プライバシー保護データマイニング技術によって
東北大学は7月12日、ゲノム情報を暗号化したまま、複数の研究機関が持つゲノム情報を相互に開示することなく正確に分析する、プライバシー保護データマイニング技術によるゲノム解析手法を共同で開発したと発表した。この研究は、日本電信電話株式会社(NTT)と東北大学東北メディカル・メガバンク機構(ToMMo)の三澤計治助教らの研究グループによるもの。研究成果は、7月14日より開催されるコンピュータセキュリティ研究会の研究発表会にて発表する。
画像はリリースより
近年のDNA配列決定技術の進歩により、大量のゲノムデータが解析されるようになった。 これに伴い、ゲノムワイド関連解析(GWAS)などの手法を用いて、疾病情報と遺伝子の関連性を発見する研究が国際的にも進められている。また、複数の研究機関が保有するゲノムデータを横断的に分析することで、より大規模なデータを使って分析を進めたいというニーズも高まっている。
しかし、ゲノムデータは個人の遺伝情報という機微性が高い性質のため慎重な取り扱いが求められ、複数の研究機関の間で相互に制限なく開示し合うことは容易ではない。このため、複数の組織が保有する情報を安全に活用する技術として、プライバシー保護データマイニングと呼ばれる技術が注目されており、その手法のひとつとしてNTTではデータを暗号化したまま計算する秘密計算技術を研究開発している。
世界初、正確性を期したフィッシャー正確確率検定
今回は、NTTが秘密計算技術を、ToMMoがゲノム解析技術を担当し、複数の研究機関が互いにゲノムデータを開示することなく、暗号化したままで比較し、かつゲノムワイド関連解析において正確性を期すために必要となるフィッシャー正確確率検定を現実的な時間で処理できる手法を共同で開発した。
研究グループは、近似であるカイ二乗検定による解析ではなく、正確性を期したフィッシャー正確確率検定を世界で初めて実現。疾病情報と遺伝子との相関を調査するのに要する時間が、従来の1年以上から約20分に短縮可能な手法(1,000人分のデータによる試算)を開発することで、プライバシー保護データマイニング技術によるゲノム解析の実現に必要となる基盤技術を確立したとしている。
今後は、1,000人以上の規模のゲノムデータに対しても、より効率的な解析が可能な手法の検討を行う予定。また、フィッシャー正確確率検定やゲノムワイド関連解析以外の重要なゲノム解析手法についても、秘密計算技術によるゲノム解析を実現する手法の開発に取り組むことで、医療の更なる発展へとつながることが期待できると、研究グループは述べている。
▼関連リンク
・東北大学 プレスリリース