2種類の深層ニュートラルネットで深層学習の問題を解消
産業技術総合研究所(産総研)は8月29日、2種類の深層ニューラルネットを組み合わせて薬剤とタンパク質の相互作用を予測する手法を開発したと発表した。この研究は、同研究所人工知能研究センター機械学習研究チームの瀬々潤研究チーム長、椿真史特別研究員が、インテリジェントバイオインフォマティクス研究チームの富井健太郎研究チーム長と共同で行ったもの。研究成果は「Bioinformatics」に掲載されている。
画像はリリースより
近年、機械学習技術のひとつとして大きな成功を収めている深層学習を、創薬をはじめとする化学・生物学分野へ応用することが期待されている。薬剤とタンパク質の相互作用が深層学習によって高速・高精度に予測できれば、新薬開発を加速させるだけではなく、人間の知識や経験だけでは到達できない革新的な薬剤の開発が期待される。
しかし、薬剤とタンパク質は、それぞれ異なるタイプの構造であるため、双方のデータを深層学習でどのように統一的に扱うかが、大きな問題となっていた。さらに深層学習は予測結果の解釈が難しく、化学・生物学分野への応用の障壁となっていた。
膨大な数のタンパク質でも、高速・高精度の予測が可能
研究グループが今回開発した手法では、各薬剤のデータに適した深層学習手法であるグラフニューラルネットと、タンパク質のデータに適した深層学習手法である畳み込みニューラルネットをそれぞれのデータに適用して、薬剤とタンパク質それぞれの性質を適切に捉える特徴ベクトルを計算。薬剤とタンパク質の大規模なデータを用いてこの特徴ベクトルを学習することで、相互作用の有無を予測する。35,000以上の薬剤とタンパク質の相互作用のデータを用いた実証評価実験により、従来用いられていたものよりも低次元(10次元程度)の特徴ベクトルを用いても相互作用の有無を適切に予測できることがわかったという。
この手法は、低次元の特徴ベクトルを用いるため計算量が抑えられ、高速な予測が実現可能。また、既存のドッキングシミュレーションや近年開発された他の深層学習手法に比べ、高い予測精度(既存手法比で3~10%の向上)を示した。さらに、薬剤のグラフとタンパク質の配列の情報のみから予測できるため、立体構造がまだわかっていない膨大な数のタンパク質についても適用可能だという。今後研究グループは、薬剤やタンパク質の三次元立体構造をより詳細に考慮した手法を開発し、さまざまな薬剤とタンパク質を用いて、その相互作用部位の立体構造を網羅的に検証、予測結果の信頼性を高めていき、新薬開発支援による創薬分野への貢献を目指すとしている。
▼関連リンク
・産業技術総合研究所 研究成果