先進各国の全ゲノム情報公開はさらに大規模化、国内でも推進が望まれる
東北大学は6月30日、官民共同10万人全ゲノム解析計画に基づき、東北メディカル・メガバンク計画(TMM計画)によるコホート調査に参加した約15万人のうち5万人分の全ゲノム解析を完了したと発表した。この研究は、同大東北メディカル・メガバンク機構(ToMMo)の基盤情報事業部 木下賢吾教授(兼 同事業部部長)らの研究グループによるもの。今回の成果をもとに、血縁関係にないと推定される3万8,000人分のバリアントのアレル・ジェノタイプ頻度情報からなる日本人全ゲノムリファレンスパネル38KJPNが、データベース「jMorp」で公開される。
一般住民を対象に全ゲノム解析を行うことは、革新的な創薬をはじめ多様な研究開発にとって極めて重要であり、日本製薬工業会(製薬協)の「製薬協政策提言2021」でも大規模な実施の必要性が言及されている。ToMMoは2013年5月に開始したコホート調査で、提供された生体試料を解析した大規模なデータベースを構築し、同年11月に1,000人分の全ゲノム解析の完了を発表したことを皮切りに、着々と解析数を積み上げ、2021年12月に約1万4,000人分の解析結果をもとにした日本人全ゲノムリファレンスパネル14KJPNを発表した。
一方、先進各国においてはさらに大規模な取り組みがなされており、最近では、2021年11月に英国のUK Biobankが20万人分の全ゲノム解析情報を、翌年3月には米国のAll of USが10万人分をそれぞれ公開したことが大きな話題となった。こういった背景からToMMoは全ゲノム情報と医療・健康情報の統合解析コンソーシアムの支援も受け、大規模な全ゲノム解析を推進していた。
新しいリファレンスパネル38KJPNにはより多くのバリアントが収載
今回、研究グループが一丸となり全ゲノム解析を進めたことにより、2022年1月末日に約5万検体の全ゲノム情報の基礎的な解析を完了したという。この5万検体分のデータを集約・統合解析を行い、5万人分の全ゲノム情報が含まれるデータベースを作成した。含まれる各検体の品質情報等はjMorpウェブサイトのRepositoryから確認可能である。
次に、5万人分の全ゲノム情報から、頻度が偏らないよう血縁関係にないと推定される3万8,000人を抽出し、日本人全ゲノムリファレンスパネルを構築した。一つ前のバージョンとなる14KJPN全ゲノム参照パネルと比較すると検体数は約2.7倍のスケールとなる。38KJPNと14KJPNに含まれる一塩基バリアント(SNV)と塩基配列の挿入欠失(INDEL)数を比べると、それぞれ約7,000万個と860万個増加し、より多くのバリアントが収載された。なお、今回のリリースでは常染色体上のSNV、INDELについてアレル・ジェノタイプ頻度情報を公開し、X染色体、およびミトコンドリアについては後日公開予定だという。
また、日本人HLA遺伝子パネル38KJPN-HLAも公開された。ヒトのHLA遺伝子は多数のアレルを持つことが知られており、HLA遺伝子はSNVやINDELを対象とした解析方法で正確に遺伝子型推定を行うことは困難である。そこで、38KJPNを構成する検体に対しHLA遺伝子に特化した解析方法を適用することで、HLA遺伝子の遺伝子型を集めたHLA参照パネルを作成した。
10万人の全ゲノム解析を目標、多因子疾患の個別化予防や、革新的な創薬開発の活用にも期待
今回、1万4,000人分の解析完了から約半年で5万人の全ゲノム解析を達成した。今後も引き続き解析を続け、目標とする10万人分のゲノム解析を完遂し、英国、米国のような大規模ゲノム・データ基盤を持つことを目指しているという。この基盤を全国の研究者が利活用することにより、多因子疾患に有効な健康リスク予測による個別化予防や、革新的な創薬開発の早期実現が可能になり、これは日本人だけではなく広く東アジアにも適用可能な基盤と予測される。「10万人の全ゲノム解析が完了すれば、全ゲノムリファレンスパネルもさらに大規模にすることができ、バリアントの頻度をより精確に表すことができる」と、研究グループは述べている。
▼関連リンク
・東北大学 プレスリリース