ヒト生命科学の総合的な情報を網羅的に収載のリファレンスパネル「jMorp」
東北大学は10月5日、東北大学東北メディカル・メガバンク機構(ToMMo)が、jMorp(Japanese Multi Omics Reference Panel)の全ゲノム解析データを8,300人に、メタボローム解析データを2万5,000人にそれぞれ大幅拡充したと共に、日本人基準ゲノム配列を再構築しJG2として公開したと発表した。
jMorpは、東北メディカル・メガバンク計画のコホート調査によって得られた試料を解析した結果を、個人識別性のない頻度情報等にして公開したデータベース。2015年7月に世界で初めて500人以上の血漿に対する網羅的メタボロームおよびプロテオームの統合解析結果を公開し、以後着々と収載データの量と種類を増やしてきた。2018年にはゲノム解析情報を、2020年には岩手医科大学いわて東北メディカル・メガバンク機構(IMM)による解析情報を追加し、現在ではゲノミクス、エピゲノミクス、トランスクリプトミクス、プロテオミクス、メタボロミクスというヒトに関わる生命科学の総合的な情報を網羅的に収載するリファレンスパネルとなっている。jMorpの情報は主に東北メディカル・メガバンク計画の長期健康調査への参加者の協力のもとに収集されている。
8.3KJPNを公開、日本人のもつ0.01%以上の頻度の変異をほぼ網羅
今回、これまで公開を行なってきた約4,700人からなる全ゲノムリファレンスパネル(4.7KJPN)の更新版として、8.3KJPNを構築。8.3KJPNは、東北メディカル・メガバンク計画による宮城県と岩手県でのコホート調査への協力者や、その他外部コホート事業における協力者、合計8,300人から構成されている。この拡充により日本人が持つアレル頻度0.01%以上のSNVをほぼ収集できたと考えられる。8.3KJPNはこれまでの4.7KJPNに含まれていた検体を引き継ぎつつ、また、外部のコホート研究との連携により東日本・西日本両方からの協力者が含まれるため、より日本人として代表性の高いゲノム情報となっている。また、4.7KJPNまではIllumina社のシークエンサーによるゲノム解析をもとにしたパネルとなっていたが、8.3KJPNでは新たにMGI社DNBSeq G400によるデータも含まれるようになった。
また、アレル頻度情報以外に、ジェノタイプ頻度情報も同時に公開。これにより、より詳しい精度での解析が可能になる。両データともjMorpウェブサイトからダウンロード可能だ。(ジェノタイプ頻度情報のダウンロードにあたっては、ORCIDと連携する認証を行い、データ移転契約(DTA:Data Transfer Agreement)を確認する必要がある。)
日本人基準ゲノム配列JG2、3セットから6セットに拡張し精度を各段に向上
日本人基準ゲノムJG2は、JG1と同じ3人の検体を用いながら、新たにHi-C法やナノポア長鎖リードシークエンサーなどの新規手法を追加して解析を行い、6ハプロイドゲノム(3人×2セットのゲノム配列)を構築し統合した。この手法によりJG2は、JG1はもとより他の人類集団固有の基準ゲノムより高い精度でゲノム解析を行うことが可能になる。特にJG2ではアセンブリの誤りと推定される領域の数がJG1から1,800程度減った。このことは、誤って構造多型として検出される数が最大で1,800程度減り、さらにこの1,800の領域におけるSNVや短いINDELの解析精度が向上することを示唆する。
メタボローム解析対象代謝物の種類も大幅に拡張
メタボロームについては、解析人数、対象とする代謝物の種類を拡充。さらに同じ対象者集団についての経時的な情報を追加し、大規模・高精度・多彩な代謝物の濃度分布情報を含むデータベースとなった。
NMRメタボローム解析では2019年に43代謝物について、1万5,403人分の定量値・分布情報を公開している。この43代謝物についての定量解析法を2019年度jMorp公開データに適用し再解析した結果に加え、さらに今回新たに1万人分の解析結果を追加し、約2万5,000人という大規模なものへと拡張するとともに新たに2代謝物を追加した。この中には妊娠中の代謝物の変動データ約2,000人分も含まれる。
MSメタボローム解析では、超高速液体クロマトグラフ三連四重極型質量分析装置(LCMS/MS)による標的メタボローム解析に、測定可能な代謝物が大幅に増えた新たな代謝物キット解析を導入し、血漿10μLから検出された421代謝物を新規に追加。解析対象者数は、約2,400人分だ。この421代謝物の新規データは,他の研究機関での解析結果と比較可能な定量値情報として提供する。また、ガスクロマトグラフ三連四重極型質量分析装置(GC-MS/MS)による代謝物についても、約600人分の分布・頻度情報を追加し、約3,000人とした。
また、詳細二次調査参加者から提供された血漿試料に対してNMR/MSメタボローム解析を実施し、NMRメタボローム解析では700人分、44代謝物の定量値情報、MSメタボローム解析ではGC-MS/MSによる約600人分、165代謝物の測定値情報を追加した。この拡張により加齢によるメタボロームの経時変化について、最大1,600人規模の比較解析を行うことが可能になる。さらに、約400人分の妊娠中の代謝物の変動データを追加し、約2,000人分とすることにより、妊娠中および産後1か月の比較解析がより高精度に可能となった。
なお、いずれの代謝物についても、2019年拡張版jMorpの公開情報と同様に、代謝物間の相関情報、年齢層別の分布情報等を公開する。今回のjMorp拡充は、宮城県で実施中のコホート調査の協力者から提供された生体試料をもとに行われた。
jMorpの活用による疾患原因、予防法、バイオマーカーの発見に期待
東北メディカル・メガバンク計画では最終的に8,000人の解析データをもとにした全ゲノムリファレンスパネルの構築を目指して解析を行ってきた。今回、8.3KJPNを構築し、目標の8,000人を達成したことで、日本人が持つアレル頻度0.01%以上のSNVデータをほぼ収集できていると考えられる。そのため、かなりまれな疾患まで含めた遺伝疾患の原因解明における、より信頼度の高い頻度フィルタ用途など、当計画のリファレンスパネルがさらに広く有効に使われることが期待される。また、ToMMoは、非常に解析が難しいY染色体の情報や、これまで収載している、SNV・INDEL頻度のほかに、構造多型の頻度情報を収載することも検討しており、「日本人全ゲノムリファレンスパネル」としてブラッシュアップし続けるとしている。
JG2は、JG1に比べ正確性がさらに向上した。しかし、未決定領域は依然250Mb程度残されており、特にセントロメアやテロメア領域と呼ばれる解読の難しい領域は未解読のままだ。ToMMoは今後、正確性の高い長鎖リードシークエンサーなど新たな技術を適用することで、これらの領域の解読を進め、さらなる高精度化を目指すとしている。
メタボローム解析データは、リリース当初500人だった対象者数が約2万5,000人となった。ToMMoは、今後も順次対象者数を増やしリファレンスとしての精度を高めるとともに、追跡調査データを加え経時情報についても厚みを持たせたいと考えているという。さらに、最新の解析手法を絶えず取り入れ、代謝物の種類を増やしていくとしている。このように解析を加速していくことで、男女、年代のバリエーションを持ち、かつ数万人単位の経時変化を含む、世界でも類を見ないメタボローム情報のコレクションが構築される。これらは、ヒトの加齢変化を分子的、かつ網羅的に捉えることができる貴重な基盤となる。全国の研究者がjMorpのデータを用いることにより、疾患の原因や予防法、バイオマーカーの発見が期待される。
▼関連リンク
・東北大学 プレスリリース