日本人集団のHLAの全容解明に挑む
大阪大学は1月29日、次世代シークエンス技術と機械学習を用いて、日本人集団におけるHLAが11パターンで構成されており、その個人差が、病気や量的形質を含む50以上の表現型に関わっていることを明らかにしたと発表した。この研究は、同大大学院医学系研究科の平田潤大学院生、岡田随象教授(遺伝統計学)、国立遺伝学研究所の井ノ上逸朗教授、金沢大学医薬保健研究域医学系の細道一善准教授、理化学研究所生命医科学研究センターの鎌谷洋一郎チームリーダーらの研究グループによるもの。研究成果は、英科学誌「Nature Genetics」のオンライン版に1月19日付で掲載された。
画像はリリースより
白血球の血液型として発見されたHLA(Human Leukocyte Antigen, ヒト白血球抗原)は、自己と非自己の認識に深く関わっており、多彩な表現型の個人差を規定している。HLAは、ヒトゲノム上の「HLA遺伝子」の配列の個人差で決定される。HLAの個人差は免疫アレルギー疾患などの発症に強いリスクを有することが知られており、移植医療や個別化医療に際して重要と考えられてきたが、HLA遺伝子構造が複雑で解読に専門技術が必要なことや高額な実験費用により、HLA遺伝子配列の詳細な個人差の解明は遅れていた。
日本人のHLAは11パターン
研究グループではこれまでに、7個の主要なHLA遺伝子(古典的HLA遺伝子)を対象に、日本人集団における白血球の血液型の構成を決定し、日本人集団に特異的な白血球の血液型が存在することを報告していた(Okada Y et al. Nat Genet 2015)。今回の研究では、次世代シークエンス技術を駆使することで、日本人集団1,120名を対象に、非古典的HLA遺伝子も含めた33のHLA遺伝子における720種類のゲノム配列を詳細に決定することに成功。この解析は、日本人集団におけるHLA遺伝子配列のデータベースとして、最大級の情報を含んだ成果になる。
次に、これらのゲノム配列の膨大な組み合わせを効率的に分類する目的で、得られたHLA遺伝子ゲノム配列情報に対して機械学習手法を適用。その結果、日本人集団のHLAは、11パターンの組み合わせに分類可能なことが明らかになった。これは、複雑なヒトゲノム情報の解釈を、機械学習手法を用いて実現した先進的な成功例と評価できるという。
52の表現型でHLAが発症に関与
さらに、1,120名で構築したHLAのパターン情報を学習データとして、バイオバンク・ジャパンが構築した日本人集団17万人における大規模ゲノムワイド関連解析(GWAS)のゲノムデータを対象に、HLAを高精度に推定することに成功。得られた17万人のHLAパターンに基づき、「フェノムワイド関連解析」を実施して、病気(免疫疾患・生活習慣病・悪性腫瘍など)や量的形質(身長・肥満、血液検査値、生理検査結果など)を含む100を超える多彩な表現型との関連を網羅的に解析した。その結果、これまで報告されていた免疫アレルギー疾患だけでなく、52の表現型において、その発症にHLAが関与していることが明らかになった。この解析は、アジア人集団で実施されたフェノムワイド関連解析として、サンプル数および表現型数において過去最大規模の解析で、今まで想定されていたより広範囲の表現型の発症に、HLAの個人差が密接に関わっていることを示した結果と考えられるという。
今回の研究成果は、日本人集団におけるHLAの全容を明らかにしたもの。また、機械学習によるHLAの分類に成功したことで、個人の表現型を予測し適切な医療を施す個別化医療の実現に貢献するものとして、今後の研究に期待が寄せられている。
▼関連リンク
・大阪大学 研究情報