GWASでの疾患感受性座位と、共有分子経路や機能に関する類似性の統合的アプローチに注目
理化学研究所(理研)は12月14日、100万人以上のサンプルを用いた冠動脈疾患(CAD)のゲノムワイド関連解析(GWAS)を実施し、CADに関わる病態を体系的に明らかにしたと発表した。この研究は、理研生命医科学研究センター循環器ゲノミクス・インフォマティクス研究チームの伊藤薫チームリーダー、小山智史客員研究員、ヒト免疫遺伝研究チームの石垣和慶チームリーダー、東京大学大学院医学系研究科循環器内科学の小室一成教授(兼 東京大学医学部附属病院循環器内科)、新領域創成科学研究科メディカル情報生命専攻複雑形質ゲノム解析分野の鎌谷洋一郎教授らの研究グループによるもの。研究成果は、「Nature Genetics」にオンライン掲載されている。
画像はリリースより
(詳細は▼関連リンクからご確認ください)
冠動脈疾患(CAD)は心臓を栄養する冠動脈が狭窄または閉塞し、心筋に血液の供給が不足または途絶することで、心筋障害を引き起こす疾患である。世界で死亡原因の第一位であるこの重要な疾患は、日本でもがんに次いで第二位を占める。CADは環境的要因と遺伝的要因が複雑に影響し合って発症するが、他の多因子疾患同様に、ゲノムワイド関連解析(GWAS)により多くの疾患感受性座位が明らかになりつつあり、疾患病態や原因リスク因子の解明が可能になってきた。しかし、これらGWASで同定される、非タンパク質コード領域に存在する座位の解釈はコンセンサスを欠くため、疾患発症の原因となる遺伝子群を同定することはしばしば困難だった。一方、最近では疾患感受性座位に特化したアプローチと、共有分子経路や機能に関する類似性に基づくアプローチを統合し、原因遺伝子の推定をより確かなものにすることの重要性が示唆されている。
そこで研究グループは、この統合的アプローチをCADのGWASに適応し、これまで解析されていなかった九つの研究、バイオバンク・ジャパン、UKバイオバンク、CARDIoGRAMplusC4D研究を組み合わせ、最終的に137万8,170人(そのうちCAD症例21万842人)のサンプルを用いてメタ解析を行い、CADに有意に関連する遺伝子、生物学的経路の同定を試みた。
欧州人集団メタ解析で同定された241の疾患感受性座位を統合的に解析
まず、研究グループは欧州人集団を用いてメタ解析を行い、既報・新規合わせて241の疾患感受性座位を同定した。この結果から、以前の解析で報告されたように、CADは動脈硬化危険因子(LDLコレステロール、中性脂肪、血圧、2型糖尿病、肥満度指数)、および他の心血管疾患(心不全、虚血性脳卒中)と正の遺伝的相関があることがわかった。
加えて、特定の疾患感受性座位の潜在的な病因を同定するために、UKバイオバンクの53の疾患と32の形質およびバイオマーカ―との関連を網羅的に調べた。その結果、今回の研究で同定された疾患感受性座位の約50%は、血中脂質、血圧、高血糖、死亡率など従来の冠動脈危険因子との関連を示した。その他の関連で上位のものは、肝臓マーカーおよび腎臓マーカーだった。
30の新規疾患感受性座位のいくつかは、生物学的にもっともらしいと考えられる遺伝子の近くに同定された。その中には、粥腫(プラーク)形成に関与するトランスフォーミング増殖因子(TGF)-βスーパーファミリーのメンバーであるアクチビンAの受容体をコードするACVR2A遺伝子の近傍座位、弾性線維形成の初期段階に介在し大動脈瘤とマルファン様疾患のビールズ症候群に関連しているフィブリリン2をコードするFBN2遺伝子の近傍座位があった。そして、プラーク内コラーゲンの調節と組織化を通して動脈硬化性プラークの安定性に影響を及ぼす間質性コラーゲナーゼであるマトリックスメタロプロテアーゼ(MMP)-13をコードするMMP13遺伝子の近傍にも疾患感受性座位が同定された。
メタ解析の結果から構築のPRS、要約統計量を用いたPRSより冠動脈疾患発症と強く関連
次に、GWASの結果を用いたCADの遺伝的リスク予測能を評価するために、今回の研究のメタ解析の結果、または2015年に発表されたCARDIoGRAMplusC4D研究のGWASの要約統計量を用いて、多遺伝子リスクスコア(PRS)を構築し性能を評価した。Malmö Diet and Cancer Studyのサブセット(全サンプル数5,685、そのうちCAD症例数815)において、構築されたPRSは、2015年の要約統計量を用いて作られたPRSよりもPRS一標準偏差増加当たりの年齢および性別調整ハザードで、冠動脈疾患発症とより強く関連しており(2015年PRSにおけるハザード比1.49、95%信頼区間1.39~1.59に対し、今回の研究PRSにおけるハザード比1.61、95%信頼区間1.50~1.72)、リスク層別化能を改善することができた。
いくつかの確立された危険因子(総コレステロール、HDLコレステロール、収縮期血圧、肥満度指数、2型糖尿病、現在の喫煙状況、CADの家族歴)で調整しても、今回の研究の結果を用いて構築されたPRSは依然としてCAD発症と強く関連していた(PRS一標準偏差増加分当たりのハザード比1.54、95%信頼区間1.42~1.66)。また、PRSの上位10%と下位10%集団のリスク比は5.7倍だった。
BBJおよび欧州人GWASのメタ解析により新規疾患感受性座位をさらに38領域同定
近年、バイオバンク・ジャパンの大規模なGWASが研究グループから発表され、東アジア人でのゲノムワイドな関連を評価した。今回、異なる民族の結果を組み合わせることで疾患感受性座位の同定が促進される可能性を検証するため、バイオバンク・ジャパンのGWASの要約統計量を今回の欧州人解析の統計量と合わせてメタ解析した。その結果、ゲノム全体に有意な新規疾患感受性座位がさらに38領域得られ、合計279のゲノムワイド関連領域が同定された。
類似性ベースの遺伝子優先順位付け手法PoPSで、235のCAD関連遺伝子を同定
研究グループはゲノムワイドな関連データを活用した類似性ベースの遺伝子優先順位付け手法であるPolygenic Priority Score(PoPS)を新たに開発しており、今回の結果にそれを適用した。遺伝子発現、タンパク質-タンパク質相互作用ネットワーク、生物パスウェイに関するデータを含む1万9,091の特徴量を予測PoPSモデルに入力し、279の疾患感受性座位の周囲500kbの全てのタンパク質コード遺伝子についてPoPSスコアを計算し、各疾患感受性座位で最も高いPoPSスコアを持つ遺伝子を優先順位付けし、235の遺伝子を同定した。この中にはLDLR、APOB、PCSK9、SORT1、NOS3、VEGFA、IL6Rなど、CAD発症に関与する多くの確立された遺伝子が含まれていた。
次に、PoPSモデルからCAD関連遺伝子の優先順位付けに最も有益な特徴量を階層的にクラスタリングした結果、2,852のクラスターが得られ、それを優先順位付けに対する相対的な寄与度でランク分けをした。最も上位のクラスターには、血中脂質(コレステロール・リポタンパク質)の恒常性維持を示す特徴が含まれていた。他の上位クラスターには、細胞移動・輸送・増殖・恒常性維持や、血管細胞機能・運動性、コラーゲン・細胞外マトリックス機能などの血管細胞の機能、移動、増殖、細胞外マトリックスの構造と機能に関わるものなど、CADの病因において確立された経路とメカニズムに関連する機能が含まれていた。さらに、いくつかの上位クラスターは、あまり知られていないが、発達制御や胎生発達などの初期の発生プロセスや細胞周期を含む情報伝達経路が含まれていた。
MYO9B遺伝子近傍の新規疾患感受性座位、エンハンサー制御がCADリスクに寄与の可能性
最後に、19番染色体上のMYO9B遺伝子近傍の新規疾患感受性座位のCADリスクに関する機能的意義を調べた。ヒト冠動脈、大動脈、脛骨(けいこつ)動脈細胞におけるエピゲノム情報から、このゲノム領域が血管組織エンハンサー内に含まれることに注目し、CRISPR-Cas9ゲノム編集技術を用いて内皮細胞、冠動脈血管平滑筋細胞、および単球の該当するエンハンサー配列を削除し、エンハンサー欠失の遺伝子転写へ与える効果を測定した。すると、エンハンサー欠失により、内皮細胞ではMYO9B遺伝子とHAUS8遺伝子の発現が減少し、冠動脈血管平滑筋細胞においてもMYO9B遺伝子の発現が減少した。
加えて、これら遺伝子のCAD発症メカニズムへの関与を明らかにするため、単層創傷治癒アッセイを行った。その結果、エンハンサーを欠失させた内皮細胞は、MYO9B遺伝子またはHAUS8遺伝子のいずれかを遺伝子ノックアウトした内皮細胞と同様に創傷治癒の障害を示した。この結果は、エンハンサーの制御作用が内皮細胞の創傷治癒障害を通じてCADリスクに寄与している可能性を示している。
「本成果は冠動脈疾患の遺伝的基盤を包括的に解明し、また最新の方法で遺伝子に結び付けることによって、疾患発症の病態解明、治療法の開発の基盤を提供するものである。またPRSの性能改善により、今後のゲノム情報を利活用した精密医療の実現に資するものと期待できる」と、研究グループは述べている。
▼関連リンク
・理化学研究所 プレスリリース