医療従事者の為の最新医療ニュースや様々な情報・ツールを提供する医療総合サイト

QLifePro > 医療ニュース > 医療 > 患者・非患者の分類をせず疾患の特徴を捉えるオミックス解析手法を開発-中央大ほか

患者・非患者の分類をせず疾患の特徴を捉えるオミックス解析手法を開発-中央大ほか

読了時間:約 3分41秒
このエントリーをはてなブックマークに追加
2023年08月28日 PM12:51

膨大なDNAメチル化の遺伝子への影響を、網羅的に解析できる方法が必要

中央大学は8月25日、開発したデータ駆動型の解析方法により、患者群と非患者群に分類されていない対象者群の3層オミックスデータ(ゲノム・エピゲノム・トランスクリプトーム)から類似した特徴を抽出することに成功し、これらのパターンに同期して変動している遺伝子群を特定したところ、さまざまな疾患関連遺伝子を抽出できることを明らかにしたと発表した。この研究は、同大理工学部物理学科の田口善弘教授、岩手医科大学医歯薬総合研究所生体情報解析部門の小巻翔平講師、須藤洋一特命准教授()、大桃秀樹特任准教授、山﨑弥生特命助教()、清水厚志教授らの研究グループによるもの。研究成果は、「PLOS ONE」に掲載されている。


画像はリリースより
(詳細は▼関連リンクからご確認ください)

複数種類のプロファイルをまとめて解析するいわゆるマルチオミックス解析は、ひとつひとつのプロファイルの変数の数が著しく異なるため容易ではない。例えばよく一緒に解析されることが多い遺伝子発現プロファイルとゲノムのDNAメチル化プロファイルの場合、遺伝子は数万個しかないが、DNAメチル化サイトは数千万か所存在するなど、個数が3桁も異なっており、遺伝子との組み合わせの数は膨大である。そのため、なんらかの付加的な情報によって解析対象数を制限する、例えば、プロモーターと呼ばれる遺伝子の発現量に影響を与えることが解っている領域の情報を事前知識として与えるなどしなければ統合解析が難しい状況であった。しかし、解析するゲノム領域を制限してしまうと、他の機能(例えば、エンハンサーと呼ばれる、ゲノムをループ状に結合させることで遺伝子の発現量に影響を与える部分)へのDNAメチル化の影響は除外されてしまい、さらには、未知の影響を検出することが不可能であった。

これに対してデータ駆動型の方法は事前知識を用いずともデータのみから想定し得ない関係性を抽出することができるため、相互関係にある遺伝子とDNAメチル化領域を特定できる可能性があった。しかし、膨大な数であるDNAメチル化領域と遺伝子の組み合わせすべてを既存のデータ駆動型のアプローチでは調べることができず、手が届かなかった。

開発した「」で遺伝子発現・SNP・DNAメチル化と疾患関連遺伝子との関係を解析

今回、研究グループが以前の研究で開発した方法をいわて東北メディカル・メガバンク機構(IMM)が100人の地域住民から網羅的に収集した、遺伝子発現、DNAメチル化、一塩基多型(SNP)の各プロファイルの3層オミックスデータに適用して、疾患関連遺伝子との関係を把握できるかを確認した。この方法はカーネルテンソル分解を用いた教師無し学習による変数選択法(テンソル分解法)と呼ばれるデータ駆動型で、全員が健常者である今回のような対象者に特段のラベルが付与されていない場合でも適用可能である。

また、1プロファイルあたりカーネルサイズ(具体的には対象者数の二乗)程度のメモリーがあれば実行可能で、SNPやDNAメチル化サイトの様に変数が数十万から数千万になるような巨大なプロファイルであってもデータ駆動型解析で対象者群の固有パターンの特定と、そのパターンに相同的なプロファイルをもつ変数(遺伝子発現量、DNAメチル化プロファイル、SNPプロファイル)を特定できる方法でもある。

テンソル分解法の3層オミックスデータ適用で、患者分類をしていない対象群の特徴分けに成功

IMMはプロファイル取得後、現在に至るまで対象者の継続的な観察を行っている。抽出された遺伝子、DNAメチル化サイト、SNPの疾患依存性が将来の対象者の発症傾向とどの程度一致するかなどを観察することは、テンソル分解法を3層オミックスデータに適用することが未病を含めた対象者の健康状態把握にどの程度有効であるかを検証する、まれな機会となることが期待される。

テンソル分解法をCD4+T細胞、単球、好中球の3種類の細胞の22本の常染色体ごとの3層オミックスデータに適用した。その結果、2種類の対象者パターンが同定され、22本の常染色体ごとに得られたこれらの2種類の対象者パターンは常染色体間で非常に強く相関し(保存され)ていた。常染色体に存在する遺伝子は互いに全く異なるので、同じようなプロファイルを得られるのは偶然とは考えにくい。この様な場合、もっとも疑われるバイアスはバッチ効果(対象者ごとに検体の採取量が違っているのを検出してしまっているなど)であるが、2種類のパターンは互いに直交しているため、単なるバッチ効果ではこのような2種類の対象者パターンの出現を説明できないこと、サンプル調整方法も取得方法も異なる3種類のオミックスデータに同じバッチ効果が乗っている可能性は極めて小さいことなどから、単なるバッチ効果であるとは考えにくい。

未病検出も含めた国民的な健康管理の手段となることを目指す

この2種類の対象者パターンはテンソル分解で得られる第2、第3特異値ベクトルであり、前者は3つの細胞種すべてで、後者は単球以外の2種の細胞で検出された。次にこれらの対象者パターンと相同なプロファイルをもつ遺伝子とDNAメチル化領域を選択したところ、多くの転写因子の共通標的になっており、かつ、これらはエンリッチメント解析により、さまざまな疾患との関連がある転写因子であることが明らかとなった。また、同定されたSNPはこれらの転写因子のDNA結合部位と統計的に有意に重なっていることもわかった。

以上のことから、テンソル分解法の3層オミックスデータの統合解析への応用が有効であることが示されたと思われる。

「IMMでは本研究成果に利用したデータ以外に臍帯血データなども蓄積しており、今後も3層オミックスデータの蓄積を行っていく。将来的には3層オミックスデータのテンソル分解法による解析が未病検出も含めた国民的な健康管理の手段として確立させることを目指す」と、研究グループは述べている。

このエントリーをはてなブックマークに追加
 

同じカテゴリーの記事 医療

  • トイレは「ふた閉め洗浄」でもエアロゾルは漏れる、その飛距離が判明-産総研ほか
  • AYA世代の乳がん特異的な生物学的特徴を明らかに-横浜市大ほか
  • 小児白血病、NPM1融合遺伝子による誘導機序と有効な阻害剤が判明-東大
  • 抗血栓薬内服患者の脳出血重症化リスク、3種の薬剤別に解明-国循
  • 膠原病に伴う間質性肺疾患の免疫異常を解明、BALF解析で-京都府医大ほか