AIでCOVID-19に関連する遺伝子群を特定
中央大学は8月11日、AIで新型コロナウイルス感染症(COVID-19)に関連する遺伝子群を特定したと発表した。この研究は、琉球大学工学部の宮田龍太助教、同大大学院理工学研究科博士前期課程の藤澤孝太氏(研究当時)、中央大学理工学部の田口善弘教授、沖縄工業高専門学校 生物資源工学科の池松真也教授らの共同研究グループによるもの。研究成果は、「Scientific Reports」に掲載されている。
画像はリリースより
現在、COVID-19が世界中で猛威を奮っている。現状を打開すべく、さまざまな研究機関で数多くの治験や臨床研究が行われており、詳細なメカニズムの解明が急務となっている。COVID-19特効薬開発の手がかりを得る方法の一つとして、遺伝子発現解析がある。同解析は、患者と非患者で遺伝子の発現レベルが異なる箇所を調査し、疾患発症に関わる遺伝子をできるだけ少ない個数で特定することを目的とする。遺伝子発現解析の難しさは、候補となる遺伝子の数が数万個と膨大な一方、サンプル(データ)数は採取するコストが高いため、数個しか手に入らないというlarge p small n問題にある。今回使用したデータも、候補となる遺伝子数は5万9,618個であるのに対し、サンプル数は34人分だった。
筆頭著者である藤澤氏らは、中央大学の田口教授が開発した「主成分分析に基づいた教師なし学習による変数選択法(PCA-based unsupervised feature extraction, PCAUFE)」を用いて、今回のゲノムデータが抱えるlarge p small n問題を解決した。このAI手法を適用することで、全くウイルスに感染していない通常の人と比べ、新型コロナウイルス感染者の体内で発現量が異常に増えている/減っている遺伝子を検出できるという。
NF-κBに関係する転写因子の活性が、ヒストン修飾H3K36me3で抑制されていた
PCAUFEを被験者の血液から採取した遺伝子発現量データに適用したところ、123個がCOVID-19の発症に関連する遺伝子群として特定された。これらの遺伝子が持つ機能をMetascape3というバイオインフォマティクスのデータベースを使って調べたところ、免疫に関連するものが多く含まれていることが判明した。
さらに、PCAUFEで特定した123個の遺伝子の発現を制御する転写因子をEnrichr4というバイオインフォマティクスのデータベースを使って検索したところ、NFKB1とRELAが上位にヒットした。これらは「防御システムの要」と言われているNF-κBに深く関係する転写因子であり、それらの活性がヒストン修飾H3K36me3で抑制されていることが明らかになった。
今後、COVID-19重症化や変異株に関連する遺伝子群を探索する予定
今回の研究成果により、COVID-19でヒトの免疫系機能が低下するメカニズムの一端を解明されたが、特定された123個の遺伝子群に単なる相関関係に留まらず、COVID-19発症の「因果」と呼べるものが含まれているのか、さらなる検証を重ねる必要がある。
「COVID-19の効果的な治療法を確立するには臨床試験のみならず、バイオインフォマティクスをはじめとした多様な病態解析で知見を積み重ねていくことが重要だと考えている。併せて、今後はCOVID-19重症化や変異株に関連する遺伝子群を探索する予定だ」と、研究グループは述べている。
▼関連リンク
・中央大学 プレスリリース