強く望まれる、術前の進行期や組織型の予測
理化学研究所(理研)は4月15日、血液検査データに基づく、機械学習による「卵巣がんの術前予測アルゴリズム」を開発したと発表した。この研究は、同科技ハブ産連本部健康医療データAI予測推論開発ユニットの川上英良ユニットリーダーらの共同研究チームによるもの。研究成果は「Clinical Cancer Research」オンライン版に4月12日付で掲載された。
画像はリリースより
卵巣がんは、組織学的に少なくとも五つの型(高異型度漿液性がん、低異型度漿液性がん、類内膜がん、粘液性がん、明細胞腺がん)に分かれ、また世界産婦人科連合(FIGO)の進行期分類で、転移の有無などによって早期がん(ステージ1、2)および進行がん(ステージ3、4)にわけられる。治療は、手術による腫瘍の切除が第一選択として行われるが、手術の前後に化学療法を行うことが一般的。化学療法への反応性は、進行期や組織型によって大きく異なることに加え、近年PARP阻害薬や抗体医薬などの有効な抗がん剤が登場してきたこともあり、術前に進行期や組織型を予測し、患者ごとに適切な治療戦略を策定することが強く望まれている。
今回、研究チームは機械学習を導入することで、多項目の術前血液検査データに基づく精密な特性予測と、予後と関連するパターンの抽出を試みた。
悪性と良性を「AUC=0.968」の高精度で予測
解析したデータは、東京慈恵会医科大学産婦人科において2010~2017年に治療された、334名の悪性卵巣腫瘍患者と101名の良性卵巣腫瘍患者のデータ。まず、教師あり機械学習のランダムフォレスト法を用いて、診断時の年齢および術前血液検査データ32項目のデータに基づいて、悪性腫瘍と良性腫瘍を予測。
その結果、予測の精度の指標となるROC曲線のAUCは、従来の統計的手法である多変量ロジスティック回帰では0.897だったのに対し、ランダムフォレスト法では0.968に達し、非常に精度良く予測できることがわかった。さらに、同じ術前血液検査データに基づいて、がんの進行期(早期がんまたは進行がん)や組織型などの予測も行った。その結果、進行期は、AUC=0.760という比較的良い精度で予測することができ、すでに知られている腫瘍マーカーに加えてCRPとLDHが重要であることが示され、進行期と炎症との関連が示された。また、組織型は、高異型度漿液性がんと粘液性がんの予測精度が比較的良く(AUC=0.785, 0.728)、高異型度漿液性がんはCA125とCA19-9、粘液性がんはCEAが予測のマーカーとなることが明らかになった。
予後と関連する新しい疾患分類も発見
さらに、「早期卵巣がんと進行卵巣がんで術前血液検査のパターンが近い症例があるのではないか」という仮説を立て、サンプルの類似度を計算するために、教師なしランダムフォレスト法を用いて、教師なし機械学習を行った。この方法を、診断時の年齢および術前血液検査データ32項目に適用し、術前の血液検査のパターンが似た人を近くに、パターンが異なる人を遠くに配置するように多次元尺度法(MDS)を用いて二次元分布を描いた。
すると、進行がんと良性腫瘍は明らかに異なる分布を示したが、早期がんは「良性腫瘍によく似た術前血液検査パターンを示す症例(クラスタ1)」と「進行がんによく似た術前血液検査パターンを示す症例(クラスタ2)」にわかれ、クラスタ1では再発がほとんどなかったのに対して、クラスタ2では再発率と死亡率が高いという、予後との強い関連が示された。この早期卵巣がんのクラスタは、すでに知られている進行期とは異なるもので、術前血液検査データという患者の全身状態を見ることで見つかった、全く新しい分類。今回の研究成果は、予測・個別化医療に向けたがんの術前診断に貢献することが期待できると、研究チームは述べている。
▼関連リンク
・理化学研究所(理研) プレスリリース