画像診断支援AI、希少症例や検査数の少ない疾病では大量の教師データ収集は困難
産業技術総合研究所(産総研)は7月12日、画像基盤モデルを使用して少量の内視鏡画像の学習から高精度に診断する膀胱内視鏡診断支援AIを開発したと発表した。この研究は、産総研人工知能研究センター機械学習機構研究チーム野里博和研究チーム長、KimWonjik研究員らの研究グループによるもの。研究成果は、米国オーランドで開催される46th Annual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC2024)にて発表される。
画像はリリースより
(詳細は▼関連リンクからご確認ください)
現在、医療分野において内視鏡画像やエックス線写真などの画像を解析して診断を支援する画像診断支援AIの開発が進んでいる。このようなAIを用いた診断によって、病気の早期発見などの診断精度が向上するだけでなく、医療従事者の負担軽減の効果も期待されるが、実際の医療現場では画像診断支援AIを活用している診断領域は限られている。画像を解析するAIの開発には、教師データと呼ばれる大量の画像と付随する情報を事前に学習する必要がある。既に製品化されている画像診断支援AIには数万~数十万枚の教師データが使われているが、患者数や検査数の少ない疾病や希少症例に関しては、この量の教師データを収集することは困難である。特に泌尿器科分野における膀胱内視鏡検査は、消化器内視鏡に比べ検査数が少なく、同じ内視鏡であっても画像診断支援AIを適用することが非常に困難だった。
数式で自動生成した大規模画像データセットから学習済みモデル構築
こうした問題を解決するため、研究グループはこれまでに、数式から自動生成した大規模画像データセットを用いてAIの画像認識モデル(学習済みモデル)を構築する手法を開発していた。この手法は事前に学習する画像と付随情報を共に数理モデルから生成するため、プライバシー保護などの倫理問題も生じず、また大量の実画像を使用せずにAIモデルを構築できる。
表面の質感・輪郭形状の特徴持つ生成画像利用し、診断支援AIモデル構築に成功
まず、膀胱内視鏡画像における膀胱粘膜の変化に着目し、これらの特徴を認識する機能を有する画像基盤モデルを構築することを目指した。具体的には、表面の質感の特徴を持つFractalDBにより生成した画像100万枚と、輪郭形状の特徴を持つVisual Atomsにより生成した画像100万枚を合わせた大規模画像データセット200万枚を用いて、画像分類AIのトップモデルであるVision Transfomer(ViT)を事前学習し、膀胱内視鏡画像向けの画像基盤モデルを構築した。さらに、この画像基盤モデルに対し、病変の1,259枚と、正常の7,553枚、合計8,812枚の膀胱内視鏡画像の追加学習により診断支援AIモデル(MixFDSL-2k)を構築した。
膀胱内視鏡画像は、筑波大学附属病院において膀胱内視鏡検査で収集された画像を用いた。画像基盤モデルの構築や診断支援AIの追加学習には、産総研が保有する人工知能処理向け計算インフラストラクチャーであるAI橋渡しクラウド「AI Bridging Cloud Infrastructure(ABCI)」を活用した。
診断支援AI、泌尿器科専門医8人の平均感度・特異度・正解率より上回る結果
次に、学習に用いていない膀胱内視鏡画像422枚(病変87枚、正常335枚)で検証を行った。開発した診断支援AIモデル(MixFDSL-2k)は、感度94.3%、特異度99.4%、正解率98.3%を達成した。この診断精度は、事前学習をしなかった場合(事前学習なし)と比較して感度は+16.1%、特異度は+9.3%、正解率は+10.6%向上した。また、事前学習に広く使用されているデータセットであるImageNet-21kとImageNet-1kを事前学習に用いた場合の診断精度も超えたことを確認した。さらに、泌尿器科勤務経験が5年以上の専門医8人に、同じ膀胱内視鏡画像422枚を1枚ずつ見せてAIと同じタスクを試してもらったところ、8人の平均感度、平均特異度、平均正解率のいずれも開発した診断支援AIが上回り、専門医に匹敵する結果となった。
教師データの収集が困難な他の医療領域での活用にもつながる可能性
今後の予定として研究グループは、「汎用的な基盤技術として、教師データの収集が困難な他の医療領域での活用を進め、本技術の有用性を実証する。また、本技術を適用した診断支援システムを実用化し、膀胱内視鏡診断支援をはじめ、AIの活用が進んでいない医療分野でも高精度なAI診断支援を届ける」と述べている。
▼関連リンク
・産業技術総合研究所 研究成果