検査者間での診断技術の差異、AI活用で課題解決へ
理化学研究所(理研)は3月22日、超音波検査に人工知能(AI)技術を適用する上で、AIの判定根拠を可視化して検査者の診断を支援する新技術を開発したと発表した。この研究は、理研革新知能統合研究センター(AIP)目的指向基盤技術研究グループがん探索医療研究チームの小松正明副チームリーダー、浜本隆二チームリーダー、理研AIP-富士通連携センターの酒井彬客員研究員、昭和大学医学部産婦人科学講座の松岡隆准教授、小松玲奈助教らの共同研究グループによるもの。研究成果は、「Biomedicines」に掲載されている。
画像はリリースより
(詳細は▼関連リンクからご確認ください)
超音波検査は簡便性・非侵襲性・リアルタイム性に優れており、幅広い医学領域で使用されている。一方、超音波検査ではプローブを手動走査して画像を取得するため、検査者間での診断技術の差異が大きいこと、また超音波画像は音響陰影(影)の影響を受けやすく、画質劣化および診断精度の低下につながることなど、特有の課題がある。近年の人工知能(AI)の技術革新およびさまざまな医療分野への導入状況を踏まえ、これらの課題解決に向けたAIを活用した超音波画像診断支援技術の臨床応用が期待されている。
先行研究で開発した「部位検出結果のバーコード表示」、弱点あり
共同研究グループは、2018年度より胎児心臓超音波スクリーニング診断支援に向けたAI基盤技術の研究開発に取り組んできた。しかし、今後の臨床応用へ向けた課題の一つとして、複雑なディープニューラルネットワーク構造を持つAIの判定根拠について十分な説明性が得られないこと(ブラックボックス問題)が挙げられる。臨床現場においてAI搭載医療機器を利用する医療従事者だけでなく、診断結果をもとにインフォームドコンセントを受ける患者の信頼を得るためにも、よりAIの説明可能性を向上させることが求められている。
超音波検査動画の解析手法として、共同研究グループが以前提案した、動画情報を二次元データに変換した「部位検出結果のバーコード表示」がある。部位検出結果バーコード表示は、検査対象の正常な部位構造について教師あり学習をさせ、取得した動画についてフレームごとに正常な部位構造の検出状況を一覧表示して保存したデータである。異常所見がある場合には、正常な部位構造が検出されず、正常からの逸脱によって異常と判定できる。また、部位構造ごとに位置・大きさ・検出の有無などの有効な情報を含んでいるため、動画全体に対して深層学習を適用するよりも説明可能性が高くなる。一方、超音波検査動画を取得する際に起こりえるプローブの手振れや反復走査、また検査対象の動き(胎動など)には対応できないという弱点があった。
ディープラーニングを用いた新しい説明可能な表現「グラフチャート図」を開発
そこで、共同研究グループはこれらの弱点を克服しつつ、さらに説明可能性を向上させるための新たなアプローチとして、代表的な教師なし学習である「オートエンコーダ」を用いて、上記バーコードから得られた分散表現を解析することで、新しい説明可能な表現「グラフチャート図」を開発した。
カーネルを検査時間経過に添ってバーコード上をスライドさせ、部位構造の検出情報を抽出してオートエンコーダに入力すると、検出情報は二次元データに圧縮され、その分散表現の軌跡をプロットすることでグラフチャート図を作成する。グラフチャート図を作成する際には、view-proxy lossという新しい指標を導入している。この指標を最小限に抑えて最適化することで、オートエンコーダの学習を安定化させ、分散表現の軌跡が絡み合うことのないように工夫された。また、グラフチャート図の内面積を用いて異常度スコアを算出する。なお、上述のプローブの手振れや反復走査、検査対象の動きについては、グラフチャート図では同一の軌跡をたどるため、その影響を最小化できるという。
グラフチャート図/異常度スコア併用の読影で、検査者スクリーニング精度の向上を確認
次に、昭和大学病院産婦人科の胎児心臓超音波スクリーニングにおいて取得された、正常胎児および代表的な先天性心疾患であるファロー四徴症の超音波検査動画にグラフチャート図を適用。その結果、疾患の特徴を捉えていることが確認できた。
さらに、オートエンコーダによる情報の圧縮過程がブラックボックスとなってしまうため、部分構造の情報を類似したグループ(心臓、大血管など)ごとに段階的に圧縮することで説明可能性を維持したまま、分散表現を獲得する手法(階層型オートエンコーダ)も考案した。この階層型グラフチャート図により、異常判定を行う際にどのグループが判定根拠に寄与したのかを、検査者により明確に提示できることが期待される。
実際に、検査者がグラフチャート図および異常度スコアを参考にすることで、胎児心臓超音波スクリーニングの精度向上が見られるのかを検証した。今回、昭和大学病院産婦人科の専門医8人、一般産婦人科医10人、後期研修医9人の計27人の協力が得られた。検査者は、ランダムな胎児心臓超音波スクリーニング動画40動画について正常・異常判定し、また判定を下す際の確信度(検査者自身が判定に対してどの程度確信を持っているかを示す値)を5段階評価で記載した。
検査者が単独で読影した場合と、グラフチャート図および異常度スコアを併用して読影した場合とで比較したところ、受信者動作特性(ROC)曲線の曲線下面積(AUC)の算術平均において、専門医で0.966から0.975、一般医で0.829から0.890、後期研修医で0.616から0.748へと、全ての検査者レベルでスクリーニング精度の向上が見られた。これは、実際に検査者が深層学習に基づく説明可能な表現を用いて胎児心臓超音波スクリーニング精度を向上させた世界初の報告であり、検査者の診断能力を補強する説明可能AIの可能性を示している。
胎児心臓超音波スクリーニング診断支援技術の臨床応用の実現へ
今後は、産婦人科をはじめ幅広い医学領域において、さらに多くのAIを活用した超音波画像診断支援技術が導入されると予想される。しかし、検査者や施設間、超音波診断装置の機種間における画像精度管理など、臨床応用に向けて解決すべき課題を一つずつ克服していく必要がある。
同技術は、臨床現場で医療従事者および患者がAI搭載医療機器をより信頼して利用できるように、AIの判定根拠に対する説明可能性の向上に貢献すると期待できる。共同研究グループは、「これまで構築してきた基盤技術と統合することで、AIを活用した胎児心臓超音波スクリーニング診断支援技術の臨床応用の実現を目指す」と、述べている。
▼関連リンク
・理化学研究所 プレスリリース