精度向上のため、最新の自己教師あり学習法を用いた手法を検討
東京大学医学部附属病院は8月14日、心電図(ECG)解析における画期的な人工知能(AI)技術を開発したと発表した。この研究は、同大大学院医学系研究科の澤野晋之介(医学博士課程:研究当時)、同大医学部附属病院循環器内科の小寺聡特任講師(病院)、同大大学院医学系研究科先端循環器医科学講座の小室一成特任教授と協力機関の共同研究グループによるもの。研究成果は、「PLOS ONE」に掲載されている。
画像はリリースより
(詳細は▼関連リンクからご確認ください)
これまでのECG解析では、精度の高い異常検出には大量のラベル付きデータが必要とされていた。しかし、医療分野ではデータの収集やラベリングが困難で、この制約が精度向上の大きな障害となっていた。
そこで研究グループは、この課題を克服するために、最新の自己教師あり学習手法であるマスクドオートエンコーダー(MAE)を用いて高精度なECG解析モデルを開発した。具体的には、MAEを用いてマスクされたECGデータを再構築し、ビジョントランスフォーマー(ViT)モデルを事前学習した。MAEは、データの一部を隠し、その隠された部分を再構築することで学習を行う。この手法により、大量のラベル付きデータがなくても心機能低下を高い精度でECGから判読するモデルを実現することが可能となった。
多施設データで検証、MAEを用いたECG解析モデルはAUC 0.962
同大病院を含む7つの医療機関から収集した約23万例の多施設データを活用し、モデルを訓練・検証。その結果、MAEを用いたECG解析モデルは、外部検証コホート全体で受信者動作特性曲線下面積(AUC)が0.962という非常に高い値を示し、他の深層学習モデルを凌ぐ性能を示した。このモデルは、国際的に評価されているECGベンチマークデータセット(PTB-XL)でも高い性能を維持し、ECG解析の新たな標準となる可能性を示した。
MAEを用いたECG解析モデルの性能、モデルの容量と訓練データの量に依存
さらに、研究グループは、MAEベースのECG解析モデルの性能がモデルの容量と訓練データの量に依存することを発見した。具体的には、東京大学医学部附属病院のECGデータ3万8,245件を使用して訓練されたViTモデル(ViT-Base38K、ViT-Large38K、ViT-Huge38K)での性能向上が確認された。これにより、データが限られている場合でも、適切な自己教師付き学習手法を用いることで高性能なモデルを構築できることが示された。
異なる医療機関や地域でも一貫して高精度なECG解析が可能となる技術
今回の研究の意義は、多施設データの活用により、AIモデルの一般化性能が大幅に向上したことである。これにより、異なる医療機関や地域でも一貫して高精度なECG解析が可能となり、より広範な医療現場での応用が期待される。また、MAEを用いることで、大量のラベル付きデータがなくても高性能なAIモデルを構築できるため、データ収集のコストや時間を大幅に削減することが可能となる。「この成果は、医療分野におけるAI技術の実用化に向けた大きな一歩となる」と、研究グループは述べている。
▼関連リンク
・東京大学医学部附属病院 プレスリリース