腎生検画像のAI解析、ラベルつきデータが乏しく普及を妨げていた
大阪大学は11月6日、自己教師あり学習を腎糸球体画像疾患分類に適応し、少ないラベルつきデータから効率的に疾患分類を行うAIを開発したと発表した。この研究は、同大医学部医学科6年の安部政俊氏、九州大学データ駆動イノベーション推進本部の新岡宏彦教授、大阪大学大学院医学系研究科の松井功講師、猪阪善隆教授(腎臓内科学)らの研究グループによるもの。研究成果は、「Journal of the American Society of Nephrology」に掲載されている。
画像はリリースより
(詳細は▼関連リンクからご確認ください)
深層学習は腎生検病理画像解析に有効であるということが知られている。しかし、深層学習モデルを十分に学習させるにはラベルつきデータを大量に集める必要があり、ラベル付きデータが乏しいことが腎生検画像の解析における深層学習の普及を妨げている。
腎生検384例のPAS染色画像、自己教師あり学習手法DINOを適応
研究グループは、同大医学部附属病院腎臓内科で腎生検を受けた384例のPAS染色画像中の1万423枚の糸球体画像に自己教師あり学習の手法の1つであるDINO(self-distillation with no labels)を適応した。
DINO学習済みモデルによって生成された特徴マップを可視化するために主成分分析(PCA)を用いると、糸球体の構成要素ごとに色が分かれ、異なる組織には異なる主成分の要素が強く出ていることが確認できた。
ラベル付きデータ制限された場合も従来モデルより性能優れると判明
そして、DINO学習済みモデルまたは従来のImageNet学習済みモデルを用いて分類タスクを学習させ、受信者動作特性曲線下面積(ROC_AUC)などの指標を用いて性能を評価した。分類タスクとして微小糸球体病変、メサンギウム増殖性糸球体腎炎、膜性腎症、糖尿病性腎症の4疾患分類と、高血圧、タンパク尿、血尿などの臨床パラメータ分類の2つを用いた。
疾患分類では、DINO学習済みモデル(ROC_AUC=0.934)がImageNet学習済みモデル(ROC_AUC=0.892)を上回った。ラベル付きデータが制限された場合、ImageNet学習済みモデルのROC_AUCは0.763[95%信頼区間:0.724~0.802]に低下したが、DINO学習済みモデルは優れた性能を維持した(ROC_AUC=0.882 95%信頼区間:0.862~0.903)。DINO学習済みモデルはいくつかの臨床パラメータにおいてもより高いROC_AUCを示した。
今回の研究では自己教師あり学習を腎糸球体分類に適応することで、最小限のラベル付けでも高い性能で疾患分類を行うことができることを示した。「自己教師あり学習を用いることでデジタル病理学における深層学習の応用の効率化が進み、さらなる発展を遂げることが期待される」と、研究グループは述べている。
▼関連リンク
・大阪大学 ResOU