画像診断症例106例対象、GPT-4/4V-based ChatGPTと放射線科医の診断精度を比較
大阪公立大学は7月25日、専門的な知識が必要な放射線画像診断において、骨軟部放射線領域におけるChatGPTと放射線科医の診断精度を比較した結果を発表した。この研究は、同大大学院医学研究科放射線診断学・IVR学の堀内大右研究医、人工知能学の植田大樹准教授らの研究グループの研究グループによるもの。研究成果は、「European Radiology」にオンライン掲載されている。
画像はリリースより
(詳細は▼関連リンクからご確認ください)
ChatGPTをはじめとする生成AIは、近年さまざまな分野で活用されており、医療分野でも期待されている。放射線画像診断は、多様な疾患に関連する多くの画像所見を解釈するために専門的な知識が必要だ。今後の画像診断におけるChatGPTの最適な活用のためには、ChatGPTの診断精度を評価することが重要だ。
今回の研究では、「Skeletal Radiology」に掲載された画像診断症例106例を対象とし、GPT-4-based ChatGPT、GPT-4V-based ChatGPT、および放射線科医(放射線科専攻医、放射線診断専門医)の診断精度を比較した。GPT-4-based ChatGPTには病歴と画像所見(文章)を、GPT-4V-based ChatGPTには病歴と画像自体を入力し、各症例について診断を生成した。また、放射線科医も同じ症例について診断を行った。なお、ChatGPTは自然な対話ができる生成AIであり、GPT-4Vは画像自体を処理することができるGPTだ。
診断精度は、放射線診断専門医>放射線科専攻医・GPT4>GPT-4V
診断精度を比較した結果、精度が高い方から放射線診断専門医、放射線科専攻医およびGPT4-based ChatGPT、GPT-4V-based ChatGPTの順であることがわかった。
GPT-4-based ChatGPTの生成診断参照で、放射線科医の診断精度わずかに上昇
また、同研究ではChatGPTが生成した診断を参考にした場合、放射線科医の診断精度が向上するかについても検討した。その結果、GPT-4-based ChatGPTの生成した診断を参考にした場合、放射線科医の診断精度は、わずかだが上昇した。この結果からも、ChatGPTが診断の補助ツールとして有用である可能性が示唆された。
性能を十分に理解した上でのChatGPT利用、骨軟部放射線領域の画像診断に有用な可能性
骨軟部放射線領域の画像診断においてChatGPTが有用である可能性が示された一方で、現時点でのChatGPTの診断性能を十分に理解した上で、活用する必要があることが示唆された。ChatGPTをはじめとする生成AIは日々進歩しており、将来的には画像診断の補助ツールとなることが大いに期待される、と研究グループは述べている。
▼関連リンク
・大阪公立大学 プレスリリース