近年、日常診療で得られる医療や健康情報などのリアルワールドデータ(RWD)が注目されている。特にこれまで活用されてきたレセプトデータから得られにくい薬剤の治療効果や安全性など、臨床アウトカムの取得可能性があるデータとして電子カルテの利活用が期待されているが、臨床アウトカムに関連する多くのデータは入力形式が定められていない非構造化データであるため、データを構造化しなければ解析が難しいという課題があった。
今回の共同研究では、癌患者の電子カルテに保存されている非構造化データに、単語の重要度評価や態度表現分析などの自然言語処理技術を用いることで、薬物治療の効果などの臨床アウトカムを客観的に評価する手法を検討すると共に、遺伝子検査結果などのレセプトデータベースでは得られにくい情報についても、電子カルテから収集できるか試みた。
対象は、宮崎大病院に2018年4月から20年9月に通院、入院した癌患者115例の経過記録や放射線レポートなどの電子カルテデータ。薬物治療の効果と判定に重要と考えられるキーワードを主要評価項目に設定。副次評価項目には、薬物治療ラインや遺伝子検査結果を設定した。
その結果、薬物治療の効果判定に関連したキーワードとして、縮小、効果、著変、改善といった臨床上重要な単語などが特定されたほか、遺伝子検査296件のうち77%の検査結果を電子カルテデータから抽出できたことから、電子カルテの非構造化データから癌患者の治療効果判定に有用な情報が得られることが明らかになった。
今後、研究グループにライフデータイニシアチブを含めた4者で、複数のキーワードの関連性や文脈を考慮した人工知能(AI)による薬物治療効果判定モデルの構築に向け、AIを活用した自然言語処理技術を用いた薬物治療の効果判定モデル生成の研究に取り組む。