機械学習を用いて従来の13因子の予測モデルより精度よく効率的に予測できるか?
東京大学医学部附属病院は4月19日、健診での糖尿病指摘後に医療機関を受診しない集団を機械学習により予測したと発表した。この研究は、同大大学院医学系研究科の岡田啓特任助教、山口聡子特任准教授、山内敏正教授、南学正臣教授、康永秀生教授、門脇孝名誉教授(虎の門病院院長)らの研究グループによるもの。研究成果は、「Diabetes Care」オンライン版に掲載されている。
糖尿病の治療を受けずに放置することにより、深刻な合併症になるリスクが高まることが知られており、糖尿病と診断された場合には、受診して治療を受けることが非常に重要だ。しかしながら、糖尿病は一般に無症状であることも多いため、健診で糖尿病を指摘された後も医療機関の受診率は低いのが現状で、実際、過去の報告によると、糖代謝異常で受診勧奨を受けた患者のうち、35%しか受診していなかった。このような健診後に受診しない集団についての研究は、世界でも数が少なく、どのような集団が受診しにくいのか、ということははっきりしていなかった。
日本では、13個の因子を用いた予測モデルの報告があるが、機械学習を用いることにより、より「良く」「効率的に」糖尿病受診勧奨後に未受診となる集団を予測できれば、このようなリスクの高い集団に早期に介入することにより、受診率を上げて合併症を予防する医療政策立案に役立つ可能性があると考えられた。そこで今回、研究グループは、機械学習を用いて、糖尿病の受診勧奨後の未受診を予測するモデルの構築を試みた。
HbA1c値、脂質異常症薬処方など4因子で従来モデルより高精度に予測
診療報酬請求明細書・健診のデータを含むJMDCデータベースには2019年10月までの健診情報が登録されている。この中から、健診受診から半年以上追跡が可能な成人のうち、健診で糖尿病の診断基準(HbA1c値が6.5%以上かつ空腹時血糖値が126mg/dL以上)を満たした1万645人を解析対象とした。このうち5,450人(51.2%)が受診勧奨にも関わらず、糖尿病に関して医療機関を受診しなかった。対象を4:1に分け、前者をモデル構築用、後者をモデル検証用の集団とし、モデル構築用の集団でLasso回帰を行い、未受診を予測する重要な因子を同定した。より少ない因子で予測能を保つことができるといわれるLasso回帰の1標準誤差ルールを用いて、39個の因子の中から予測因子を選択した。対照となる予測モデルとしては、2014年に科学誌に掲載された、13個の因子を含む予測モデルを用いた。
Lasso回帰の1標準誤差ルールで選ばれた予測因子は、(1)過去12か月の受診頻度、(2)HbA1c値、(3)脂質異常症薬処方、(4)降圧薬処方であり、この4つだけで予測したモデルの方が対照モデルの予測性能よりもDelong検定で有意に高い予測能を示した(c統計量:Lassoモデル0.71(95%信頼区間0.69-0.73)、対照モデル0.67(95%信頼区間0.65-0.69)、P値<0.001)。
糖尿病合併症予防と健康寿命延伸への貢献に期待
今回の研究で機械学習によって得られた予測モデルは、健診で糖尿病を指摘後に未受診となる集団を、既存モデルよりも高い予測能で予測できることが明らかになった。糖尿病の合併症予防は、日本のみならず、世界中で大きな公衆衛生上の問題であり、同研究の結果が活用されれば、日本全体における糖尿病患者の受診率が向上する可能性がある。「受診率が向上すれば、心筋梗塞、脳卒中や慢性腎不全などの合併症を予防できる可能性が増加し、心筋梗塞や脳梗塞といった急性期疾患の予防につながり、ひいては健康寿命の延伸にもつながることが期待される」と、研究グループは述べている。
▼関連リンク
・東京大学医学部附属病院 プレス発表