IVIG不応に関連する重要な3つの項目から、臨床応用可能で簡便な新規スコアを作成
山梨大学は3月31日、山梨県内の小児入院施設を中心に構成される山梨川崎病研究グループ(代表:長谷部洋平 山梨大学小児科学講座 特任助教)の協力により収集した2010~2020年の川崎病臨床データから機械学習を用いて、IVIG(大量免疫グロブリン静注)不応予測を行ったと発表した。この研究は、同大医学部小児科学講座の須長祐人臨床助教、犬飼岳史教授らと、千葉大学大学院医学研究院人工知能(AI)医学/理化学研究所の川上英良教授らの研究グループによるもの。研究成果は、「Clinical Rheumatology」にオンラインに掲載されている。
画像はリリースより
(詳細は▼関連リンクからご確認ください)
川崎病(KD)は、乳幼児期に好発する全身の血管炎症候群で、発熱の持続、眼球結膜の充血、口唇の紅潮、不定形発疹、四肢末端の変化や頚部リンパ節の腫脹などの症状を特徴とする。冠動脈をはじめとする中型動脈の炎症を中心とした動脈炎を生じ、冠動脈瘤を形成する可能性がある。一般的に、中型血管の炎症から動脈炎、汎血管炎に至り、発症10日以降で動脈の拡張を認める。
KDの標準的な初期治療は、IVIG療法が確立されているが、約20%の症例で発熱や炎症所見が改善せず、IVIG不応として追加治療を必要とする。IVIG不応症例は、冠動脈病変を合併するリスクが高い。近年、治療前にIVIG不応リスク層別化を行い、高リスク群に対する初期治療をIVIG+他の抗炎症薬とすることで、冠動脈病変を含めたKDの予後を改善する可能性があると報告されている。冠動脈病変の発症を抑えるため、治療前のIVIG不応リスクをより正確に予測することは重要な課題だ。
過去にKD症例を対象に機械学習を施行した報告はあるが、機械学習の結果を踏まえて簡便なスコアを作成した報告はない。研究グループは今回、機械学習を使用し、診断時の臨床的特徴からIVIG不応を予測した上で、その結果を踏まえ、IVIG不応に関連する最も重要な3つの項目から、臨床応用が可能で簡便な新たなスコアを作成した。
1,002例を対象に後方視的コホート研究を実施、新規スコアと代表的なスコアを比較
研究では、2010年6月~2020年12月の間に山梨大学およびその関連病院で診断・治療されたKD症例1,002例を対象とし、後方視的コホート研究を行った。機械学習はpython、scikit learnで実施。機械学習の説明変数は、診断時における臨床的特徴および検査データの計30項目とし、目的変数はIVIG反応性とした。KD症例1,002例のうち、227例(22.7%)が初回IVIG不応だった。801例(約80%)をトレーニングデータ、201例(約20%)をテストデータとし、多数の決定木に基づいたアンサンブル学習アルゴリズムであるRandom Forest法、eXtreme Gradient Boosting(XGBoost)法と、Light Gradient Boosting Machine(Light GBM)法を用いた。また、予測モデルに影響を与えIVIG反応性の高い説明変数を、SHAP(SHapley Additive exPlanation)法で特定した。SHAP法は協力ゲーム理論における報酬を貢献度に応じて分配する手法を機械学習に応用した手法であり、それぞれの説明変数(項目)および実際の数値が、どの程度予測に影響を与えたかを具体的に算出することができる。それらの結果から、各項目のカットオフを決定し、機械学習に基づく簡便なスコア(山梨スコア)を構築した。
同研究の患児を対象に、新たなスコア(山梨スコア)の曲線下面積(AUC)、感度および特異度を評価し、過去に報告されているロジスティック回帰分析で作られた代表的な3つのスコア(群馬スコア、久留米スコア、大阪スコア)と比較した。
IVIG不応予測に重要な上位3項目は「治療開始日・CRP値・総コレステロール値」と判明
その結果、各モデルにおけるIVIG不応予測の中で最も精度が高かったのは、Light GBM法だった。Light GBM法での精度、感度、特異度、陽性予測値、陰性予測値、陽性尤度比、陰性尤度比はそれぞれ0.78(95%信頼区間: 0.72-0.84)、0.50(0.36-0.64)、0.88(0.82-0.93)、0.59(0.43-0.74)、0.83(0.77-0.89)、4.14(2.48-6.90)および0.57(0.43-0.75)だった。
次に、Light GBM法での予測に影響した上位20項目をSHAPで評価した。SHAP値の絶対値が高いほど、IVIG不応予測をする上でその項目がより重要であることを示している。IVIG不応予測に重要な上位3項目は、治療開始日、CRP値と総コレステロール値だった。過去に報告されているIVIG不応予測スコアの中で、総コレステロール値が含まれているスコアはないものの、近年の研究から、総コレステロール値はKDの病態生理へ関与すると言われている。
SHAPの結果から構築した新規スコアは既存のIVIG不応予測スコアと同等以上の予測精度
SHAPの結果から、IVIG不応予測モデルに影響した上位3項目をスコアの項目とした。各項目のSHAP dependence plotを解析し、その結果から開始日≦4日、CRP≧10および7mg/dL、総コレステロール≦131mg/dLという各項目のカットオフ値を設定。また、開始日≦4日目、CRP≧10mg/dLを2点、CRP≧7mg/dL(および<10mg/dL)、総コレステロール≦131mg/dLを1点として、この3項目から成る簡易スコアリングモデル(山梨スコア)を作成した。同施設の患児を対象とし、新たなスコア(山梨スコア)を、群馬スコア、久留米スコア、大阪スコアと比較したところ、3項目から構成される新たなスコアは群馬スコアとほぼ同じ精度でIVIG不応を予測し、久留米、大阪スコアよりさらに高い確率で予測できたという。
解析規模の拡張で、KDの病態生理に関連する因子の発見や予測モデル作成に期待
多数の決定木に基づいたアンサンブル学習アルゴリズムは、多重共線性を考慮する必要がないため、予測変数を大幅に増加させても解析が成立する。今後、解析規模を拡張することで、従来の解析からは予想しがたいKDの病態生理に関連する因子の発見、より有用な予測モデルの作成が期待される。また、同研究ではIVIG不応が予測されたが、KDの予後を改善するためには、遠隔期の冠動脈病変の有無の予測が望まれる。
「SHAPを適用することで、ランダムフォレスト法の説明変数の意義を明確化し、新規の簡便なスコアリングシステムを構築することができた。しかし、他の人種、集団での評価ができておらず、今後、他の人種や集団に適用するためにはさらなる検証が必要だ」と、研究グループは述べている。
▼関連リンク
・山梨大学 プレスリリース