機械学習を用いて、気象観測・暦データを基にした院外心停止発症予測モデルを作成
国立循環器病研究センターは5月18日、機械学習を用いて気象観測データと暦データを基にした院外心停止発症予測モデルを世界で初めて作成したと発表した。この研究は、同研究センター予防医学・疫学情報部の中島啓裕客員研究員(現ミシガン大学)、尾形宗士郎上級研究員、西村邦宏部長、野口暉夫副院長らの研究グループによるもの。研究成果は、「Heart誌」に掲載されている。
画像はリリースより
院外心停止は公衆衛生上の重要な問題であり、日本では年間約11万件発症しているとされている。蘇生科学の目覚ましい発達にも関わらず、社会復帰率は約7%前後と低く、社会復帰率改善は先進諸国の喫緊の課題だ。
これまで蘇生科学の研究は主に病院前救護体制および病院収容後の治療に焦点が当てられてきた。研究グループは、院外心停止発症の要因に焦点を当て、過去の研究で心血管疾患と気温に関係性があるという報告から、気象条件をもとに日々変動する院外心停止発症リスクを予測するモデルの作成を行った。
心停止発症数予測に強く関連の因子、気象データ「低い平均気温」、暦データ「冬季」など
同研究では、総務省消防庁によるウツタイン様式救急蘇生統計データとWeather Company社の高解像度気象データを用いた。2005年1月~2013年12月を訓練データセットとして、1日あたりの心停止発症数を予測する機械学習モデルを作成。2014年1月~2015年12月のデータを用いて同予測モデルの精度を試験し、予報システムに広く使用されている平均絶対誤差(MAE)と平均絶対パーセント誤差(MAPE)を用いて評価した。MAE、MAPEともに低いほど予測精度が高いことを示し、一般的にMAPEは10%以下で高精度であるとされている。
研究期間中に登録された心原性院外心停止66万1,052件(訓練モデル52万5,374件および試験モデル13万5,678件)を解析対象とし、気象データのみ使用したモデル、暦データのみを使用したモデルおよび気象と暦データを組み合わせたモデルを作成。予測精度をそれぞれ評価した。
評価の結果、気象と暦データを組み合わせたモデルは、訓練データセットにおいてMAE 1.314、MAPE 7.007%と他モデルと比較して最も精度が高く、試験データセットにおいてもMAE 1.547、MAPE 7.788%と高い予測精度を示した。また、心停止発症数予測において強く関連した因子は、気象データでは低い平均気温、日内・日間の大きな気温差であり、暦データでは日曜日、月曜日、祝日、冬季(12月~2月)だった。
実用化には、さらなる研究が必要
今回、気象観測データと暦データを用いた院外心停止発症予測モデルは、高精度で院外心停止の発症を予測することに成功した。過去に気温と心血管疾患の関係性を報告した論文はあるが、これまでに複数の気象因子を用いた研究はないという。同研究では、機械学習を用いることで複数の因子を使用し、さらには日内・日間の気温差による院外心停止発症リスクについて調べることに成功した。
気象情報を院外心停止発症予測モデルに使用する利点として、気象予報は2週間先の未来まで予測可能なことが考えられる。研究グループは将来的に、循環器病を有する患者に対して、今回の研究で得られた院外心停止発症リスクの高い日の情報を事前に提供することで、実際に心停止発症を減らすことができるかの検証を考えているという。ただし、同研究で使用した院外心停止データは都道府県レベルの粒度であり、さらに心停止発症場所(屋外、屋内)に関する情報がないため、実用化のためには、さらなる研究が必要だとしている。
▼関連リンク
・国立循環器病研究センター プレスリリース