日本の7、8月は、WBGTによる熱中症リスクの詳細な評価が困難
国立循環器病研究センターは7月28日、人工知能(AI)技術の機械学習を用いて、気象データ等から熱中症発症数を高精度に予測するAIモデルを世界で初めて開発したと発表した。この研究は、同センター予防医学・疫学情報部の尾形宗士郎上級研究員、西村邦宏部長らと、関西大学環境都市工学部の尾﨑平教授、北詰恵一教授ら、国立環境研究所の山崎新エコチル調査コアセンター長、地球環境研究センターの山形与志樹客員研究員らの研究グループによるもの。研究成果は、「Nature Communications」に掲載されている。
画像はリリースより
地球温暖化に伴い猛暑日が増加し、熱中症発症リスクが増加すると想定されている。近年、世界各地において熱波が発生し、多数の熱中症が報告されている。また、気温と湿度と日射量を複合したWBGT(湿球黒球温度)は、気候条件から熱中症リスクを示す指標として広く使用されている。しかし、WBGTで熱中症リスクを評価すると、日本の7、8月の多くの日がハイリスクとなり、熱中症リスクの詳細な評価が困難だった。
市町村単位の12時間ごとの熱中症発症数をAIモデルで予測
そこで研究グループは、市町村の消防署より提供を受けた匿名化済みの熱中症搬送情報、The Weather Company社による高解像度気象データ、AI技術の機械学習を用いて、12時間ごとの市町村単位の熱中症発症者数を高精度に予測するAIモデルを作成した。
近畿地方16市町村の2015~2017年の6~9月のデータを予測モデル作成のための訓練データセットとし(熱中症による救急搬送の全症例件数=1万1,349件)、2018年の6~9月のデータを予測モデルの精度を検証するためのデータセットとした(熱中症による救急搬送の全症例件数=7,513件)。天気情報と暦情報と公開されている市町村の統計情報(人口、人口男女比、高齢化割合、緑地面積等)を特徴量とし、熱中症による救急搬送の全症例件数と中等症以上症例件数(入院診療、長期入院、死亡例)を教師データとし、複数の機械学習アルゴリズムで(一般化線形モデル、一般化加法モデル、ランダムフォレスト、勾配ブースティング)、AI予測モデルを作成。比較のために、古典的な統計モデルである一般化線形モデルとWBGTと市町村人口のみで作成した古典予測モデルも作成した。
作成した予測モデルと2018年の天気情報と暦情報と市町村の統計情報によって、2018年における12時間ごとの市町村単位の熱中症発症数の予測値を求め、それに対応する実測数との差をみることで、作成した予測モデルの精度を評価した。市町村単位の12時間ごとの予測精度は二乗平均平方根誤差(RMSE)で評価し、熱中症発症数が多い日の全市町村の1日単位の予測精度は平均絶対パーセント誤差(MAPE)で評価。RMSE、MAPEともに低いほど予測精度が高いことを示す。
熱中症発症数が急上昇するピーク日も高精度に予測
熱中症による救急搬送の全症例件数に対して、古典的な予測モデルでは、RMSEが3.73(件数)でMAPEが43.0%だった一方で、作成したAI予測モデルは、RMSEが2.97(件数)でMAPEが14.8%だった。
2018年のモデル精度検証のための検証データセットでは、古典的な予測モデルでの熱中症発症数ピーク時の予測精度は低い結果であったが、AI予測モデルでは、ピーク時も含めて観測件数と予測件数が非常に類似していることが示され、予測精度が高いことが示された。
また、熱中症による救急搬送の中等症以上症例件数(入院診療、長期入院、死亡例)に対して、古典的な予測モデルのRMSEは1.14(件数)、MAPEは37.7%であった一方、AI予測モデルのRMSEは0.83(件数)、MAPEは10.6%だった。
ルーティンで収集される情報の活用で社会実装しやすい
今回の研究で開発された、天気情報と暦情報と市町村の統計情報を用いた熱中症発症数予測モデルは、熱中症による救急搬送の全症例件数と中等症以上症例件数(入院診療、長期入院、死亡例)を高精度に予測することに成功した。気象条件と熱中症発症数が関連することは、すでに多くの論文で報告されているが、同研究のように熱中症発症数・重症度・発症数ピークを高精度に予測するAIモデルは世界初の研究結果であるという。
「本AIモデルは天気情報と暦情報と市町村の統計情報といったルーティンで収集されている情報を用いて熱中症発症数を予測することができるので、本AIモデルは比較的容易に社会実装できると考えている。将来的に熱中症アラートを高精度に発信することで、多くの方の熱中症予防につながることを期待している」と、研究グループは述べている。
▼関連リンク
・国立循環器病研究センター プレスリリース