特定のグループや年齢などによる因果効果の異質性検討、機械学習を多く用いる分野等は?
京都大学は10月30日、これまでに出版された医学論文情報を検索し、因果効果の異質性を調べるためにどのような機械学習手法が使われているのかを明らかにしたと発表した。この研究は、同大大学院医学研究科の井上浩輔准教授(社会疫学、白眉センター)、近藤尚己教授、同大成長戦略本部の古川壽亮教授、ハーバード大学公衆衛生大学院の安富元彦博士課程学生らの研究グループによるもの。研究成果は、「Journal of Clinical Epidemiology」にオンライン掲載されている。
近年、均一な治療を全員に提供するのではなく、個人が最大の治療効果を得られるよう治療を個別化する考え方(個別化医療)が広まっている。個別化医療を進める上で必要不可欠な情報は、ある特定のグループで治療効果が異なるのか(因果効果の異質性)である。例としては、女性で薬剤Xの治療効果が高い一方で、男性では薬剤Xの治療効果が全くない、というような状況が挙げられる。元来は、ランダム化比較試験(RCT)を行う際に、事前に興味のあるグループを明記し、そのグループで因果効果の異質性を検討することが多く行われてきた。しかし、この方法では事前に想定していないグループでの因果効果の異質性や、年齢などの連続的な変数と因果効果の関わりを検討することはできない。
近年の機械学習手法の発展に伴い、事前に仮説を設定せずに、さまざまな切り口から因果効果の異質性を検討することが可能になってきた。これらの機械学習手法の発展はめざましく、現在では多くの手法が存在するが、各手法を実際の利用頻度なども含めて解説した研究はなかった。
32報レビュー、2つの手法が頻繁に使われ応用領域は循環器・集中治療を中心に多岐
研究グループは、現時点での機械学習手法の利用状況と各手法の特徴を網羅的に検討することを目的に、「Medline」「EMBASE」の2つの書誌情報検索データベースを用いてスコーピングレビューを行った。ランダム化比較試験のデータに対して機械学習手法を適用し異質性を検討した論文を対象とし、2010年~2022年の間に出版された32報の論文がレビューの対象となった。
その結果、手法として「causal forest」と「Bayesian causal forest」が頻繁に用いられ、研究分野は循環器、集中治療を中心に、精神、呼吸器、社会学など多岐に渡っていたことがわかった。
研究グループは各手法について、概要・利点・限界を説明し、実装のためのRプログラミングコードを付記。さらに、機械学習手法を用いる際の注意点の詳細な説明も論文に示した。
より適切な形での機械学習の利用に期待
因果効果の異質性は個別化医療を進める上で必要不可欠な情報であるが、機械学習手法の急速な発展に伴い、どの手法を使って異質性を評価するべきなのかは多くの臨床研究者が疑問に思っているところだ。各手法を解説したレビュー論文が過去に何報か出版されているが、その多くは統計的な解説に注力しており、実際に手法を利用する研究者の視点では実用性に欠けるものだった。「今回の研究が、多くの臨床研究者に参照され、機械学習手法がより適切な形で利用されることが期待される」と、研究グループは述べている。
▼関連リンク
・京都大学 最新の研究成果を知る