自閉スペクトラム症の診断には多角的なアプローチが必要
弘前大学は11月20日、青年期および成人期の自閉スペクトラム症(ASD)の診断評価に、自然言語処理技術を用いてインタビュー中の言語を解析する手法が有用である可能性を見出したと発表した。この研究は、同大大学院保健学研究科および医学研究科の加藤澄客員教員(青森中央学院大学・教授)と、同大大学院保健学研究科の斉藤まなぶ教授、同・医学研究科の中村和彦教授らの研究グループによるもの。研究成果は、「PLOS ONE」に掲載されている。
画像はリリースより
(詳細は▼関連リンクからご確認ください)
ASDの主症状は社会的コミュニケーションの課題を中心に、特に語用論的障害(PI)として現れる。PIは社会的文脈で言語を効果的に使用することに関連する語用論的レベルでの言語理解と表現の困難を特徴とする。PIには、状況に基づいて言語形式を適応させること、字義通りでない言語(慣用句、比喩、皮肉、揶揄など)を解釈すること、および対人関係に影響を与える言語のニュアンスを理解することにおける困難が含まれる。これは、基本的な文法構造における問題ではなく、語用論的側面での問題となる。一般にPIは言語、非言語的側面、認知など複数の要因を組み込んで包括的に査定される必要がある。ASDのPIを包括的にマッピングする有効的な方法の一つは、ASD者の話し言葉のコーパスを利用することだ。コーパスの作成は海外で先行しているものの、解析情報の注釈がない生テキストだ。日本では、加藤澄客員教員らが2022年に初めて日本語話者であるASDとnon-ASD者の語彙-文法資源の選択を分析するための包括的な注釈スキームに基づくコーパスを開発。同コーパスは言語活動の相互に関連した層を構造化した選択体系機能言語学(SFL)の理論的枠組みに基づいて開発された。
ASD診断支援ツールとして最も一般的に使用されているのは、ADOS-2とADI-Rだ。ADOS-2は行動観察に基づく半構造化の診断評価ツールで、ADI-Rは保護者からのインタビューを通じて発達歴や現在の機能特性を評価する標準化ツールだ。これらは併用が推奨され、高い診断妥当性が示されている。しかし、特に成人の診断においては、ADOS-2の汎用性に課題があると指摘されている。例えば、ASDと他の神経発達症(ADHDなど)や精神疾患(統合失調症の陰性症状、不安障害、気分障害など)との区別が不明瞭であること、またASD自体の多様性が鑑別診断をさらに複雑にしていることが挙げられる。加えて、カモフラージュ行動や補償戦略によって症状が隠され、診断が困難になることがある。特に成人の場合、保護者やケア提供者からの発達報告が不足することや、患者自身の自己洞察が信頼性に欠ける点も問題だ。そのため、ASDの診断には多角的なアプローチが必要とされている。
研究グループは今回、「ASDに関連する神経認知異常が言語生成に反映され、それによってASDとnon-ASDを区別するために活用できるASD者固有の語彙-文法資源パターンが特定できる」という仮説を立てた。これらは社会的相互作用において一般的とされる語彙-文法資源の選択からの変異として捉えることができ、ASD者の神経認知の違いに関連する可能性がある言語行動を示唆していると考えられた。また、これらの判別には機械学習を適用した。
コーパス内のテキストなどに機械学習を適用、ASDか否かを区別できるモデルを開発
研究では、語彙-文法資源の選択の分析を通して、コーパス内のテキストと注釈に機械学習を適用し、ASDとnon-ASDを区別できるモデルを開発することを目的とした。機械学習には、加藤らが作成したASDとnon-ASDの話し言葉コーパスを使用。言語獲得の臨界期を過ぎた14歳以上、主に14~20歳までのASD(N=64、M=18、SD=3.48)とnon-ASD(N=71、N=19、SD=2.77)が選択された。ASDの診断はADOS-2のほか、知能検査などの精密検査をふまえ、専門医によりDSM-5診断基準で行われた。
機械学習アプローチでは、解釈のしやすさと性能のバランスに焦点を当て、ASDとnon-ASDを区別するために、線形モデル(ロジスティック回帰)とディープニューラルネットワーク(DNN)モデルの両方が検討された。また、ASDを区別するために「タグのみを使用する線形モデル(タグ線形)」「タグのみに依存するDNNモデル(タグDNN)」「タグとテキストの両方を組み込んだDNNモデル(テキスト+タグDNN)」を提案した。
インタビューの方がより効果的な診断手法と判明、大規模検証・スキーム改善が課題
3つのモデルによって生成された結果に有意差は見られなかったが、モデルのパフォーマンスはテキスト+タグDNNモデルがわずかに優れていた。また、「インタビュー」と「物語を語る」のテキストの比較では、「インタビュー」の方がASDの言語行動に関してnon-ASDとの違いが顕著に観察されることが示唆された。「インタビュー」は本質的に双方向的で社会的であるため、ASDの神経認知特性に関連する語彙-文法資源の選択の違いが現れやすくなる傾向がある。物語を語ることも、聞き手を前にしているので社会的ではあるが、そのモノローグ的な性質により、語彙-文法資源の選択の違いが顕在化する機会は少なくなる。
このような背景から、インタビューの方がより効果的な診断手法であることが判明した。一方、同研究ではサンプルサイズが小さく限界があるため、次の段階では同ツールの包括的な検証が求められる。そのためにはより多様で大規模なサンプルを収集し、研究結果の妥当性と一般化可能性を高める必要がある。
もう一つの限界は、ASDの診断手法として感度と特異度がそれぞれ73%・87%である点にある。これはASD診断において、偽陰性または偽陽性として現れる潜在的なエラー率がそれぞれ27%・13%であることを示唆している。精緻さを上げるため、組み立てた注釈スキームにシステムネットワークから追加注釈項目を組み込んだスキームの構築が今後の課題と言える。いずれにしても、ASDの診断には、言語ベースの診断を従来の方法と統合することで、より包括的で精緻な方法の探求が、誤診率の低減において重要となる。
従来法と統合し、ASDの正確な診断へのサポート強化に期待
今回の研究により、自然言語処理を使用してASDの診断ツールを開発する可能性が実証された。テキスト+タグのDNNモデルは、語彙-文法資源の選択によってASDとnon-ASDを鑑別診断できる可能性を示している。
「これは、語彙-文法資源の選択を調べることで、ASDの多分野にわたる診断をサポートする可能性を意味している。自然言語処理と機械学習を活用して、言語ベースの診断を従来の方法と統合し、ASDの正確な診断へのサポートを強化できることが期待できる」と、研究グループは述べている。
▼関連リンク
・弘前大学 プレスリリース