ヒトもサルも「予想外の大当たりで次の判断が狂う」、新たな理論で証明－筑波大

読了時間：約 3分18秒

2023年05月24日　AM11:15

プロスペクト理論＋強化学習理論で、ヒトとサルの価値観を検証

筑波大学は5月18日、ヒトもサルも予想外の大当たりで、次の判断が狂うことを明らかにしたと発表した。この研究は、同大医学医療系山田洋准教授らの研究グループによるもの。研究成果は、「Science Advances」に掲載されている。

画像はリリースより
（詳細は▼関連リンクからご確認ください）

ヒトがギャンブルを行う際には、さまざまな方法で当たりを予測する。最も単純な予測方法として、当たりの金額と当たりの確率を掛けた期待値を計算することが挙げられる。最も期待値の高い選択肢を繰り返し選ぶことで、平均的に高い利得を得ることができるためである。伝統的な経済学では、ヒトは期待値に応じて合理的に判断することを前提として行動を説明してきた。

しかし、実際のヒトの行動はそうではなく、お金の感じ方も確率の感じ方も、客観値からずれることが知られている。例えば、1万円持っていて2万円を得るのも、100万円を持っていて2万円を得るのも、利得は同じ2万円なのに、1万円から増えた2万円の方が大きな価値があるように感じる。また、宝くじの1等の当選確率は極めて低いのに、当たるかもしれないと思ってつい買ってしまいがちだ。このような、経済行動に関するヒトの主観を普遍的に説明するのが経済学の「プロスペクト理論」だ。

プロスペクト理論は、ヒトのギャンブルにおける予測をよく説明するが、ヒトの多面的な価値観の一部を捉えるに過ぎない。例えば、ヒトはギャンブルの勝ち負けに一喜一憂したり、勝ちが続いたり負けが混んだ状況で浮かれたり打ちひしがれたりする。プロスペクト理論では、ヒトの主観は揺らがず不変であるという前提にたって論理が構築されており、このような変化を説明しない。むしろ、このような主観の変化は、プロスペクト理論とは全く別の「強化学習」と呼ばれる価値の学習理論によって説明されてきた。予想よりも結果が良かったのか悪かったのかを意味する「報酬の予測誤差」に応じて、過去の経験から最も儲かるように行動を学習する理論だ。いずれも価値判断に関わる行動を説明する理論であるにも関わらず、その性質の違いからこれらの理論は別々に用いられてきた。

そこで研究グループは今回、2つの理論を統合することで、これらの主観が生まれる原理を統一的に説明することを試みた。さらに、ヒトと、ヒトに近い実験動物のマカクザル（以下、サル）の判断行動を比較検証することで、サルがヒトに良く似た価値観を持つかについて詳細に検証した。

ヒト/サルでよく似た当たり構造を持つギャンブルにより、行動予測理論を構築

研究では、ヒトとサルにできる限りよく似た当たり構造を持つギャンブルを行わせ、その行動を予測する理論を構築した。サルを用いた実験では、実験動物として飼育するサルに、ヒトが行うのと同じようなギャンブル（くじ引き）を繰り返し経験させた。ここでは、ヒトで用いるお金の代わりに、ジュースなどの飲み物を報酬として用いた。このくじでは、報酬の量とその報酬がもらえる確率が、別々の色のパイの数で示される。10か月ほど訓練すると、サルはくじが意味する確率とジュースの量を理解し、できるだけ多くの報酬が得られるようにギャンブルをするようになったという。一方で、サルの実験とは別に行ったヒトを対象とした実験では、参加者は初めに説明文を読み、2種類の色のパイの数が当たり金額と確率を表すことを理解し、その後、繰り返しギャンブルを行った。

サルもヒトも、予想外の大当たりを経験すると次のギャンブルも当たると感じやすい

このようにして取得したサルとヒトの行動データを解析した。まず、確率と報酬の利得に基づいた判断行動が、どのような主観に基づいて行われているのかを、従来のプロスペクト理論に基づく数理モデルを用いることで推定。その結果、ヒトの主観もサルの主観も、報酬の利得とそれを得られる確率のどちらも直線で示す客観値からずれており、上に凸の数学的な特徴で表現されることが判明した。

サルの主観を従来の経済学の理論で説明した後に、従来のプロスペクト理論では説明されてこなかったギャンブルの当り外れに基づく主観の変化について検討を行った。この際、プロスペクト理論と強化学習理論を統合した動的プロスペクト理論を構築。プロスペクト理論が仮定していた、主観が変化しないという前提を取り除き、予想外の度合いに応じて主観が変化する強化学習の性質を組み込んだ。

この新規理論を用いて行動データを解析したところ、サルでもヒトでも、予想外に大きな利得が得られた次のギャンブルで、確率に関する判断が全体に高まっていることが明らかになった。これは、サルもヒトも同様に、予想外の大当たりを経験すると、なぜか次のギャンブルも当たるのではないかと感じてしまうことを反映した主観と考えられる。

金銭感覚や確率の感じ方、成功の喜びなどに関する脳メカニズム理解につながる可能性

今回の研究成果を基に、ヒトとよく似たギャンブルを行うサルの脳を調べることで、ヒトが抱く多様な金銭感覚や確率の感じ方、成功した時の喜びなどが生み出される脳のメカニズムを理解する研究へと発展することが期待される。

「個人個人の価値観を生み出す脳の仕組みを理解することで、将来的に、多様な価値観を育み、認め合い、より多くの人が幸せを感じられる社会の実現に近づくことができると期待される」と、研究グループは述べている。（QLifePro編集部）

▼関連リンク
・筑波大学　TSUKUBA JORANAL

TimeLine: QLifePro編集部, ギャンブル, サル, 動的プロスペクト理論, 強化学習理論, 筑波大学, 脳

ヒトもサルも「予想外の大当たりで次の判断が狂う」、新たな理論で証明－筑波大

プロスペクト理論＋強化学習理論で、ヒトとサルの価値観を検証

ヒト/サルでよく似た当たり構造を持つギャンブルにより、行動予測理論を構築

サルもヒトも、予想外の大当たりを経験すると次のギャンブルも当たると感じやすい

金銭感覚や確率の感じ方、成功の喜びなどに関する脳メカニズム理解につながる可能性

同じカテゴリーの記事 医療

同じカテゴリーの記事　医療