11か国における経験と説明に基づく経済的選好の比較

11カ国の経験と基本的な経済的選好の記述の比較

背景と動機

近年の研究では、人間が報酬の価値をエンコードする過程において高度な文脈依存性が存在し、これが一部の場合で非最適な意思決定をもたらすことが示されています。しかし、このような計算制限が人間の認知の普遍的な特徴であるかどうかはまだ明らかではありません。この研究では、アルゼンチン、イラン、ロシア、日本、中国、インド、イスラエル、チリ、モロッコ、フランス、アメリカの11カ国から561名の個人の行動を調査し、報酬価値エンコードの文脈依存性が人間の認知の一貫した特徴であるかどうかを探求しました。

研究の出典

この研究は、Hernán Anlló、Sophie Bavard、Fatimaezzahra Benmarrakchi、Darla Bonaguraなどの多くの学者が協力して行い、パリ高等師範学校や早稲田大学などの複数の国際的に有名な学術機関が参加しています。研究結果は『Nature Human Behaviour』誌に掲載され、論文は2024年4月19日に受理されました。

研究プロセス

行動実験デザイン

  1. 強化学習タスク(RLタスク):このタスクは、学習フェーズと移行フェーズの二つのフェーズに分かれています。学習フェーズでは、参加者は最大の報酬を得るために二つの選択肢から一つを選ぶ必要があります。各選択肢には異なる報酬確率があり、参加者は複数の試行を通じて各選択肢の価値を徐々に学習します。移行フェーズでは、以前に学習した選択肢が新しい意思決定状況に再構成されますが、フィードバック情報は提供されません。

  2. 記述的意思決定タスク(Lotteryタスク):このタスクでは、既知の報酬確率と報酬値を持つ選択肢を選びます。これはRLタスクの移行フェーズに対応しています。参加者は異なる確率の下で高値または低値の報酬を選ぶ必要があります。

  3. アンケート調査:タスク完了後、参加者は社会経済的、文化的、認知的特徴のデータを収集するために一連のアンケートに回答します。

データ分析方法

研究では、データ分析に一般化線形混合効果モデルを使用し、主に正しい選択率に注目しました。観察された意思決定戦略を定量化するために、主観的結果のスケーリングに基づくモデルを使用して選択行動を形式化しました。

参加者の特徴と選定基準

研究では、異なる社会経済的および文化的背景を持つ参加者を選び、サンプルの広範性と代表性を確保しました。参加者は以下の基準を満たす必要があります:対象国の国籍を持ち、対象国に常住し、少なくとも基礎教育を修了し、対象国の公用語を母語とすること。

主な発見

経験型RLタスク

  • 学習フェーズ:異なる国の参加者は、各意思決定状況での平均正しい選択率がランダムレベルを著しく上回っており、すべての参加者が効果的に学習できることを示しています。しかし、結果の幅効果(Magnitude Effect)は顕著ではなく、異なる期待値の差異が学習パフォーマンスに統計的に有意な影響を与えないことが明らかになりました。
  • 移行フェーズ:移行フェーズでは、異なる国の参加者がいくつかの状況で類似または一貫した非最適選択行動を示し、文脈依存性が人間の認知の普遍的な特徴であることをさらに証明しました。

記述型Lotteryタスク

  • リスク選好:各国の参加者のリスク回避行動には著しい違いが見られました。リスクが増加するにつれて、すべての国の参加者は高価値選択肢を選ぶ割合が減少しましたが、この効果の程度は国ごとに著しい違いがありました。
  • 記述型選択とRL選択の比較:類似の意思決定状況で、リスク回避はRLタスクの選好逆転現象を説明できず、記述型意思決定と経験型意思決定が文化を超えて顕著に異なることを示しています。

計算結果

  • スケーリングパラメータ(ν):RLタスクとLotteryタスクのスケーリングパラメータは、異なる文化間で異なる安定性を示しました。RLタスクのスケーリングパラメータには国間で顕著な差異は見られませんでしたが、Lotteryタスクのスケーリングパラメータには顕著な国際差が見られました。

結論

この研究の主要な結論は、報酬価値エンコードの文脈依存性が人間の認知における一貫して文化を超えて安定した特徴であり、記述型意思決定における文化的感受性とは対照的であることです。この発見は、強化学習理論に新たな証拠を提供するだけでなく、行動科学に基づいた公共政策や介入策の設計にも重要な示唆を与えます。

研究のハイライト

  1. 文化を超えた一貫性:社会経済的地位、教育レベル、文化的背景の違いにもかかわらず、各国の参加者はRLタスクでの文脈依存行動に高度な一貫性を示しました。
  2. 文脈依存性とリスク回避の区別:リスク回避はRLタスクでの非最適選択行動を説明できず、これら二つ