ゲーム理論・入門 新版 (岡田章) 第12章 ゲーム実験
ゲーム理論 新版 が難しすぎたので、ゲーム理論・入門 新版--人間社会の理解のために (有斐閣アルマ) から読むことにした。
この章では、ゲーム理論の理論を実験によってテストすることの意義と実例を見ていく。
ゲーム実験の意義
- 理論は仮定の体系であり、それが論理的/数学的に整合的であるというだけでは、実証科学の理論として十分ではない。
- 実証科学の理論は、現実の事象や観測データをうまく説明できている必要がある。
- それをテストするための手法が「実験」であるが、社会科学において「実験」は不可能と言われてきた。
- その理由は2つある。
- 社会的な実験の環境を構築し適切にコントロールすることが難しい。
- 理論が研究室レベルでの実験によってテストできるほど定式化されていない。
- ゲーム理論は、ゲームのルールとプレイヤーの行動原理を非常に明確に定式化する。このことによって、研究室において実験をデザインすることが容易になり、ゲーム理論の様々な理論予測を実験によってテストすることが可能となった。
- 実験研究の意義は大きく分けて3つある。
- 理論の適用可能な範囲とその限界を明らかにする。
- 理論がまだ確立されていない問題において、諸変数の規則性を実験データから発見し、理論の構築の手がかりを得る。
- 様々な政策や施策の効果を実験によってシミュレーションする。
- 実験研究への批判として、現実社会と実験室環境との差異をあげつらうものがあるが、実験研究の目的は、現実経済を忠実に再現することでも、正確な予測を行うことでもないことに注意が必要。
この様な実験研究の意義を踏まえて、有名な3つの実験について見ていく。
ゲーム実験の実例
1. 最後通告ゲーム
ルールと理論解
ルールは次の通りである。
- 2人のプレイヤー1と2が一定の金額 の分配をめぐって交渉する。
- 最初にプレイヤー1 (提案者) が分配 ( ), を提案する。ここで はプレイヤー1の取り分であり、 はプレイヤー2の取り分である。
- 次にプレイヤー2 (応答者) が提案を受け入れるかどうかを表明する。
- もし、プレイヤー2が受け入れれば、分配 ( ) が合意され、プレイヤー2が拒否すれば交渉は決裂し2人は何も得られない。
6章で見たように、プレイヤーの合理性を前提とすると、プレイヤー1がほぼ全てを独占することになる。この予測は現実の人々の行動にも当てはまるのだろうか?
実験結果
過去記事で見たように、部分ゲーム完全均衡点が実際にプレイされることはほとんどない。特に提案者の要求額が大きい時、応答者は正の利得を犠牲にしても提案を拒否することが観察される。
応答者の意思決定には、自分の金銭的利得の最大化だけでなく、公平性も考慮して行われる。
相手の親切な行為に対してこちらも親切な行為でお返しをする、相手の不親切な行為にはこちらも不親切な行為でお返しをするという行動様式を、互恵性という。特に前者を正の互恵性、後者を負の互恵性という。
提案者の多くが40%から50%程度の金額を提案するという観察結果は、2通りに解釈できる。1つは、公平な分配を提案して相手も金銭的利得を得ることに喜びを感じる利他的選好を、生来提案者は持っているという解釈である。もう1つは、応答者の負の互恵性を予測して、自分の金銭的利得を最大化するために、拒否される可能性の小さい金額を提案するという解釈である。
独裁者ゲーム
この2つの解釈のどちらが正しいかを確かめるために、最後通告ゲームのルールを少し変えた、独裁者ゲームを考える。このゲームでは、提案者が分配を提案した後、応答者に選択の余地はなく、提案者の提案通りに分配が行われる。
こうした場合、提案額の平均は分配総額の約20%程度になる。最後通告ゲームと比べて、提案額の率が下がっているということは、応答者の負の互恵性を恐れて戦略的に提案していたことが分かる。しかし、0%になるのではなく、20%にとどまっているということは、一定程度、利他的選好を持っている被験者も存在することも否定できない。
信頼ゲーム
ルールは次の通り。
- プレイヤー1 (投資家) は の資産を持ち、資産のうちどれだけを投資するか (投資額 ) を決定しプレイヤー2に預ける。
- 投資の収益率は で、プレイヤー1の投資額 は となる。
- プレイヤー2 (資産運用者) は、収益 のうち自分の取り分Yを選択し、 の額を投資家に返す。
- 投資家の利得は 、すなわち であり、運用者の利益は収益 である。
投資家も資産運用者も自分の金銭的利得を最大にすることが目的であるならば、運用者は収益を全て自分の取り分にする。よって がゲームの部分ゲーム完全均衡点となる。
しかし実験の結果は、投資家の投資額は平均50%程度で、運用者の返却額は平均95%程度だった。
投資家は、運用者が投資による利益の一部をきちんと返却することを信頼しているということを示している。
2. 公共財の供給
公共財の供給ゲームについては、5章と7章で、有限回繰り返しゲームを前提とすると協力行動は実現しないが、無限回の繰り返しゲームを前提とすると協力行動が実現すること (フォーク定理) を確認した。
これらの理論的説明は、現実の人々の行動と整合的なのだろうか?
ゼルテンとシュトカーの有限回繰り返しゲーム実験
- ゲームを繰り返すうちに、被験者は相手と協力することを学習する様子が観察された。
- これは被験者の行動が、最適化行動では十分に説明されないことを示している。
- ゼルテンとシュトカーは人々の行動を、人々の行動インセンティブは金銭的利得であるという経済学の通常の仮定を採用しつつ、最適化行動は採用せずに、限定合理的な学習行動によって被験者の協力行動を説明した。
フェアとゲヒターの処罰機会あり公共財供給ゲーム実験
下記の実験で、被験者の行動は金銭的利得のみからは説明できず、被験者は不公平性を嫌うなどの社会的選好を持つことが示された。
3. 平均値推測ゲーム
ルールと理論解
- n 人のプレイヤーがそれぞれ独立に 0 から 100 の数字を 1 つ選ぶ。
- 選ばれた n 個の数字の平均値を p 倍した数字に最も近い数字を選んだプレイヤーが勝ち。
- ケインズの美人投票に似ており、その場合は p = 1 となる。
- 理論解は p が 1 未満の場合 (例えば 0.7 の場合)、全てのプレイヤーが 0 を選ぶ戦略の組が唯一のナッシュ均衡点となる。
実験結果
- ポートフォリオ・マネージャ: 24.31、どこかの大学の経済学 Ph.D. 取得者: 27.44、カルテックの学部生: 21.88、高校生: 32.45、etc.
- 被験者の平均的な行動仮説は、「区間 [0, 100] の中間値 50 から推論を始めて、1 〜 2 回の深さの推論で弱支配される数字を除去し、35 から 24.5 の近くの数字を選択する」というものだったと推測される。
- 何らかのナッシュ均衡以外の理論によって、上記実験結果が説明できるようになったと仮定する。そして、その理論が全ての人に周知されたとする。この場合、その理論値より少ない値を予想したほうが勝利する確率が高まる。この様に、ナッシュ均衡点と異なるいかなる行動理論も、その理論が社会に定着する (共有知識になる) と同時に理論から離脱する個人が現れるという意味で、自己破壊的である。
- 実際の実験においても、平均値推測ゲームを繰り返しプレイする時、被験者の行動は次第にナッシュ均衡点に近づいていくことが観察されている。