ゲーム理論・入門 新版 (岡田章) 第08章 不確実な相手とのゲーム
ゲーム理論 新版 が難しすぎたので、ゲーム理論・入門 新版--人間社会の理解のために (有斐閣アルマ) から読むことにした。
この章では、プレイヤーの選好を表す利得関数や、ゲームのルールが不確実な状況におけるゲームについて説明する。
1. 基本概念
まずは基本概念を整理する。
- 情報完備ゲーム (game with complete information): プレイヤーの利得関数や戦略集合を規定するゲームのルールがゲームに参加する全てのプレイヤーの共有知識であるゲーム。
- 情報不完備ゲーム (game with incomplete information): プレイヤーが利得関数やルールについて不完全な情報しか持たないゲーム。
- 個人情報 (private information): 特定の個人しか知らない情報。例えば、Aは野球が好きで、Bはバレエが好きなど。
- タイプ (type): プレイヤーの個人情報の総称。例えば、Aは野球好きなタイプで、Bはバレエが好きなタイプなど。
- 公的情報 (common knowledge): 全プレイヤーが知っている情報。
- 非対称情報ゲーム (game with asymmetric information): 個人情報が存在するゲーム。
- 事前予想 (prior assumption): 情報不完備ゲームでプレイヤーは、相手のタイプが不確実な状況において、相手のタイプを主観的に確率を見積もって予想する。この確率分布を事前予想という。
- ハーサニー変換: 情報不完備ゲーム (game with incomplete information)と混同しがちな概念として、情報不完全ゲーム (games with imperfect information)があるが、これはプレイヤーの履歴について不完全な情報しか得られないゲーム。ハーサニーは、プレイヤーのタイプを定める偶然手番をゲームの初めに追加する事によって、情報不完備ゲームを情報完備な不完全情報ゲームに変換できることを示した。これをハーサニー変換という。
- ベイジアン・ゲーム (Bayesian game): 情報不完備ゲームのモデルはベイジアン仮説を採用するので、ベイジアンゲームという。
- ベイジアン均衡点 (Bayesian equilibrium): ベイジアンゲームにおける均衡点。ハーサニー変換により、ダイナミックなゲームでの戦略や均衡点の概念が同じ様に適用できる。
- 完全ベイジアン均衡点 (Perfect Bayesian equilibrium): ベイジアン均衡点は、ダイナミックなゲームのナッシュ均衡点と同様に、信憑性のない脅しを含むという欠点を持つため、より強い均衡概念として完全ベイジアン均衡点がある。
2. プレイヤーの信念とベイズの定理
例: 情報不完備版レディファーストのゲーム
レディファーストのゲームにおいて、女性は男性の好みを知っているが、女性の好みは女性しか知らないとする。
<バレエが好きな女性とのゲームの利得行列>
男 \ 女 | 野球 | バレエ |
---|---|---|
野球 | 2, 1 | 0, 0 |
バレエ | 0, 0 | 1, 2 |
<野球が好きな女性とのゲームの利得行列>
男 \ 女 | 野球 | バレエ |
---|---|---|
野球 | 2, 2 | 0, 0 |
バレエ | 0, 0 | 1, 1 |
<ゲームの木>
<行動戦略>
- 女性の行動戦略
- 2つの情報集合 、 でそれぞれ野球を選択する確率の組 で表される。
- : 情報集合 でバレエが好きな女性 (タイプ ) が野球を選択する確率 ( )
- : 情報集合 で野球が好きな女性 (タイプ ) が野球を選択する確率 ( )
- 例えば は、バレエ好きな女性がバレエを選び、野球好きな女性が野球を選ぶ行動戦略を表す。
- 男性の行動戦略
- 2つの情報集合 、 でそれぞれ野球を選択する確率の組 で表される。
- : 女性が野球を選択したことを知った上で、情報集合 で男性が野球を選択する確率 ( )
- : 女性がバレエを選択したことを知った上で、情報集合 で男性が野球を選択する確率 ( )
- 例えば は、女性が野球を選択したことを知った上で野球を選び、女性がバレエを選択したことを知った上でバレエを選ぶ行動戦略を表す。
整合的な信念
- 男性は女性のタイプを知らないが、女性の選択を知った上で、女性のタイプを予想することができる。女性のタイプを予想することは、言い換えると各情報集合の中で、どの手番にいるかを予想することである。
- この様に、女性の選択を知った上で修正される男性の予想を事後予想、もしくは単に予想、信念 (belief) などと言う。
- 男性の事後予想は、事前予想と女性の行動戦略から定まる。例えば、行動戦略 が取られるとしよう。このとき女性がバレエを選択したことを知れば、合理的な男性であれば、女性はバレエ好きと予想できる。この様な、女性の行動戦略と矛盾しない男性の事後予想を、 と整合的であるという。
- 一般に、女性の行動戦略 に対して、 と整合的な男性の信念 (事後予想) とは、ベイズの公式で定義される条件付き確率 である。
- : 女性がタイプ であって、情報集合 に手が進む確率
- : 情報集合 に手が進む確率
女性が行動戦略 b1 = (0, 1) を選択する場合の整合的な信念
- 女性の行動戦略 は、バレエ好きな女性がバレエを選択し、野球好きな女性が野球を選択することを意味している。
- 男性の事前予想は である。
- 情報集合 に手が進む確率は、女性が野球好きである事前予想確率と等しく である。女性がバレエ好き (タイプ ) で野球を選択する確率は であり、女性が野球好き (タイプ ) で野球を選択する確率は である。
- 従って、男性の情報集合 に手が進むときに、女性のタイプが である条件付き確率 (整合的な信念) は、 ( の場合 ) or ( の場合 ) である。
- 同様に、男性の情報集合 に手が進むときに、女性のタイプが である条件付き確率 (整合的な信念) は、 ( の場合 ) or ( の場合 ) である。
- 男性の事前予想が女性の行動を踏まえて更新されることが分かる。
女性が一般の行動戦略 b1 = (b11, b12) を選択する場合の整合的な信念
- 、 とする。
- 男性の事前予想は である。
- この場合、情報集合 に手が進む確率は、女性が野球を選択する確率と等しいから、 である。
- 女性がタイプ で野球を選択する確率は であり、
- 女性がタイプ で野球を選択する確率は である。
- 従って、男性の情報集合 に手が進むときに女性のタイプが である条件付き確率 (整合的な信念) は、 ( の場合) or ( の場合) である。
- 同様に、男性の情報集合 に手が進むときに女性のタイプが である条件付き確率 (整合的な信念) は、 ( の場合) or ( の場合) である。
- 男性の事前予想が女性の行動を踏まえて更新されることが分かる。
両方のタイプの女性が野球を選択する場合の整合的な信念
- これは ということ。
- 男性の事前予想は である。
- どんなときでも野球を選択するので、必ず情報集合 に到達し、 となる。
- そして、 で、 である。
- 従って、男性の情報集合 に手が進むときに女性のタイプが である条件付き確率 (整合的な信念) は、 ( の場合) or ( の場合)
- そして、情報集合 に手が進む確率 は であり、分母が0になるため、ベイズの公式は使えない。この場合は、どんな信念も整合的と考える。
- この場合は、女性の行動は何の情報も男性に与えず、男性の事前予想は更新されないことが分かる。
まとめ
以上をまとめると、プレイヤの行動戦略の組に対して、行動戦略と整合的なプレイヤーの信念は、次の性質を持つ。
性質8.1
情報集合が戦略によって到達可能なときは、予想はベイズの公式による条件付き確率と等しい。
性質8.2
情報集合が戦略によって到達可能でないときは、どんな予想も整合的とする。
3. 完全ベイジアン均衡点
展開形ゲームにおける部分ゲーム完全均衡点を、ベイジアンゲームや一般の不完全情報を持つ展開形ゲームに拡張した均衡概念が、完全ベイジアン均衡点である。
定義8.1
プレイヤーの行動戦略と信念の組が完全ベイジアン均衡点であるとは、全ての情報集合において次の2つの条件が成り立つことである。
(1) プレイヤーの信念は行動戦略と整合的である。
(2) プレイヤーの行動戦略は信念のもとで、他のプレイヤーの行動戦略に対して最適応答である。
以下で、完全ベイジアン均衡点と完全ではないベイジアン均衡点の例を確認する。
引き続き「情報不完備版レディファーストのゲーム」で説明する。
完全ベイジアン均衡点の例
- 男性の情報集合 における最適戦略は、女性のタイプに関する信念に関わらず野球を選択することである。
- 男性の情報集合 における最適戦略は、女性のタイプに関する信念に関わらずバレエを選択することである。
- これを所与として女性の最適戦略を考えると、女性は自分の好みに応じて選択することが最適戦略であることが分かる。
- まとめると、女性は自分の好みに応じて野球かバレエを選択する。男性は女性と同じ選択をする。男性の信念は、女性がバレエを選択するときは女性はバレエ好きなタイプであると予想し、女性が野球を選択するときは女性は野球好きなタイプであると予想することである。
- 行動戦略
- 行動戦略
- 男性の信念は、下記の通りであり、これは女性の均衡戦略と整合的である。
- ( の場合) or ( の場合)
- ( の場合) or ( の場合)
- この様に、行動からタイプを完全に判定できる場合の均衡点を、分離均衡 (separating equilibrium) という。
完全ではないベイジアン均衡点の例
- 男性の戦略として、女性の選択とは無関係に常に野球を選択するものを考える。(こんな非合理な仮定を置けるなら何でもアリにならない? → 仮定を置いていると言うよりも全ての戦略に関して検討した場合、当然こういう戦略も出てくるという話)
- この時、女性の最適戦略は、自身の好みに関わらず、野球を選択することである。(意思決定の順番が逆になってるよね?女性が決めてから男が決めるというルールでは? → 意思決定の順番は変わってない。後向き帰納法で検証しているだけ)
- また、女性の行動戦略に対して、男性の行動戦略は最適応答であることが分かる。
- まとめると、次の様なベイジアン均衡点が得られる。
- 女性は自分の好みに関わらず野球を選択する。男性は女性の選択が何であっても野球を選択する。男性の信念は、女性が野球を選択するときは事前予想と同じであり、女性がバレエを選択するときはどんなものでもよい。
- 情報集合 における男性の行動はいかなる信念のもとでも男性の最適戦略ではない (信憑性のない脅し) から、完全ベイジアン均衡点ではない。
- この様に、行動からタイプを判定できない場合の均衡点を、一括均衡 (pooling equilibrium) という。
4. 逆選択とシグナリング
情報の非対称性による問題
情報の非対称性を放置しておくと、全体の利得が低下する。
例1: 中古車市場で、中古車の品質が不明だと、多くの人は安い価格でしか買わなくなり、そうすると高品質な車を中古車市場に売る人はいなくなり、ますます中古車市場に出回る車の品質は下がる。
例2: 保険の加入者には事故率の高い人と低い人がいるが、事故率の低い人は、事故率の高い人と同じ保険料を払う必要があり、不公平な状況にある。そのため、事故率の低い人の加入率は下がり、加入者に占める事故率の高い人の割合が増える。そうすると、保険料は上がり、ますます、事故率の高い人の割合が上がっていく。
この様に本来高品質の財が取引されるはずの市場で、逆に低品質の財が取引される現象を逆選択という。
逆選択を防ぐ有効な手段が、情報の保有者によるシグナリングだ。シグナリングとは、相手にシグナルを送って自分のタイプを知らせる行為をいう。
シグナリング・ゲーム
ベイジアンゲームを用いて、労働市場のシグナリングの分析を説明する。
ルール説明
- ピザ店の経営者が労働者を1人雇用する。
- 経営者の利得
- 高い能力を持つ労働者 (タイプH) を採用すれば +1
- 低い能力を持つ労働者 (タイプL) を採用すれば -1
- 労働者を採用しないとき ±0
- 経営者は労働者の能力を確実に知ることはできないが、これまでの採用実績からタイプ H とタイプ L の割合は 1 : 2 と推定している (事前予想)。
- 経営者の期待利得は であるから、経営者の最適行動は採用しないことである。その結果、能力の低い個人だけでなく、能力の高い個人も採用されないことになってしまい、社会にとって望ましくない。この時、資格を取得するなどのシグナルが有効に機能するかどうかを調べてみよう。
- 個人の利得
- タイプ H が資格を取得するコスト -2
- タイプ L が資格を取得するコスト -5
- 採用された場合 +3
- 採用されなかった場合 ±0
- ゲームの木
- 左の数字が個人の利得で、右の数字が経営者の利得。
- この様に最初に個人がシグナルを出すかどうかを選択するゲームを、シグナリング・ゲームという。
完全ベイジアン均衡点
- タイプ L の最適行動は資格を取得しないことである。
- タイプ L の個人が資格を取得すれば、利得はマイナス。
- 資格を取得しなければ 0 または プラスの利得が得られる。
- タイプ H が資格を取得する場合、次の行動戦略と信念の組は分離均衡の完全ベイジアン均衡点である。
- 個人の行動戦略: タイプ H は資格を取得し、タイプ L は資格を取得しない。
- 経営者の行動戦略: 資格取得した個人は採用し、資格取得していない個人は採用しない。
- 経営者の信念: 個人が資格を取得するならばタイプ H と予想し、資格を取得しないならばタイプ L と予想する。
- タイプ H の個人が資格を取得しない場合、次の行動戦略と信念の組は一括均衡の完全ベイジアン均衡点である。
- 個人の行動戦略: どのタイプの個人も資格を取得しない。
- 経営者の行動戦略: 経営者は個人が資格を取得したかどうかに関わらず雇用しない。
- 左側の情報集合では信念は事前予想と同じ。よって経営者の最適行動は個人を採用しないことである。
- 右側の情報集合では採用するときの経営者の期待利得は であるから、 ならば経営者の最適行動は個人を採用しないこと、 ならば経営者の最適行動は個人を採用することである。
- 経営者の信念: 個人が資格を取得しないならば事前予想と同じであり、個人が資格を取得するならば、個人が高い能力を持つ確率 p を と予想する。
分離均衡ではシグナルは有効であり、シグナルが有効であるためのキーポイントは、個人の能力によってシグナルのコストが異なることである。一括均衡ではシグナルが有効ではなく、非効率な結果となってしまう。
5. モラル・ハザード
モラル・ハザードとは
- これまでは相手のタイプがわからない不完備情報ゲームを扱ってきた。この節では相手の行動が分からない不完全情報ゲームを扱う。
- 相手の行動が分かれば選択できた最適な行動が取れず、自分だけでなく社会的にも非効率な結果が生じてしまうことをモラル・ハザードという。
- もともとの意味は、保険に加入した人が、保険に加入したがゆえに不注意になり、それを考慮した保険会社が高い保険料を付け、保険に加入する人が少なくなってしまい、保険制度が十分に機能しなくなること。
プリンシパル=エージェント問題
概要
- 労働者にできるだけ仕事をさせたい経営者と、同じ賃金ならできるだけ努力せずに済ませたい労働者がいる。労働者の努力の度合いは経営者からは見えず、努力に応じて賃金を支払うことができないため、労働者の努力水準は低くなり業績は悪化し、経営者と労働者の双方にとって望ましくない状況になる。これがモラル・ハザードの一例として知られるプリンシパル=エージェント問題。
- 努力を見える化して、賃金を適正化すればこの状況は解決されそう。
ルール説明
- 経営者 P はあるプロジェクトを実行するかどうかの選択に直面している。
- プロジェクトが成功すれば 600万円 の利益が見込まれる。
- プロジェクトが失敗すれば利益は 0 である。
- プロジェクトの成功は、労働者 A の努力水準に依存している。
- 努力水準が高い (H) 場合は、確率 0.8 で成功するが確率 0.2 で失敗する。
- 努力水準が低い (L) 場合は、確率 1.0 で失敗する。
- 労働者 A にとって高い努力水準のコストは 100万円 であり、低い努力水準のコストは 20万円 である。
- 労働者の努力水準は経営者にとって観察可能ではないとする。
- 経営者と労働者は共にリスク中立的である。
固定賃金契約を提示する場合
- ゲームの木
- 左が経営者の利得で右が労働者の利得。
- プロジェクトが成功するか失敗するかに依らず、努力水準 H の場合の労働者の利得は だが、努力水準 L の場合の労働者の利得は なので、労働者の最適行動は、L を選択すること。
- これを前提に経営者が利得を最大化すると となり、労働者は契約を受け入れず、プロジェクトは実行されず、両者の利得は 。
- もしプロジェクトを実行して労働者が高い努力水準を選択した場合、期待利得は で、労働者のコストは 100 なので、380 の総利得が生み出される。
- この様に、プロジェクトの結果に関係のない固定賃金契約では労働者に高い努力水準を選択するインセンティブが与えられず、社会的に非効率な結果となってしまう。
ボーナス賃金契約を提示する場合
- ゲームの木
- ボーナス賃金契約はプリンシパル=エージェント問題を解決し、社会的効率を高めていることが確認できた。
- 現実の世界では、経営者が複数のプロジェクトにリスクを分散できるのに対して、労働者はリスクを分散できないので、労働者の方がリスク回避的であることが多く、ボーナスの比率を下げたほうが良い場合があることには留意が必要。
6. オークションの収入同値定理
オークションは、自分の評価額は知っているが他の参加者の評価額は知らないという情報不完備ゲームである。
ルール説明
- 入札者1と入札者2がいる。
- 各プレイヤーの商品の評価額は とする。() ( は の独立な確率変数で、一様分布に従う。)
- 入札者は自分の評価額は知っているが、他の入札者の評価額を知らない。
- 入札者 の戦略 は、評価額のそれぞれの値 に対して、入札額 を定めるものであり区間 ] の関数である。
ベイジアン均衡点を求める
第 1 価格入札ルール
- 簡単の為に全ての入札者が同じ戦略 ( )を採用する均衡点を考える。この様な均衡点を対称均衡点という。
- 入札者 2 が戦略 を採用する時の、入札者 1 最適な入札価格を計算する。
- よって、参加者が 2 名のとき、「評価額が のとき、入札者 は の価格を入札する」戦略の組は、第 1 価格ルールの元でベイジアン均衡点であることが分かる。
- また、対称ベイジアン均衡点はこれ以外にないことが知られている。
第 2 価格入札ルール
第 2 価格入札ルールの元では、全ての入札者にとって評価額と等しい価格で入札することが弱支配戦略であることは、こちらで説明した。よって「全ての入札者 が自分の評価額 を入札する」戦略の組がベイジアン均衡点である。
主催者の期待収入を求める
- 主催者の期待収入は 2 人の入札者の期待支払金額の合計である。
- どの価格ルールの元でも、評価額 を持つ入札者 1 がオークションに勝つ確率は である。
- 入札者 1 がオークションに勝つ確率は、入札者 2 の評価額が x 以下である確率であり、
- 入札者 2 の評価額は、区間 ] 上に一様に分布するから。
第 1 価格入札ルール
- 入札者 1 の評価額が の時に、入札者 1 が支払う期待金額は である。
- 入札者 1 が主催者に支払う金額の期待値は である。
- 対称均衡点では全ての入札者の支払う期待金額は等しいから、オークションの主催者の期待収入は 万円 である。
第 2 価格入札ルール
- 評価額 を持つ入札者 1 がオークションに勝つのは、相手の評価額 が 以下の場合であり、商品の価格は第 2 価格 である。従って評価額 を持つ入札者 1 の期待支払金額は である。
- 以降の計算は第 1 価格入札ルールと同じで、オークションの主催者の期待収入は 万円 となる。
この様に第 1 価格入札ルールの元でも、第 2 価格入札ルールの元でも、主催者が受け取る期待収入は同じになる。これは、入札者の数や入札者の評価額の確率分布に関わらず、一般的に成り立つことが知られている。
定理8.1 オークションの収入同値定理
入札者がリスク中立的であり、入札者の評価額が独立な同一分布に従う時、売り手の第 1 価格封印入札での期待収入と第 2 価格封印入札での期待収入は等しい。