読書メモ

個人的な読書メモ。それ以上でも以下でもありません。

ゲーム理論・入門 新版 (岡田章) 第11章 進化ゲーム

ゲーム理論 新版 が難しすぎたので、ゲーム理論・入門 新版--人間社会の理解のために (有斐閣アルマ) から読むことにした。

ゲーム理論・入門 新版--人間社会の理解のために (有斐閣アルマ)

ゲーム理論・入門 新版--人間社会の理解のために (有斐閣アルマ)

  • 作者:岡田 章
  • 出版社/メーカー: 有斐閣
  • 発売日: 2014/09/18
  • メディア: 単行本(ソフトカバー)

この章では、進化ゲームの歴史的な背景と基礎概念を整理した上で、進化ゲームにおける均衡概念である「進化的に安定な戦略」について説明する。

基礎概念の整理

ゲーム的状況を進化論的な概念を使って分析することによって、伝統的な非協力ゲーム/協力ゲームとは違った形で、ゲームの均衡状態 (進化的に安定な戦略) とダイナミクスを分析する理論を進化ゲーム理論という。

  • 多数の個体がランダムに相互作用を繰り返す集団において、適応度の高い個体の数が増加し、適応度の低い個体の数が減少する。こうした考え方を自然選択自然淘汰と呼ぶ。
  • 自然選択を通じて、個体の分布について、ある一定のパターンが生まれることがある。これを定常状態と呼ぶ。
  • 集団内において異なるタイプの個体が発生したり外部から侵入したりすることを突然変異 (mutant) と呼ぶ。
  • 突然変異種が集団に侵入しても、突然変異種が増殖せずに、元の定常状態が維持される時、その状態は進化的に安定 (evolutionarily stable) であるという。
  • ゲーム的状況にこういった進化論の概念を適用する際は、個体=プレイヤーと見做し、また個体と戦略は同義となる。2つの戦略が対戦する時に定まるプレイヤーの利得は、プレイヤー=戦略の適応度を表すことになる。
  • また、伝統的なゲーム理論における均衡概念は進化的に安定な戦略 (evolutionarily stable strategy, ESS) として分析される。
  • また、人間や人間の集団が時々おかす間違いや実験的行動は、突然変異として解釈される。
  • プレイヤーの合理性を前提とする必要がない点が、伝統的なゲーム理論と進化ゲーム理論との間の大きな違いの一つである。

進化的に安定な戦略 (ESS) と均衡点の関係

これまでに見てきたゲームを進化ゲームの観点から分析し、ESSとナッシュ均衡点との関係を見る。

囚人のジレンマ

状況説明

  • C D
    C 2, 2 -1, 3
    D 3, -1 0, 0
  • 協力するタイプ (C) の個人と裏切るタイプ (D) の個人が無数に存在する集団を考える。
  • 集団内のCタイプの比率を  x ( 0 \lt x \lt 1) とし、Dタイプの比率を  (1 - x) とする。
  • 各個人がランダムに出会って、ゲームをプレイする。

期待利得 (適応度) の計算

  • Cの期待利得:  2 \times x+ (-1) \times (1 - x) = 3x - 1
  • Dの期待利得:  3 \times x+ (0) \times (1 - x) = 3x

ESSと均衡点

  • Dタイプの期待利得 (適応度) は常にCタイプよりも大きい。つまり、集団の初期状態に関わらず、Dタイプが増えていき、長期的にはDタイプしか存在しない定常状態に収束する。Cタイプがいくら集団に侵入しようとも、最終的にはDタイプしか存在しない定常状態 (ESS) に戻る。
  • 支配戦略から成るナッシュ均衡点は進化的に安定である。

技術標準の選択問題

状況説明

  • WindowsユーザーとMacユーザーから成る集団があるとする。
  • 個人間でコミュニケーションし、お互いにWindowsを使っている場合は利得2を得、お互いにMacを使っている場合は利得4を得、別のOSを使っている場合は利得を得ることができないとする。

  • Windows Mac
    Windows 2, 2 0, 0
    Mac 0, 0 4, 4
  • Windowsを使っている個人の比率を  x とし、Macを使っている個人の比率を  (1 - x) とする。

期待利得 (適応度) の計算

  • Windowsユーザーの期待利得:  2x
  • Macユーザーの期待利得:  4 (1 - x) = 4 - 4x

ESSと均衡点

  •  x \gt \frac{2}{3} の場合は、Windowsユーザーの利得の方がMacユーザーよりも大きいので、徐々にWindowsユーザーの数が増え、最終的にはWindowsユーザーしかいない世界になる。
  •  x \lt \frac{2}{3} の場合は、Macユーザーの利得の方がWindowsユーザーよりも大きいので、徐々にMacユーザーの数が増え、最終的にはMacユーザーしかいない世界になる。
  • この様に、進化の安定状態が初期状態に依存する現象を、進化の歴史経路依存性と呼ぶ。
  •  x = \frac{2}{3} の場合も、定常状態のように見えるが、少しでもWindowsユーザー / Macユーザーが侵入すると、その定常状態は崩れてしまうので、ESSであるとは言えない。
  • 純戦略のナッシュ均衡点は進化的に安定であるが、混合戦略のナッシュ均衡点は進化的に安定ではない。

タカ-ハト ゲーム

状況説明

  • ハト タカ
    ハト 2, 2 1, 3
    タカ 3, 1 0, 0
  • 集団内におけるハトの割合を  x、タカの割合を  1- x とおく。

期待利得 (適応度) の計算

  • ハトの期待利得 (適応度):  2 \times x + 1 \times (1 - x) = x + 1
  • タカの期待利得 (適応度):  3 \times x + 0 \times (1 - x) = 3x

ESSと均衡点

  •  x \gt \frac{1}{2} の場合 (ハトの方が多い場合)、タカの期待利得 (適応度) の方が大きいため、ハトの比率 (  x ) は減少する。
  •  x \lt \frac{1}{2} の場合 (ハトの方が少ない場合)、ハトの期待利得 (適応度) の方が大きいため、ハトの比率 (  x ) は増加する。
  • つまり、 x = \frac{1}{2} は進化的に安定である。
  • この様に、異なるタイプの個体が共存する集団は多型集団と呼ばれる。これに対して、単一のタイプから成る集団は単型集団と呼ばれる。

男女の争い

これまでは、一つの集団内での行動の進化を考えてきた。ここでは、複数の集団の間で相互作用が繰り返されることによって、各集団内で起こる進化 (共進化) について見ていく。

状況説明

  • 野球 バレエ
    野球 2, 1 0, 0
    バレエ 0, 0 1, 2
  • 男性の集団と女性の集団があるとする。
  • 繰り返し、各集団からランダムに選ばれた男女のペアがゲームを行う。
  • 男性集団の中で野球を選択するタイプの比率を  x とし、バレエを選択するタイプの比率を  1 - x とする。
  • 女性集団の中で野球を選択するタイプの比率を  y とし、バレエを選択するタイプの比率を  1 - y とする。

期待利得 (適応度) の計算

期待利得と均衡点の計算方法はこちらを参照。

ESSと均衡点

  • 男性集団の  x の値は女性集団の  y の値で決まり、女性集団の  y の値は男性集団の  x の値で決まる。
  • 女性集団において  y \geq \frac{1}{3} であるとき、男性の最適応答は野球であるから、男性集団における  x は増加する。
  • 女性集団において  y \leq \frac{1}{3} であるとき、男性の最適応答はバレエであるから、男性集団における  x は減少する。
  • 男性集団において  x \geq \frac{2}{3} であるとき、女性の最適応答は野球であるから、女性集団における  y は増加する。
  • 男性集団において  x \leq \frac{2}{3} であるとき、女性の最適応答はバレエであるから、女性集団における  y は減少する。
  • 純戦略による均衡 (野球, 野球) と (バレエ, バレエ) は進化的に安定である。
  • 混合戦略による均衡  ( ( \frac{2}{3}, \frac{1}{3} ), ( \frac{1}{3}, \frac{2}{3} ) ) は、突然変異に弱いので進化的に安定とは言えない。

ESSの条件

ある戦略がESSであると言えるためには、どのような条件が成り立っている必要があるかを考える。

  1. 集団の全員がある戦略  s^* をとっている定常状態があるとする。
  2. この集団に、僅かな比率  \epsilon \gt 0 で戦略  t をとる突然変異種が侵入してきたとする。
  3. つまり、 (1 - \epsilon) s^* をとり、 \epsilon t をとる状態。これを便宜的に  (1 - \epsilon) s^* + \epsilon t と表記する。
  4. 戦略  s^* の集団  (1 - \epsilon) s^* + \epsilon t における適応度を  u (s^*, (1 - \epsilon) s^* + \epsilon t) とし、
    戦略  t の集団  (1 - \epsilon) s^* + \epsilon t における適応度を  u (t, (1 - \epsilon) s^* + \epsilon t) とする。
  5. このとき戦略  s^* の方が、突然変異  t よりも適応的である条件は、
     u (s^*, (1 - \epsilon) s^* + \epsilon t) \gt u (t, (1 - \epsilon) s^* + \epsilon t)
    である。
    全ての突然変異  t と、全ての微小な割合  \epsilon \gt 0 に対して、この条件が成り立つなら、戦略  s^* はESSであると言える。
  6.  u (s^*, (1 - \epsilon) s^* + \epsilon t) = (1 - \epsilon) u (s^*, s^*) + \epsilon u (s^*, t)
    ∵ 戦略  s^* 1 - \epsilon の確率で  s^* と対戦し、 \epsilon の確率で  t と対戦するから。
  7.  u (t, (1 - \epsilon) s^* + \epsilon t) = (1 - \epsilon) u (t, s^*) + \epsilon u (t, t)
    ∵ 突然変異  t 1 - \epsilon の確率で  s^* と対戦し、 \epsilon の確率で  t と対戦するから。
  8. 戦略  s^* がESSであると言えるためには、どんな小さな比率  \epsilon \gt 0 に対しても、
     (1 - \epsilon) u (s^*, s^*) + \epsilon u (s^*, t) \gt (1 - \epsilon) u (t, s^*) + \epsilon u (t, t)
    が成り立つことが必要である。
  9. ここで  u (s^*, s^*) \geq u (t, s^*) が成り立つ。
     u (s^*, s^*) \lt u (t, s^*) だとしたら、 \epsilon を極小化した時に矛盾が生じるから。
  10. よって、ESS  s^* の組は、ゲームのナッシュ均衡点である。

上記ESSの条件を利用して タカ-ハト ゲーム のナッシュ均衡点の混合戦略  s^* = (\frac{1}{2}, \frac{1}{2}) がESSであるかどうかを確認する。

  1. 突然変異として、任意の混合戦略  t = (p, 1 - p) (  p \neq \frac{1}{2} ) を考える。
  2. ここで、
     u (s^*, s^*) = \frac{1}{2} \times (\frac{1}{2} \times 2 + \frac{1}{2} \times 1) + \frac{1}{2} \times (\frac{1}{2} \times 3 + \frac{1}{2} \times 0) = \frac{3}{2}
     u (t, s^*) = p \times (\frac{1}{2} \times 2 + \frac{1}{2} \times 1) + (1 - p) \times (\frac{1}{2} \times 3 + \frac{1}{2} \times 0) = \frac{3}{2}
    なので、 s^* がESSであるためには、
     u (s^*, t) \gt u (t, t)
    でなければならない。
  3.  u (s^*, t) = 2p + \frac{1}{2}
     u (t, t) = 4p - 2p^2
     u (s^*, t) - u (t, t) = 2 (p - \frac{1}{2})^2 \gt 0
  4. 故に、混合戦略  s^* はESSである。

協力の進化

協力の進化に関しては、本書の中ではアクセルロッドの実験についてさらっと触れられている程度なので割愛する。詳しくは下記を参照。

mas178.hatenablog.com