読書メモ

個人的な読書メモ。それ以上でも以下でもありません。

ゲーム理論 新版 (岡田章) 第2章 戦略形ゲーム ( 1 〜 2 )

ゲーム理論 新版

ゲーム理論 新版

1. 戦略形ゲームの定義

  • 戦略形ゲーム (game in strategic form) とは、「プレーヤーの戦略と利得との関係によって定義されるゲーム」のことを言う。標準形ゲーム (game in normal form) とも言う。
  • 戦略形n人ゲームは、次の要素の組によって定義される。
    •  G = \bigl( N, \{ S_i \} _{i \in N}, \{ f_i \} _{i \in N} \bigr)
      •  N = \{1, 2, \cdots, n\} はプレイヤーの集合
      •  S_i はプレイヤー  i の選択可能な行動あるいは戦略の集合
      •  f_i は直積集合  S = S_1 \times S_2 \times \cdots \times S_n 上の実数値関数であり、プレイヤー  i の利得関数を表す。
  • ゼロ和ゲーム (zero-sum game) は、全ての戦略に対する効用の和がゼロであるゲーム。
  • 定和ゲーム (constant-sum game) は、全ての戦略に対する効用の和が定数であるゲーム。ゼロ和ゲームは定和ゲームの特殊例であり、本質的な違いはない。
  • 利得行列 (payoff matrix) の読み方。
  • 市場シェア、囚人のジレンマ、男女の争い (ボクシング / バレエ) の例。

2. ナッシュ均衡点 (Nash equilibrium point)

  • 非協力ゲームの理論における最も重要な問題は、ゲームにおいて個々のプレイヤーが十分に理性的で合理的であるならば、相手プレイヤーの戦略をどのように予測し、どのような戦略を選択するかということである。この問題を分析するために多くの解概念が存在するが、その一つがナッシュ均衡点である。
  • 最適応答 (best response)
    • 定義2.1. プレイヤー  i の戦略  s_i \in S_i が、他の  n - 1 人のプレイヤーの戦略の組  s_{-i} = (s_1, \cdots, s_{i-1}, s_{i+1}, \cdots, s_n) に対する最適応答であるとは、
       f_i(s_i, s_{-i}) = \max_{t_i \in S_i} f_i(t_i, s_{-i})
      であるときをいう。
  • ナッシュ均衡点 (Nash equilibrium point)
    • 戦略形  n 人ゲームにおいて、プレイヤーの戦略の組  S^*ナッシュ均衡点であるとは、全てのプレイヤー  i\ (= 1, \cdots, n) に対して戦略  s_i^* が他のプレイヤーの戦略の組  s_{-i}^* に対する最適応答であるときをいう。
    • 定義2.2. 戦略の組  s^* = (s_1^*, \cdots, s_n^*) が均衡点であるとは、すべてのプレイヤー  i\ (=1, \cdots, n) に対して、
       f_i(s^*) \geq f_i(s_i, s_{-i}^*), \forall s_i \in S_i
      が成立することである。
    • 定理2.1. ゼロ和2人ゲームにおいて戦略の組  s^* = (s_1^*, s_2^*) が均衡点であるための必要十分条件は、全ての  s_1 \in S_1 と全ての  s_2 \in S_2 に対して、
       f(s_1, s_2^*) \leq f(s_1^*, s_2^*) \leq f(s_1^*, s_2)
      が成立することである。但し、 f(s_1, s_2) はプレイヤー1 (最大化プレイヤー) の利得関数を表す。
  • 支配戦略 (dominant strategy)
    • 自分以外のプレイヤーが何を選んでも、自分の他の戦略よりも良い戦略を支配戦略という。
    • 定義2.3. プレイヤー  i の2つの戦略  s_i t_i に対して、戦略  s_i t_i を支配する (dominate) とは、他の  n - 1 人のプレイヤーが持つ全て戦略の組  s_{-i} \in S_1 \times \cdots \times S_{i-1} \times S_{i+1} \times \cdots \times S_n に対して、
       f_i(s_i, s_{-i}) > f_i(t_i, s_{-i})
      が成立することである。
    • また、戦略  s_i t_i を弱く支配するとは、すべての戦略の組  s_{-i} に対して上の条件が弱い不等式  \geq で成立し、さらに少なくとも1つの戦略の組  t_{-i} に対しては強い不等号  > が成立することをいう。
  • パレート最適 (Pareto optimal)
    • ある集団が、1つの社会状態 (資源配分) を選択するとき、集団内の誰かの効用を犠牲にしなければ他の誰かの効用を高めることができない状態パレート最適という。 (wikipedia)
    • 誰も不利益を被ることなく、全体の利益が最大化された状態 (それ以上利益を出すためには誰かを犠牲にしなければいけない状態) をパレート最適という。(ferret)
    • 定義2.4. 戦略形n人ゲーム  G = (N, \{ S_i \} _{i \in N}, \{ f_i \} _{i \in N}) において、戦略の組 s = (s_1, \cdots, s_n) が (戦略集合  S = S_1 \times \cdots \times S_n に関して) パレート最適であるとは、全てのプレイヤー  i\ (= 1, \cdots, n) に対して、
       f_i\ (t_1, \cdots, t_n) > f_i\ (s_1, \cdots, s_n)
      となる戦略の組  (t_1, \cdots, t_n) \in S が存在しないことである。