読書メモ

個人的な読書メモ。それ以上でも以下でもありません。

社会集団における協力形成問題へ向けて:数理モデル,計算機シミュレーションによるアプローチ (秋山 英三 2017)

社会集団における協力形成問題へ向けて:数理モデル,計算機シミュレーションによるアプローチ (秋山 英三 2017)

協力行動の促進・維持のメカニズムを、ゲーム理論と計算機シミュレーションで解明しようとする研究のサーベイ論文。

Ⅰ. はじめに

社会的ジレンマ状況において、どのように協力行動が形成されるのか?」という問題を解くための、いくつかの有効な方策が近年示唆されている。代表的な下記4つの方策をレビューする。

  1. 直接互恵: 協力してくれた人への協力
  2. 間接互恵: 評判の高い人への協力
  3. マルチレベル淘汰: 集団内のサブグループ形成による協力行動の誘発
  4. ネットワーク互恵: 近所付き合いによる協力クラスタの形成・拡大

Ⅱ. 社会的ジレンマと囚人ジレンマ

  • 社会的ジレンマ」は、個々の利益と集団の利益との間のジレンマから発生する問題一般を指す。「(n人) 囚人のジレンマ」はそれらの問題の核となる数理構造を明確にしたもの。

Ⅲ. 協力的社会の構築:古典ゲーム論によるアプローチ

  • 囚人のジレンマを繰り返し行う時、ゲームが次回以降も続く確率 (割引因子) が 1.0 に十分に近く、「引き金戦略 (最初協力するが、裏切りに対しては永遠に裏切りで報復する)」を双方が採用する場合、相互協力が均衡解となる。これはフォーク定理によって説明することができる。
  • しかし、フォーク定理による説明には二つの問題点がある。
    1. 引き金戦略による相互協力の均衡解以外にも、無数に均衡解が存在すること。つまり、フォーク定理では、どんな戦略と結果でも説明できてしまう。
    2. フォーク定理が前提とするような、無限の推論能力を持ったプレイヤーは現実には存在しないということ。

Ⅳ. 協力的社会の構築:進化ゲーム理論とシミュレーション

1. 社会集団内での繰り返し相互作用と「オウム返し戦略」

  • 無限の推論能力を持つプレイヤーを仮定せず、過去の経験 (と幾分の推論能力) により選択を行うプライヤーを前提として、ジレンマを解決するメカニズムを考察するには、「進化ゲーム理論」と「計算機シミュレーション」による分析が有効となる。
  • Axelrodは、直接互恵的なモデル (オウム返し戦略) から協力関係が生じることを示した。
  • 実際に、第一次世界大戦西部戦線では、両軍の兵士の間で互恵的利他行動が芽生えた。

2. オウム返し戦略の弱点

  • 現実の人間は、時々間違って裏切ってしまったり、間違って協力してしまったりする。こういった「ミス」を取り込んだモデルとして「寛大なオウム返し戦略 (Nowak & Sigmund, 1992)」や「勝ったら同じ行動、負けたら違う行動戦略 (win-stay lose-shift) (Nowak & Sigmund, 1993)」の有効性が確認されている。
  • 現実のゲームは2人ではなく、複数人で行われる。複数性を取り込んだモデルを「n人囚人ジレンマゲーム」という。プレイヤーが複数になると、2人の場合と異なり、プレイヤー間に匿名性が生まれる。Boyd & Richerson (1988) は、オウム返し系の戦略が進化的安定戦略となるための条件が、人数の増加とともに厳しくなるということを示している。n人囚人ジレンマゲームの完全な解決法は未だに見つかっていない。

Ⅴ. 協調形成に関する研究:近年の発展

  • Nowak (2006) のサーベイ論文では、ジレンマ状況における協力進化を促進・維持する可能性がある5つのメカニズムとして、血縁淘汰、直接互恵、間接互恵、ネットワーク互恵、マルチレベル互恵 (グループ淘汰) を挙げている。どの研究でも計算機シミュレーションが重要な役割を果たす。

1. 直接互恵と間接互恵

  • 直接互恵による協力行動の促進と維持においてポイントとなるのは、繰り返し相互作用を通じた「複数プレーヤーの協力行動のクラスタリング」である。つまり、オウム返し戦略を通じて、協力者は協力者同士でグループを作り、裏切り者は裏切り者同士でグループを作る。
  • 間接互恵は、チャリティ活動などの様に、直接互恵的な関係を築くのではなく、見知らぬ第三者に対する協力行動を可能にするメカニズムである。ここでは「評判」が重要となる。Nowak & Sigmund (1998, 2005) で、シミュレーションと進化ゲーム的分析により「評判情報 (image score)」が持つ効果を数理的に示した。
  • 直接互恵と同様に、間接互恵も、相互作用の人数nの増加とともに、協力行動の進化は困難となる。
  • 間接互恵による協力行動の促進と維持においてポイントとなるのは、評判の更新と参照を通じた「複数主体の協力行動のクラスタリング」である。つまり、評判という情報を通じて、協力行動は他者の協力行動を誘引する。協力行動のクラスタリングは協力者の利益を高め、協力行動の進化を促す。

2. マルチレベル淘汰

  • 直接互恵/間接互恵では、個人と全体という二階層だけで、協力行動を考えていた。個人-群れ-全体 の様な階層構造で協力行動を推進するメカニズムのことを「マルチレベル淘汰」という。
  • このメカニズムの背後には、シンプソンのパラドックス (部分集団の全てで成立する仮説が、母集団で成立するとは限らない) と呼ばれる数理構造がある。

n人2グループ囚人ジレンマゲーム

ある社会集団に、それぞれ 100 人からなるグループAとグループBがあるとする。各グループ内でメンバーが 100 人囚人ジレンマゲームをプレイする。各人は協力行動か裏切り行動のどちらかを選択するとする。協力者が n 人の場合、協力者の利得は n-1、裏切り者の利得は n となる。

協力者 裏切り者 1人当り平均利得
グループA:
協力者が少ない
1人 x 0点 99人 × 1点 0.99点/人
= (1人 x 0点 + 99人 × 1点) ÷ 100人
グループB:
協力者が多い
99人 × 98点 1人 × 99点 98.01点/人
= (99人 × 98点 + 1人 × 99点) ÷ 100人
1人当り平均利得 97.02点/人
= (1人 x 0点 + 99人 × 98点) ÷ 100人
1.98点/人
= (99人 × 1点 + 1人 × 99点) ÷ 100人
-

どちらのグループでもグループ内では裏切る方が利得が高くなるが、グループを統合した場合は協力者の利得の方が圧倒的に高いというシンプソンのパラドックスを生み出している。

進化・淘汰の過程を考えると、グループ内淘汰では裏切り者が増えるが、グループ間淘汰では協力者が多いBの方が人口が増える可能性がある。この様に複数のレベルでの淘汰が生じるプロセスを「マルチレベル淘汰」と言う。

マルチレベル淘汰において、上手く協力行動の促進・維持のメカニズムが機能するためには、一定のタイミングでグループの再構成が行われる必要がある。

マルチレベル淘汰による協力行動の進化をシンプルな生態系型のエージェントシミュレーションで示した例としては、Pepper & Smuts (2001) の研究 (「パッチモデル」と呼ばれる) がある。

3. ネットワーク互恵と複雑ネットワーク

  • ここまでに紹介した 直接互恵 / 間接互恵 / マルチレベル淘汰 では、集団内・グループ内で一様な相互作用が行われること (well-mixed) を前提としていたが、現実の集団構成は相互作用に偏りがあり、ネットワーク的である。この様なネットワーク的相互作用を前提とする協力進化のメカニズムのことを「ネットワーク互恵」という。
  • 要するに、ネットワークのハブが協力者だとそのネットワークは安定し、ハブが裏切り者だと不安定になる。なので、協力行動が普及する。
  • ネットワークの最初の研究は Nowak & May (1992)。格子状ネットワーク上でのゲーム。
  • 進化的グラフ理論という視点から整理され発展している。近年、複雑ネットワーク上でのゲームの研究も活発に行われている。サーベイ論文としては、増田 (2008) や Szabo & Fath (2007) など。
  • Yonenoh & Akiyama (2014) では、ジレンマ状況下での社会ネットワークの創出について検証し、Iwata & Akiyama (2016) では、個人間の付き合い頻度の異質性が協力行動の進化に与える影響を分析している。

Ⅵ. まとめ

  • 協力行動を促進・維持するメカニズムとして、「直接互恵」「間接互恵」「マルチレベル淘汰」「ネットワーク互恵」を紹介した。
  • 協力行動を促進・維持するメカニズムとして、本稿では紹介しなかったが重要なものとしては、下記がある。
    • 血縁淘汰: 遺伝的に近いものへの協調
    • 罰則・報酬制度: Fehr & Gachter (2000)
    • 相手の「タグ」に応じた行動様式: 仲間に対する協力
  • 今後の研究では、以上のアプローチを相補的に用いた研究に期待される。