マルチエージェントゲーム理論 と 「人付き合い」
Download
Report
Transcript マルチエージェントゲーム理論 と 「人付き合い」
意外と
身近なゲーム理論
へなちょこ研究室
p
ゲーム理論って難しい?
2005年にゲーム理論の先駆者が
ノーベル賞を受賞
ロバート・オーマン トーマス・シェリング
冷戦下の安全保障 人種の棲み分け理論
ゲーム理論は
人間の経済行動に密接に関係
身近な例にゲーム理論を適用
非協力ゲーム理論
エージェント :利己的な組織・個人
ゲーム
:エージェント間の利害関係
非協力ゲーム:エージェント間に提携がない
囚人のジレンマゲーム
P1
P2
Cooperate(協調)
Defect(裏切り)
Cooperate(協調)
Defect(裏切り)
パレート最適解
3\3
5\0
0\5
1\1
戦略
各エージェントは
戦略
を持つ
…前回相手が協調
→今回自分が協調する確率
…前回相手が裏切り
…非協調
…協調
…厳格
…寛容
0
1
0
常に
非協調
逆しっ
ぺ返し
1
しっぺ
返し
常に
協調
(0.4,0)
(0.2,0.6)
5
対戦
03
(0.8,0.4)
3
D
C
C
C
(1,0.8)
(0.3,0.3)
スケールフリーネットワーク
•頂点の数と他の頂点と接続している数が
べき法則に従うネットワーク
•80:20の法則・パレートの法則・ロングテール理論
•売り上げの8割は
2割の商品で占められる
•文章で使われる単語の
8割は全単語の2割である
•オークション出品物の8割は
2割のユーザーの出品である
実験アルゴリズム
1.
対戦
–
2.
対戦可能な相手と規定回数対戦
正規化
–
3.
総利得を対戦回数で除算
進化
–
4.
エージェント数
255
対戦回数
4
対戦期間
2500
対戦可能なエージェントの中で最も
高い利得を獲得したエージェントの エラー発生率
戦略をコピー
繰り返し回数
エラー
–
パラメータ
コピーエラーやノイズ
0.1
100
協調達成閾値
2.3
協調崩壊閾値
1.7
結果1
協調の崩壊
平均利得2.61
協調の崩壊20回
全エージェント
Hubエージェント・EtoHエージェントが
結果2
高いAqを持つHubエージェントを搾取
↓
協調が崩壊??
Hub
EtoH
EtoE
検証実験
5人のHubエージェントの戦略を
固定された値に操作する
操作
平均利得
協調の崩壊
なし
2.52
20
2.23
63
2.55
0
2.61
0
2.00
237
結果
まとめ
• スケールフリーネットワークにおいても協調は達
成される
• が、脆弱であり崩壊しやすい
• 崩壊の原因は、接続次数の高いハブエージェント
が非協調に対して寛容になることである
現実社会では
中心人物が寛容になることに対し
脆弱性を持つ