新ゲーム理論第Ⅰ部非協力ゲームの理論第1章非協力ゲームの戦略形

Transcript 新ゲーム理論第Ⅰ部非協力ゲームの理論第1章非協力ゲームの戦略形

新ゲーム理論
第Ⅰ部非協力ゲームの理論
第1章非協力ゲームの戦略形
M1 藤井敬士
今回の内容
• 社会的ジレンマ
– 囚人のジレンマ
– 均衡利得，パレート最適
• 状況表現としてのゲーム
– 協力ゲームと非協力ゲーム
• 支配可能
• 共有地の悲劇
– 非協力的状況から協力関係の構築
• ゲームの理論の性格
囚人のジレンマ
2人で
・・・．
やりました
半年
2年
5年
10年
2年
5年
B
A
B
黙秘
共犯宣言
A,Bとも
に2年
Aに10年
Bに半年
共犯宣言 Aに半年
Bに10年
A,Bとも
に5年
黙秘
A
2人で
・・・．
やりました
B
A
黙秘
共犯宣言
黙秘
5，5
0，8
共犯宣言
8，0
2，2
(※利得がA,Bにとって共通であると仮定)
自分が最悪になるのを避けるために，結局2人とも証言する．
標準的囚人のジレンマ・ゲーム
C
D
C
D
S1, S2
W1, B2
B1,W2
Bi (best)  Si (second)  Ti (third)  Wi (worst), i  1,2
のとき，囚人のジレンマ型ゲームという
T1,T2
2S1  B1 W1, 2S1  B1 W1
のとき，特に標準的囚人のジレンマ型ゲームという
→最高と最低よりも2番目×2回の方がいい
最終的に両者の思考が
たどり着く
( D, D)を均衡点と呼び，
そのときの利得ベクト
ル(T1, T2 )を均衡利得と呼ぶ
支配戦略均衡
S1, S2
W1, B2
B1,W2
T1,T2
＜
D
D
＜
C
C
プレイヤー
1についてS1  B1, W1  T1 であるから，
プレイヤー
2がどんな戦略をとろう
とも戦略
Dをとるのが良い．
→戦略Dが戦略Cを支配している，もしくは戦略Cは戦略Dに支配されるという．
→プレイヤー２についても同様
→支配戦略があるときは支配戦略を用いる（支配戦略の原理）
（D，D）を支配戦略均衡点という．
均衡利得とパレート最適性
(S1, S2 )  (5,5)のように，誰かの利得
を増加させるためには
他の人の利得を減少さ
せなければならないと
き，
その利得ベクトルをパ
レート最適という．
厳密には，利得ベクト
ル x  ( x1,...,xn ), y  ( y1,...,yn )
において，
xi  yi
i  1,2,...,n
のとき，
xはyをパレート支配すると
いい，すべての
yに対して
これが成り立つ
xをパレート最適という
．
囚人のジレンマの閉塞的状況から脱出するためには，
非協力的状況から協力的状況への変革が必要
状況表現としてのゲーム
• ゲームとは
→ゲームには相手がいる
• 有限か無限か
• 誰がプレイヤーであるか
• ある主体は，ゲームの中にいるのか外にいるのか
（ex.「住民参加」という言葉を使うとき
– プレイヤーの集合が変動することもある
ゲームとは，プレイヤーを明らかにしたうえで，それら
のプレイヤーの間に成立している社会的状況のこと
非協力ゲームと協力ゲーム
戦略＝各プレイヤーの持つ行動計画
1. 非協力ゲーム理論
プレイヤーの間には，各プレイヤーがとるべき戦略について，強制力
のある取り決めは存在しない．(より基本的といえる．)
2.
協力ゲーム理論
すべてのプレイヤーの間に，そのとるべき戦略についての合意が成り
立ち，それに基づいて戦略を選択し行動する．
※現実に拘束的合意が存在するかどうかは観察不可能なので，どちらの
前提に立つのか，という問題．
非協力ゲームの戦略形
利得関数
xi  fi (s1, s2 ,...,sn ), i  1,2,...,n
ここで，
si  Si i  1,2,...,n (Si : プレイヤー
iの戦略の集合)
※各プレイヤーの利得は，自分だけでなくほかのプレイヤーの
とる戦略の関数でもある．
非協力ゲームの戦略形
社会的状況を，非協力という前提で，プレイヤー．戦略，利得関数の
3つの組で表したもの．他に展開形という形式がある．（cf.3章）
非協力ゲームの戦略形
非協力有限2人ゲーム
プレイヤー１と２がい
るとき，それぞれの戦
略をi, jとし
(1  i  m,1  j  n)，
それぞれの利得を
aij  f1 (i, j ), bij  f 2 (i, j )とするとき，
A  aij , B  bij を
 
プレイヤー１，２の利
得行列という．このよ
うな非協力ゲームを
戦略形非協力有限2人ゲームという．
プレイヤー2
プ
レ
イ
ヤ
ー
1
1
1  a11, b11

 
i  ai1 , bi1

 
m am1 , bm1

j
 a1 j , b1 j

 aij , bij

 am j, bm j

n
 a1n , b1n 
 
 ain , bin 

 
 am n, bm n
という双行列で表せる
ので双行列ゲームとも
いう．
 
非協力ゲームの戦略形
行動原理
プレイヤーは期待効用を最大にするように行動する
ルールとゲーム
ルール・・・ここまでに挙げた要素や前提のこと
ゲーム・・・1組のルールによって表現されたもの
ゲームとは，複数のプレイヤー間の状況をルールと
して表現したもの．このように状況を表現すること
がゲーム理論の第一の目的
以下での表記について
プレイヤーの集合
: N  {1,2,, n}
プレイヤー
iの戦略とその集合
: Si  {si }
戦略の組とその集合：
S  {s  (s1 , s2 ,, sn )}  S1  S2  Sn
プレイヤー
i以外のすべてのプレイ
ヤーの
とる戦略の組とその集
合:
si  (s1 , s2 ,, si 1 , si 1 ,, sn )
Si  S1  S2  Si 1  Si 1  Sn
si  Si
とかく
戦略の同等と支配
プレイヤー
iの戦略hと戦略kについて，
任意のsi  Siに対して
fi (s1, s2 ,, h,, sn )  fi (s1, s2 ,, k ,, sn )
が成り立つとき，プレ
イヤーiの
戦略hと戦略kは同等であるという．
 が  に変わると，戦略
hは戦略kを支配するという．
被支配戦略の除去と支配可能
「支配される戦略は用いない」という戦略の選択原理を被支配戦
略除去の原理という．下のようなゲームの例で説明する．
プレイヤー2
1
2
3
1
2,4
4,6
6,3
2
3,2
3,4
3,5
3
4,5
2,6
4,4
プレイヤー1
被支配戦略の除去と支配可能
1.
5. プレイヤー2にとって，戦略1は戦略2に支配されている．
3.
2.
4.
プレイヤー2は戦略2を選択する．
縮小したゲームを考えると，プレイヤー1の戦略2と3は戦略1
プレイヤー2の戦略1を除く
プレイヤー1の戦略2と3を除去する．
に支配されている．
プレイヤー2
1
2
3
1
2,4
4,6
6,3
2
3,2 ＜3,4
3,5
3
4,5
4,4
プレイヤー1
2,6
被支配戦略の除去と支配可能
このように(被支配戦略除去の原理に従って)
到達した戦略の組(1,2)を，一般にゲームの
均衡点という．
被支配戦略除去の原理による均衡点が存在
するとき，ゲームは支配可能であるという．
支配戦略均衡点
支配戦略・・・他のすべての戦略を支配する戦略
支配戦略均衡点・・・ｎ人のすべてのプレイヤーが支配戦略を持
つとき，支配戦略が存在するときは支配戦略を用いる（支配
戦略の原理）ため，ｎ個の支配戦略の組 s*  (s1* , s2* ,, sn* )
が残る．これを支配戦略均衡点という．
（※支配戦略の原理は，被支配戦略除去の原理の特別な場合
といえる）
弱支配戦略・・・
fi (s1, s2 ,, h,, sn )  fi (s1, s2 ,, k,, sn ) のとき，戦略ｋは
戦略ｈに弱支配されるという．
共有地の悲劇
共有地の悲劇
モデル化して考える（非協力ゲーム）
q1頭
農家1
q1頭
農家2
q2頭
農家3
q3頭
農家4
q4頭
牛1頭の価格＝2，1軒につき3頭まで買える資金がある
農家iの収益xiは，xi  qi [16  (q1  q2  q3  q4 )]  2qi
全体の放牧数が増えると
生育が悪くなり利益効率が下がる
牛購入のコスト
共有地の悲劇
1.
2. 農家iにとって，戦略1は戦略2と3に支配されているので
3.
戦略3は戦略2を弱支配する．（他の農家が3頭ずつ出し
つまり，他の農家が2頭以下にやめる保証のない限りは
排除する．
たとき以外は戦略3の方が有利）
3頭放牧したほうが有利
i以外の農家の放牧牛の数の和
i
の
牛
数
0
1 13
2 24
3 33
1
12
22
30
2
11
20
27
3
10
18
24
4
9
16
21
5
8
14
18
6
7
12
15
7
6
10
12
8
5
8
9
9
4
6
6
共有地の悲劇
このゲームの弱支配均衡点は，s=(3,3,3,3)であり，この場合，均衡利得は
ｘ=(6,6,6,6)である．
仮にr=(2,2,2,2)という戦略をとれば，y=(12,12,12,12)という利得ベクトル
が期待できる．
つまり，弱支配均衡点における均衡利得は共同合理的でない場合もある．
i以外の農家の放牧牛の数の和
i
の
牛
数
0
1 13
2 24
3 33
1
12
22
30
2
11
20
27
3
10
18
24
4
9
16
21
5
8
14
18
6
7
12
15
7
6
10
12
8
5
8
9
9
4
6
6
共有地の悲劇（問題改善）
非協力的状況では限界がある．
→各農家で相談して2頭ずつ放牧することに取り決め
る
→共同事業を行い，4軒をひとつの農家とみなす
収益x  q(16  q)  2qだから，
q  7のとき利得は最大値
49
→4軒では割り切れないので貨幣のようなものを導入
する
非協力的状況からいかに協力関係を構築する
かということが問題解決の重要な点になっている
ゲーム理論の性格
• 形式合理性（思考と行動の論理的整合性）を前提と
している
– 完全でない場合もあり，限定合理性を前提とすることもあ
る
– 合理性と言うとき，効用を最大化するという目的合理性と
いう意味も持つ場合が多い
– すべてのプレイヤーに共通な合理性の基準というものが
あるのか？
ゲーム理論の役割（目的）は，分析することである．その上
で問題解決のための思考の枠組みを提供する．（必ずしも
すべての人を満足させる案を出すことだけではない）

新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形

Transcript 新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形

Directory

新ゲーム理論第Ⅰ部非協力ゲームの理論第1章非協力ゲームの戦略形

Transcript 新ゲーム理論第Ⅰ部非協力ゲームの理論第1章非協力ゲームの戦略形