Transcript game03

第Ⅰ部 協力ゲームの理論
第3章 非協力ゲームの展開形
2008/07/01(火)
ゲーム理論合宿
B4 山﨑 一郎
内容
•
展開型ゲーム
– ゲームの木
– 情報構造
– 完全記憶と完全情報
•
•
•
情報構造と戦略
純戦略での均衡点
行動戦略での均衡点
– 完全記憶と行動戦略
– 不完全記憶と行動戦略
2
1.展開型ゲーム
~ゲームの木~
自然と2人のプレイヤーからなるゲーム
2人のプレイヤーは売る(S)と買う(B)の2つの行動を
もっていて、それらの行動による利得は、
景気の上昇(α)と下降(β)によって異なる。
2人のプレイヤーとは独立に
決定される手番・・・偶然手番(ここでは景気の変動を指す)
3
1.展開型ゲーム
~ゲームの木~
ゲームの木・・・ゲームの手番と行動の系列を
木の形で表現したもの
偶然手番で自然(景気)が行動を選択し、次にプレイヤー1・
プレイヤー2が行動を選択することでゲームが終了する。
その時プレイヤーの利得が決まる。
4
1.展開型ゲーム
~ゲームの木~
– 選択枝の数は有限・無限を問わない
– 偶然手番は確率分布が定まっているとする
cf.デシジョンツリー
5
1.展開型ゲーム
~情報構造~
自身の選択をする上で、他プレーヤーの選択結果を
知っているか知らないかは重要である。
情報集合
プレーヤー1が自然のとった選択を知らないとすると、自身はaにいるかb
にいるかはわからないが、集合u₁={a,b}に含まれることはわかる。こ
のような集合を情報集合と呼ぶ。
6
1.展開型ゲーム
~情報構造~
– 自然のもつ情報集合はただひとつの点からなる。
– 情報集合は、次の2つの性質をもつ
ⅰ.1つの情報集合に属する分岐点は同じ数の枝をもつ
ⅱ.1つの情報集合は1つのプレイに属する点を2個以上含まない
7
1.展開型ゲーム
~情報構造~
プレーヤー分割
ゲームの木の分岐点の集合は、各プレーヤーのもつ(自然を含む)点の
集合に分割できる ・・・プレーヤー分割
情報分割
分岐点の集合は、各プレーヤーのもつ情報集合に分割される
⇒プレーヤー分割の再分割
8
1.展開型ゲーム
~情報構造~
利得ベクトル
ゲームの木の頂点は、ゲームの終了時における各プレイヤーの状態 を表し、
各頂点には、プレイヤ ーの利得hi (t)を成分とする利得ベク トルとして
表現できる。
また、頂点 tと利得ベクトルを対応 させる関数
h(t )  (h 1 (t ),h 2 (t ),,h n (t ))
を利得関数という。
9
1.展開型ゲーム
~情報構造~
展開型ゲーム
• 全ての点における枝の数が有限で、かつ、全てのプレイが有限個の点と枝
からなる木をもつゲーム・・・有限ゲーム
• そうでないゲーム・・・無限ゲーム
ゲームの木K、
番の確率分
イヤー
情報分割U、利
h
(t)
の5つの要
表され
G
={K,p,P,U
h
(t)
}
を展開型ゲーム
10
1.展開型ゲーム
~完全記憶と完全情報~
完全記憶ゲーム 複数の手番があるプレーヤーがいて、現在の自分の
とる行動を選択する際、前の手番での自分の選択を
知っていて、その記憶を用いることができる。
11
1.展開型ゲーム
~完全記憶と完全情報~
完全情報ゲーム 全てのプレイヤーは、自分の行動を決定するに
あたって、自分が今どの分岐点にいるかを知っている
cf. 完全情報と情報完備
12
1.展開型ゲーム
~完全記憶と完全情報~
情報構造の精密化・劣悪化
2つのゲームG, G  があって、 G  はGの情報分割Uを
再分割した情報分割U をもっているとき、
情報構造について、G  はGの精密化ゲーム、 Gは G  の
劣悪化ゲームであると いう
13
2.情報構造と戦略
2人のプレイヤーがいて、ともに、SとBの2つの行動を
もっている偶然手番の無い市場を考える。そのとき、
プレイヤー2がプレイヤー1の選択について、情報をもつ場合と
もたない場合がある。
14
2.情報構造と戦略
• 情報をもつ場合
「プレイヤー1が行動Sをとれば、自分は行動Sをとり、
プレーヤー1が行動Bをとれば、自分は行動Bをとる」
プレイヤー2は情報集合u₂₁,u₂₂をもっていて、それぞれの情報
集合に到達したときに、行動を選択する・・・行動計画
⇒「情報集合u₂₁では行動Sをとり、
•
情報集合u₂₂では行動Bをとる」
15
2.情報構造と戦略
局所純戦略
ある情報集合で、いかなる行動を選択するかを指定した行
動計画を、その情報集合における局所純戦略という
純戦略は、局所純戦略の組である
(u₂₁での局所純戦略,u₂₂での局所純戦略)
(SS)
(SB)
(BS)
(BB)
プレーヤー2の純戦略
純戦略は予め立てられた行動計画を意味する
16
2.情報構造と戦略
展開型ゲームの戦略形ゲームへの縮約
先のゲームの戦略形は次のようになる
P₁
(S)
(B)
P₂
(SS) (SB) (BS) (BB)
6,4 6,4 0,5 0,5
5,3 2,2 5,3 2,2
均衡点は(B,BS)すなわち(5,3)となる
17
2.情報構造と戦略
• 情報をもたないゲーム
戦略形
(S) (B)
(S) 6,4 0,5
(B) 5,3 2,2
→純戦略では均衡点は存在しない
→混合戦略にまで範囲を広げると、
s*
q
(
p
*,
*)

((
1
/
2
,
1
/
2
),
(
2
/
3
,
1
/
3
))
となる。このときの期待値としての均衡利得は、


x
*

p
*
Aq
*

4
,
x
*

p
*
Bq
*

3
.
5
1
2
となる
18
2.情報構造と戦略
プレイヤー2が情報をもつ場合ともたない場合の比較
情報を持たないゲーム 情報をもつゲーム
均衡点
混合戦略
純戦略
(4,3.5)
均衡利得
(5,3)
19
2.情報構造と戦略
均衡経路の確定性
均衡経路・・・各プレイヤーが、均衡点によって
示された均衡戦略を用いたときに
得られる底点から頂点までの経路
• 情報をもつ場合、均衡点は純戦略の組として与えられ、均衡
点はただ1つに確定する
• 情報をもたない場合、均衡点は混合戦略の組として与えられ、
正の確率を持つ純戦略によって与えられる頂点までの経路が
複数個与えられる。どの経路が実現されるかは確率的に定ま
るだけである。
20
2.情報構造と戦略
• 利得の変化
プレイヤー2が情報をもつと、プレイヤー1の利得は増加し(4
→5)、プレイヤー2の利得は減少する(3.5→3)。
→プレイヤー1は情報を公開したほうが有利
→プレイヤー1にとって、この情報は戦略的に正の価値がある
⇔プレイヤー2にとって、この情報の価値は負である
21
3.純戦略での均衡点
3人のプレイヤーがいて、3人ともAとBとの2つの行動を
もっている。ゲームは完全情報で、下図のような
展開形に書けるとする。
22
3.純戦略での均衡点
プレイヤー1の純戦略
情報集合は1つだから、(A),(B)の2通り
プレイヤー2の純戦略
情報集合は2つだから、(AA),(AB),(BA),(BB)の4通り
プレイヤー3の純戦略情報集合は4つだから、
(AAAA),(AAAB),・・・(BBBB)の16通り ←多すぎ!
→ゲームの木の頂点から考え、戦略形を縮約することを
考える
23
3.純戦略での均衡点
プレイヤー3の行動でゲームは終了するので、プレイヤー3は、
各情報集合における最適反応戦略を求めることができる。
24
3.純戦略での均衡点
同様に、プレイヤー2の各情報集合における最適反応戦略を求
めることができる
25
3.純戦略での均衡点
同様に、プレイヤー1の最適反応戦略を考えると、プレイヤー1
は戦略Bをとる。
したがってこのゲームの均衡経路は
B→B→B
と定まる。この均衡経路を指定する均衡点は、
(B,BB,AAAB)
である。
→ゲームの木の頂点のほうから底点に向かって考えていく方
法
・・・逆戻り推論法
26
3.純戦略での均衡点
純戦略での均衡点の存在
キューンの定理Ⅰ
完全情報をもつ有限展開型n人ゲームでは純戦略による均衡
点が存在する
岡田の定理
偶然手番がなく、情報構造が完全記憶であるゲームが与えら
れたとき、利得の如何にかかわらず、純戦略での均衡点が存
在するための必要十分条件は、情報構造が完全情報である
ことである。
27
3.純戦略での均衡点
均衡経路の保存
純戦略での均衡点が存在するとき、完全情報でなくとも、
純戦略での均衡点が存在する場合がある。そのときの
均衡経路は、情報構造を更に精密化しても、偶然手番の
ない場合には、その均衡経路はそのまま保存される。
→それ以上情報を精密化する必要がない
→必要十分な精密化の度合を求めることができる
28
4.行動戦略での均衡点
行動戦略・・・プレイヤーがもつ全ての情報集合における
局所混合戦略の組
純戦略・・・全ての局所戦略が局所純戦略からなる行動戦略
→純戦略に確率を付したものが混合戦略
29
4.行動戦略での均衡点
~完全記憶と行動戦略~
プレイヤー1が情報
合
u
において、
L
をとる確
a
、
11
11
R
をとる確率を
a
とすると、
u
における局
a
,
a
)
12
11
11
12
と表される。同様に
て、情報集合
u
における
12
(
a
,
a
)、情報集合
u
における局所
a
,
a
)と表
21
22
13
31
32
30
4.行動戦略での均衡点
~完全記憶と行動戦略~
したがって、
ー1の行
つの
b

(
(
a
,
a
)
(
,
a
,
a
)
(
,
a
,
a
)
)
1
11
12
21
22
31
32
で表される。
31
4.行動戦略での均衡点
~完全記憶と行動戦略~
このとき、行動戦
組
b

(
b
,
b
)につい
均衡
1
2
いままでと同じ
定義するこ
。
そのようにして
れた行動戦
て表さ
行動戦略による
という。
32
4.行動戦略での均衡点
~完全記憶と行動戦略~
このゲームの行動戦略
による均衡点を、
b*
( b1*,
b2*)とすると、
b1*{(
5/16
,
11
/16
),(0,1),(1,0)}
b2*{(
7/16
,9/16
)}
である。そのときの均
衡利得は
(3/16
,-3/16
)である。

プレイヤー1の均衡行
動戦略
b1*は、情報集合
u11
で
(5/16
,
11
/16
)、情報集合
u12では局所純戦略R、情
報集合
u13では
局所純戦略Lをとると
いうことを意味する

プレイヤー2は情報集
合
u2で行動Lを
7/16
、行動Rを
9/16
の
確率でとる
→行動計画の確定性の減少
33
4.行動戦略での均衡点
~完全記憶と行動戦略~
ゲームの戦略形
u2
u11,u12,u13
(L) (R)
(LL*) 6 -5
(LR*) -6 5
(R*L) 3 -2
(R*R) -3 2
*はLまたはRを意味する
→プレイヤー1・・・最大化プレイヤー
プレイヤー2・・・最小化プレイヤー
34
4.行動戦略での均衡点
~完全記憶と行動戦略~
プレイヤー1および2
の混合戦略をそれぞれ
p(p1,p2,p3,p4),q(q1,q2)
とすると、混合戦略と
行動戦略との関係は、
次のように表さ
p1(LL*
)a11a21
,p2(LR*
)a11a22
p3(R*L
)a12a31
,p4(R*R
)a12a32
q1(L)b21
,q2(R)b22

混合戦略の均衡点は、
行動戦略による
均衡点から生成する
ことができる。
p*(p1*,p2*,p3*,p4*)(0,
5/16
,
11
/16
,
0)
q*(q1*,
q2*)(7/16
,
9/16
)
35
4.行動戦略での均衡点
~不完全記憶と行動戦略~
東京とロンドンの間で
不完全記憶が
き、
ゲームの木は下図の
うになる。この
このゲー
行動戦略での均衡点
存在しない。

ゼロ和2人ゲームに
、混合戦略で
が常に
という定理により、混
合戦略での均
めること
36
4.行動戦略での均衡点
戦略形
u11,u12
~不完全記憶と行動戦略~
u2
(LL)
(LR)
(RL)
(RR)
max
(L)
6
-6
3
-3
6
(R.)
-5
5
-2
2
5
min
-5
-6
-2
-3
純戦略での均衡点は
在しないから、
ヤー1お
混合戦略をそれぞれ
p

(
p
,p
,p
,p
)
,
q

(
q
,
q
)
とする。
1
2
3
4
1
2
そのときの混合戦略
の均衡点を
(
p
*,
q
*)
とすると、
p
*

(
0
,
5
/
16
,
11
/
16
,
0
)
,
q
*

(
7
/
16
,
9
/
16
)
である。
37
4.行動戦略での均衡点
~不完全記憶と行動戦略~
• 行動戦略
プレイヤー1の2つの
情報集合におい
レイヤー
Lをとる確率を
a
,a
とすると、プレイヤ
1の行動
11
21
b

((
a
,a
),
(
a
,a
))
1
11
12
21
22
である。同様に、プレ
イヤー2について
b
(
b
,b
)
である。
2
21
22
38
4.行動戦略での均衡点
~不完全記憶と行動戦略~
• 行動戦略
このとき、プレイヤー1の混合戦略p  ( p1, p 2 , p3 , p4 )
プレイヤー1の行動戦略b1  (( a11, a12 ), ( a21 , a22 ))において、
p1 (LL)  a11  a 21,p2 (LR)  a11  a22
p3 (RL)  a12  a 21,p4 (RR)  a12  a22
である。したがって、混合戦略p*  ( p1*, p2*, p3 *, p 4*)  ( 0,
5 / 16,
11 / 16,
0)
に対応する行動戦略は、
a11  a21  0,a11  a22  5 / 16
a12  a21  11 / 16,a12  a22  0
をみたす局所戦略の組である。 ←存在しない
39
4.行動戦略での均衡点
~不完全記憶と行動戦略~
→均衡点として求められた混合戦略と両立する
行動戦略を求めることができない。
戦略形から混合戦略での均衡点を求めても、
プレイヤー1にとっては役に立たない
→第1の手番で確率に基づいて行動しても、第3の手番で、
第1の手番で何を選択したかを知らないから
40
4.行動戦略での均衡点
• 完全記憶ゲームでは混合戦略は行動戦略から作ることができ、
また逆に、混合戦略からそれに対応する行動戦略を作ること
ができる。
• 不完全記憶ゲームでは、行動戦略での均衡点が存在しない
場合があり、その場合には戦略形から混合戦略の均衡点を求
めても役に立たない
41
4.行動戦略での均衡点
一般に、行動戦略での均衡点の存在について次の定理がある。
• キューンの定理Ⅱ
完全記憶をもつ有限展開型n人ゲームは行動戦略において
均衡点をもつ
一般に、完全情報ゲームでは、利得の如何にかかわらず、純戦
略での均衡点が存在し、完全記憶ゲームでは、利得の如何に
かかわらず、行動戦略での均衡点が存在し、不完全記憶ゲー
ムでは、行動戦略での均衡点が存在しない場合がある。
→情報構造の精密化は、行動計画の不確実性の減少という役
割を果たす
42