Transcript game04

第I部 非協力ゲームの理論
第4章 完全均衡点
2008/07/01(火)
ゲーム理論合宿
B4 山田孝太郎
内容
• 部分ゲーム完全均衡点
-部分ゲーム
-部分ゲーム完全均衡点
-2段階完全情報ゲーム
• シュタッケルベルク均衡点
• 完全均衡点の不完全性
-チェーンストアパラドックス
-合理性の限界
1
4.1. 部分ゲーム完全均衡
4.1.1. 部分ゲーム
 展開形ゲーム
が与えられているとき、ゲームの木Kの分岐点aを底点として、それ以後の
分岐点、枝、頂点からなる木の部分K’を、元の木Kの切断、あるいは、aを
底点とするKの部分木という。
P1
P2
A
・a
a
Γ
利得
P3
B
・
・
A
(6,1,3)
B
A
(2,6,1)
B
(5,1,2)
A
B
A
(3,0,4)
(1,4,1)
(2,6,2)
B
(6,1,5)
(0,3,5)
Γa
v・
・b
A
・
B
・
Γb
2
4.1. 部分ゲーム完全均衡
4.1.1. 部分ゲーム
•
このようなものは部分ゲームではない。
P1
P2
A
・a
a
Γ
利得
P3
B
A
(6,1,3)
B
A
(2,6,1)
B
(5,1,2)
A
B
A
(3,0,4)
(1,4,1)
(2,6,2)
B
(6,1,5)
(0,3,5)
Γa
v・
A
・b
B
Γb
←情報集合が部分木間をまたぐ。
3
4.1. 部分ゲーム完全均衡
4.1.1. 部分ゲーム
P1
例1. 完全情報2人ゲーム
• プレイヤー1と2はそれぞれSとB
の行動をもっている。
• 第2の手番で、プレイヤー2は1
の行動を知った上で、自分の
行動を選択できる。
• 戦略と、純戦略での均衡点と均
衡利得は
(S)
(B)
(S S) (S B) (B S) (B B)
3,6 3,6* 0,0
0,0
5,3
2,2
5,3
2,2
u21
・a
Γ
u1
利得
P2
S
S
(3,6)
Γa
B
(0,0)
S
(5,3)
B
(2,2)
・
B
u22
・b
Γb
均衡点 (B,SS) (B,BS) (S,SB)
均衡利得 (5,3)
(5,3)
(2,2)
となる。
4
4.1. 部分ゲーム完全均衡
4.1.2. 部分ゲーム完全均衡点
• 例1で求めた、3つの均衡点の意味は?
P1
u21
・a
Γ
u1
利得
P2
S
S
(3,6)
Γa
B
(0,0)
S
(5,3)
B
(2,2)
(S)
(B)
・
B
u22
・b
Γb
(S S) (S B) (B S) (B B)
3,6 3,6* 0,0
0,0
5,3
2,2
5,3
2,2
均衡点 (B,SS) (B,BS) (S,SB)
均衡利得 (5,3)
(5,3)
(2,2)
5
4.1. 部分ゲーム完全均衡
4.1.2. 部分ゲーム完全均衡点
(1)部分ゲーム完全均衡点(subgame perfect equilibirium)
均衡点(B,SS)の意味
-部分ゲームΓaにおいて、情報集合u21でのプレーヤー2の最適反応戦略は、行
動Sをとることで、 Γbにおける情報集合u22でも同様に、Sが最適反応戦略。
-均衡点(B,SS) において、プレイヤー2の戦略(SS)を、2つの部分ゲームに限定し
たとき、ともに均衡点となる。
-このとき、ゲームΓは右のように縮約できる。
-そして、この縮約ゲームにおいて、プレイヤー1の
P1
利得
最適反応戦略は(B)で、均衡点も(B)。
(3,6) Γa
Γ
-逆戻り推論で得られた均衡点。
S
o
要するに、
・
均衡戦略をΓ, Γa, Γbの3つの部分ゲームに限定したとき、
それぞれの部分ゲームにおける均衡点の組のこと。
B
(5,3) Γb
6
4.1. 部分ゲーム完全均衡
4.1.2. 部分ゲーム完全均衡点
(2)不完全均衡点I
均衡点(B,BS)の意味
-もし、間違って1が行動Sをとった場合、
この均衡点によって行動を選択すると、
利得が(0,0)になる。
-つまり、中に不合理な選択を含む均衡点。
-なぜナッシュ均衡点になっているのか?
←プレイヤー1がBをとることになっている
ので、 ΓaにおいてBをプレイヤー2が選択
しても関係ない。
P1
u21
・a
Γ
利得
P2
S
S
(3,6)
Γa
B
(0,0)
S
(5,3)
u1
・
B
u22
・b
Γb
B
(2,2)
(3)部分ゲーム完全均衡点と不完全均衡点
-部分ゲーム完全均衡点とは、ナッシュ均衡点であって、すべての部分ゲームに
限定したときに得られる行動戦略の組が、その部分ゲームの均衡点になっている
点のこと。
-そうでないときは、単に不完全均衡点という。
7
4.1. 部分ゲーム完全均衡
4.1.2. 部分ゲーム完全均衡点
(4)不完全均衡点II(脅しの均衡点)
均衡点(S,SB)の意味
P1
P2
利得
u
21
(3,6)
S
-プレイヤー2が情報を持たないときには得られ
Γa
・a
なかった点。
Γ
B
S
(0,0)
-部分ゲームΓbにおいて、戦略(B)は均衡点
u1
ではないので、不完全均衡点。
・
-プレイヤー2の戦略の意味は
B
u22
(5,3)
S
「もし君がSすれば、僕もSして、
Γb
・b
もし君がBすれば、僕もBする」ということ。
B
(2,2)
-この後半部分は「脅し」なので、脅しの戦略
という。
-脅しの戦略は、プレイ前に通告ができて、それを開始後も変更することができな
い場合に有効。
例)日本が競争的輸出をするならば、輸入禁止的処置をとることを米が法制化
8
4.1. 部分ゲーム完全均衡
4.1.3. 2段階完全情報ゲーム
•
•
•
例1のゲームは、プレイヤー2はゲームがプレイされる前に、
自分の取る戦略を決定し、実行するという前提。
プレイヤー2が自分の手番の分岐点に来た時に戦略を決定
するという状況なら、脅しの戦略は実行されない。
このように完全記憶ゲームで、ゲームがいくつかの段階に分
かれていて、それぞれの段階で行動を選択・実行するゲーム
を、多段階ゲームという。
9
4.1. 部分ゲーム完全均衡
4.1.3. 2段階完全情報ゲーム
例2 2段階完全情報2人ゲーム
-2段階ゲームで、プレイヤー2は1の行動を知った上で行動を選択する。
-話し合いはない。
-このゲームには先手(leader)、後手(follower)がある。展開形に段階を明
記して書くことができる。戦略形と均衡点・利得は右下
段階1 段階2
P1
P2
u21
・a
Γ
u1
S
終点
利得
S
(4,8)
Γa
B
(0,0)
S
(6,6)
B
(0,6)
・
B
u22
・b
Γb
(S)
(B)
(S S)
4,8
6,6*
(S B)
4,8*
0,6
(B S)
0,0
6,6*
(B B)
0,0
0,6*
均衡点 (S,SB) (B,SS) (B,BS) (B,BB)
均衡利得 (4,8)
(5,3)
(6,6)
(0,6)
10
4.1. 部分ゲーム完全均衡
4.1.3. 2段階完全情報ゲーム
例2 2段階完全情報2人ゲーム
- Γaにおける2の最適反応戦略は(S).
- Γbにおける2の最適反応戦略はどちらも2の利得が6になるので、(S)も
(B)も最適反応戦略。
段階1 段階2
終点
P1
P2
利得
-縮約すると、右図。
-プレイヤー2が戦略(S)をとる保証がない限り、
u21
S
1は戦略(B)をとることができない。
(4,8) Γa
・a
Γ
-友情ルールがあれば、1は心おきなく(B)をとる
S
u1
が、プレイヤー2が(S)をとる恐れがあるときは、
・
(S)をとらざるを得ない。
(6,6)
-したがって、プレイヤー2の局所混在戦略を考える。B u22 S
・b
Γb
B
(0,6)
11
4.1. 部分ゲーム完全均衡
4.1.3. 2段階完全情報ゲーム
例2 2段階完全情報2人ゲーム
-縮約ゲームの戦略形は下のようになる。
(S)
(B)
(S S)
4,8
6,6*
(S B)
4,8*
0,6
-均衡点は(B,SS), (S,SB)で、混合戦略を考え、 Γbにおいてプレイヤー
2がSをとる確率をqとすると、均衡点は、
である。これは、プレイヤー1の2の行動についての予測。
12
4.2. シュタッケルベルク均衡点
• シュタッケルベルク複占市場
-2段階完全情報2人ゲーム
-クールノー複占市場をもとにした定義は、
•
(1)プレイヤーを企業1と2とする。
(2)企業1と2は買い手から見て無差別な財を市場に提供している。
(3)財は無限に分割可能で、供給量は実数で表される。
(4)企業1,2の戦略を財の供給量とし、戦略の集合をそれぞれ
とする。ここで、M1,M2は適当な正の数で、戦略は有限の範囲にある。
(5)財の価格をpとし、市場の需要関数を次のようにおく。
(6)2つの企業の費用関数を次のようにおく。
•
(7)2つの企業は互いに話し合うことなく、供給量を決定する。
(8)第1段階で企業1がある量x1を供給し、第2段階で、企業2がそれを知ったうえで、ある量
x2を供給して、企業1と2の利得が定まり、ゲームは終了する。すなわち、2段階完全情報2人
ゲームである。
13
4.2. シュタッケルベルク均衡点
•
無限に選択肢があるが、数個の枝で代表させて図にすると、
利
得
x2
x2=0
x2
x2=M2
x2
x2=M2
x2=0
x2=0
x2=M2
P2
x1
x1=0
x1=M1
P1
14
4.2. シュタッケルベルク均衡点
•
シュタッケルベルク均衡点
-企業1が戦略x1をとったとき、企業2の最適反応戦略は
となる。
-
とすると、
となる。
-したがって、財の価格、企業1・2の利得はx1を用いて、
となる。
-企業1は利得を最大化させるように行動するので、
-よってナッシュ均衡点は
となる。
15
4.3. 完全均衡点の不完全性
4.3.1.チェーンストアパラドックス
例3.市場参入ゲーム
-大手のチェーンストアが、ある町に支店を持っていて、ある商品を独占
的に販売している。そこで、小売店が同じ商品を扱う事業を始めるかどう
か?
-チェーンストアは、小売店が同じ事業を始めたときに、協調的態度か、
攻撃的態度をとる。別の事業の時はそのまま。
v.s.
16
4.3. 完全均衡点の不完全性
4.3.1.チェーンストアパラドックス
例3.市場参入ゲーム
-展開形・戦略形は右図。
-部分ゲーム完全均衡点は
(参入する, 協調的行動をとる)
で、利得は(2, 2)。
-このほかにも
(参入しない, 攻撃的行動をとる)
という均衡点もある。
-これは不完全均衡点で「脅しの
戦略」になる。「もし君がその気な
ら、僕にも考えがあるんだよ。」
チ
ェ
ー
ン
ス
ト
ア
小
売
店
o
a
参入する
利得
(小,チ)
協調的
(2,2)
攻撃的
(0,0)
・
・
参入しない
(1,5)
協調的 攻撃的
参入する
2, 2
0, 0
参入しない 1, 5
1, 5
17
4.3. 完全均衡点の不完全性
4.3.1.チェーンストアパラドックス
例3.市場参入ゲーム
-もしn個の町があって、それぞれでチェーンストアが店を開いているとき、
次々と地元の小売店が、前の町の状況を知った上で、同じ事業に参入し
ようとしている。
-それぞれの町は部分ゲームになる。もし、それぞれの町で、脅しの戦略
の通知が不可能ならば、チェーンストアは協調的行動をとらざるを得なく
なる。
-したがって、チェーンストアは、最適に行動しようとすると、利得は¥が小
さくなるようにしか行動できない。部分ゲーム完全均衡点の概念は、
チェーンストアにとって、必ずしも、合理的とはいえない。
-現実には、通告の可能性に関わらず、どの町でも脅しの戦略を取って、
新規参入を阻止しようとする。つまり、この均衡点は現実にも合わない。こ
れをチェーンストア・パラドックスという。
-前の町の評判が次の町に伝わる。→繰り返しゲームとしての考察。
18
4.3. 完全均衡点の不完全性
4.3.2. 合理性の限界
例4. ギブ・アンド・テイク・ゲーム
-それぞれある技術を持つ2つの企業がプレイヤー。それを相手に教える
(C)、教えない(D)という二つの行動を持つ。
-各手番で、(C)か(D)を選ぶ。(D)を選んだら、そこで試合終了だよ。教え
たら、相手の手番に移る。
-プレイヤー1から始め、手番の数は8とし、第1の手番で終了したときの利
得は(1, 0)で、次の手番からは、教えないと、相手の利得は1減少し、自分
の利得は3増加する。
-展開形ゲームはこのようになる。
C
P2
P1
P2
P1
C
P2
P1
C
C
P2
P1
C
C
C
C
D
D
D
D
D
D
D
D
(1,0)
(0,3)
(3,2)
(2,5)
(5,4)
(4,7)
(7,6)
(6,9)
(9,8)
19
4.3. 完全均衡点の不完全性
4.3.2. 合理性の限界
例4. ギブ・アンド・テイク・ゲーム
P
P
P2
P1
C
D
(1,0)
2
1
C
D
(0,3)
C
D
(3,2)
P2
P1
C
D
(2,5)
C
D
(5,4)
P2
P1
C
D
(4,7)
C
D
(7,6)
C
(9,8)
D
(6,9)
-長い期間にわたって教え続ければ、お互いに利益がある。
-しかし、プレイヤー2は、第8の手番で教えない方が利益が大きい。なの
で、1は7番目でやめようとするが、そうすると2も黙ってはいない・・・。それ
を繰り返していくと、結局最初から教えない方がよい、となってしまう。
-したがって、このゲームの完全均衡点は、常に(D)をとることである。これ
は手番の数に関係ない。
-この結果は現実的なのか?普通は手番が多くなると、ギブ・アンド・テイク
の気持ちが働くのでは?
20
4.3. 完全均衡点の不完全性
4.3.2. 合理性の限界
例4. ギブ・アンド・テイク・ゲーム
-多くの場合、お互いに信頼し合っており、相手がプレイを継
続すると信じている。
-プレイヤーはそれぞれ、プレイが継続される(と思う)確率の
組(p, q)を持っているとき、プレイは継続されることになる。こ
の確率の組は、共通の確信(common belief)と呼ばれる。
-共通の確信は、ゲームの要素として明示されない要因に依
存していると考えられる。
-人々は、長い人生において、このような確信を育てていくこ
とに努力しているようである。
21