ナッシュ均衡点

Transcript ナッシュ均衡点

新ゲーム理論
第Ⅰ部非協力ゲームの理論
第2章戦略形ゲームのナッシュ均衡
M1 北川直樹
内容
ナッシュ均衡点
ミニマックス均衡点
寡占市場の均衡
混合戦略による均衡点
1.
2.
3.
4.
•
•
混合戦略
混合戦略による均衡点
5. 非協力n人ゲーム
6. 非協力ゲーム理論の性格
1. ナッシュ均衡点の性格
2. ナッシュ均衡理論の性格
内容
1. ナッシュ均衡点
2. ミニマックス均衡点
3. 寡占市場の均衡
4. 混合戦略による均衡点
•
•
混合戦略
混合戦略による均衡点
5. 非協力n人ゲーム
6. 非協力ゲーム理論の性格
1. ナッシュ均衡点の性格
2. ナッシュ均衡理論の性格
ナッシュ均衡点
例１）非協力2人ゲームを考える
＜
4,4
4,3
＜
3,6
＜
2,5
5,4
5,5
＜
＜
＜
＜
0,3
0,9
＜
戦略Ⅲ
＜
＜
戦略Ⅱ
8,8
＜
戦略Ⅰ
＜
A
B 戦略Ⅰ 戦略Ⅱ 戦略Ⅲ
このゲームでは、2人のプレイヤーの持つ戦略間に
支配関係がない．
ナッシュ均衡点
• 各プレーヤーは、自分が取った戦略に対する相手
の反応を考える
A
• プレイヤーAの戦略：ⅰ
• プレーヤーBの戦略：ｊ
B
戦略Ⅰ 戦略Ⅱ 戦略Ⅲ
戦略Ⅰ
8,8
0,9
5,4
戦略Ⅱ
0,3
5,5
4,4
戦略Ⅲ
2,5
4,3
3,6
ナッシュ均衡点
• プレイヤーＡの考え
• プレイヤーＢの考え
– ⅰ＝１のとき
– ｊ＝１のとき
• max(8,9,4)＝9、ｊ＝2
– ⅰ＝2のとき
• max(8,0,2)＝8、 ⅰ＝1
– ｊ＝2のとき
• max(3,5,4)＝5、ｊ＝2
– ⅰ＝3のとき
• max(0,5,4)＝5、 ⅰ＝2
– ｊ＝3のとき
• max(5,3,6)＝6、ｊ＝3
A
• max(5,4,3)＝5、 ⅰ＝1
B 戦略Ⅰ 戦略Ⅱ 戦略Ⅲ
戦略Ⅰ
8,8
0,9
5,4
戦略Ⅱ
0,3
5,5
4,4
戦略Ⅲ
2,5
4,3
3,6
均衡点
ナッシュ均衡点
• 最適反応戦略の均衡点
– プレイヤーＡが戦略Ⅱ、プレーヤーＢも戦略Ⅱの
とき、どちらのプレーヤーも自分の戦略を変えて
も利得は増加しない。
A
均衡点／ナッシュ均衡点
（ⅰ, ｊ）＝（2 , 2）
B
戦略Ⅰ 戦略Ⅱ 戦略Ⅲ
戦略Ⅰ
8,8
0,9
5,4
戦略Ⅱ
0,3
5,5
4,4
戦略Ⅲ
2,5
4,3
3,6
ナッシュ均衡点
• 最適反応原理
– 相手がある戦略をとったときに、その戦略のもと
で自分の利得を最大にするように行動する
• 最適反応戦略の均衡点（ナッシュ均衡点）
– 2人のとる戦略が互いに相手の戦略の最適反応
戦略になっている
ナッシュ均衡点
• 非協力2人ゲームの戦略形
プレイヤー 2人 : i  {1,2}
プレイヤー iの戦略とその集合 : Si  {si }
戦略の組とその集合：
S  S1  S2  {s  (s1, s2：) s1  S1, s2  S2}
プレーヤーiの持つ利得関数
xi  fi (s1, s2 ), i  1,2
ナッシュ均衡点
• 次の条件をみたすＳの点を均衡点という

1


1


)  max f (s

, s )　: s S

f1 (s , s2 )  max f1 (s1 , s2 ) : s1  S1
f 2 (s , s2


1
2

s  (s , s2 )

1
2
2
2
ナッシュ均衡点／均衡点
前回の「支配される戦略は使わない」という戦略原理によって到達
した均衡点や支配戦略均衡点は、ナッシュ均衡点の特別な場合
ナッシュ均衡点
• 最適反応戦略の集合
・プレイヤー１の戦略 s1に対する
プレーヤー2の最適反応戦略の集合R2 (s1 )
R2 (s1 )  s 2 S2 , f 2 (s1 , s2 )  max f 2 (s1 , s2 )
s 2 S2


・プレイヤー 2の戦略s2に対する
プレーヤー1の最適反応戦略の集合R1 (s2 )
R1 (s2 )  s1 S1 , f1 (s1 , s2 )  max f1 (s1 , s2 )
s1S1


ナッシュ均衡点
• 最適反応集合
• プレーヤー１の最適反応集合
– プレイヤー2の戦略ｓ2とそれに対するプレーヤー1の最適
反応戦略の組の集合（D1）
• プレイヤー２の最適反応集合
– プレイヤー１の戦略ｓ1とそれに対するプレーヤー２の最適
反応戦略の組の集合(D2)
D1  s  (s1, s2 ) : s2  S2 , s1  R1 (s2 )
D2  s  (s1, s2 ) : s1  S1, s2  R2 (s1 )
ナッシュ均衡点
• ナッシュ均衡点の集合（D）
D  D1  D2
• 例１の場合
 1,1 2,2 1,3 
D   1,2 2,2 3,3 
D  D  D   2,2 
D1 
2
1
2
A
B
戦略Ⅰ 戦略Ⅱ 戦略Ⅲ
戦略Ⅰ
8,8
0,9
5,4
戦略Ⅱ
0,3
5,5
4,4
戦略Ⅲ
2,5
4,3
3,6
内容
1. ナッシュ均衡点
2. ミニマックス均衡点
3. 寡占市場の均衡
4. 混合戦略による均衡点
•
•
混合戦略
混合戦略による均衡点
5. 非協力n人ゲーム
6. 非協力ゲーム理論の性格
1. ナッシュ均衡点の性格
2. ナッシュ均衡理論の性格
ミニマックス均衡点
• 例２）ゼロ和2人ゲーム（立地ゲーム）
同じ製品を販売する２つの会社A、Bがある
全体の需要を100とすると各町の需要は、20、40、20、20である。
ともに、ある道路に沿って等間隔に位置している４つの町の中の１つに、
・・• A社は、各町について、もしA社がB社よりその町に近けれ
新しい店を出したいと思っている。
ばその町の需要の80%、B社より遠ければ40％、同じ距離な
らば60％を得ることができる
A社
20人
40人
プレイヤー
B社
20人
20人
需要
1町
2町
3町
4町
戦略
ミニマックス均衡点
• A社がⅰ町に、B社がｊ町に出店したときのＡ社の利
得をaij、Ｂ社の利得をbijとすると
bij =100－ aij
• 企業Bの利得をbij ´＝－ aijと置き換えると（ゼロ和ゲーム）、
企業Ａの利得行列をＡ＝[aij]とすると利得行列Ｇは
60,
72,
G  aij  
64,

56,
 
48,
60,
56,
52,
56,
64,
60,
48,
64

68
72

60
ミニマックス均衡点
非協力ゼロ和2人ゲームでは
• Ａ社は、利得aijを最大にしようと行動する
– 最大化プレイヤー
– 最大化戦略
• Ｂ社は、利得aijを最小にしようと行動する
– 最小化プレイヤー
– 最小化戦略
ミニマックス均衡点
• マックスミニ戦略
• Ａの戦略ⅰに対抗するＢの最小化戦略 j
i  1に対しては , min(60,48,56,64)  48, j  2
i  2に対しては , min(72,60,64,68)  60, j  2
i  3に対しては , min(64,56,60,72)  56, j  2
i  4に対しては , min(56,52,48,60)  48, j  3
• Bが最適反応戦略である最小化戦略をとるとすると
Aは、
max(48,60,56,48)  maxmin ai j  60
i
j
ミニマックス均衡点
• ミニマックス戦略
• Bの戦略 j に対抗するAの最小化戦略 i
j  1に対しては , max(60,72,64,56)  72, i  2
j  2に対しては , max(48,60,56,52)  60, i  2
j  3に対しては , max(56,64,60,48)  64, i  2
j  4に対しては , max(64,68,72,60)  72, i  3
• Aが最適反応戦略である最大化戦略をとるとすると
Bは、
min(72,60,64,72)  min maxai j  60
j
i
ミニマックス均衡点
• 最大化プレイヤーＡがマックスミニ戦略（i=2）、
最小化プレイヤーＢがミニマックス戦略（j=2）のとき
maxmin ai j  min maxai j  60
i
j
j
i
均衡点：（ⅰ, ｊ）＝（2 , 2）
ミニマックス均衡点
※相手のとる戦略に対して最適反応戦略なのでこのゲームのナッシュ均衡点
ミニマックス均衡点
• ミニマックス原理
– 最大化プレイヤーがマックスミニ戦略ととり、最小化
プレイヤーがミニマックス戦略をとる行動原理。
• ミニマックス戦略
– マックスミニ戦略とミニマックス戦略をまとめて呼ぶ。
• ミニマックス均衡点
– マックスミニ戦略とミニマックス戦略との組。
• 問題点
– 非ゼロ和ゲームの場合、ミニマックス原理は合理的
な行動原理ではない。
内容
1. ナッシュ均衡点
2. ミニマックス均衡点
3. 寡占市場の均衡
4. 混合戦略による均衡点
•
•
混合戦略
混合戦略による均衡点
5. 非協力n人ゲーム
6. 非協力ゲーム理論の性格
1. ナッシュ均衡点の性格
2. ナッシュ均衡理論の性格
寡占市場の均衡
例３）クールノーの複占市場
1. ２つの企業をプレイヤー１、プレイヤー２とする。
2. 両者は、無差別な財を市場に供給している。
3. プレイヤー１の戦略Ｓ１、供給量ｘ1
プレイヤー２の戦略Ｓ２、供給量ｘ２
S1  x1 : 0 ≦ x1 ≦ M1
S2  x2 : 0 ≦ x2 ≦ M 2 
M1、 M：適当な正の数
2
※今までと違うのは、戦略が連続量ってこと
寡占市場の均衡
例３）クールノーの複占市場
4. 財の価格をpとし、x1、x2で表すと
p  maxa  bx1  x2 , 0 , a＞0, b＞0
5. ２つの企業の費用関数をＣ1、Ｃ2とすると
C1  c1 x1, ただし a＞c1＞0
C2  c1x1, ただし a＞c2＞0
6. ２つの企業の利得関数をy1,y2とすると、p＞0のとき
y1  px1  c1x1  a  c1 x1  bx1 x1  x2 
y2  px2  c2 x2  a  c2 x2  bx2 x1  x2 
総売上
総費用
寡占市場の均衡
• 相手の供給量に対する最適反応戦略を求める
y1
 a  c1  bx1  bx1  x2   0
x1
ここを探す感じ
 2 y1
 b  b  2b＜0
2
x1
– 企業1の企業2の戦略に対する最適反応戦略


x1  R1 x2   max a  c1  bx2  / 2b, 0
– 企業2の企業1の戦略に対する最適反応戦略


x2  R2 x1   max a  c2  bx1  / 2b, 0
寡占市場の均衡
x2
a  c1
b
D1
a  c2
2b
均衡点
x2
D2
x1 a  c1
2b
a  c2
b
x1
寡占市場の均衡
a  24, b  1, c1  3, c2  6, M1  M 2  30のとき
・反応曲線の交点 xは
x1  a  2c1  c2  / 3b  8
x2  a  2c2  c1  / 3b  5


x  x1 , x2  8, 5
・均衡利得 yは
y  64, 25
・財の価格 pは
p  11
クールノー／ナッシュ均衡点
寡占市場の均衡
• クールノー均衡点
– 企業が交互に自分の戦略を市場に提示し、相手
が提示した戦略に対する次々と最適反応戦略を
提示し、どちらも戦略を変えようとしない戦略の組
– 次々と戦略を提示する過程をプレイヤーが頭の
中で考え、それぞれの均衡した戦略をとると考え
ると、到達する均衡点はナッシュ均衡点
– クールノー型複占市場の均衡点は、結果的に
ナッシュ均衡点に一致する。
内容
1. ナッシュ均衡点
2. ミニマックス均衡点
3. 寡占市場の均衡
4. 混合戦略による均衡点
•
•
混合戦略
混合戦略による均衡点
5. 非協力n人ゲーム
6. 非協力ゲーム理論の性格
1. ナッシュ均衡点の性格
2. ナッシュ均衡理論の性格
混合戦略
例4）２つの企業の販売戦略
• 利得行列
プレイヤー２
プレイヤー１
1
2
1
2
8, 0
0, 4
0, 6
6, 0
• プレイヤー１の最適反応戦略
D1 
 1, 1,
2, 2 
• プレイヤー２の最適反応戦略
D2 
 1, 2, 2, 1 
最適反応戦略の共通部分がない
混合戦略
• くじ引きで確率的に決断する。
• プレイヤー１が戦略１をとる確率： p1
戦略２をとる確率： p2
• プレイヤー１の混合戦略： p=(p1, p2)
• 本来の戦略１、２を混合戦略と区別して純戦略
と呼ぶ
混合戦略
• プレーヤー１の期待値Ｅ1
– プレイヤー１が混合戦略p(p1,p2) 、
プレイヤー２が純戦略１か２のとき
E1  p,1  8  p1  0  p2  8 p1
E1  p,2  0  p1  6  p2  6 p2  61  p1 
– プレイヤー１が混合戦略p(p1,p2)、
プレイヤー２も混合戦略q(q1,q2)のとき
E1  p, q  E1  p,1q1  E1  p,2q2
混合戦略
• プレーヤー2の期待値Ｅ2
– プレイヤー2が混合戦略q(q1,q2) 、
プレイヤー1が純戦略１か２のとき
E2 1, q  0  q1  6  q2  61  q1 
E2 2, q  4  q1  0  q2  4q1
– プレイヤー2が混合戦略q(q1,q2) 、
プレイヤー1も混合戦略p(p1,p2)のとき
E2  p, q  E2 1, q p1  E2 2, q p2
混合戦略
• 利得関数Ｅ1(p,q)、E2(p,q)をもつ新ゲームと定義
⇒前のゲームの混合拡大ゲーム
• 混合戦略を考慮した混合拡大ゲームの利得行列
q1
p1
1
4/7
3/7
2/7
0
1
8.0 , 0.0 4.6 , 2.6 3.4 , 3.4 2.3 , 4.3 0.0 , 6.0
3/5
4.8 , 1.6 3.8 , 2.5 3.4 , 2.7 3.1 , 3.0 2.4 , 3.6
2/5
3.2 , 2.4 3.4 , 2.4 3.4 , 2.4 3.5 , 2.4 3.6 , 2.4
1/5
1.6 , 3.2 3.0 , 2.3 3.4 , 2.1 3.9 , 1.8 4.8 , 1.2
0
0.0 , 4.0 2.6 , 2.3 3.4 . 1.7 4.3 , 1.1 6.0 , 0.0
混合戦略
• 最適混合戦略の組
p   p1, p2   2 / 5 , 3 / 5
q  q1, q2   3 / 7 , 4 / 7
• 均衡利得
（3.4 , 2.4）
1
4/7
3/7
2/7
0
1
8.0 , 0.0
4.6 , 2.6
3.4 , 3.4
2.3 , 4.3
0.0 , 6.0
3/5
4.8 , 1.6
3.8 , 2.5
3.4 , 2.7
3.1 , 3.0
2.4 , 3.6
2/5
3.2 , 2.4
3.4 , 2.4
3.4 , 2.4
3.5 , 2.4
3.6 , 2.4
1/5
1.6 , 3.2
3.0 , 2.3
3.4 , 2.1
3.9 , 1.8
4.8 , 1.2
0
0.0 , 4.0
2.6 , 2.3
3.4 . 1.7
4.3 , 1.1
6.0 , 0.0
その後….
企業１の社長は、2/5の確率で純戦略１、3/5の確率で
純戦略２、が出るクジを引いて決断し、
企業2の社長は、3/7の確率で純戦略１、4/7の確率で
純戦略２、が出るクジを引いて決断した。
大事な決定をクジで決めることは、奇妙な方法にみえ
るかもしれないが、
これ以外のいかなる方法も、社長にとっても、スタッフ
にとっても十分に納得できなかったのである。
めでたし、めでたし
混合戦略による均衡点
１）プレイヤー２人：
1　,2
２）プレイヤー 1,2の純戦略
i  1,, m, j  1,, n
３）利得行列は、双行列G  ai j , bij で表される。


４）プレイヤー 1,2の混合戦略の集合をS1  p, S2  qとすると
p   p1,, pm , q  q1,, qn 
pi ≧0, i  1,, m, p1   pm  1
q j ≧0, j  1,, n, q1   qn  1
混合戦略の均衡点
５）混合戦略の組の集合Sは
S  S1  S2  s  ( p, q) : p  S1 , q  S2 
６）プレイヤー iの利得関数は、混合戦略の関数として
x1  f1  p, q  pAqT
x2  f 2  p, q  pBqT
ただし、 A  aij , B  bij
 
 
７） s   p, q が以下の条件をみたすとき、
s をこのゲームのナッシュ均衡点という
f1  p, q   max f1  p, q , p  S1 
f 2  p, q   max f 2  p, q, p  S2 
内容
ナッシュ均衡点
ミニマックス均衡点
寡占市場の均衡
混合戦略による均衡点
1.
2.
3.
4.
•
•
混合戦略
混合戦略による均衡点
5. 非協力n人ゲーム
6. 非協力ゲーム理論の性格
1. ナッシュ均衡点の性格
2. ナッシュ均衡理論の性格
非協力ｎ人ゲーム
•
無限の戦略をもつ非協力ゲーム
１）プレイヤーを i  1,2,, n　nは有限の正の整数とする。
２）プレイヤー iのもつ純戦略の集合Sは
S  S1  S2  Sn  s  s1, s2 ,, sn 
３）プレイヤー iにとって、自分以外のプレイヤーがとる
戦略の組を si ,その集合をSiとする。
４）プレイヤー iのもつ利得関数をfi s とする。
４）ナッシュ均衡点 s は
fi s   max fi si , si  : si  Si 
非協力ｎ人ゲーム
• 有限の戦略をもつ非協力ゲーム
１）プレイヤーを i  1,2,, n　nは有限の正の整数とする。
２）プレイヤー iのもつ純戦略の集合Sは、
S  S1  S2  Sn  s  s1, s2 ,, sn 
３） hiを純戦略j,, kのときのプレイヤー iの利得とすると、
混合戦略pのときのプレイヤー iのもつ利得関数fi s は、
fi s    hi  j,, k p1 j  pnk
j 1
k 1
４）ミニマックス均衡
点( p, q)の成立条件は、
max min pAqT  min max pAqT
pS1 qS2
pS1 qS2
内容
ナッシュ均衡点
ミニマックス均衡点
寡占市場の均衡
混合戦略による均衡点
1.
2.
3.
4.
•
•
混合戦略
混合戦略による均衡点
5. 非協力n人ゲーム
6. 非協力ゲーム理論の性格
1. ナッシュ均衡点の性格
2. ナッシュ均衡理論の性格
ナッシュ均衡点の性質
• 例６）面会ゲーム
２人がとることのできる行動は、以下の２つです。
となる田舎まちに、仲の良いカップルがいました。
２人は、今すぐに会いたいです。
すると、突然の大地震が起こり、2人は離ればなれになってしまいました。
（a）相手が来るのをその場で待つ
通信網も途切れてしまい、連絡が取れません。
（b）こちらから相手のいるところに出掛ける
会いたいよ
ジョン！
会いたいよ
ステファニー！
ナッシュ均衡の性質
• このゲームの利得行列は、
a 待つ
b 出掛ける
a 待つ
0,0
10 , 6
b 出掛ける
6 , 10
ｰ6 , －6
ナッシュ均衡の性質
• このゲームの均衡点  p, q  は
 p, q   1, 0, 0, 1  a, b
 p, q   8 / 11, 3 / 11, 8 / 11, 3 / 11
 p, q   0, 1, 1, 0  b, a
ここで、（a,b）と(b,a)は、純戦略による均衡点である。
• それぞれの均衡利得は、
10, 6
30 /11, 30 /11
6, 10
a 待つ
b 出掛ける
a 待つ
0,0
10 , 6
b 出掛ける
6 , 10
－6 , －6
ナッシュ均衡の性質
1. 最適反応戦略とにミニマックス戦略の関係
1. ミニマックス戦略
• 純戦略のみの場合
•
•
•
２人とも、その場で待つ、を選択する
そのときの利得の組 : (0, 0)
混合戦略の場合
•
•
ミニマックス戦略： p=q=(6/11, 5/11)
そのときの利得の組 : (30/11, 30/11)
• ３つの均衡利得は、いずれも２人がともにミニマックス原理
に従って行動したときに得られる利得の30/11以上
• 一般に、マックスミニ利得は均衡利得の下限になる。
ナッシュ均衡の性格
2. 戦略の交換性と最適性の不成立
– 均衡戦略の交換可能
•
•
２つの均衡戦略を交換してできる戦略の組も、同じく
均衡点になるもの
非ゼロ和２人ゲームでは、複数個の均衡点の均衡戦
略は必ずしも交換可能ではないが、ゼロ和２人ゲーム
では、常に均衡戦略は交換可能である。
ナッシュ均衡点の性格
3. 複数のナッシュ均衡点の意味
1. 起こりうる可能性
•
純戦略で表現される状態と混合戦略で表現される状態が存在
2. 予備知識がある場合
•
•
「彼は、いつも行動的な人である」などの、経験の積み重ねによる
情報の累積によって、均衡点が限定される。
ゲームで表現できるのは現実の一部であり、他の情報を補うべき。
3. 通報可能な場合
•
•
彼が戦略を通報することができれば、彼女の戦略は決定する
均衡点は、外からの強制力なしで自立的な安定性をもっている。
4. 予備知識もなく、通報の可能性もない場合
•
ゲームとして表現された情報のみでは、確定的な行動ができない
ため、混合戦略を基に行動の指針を決定する。
ナッシュ均衡点の性格
4. 状況のより深い理解を与えるための均衡点
–
それぞれの均衡点の意味を考えることによって、ゲー
ムとして表現することのできなかった背後にある状況に
対して深い理解をもつことが可能となる。
ナッシュ均衡理論の性格
例７）友情原理
A
B
A
8,8
4,8
B
8,4
4,4
• プレイヤー１、２にとって、戦略Ａ、Bは同等の戦略
• しかし、得られる利得は異なる
均衡点（Ａ , Ａ）：利得（８ , ８）
均衡点（B , B）：利得（4 , 4）
ナッシュ均衡理論の性格
• 友情ルール
– ある与えられた相手の戦略に対して、自分の利得が同じ
になる戦略が複数個あるときには、相手の利得が大きく
なる戦略を選択する。
• 例７）において、友情ルールが成立すると利得は
（8 , 8）になる。
• 社会がある程度成熟してくると、特別な会話なくとも
友情ルールのような“慣習”が成り立ってくる。
らしい…...
ほんとかよー！?
ナッシュ均衡論の性格
• 筆者の熱き思い
– ゲーム理論を学ぶ意義とは、
• ある状況のもとでのプレイヤー相互依存関係を明確に
認識し、起こりうる事態を明らかにすることによって、よ
り深く社会を認識することである。
• そして、個々のプレイヤーにとっては、いかに行動する
かを学びとることであり、政策立案者にとっては、いか
なるルールを設計すべきかを学びとることである。

ナッシュ均衡点

Transcript ナッシュ均衡点

Directory