新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形

Download Report

Transcript 新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形

新ゲーム理論
第Ⅰ部 非協力ゲームの理論
第1章 非協力ゲームの戦略形
M1 藤井敬士
今回の内容
• 社会的ジレンマ
– 囚人のジレンマ
– 均衡利得,パレート最適
• 状況表現としてのゲーム
– 協力ゲームと非協力ゲーム
• 支配可能
• 共有地の悲劇
– 非協力的状況から協力関係の構築
• ゲームの理論の性格
囚人のジレンマ
2人で
・・・.
やりました
半年
2年
5年
10年
2年
5年
B
A
B
黙秘
共犯宣言
A,Bとも
に2年
Aに10年
Bに半年
共犯宣言 Aに半年
Bに10年
A,Bとも
に5年
黙秘
A
2人で
・・・.
やりました
B
A
黙秘
共犯宣言
黙秘
5,5
0,8
共犯宣言
8,0
2,2
(※利得がA,Bにとって共通であると仮定)
自分が最悪になるのを避けるために,結局2人とも証言する.
標準的囚人のジレンマ・ゲーム
C
D
C
D
S1, S2
W1, B2
B1,W2
Bi (best)  Si (second)  Ti (third)  Wi (worst), i  1,2
のとき,囚人のジレンマ型ゲームという
T1,T2
2S1  B1 W1, 2S1  B1 W1
のとき,特に標準的囚人のジレンマ型ゲームという
→最高と最低よりも2番目×2回の方がいい
最終的に両者の思考が
たどり着く
( D, D)を均衡点と呼び,
そのときの利得ベクト
ル(T1, T2 )を均衡利得と呼ぶ
支配戦略均衡
S1, S2
W1, B2
B1,W2
T1,T2
<
D
D
<
C
C
プレイヤー
1についてS1  B1, W1  T1 であるから,
プレイヤー
2がどんな戦略をとろう
とも戦略
Dをとるのが良い.
→戦略Dが戦略Cを支配している,もしくは戦略Cは戦略Dに支配されるという.
→プレイヤー2についても同様
→支配戦略があるときは支配戦略を用いる(支配戦略の原理)
(D,D)を支配戦略均衡点という.
均衡利得とパレート最適性
(S1, S2 )  (5,5)のように,誰かの利得
を増加させるためには
他の人の利得を減少さ
せなければならないと
き,
その利得ベクトルをパ
レート最適という.
厳密には,利得ベクト
ル x  ( x1,...,xn ), y  ( y1,...,yn )
において,
xi  yi
i  1,2,...,n
のとき,
xはyをパレート支配すると
いい,すべての
yに対して
これが成り立つ
xをパレート最適という
.
囚人のジレンマの閉塞的状況から脱出するためには,
非協力的状況から協力的状況への変革が必要
状況表現としてのゲーム
• ゲームとは
→ゲームには相手がいる
• 有限か無限か
• 誰がプレイヤーであるか
• ある主体は,ゲームの中にいるのか外にいるのか
(ex.「住民参加」という言葉を使うとき
– プレイヤーの集合が変動することもある
ゲームとは,プレイヤーを明らかにしたうえで,それら
のプレイヤーの間に成立している社会的状況のこと
非協力ゲームと協力ゲーム
戦略=各プレイヤーの持つ行動計画
1. 非協力ゲーム理論
プレイヤーの間には,各プレイヤーがとるべき戦略について,強制力
のある取り決めは存在しない.(より基本的といえる.)
2.
協力ゲーム理論
すべてのプレイヤーの間に,そのとるべき戦略についての合意が成り
立ち,それに基づいて戦略を選択し行動する.
※現実に拘束的合意が存在するかどうかは観察不可能なので,どちらの
前提に立つのか,という問題.
非協力ゲームの戦略形
利得関数
xi  fi (s1, s2 ,...,sn ), i  1,2,...,n
ここで,
si  Si i  1,2,...,n (Si : プレイヤー
iの戦略の集合)
※各プレイヤーの利得は,自分だけでなくほかのプレイヤーの
とる戦略の関数でもある.
非協力ゲームの戦略形
社会的状況を,非協力という前提で,プレイヤー.戦略,利得関数の
3つの組で表したもの.他に展開形という形式がある.(cf.3章)
非協力ゲームの戦略形
非協力有限2人ゲーム
プレイヤー1と2がい
るとき,それぞれの戦
略をi, jとし
(1  i  m,1  j  n),
それぞれの利得を
aij  f1 (i, j ), bij  f 2 (i, j )とするとき,
A  aij , B  bij を
 
プレイヤー1,2の利
得行列という.このよ
うな非協力ゲームを
戦略形非協力有限2人ゲームという.
プレイヤー2
プ
レ
イ
ヤ
ー
1
1
1  a11, b11

 
i  ai1 , bi1

 
m am1 , bm1

j
 a1 j , b1 j

 aij , bij

 am j, bm j

n
 a1n , b1n 
 
 ain , bin 

 
 am n, bm n
という双行列で表せる
ので双行列ゲームとも
いう.
 
非協力ゲームの戦略形
行動原理
プレイヤーは期待効用を最大にするように行動する
ルールとゲーム
ルール・・・ここまでに挙げた要素や前提のこと
ゲーム・・・1組のルールによって表現されたもの
ゲームとは,複数のプレイヤー間の状況をルールと
して表現したもの.このように状況を表現すること
がゲーム理論の第一の目的
以下での表記について
プレイヤーの集合
: N  {1,2,, n}
プレイヤー
iの戦略とその集合
: Si  {si }
戦略の組とその集合:
S  {s  (s1 , s2 ,, sn )}  S1  S2  Sn
プレイヤー
i以外のすべてのプレイ
ヤーの
とる戦略の組とその集
合:
si  (s1 , s2 ,, si 1 , si 1 ,, sn )
Si  S1  S2  Si 1  Si 1  Sn
si  Si
とかく
戦略の同等と支配
プレイヤー
iの戦略hと戦略kについて,
任意のsi  Siに対して
fi (s1, s2 ,, h,, sn )  fi (s1, s2 ,, k ,, sn )
が成り立つとき,プレ
イヤーiの
戦略hと戦略kは同等であるという.
 が  に変わると,戦略
hは戦略kを支配するという.
被支配戦略の除去と支配可能
「支配される戦略は用いない」という戦略の選択原理を被支配戦
略除去の原理という.下のようなゲームの例で説明する.
プレイヤー2
1
2
3
1
2,4
4,6
6,3
2
3,2
3,4
3,5
3
4,5
2,6
4,4
プレイヤー1
被支配戦略の除去と支配可能
1.
5. プレイヤー2にとって,戦略1は戦略2に支配されている.
3.
2.
4.
プレイヤー2は戦略2を選択する.
縮小したゲームを考えると,プレイヤー1の戦略2と3は戦略1
プレイヤー2の戦略1を除く
プレイヤー1の戦略2と3を除去する.
に支配されている.
プレイヤー2
1
2
3
1
2,4
4,6
6,3
2
3,2 <3,4
3,5
3
4,5
4,4
プレイヤー1
2,6
被支配戦略の除去と支配可能
このように(被支配戦略除去の原理に従って)
到達した戦略の組(1,2)を,一般にゲームの
均衡点という.
被支配戦略除去の原理による均衡点が存在
するとき,ゲームは支配可能であるという.
支配戦略均衡点
支配戦略・・・他のすべての戦略を支配する戦略
支配戦略均衡点・・・n人のすべてのプレイヤーが支配戦略を持
つとき,支配戦略が存在するときは支配戦略を用いる(支配
戦略の原理)ため,n個の支配戦略の組 s*  (s1* , s2* ,, sn* )
が残る.これを支配戦略均衡点という.
(※支配戦略の原理は,被支配戦略除去の原理の特別な場合
といえる)
弱支配戦略・・・
fi (s1, s2 ,, h,, sn )  fi (s1, s2 ,, k,, sn ) のとき,戦略kは
戦略hに弱支配されるという.
共有地の悲劇
共有地の悲劇
モデル化して考える(非協力ゲーム)
q1頭
農家1
q1頭
農家2
q2頭
農家3
q3頭
農家4
q4頭
牛1頭の価格=2,1軒につき3頭まで買える資金がある
農家iの収益xiは,xi  qi [16  (q1  q2  q3  q4 )]  2qi
全体の放牧数が増えると
生育が悪くなり利益効率が下がる
牛購入のコスト
共有地の悲劇
1.
2. 農家iにとって,戦略1は戦略2と3に支配されているので
3.
戦略3は戦略2を弱支配する.(他の農家が3頭ずつ出し
つまり,他の農家が2頭以下にやめる保証のない限りは
排除する.
たとき以外は戦略3の方が有利)
3頭放牧したほうが有利
i以外の農家の放牧牛の数の和
i
の
牛
数
0
1 13
2 24
3 33
1
12
22
30
2
11
20
27
3
10
18
24
4
9
16
21
5
8
14
18
6
7
12
15
7
6
10
12
8
5
8
9
9
4
6
6
共有地の悲劇
このゲームの弱支配均衡点は,s=(3,3,3,3)であり,この場合,均衡利得は
x=(6,6,6,6)である.
仮にr=(2,2,2,2)という戦略をとれば,y=(12,12,12,12)という利得ベクトル
が期待できる.
つまり,弱支配均衡点における均衡利得は共同合理的でない場合もある.
i以外の農家の放牧牛の数の和
i
の
牛
数
0
1 13
2 24
3 33
1
12
22
30
2
11
20
27
3
10
18
24
4
9
16
21
5
8
14
18
6
7
12
15
7
6
10
12
8
5
8
9
9
4
6
6
共有地の悲劇(問題改善)
非協力的状況では限界がある.
→各農家で相談して2頭ずつ放牧することに取り決め
る
→共同事業を行い,4軒をひとつの農家とみなす
収益x  q(16  q)  2qだから,
q  7のとき利得は最大値
49
→4軒では割り切れないので貨幣のようなものを導入
する
非協力的状況からいかに協力関係を構築する
かということが問題解決の重要な点になっている
ゲーム理論の性格
• 形式合理性(思考と行動の論理的整合性)を前提と
している
– 完全でない場合もあり,限定合理性を前提とすることもあ
る
– 合理性と言うとき,効用を最大化するという目的合理性と
いう意味も持つ場合が多い
– すべてのプレイヤーに共通な合理性の基準というものが
あるのか?
ゲーム理論の役割(目的)は,分析することである.その上
で問題解決のための思考の枠組みを提供する.(必ずしも
すべての人を満足させる案を出すことだけではない)