Transcript 2 - 经济学院
第四讲 纳什均衡
上海财经大学 经济学院
1
1
第三讲 纳什均衡
• 1. 纳什均衡
• 2. 纳什均衡:信念的协调
• 3. 古诺均衡
• 4. 对称博弈
2
1. 纳什均衡
• 投资博弈
– 每个人同时决定 “投资10元” 或 “不投资”
• 如果选择“不投资”:支付为0
• 如果选择“投资”:
– 当超过90%的人选择了也“投资”,那么会得到5
元的利润(即得到本利15元);
– 当选择“投资”的人数低于90%,那么就会失去10
元的本金,即亏10元。
3
投资博弈:N=2
• 参与者: 甲和乙
• 策略: 投资或不投资
• 支付矩阵:
乙
投资
甲
投资
不投资
(5, 5)
不投资
(-10,
0)
(0, -10) (0, 0)
4
投资博弈:N=2
• 策略组合 (投资,投资)
– 每个人的选择都是对他人选择的最优反应
– 给定别人的策略选择,没有一方愿意做出改变
• 策略组合 (不投资,不投资)也具有这个性质
– 双方协商一致后,没有背叛激励
乙
投资
甲
投资
不投资
(5, 5)
(0, -10)
不投资
(-10,
0)
(0, 0)
5
投资博弈:N=2
• 称策略组合 (投资,投资)、 (不投资,不投资)
为纳什均衡
– 没有单方偏离激励,具有自我实施性质
乙
投资
甲
投资
不投资
(5, 5)
(0, -10)
不投资
(-10,
0)
(0, 0)
6
定义:纳什均衡
• 策略组合 s*=(s*1, s*2)是纳什均衡,如果
– 参与者的策略互为最优反应
• u1 (s*1, s*2) ≥ u1 (s1, s*2)
任意 s1 S1
– s*1=b1(s*2)
• u2 (s*1, s*2) ≥ u2 (s*1, s2)
任意 s2 S2
– s*2=b2(s*1)
7
1.2 纳什均衡与占优
• 占优策略组合:(坦白,坦白)
–是纳什均衡
• 例:囚徒困境
乙
坦白
甲
沉默
坦白
(-10,-10)
(0, -15)
沉默
(-15,0)
(-5,-5)
8
1.2. 纳什均衡与占优
• 重复剔除严格劣策略得到的唯一策略组合: (X,X)
– 是 纳什均衡
• 例:成绩博弈:互利者 VS 自利者
别人(自利)
自己(互利)
X
Y
X
(2.7,2.7)
(2, 2)
Y
(-1, 4)
(3, 3)
2r
1r
9
1.2. 纳什均衡与占优
• 例:成绩博弈:互利者 VS 互利者
• 纳什均衡
别人(自利)
X
自己(互利)
X
(2.7,
Y
(-1,
Y
)
(2,
)
)
(3,
)
10
1.2 纳什均衡性质
• 自我实施性
– 没有单方偏离激励
• 信念与行动一致
– 每个人对他人策略选择有着正确的信念
参与者 2
参与者 1
X
Y
Z
L
1, 0
2, 2
0, 1
F
0, 3
0, 1
2, 1
T
2, 1
0, 0
1, 2
11
2. 信念的协调
• 例:投资博弈
乙
投资
甲
投资
不投资
(5, 5)
不投资
(-10,
0)
(0, -10) ( 0, 0)
12
2. 信念的协调
• 对称的共赢协调博弈(Ranked Coordination)
– 投资博弈 :
– 银行挤兑博弈:
– ……
c=投资, d=不投资
c=不提款, d=提款
参与者 2
参与者 1
c
d
c
(5, 5)
(0, -10)
d
(-10, 0)
(0, 0)
13
2. 信念的协调
• 非对称共赢协调问题
– 性别战(约会博弈): c=足球, d=音乐会
– 标准竞争
乙
c
甲
c
d
(5, 2)
(0, 0)
d
(0, 0)
(2, 5)
14
案例:56k调制解调器技术标准竞争
• 90年代中期,调制解调器主导标准:V.34,28.8kbs/秒
• 1996年Rockwell、US Robotics、朗讯和摩托罗拉相继向市
场投放下一代调制解调器:56kbs/秒,但分为两大阵营
– Rockwell、朗讯、摩托罗拉: K56Flex标准
– US Robotics: X2标准
– 双方互不兼容,并拒绝了国际电讯联盟的标准化协调
US Robotics
K56Flex
Rockwell
K56Flex
(10,2)
X2
(0, 0)
X2
(0,
0)
(2, 10)
15
案例:56k调制解调器技术标准竞争
• 洛克威尔,US Robotics 的56k调制解调器
– 3Com公司(Rockwell的支持者)收购 US Robotics,打破
僵局
– 1997年,国际通讯联盟推出 V90标准,解决两者之间
的差异,市场迅速扩大。
16
2. 信念的协调
• 冲突协调
– 斗鸡博弈(Chicken)
– 消耗战 (War of Attrition)
乙
c
甲
c
d
(0, 0)
(2, -1)
d
(-1,
2)
(-10,-10)
17
例:分饼博弈
• 给定有100元钱,由两个人分享。规则要求每个人同时提
出自己想要的份额si,如果s1 + s2 100,那么按各自索要的
份额分配,如果, s1 + s2 >100,那么每个人都得到0。请求
解纳什均衡。
• 参与者:
– I={1,2}
• 策略集
– si=[0, 100], i=1,2
– s=(s1, s2)
• 支付函数
–
si if s1 +s2 100
ui ( s)
0 if s1 +s 2 >100
i 1, 2
18
18
例:分饼博弈
• 参与者 i 的最优反应函数
– 给定策略组合(si sj ), 参与者的 i 支付
si if s1 +s 2 100
ui ( s )
0 if s1 +s 2 >100
– Max
ui(si,sj)
– Bi (sj)=
100-sj
如果 0 sj <100
[0, 100]
如果 sj =100
19
例:分饼博弈
• 参与者i的最优反应函数
– Bi (sj)=
• NE
100-sj
如果 0 sj <100
[0, 100] 如果 sj =100
– s*1 B1(s*2); s*2 b2(s*1)
s2
B1 (s2)
– (x, 100- x) 其中 x[0,100]; 100
– (100, 100)
70
• 协调
– 文化:公平价值观
– 聚点均衡: (50,50)
B2 (s1)
30
100
s1
20
分饼博弈:Nash谈判解
• 双边谈判问题
– 总剩余: R
– 可行分配集 F={(x1,x2) : x1,0, x2 0, x1+x2R}
– 保留支付 : (r1, r2)
• 威胁点
• 纳什谈判解 (Nash, 1950)
–
Max
(x1,x2) F
(x1-r1)·(x2-r2)
• v1 = r1+ (R - r1 - r2) /2
• v2= r2+ (R - r1 -r2) /2
21
讨论
• 如果你是甲,会如何选择
• 纳什均衡: (A, X)
• 批评一:为什么不是(C,Z)
甲
X
乙
Y
Z
A
2, 2
3, 1
0, 2
B
1, 3
2, 2
3, 2
C
2, 0
2, 3
2, 2
22
讨论
• 乙有占优策略:X
• 所以甲最优反应是C。
• 但是事实上,许多人会选择A,为什么?
乙
甲
X
Z
A
9, 10
8, 9.9
C
10, 10
-1000, 9.9
23
小结:纳什均衡
• 纳什均衡
– 没有单方偏离激励
– 一致信念:每个人对他人策略选择有着正确的信念
• 纳什均衡的推理
– 方法一:按“没有单方偏离激励”标准检验每个策略
组合
– 方法二:找出每个参与者的最优反应函数 bi(s- i) ,然后
求解方程组:
• s*i = bi(s*-i) i=1,2,3,…,N
24