2 - 经济学院 | slideum.com

2 - 经济学院

Transcript 2 - 经济学院

第四讲纳什均衡
上海财经大学经济学院
1
1
第三讲纳什均衡
• 1. 纳什均衡
• 2. 纳什均衡：信念的协调
• 3. 古诺均衡
• 4. 对称博弈
2
1. 纳什均衡
• 投资博弈
– 每个人同时决定 “投资10元” 或 “不投资”
• 如果选择“不投资”：支付为0
• 如果选择“投资”：
– 当超过90%的人选择了也“投资”，那么会得到5
元的利润（即得到本利15元）；
– 当选择“投资”的人数低于90%，那么就会失去10
元的本金，即亏10元。
3
投资博弈：N=2
• 参与者：甲和乙
• 策略：投资或不投资
• 支付矩阵：
乙
投资
甲
投资
不投资
（5， 5)
不投资
（-10,
0）
（0, -10）（0， 0）
4
投资博弈：N=2
• 策略组合 (投资，投资）
– 每个人的选择都是对他人选择的最优反应
– 给定别人的策略选择，没有一方愿意做出改变
• 策略组合 (不投资，不投资）也具有这个性质
– 双方协商一致后，没有背叛激励
乙
投资
甲
投资
不投资
（5， 5)
（0, -10）
不投资
（-10,
0）
（0， 0）
5
投资博弈：N=2
• 称策略组合 (投资，投资）、 (不投资，不投资）
为纳什均衡
– 没有单方偏离激励，具有自我实施性质
乙
投资
甲
投资
不投资
（5， 5)
（0, -10）
不投资
（-10,
0）
（0， 0）
6
定义：纳什均衡
• 策略组合 s*=(s*1, s*2)是纳什均衡，如果
– 参与者的策略互为最优反应
• u1 (s*1, s*2) ≥ u1 (s1, s*2)
任意 s1 S1
– s*1=b1(s*2)
• u2 (s*1, s*2) ≥ u2 (s*1, s2)
任意 s2 S2
– s*2=b2(s*1)
7
1.2 纳什均衡与占优
• 占优策略组合：（坦白，坦白）
–是纳什均衡
• 例：囚徒困境
乙
坦白
甲
沉默
坦白
(-10，-10)
(0, -15)
沉默
(-15，0)
（-5，-5）
8
1.2. 纳什均衡与占优
• 重复剔除严格劣策略得到的唯一策略组合：（X，X）
– 是纳什均衡
• 例：成绩博弈：互利者 VS 自利者
别人（自利）
自己(互利)
X
Y
X
(2.7，2.7)
（2， 2）
Y
（-1， 4）
（3， 3）
2r
1r
9
1.2. 纳什均衡与占优
• 例：成绩博弈：互利者 VS 互利者
• 纳什均衡
别人（自利）
X
自己(互利)
X
(2.7，
Y
（-1，
Y
)
（2，
）
）
（3，
）
10
1.2 纳什均衡性质
• 自我实施性
– 没有单方偏离激励
• 信念与行动一致
– 每个人对他人策略选择有着正确的信念
参与者 2
参与者 1
X
Y
Z
L
1, 0
2, 2
0, 1
F
0, 3
0, 1
2, 1
T
2, 1
0, 0
1, 2
11
2. 信念的协调
• 例：投资博弈
乙
投资
甲
投资
不投资
（5， 5)
不投资
（-10,
0）
（0, -10）（ 0， 0）
12
2. 信念的协调
• 对称的共赢协调博弈（Ranked Coordination）
– 投资博弈 :
– 银行挤兑博弈：
– ……
c=投资， d=不投资
c=不提款， d=提款
参与者 2
参与者 1
c
d
c
（5， 5)
(0, -10)
d
（-10, 0）
（0， 0）
13
2. 信念的协调
• 非对称共赢协调问题
– 性别战（约会博弈）： c=足球， d=音乐会
– 标准竞争
乙
c
甲
c
d
（5， 2)
（0, 0）
d
（0, 0）
（2， 5）
14
案例：56k调制解调器技术标准竞争
• 90年代中期，调制解调器主导标准：V.34，28.8kbs/秒
• 1996年Rockwell、US Robotics、朗讯和摩托罗拉相继向市
场投放下一代调制解调器：56kbs/秒，但分为两大阵营
– Rockwell、朗讯、摩托罗拉： K56Flex标准
– US Robotics: X2标准
– 双方互不兼容，并拒绝了国际电讯联盟的标准化协调
US Robotics
K56Flex
Rockwell
K56Flex
（10，2)
X2
（0, 0）
X2
（0,
0）
（2， 10）
15
案例：56k调制解调器技术标准竞争
• 洛克威尔，US Robotics 的56k调制解调器
– 3Com公司(Rockwell的支持者)收购 US Robotics，打破
僵局
– 1997年，国际通讯联盟推出 V90标准，解决两者之间
的差异，市场迅速扩大。
16
2. 信念的协调
• 冲突协调
– 斗鸡博弈（Chicken）
– 消耗战 (War of Attrition)
乙
c
甲
c
d
（0， 0)
（2, -1）
d
（-1,
2）
（-10，-10）
17
例：分饼博弈
• 给定有100元钱，由两个人分享。规则要求每个人同时提
出自己想要的份额si,如果s1 + s2 100，那么按各自索要的
份额分配，如果， s1 + s2 >100,那么每个人都得到0。请求
解纳什均衡。
• 参与者：
– I={1,2}
• 策略集
– si＝[0, 100], i=1,2
– s=(s1, s2)
• 支付函数
–
si if s1 +s2  100
ui ( s)  
0 if s1 +s 2 >100
i  1, 2
18
18
例：分饼博弈
• 参与者 i 的最优反应函数
– 给定策略组合(si sj ), 参与者的 i 支付
 si if s1 +s 2  100
ui ( s )  
0 if s1 +s 2 >100
– Max
ui(si,sj)
– Bi (sj)=
100-sj
如果 0  sj <100
[0, 100]
如果 sj =100
19
例：分饼博弈
• 参与者i的最优反应函数
– Bi (sj)=
• NE
100-sj
如果 0  sj <100
[0, 100] 如果 sj =100
– s*1  B1(s*2)； s*2 b2(s*1)
s2
B1 (s2)
– (x, 100- x) 其中 x[0,100]； 100
– (100, 100)
70
• 协调
– 文化：公平价值观
– 聚点均衡： (50,50)
B2 (s1)
30
100
s1
20
分饼博弈：Nash谈判解
• 双边谈判问题
– 总剩余: R
– 可行分配集 F={(x1,x2) : x1,0, x2 0, x1+x2R}
– 保留支付 : (r1, r2)
• 威胁点
• 纳什谈判解 (Nash, 1950)
–
Max
(x1,x2)  F
(x1-r1)·(x2-r2)
• v1 = r1+ (R - r1 - r2) /2
• v2= r2+ (R - r1 -r2) /2
21
讨论
• 如果你是甲，会如何选择
• 纳什均衡： (A, X)
• 批评一：为什么不是（C，Z）
甲
X
乙
Y
Z
A
2, 2
3, 1
0, 2
B
1, 3
2, 2
3, 2
C
2, 0
2, 3
2, 2
22
讨论
• 乙有占优策略：X
• 所以甲最优反应是C。
• 但是事实上，许多人会选择A，为什么？
乙
甲
X
Z
A
9, 10
8, 9.9
C
10, 10
-1000, 9.9
23
小结：纳什均衡
• 纳什均衡
– 没有单方偏离激励
– 一致信念：每个人对他人策略选择有着正确的信念
• 纳什均衡的推理
– 方法一：按“没有单方偏离激励”标准检验每个策略
组合
– 方法二：找出每个参与者的最优反应函数 bi(s- i) ，然后
求解方程组：
• s*i = bi(s*-i) i=1,2,3,…,N
24

2 - 经济学院

Transcript 2 - 经济学院

Directory