复杂系统中演化博弈研究背景介绍

Download Report

Transcript 复杂系统中演化博弈研究背景介绍

复杂系统中演化博弈研究
背景介绍
姜罗罗
中国科学技术大学
提纲
演化博弈理论简介
• 经典博弈理论
• 演化博弈理论
1、博弈理论简介
• 博弈论(Game Theory):研究具有斗争或竞争性质现象的
理论和方法。
三要素:参与者(players)集合,策略(strategies)集合和收益
(payoffs)集
分类:合作博弈、非合作博弈;
静态博弈、动态博弈;
完全信息博弈、不完全信息博弈;
• 研究博弈论的意义:理解人类的经济行为;理解社会和生
态物种系统中的合作行为以及自自组织斑图。
(1)经典博弈论
合作博弈强调群体理性
(group rationality),就是从群体
的角度考虑策略的选择,使得整
体收益最大。所以合作博弈研究
的是参与者在达成合作时如何分
配合作得到的收益,即收益分配
问题。
约翰·冯·诺依曼
(J. von Neumann )
《Theory of games and economic behavior》 (1944)
非合作博弈强调个体理性
(individual rationality),就是从个
体的角度考虑策略选择,使得个体
收益最大。所以非合作博弈研究的
是参与者在利益相互影响的情况下
如何选策略使自己的收益最大,即
策略选择问题。
约翰·纳什
(J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
组合。此时,每一个理性的参与者都不会有单独改变策略,因为
当其他人不改变策略时如果他改变策略他的收益将会降低 。
例如:在两人合作博弈中,当参与者A采取其最优策略a*,参与者B也采取其
最优策略b*,如果B仍采取b*,而A却采取另一种策略a,那么A的收益不会超
过他采取原来的策略a*的收益。这一结果对B亦是如此。
纳什(J. Nash)的博士论文 《非合作博弈》(1950)
应用举例:
田忌赛马:
贵族:上等马、中等马、下等马
田忌:下等马、上等马、中等马
司马迁 《史记》
财富分配:
a、b、c三人投票决定如何分配100万,他们分别拥有50%、40%、10%
的权力,规则规定,当超过50%的票认可了某种方案时才能通过。
如何分配才是合理的呢?
按可以票力分配,a50万、b40万、c10万;c向a提出:a70万、b0、c30
万b向a提出:a80万、b20万、c0……
权力指数:每个决策者在决策时的权力体现在他在形成的获胜联盟中的
“关键加入者”的个数,这个“关键加入者”的个数就被称为权利指数。
夏普里值:在各种可能的联盟次序下,参与者对联盟的边际贡献之和除
以各种可能的联盟组合。
次序 abc acb bac bca cab cba
关键加入者 a c a c a b
由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6
所以a,b,c应分别获得100万的2/3,1/3,1/3。
最后通牒博弈
酒吧博弈
在酒吧中消费,人太多则拥挤,人少则能够享受很好
的服务。第一次到酒吧的人多,那么大多人人认为酒吧人
太多,太挤。第二次决定的时候,参考前次而不去酒吧。
少数去的人发现酒吧的人第二天很少,感觉很爽,第三次
将继续回来,并重新带回许多人……循环就此开始。
如何决定下一次是否去酒吧消费?
争当少数者博弈
智猪博弈
小猪和大猪住在猪圈的一边(食槽在这里),开启食物的
开关在另一头,谁去踩,谁丧失先机。如何小猪去踩开关,
等小猪回来的时候大猪已经把大部分食物吃完。如果大猪
去踩开关,等大猪回来的时候小猪已经把一半的食物吃完。
对于小猪来说,最佳策略是等待大猪去踩开关,然后“搭
便车”获得小部分食物。然而,当大猪不去踩开关的时候,
小猪也要冒风险去踩开关。例如腾讯毫无顾忌地跟风,做
QQ旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技
术研发的前期搞定了,大猪们只需要悄悄跟随,适当的时
候踢开挡路的,就可以了。
关税战:
任何一个国家在国际贸易中都面临着保持贸易自由与
实行贸易保护主义的两难选择。X国和Y国进行贸易就是
博弈。这里存在一Nash均衡,就是双方都实行贸易保护
主义,提高关税。在这个均衡中贸易双方采取不合作的
策略,结果使双方因贸易战受到损害。X国试图对Y国进
行进口贸易限制,比如提高关税,则Y国必然会进行反
击,也提高关税。结果贸易双方的利益都受到损害,也
就是损人不利己。反之,如果贸易双方都采取合作的策
略,都减少关税限制,那么双方都可以从贸易自由中获
得了最大利益。
(2)演化博弈论
进化稳定策略(Evolutionary stable strategy)
理性、重复博弈;
策略学习动力学。
针锋相对(tit for tat, TFT)
善良(niceness)、报复(retaliation)、宽容(forgiveness)、清晰(clarity)
“囚徒困境”博
弈
M. A. Nowak and R. M. May, Evolutionary games and spatial chaos,
Nature, 359, 826 (1992).
M. Nowak and R. May, Evolutionary games and spatial chaos, Nature (1992)
(a)R = 1,R= 1.62,S = −0.07,P= 0
(b)R = 1,R= 1.62,S = 0.38, P= 0
C. Hauert and M. Doebeli, Spatial structure often inhibits the
evolution of cooperation in the snowdrift game,
Nature, 428, 643 (2004).
生态博弈