Transcript 不完全信息动态博弈
不完全信息动态博弈 • 不完全信息动态博弈(或动态贝叶斯博弈)的基本特征是参与人的行动是序 • 贯的,有先有后,与完全信息动态博弈相比,其中的私人信息可能表现在支 • 付函数上,也可能表现在行动的选择上。前一个表现形成不完全信息,后— • 个表现形成不完美信息。 • 象不完全信息静态博弈被转化成完全但不完美信息动态博弈进行分析一 样。所有的不完全信息动态博弈都可以被转换成完全但不完美信息的动态博 弈进 • 行分析。正因为这样,我们把“不完全信息动态博弈”与“不完美信息动态 博弈”混同使用。 一、完美贝叶斯一纳什均衡 • (一)、多节点信息集和不完美信息动态博弈的表示 • 用博弈树表示完全且完美信息的动态博弈,其中博 弈树上的每个节点就是一个独立的决策节,表示参与人 • 在该时点对此前的博弈过程有完全的了解。 • 而在不完全信息动态博弈中,“自然”首先选择参 与人的类型,相应的参与人知道自己的类型,其他参与 人不知道;在自然的选择之后,参与人开始序贯行动, 后行为者能观测到先行为者的行动,但无法观测到先行 为者的类型,从而产生不完美信息,对此,我们在博弈 树上用多节点的信息集来反映。 二手车交易博弈 二手车交易博弈 • 1、二手车交易看成这样一个动态博弈 • 先是自然(N)决定二手车的类型:好车或差车。 • 卖主(参与人1)知道自己的类型后选择卖或不卖,若卖主选择不 • 卖,则博弈结束;若选择卖,则轮到顾客(参与人2)决定买还是 不 • 买。 • 顾客在轮到决策的时点上,只能观测到卖主选择了卖的行动而不 • 知道卖主的类型是好车还是差车(即顾客不知道自然的选择是好 • 车还是差车)。(这是不完美信息) • 这个交易里有两个决策节点就形成 一个多节点的信息集 (用椭 圆圈出)。 • 2、多节点信息集有如下特征: • • • • • • (1)在此信息集中的每一个节点都轮到该参与人行动, (2)当博弈的进行达到该信息集中的某个节点时,轮到行动的 参与人并不知道实际到达了哪一个节点,而只知道到达了其中的 某个节点的概率(先验概率或后验概率)。 • 引进了多节点信息集之后,我们要对博弈树上的“子博弈”概念进行修 • 正,它必须是; • (1)始于单节点信息集的决策节点n(但不包含博弈树的第—个决策节点); • (2)包含博弈树中n之下所有的决策节点和终点节(但不在n之下的除外); • • • • • • • (3)没有对任何信息集形成分割(即如果博弈树中n之下有一个决策节点n’ ,则 和n’处于同—个信息集中的其他决策节点也必须在n之下,从而也必须包含于 该子博弈中) 其中要求(1)和要求(2)对不完美信息动态博弈和对完美信息动态博弈并没 有什么不同,而要求(3)是专门针对不完美信息动态博弈的。 对照要求(3),图中的博弈树中不存在子博弈。这意味着我们分析动态贝 叶 • 斯博弈的均衡时,不能完全照搬逆推归纳法。 • • • 引进了多节点信息集后,我们前面讲过:博弈还可以用博 弈树表示静态博弈。静态博弈中参与人并不一定要同时行动,而 只要每个参与人在选择策略时不知道其他参与人的选择就足够了。 这说明,对静态博弈,我们既可用标准式表述也可用扩展式 表述来表现,只不过用标准式表述更便于我们的分析罢了。 • 类似地,我们用扩展式表述动态博弈也仅仅是为了分析的方 便起见,而并不意味着动态博弈只能用扩展式表述,比如下图所 示的动态博弈就可以用下表所示的支付矩阵来表示,只不过我们 要对动态博弈中参与人的策略是一个关于行动的完整计划这一点 作出强调。 动态博弈的博弈树与扩展式表示 • 从上我们可以看出参与人2有两个可选择的行动,但有4个策略: 策略1:如果参与人1选择L,则选择M,如果参与人1选择 R,也选 择M,表示为(M,M); 策略2:如果参与人1选择L,则选择M,如果参与人1选择R,那么 选择N,表示为(M,N); 策略3:如果参与人1选择L,则选择N,如果参与人1选择R,还是 选择N,表示为(N,N); 策略4:如果参与人1选择L,则选择N,如果参与人1选择R,那么 选择M,表示为(N,M)。 完美信息和不完美信息的区分 • 完美信息为在动态博弈进行的每一个阶段,轮到行动的参与人对 • 此前博弈的全过程都了解;与此相对应的是博弈树中每一个信息 • 集都是单节点的(只包含一个决策节点的信息集)。 • 不完美信息则意味着在博弈树上至少存在一个信息集是包含两个 • 或两个以上决策节点的。那么,一个同时行动的博弈(如囚徒困 • 境博弈)的扩展式表述就是一个不完美信息博弈。 • • • • 在前面讨论到有同时选择的两阶段动态博弈也是不完美信息的。 一般地,完全但不完美信息动态博弈可用包含多个决策节点的信 息集的博弈树表述,从而对每一参与人在轮到他行动时对本博弈 了解什么或不了解什么表达得清清楚楚。 (二)完美贝叶斯一纳什均衡 • 对动态博弈进行分析,可信性问题始终是 一个中心问题,一个理想的均衡必须是排除了所 有不可信的威胁和许诺的。 • 在完全信息动态博弈中,鉴于纳什均衡本身 无法排除不可信的威胁和许诺,我们加上了子博 弈完美这一要求(即要求策略组合在每一个子博 弈中都能构成纳什均衡),并称这样的纳什均衡 为子博弈完美纳什均衡. • • • • • • 对于不完全信息动态博弈,由于贝叶斯纳什 均衡同样未能排除不可信的威胁和许诺,我们需 要对贝叶斯纳什均衡进一步强化(即加强对条件 的要求),并把强化后的贝叶斯纳什均衡称为完 美贝叶斯纳什均衡,简称为完美贝叶斯均衡。 • • • • 因此,用更为广义的后续博弈的概念来代替子博 弈的概念。前面我们已经定义过的子博弈必须开 始于单节点信息集,并且不能分割信息集,与之 不同的是“后续博弈”是指从任何信息集(不论 是 • 单节点的还是包含多节点的)开始的动态博弈的 • 后续部分。 精练贝叶斯纳什均衡的理解 • 在不完全信息动态博弈中,“自然”首先选择参与人的类型 ,参与人 自 • 己知道,其他参与人不知道; • 在“自然”选择之后,参与人开始行动,参与人的行动有先有后,后 行 • 动者能观测到先行动者的行动,但不能观测到先行动者的类型。 • 因为参与人的行动是类型依存的,每个参与人的行动都传递着自己类 • 型的某种信息,后行动者可以通过观察先行动者所选择的行动来推断其类 • 型或修正对其类型的先验信念(概率分布),然后选择自己的最优行动。 • 先行动者理性预测到自己的行动将被后行动者所利用,就会设法选择 • 传递对自己有利的信息,避免传递对自己不利的信息。 • 因此,该博弈过程的实质不仅是参与人选择行动的过程,而且是参与 • 人不断修正信念的过程。精练贝叶斯纳什均衡是完全信息动态子博弈精练 完美贝叶斯纳什均衡必须满足以下 四条要求 • • • • • 1、在每一个信息集上,轮到行动的参与人必须对博弈进行到该 信息集中各个决策节点的可能性大小有一个推断。对非单节点信 息集,一个推断就是在信息集中关于不同决策节点的一个概率分 布;对于单节点的信息集,一个推断就是博弈到达此单一节点的 概率等于1。 完美贝叶斯纳什均衡必须满足以下 四条要求 • • • • 2、给定参与人的推断,参与人的策略必须是序贯理性的。即在 每一信息集中,给定轮到行动的参与人在此信息集中的推断,以 及其他参与人的后续策略(指从给定信息集开始的参与人在后续 博弈中的完备的行动计划),该参与人的行动必须是最优的。 完美贝叶斯纳什均衡必须满足以下 四条要求 • 3、在处于均衡路径之上的信息集处,推断由贝叶斯法则和参与 人的均衡策略给出。 完美贝叶斯纳什均衡必须满足以下 四条要求。 • 4、在处于均衡路径之外的信息集中,推断由贝叶斯法则和参与 人在此处可能有的均衡策略决定。 • 满足上述四条要求的策略组合和相应的推 断构成完美信息动态博弈的完美贝叶斯纳 什均衡。 例:不完美信息动态博弈 • 1、有两个参与人,其中参与人1首先行动——在行动L或者M或 者R中选择一个。 • 2、如果参与人1选择了R,则博弈结束,参与入2没有实际的选 择行动的机会; • 3、如果参与人1没有选择R.则轮到参与人2在T和H之间选择, 但参与人2却不知道参与人1是已经选择了L还是选择了M。因此, 这是一个不完美信息动态博弈。 • 4、如果把该动态博弈表述为标准式,我们很快就知道它存在两 个纯策略纳什均衡,即(L,T)和(R,H)。 标准式表示 • • • • • 5、并且这两个均衡也满足子博弈完美性的要求,因为在图里, 该动态博弈不存在子博弈,所以子博弈完美性的要求就自动满足 了(在不存在任何子博弈的动态博弈中,子博弈完美纳什均衡的 定义便等向于纳什均衡的定义),就是说,(L,T)和(R,H)那是 子博弈完美纳什均衡。 • • • • 6、然而(R,H)却明显地并不是一个合理的均衡:对参与人1来 说,参与人2的选择H的行动是不可信的威胁,因为参与人2一旦 有了选择的机会,他的理性选择肯定是T而不会是H,这样,参 与人1的最优选择就不是R而是L。 • 7、用完美贝叶斯纳什均衡的要求1和要求2来衡量就能够把(R, • H)这样包含不可信威胁的子博弈完美纳什均衡剔除掉。 • • • • • • • • • 具体地说,在图中,参与人2所处的信息集包含两个决策节 点,按照要求1,他必须对博弈到达这两个决策节点的可能性大 小作出推断,以P表示参与人2推断参与人1选择L的概率,那么 (1一P)就是参与人1选择M的概率(既然参与人2已观测到参与人 1没有选择R),参与人2在给定自己的推断(P,1一P)后,选 择T的期望支付等于:P·1十(1一P)·2=2一P,选择H的期望值支 付等于:P·0十(1一P)·1=1一P。对于任意的0≤P ≤ 1,恒有(2 一P)>(1一P),所以一旦参与人2观测到参与人1没有选择R,他 就绝不会选择H,可见要求2排除了参与人2选择H的可能性。 • 从而在本例中,满足要求1和要求2,使我们剔除了(R.H)这 • 样不合理的子博弈完美纳什均衡。 • • • • • • • 在本例中,简单地要求处于多节点信息集处的参与人对博 弈到达该信息集中各节点的可能性大小有一个推断(要求 1),并且在此推断下选择最优行动(要求2),就足以使我们 剔除不合理的均衡(R,H),而在更多的不完全(不完美)信 息动态博弈的分析中,仅满足这两个要求是不够的,我们 还需要进一步明确这样的推断是不是合理的,为此,我们 需要进一步的约束条件要求3和要求4。 • 要求3和要求4中有“处于均衡路径之上”和“处于均衡路径之外” 这一对概念,它们的含义分别是: • 对于一个给定的均衡,如果博弈按照均衡策略进行将会以正 • 的概率到达某信息集,我们称此信息集处于均衡路径之上; • 反之,如果博弈以均衡策略进行时,肯定不会到达某信息集,我 • 们称该信息集处于均衡路径之外。 • 要求3实质上表述了这样的要求: • 参与人的推断(即博弈到达多节点信息集中各节点的概率分布) 必须是使用贝叶斯法则从最优策略和观测到的行动得到的(在可 • 能的情况下)。 • 在图所示的博弈中,参与人2处在多节点信息集之上,他的 • 推断是直接关于参与人1的选择的,不存在条件概率问题,也不 • 存在推断的修正问题,因此贝叶斯法则自动满足,参与人2将直 • 接根据自己的和参与人1的最优策略来形成推断: • 首先,如果参与人1不选择R,则轮到参与人2选择行动,而 • 且从期望支付来看,他肯定不会选择H,这—点是双方的共同知 • 识,给定参与人2不选择H,参与人1的最优选择就是L. • • 因此,参与人2将有推断P=1,这样形成的推断是有坚实 基础的,以它作为参与人2的决策基础进而分析出的双方 策略均衡才是稳定的;参与人1在第一阶段选择L,参与 人2的推断P=1(P是参与人2推断参与人1选择L的概率)并 选择T正是本例的完美贝叶斯均衡结果,记为(L,T;P= 1)。 • 这里,我们注意到均衡策略和合理推断之间的密切关 系。相反,如果参与人2随意地给出—个推断,比如P= 0.6,这时,结果(L,T:P=0.6)就是不稳定的。因为如 果P=0.6,那么参与人2就认为参与1还是有可能选择M, 那么尽管选择T还是参与人2的理性行为,但参与人1的最 优选择却不再是L或M,而是R。 • 下面分析要求4的作用 • 这是一个由三个参与人各行动一次构成的三阶段不完美信息 • 动态博弈。 • 参与人1在第一阶段在A和B中作出选择,如果他选择A,则博 • 弈结束,如果他选择B,则轮到参与人2在第二阶段在C和D之间 • 作出选择,在第三阶段由参与人3在E和F之间进行选择。 • 其中参与人1的行动能被参与人2和3观测到,但参与人2的行 • 动却不能被参与入3观测到。分别用P和(1一P)表示参与人3推断 • 参与人2选择C和D的概率,那么参与人3选择E的期望支付为 • P×1十(1一P)×2=2一P,选择F的期望支付为P×3十(1一 P)×1 • =1十2P,因此,当P<1/3时,他会选择E,当P>1/3时,他会 • 选择F,当P=1/3时,他可选择E或F或混合策略。 • • 那么他所推断的P究竟是这三种情况中的哪一种情况呢?这取 决于他对参与人2的最优选择的判断。 • 对参与人2来说,D是相对于C的严格下策,所以参与人2的合 理选择必定是C,因此P=1>1/3,所以参与人3的选择是F。参 与人1在第一阶段对第二阶段和第三阶段参与人2和3的决策思路 是清楚的,所以他知道如果自己选择B的话,支付将是B,比选 择A的支付2大,因此,他会选择B。 • 这样,我们就得到一个策略组合(B,C,F)与参与人2的推断P =1.从上面的分析可知,(B,C,F,P=1)是完全符合要求1 到要求3的,并且,由于该策略组合下不存在均衡路径之外的 信息集,因此要求4也就自动满足,从而我们说(B,C,F;P =1)是该博弈的完美贝叶斯纳什均衡。 • 下面考虑策略组合(A,C,E)及相应的推断P=0。 • 首先,(A,C,E;P=0)是一个纳什均衡,因为任何一个参 与人都不可能通过单独改变自己的策略使自己的支付得到改善; • 其次,用要求1到要求3来衡量它也是满足的。但是,它却不 是子博弈完美的,因为该博弈只有惟一的子博弈,并且根据上面 的分析,它的惟一的纳什均衡是(C,F),而不是(C,E)。 • • • • • • • 产生这—矛盾的原因就在于要求4没有满足。在(A,C,E; P=0)下,均衡路径就是第一阶段参与人1选择A,博弈结束,参 与人2和3的策略C和E及推断P=0都不在均衡路径上,即存在均 衡路径之外的信息集,对于参与人3在该信息集上的推断P=0, 要求1到要求3没有任何的限制,而根据要求4,参与人3的推断 决 • 定于参与人2的合理选择:如果参与人2选择C,则参与人3的推 • 断必须是P=1,如果参与人2选择D,则参与人3的推断必须是P • =0。 • 纳什均衡(B,C,E;P=0)中,恰恰就是参与 人3的推断P=0与参与人2的选择C不相符合。 因此,以要求1来衡量,纳什均衡(B,C,E; P=0)是不合理的均衡(主要是推断不合理), 应该予以剔除。 • • • • • 上述四个要求中,要求2要求参与人在一个特定信息集上的行动 依赖于参与人在该信息集的推断,而要求3或要求4又要求参与人 的推断依赖于博弈树更上端的参与人的行动,但要求2又要求这 些在博弈树上更上端的参与人的行动部分地依赖于随后参与人的 行动。 • 这样的循环依赖意味着通过博弈树进行逆推归纳求解,完美 • 贝叶斯纳什均衡将不像在完全且完美信息动态博弈中确定子博弈 • 完美纳什均衡那样顺利(—般情况而言)。 • 事实上,要求1到要求4为我们提供了确定完美叶斯纳什均衡 • 的思路和方法,我们以这四个要求为依据和标准并结合具体的特 • 点来分析确定完美贝叶斯纳什均衡。 二 信号博弈 • • • • • • • • • 1、什么是信号博弈 信号博弈是一类比较简单但有着广泛应用的不完全信息动态 博弈。在这种博弈中,有两个参与人,双方各自都只行动一次, 后行动的参与人具有不完全信息,但他能够从先行动的参与人所 采取的行动中获得部分信息,因此,先行动的参与人的行动对后 行动的参与入来讲就好像是某种反应其支付函数的信号,因此, 这种博弈被称为“信号博弈”, 其中,先行动的参与人就被称为信号发送者,后行动的参与 人被称为信号接收者。 • 信号博弈可以划分为三类;混同策略、半分离策略和分离策略。 • 各自的意义如下: • • • • (1)混同策略 混同策略这类策略中,信号发送者在不同类型下部发出相同的信 号。因而,信号接收者无法从观测到的信号中得到新的信息,也 就无法对先验概率进行修正。 • • • • • (2).半分离策略 指信号发送者对某些类型选择特定的信号,而对另—些类型则随 机地选择信号。这时,信号接收者观测到某些信号能够准确地判 断出发送者的类型,而观测到另外某些信号时尽管不能完全判断 出发送者的类型,但是能够据以修正自己的先验概率。 • (3).分离策略 • 指信号发送者针对不同的类型完全选择不同的信号。这类策略 • 中,信号准确地表现类型,接收者可以通过所观测到的信号准确 地判断出发送者的类型。 三:均衡精练 • • • • • 以往所讨论的任何一种均衡概念都不能在保证存在性的同时保证 惟一性,由此产生的均衡多重性是博弈论面临的一个难题:对 此,目前的解决方法是:无沦采用哪一种均衡概念,在对应的多 个均衡中利用特定的评价标准,可能能够分辨出其中一些是合理 的,而另一些是不合理的。 • 通过评价标准的设定就可以剔除相应不合理的均衡:这种方 • 法被称为均衡的精炼。 • 即通过剔除在对应标准下不合理的均衡来减少均衡的数目, • 如子博弈完美纳什均衡就是纳什均衡的精练。 (一) 序贯均衡 • • • • 1、序贯均衡的概念是由克瑞普斯和威尔逊(1982)首先提出的。它的原理与完 美贝叶斯一纳什均衡相似,也应用于动态贝叶斯博弈,但更着重强调非均衡 路径上后验概率的形成,对局中人随着博弈的进行修正自己信念的方式作了 更加严格的要求,认为局中人的行动必须由对行动历史的信念合理化决定。 • • • • • 2、序贯均衡对非均衡路径上后验概率的处理是:首先假定在每个信息集上, 局中人选择严格混合策略(即以严格正的概率选择每一个行动),从而博弈到达 每一个信息集的概率严格为正,这样贝叶斯公式在每一个信息集上都可以适 用而不会出现后验概率任意取位的情况;然后,将均衡作为这种严格混合策 略和相应后验概率的序列的极限,而能够成为这种极限的均衡就是序均衡。 (二)颤抖手均衡 • • • • • 1、其基本思想是:在任何一个博弈中,每一个局中人均 有可能犯错误,如同一个人抓东西时因手的颤抖使其发生 偏差而抓不住一样(这种均衡概念的名称即来源于此),这 样局中人在选择策略时就需要考虑到其他局中人犯错误的 可能性,这样的均衡比纳什均衡概念更为合理。 • • • • • • • 2、泽尔滕将非均衡事件的发生解释为局中人策略选择时的“颤 抖”,当局中人发现博弈偏离均衡时,他将这一事件归结为某一 个其他局中人的非蓄意错误。在发生颤抖的博弈中.局中人要针 对这些颤抖作出最佳反应,从而构成了纳什均衡。当颤抖的幅度 缩小时,被颤抖扰动的博弈中均衡的极限就是颤抖手均衡。颤抖 手均衡要求均衡策略不仅是对对手策略的最佳反应,而且是当对 手策略发生微小(或无限小)颤抖时的最佳反应; • • • • • 3、缺陷:这样定义的颤抖手均衡仍然有缺陷,将它应用到动态 博弈对应的策略型描述时,就会出现颤抖手均衡不是子博弈完美 均衡的情况。这是由于动态博弈的策略型描述中,同一局中人在 动态博弈不同阶段的错误(颤抖)具有相关性,从而不能剔除子博 奔完美均衡概念所揭示的不合理的均衡。 • 于是,在经济学上,为了排除局中人犯错误时的动态相关 • 性,泽尔滕引人了“代理人一策略型表述”,也就是将原来的局 中 • 人作为委托人、他在不同信息集上雇佣了不同的代理人,授权后 • 者进行决策:代理人的支付函数与委托人相同,按委托人的利益 • 行动,但是各代理人间彼此独立行动,这样犯错误的可能性就是 • 独立的,从们消除了颤抖的动态相关性。通过这种方法就改进了 • 颤抖手均衡的概念,与子博弈完美均衡不再矛盾。 • 4、颤抖手均衡与序贯均衡的关系是:颤抖 手均衡一定是序贯均衡,而序贯均衡却不 一定是颤抖手均衡。 (三)均衡精炼 • 均衡精炼是博弈论中的一个重要专题,出现过多 种多样的精炼均衡概念。梅耶森(1978)提出的恰 当均衡即为其中之一,其思路是:在颤抖手均衡 中,假设局中人在各个方向上犯错误的可能性相 同,而实际上,局中人犯错误的后果并不相同, 错误选样一种策略可能比错误选择另一种策略带 来更大的损害,所以局中人会尽量避免代价大的 错误。考虑到这种心理就形成了恰当均衡的概念。 (三)均衡精炼 • • • • • 均衡精炼至今仍处于发展之中,且不断有新的 均衡概念出现,不过目前还是以进行理论讨论为 主:在实际中应用较多的还是我们在前面所介绍 的四种均衡概念、即: 1.完全信息静态博弈中的纳什均衡 2.完全信息动态博弈中的子博弈完美纳什均衡 3.不完全信息静态博弈中的贝叶斯一纳什均衡 4.不完全信息动态博弈中的完美贝叶斯一纳什均 衡