微观经济学第十章 博弈论初步.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10.3 名校考研真题详解 一、名词解释 1.纳什均衡(Nash equilibrium)[浙江大学2005研;厦门大学2006、2008研;中南财经政法大学2007、2009 研;财政部财政科学研究所2008研;西安交通大学2009研] 答:纳什均衡(Nash Equilibrium)又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰·纳什的名字 命名。 纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略决定的情况下, 他选择了最好的策略。纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略, 任何个人都没有积极性去选择其他战略,从而这个均衡没有人有积极性去打破。 与其相联系的一个概念是占优策略均衡。占优策略均衡指这样一种均衡,不管其对手采取什么策略,该竞争者 采取的策略都是最优策略。纳什均衡指每一个竞赛者都确信,在给定竞争对手策略决定的情况下,他选择了最好的 策略。占优均衡是一种纳什均衡。占优均衡若存在,只存在惟一均衡,而纳什均衡可能存在多重解。
第10章 博弈论初步 10.1 本章框架结构图
博弈论在20世纪50年代由数学家约翰·冯·诺依曼(Von Neumann)和经济学家奥斯卡·摩根斯坦 (Morgenstern)引入经济学,目前已经成为主流经济分析的主要工具,对寡头理论、信息经济学等经济理论的发展 作出了重要贡献。
一、博弈论的几个基本概念 博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。在策略性环境中,每一个人进行 的决策和采取的行动都会对其他人产生影响。因此,每个人在进行策略性决策和采取策略性行动时,要根据其他人 的可能反应来决定自己的决策和行动。 1.博弈参与人 参与人或称局中人,是指博弈中的决策主体,即在博弈中进行决策的个体。参与人既可以是个人,也可以是团 体(企业或国家)。每个参与人的目标是通过选择行动使自己的效用最大化。 2.策略 策略是指参与人选择行为的规则,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大 化。 3.支付函数 支付函数也称为效用函数,表明了博弈的参与人采取的每种策略组合的结果或收益,它是所有参与人策略或行 动的函数,是每个参与人真正关心的东西。 4.支付矩阵 参与博弈的多个参与人的收益可以用一个矩阵或框图表示,这样的矩阵或框图称之为支付矩阵,也称之为博弈 矩阵或收益矩阵。 其中,博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个基本要素。表10-1即为一个支付矩 阵。
当B选择U时,A会选择R,因为 5;当3 B选择D时,A会选择R,因为 。2 当0 A选择L时,B会选择U,因为 选择R时,B会选择D,因为 1。 0因此,依据纳什均衡定义,可知 D,是R纳什均衡。
4; 3当A
5.囚徒困境 囚徒困境的博弈模型的假设条件是:甲、乙两个被怀疑为合谋偷窃的嫌疑犯被警方抓获,但警方对他们偷窃的 证据并不充分。他们每一个人都被单独囚禁,并单独进行审讯,即双方无法互通信息。警方向这两个嫌疑犯交待的 量刑原则是:如果一方坦白,另一方不坦白,则坦白者从宽处理,判刑1年;不坦白者从重处理,判刑7年。如果两 人都坦白,则每人都各判刑5年。如果两个都不坦白,则警方由于证据不足,只能对每个人各判刑2年。表10-6的支 付矩阵描述了这一博弈。表中的报酬均为负数,以表示判刑的年数。
表10-6 囚徒困境
通过分析可以看出,囚徒困境的博弈有一个占优策略均衡(坦白、坦白)。但是,如果两人都是选择不坦白 (即合作),则都可以获得最好的结局。很清楚,囚徒困境的占优策略均衡反映了一个矛盾:即个人理性和团体理 性的冲突。
三、同时博弈:混合策略均衡 并不是所有的博弈都存在纳什均衡。比如,如表10-7所示。这博弈就不存在纯策略纳什均衡,但却存在混合策 略纳什均衡。混合策略纳什均衡是这样一种均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都 为自己确定了选择每一种策略的最优概率。
表10-5 寡头博弈:合作与不合作
【例10.2】考虑两寡头厂商A和B的如下支付矩阵,二者的(纳什)均衡策略组合为( )。
A.(U,L) B.(D,R)
C.(U,R) D.(D,L)
【答案】B
【解析】在一个纳什均衡里,任何一个参与者都不会改变自己的最优策略.如果其他参与者均不改变各自的最
优策略,即要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。对于本题,
表10-1 支付矩阵
二、同时博弈:纯策略均衡 “同时博弈”是参与人同时进行决策或行动的博弈。在同时博弈中,在给定其他参与人的策略时,某个参与人 的最优策略称之为该参与人的条件优势策略(简称条件策略),而包括该参与人的条件策略以及这些条件在内的所 有参与人的策略组合称之为该参与人的条件优势策略组合(简称条件策略组合)。 1.占优策略 在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。也就是说,无论其他参与人采取 什么策略,该参与人的最优策略是惟一的,这样的策略称之为占优策略。如表10-2所示,通过对支付矩阵的分析可 以看出,如果A、B两厂商都是理性的,则这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个 厂商都会选择做广告。这种策略均衡称之为占优策略均衡(equilibrium in dominant strategies)。
A.一个混合策略纳什均衡,即两人都以80%概率选择“避让”,以20%的概率选择“冲过去” B.两个混合策略纳什均衡,即每个青年人轮流采取避让或者冲过去 C.一个混合策略纳什均衡,即一人以80%的概率选择“避让”,另一人以20%的概率选择“冲过去” D.一个混合策略纳什均衡,即两人都以40%的概率选择“避让”,以60%的概率选择“冲过去” 【答案】A 【解析】根据题中条件可写出两人的收益矩阵,如表10-8所示。
4.寻找纳什均衡的方法——条件策略下划线法 对于一个简单的“二人同时博弈”,可以用一个以二元数组为元素的支付矩阵来表示,并用“条件策略下划线 法”来确定它的纳什均衡。具体步骤如下: (1)把整个博弈的支付矩阵分解为两个参与人的支付矩阵。 (2)在第一个(即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线。 (3)在第二个(即位于整个博弈矩阵上方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线。 (4)将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵。 (5)在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合代表的策略 组合就是博弈的纳什均衡。
【例10.4】在下面的博弈树中,确定纳什均衡和逆向归纳策略。
答:纳什均衡是(决策1,决策3)、逆向归纳策略也是(决策1,决策3)。分析如下: (1)(决策1,决策3)是一个纳什均衡。在该策略组合上,没有哪个参与人愿意单独改变自己的策略。首先, 参与人B不会单独改变自己的策略。如果它单独改变策略,即将原来的决策3变为决策4,参与人B的支付将从原来的 3下降到0。其次,参与人A也不会单独改变自己的策略。如果它单独改变策略,即将原来的决策1变为决策2,则策 略组合就成为(决策2,决策3),参与人A的支付将从原来的1下降到0。 (2)采用逆向归纳法,可以判断出逆向归纳策略也是(决策1,决策3)来自百度文库首先,如果参与人A选择决策1,参 与人B肯定不会选择决策4。另一方面,如果参与人A选择决策2,参与人B肯定不会选择决策4。在此情况下,考察参 与人A的选择。由博弈树可以看出,参与人A的最优选择是决策1。最终结果是,参与人A选择决策1,参与人B选择决 策3,即最优策略组合为(决策1,决策3)。
表10-7 社会福利博弈
所有参与人的混合策略的组合构成“混合策略组合”。混合策略组合与参与人的支付的乘积之和为参与人的期 望支付。当其他参与人的混合策略确定之后,某个参与人选择的可以使自己的期望支付达到最大的混合策略是该参 与人的条件混合策略(其几何表示为“条件混合策略曲线”)。不同参与人的条件混合策略曲线的“交点”就是混 合策略条件下的纳什均衡。可以证明,混合策略均衡总是存在的。
,解得 r 0.2 ;对于乙来说,也应该使其冲过去的期望收益等于避让的期望收益,即 36c 91 c 0 ,解得 c 0.2 。 所以,存在一个混合策略纳什均衡。
四、序贯博弈 “序贯博弈”是参与人的决策和行动有先有后的博弈。描述序贯博弈的更加方便也更加自然的工具是“博弈 树”。博弈树由“点”(包括“起点”、“中间点”、“终点”)、连接点的“线段”以及标在这些点和线段旁边 的文字和数字组成。在博弈树中,一个纳什均衡代表一条均衡的路径。在该均衡路径上,没有哪个参与人愿意单独 改变自己的策略。
图10-1 博弈树 在序贯博弈中,可能存在多个纳什均衡的情况。在多个纳什均衡中,有些可能并不合理。所谓对纳什均衡的 “精炼”,就是要从众多的纳什均衡中进一步确定“更好”的纳什均衡。纳什均衡的精炼方法通常是使用所谓的 “逆向归纳法”,具体包括以下两个步骤: 第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的 其他策略删除,从而得到原博弈的一个简化博弈。 第二步,再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。这个最简博弈,就是原博 弈的解;而在存在多重纳什均衡时,它就是对纳什均衡的精炼。
2.混合策略[北京交通大学2004研;东北大学2007研;华中科技大学2008研] 答:混合策略是指在博弈中,博弈方的决策内容不是确定性的具体的策略,而是在一些策略中随机选择的概率 分别的策略。混合策略情况下的决策原则有以下两个: (1)博弈参与者互相不让对方知道或猜到自己的选择,因而必须在决策时利用随机性来选择策略,避免任何 有规律性的选择。 (2)博弈参与者选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性倾向的某一种 策略而在博弈中占上风。
表10-3 广告博弈的支付矩阵
3.纳什均衡与占优策略均衡的区别 每一个占优策略均衡一定是纳什均衡,但并非每一个纳什均衡都是占优策略均衡。纳什均衡是有条件的占优策 略均衡。 一个博弈可能存在一个以上的纳什均衡,但是一个博弈也可能不存在纯策略纳什均衡,如表10-4所示。
表10-4 没有纳什均衡的同时博弈
表10-2 广告博弈的支付矩阵
2.纳什均衡 并不是每个博弈的各个参与人都有一个占优策略。如表10-3所示,通过对支付矩阵的分析可以看出,现在厂商 A没有占优策略,它的最优决策取决于厂商B的选择。如果厂商B做广告,则厂商A最好也做广告;但如果厂商B不做 广告,厂商A不做广告又是最好的选择。这种均衡就是纳什均衡(Nash equilibrium)。所谓纳什均衡,指的是参与 人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。即如果在一个策略组合中, 当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
【例10.1】下列说法错误的是( )。 A.占优策略均衡一定是纳什均衡 B.纳什均衡不一定是占优策略均衡 C.占优策略均衡中,每个参与者都是在针对其他参与者的某个特定策略而做出最优反应 D.纳什均衡中,每个参与者都是在针对其他参与者的最优反应策略而做出最优反应 【答案】C 【解析】占优策略均衡中,不论其他参与者采取何种策略,每个参与者都会选择其自身的最优策略。
【例10.3】在一条狭窄巷子里,两个年青人骑着自行车相向而行。每人都有两个策略,即或者选择“冲过去” 或者选择“避让”。如果选择“避让”,不管对方采取什么策略,他得到的收益都是0。如果其中一个人采取“冲 过去”的策略,如果对方采取“避让”,那么他得到的收益是9;如果对方不避让,那么他得到的收益是-36。这个 博弈有两个纯策略纳什均衡和( )。
表10-8 两人的收益矩阵
乙 冲过去
避让
选择概率
冲过去
-36,-36
9,0
r
甲
避让
0,9
0,0
1 r
选择概率
c
1 c
从收益矩阵可看出,这个博弈有两个纯策略纳什均衡(冲过去,避让),(避让,冲过去)。设甲选择冲过去的概
率为 r ,乙选择冲过去的概率为 c 。对于甲来说,应该使冲过去的期望收益等于避让的期望收益,即 36r 91 r 0