博弈论复习题及答案(DOC)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
囚徒困境说明个人的理性选择不一定是集体的理性选择。(√)
子博弈精炼纳什均衡不是一个纳什均衡。(×)
若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×)
纳什均衡一定是上策均衡。(×)
上策均衡一定是纳什均衡。(√)
在一个博弈中只可能存在一个纳什均衡。(×)
在一个博弈中博弈方可以有很多个。(√)
在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√)
在博弈中纳什均衡是博弈双方能获得的最好结果。(×)
~
在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×)
因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。
(×)
在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×)
在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。
囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。
(×)
纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√)
—
多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√)
如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t 零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。(√)(或:零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。(×))原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别。(√) 原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最 大利益,但惟一的纳什均衡不是效率最高的战略组合,存在潜在合作利益的囚徒困境博弈。(√)(或:原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,不存在潜在合作利益的囚徒困境博弈。(×))根据参与人行动的先后顺序,博弈可以划分为静态博弈(static game)和动态博弈(dynamic game)。 如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T,重复博弈G(T)有唯一的子博弈完美结局:在每一阶段取G的Nash均衡策略。(√) 1、无限次重复博弈与有限重复博弈的区别: a.无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中, 存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互 制约关系,使重复博弈无法实现更高效率均衡的关键问题。 b.《 c.无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题, 必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必 须以平均得益或总得益的现值为根据。 d.无限次重复博弈与有限次重复博弈的共同点:试图“合作”和惩罚 “不合作”是实现理想均衡的关键,是构造高效率均衡战略的核心 构件。 4、根据两人博弈的支付矩阵回答问题: A2,30,0 B, 0,0 4,2 (1)6分) (2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效。 (3)求出该博弈的混合策略纳什均衡。(7分) (1)策略 甲:AB 乙:ab 博弈树(草图如下: & (2)Pure NE (A, a); (B, b) 都是Pareto有效,仅(B, b)是K-H有效。 (3)Mixed NE ((2/5, 3/5); (2/3, 1/3)) 5、用反应函数法求出下列博弈的所有纯战略纳什均衡。 参与人2 … a b c d A 参与人1 B [ C D 解答: 纯策略纳什均衡为(B ,a )与(A ,c ) 分析过程:设两个参与人的行动分别为12a a 和, player1的反应函数221222,,(),B a a B a b R a A a c C a d =⎧⎪ =⎪=⎨=⎪⎪=⎩如果如果如果或者D,如果 player2的反应函数112111 ,,(),D c a A a a B R a c a C c a =⎧⎪ =⎪=⎨=⎪ ⎪=⎩如果如果如果,如果 交点为(B ,a )与(A ,c ),因此纯策略纳什均衡为(B ,a )与(A ,c )。 6、(entry deterrence 市场威慑)考虑下面一个动态博弈:首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。