博弈论各章节课后习题答案 (4)
博弈论课后习题
第一章导论1、什么是博弈?博弈论的主要研究内容是什么?2、设定一个博弈模型必须确定哪几个方面?3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。
4、“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。
5、博弈有哪些分类方法,有哪些主要的类型?6、你正在考虑是否投资100万元开设一家饭店。
假设情况是这样的:你决定开,则0.35的概率你讲收益300万元(包括投资),而0.65的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择?(c)如果你是风险规避的,且期望得益的折扣系数为0.9,你的策略选择是什么?(d)如果你是风险偏好的,期望得益折算系数为1.2,你的选择又是什么?7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。
如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。
逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。
请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。
第二章完全信息静态博弈1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么?2、为什么说纳什均衡是博弈分析中最重要的概念?3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。
4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响?5、下面的得益矩阵表示两博弈方之间的一个静态博弈。
该博弈有没有纯策略纳什均衡?博弈的结果是什么?6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。
7、博弈方1和2就如何分10000元进行讨价还价。
假设确定了以下规则:双方同时提出自己要求的数额S1和S2,,如果s1+s2≤10000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10000,则该笔钱就被没收。
大学mooc博弈论(首师大)满分章节测验答案
第一讲认识博弈论1单选(10分)博弈论的基本要素以下内容,除了()。
A.策略与策略集B.均衡C.支付与支付函数D.局中人正确答案:B你选对了2单选(10分)博弈论的基本假设是强调()。
A.均衡状态B.利益最大化C.个人理性D.集体理性正确答案:C你选对了3单选(10分)哪种表述模型更适合表示二人博弈()。
A.特征函数式B.标准式C.扩展式D.以上都不适合正确答案:B你选对了4单选(10分)根据人们行动为相互作用时,参与人能否达成一个具有约束力的协议,可将博弈分为( )。
A.静态博弈与动态博弈B.常和博弈与非常和博弈C.完全信息博弈与不完全信息博弈D.合作博弈与非合作博弈正确答案:D你选对了5单选(10分)“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”出自哪位诺贝尔经济学奖获得者的名言( )。
A.1994年诺贝尔经济学奖获得者John·NashB.2012年诺贝尔经济学奖获得者Lloyd S. ShapleyC.2005年诺贝尔经济学奖获得者Robert·AumannD.1970年诺贝尔经济学奖获得者Paul A. Samuelson正确答案:D你选对了6多选(15分)博弈论的研究特点包括()。
A.博弈论存在信息的对称性B.博弈论涉及的决策者至少为两人C.博弈论存在信息的不对称性D.博弈论需要考虑其他决策者的决策对自身利益的影响正确答案:B、C、D你选对了7多选(15分)“囚徒困境”反映了()。
A.“看不见的手”是有力的,但不是万能的B.个人理性通过市场机制导致社会福利最优的结论并不总是成立的C.个体理性与集体理性的冲突D.以自我利益为目标的“理性”行为,最终导致了两个囚徒得到相对较劣的收益正确答案:A、B、C、D你选对了8判断(5分)博弈论是一种以数学为基础、研究发生对抗与冲突时如何选择最优策略的一门学问。
正确答案:√你选对了9判断(5分)博弈论是单向的理性决策。
博弈论习题及解答
※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)2. 分别用规范式和扩展式表示下面的博弈。
两个相互竞争的企业考虑同时推出一种相似的产品。
如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。
企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? (见教材)4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。
例子:厂商之间的价格战,广告竞争等。
※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? (见教材)2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。
先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。
然后用划线法求出该矩阵博弈的纯策略Nash均衡。
乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。
乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知,该矩阵博弈没有纯策略Nash均衡。
由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。
解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线,如下图,图中粗的折线,就是F(x)的图象由图可知,纳什均衡点与β1无关,所以原问题化为新的2*2矩阵博弈:由公式计算得:。
大学mooc博弈论(首师大)满分章节测验答案
第一讲认识博弈论1单选(10分)博弈论的基本要素以下内容,除了()。
A.策略与策略集B.均衡C.支付与支付函数D.局中人正确答案:B你选对了2单选(10分)博弈论的基本假设是强调()。
A.均衡状态B.利益最大化C.个人理性D.集体理性正确答案:C你选对了3单选(10分)哪种表述模型更适合表示二人博弈()。
A.特征函数式B.标准式C.扩展式D.以上都不适合正确答案:B你选对了4单选(10分)根据人们行动为相互作用时,参与人能否达成一个具有约束力的协议,可将博弈分为( )。
A.静态博弈与动态博弈B.常和博弈与非常和博弈C.完全信息博弈与不完全信息博弈D.合作博弈与非合作博弈正确答案:D你选对了5单选(10分)“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”出自哪位诺贝尔经济学奖获得者的名言( )。
A.1994年诺贝尔经济学奖获得者John·NashB.2012年诺贝尔经济学奖获得者Lloyd S. ShapleyC.2005年诺贝尔经济学奖获得者Robert·AumannD.1970年诺贝尔经济学奖获得者Paul A. Samuelson正确答案:D你选对了6多选(15分)博弈论的研究特点包括()。
A.博弈论存在信息的对称性B.博弈论涉及的决策者至少为两人C.博弈论存在信息的不对称性D.博弈论需要考虑其他决策者的决策对自身利益的影响正确答案:B、C、D你选对了7多选(15分)“囚徒困境”反映了()。
A.“看不见的手”是有力的,但不是万能的B.个人理性通过市场机制导致社会福利最优的结论并不总是成立的C.个体理性与集体理性的冲突D.以自我利益为目标的“理性”行为,最终导致了两个囚徒得到相对较劣的收益正确答案:A、B、C、D你选对了8判断(5分)博弈论是一种以数学为基础、研究发生对抗与冲突时如何选择最优策略的一门学问。
正确答案:√你选对了9判断(5分)博弈论是单向的理性决策。
博弈论 课后习题答案
博弈论课后习题答案第四部分课后习题答案1. 参考答案:括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙的得益,而b表示甲的得益。
在第三阶段,如果,则乙会选择不打官司。
这时逆推回第二阶段,甲会选择a,0不分,因为分的得益2小于不分的得益4。
再逆推回第一阶段,乙肯定会选择不借,因为借的最终得益0比不借的最终得益1小。
在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是(a,b)。
a,0逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为(a,b)。
b,2在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0),当a,1时乙肯定会选择借,最后双方得益为(a,b)。
在第二阶段如果,则甲会选择a,1b,2分,此时双方得益为(2,2)。
再逆推回第一阶段,乙肯定会选择借,因为借的得益2大于不借的得益1,最后双方的得益(2,2)。
根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况:(1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0得益(1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益(a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。
要本博弈的“威胁”,即“打”是可信的,条件是。
要本博弈的“承诺”,即a,0“分”是可信的,条件是且。
a,0b,2注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。
不过最终的结果并不会超出上面给出的范围。
2. 参考答案:静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。
博弈论练习题答案 张照贵
博弈论练习题(一)一、下面哪些问题适用博弈来模型化∶1、石油输出国组织(OPEC)成员国选择其年产量;2、通用汽车公司向USX购买钢材;3、两厂商,一家制造螺钉,一家制造螺帽,是用公制还是英制;4、公司董事会为其总经理(CEO)设立一项期股安排;5、联合果品公司决定招募工人;6、一电力公司估计了未来10年对电力的需求后,决定是否购置一套新的发电机组。
问题1和3可以用博弈来模型化二、博弈论与经济学的关系是什么?经济学的变化趋势是什么?答:(1)博弈论与经济学的关系:1、博弈论在经济学中的应用最广泛、最成功。
2、经济学家对博弈论的贡献越来越大。
3、经济学和博弈论研究的模式是一样的。
经济学和博弈论都强调个人理性,即在给定的约束条件下追求效用最大化。
(2)经济学发展的几个趋势博弈论成为主流经济学的基石,反映了经济学发展的几个趋势∶1、经济学研究的对象越来越转向个体。
2、经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响及作用,人们之间利益的一致与冲突,竞争与合作的研究。
3、经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。
三、博弈论的构成要素有哪些?答:广义上讲博弈论则主要由以下五大要素构成:一,决策主体(Player):又称局中人或博弈方,指的是博弈中能独立决策、独立行动并承担决策结果的个人或组织。
二,策略空间(Strategy space):又称策略集,是指供参与者选择的策略和行动空间。
三,效用(Utility):也就是博弈者之间相互争夺的利益。
博弈双方或多方都是围绕一定利益展开的,因此博弈胜负的评判结果主要是靠策略选择后的得失来衡量。
四,次序(Orders):即各博弈方在决策时有先后之分,因为博弈方在决策选择上要不时地调整改善,一定要十分注重次序轻重的问题。
如果决策的次序和实施时间不同,则博弈的结果必会有所差别。
五,博弈均衡:博弈虽然是为了利益和胜利,但并非是利益尽占,而是要遵循均衡理论。
吉本斯《博弈论基础》课后习题答案
1.14
证 明 : 在 混 合 战 略 纳 什 均 衡 中 , 参 与 人 i 的 混 合 战 略 为 pi* , 其 中 选 择 第 j 个 纯 战 略 sij 的 概
1.4 对 于 第 i个 厂 商 , 其 目 标 为 最 大 化 自 己 的 利 润 , 即 :
max πi
=
max( p qi ≥0
− c)qi
=
max qi ≥0
(
a
−
qi
−
q−*i
− c)qi
;
由 一 阶 条 件 ∂π i / ∂qi = 0 , 可 得 : qi* = (a − q−*i − c) / 2 … … ( 1)
率 为 pi*j 。 用 反 证 法 证 明 。
假 设 pi*j > 0 , 且 sij 是 第 一 个 被 重 复 剔 除 劣 战 略 所 剔 除 的 战 略 。 那 么 参 与 人 i 必 定 存 在 另 一
个 纯 战 略 Sik, 使 得 ui (sij , p−i ) < ui (sik , p−i ) , p−i 是 其 他 参 与 人 任 意 的 战 略 组 合 。 因 为 sij 第
经济学家-
经济学家-
Gibbons《博弈论基础》第二章习题解答(部分)
2.1 采用逆向归纳法,先最大化家长的收益:给定孩子的行动 A,来选择自己的行动 B,
MaxV B
(I
p
−
洪开荣《经济博弈论》习题答案
《经济博弈论》思考题第1章纳什均衡1、每位学者的贡献都是建立在前者理论基础之上的,排名考虑的因素是理论的原创性。
纳什提出了纳什均衡概念,建立了一种互动分析模式;泽尔腾以纳什均衡为基础建立了策略性思维的动态分析模式;海萨尼提出海萨尼转换及其均衡体系。
2、博弈论学科对数学工具的利用使得博弈论乃至经济学成为一门真正的科学。
博弈均衡数学表达式的简明与繁复意味着背景事实的简明与繁复。
3、要素包括参与人,行动,支付和信息。
明确了三要素也就完成了建模。
模型的表述4分析方法就是关注各个参与人之间的互动及相互之间的影响。
比如,甲、乙两公司分数两个国家,在开发某种新产品时有下面矩阵表示的博弈关系的收益,这些不同策略组合下的收益则是双方互动选择的结果。
5、博弈论和经济学都是基于“理性人”的假设,人们都是追求自身利益的最大化。
以性别战博弈为例,女生选择芭蕾时,尽管男生更偏好足球,但此时他为使收益最大化,会选择芭蕾,即男生的最适反应是芭蕾。
同样,男生选择足球时,尽管女生更偏好芭蕾,但此时她为使收益最大化,会选择足球,即女生的最适反应是足球。
6、(1)博弈双方是在比较每个策略下自己的受益而做出选择,得益值的绝对值也就失去了意义。
必然会选择(不坦白,不坦白),因为这样双方的收益都能最大化。
7、博弈至少是在两方之间进行的,博弈的过程中双方都是理性的,在理性的指引下做出策略选择,故博弈论应包含理性、互动和决策。
其中理性是前提,互动是过程,决策时结果。
博弈过程中,各方都追求其自身的利益最大化,也就是给定对方的策略,自己的策略总是最优的。
博弈双方的两个最优反应以最适合的方式结合起来,也就是互为最适反应,这就会说博弈论的决策方法。
8、以囚徒困境为例,若双方同时选择抵赖,收益为(-1,-1),此时,双方收益和最大,但这种非纳什均衡的情况是不稳定的。
纳什均衡下,双方的策略为(坦白,坦白),收益为(-8,-8),此时收益明显比双方同时抵赖要低。
博弈论各章节课后习题答案 (4)
第四章谈判与协调1.帕累托占优均衡和纳什均衡的关系是什么?纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。
这样的策略组合构成一个均衡局势,并命名为纳什均衡。
纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。
一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。
在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。
其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。
在博弈中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ∗∗∗⋯0i s ∗,0()()i i i j P s P s ∗∗>1,2,,,1,2,,i n j m==⋯⋯则称为博弈G 的帕累托占优纳什均衡。
可见帕累托占有纳什均衡是纳什均衡中收益最大0i s ∗的一种均衡。
2.分别找出具有下列性质的2人博弈的例子。
(1)不存在纯策略纳什均衡;(2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。
(1)不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡(2)该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均衡。
很显然,(和平,和平)是一个帕累托占优纳什均衡。
2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为:TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+200002122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。
试分别基于古诺模型和纳什谈判模型求解两企业的利润。
解:由和400010Q p =−12Q q q =+得124000.1()p q q =−+战争和平国家1战争-5,-58,-10和平-10,810,10所以:[]21121114000.1()(0.120100000)q q q q q π=−+−++211213800.10.2100000q q q q =−−−[]22122224000.1()(0.43220000)q q q q q π=−+−++221223680.10.520000q q q q =−−−12113800.10.40q q q π∂=−−=∂21223680.10q q q π∂=−−=∂21123800.10.403680.10q q q q −−=⎧⎨−−=⎩求解方程组得12880280q q =⎧⎨=⎩将,代入到,中去得到最优解1q 2q 1π2π*1*25488019200ππ⎧=⎪⎨=⎪⎩4.你能否对如下的CG-2×2博弈中x 的变化设计出一些实验方案,来讨论是帕累托占优思想还是风险占优思想在策略选择中起主要作用。
博弈论课后题答案
博弈论课后题答案(总9页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--;第二章第三章PPT问题第四章第五章第六章一、用柠檬原理和逆向选择的思想解释老年人投保困难的原因。
答:“柠檬原理”是在信息不完美且消费者缺乏识别能力的市场中,劣质品赶走优质品,最后搞垮整个市场的机制。
“逆向选择”是在同样不完美信息和消费者缺乏识别能力的市场中,当价格可变时,价格和商品质量循环下降,市场不断向低端发展的机制.高龄人群的保险市场是一个典型的柠檬原理和逆向选择会起作用,从而会导致发展困难的市场。
老年人的健康情况差别很大,比年轻人之间的差别要大得多,而保险公司要了解老年人投保人的实际健康状况又很困难或成本很高,这就造成了保险公司对老年投保人健康状况的信息不完美。
则保险公司就无法根据每个老年投保人的实际健康情况确定不同的保费率,只能根据平均健康情况确定保费率。
这种平均保费率对健康情况很差的老年人是合算的,但对健康状况较好的老年人则不合算。
因此前者倾向于投保,后者则不愿意投保,这就会导致投保的老年人的平均健康情况会很差。
这使得保险公司的赔付风险大大提高,不仅不能赢利而且要亏损,从而失去经营老年保险的积极性,最终导致老年人的投保难问题。
这就是柠檬原理作用的结果。
如果允许调整保费率,那么保险公司为了避免亏损会上调保费率。
而这又会使得原来投保或者准备投保者中相对较健康的老人退出,从而投保老人的平均健康状况会变得更差。
如此循环,最终保费会升得很高而投保老人的平均健康情况则会越来越差,对市场的发展当然是很不利。
这就是逆向选择作用的结果。
二、为什么消费者偏好去大商店买东西而不太信赖走街穿巷的小商贩消费者去大商店更接近无限次重复博弈,商场提供高质量产品的概率更大,虽然个别消费者不一定能对商店以往售出商品的质量作出反应,但消费者群体肯定可以作出反应,因此大商店保持高质量符合自己的长期利益,一股会自觉保证质量,从而消费者也比较可以信任大商店的商品。
博弈论第4章答案
R R M 4.1.a 标准式1↖2 L ’ R ’4,1 0,0 3,0 0,1 2,2 2,2纯战略纳什均衡:( L, L ’ ) ( R, R ’ )子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ )精炼贝叶斯纳什均衡:( L, L ’ )4.1.b 标准式1↖2 L ’ M ’ R ’1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4纯战略纳什均衡:( R, M ’ )子博弈精炼纳什均衡:( R, M ’ )精炼贝叶斯均衡: 没有4.2标准式1↖2 L ’ R ’2,2 2,2 3,0 0,1 0,1 3,0六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。
求混合战略精炼贝叶斯均衡:设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p −−参与者2选择L ’和R ’的概率分别为,(1)q q −在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212120*1*1*0*p p p p p p +=+⇒=给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则:12121212[3*0*(1)][0*3*(1)]2*(1)41:**,*112p q q p q q p p p p p p q +−=+−=−−====又 联立得 所以 L LML LM L RL4.3答案(见4.5)4.4表示方法第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号;第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a )[(,),(,),1/2][(,),(,),1/2][(,),((1),),1/2][(,),(,),1,0]R R u u p R R d u p R R d u u p L R u d p q αα><+−===(b )[(,),(,),1/2,2/3][(,),(,),1,0][(,),(,),0,1]L L u u p q L R d u p q R L u d p q =<====中文版习题4.5答案(a )[(,),(,),1/3,1/2]R R u d p q >=(b )12121212[(,,),(,),1/3,1/2][(,,),(,),1/2,0]L L L u u p p q q L L R u d p p q q ==+<==+=。
博弈论与信息经济学部分课后习题答案
解:(1)成为先行者意味着 3 点:1.企业可以赚取比古诺状态下更多的利润,否则没有动机成为先行者;2.追随企业没有办法威胁 先行企业,即选取产量使己方产量为正,它方产量为负 3.如果另一企业成为先行者,该企业可以成功威胁另一企业max 1q1, q2 100 0.5q1 0.5q2 q1 5q1 q1先求古诺均衡:q195 0.5q2max 2 q1, q2 100 0.5q1 0.5q2 q2 0.5q22q2q1 80, q2 30,因此为满足条件 1,对于任何先行动者来说,必须有 q1 80, q2 30 (否则追随者可以选取产量,使价格等于古诺价格,此时先行者利润低于古诺均衡时情况)a.如果企业 2 成为领导者,观察企业 1 能否采取威胁战略使己方利益为正,对方利益为负: 1 q1, q2 100 0.5q1 0.5q2 q1 5q1 0即: 2 q1, q2 100 0.5q10.5q2 q20.5q2 20 200 2q2 q1 190 q2对于企业 2 的任何产量先行决策 q2 10 ,只要企业 1 威胁其产量 q1 将满足上式,则企业 2 将不敢先行动若 q2 10 ,与先行动者的 q2 30 矛盾。
因此企业 2 不会是先行者b.考虑企业 1 能否成为先行者,由 a 已经知道企业 1 可以成功在企业 1 先行时成功威胁企业 2。
故只需考虑如果企业 1 先行,企业 2 能否威胁企业 1当企业 1 先行动时,企业 2 决策max 2 q1, q2 100 0.5q1 0.5q2 q2 0.5q22 q2 q2 50 0.25q1企业 1 决策:max 1q1, q2 100 0.5q1 0.5q2 q1 5q1 q1 max 70 0.375q1 q1 q1 q1 380 93.33 3因此企业 1 的产量决策范围为 80 q1 93.33而企业 2 要惩罚企业 1 为领导者必须满足2 q1, q2 1 q1, q2 100 0.5q1100 0.5q1 0.5q2 0.5q2q2q1 0.5q22 5q1 00 190 q1 q2 100 0.5q1 q1 180这与 80 q1 93.33 矛盾。
博弈论各章节课后习题答案
9. 求如图所示完全信息动态博弈的子博弈完美纳什均衡(图中数字(a,b,c)分别表示局中人 1、
2、3 的 收 益 )。
1
A1
A2
3
2
C1
C2
B1
B2
(4,2,3)
(1,7,8) 3
C1
C2 C1
3
C2
(5,4,3) (7,6,6) (2,1,9) (0,4,2)
答:局中人 1 采取 A2 行 动 ,局中人 2 采取行动 B1 时,局中人 3 必然采取 C2 行 动( 因为 3<6), 因而该博弈的顶点只能是(7,6,6)。同样对于局中人 3 右边一个子博弈,必然采取 C1 行动 (9>2),因而该博弈的顶点只能是(2,1,9)。进而原博弈简化为:
的定价,qi是企业i的需求量。假设企业生产没有固定成本,并且边际成本为常数c,c<a.假定博弃 重复无穷多次,每次的价格都立即被观察到,企业使用触发策略。求使垄断价格可以作为完美 均衡结果出现的最低贴现因子δ,并解释δ与n的关系。
分以下几个步骤进行。
1)计算纳什均衡 当企业 i 选择价格 pi,其它企业选择价格 pj(j=1,2,…,n,j≠i)时,企业 i 的利润为: πi = (pi − c)qi = (pi − c)(a − pi + b(p1 + p2 + ⋯ + pi−1 + pi+1 + ⋯ + pn )) ,i=1,2,…,n
∂π2 ∂q 2
= a − q1
− 2q2
− q3
−c=0
∂π3 ∂q3
=
a
− q1
− q2
− 2q3
−c
博弈论 战略分析入门第四章课后题答案
Instructor’s Guide to Game Theory: A Nontechnical Introduction to theAnalysis of StrategyChapter 4. Nash Equilibrium1.Objectives and ConceptsThe principle objective of this chapter is to introduce the Nash equilibrium and to convey some notion of the range of possibilities and applications, including the possibilities that there may be no Nash equilibria in pure strategies and the possibility that there may be plural Nash equilibria. (Since mixed strategy equilibria are not introduced until Chapter 8, it is not possible to give a meaningful definition of pure strategies at this point, and is necessary to talk around it a bit.) Important subsidiary concepts are coordination games and Schelling points (or focal point equilibria), heuristic methods of finding the Nash equilibria, such as underlining, and refinement of Nash equilibrium.The chapter begins with an example that is based on Warren Nutter’s game-theoretic version of Bertrand competition, except that in this instance a kind of quality competition is considered. The solution to this game can be found by iterated elimination of dominated strategies (which will not be covered until Chapter 11) and reflects the intuition that it is best to be just one step ahead of the competition. Thus, while it does not have a dominant strategy equilibrium, it has some dominated strategies and a unique Nash equilibrium, and hopefully forms a natural bridge from the study of dominant strategy equilibrium.Games with plural equilibria are introduced with the game of Choosing Radio Formats. The idea that history (or other clues) can establish a Schelling point also comes in with this example. The Market Day game reinforces the idea that plural Nashequilibria can have explanatory value – explaining the persistence of what seem to be arbitrary conventions. Games without Nash equilibria (in pure strategies) are introduced with an escape-evasion game. This is an important category in itself, though the most important applications are in differential games and thus beyond the scope of the book.Accordingly, the concepts areNash EquilibriumUnique Nash EquilibriaFinding Nash EquilibriaPlural Nash EquilibriaThe difficulty of choosing among plural Nash equilibriaSchelling PointsCustom, convention and history as Schelling pointsSchelling points from the logic of the gameRefinementGames without Nash equilibria in pure strategies2. Common Study ProblemsStudents who have not yet grasped the best-response idea will find Nash equilibria even more difficult than dominant strategy equilibria. This is the crisis point for students who have not “got” best response. The best response tables (such as table 2 in the chapter) are designed to make this a little easier, so urge the student to rely on them and on underlining as intermediate steps in their analysis. I sometimes suggest to mystudents that they physically move their fingers along the column or row to pick out the biggest payoff. Making the solution as mechanical as possible will help students over that hump. Another (less troubling) problem is the relationship between Nash and dominant strategy equilibria. Taking dominant strategy equilibria first is a pedagogical convenience, since it is a little easier and will be familiar to students who have seen the Prisoner’s Dilemma in another class, but it can produce the impression that dominant strategy equilibria are not Nash equilibria. The Venn diagram (Figure 1) is meant to speak to that problem, and may need some stress in class.3. For Business StudentsThe key business concepts for this chapter are strategies of location and market niche, in the Location, Location, Location example, but also in the Radio Formats example and in the Hairstyle example in the exercises and discussion questions.4. Class AgendaFirst hour:1)Quiz on earlier material2)Introductory presentation: Nash Equilibria•Assignments3)Discussion: The Blonde Problem AgainSecond Hour:1)Discussion of quiz and assignments2)Play a coordination game in class, with random matching and without discussion.A handout description of the game is given on the next page.Another Random-Matching Two-Person GameOnce again, each person chooses between the strategies of collusion or defecting from the collusive arrangement.Put in your name and circle one of the two statements: either "my strategy is collude" or "my strategy is defect." Your instructor will tell you whether to follow directions A) or B) below.A)After you turn it in, your strategy choice will be matched with that of anotherclass member AT RANDOM, and your bonus points will be based on the payofftable above. There is to be no discussion of your strategy choices.B)You will be matched with your neighbor and may discuss your strategy choice ifyou wish.Payoffs are in GameBucks.TableArt's StrategyCollude DefectCollude (3,3)(0,2)Bob's StrategyDefect(2,0)(1,1)What will you do? Go for the big reward with a "collude" strategy or protect yourself with an "defect" strategy?Student name ____________________________My strategy is (circle one)ColludeDefect3)Discussion:a.Results of the in-class game.b.Give other examples of Schelling points in coordination games. Ideally,these should come from the students, but the following instances maystimulate the discussion if it comes slowly:i.Driving on the right or left-hand side of the road.ii.Speaking the same language.iii.Choosing a profession. Assumption: if both choose the sameprofession, it does not pay well because it is too crowded. Howmany business majors in the class? Engineering? Communications,etc?5. Answers to Exercises and Discussion Questions1.Solving the Game. Explain the advantages and disadvantages of NashEquilibrium as a solution concept for noncooperative games.Nash equilibrium is based on the idea that each player chooses the best response tothe strategy chosen by the other player. This is a clear concept of rationality wheneach person chooses in isolation from the other. Among the shortcomings are 1)Nash equilibrium may not be unique, posing the problem of determining which oftwo or more Nash equilibria may actually be chosen by rational agents, and 2) considering only the list of strategies for the game in normal form, that is, the“pure” strategies, there may not be a Nash equilibrium.2.Location, Location, Location (Again) Not all location problems have similarsolutions. Here is another one: Gacey's and Mimbel's are deciding where to puttheir stores in Metropolis, the town across the river from Gotham City. The three strategies for Metropolis are to locate downtown, in Old Town, or in the Garden District. The payoffs are shown in Table E1.Table E1 Payoffs in a New Location GameGacey'sDowntown Old Town Garden DistrictDowntown70,6060,12080,100Old Town110,7040,40120,110Mimbel'sGardenDistrict120,80110,12050,50Does this game have Nash equilibria? What strategies, if so? Which strategies would you predict that Gacey's and Mimbel's would choose? Compare and contrast this game with the location game in the chapter. What would you say about the relative importance of congestion in the location decisions of the firms in the two cases?A table modified to show the highest payouts for each player for each decision is as follows:Gacey's Downtown Old Town Garden District Downtown 70, 6060, 12080, 100Old Town110, 7040, 40120, 110M i m b e l 's Garden District 120, 80110, 12050, 50There are two Nash Equilibria. When Gacey’s locates in Old Town, Mimbels will locate in the Garden District, and vice versa. Which solution will actually be chosen is not definite.This problem is different from the one in the chapter since there are 2 NashEquilibriums instead of one, which requires a little guesswork as to which one will be the final solution. It is similar in that there is not a dominant strategy equilibrium.Congestion must be more of a problem in this scenario than in the chapterproblem. There is never a Nash equilibrium when both pick the same site. This could be explained by the congestion problem3. Drive on. Two cars meet, crossing, at the intersection of Pigtown Pike and Hiccup Lane. Each has two strategies: wait or go. The payoffs are shown in Table E2.Table E2. The Drive On Game Mercedeswait go wait0,01,5Buick go 5,1-100,-100Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibria? What strategies, if so? Would you predict which strategies rational drivers would choose in this game?Which? Why? Pigtown Borough has decided to put a stoplight at this intersection. How could that make a difference in the game?Here is a table modified to show the maximum payout for each driver:Mercedes Wait Go Wait0, 05, 1B u i c kGo 5, 1-100,-100Once again, there are 2 Nash Equilibria. They are for the Buick to wait and the Mercedes go, or vice versa.To determine which will happen requires guesswork. The personality of thedrivers might determine what happens. If I were in the Mercedes, I would probably not want to risk an expensive car getting damaged. Someone else, say in a CL600, mightfigure that his car is faster and that he can beat the other driver. Also, one of the drivers might just wave the other on rather than have both wait or both go.It is possible that both drivers might wait rather than run the risk of an accident, i.e. choose a risk dominant strategy.The stoplight would provide a Schelling Point to select for the equilibrium at which the driver with the green light chooses go.4. Rock, Paper, Scissors. Here is another common school-yard game called Rock, Paper, Scissors. Two children (we will call them Susan and Tess) simultaneously choose a symbol for rock, paper or scissors. The rules for winning and losing are:Paper covers rock (paper wins over rock)Rock breaks scissors (rock wins over scissors)Scissors cut paper (scissors win over paper)The payoff table is shown as Table E3.Table E3. Rock, Paper, ScissorsSusanpaper stone scissors.paper0,01,-1-1,1Tessstone-1,10,01,-1scissors1,-1-1,10,0Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibria? What strategies, if so? How do you think the little girls will try to play the game?Here is a table modified to show the best responses.Susanpaper stone scissors.paper0,01,-1-1,1Tessstone-1,10,01,-1scissors1,-1-1,10,0We see that there are no dominant strategies, nor are there Nash equilibriain terms of the strategies shown here. We have no basis (so far) to decide how the girls will play the game.NOTE TO INSTRUCTOR For the purist, it is not correct to say here that “thereare no Nash equilibria,” since this game has a mixed-strategy equilibrium. But, of course, we will not cover mixed strategy equilibria until a later chapter. Thecorrect statement is that there is no equilibrium in pure strategies.5. The Great Escape. Refer to Chapter 2, Question 2.Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibrium? What strategies, if so? How can these two opponents each rationally choose a strategy?WardenGuard walls Inspect cellsclimb No escape, success inpreventing escape Escape,failurePrisonerdig Escape,failure No escape, success inpreventing escapeThe numerical payoffs can be assigned in many different ways. Here is a simple version that interprets “no escape” as minus one for the prisoner, plus one for the warden, and “escape” as vice versa. As the underlines show, there is no Nash equilibrium. Thus far, we have no basis to say how a rational person would choose strategies in this case.WardenGuard walls Inspect cellsclimb-1,11,-1Prisonerdig1,-1-1,16. Sibling Rivalry. Refer to Chapter 2, Question 1.Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Determine all the Nash equilibria in this game. Do some Nash Equilibria seem likelier to occur than others? Why?Irismath litmath 3.7, 3.8 4.0, 4.0Julialit 3.8, 4.0 3.7, 4.0If the siblings act independently, rationally and with self- interest (non-cooperatively), we can find two Nash equilibrium's strategies: (literature, math), (math, literature).We note that there is a Schelling point in this game: (Math, Lit) yields a certain 4.0 for both girls, which is a reason it might attract attention, and probably is more likely to be observed.7. Hairsyle.Shaggmopp, Inc. and Shear Delight are hair-cutting salons in the same strip mall, each groping for a market niche. Each can choose one of three styles: punker, contemporary sophisticate, or traditional. Those are their strategies. They already have somewhat different images, based on the personalities of the proprietors, as the names may suggest. The payoff table is shown as Table E4.Table E4. Payoffs for HaircuttersShearpunker sophisticate traditionalpunker35,2050,4060,30Shaggmoppsophisticate30,4025,2535,55traditional20,4040,4520,20Are there any dominant strategies in this game? Is there a dominant strategy equilibrium? Are there any Nash equilibria? How many? Which? How do you know?Once again, here is the modified table:ShearPunkerSophisticate Traditional Punker 35, 2050, 4060, 30Sophisticate 30, 4025, 2535, 55S h a g g m o p pTraditional20, 4040, 4520, 20Shaggmopp’s best strategy is to go punker regardless of what Shear does. This is his dominant strategy. Since Shear has no such dominant strategy, there is no dominant strategy equilibrium.The only Nash equilibrium is when Shear decides to go with the sophisticate look.Since Shear knows that Shaggmopp will probably go punk rather than sophisticate, it will choose sophisticate.6. Quiz questionPlaced on the next page for convenience in copying and printing.Student name ____________________________Quiz – Game TheoryFelix and Oscarina share their home with two cats. Felix, who has a sharp sense of smell, would like for the cat boxes to be cleaned twice a week. Oscarina, whose sense of smell is less acute, would be satisfied if they were cleaned once a week. Each would prefer not to be the one to clean the cat boxes. Their payoffs are shown on the following table.Oscarinadon't clean clean once clean twicedon't clean-5,-30,-17,-5Felixclean once-2,45,26,-4clean twice0,51,32,-3Find any and all Nash equilibria for the catbox game? Are there dominated strategies? Which? Is there a dominant strategy equilibrium? Explain.Answer:A payoff table with best responses underlined follows:Oscarinadon't clean clean once clean twicedon't clean-5,-30,-17,-5Felixclean once-2,45,26,-4clean twice0,51,32,-3The Nash equilibrium is where Felix cleans the cat box twice and Oscarina never cleans. “Clean twice” is a dominated strategy for Oscarina. Since the best response for each person depends on the strategy chosen by the other, there is no dominant strategy equilibrium.It seems that Felix, whose need is greater, will empty the catbox, if the two companions act noncooperatively. Now, it may seem odd that people who live together would act noncooperatively , but life is strange, and odd things do happen. However, a couple of years ago, Oscarina gave Felix a Christmas present – a year of catbox cleaning – and has renewed the gift, so love triumphs after all.。
“博弈论”习题及参考答案
《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。
A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。
A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。
A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。
A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。
A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。
A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。
A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。
A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。
A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。
A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。
A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。
博弈论习题和参考答案与解析
博弈论?习题一、单项选择题1.博弈论中,局中人从一个博弈中得至口的结果常被称为〔〕. A?效用B.支付C.决策D.利润2.博弈中通常包括下面的内容,除了〔〕.A.局中人B.占优战略均衡C策略D?支付3.在具有占优战略均衡的囚徒困境博弈中〔〕.A.只有一个囚徒会坦白氏两个囚徒都没有坦白C?两个囚徒都会坦白D.任何坦白都被法庭否决了4.在屡次重复的双头博弈中,每一个博弈者努力〔〕.A.使行业的总利润到达最大B?使另一个博弈者的利润最小C?使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是〔〕A.策略组合B.策略C信息D.行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最正确行为,此时的博弈具有〔〕0A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D?激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为〔〕.A.一报还一报的策略B.激发策略8.在囚徒困境的博弈中,合作策略会导致〔〕oA博弈双方都获胜B博弈双方都失败C使得先米取行动者获胜D使得后米取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现〔〕oA.当一个垄断竞争行业是由一个主导企业限制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D.当一个寡头行业进行一次博弈时一个企业米取的彳丁为10.与另一个企业在前一阶段采取的行为一致〞这种策略是一种〔〕A.主导策略B.激发策略C.一报还一报策略D.主导策略11-关于策略式博弈,正确的说法是〔〕0A.策略式博弈无法刻划动态博弈B.策略式博弈无法说明行动顺序C.策略式博弈更容易求解D.策略式博弈就是一个支付矩阵12.以下关于策略的表达哪个是错误的〔〕:A.策略是局中人选择的一套行动方案;B.参与博弈的每一个局中人都有假设干个策略;C.一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D.策略与行动是两个不同的概念,策略是行动的规那么,而不是行动本身.13.囚徒困境说明〔〕:A.双方都独立依照自己的利益行事,那么双方不能得到最好的结果;B.如果没有某种约束,局中人也可在〔抵赖,抵赖〕的根底上到达均衡;C.双方都依照自己的利益行事,结果一方赢,一方输;D.每个局中人在做决策时,不需考虑对手的反响14.一个博弈中,直接决定局中人损益的因素是〔〕:A.策略组合B.策略C信息D.行动15.动态博弈参与者在关于博弈过程的信息方面是〔〕A不对称的B对称的C不确定的D无序的16.古诺模型表达了寡头企业的〔〕决策模型A本钱B价格C产量D质量17.伯特兰德模型表达了寡头企业〔〕决策模型.A本钱价格C产量 D 质量18.用囚徒困境来说明两个寡头企业的情况,说明了:〔〕A、每个企业在做决策时,不需考虑竞争对手的反响E. 一个企业制定的价格对其它企业没有影响C、企业为了预防最差的结果,将不能得到更好的结果D、一个企业制定的产量对其它企业的产量没有影响19.子博弈精炼纳什均衡〔〕:A.是一个一般意义上的纳什均衡;B.和纳什均衡没有什么关系;C.要求某一策略组合在每一个子博弈上都构成一个纳什均衡;D.要求某一策略组合在原博弈上都构成一个纳什均衡.20.在一般产品销售市场上,以下哪种原因导致了逆向选择.〔〕A产品质量的不确定性B私人信息C公共信息D产品价格21.完全信息动态博弈参与者的行动是〔〕A无序的B有先后顺序的C不确定的D因环境改变的22.市场交易中普遍存在的讨价还价属于哪种博弈.〔〕A完全信息静态博弈B完全信息动态博弈C不完全信息静态博弈D不完全信息动态博弈23.下面哪种模型是一种动态的寡头市场博弈模型〔〕A古诺模型B伯川德模型C斯塔克尔伯格模型D田忌齐威王赛马24?博弈方根据一组选定的在两种或两种以上可能行为中随机选择的策略为血玄〔、A纯策略B混合策略C激发策略D 一报还一报策略25.影响重复博弈均衡结果的主要因素是〔〕A博弈重复的次数B信息的完备性C支付的大小DA和B26.在动态博弈战略行动中,只有当局中人从实施某一威胁所能获得的总收益()不实施该威胁所获得的总收益时,该威胁才是可信的.A大于B等于C小于D以上都有可能二、判断正误并简要说明理由I,纳什均衡一定是上策均衡,上策均衡一定是纳什均衡.2?在一个博弈中博弈方可以有很多个.3.在一个博弈中只可能存在一个纳什均衡.4.由于零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈.5.在一个博弈中如果存在多个纳什均衡那么不存在上策均衡.6.曲于两个罪犯只打算犯罪一次〞所以被捕后才出现了不合作的问题即囚徒困境.但如果他们打算重复合伙屡次,比方说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供.7,在博弈中纳什均衡是博弈双方能获得的最好结果.8.在博弈中如果某博弈方改变策略后得益增加那么另一博弈方得益减少.9,纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合.10.囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是由于两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长.11.斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润.12.在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系〞使重复博弈无法实现更高效率均衡的关键问题.13.子博弈精炼纳什均衡不是一个纳什均衡.14.零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡.15.原博弈惟一的纳什均衡本身是帕雷托效率意义上最正确战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别.16.在动态博弈中,由于后行动的博弈方可以先观察对方行为后再选择行为 ,因此总是有利的.入计算与分析题1、A、B两企业利用广告进行竞争.假设A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;假设A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;假设A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;假设A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润.〔,〕画出A、B两企业的损益矩阵.〔2 〕求纯策略纳什均衡.2、可口可乐与百事可乐〔参与者〕的价格决策:双方都可以保持价格不变或者提升价格〔策略〕;博弈的目标和得失情况表达为利润的多少〔收益〕;利润的大小取决于双方的策略组合〔收益函数〕;博弈有四种策略组合,其结局是:〔1〕双方都不涨价,各得利润10单位;〔2 〕可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30 ;(3 )可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30 ;(4 )双方都涨价,可口可乐利润140,百事可乐利润35 ;画出两企业的损益矩阵求纳什均衡.3、假定某博弈的报酬矩阵如下:(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>?(2 )如果(上,左)是纳什均衡,上述哪几个不等式必须满足4、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场.如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元.如果一方在价格决策方面选择合作而另一方却选择降低价格,那么合作的厂商获利将为零,竞争厂商将获利900000元.(1)将这一市场用囚徒困境的博弈加以表示.(2 )解释为什么均衡结果可能是两家公司都选择竞争性策略.5、博弈的收益矩阵如下表:⑴如果(上/左)是占优策略均衡/那么a、b、c、d、G、f、g、h之间必然满足哪些关系〔尽量把所有必要的关系式都写出来〕〔2 〕如果〔上,左〕是纳什均衡,那么〔1〕中的关系式哪些必须满足〔3 〕如果〔上,左〕是上策均衡,那么它是否必定是纳什均衡为什么〔4 〕在什么情况下,纯策略纳什均衡不存在6、猪圈里有一头大猪和_头小猪,猪圈的一头有一个饲料槽,另一头装有限制饲料供给的按钮.按一下按钮就会有,0个单位饲料进槽,但谁按谁就要付出2个单位的本钱.谁去按按纽那么谁后到;都去按那么同时到.假设大猪先到,大猪吃到9个单位,小猪吃到一个单位;假设同时到,大猪吃7个单位,小猪吃3个单位;假设小猪先到,大猪吃六个单位,小猪吃4个单位.求〔1〕各种情况组合扣除本钱后的支付矩阵〔2 〕求纳什均衡.7、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润〔单位:万元〕由以下图的得益矩阵给出:1〕有哪些结果是纳什均衡(2 )两厂商合作的结果是什么8、求出以下博弈的所有纯策略纳什均衡.9、求出下面博弈的纳什均衡(含纯策略和混合10、根据两人博弈的损益绸邛仲I答问题:(1) ◎出两人各自的金部策略.图示均衡点.(2 )求出斯塔克博格rstackelberg )均衡情况下的产量、价格和利润.(3)说明导致上述两种均衡结果差异的原因.13.下面的得益矩阵两博弈方之间的一个静态博弈,该博弈有没有纯策略的纳什均衡,博弈的结果是什么14.两个兄弟分一块冰激凌.哥哥先提出一个分割比例 ,弟弟可以接受或拒绝,接受那么按哥哥的提议分割,假设拒绝就自己提出一个比例.但这时候冰激凌已化得只剩1/2 了,对弟弟提议的比例哥哥也可以接受或拒绝,假设接受那么按弟弟的建议分割,假设拒绝冰激凌会全部化光.由于兄弟之间不应该做损人不利己的是“因此我们假设接受和拒绝利益相同时兄弟俩都会接受.求该博弈的子博弈完美纳什均衡.15?如果学生在测试之前全面复习,考好的概率为90%,如果学生只复习一局部重点,那么有50% 的概率考好.全面复习花费的时间tl = 100小时,重点复习之需要花费t2=20小时.学生的效用函数为:U二W-2巳其中W是测试成绩,有上下两种分数Wh和Wl, e为努力学习的时间.问老师如何才能促使学生全面复习16?在以下监工与工人之间的博弈中,试用划线法分析该博弈有无纯策略纳什均衡;如果没有,那么写出混合策略纳什均衡的结果.监工17 ?求解以下博弈的纳什均衡.博弈方29 18 ?某人正在打一场官司,不请律师肯定会输,请律师后的结果与律师的努力程度有关.假设当律师努力工作〔100小时〕时有50%的概率能赢,律师不努力工作<10小时〕那么只有15%的概率能赢.如果诉讼获胜可得到250万元赔偿,失败那么没有赔偿.由于委托方无法监督律师的工作,因此双方约定根据结果付费,赢官司律师可获赔偿金额的10%,失败那么律师一分钱也得不到.如果律师的效用函数为m 0.05e,其中m是报酬e是努力小时数,且律师有时机本钱5万元.求这个博弈的均衡.四、论述题Is解释"囚犯困境;并举商业案例说明.2、用〃小偷与守卫的博弈"说明〃鼓励〔监管〕悖论"博弈论?习题参考答案>单项选择题r 5 B. B. C.D ' A.11 15. B. C. A.6 10 C. A. A.D. C.16 20 C. B. C.21 26. B. B. C. B. D. A.,判断正误并简要说明理由1. F 上策均衡是比纳什均衡更严格的均衡.所以上策均衡一定是纳什均衡 一定是上策均衡,2. T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈3. IF 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在多个纳什均衡4. T 零和博弈才旨参与博弈各方在严格竞争下,一方收益等于另一方损失与损失之和恒为零,所以双方不存在合作可能性而纳什均衡不 ,如性别战.,博弈各方收益 ,只能有一个5.T上策均衡是通过严格下策消去法〔重复剔除下策〕所得到的占优策略纳什均衡6.IF只要两囚犯只打算合作有限次,其最优策略均为招供.比方最后一次合谋,两小偷被抓住了,由于将来没有合作时机了,最优策略均为招供.回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢.依此类推,对于有限次内的任何一次,两小偷均不可能合作.7.F纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的.团F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.T虽然斯塔格伯格模型各方利润总和小于古诺模型〞但是领导者的利润比古诺模型时12..T无限次重复博弈没有结束重复确实定时间;而在有限次重复博弈中,存在最后一次重复,并且正是有结束重复确实定时间,使重复博弈无法实现更高效率均衡.13.F子博弈精炼纳什均衡一定是一个纳什均衡.14.F零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡.15.T原博弈惟一的纳什均衡本身是帕雷托效率意义上最正确战略组合,因此不管是重复有限次还是无限次,不会和一次性博弈有区别.16.F动态博弈是指各博弈方的选择和行动又先后次序的博弈.动态博弈的信息盯以是不对称的.所以策略分为先发制人和.斯塔克伯格博弈揭示“先发制人〞更有禾L而"后发制人"后行动的博弈方可以先观察对方行为后再选择行为反而处于不利境地.三、计算与分析题Is (1)(2)纯策略纳什均衡为(做广告,做广告),(不做广告,不做广告)得长价-20, 30140,35纳什均衡〔不涨价,不涨价〕,〔涨价,涨价〕.从帕累托均衡角度,为〔涨价,涨价〕3、〔 1〕如果〔上/左〕是上策均衡,那么,a>e b>d, g<c, f>h 〔2 〕如果〔上〕左〕是纳什均衡,a>e b>d,不等式必须满足新华航空北方航空 合作竞争50, 50 90, 00, 90 6, 65、 略纳什均衡为〔按,等〕 7、略8、纯策略纳什均衡〔氏甲〕,〔⑴不存在纯策略纳什均衡合作肓争⑵设甲选择"U"的概率为概率为1-P1乙选择"『的概率为P2,贝V选择" R" 的概率为1-P2对甲而言,最正确策略是按定的概率选〃上"和‘下’,使乙选择“左〃和〃右"的期望值相等即PI*8+ (l-PI) *0-P1*1+ (1-P1) *5解得PI = 5/12即⑸12, 7/12 )按5/12概率选〃上“、7/12概率选〃下"为甲的混合策略Nash均衡对乙而言,最正确策略是按一定的概率选“左“和“右",使乙选择〃上"和‘下’的期望值相等即P2*5+(l-P2)*0- P2*2 + (l-P2)*4即(4/7, 3/7肢4/7概率选‘左’、3/7概率选"右"为乙的混合策略Nash均衡10、略.11、见笔记12、见笔记.13、首先,运用严格下策反复消去法的思想,不难发现在博弈方1的策略中,B是相对于T的严格下策.把博弈方1的B策略消去后又可以发现,博弈方2的策略中C是相对于R的严格下策,从而也可以消去.两个博弈方各消去一个策略后的博弈是如下的两人2X 2博弈,己经不存在任何严格下策.再运用划线或箭头法,很容易发现这个2X2博弈有两个纯策略纳什均衡(M,L )和(1R ) 0由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系,一次性静态博弈的结果不能肯定.由于双方在该博弈中可能采取混合策略,因此实际上该博弈的结果可以是4个纯策略组合中的任何一个.14.假设哥的方案是SI: 1-S1淇中S1是自己的份额,弟的方案是S2: 1-S2, S2是哥的份额,那么可用如下的扩展形表示该博弈:Hi SiC5V2eS? 2)CO O)运用逆推归纳法先分析最后一阶段哥的选择.由于只要接受的利益不少于不接受的利益哥就会接受,因此在这个阶段只要弟的方案满足S2/2 $0,也就是S2$0,哥就会接受,否那么不会接受.由于冰激凌的份额不可能是负数,也就是说由于哥不接受弟的方案冰激凌会全部化掉〞因此任何方案哥都会接受.现在回到前一阶段弟的选择.由于弟知道后一阶段哥的选择方法,因此知道如果不接受前一阶段哥提出的比例,自己可以取S2=0,独享此时还未化掉的1/2块冰激凌;如果选择接受前一阶段哥的提议,那么自己将得到出1,显然只要l-Sn/2 ,即S1W1/2,弟就会接受哥的提议.再回到第一阶段哥的选择.哥清楚后两个阶段双方的选择逻辑和结果 ,因此他在这一阶段选择Sl = 1/2,正是能够被弟接受的自己的最大限度份额,超过这个份额将什么都不能得到,因此SI二1/2是最正确选择.综上,该博弈的子博弈完美纳什均衡是:哥哥开始时就提议按(1/2J/2)分割,弟弟接受.15.此题中老帅的调控于段高分和低分的差距.该博弈的扩•展形如下:只有当Ul» U2时学生才会选择全面复习.根据Ul» U2我们可以算出Wh- WD 400o这就是老师能有效全面复习需要满足的条件.其实在奖学金与成绩挂钩时,Wh- W1也可以理解成不同等奖学金的差额.16泄有纯策略均衡,只有混合策略均衡((0. 25,0.75 ),(0. 5,0. 5 ))17. 可以根据画线法求得有唯一纯策略均衡(上,左)18.参见第15题四、论述题1、解释〃囚犯困境〃,并举商业案例说明.(1)假设条件举例:两囚徒被指控是一宗罪案的同案犯.他们被分别关在不同的牢房无法互通信息.各囚徒都被要求坦白罪行.如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年.(2)囚徒困境的策略矩阵表.每个囚徒都有两种策略:坦白或不坦白.表中的数字分别代表囚徒甲和乙的得益.囚徒乙3〕分析:通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都〃坦白〃.给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白.这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不管对方如何选择,个人的最优选择是坦白.其结果是双方都坦白.4〕商业案例:寡头垄断厂商经常发现它们自己处于一种囚徒的困境.当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润.但卡特尔协定不是一个纳什均衡,由于给尢双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润.2用〞小偷与守卫的博弈〃说明〃鼓励〔监管〕悖论〃.〔1〕假设条件举例:偷窃和预防偷窃是小偷和门卫之间进行博弈的一场游戏.门卫可以不睡觉,或者睡觉.小偷可以采取偷、不偷两种策略.如果小偷知道门卫睡觉, 他的最正确选择就是偷;如果门卫不睡觉,他最好还是不偷.对于门卫,如果他知道小偷想偷,他的最正确选择是不睡觉,如果小偷采取不偷,自己最好去睡觉.〔2 〕小偷与门卫的支付矩阵表〔假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住〕:。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章谈判与协调
1.帕累托占优均衡和纳什均衡的关系是什么?
纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。
这样的策略组合构成一个均衡局势,并命名为纳什均衡。
纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。
一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。
在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。
其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。
在博弈
中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ∗∗∗⋯0
i s ∗,0()()i i i j P s P s ∗∗
>1,2,,,1,2,,i n j m
==⋯⋯则称为博弈G 的帕累托占优纳什均衡。
可见帕累托占有纳什均衡是纳什均衡中收益最大
0i s ∗
的一种均衡。
2.分别找出具有下列性质的2人博弈的例子。
(1)不存在纯策略纳什均衡;
(2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。
(1
)不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡
(2)
该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均
衡。
很显然,(和平,和平)是一个帕累托占优纳什均衡。
2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为:
TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000
2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。
试分别基于古诺模型和纳什谈判模型求解两企业的利润。
解:由和400010Q p =−12
Q q q =+得124000.1()
p q q =−+战争
和平国
家
1战争-5,-58,-10和平-10,810,10
所以:
[]21121114000.1()(0.120100000)
q q q q q π=−+−++211213800.10.2100000
q q q q =−−−[]22122224000.1()(0.43220000)
q q q q q π=−+−++221223680.10.520000
q q q q =−−−1211
3800.10.40q q q π∂=−−=∂2122
3680.10q q q π∂=−−=∂21123800.10.403680.10
q q q q −−=⎧⎨−−=⎩求解方程组得12880280
q q =⎧⎨=⎩将,代入到,中去得到最优解1q 2q 1π2π*1*25488019200
ππ⎧=⎪⎨=⎪⎩4.你能否对如下的CG-2×2博弈中x 的变化设计出一些实验方案,来讨论是帕累托占优思想还是风险占优思想在策略选择中起主要作用。
设计试验
(1)a<x<800这时是风险占优思想在策略选择中起主要作用。
A 、B 都会选择行动1。
这里的a 取决于参与人能接受的风险程度。
(2)x.>1000这时是帕累托占优思想起主要作用。
都会选择行动2。
局中人B
1
2局中人
A
1800,800x,020,x 1000,1000。