博弈论第四章习题
博弈论与经济分析(不完全信息静态)
博弈论与经济分析(不完全信息静态)第四章 不完全信息静态博弈不完全信息意味着至少有一个参与者不能确定另一个参与者的收益函数,或者说类型。
我们用一个例子来引入要讨论的问题: 例:信息不对称条件下的古诺模型 市场:P(Q)=a-Q ,Q=q1+q2 企业1:C1(q1)=cq1企业2:以θ的概率为高成本,即222()H C q c q =;以1θ-的概率为低成本,即222()L C q c q =。
当然,H L c c >。
信息不对称:企业2知道自己的成本,也知道企业1的成本;企业1知道自己的成本,但是只知道企业2成本状况的概率分布。
以上都是公共信息,即企业1知道企业2享有信息优势,企业2知道企业1知道,企业1也知道企业2知道企业1知道……如此等等。
解题:企业1会预测企业2在不同情况下的最优选择:当企业2为高成本时2122max[()]H q a q q c q *---当企业2为低成本时2122max[()]L q a q q c q *---既然企业只知道企业2成本情况的概率分布,则企业1只能根据上述预测最大化自己的期望收益:1121121max [(())](1)[(())]H L q a q q c c q a q q c c q θθ**---+----以上三个优化问题的一阶条件为:12()2H H a q c q c **--=12()2LL a q c q c **--=221[()](1)[()]2H L a q c c a q c c q θθ***--+---=联立求解:221()()36H H H L a c c q c c c θ*-+-=+-22()()36L L H L a c c q c c c θ*-+=-- 12(1)3H L a c c c q θθ*-++-=比较该结果与“完全信息条件”条件下结果的不同。
作业:说明企业2在两种成本下是否因为“信息优势”得到了好处?是应该巩固该优势还是向企业1公开信息?一、 静态贝叶斯博弈的标准表述完全信息静态:G={S1,…Sn;u1,…,un}在静态博弈条件下,策略S 就是一个行动A (当然,动态博弈则不同),于是我们可以写作G={A1,…An;u1,…,un}。
博弈论谢识予第四五章参考答案
第四章参考答案2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。
在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。
这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。
3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。
从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次16重复博弈中无法直接运用,因为没有最后一次重复。
因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。
此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。
从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。
例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。
两类重复博弈民间定理的差异也说明了这一点。
最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。
上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。
6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。
这两个纳什均衡的得益都帕累托劣于(B,S)。
一次性博弈中效率较高的(B,S)不可能实现。
博弈论基础讲义-第四章
第四章动态不完全信息博弈第一节. 序贯均衡的内涵一.问题的提出1.序贯理性2.一致信念二.序贯均衡的内涵1.例子2.定义a.行为战略b.序贯理性c.一致信念3.存在性三.序贯均衡的计算1.例子:一般计算2.例子:分析应用第二节. 序贯均衡的应用一.教育和信号传递1.假设2.分析二.垄断限价模型1.假设2.分析三.声誉模型1.假设2.分析四.序贯均衡之再精炼1.剔除劣弱战略2.直观标准3.垄断限价模型第四章不完全信息动态博弈第一节.序贯均衡的内涵一.问题的提出1.序贯理性——参与人在所有情况决策都是理性的,即在给定信念的条件下,以及其他参与人的选择条件下,自身选择是最优的例1:子博弈最优——纳什均衡(,)L l是否合理?——如果参与人2有机会选择,肯定选r而不是l;——(,)L l不是子博弈精炼纳什均衡。
例2:单点信息集最优——纳什均衡(,,)D a l是子博弈纳什均衡;——但如果参与人2有机会选择,但肯定选择d;——(,,)D a l不满足单点信息集理性。
例3:多点信息集最优——纳什均衡(,)A r是子博弈精炼纳什均衡;——(,)A r不满足多点信息集理性。
2.一致信念例1:与客观事实一致u=是否合理?——参与人2的信念2/3——2/3u=是不合理的,因为任何到达参与人2信息集都不可能产生此后验概率;——后验信念必须与先念信念保持一致。
例2:前后信念一致——参与人2的第2个信息集上的信念,是否合理?——不合理,给定参与人战略和第1个信息集的信念,利用贝叶斯法则计算信念与此不一致;——参与人前后信念保持一致。
例3:独立偏离——参与人3的信念0.9u =是否合理?——参与人1和参与人3的偏离是独立的,所以参与人3的合理信念为0.1u =;——不同参与人之间的偏离是独立的总结,一致信念要求:参与人偏离最小化,,参与人之间偏离是独立的;二.序贯均衡的定义1.例子——定义参与人1在信息集1.1和1.3以及参与人2在2.2上的序贯理性;——定义信息集1.3和2.2的信念?2.定义a.行为战略:参与人在某个信息集到行动集映射,——如果某个状态真正发生,参与人如何决策;——序贯理性是否满足?b.序贯理性:在任何信息集上,参与人在给定信念和所有后续行为战略,选择自身行为战略最大化预期效用。
王则柯博弈论4序贯决策博弈
• 试验表明,在分别判断的情况下(也就是人们不能把这两杯冰 淇淋放在一起比较),人们反而愿意为冰淇淋A多付钱。结果 显示,人们愿意花2.26美元买冰淇淋A,却只愿意用1.66美元 买冰淇淋B。 • 说明:人们在作决策的时候,不是象传统经济学那样判断一个 物品的真正价值,而是根据一些比较容易评价的线索来判断。 • 引申:在送礼物的时候,礼物在它所属的类别里面是不是昂贵 很重要。
n人序贯博弈的博弈树的主要特征
• 对于表达有n个局中人P1,P2,…,Pn参与 的一个序贯博弈的博弈树:
1. 在树的每一个非末端节点上,都只有一个局中人 进行决策; 2. 在树的每一个末端节点上,都指派了一个n维的 “支付”向量p(v)=(p1(v),p2(v),…,p3(v)),这 里v是这个末端节点的相应的策略表达.而1, 2,…n是博弈参与人首次决策的自然顺序。
• 博弈树必须说明在每一个决策节点上相应的局中人能够 采取的所有可能的选择。 • 一些博弈树可能包含“不做任何决策”的决策节点。每一个 决策节点都有至少一条棱从它那里出发往后延伸,但是 没有最大延伸数量的限制。 • 对于不是根的每个节点,只能有来自别的节点的唯一的 棱指向它这个节点。
• 博弈树并不要求每个局中人必须在至少一个非末 端节点上进行决策。即,可能会出现某些局中人 并不在任何一个非末端节点上进行决策的情形。
• 策略组合
• 策略组合星号简示法 : ( U ,{ U’ , * } )2 • 策略组合的节点表示法: ( { U / D }, { U’ / D’ , U’’ / D’’ })8
4-4 倒推法(逆向推导法)
• 在序贯博弈中,由于均衡与结果是两个不同的概 念,所以求解纳什均衡的虚线排除确定法,并不适 用于求解序贯博弈的结果。一般使用倒推法(逆向 推导法)求序贯博弈的结果。
博弈论 课后习题答案
博弈论课后习题答案第四部分课后习题答案1. 参考答案:括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙的得益,而b表示甲的得益。
在第三阶段,如果,则乙会选择不打官司。
这时逆推回第二阶段,甲会选择a,0不分,因为分的得益2小于不分的得益4。
再逆推回第一阶段,乙肯定会选择不借,因为借的最终得益0比不借的最终得益1小。
在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是(a,b)。
a,0逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为(a,b)。
b,2在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0),当a,1时乙肯定会选择借,最后双方得益为(a,b)。
在第二阶段如果,则甲会选择a,1b,2分,此时双方得益为(2,2)。
再逆推回第一阶段,乙肯定会选择借,因为借的得益2大于不借的得益1,最后双方的得益(2,2)。
根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况:(1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0得益(1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益(a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。
要本博弈的“威胁”,即“打”是可信的,条件是。
要本博弈的“承诺”,即a,0“分”是可信的,条件是且。
a,0b,2注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。
不过最终的结果并不会超出上面给出的范围。
2. 参考答案:静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。
博弈论课后习题
第一章导论1、什么是博弈博弈论的主要研究内容是什么2、设定一个博弈模型必须确定哪几个方面3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。
4、“囚徒的困境”的内在根源是什么举出现实中囚徒的困境的具体例子。
5、博弈有哪些分类方法,有哪些主要的类型6、你正在考虑是否投资100万元开设一家饭店。
假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。
如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。
逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。
请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。
第二章完全信息静态博弈1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么2、为什么说纳什均衡是博弈分析中最重要的概念3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。
4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响5、下面的得益矩阵表示两博弈方之间的一个静态博弈。
该博弈有没有纯策略纳什均衡博弈的结果是什么6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。
7、博弈方1和2就如何分10 000元进行讨价还价。
假设确定了以下规则:双方同时提出自己要求的数额S1和S2,0≤s1,s2≤10000,如果s1+s2≤10 000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10 000,则该笔钱就被没收。
问该博弈的纯策略纳什均衡是什么如果你是其中一个博弈方,你会要求什么数额,为什么8、设古诺模型中有n家厂商、qi 为厂商i的产量,Q=q1+…+qn 为市场总产量、P为市场出清价格,且已知P=P(Q)=a-Q(当Q<a时,否则P=0)。
博弈论第四章
4 非完全信息动态博弈4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。
参与人2 不知道t,但知道t的概率分布。
博弈的时序:(1)参与人1选择行动a1∈A1;(2)参与人2观察a1,选择a2∈A2博弈的收益:u1(a1, a2, t), u2(a1, a2, t )u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2例:1 RL M 13p 2 1- pL'R'L'R'2 0 0 01 0 1 2标准式表示参与人 2L'R'L2,10,0参与人 1 M0, 20,1R1, 31, 3纯战略纳什均衡: (L,L'), (R,R')均为子博弈精炼纳什均衡(无子博弈)。
但是(R, R')不可信。
排除不可信的纳什均衡:要求1 参与人必须有一个推断(belief).要求2 参与者的战略必须满足序贯理性(sequentially rational).定义: 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下,博弈以正的概率到达该集.要求3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。
例要求3的说明参与人1的类型空间:{ t1,t2,t3,t4 }行动空间:A= { L,R}推断p i: 观察到L后,参与人1的类型是t i的概率。
推断q i: 观察到R后,参与人1的类型是t i的概率。
p1 + p2 + p3 + p4 = 1q1 + q2 + q3 + q4= 1N如果参与人1的战略: t 1选 L ,t 2选 L , t 3选R ,t 4 选R 。
参与人2对p i 与 q i 的推断:p 1 = 3.02.02.0+= 0.4, p 2 = 3.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,例 3个参与人的博弈。
策略博弈习题部分解答
博弈论与政治第三小组作业第二章名词解释:1、理性行为(rational behavior):参与人精于算计并严格按照其最优策略行事。
其中理性有两个重要的内涵:一个人对自己的利益完全了解,并能完美地计算出何种行动可以最大化其利益。
2、不完美信息(imperfect information):在博弈的每一个行动时点上,参与人可能无法获悉决策所需的全部信息。
这包括相关的外部环境——比如天气——的不确定性,以及对方先前或当前的行动。
这类情况称为不完美信息。
3、不完全信息(incomplete information):当一个参与人比另一个参与人了解更多信息时,阴谋诡计就会产生。
这类情况称为不完全信息。
4、合作博弈(cooperative game):博弈论使用两个专门术语来区分协议具有强制力和不具有强制力的情况。
若协议对参与人行为具有强制力,则称此类博弈为合作博弈。
5、非合作博弈(noncooperate game):个体参与人可根据其利益采取行动,则称此类博弈为非合作博弈。
第三章名词解释:1、中间评估函数(intermediate valuation function):赋予非终点结支付的规则被称为中间评估函数。
2、先动优势(firstmover advantage):在博弈的过程中先做决策带来的优势。
先动优势来自于将其自身置于一个优势地位以及迫使其他参与人接受它的承诺能力。
后动优势(second-mover advantage):在博弈的过程中后做决策带来的优势。
后动优势源于自己可对他人选择做出的灵活性。
第四章名词解释:1、占优策略(dominant strategy)、劣策略(dominated strategy):每一个博弈中的参与者通常都拥有不止一个竞争策略,其所有策略的集合构成了该企业的策略集。
在参与者各自的策略集中,如果存在一个与其他竞争对手可能采取的策略无关的最优选择,则称其为占优策略(Dominant Strategy),与之相对的其他策略则为劣势策略。
博弈论第四章 完全且完美信息动态博弈
0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
精的扩展式表述包括四个要素:
✓ 参与人集合(Player) ✓ 每个参与人的战略集合(Strategy) ✓ 博弈的顺序(Order) ✓ 由战略组合决定的每个参与人的支付(Payoff)
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
精选PPT
12
动态博弈的 战略
精选PPT
13
动态博弈的战略的表述
✓ 战略:参与人在给定信息集的情况下选择行动的规则,它规定参 与人在什么情况下选择什么行动,是参与人的“相机行动方案”。
si表示第i个参与人的特定战略
Si si代表第i个参与人所有可选战 择略 的集合
如果n个参与人每人选择战 一略 个, n维向量s (s1,s2, ,si, ,sn)称为一个战略组合 si表示第i个人选择的战略
精选PPT
6
扩展式表示的一个例子
精选PPT
7
博弈树始于 局中人1 的一个决策结点,这时1
要从L和R中作出选择,如果局中人1选择L,其后就
到达 局中人2 的一个决策结点,这时,局中人2要
从L′和R′中作出选择。类似地,如果局中人1选择R, 则将到达局中人2的另一个决策结点。
这时局中人2从L′和R′中选择行动。无论局中人2 选择了哪一个,都将到达终结点 (即博弈结束)且两 局中人分别得到相应终点节下面的收益。
博弈论习题及解答
博弈论习题及解答※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)2. 分别用规范式和扩展式表示下面的博弈。
两个相互竞争的企业考虑同时推出一种相似的产品。
如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。
3. 什么是特征函数? (见教材)4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。
例子:厂商之间的价格战,广告竞争等。
※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? (见教材)2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。
先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。
然后用划线法求出该矩阵博弈的纯策略Nash均衡。
3. 求出下面博弈的纳什均衡。
由划线法易知,该矩阵博弈没有纯策略Nash均衡。
由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。
解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线,如下图,图中粗的折线,就是F(x)的图象由图可知,纳什均衡点与β1无关,所以原问题化为新的2*2矩阵博弈:由公式计算得:。
所以该博弈的纳什均衡点为((2/3,1/3),(0,1/2,1/2)),博弈的值为1。
经济博弈论(第三版)复习题及答案%20谢识予著
自然 赚(35%) 我 开 不开 开 不开 亏(65%)
(300) (100)
(0)Байду номын сангаас(100)
(b)如果我是风险中性的,那么根据开的期望收益与不开收益的比较: 0.35×300+0.65×0=105>100 肯定会选择开。 (c)如果成功的概率降低到 0.3,那么因为这时候开的期望收益与不开的收 益比较: 0.30×300+0.70×0=90<100 因此会选择不开,策略肯定会变化。 (d)如果我是风险规避的,开的期望收益为: 0.9×(0.35×300+0.65×0)=0.9×105=94.5<100 因此也会选择开。 (e)如果我是风险偏好的,那么因为开的期望收益为: 1.2×(0.35×300+0.65×0)=1.2×105=126>100 因此这时候肯定会选择开。 10、首先需要注意的是,在该博弈方的得益单位不同,逃犯得到的是增加或 者减少的刑期(年) ,而看守得到的则是奖金(元) ,因此除非先利用效用概念折 算成相同的单位,否则两博弈方的得益相互之间不能比较和加减。 直接采用单位不同的得益,该博弈的得益矩阵如下: 看 路线一 -10,1000 10,0 守 路线二 10,0 -10,1000
其实,根据该得益矩阵不难得到与上述动态博弈相同的结论,仍然是工人会 选择偷懒和老板会选择克扣。这个博弈实际上与囚徒的困境是相似的。
第二章复习题
4,5,5,7,9,10
第二章参考答案
4、多重纳什均衡不会影响纳什均衡的一致预测性质。这是因为一致预测性 不是指各个博弈方有一致的预测, 而是指每个博弈方自己的策略选择与自己的预
逃 犯
路线一 路线二
该博弈的扩展形表示如下:
逃犯 路线一 看守 路线一 路线二 路线一 路线二 路线二
4博弈论基础作业及答案.doc
博弈论基础作业一、名词解释纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识见PPT二、问答题1 •举出囚徒困境和智猪博弈的现实例子并进行分析。
囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等;以屮小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负, 一个学校最好不减负,因为这样做,可以带來比其他学校更高的升学率。
给定其他学校不减负,这个学校的最佳应对也是不减负。
否则自己的升学率就比其他学校低。
因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。
每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。
请用同样的方法分析其他例子。
智猪博弈的例子:大金业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。
而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。
但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。
因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。
请用同样的方法分析其他例子。
2•请用博弈论來说明“破釜沉舟”和“穷寇勿追”的道理。
破釜沉舟是一个承诺行动。
H的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。
也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。
否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。
穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。
否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。
口己也会付出更大的代价。
3.当求职者向企业声明自己能力强吋,企业未必相信。
但如果求职者拿出自己的各种获奖证书吋,却能在一定程度上传递自己能力强的信息。
这是为什么?由于口头声明几乎没有成本,因此即便是能力差的求职者也会向企业声明自己能力强。
博弈论各章节课后习题答案 (4)
第四章谈判与协调1.帕累托占优均衡和纳什均衡的关系是什么?纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。
这样的策略组合构成一个均衡局势,并命名为纳什均衡。
纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。
一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。
在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。
其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。
在博弈中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ∗∗∗⋯0i s ∗,0()()i i i j P s P s ∗∗>1,2,,,1,2,,i n j m==⋯⋯则称为博弈G 的帕累托占优纳什均衡。
可见帕累托占有纳什均衡是纳什均衡中收益最大0i s ∗的一种均衡。
2.分别找出具有下列性质的2人博弈的例子。
(1)不存在纯策略纳什均衡;(2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。
(1)不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡(2)该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均衡。
很显然,(和平,和平)是一个帕累托占优纳什均衡。
2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为:TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+200002122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。
试分别基于古诺模型和纳什谈判模型求解两企业的利润。
解:由和400010Q p =−12Q q q =+得124000.1()p q q =−+战争和平国家1战争-5,-58,-10和平-10,810,10所以:[]21121114000.1()(0.120100000)q q q q q π=−+−++211213800.10.2100000q q q q =−−−[]22122224000.1()(0.43220000)q q q q q π=−+−++221223680.10.520000q q q q =−−−12113800.10.40q q q π∂=−−=∂21223680.10q q q π∂=−−=∂21123800.10.403680.10q q q q −−=⎧⎨−−=⎩求解方程组得12880280q q =⎧⎨=⎩将,代入到,中去得到最优解1q 2q 1π2π*1*25488019200ππ⎧=⎪⎨=⎪⎩4.你能否对如下的CG-2×2博弈中x 的变化设计出一些实验方案,来讨论是帕累托占优思想还是风险占优思想在策略选择中起主要作用。
35博弈论-第四章
第四章完全信息动态博弈更为现实的考虑是将静态博弈动态化,动态化后,纳什均衡这一概念是否仍然有效呢?答案是部分有效的。
如果不存在动态不一致,那么纳什均衡在完全信息动态博弈中仍不失为一个有用的均衡概念,但纳什均衡概念本身并不能保证不出现动态不一致,为了克服这一点在纳什均衡的基础上生产了所谓子博弈完美均衡。
而这一章,我们将围绕这子博弈完美均衡来展开。
第一节完美信息与完全但不完美信息完全信息动态博弈可以分为两类,即完美信息与完全但不完美信息。
所谓的完美信息博弈,是指博弈中的后行动者始终能够观察到前行动者的行动,因而动态博弈中不存在参与者同时行动这样的情况。
而完全但不完美信息博弈,则指动态博弈中,至少存在两个参与者同时行动的情况,因而“后行动者”无法观察到“前行动者”的行动。
我们不妨用两个例子来加以说明。
例4.1 动态囚徒困境囚徒1图4-1 动态囚徒困境例4.2 取消管制政府图4-2 取消管制与图4-2完全等价的表示方法见图4-3。
政府图4-3 取消管制定义4.1完美信息动态博弈就是不存在同时行动的完全信息动态博弈。
显然,运用策略式来描述动态博弈会非常不便,特别是当信息不完全时更是如此,为了更简便地描述动态博弈,我们将引入一种新的博弈表达式——扩展式。
第二节动态博弈的扩展式我们把博弈中所有从开始到结束的行动序列称为全历史(Terminal history),而用参与者函数来表示在每一个全历史上,在博弈进行到某个阶段时谁来行动。
因而要完整地描述一个动态博弈,必须具备四个要素:(1)参与者集合;(2)全历史集合;(3)参与者函数;(4)偏好。
如果我们把全历史表示成一个行动序列(a1, a2,…, a K)(K为自然数,当K→∞时,就表示无穷动态博弈),那么(a1, a2, …, a m),其中m K≤,就称为全历史(a1, a2, …, a K)的子历史(Subhistory)。
当m < K时,(a1,a2, …, a m)就是全历史(a1, a2, …, a K)的真子历史(Proper subhistory)。
博弈论第4章答案
R R M 4.1.a 标准式1↖2 L ’ R ’4,1 0,0 3,0 0,1 2,2 2,2纯战略纳什均衡:( L, L ’ ) ( R, R ’ )子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ )精炼贝叶斯纳什均衡:( L, L ’ )4.1.b 标准式1↖2 L ’ M ’ R ’1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4纯战略纳什均衡:( R, M ’ )子博弈精炼纳什均衡:( R, M ’ )精炼贝叶斯均衡: 没有4.2标准式1↖2 L ’ R ’2,2 2,2 3,0 0,1 0,1 3,0六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。
求混合战略精炼贝叶斯均衡:设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p −−参与者2选择L ’和R ’的概率分别为,(1)q q −在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212120*1*1*0*p p p p p p +=+⇒=给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则:12121212[3*0*(1)][0*3*(1)]2*(1)41:**,*112p q q p q q p p p p p p q +−=+−=−−====又 联立得 所以 L LML LM L RL4.3答案(见4.5)4.4表示方法第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号;第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a )[(,),(,),1/2][(,),(,),1/2][(,),((1),),1/2][(,),(,),1,0]R R u u p R R d u p R R d u u p L R u d p q αα><+−===(b )[(,),(,),1/2,2/3][(,),(,),1,0][(,),(,),0,1]L L u u p q L R d u p q R L u d p q =<====中文版习题4.5答案(a )[(,),(,),1/3,1/2]R R u d p q >=(b )12121212[(,,),(,),1/3,1/2][(,,),(,),1/2,0]L L L u u p p q q L L R u d p p q q ==+<==+=。
博弈论4 重复博弈
重复三价博弈的等价模型 不可信报复
第一阶段不管选什么策略,二阶段都选 (M,M),于是将(3,3)加到其余策略上,得到 右边等价的得益矩阵。结果第一阶段最 佳策略不是(H,H),而是(M,M)
囚徒2 坦 白 不坦白 囚 坦白 -5,-5 徒 1 不坦白 -8,0 0,-8
-1,-1
(-5,-5)
囚徒2 坦 白 不坦白 囚 坦白 -10,-10 -5,-13 徒 -13,-5 -6,-6 1 不坦白 (-10,-10)
二、一般结论 定理:设原博弈G有唯一的纯策略纳什 均衡,则对任意整数T,重复博弈 G(T)有 唯 一的子博弈完美纳什均衡,即各博弈 方每个阶段都采用G的纳什均衡策略。
4.2.1 两人零和博弈的有限次重复博弈
以零和博弈为原博弈的有限次重复博弈中,所 有博弈方的唯一选择策略是重复一次性博弈中 的纳什均衡策略 (混合策略纳什均衡)。
原因:重复不会改变博弈效率是利益是 对立的不可调和的。
4.2.2唯一纯策略纳什均衡博弈的 有限次重复博弈
唯一的Nash均衡有两种: 一是:本身是帕雷托最优的。它都符合双方的利益, 重复不会改变 二是:本身不是帕雷托最优的。重复能否改变得益? 一、有限次重复囚徒的困境博弈
两人零和博弈有限次重复的所有阶段都不可能发生合 作,因为他们的利益关系是完全对立的。博弈方会一 直重复原博弈的混合策略纳什均衡。 两人零和博弈无限次重复的所有阶段都不可能发生合 作,博弈方会一直重复原博弈的混合策略纳什均衡 由于无限次重复博弈没有最后一个阶段,所以无法用 逆向归纳法证明。 类似的方法是从无限次重复博弈的第t阶段,进行逆向 归纳。注意t是任意的。
博弈论第四章习题
第四章习题一、如果T次重复齐威王田忌赛马,双方在该重复博弈中的策略是什么?博弈结果如何?答:因为这是零和博弈,结论比较具体。
重复Nash 均衡,均以1/6的概率选择各个策略,期望收益分别为1和-1。
因为这是竞争性的零和博弈,无论是有限次重复博弈还是无限次的重复博弈,均不能达成合作的条件。
二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。
答:火车站和机场餐饮业的服务的顾客往往是一次性的,回头客和常客也比较少,价格高,质量差,一次性博弈。
效率也比较低。
商业区和居民区的餐饮业和商业服务业,回头客和常客比较多,比较注重信誉,质优、价廉,重复博弈。
效率也比较高。
三、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?答:动态博弈的逆向归纳法可以用于有限次重复博弈,但不能用于无限次重复博弈,主要用逆向归纳法。
无限次重复博弈的效率往往高于有限次重复博弈。
当重复次数较少不一定考虑贴现问题,但无限次重复博弈必须考虑贴现问题。
启发:重视有限次与无限次的区别,区分和研究这两类博弈,在实践方面重要启发是促进和保持经济的长期稳定和可持续发展,提高社会经济效率是非常有意义的。
四、判断下列表述是否正确,并作简单讨论:(1)有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。
答:不一定。
对于有两个以上纯策略纳什均衡的条件下就不一定。
如“触发策略”就不是。
(2)有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。
答:是,根据子博弈完美纳什均衡的要求,最后一次必须是原博弈的一个纳什均衡。
(3)无限次重复博弈均衡解的得益一定优于原博弈均衡解的得益。
答:错。
如严格竞争的零和博弈就不优于。
(4)无限次重复古诺产量博弈不一定会出现合谋生产垄断产量的现象。
答:正确。
合谋生产垄断产量是有条件的,由贴现率来反映,当不满足条件时,就不能构成激励。
(5)如果博弈重复无限次或者每次结束的概率足够小,而得益的时间贴现率 充分接近1,那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。
吉本斯-博弈论基础答案
1 2 的收益贴现到t期可得 1 − δ (a − c) / 8 , 1 2 2 触发战略有效的条件是: 1 − δ (a − c ) / 8 > (a − c) / 4 ,得到: δ > 1/ 2
(可参见谢识予的《经济博弈论》习题解答) 。 2.14 略 2.15 (1)垄断的产量、价格、利润: π=Q(a-Q)-CQ 利润最大化时:a-2Q=C,从而 Q=(a-c)/2. 此时价格为(a-c)/2。 (2)古诺均衡下的产量、价格、利润: π=(a-∑qi) qi -cqi
(*)
因 此 当 增 加 S 时 , U1 ( I c − S ) 会 减 小 , 同 时 , d ( S + B ) / dS > 0 , ∴ S + B 会 增 加 ,
∴ U 2 ( S + B ) 会增加,因为(*)式, U 2 ( S + B ) 增加的幅度比 U1 ( I1 − S ) 减小的幅度大,所以
如果参与者推断自然选择左边博弈的概率23参与者2选l如果参与者推断自然选择左边博弈的概率23参与者2选l和选r无差异如果参与者推断自然选择左边博弈的概率23参与者2选r如果参与者推断自然选择左边博弈的概率23参与者2选l如果参与者推断自然选择左边博弈的概率23参与者2选l和选r无差异如果参与者推断自然选择左边博弈的概率23参与者2选r自然选择左边博弈时参与者1选t参与者2选l
由 一 阶 条 件 ∂π i / ∂qi = 0 , 可 得 : qi = (a − q− i − c) / 2 … … ( 1)
* *
( 1) 式 两 端 乘 以 2, 再 减 qi , 可 得 : qi = a − Q − c … … ( 2), 对 于 任 意 的 i 都 成 立 。
博弈论 战略分析入门第四章课后题答案
Instructor’s Guide to Game Theory: A Nontechnical Introduction to theAnalysis of StrategyChapter 4. Nash Equilibrium1.Objectives and ConceptsThe principle objective of this chapter is to introduce the Nash equilibrium and to convey some notion of the range of possibilities and applications, including the possibilities that there may be no Nash equilibria in pure strategies and the possibility that there may be plural Nash equilibria. (Since mixed strategy equilibria are not introduced until Chapter 8, it is not possible to give a meaningful definition of pure strategies at this point, and is necessary to talk around it a bit.) Important subsidiary concepts are coordination games and Schelling points (or focal point equilibria), heuristic methods of finding the Nash equilibria, such as underlining, and refinement of Nash equilibrium.The chapter begins with an example that is based on Warren Nutter’s game-theoretic version of Bertrand competition, except that in this instance a kind of quality competition is considered. The solution to this game can be found by iterated elimination of dominated strategies (which will not be covered until Chapter 11) and reflects the intuition that it is best to be just one step ahead of the competition. Thus, while it does not have a dominant strategy equilibrium, it has some dominated strategies and a unique Nash equilibrium, and hopefully forms a natural bridge from the study of dominant strategy equilibrium.Games with plural equilibria are introduced with the game of Choosing Radio Formats. The idea that history (or other clues) can establish a Schelling point also comes in with this example. The Market Day game reinforces the idea that plural Nashequilibria can have explanatory value – explaining the persistence of what seem to be arbitrary conventions. Games without Nash equilibria (in pure strategies) are introduced with an escape-evasion game. This is an important category in itself, though the most important applications are in differential games and thus beyond the scope of the book.Accordingly, the concepts areNash EquilibriumUnique Nash EquilibriaFinding Nash EquilibriaPlural Nash EquilibriaThe difficulty of choosing among plural Nash equilibriaSchelling PointsCustom, convention and history as Schelling pointsSchelling points from the logic of the gameRefinementGames without Nash equilibria in pure strategies2. Common Study ProblemsStudents who have not yet grasped the best-response idea will find Nash equilibria even more difficult than dominant strategy equilibria. This is the crisis point for students who have not “got” best response. The best response tables (such as table 2 in the chapter) are designed to make this a little easier, so urge the student to rely on them and on underlining as intermediate steps in their analysis. I sometimes suggest to mystudents that they physically move their fingers along the column or row to pick out the biggest payoff. Making the solution as mechanical as possible will help students over that hump. Another (less troubling) problem is the relationship between Nash and dominant strategy equilibria. Taking dominant strategy equilibria first is a pedagogical convenience, since it is a little easier and will be familiar to students who have seen the Prisoner’s Dilemma in another class, but it can produce the impression that dominant strategy equilibria are not Nash equilibria. The Venn diagram (Figure 1) is meant to speak to that problem, and may need some stress in class.3. For Business StudentsThe key business concepts for this chapter are strategies of location and market niche, in the Location, Location, Location example, but also in the Radio Formats example and in the Hairstyle example in the exercises and discussion questions.4. Class AgendaFirst hour:1)Quiz on earlier material2)Introductory presentation: Nash Equilibria•Assignments3)Discussion: The Blonde Problem AgainSecond Hour:1)Discussion of quiz and assignments2)Play a coordination game in class, with random matching and without discussion.A handout description of the game is given on the next page.Another Random-Matching Two-Person GameOnce again, each person chooses between the strategies of collusion or defecting from the collusive arrangement.Put in your name and circle one of the two statements: either "my strategy is collude" or "my strategy is defect." Your instructor will tell you whether to follow directions A) or B) below.A)After you turn it in, your strategy choice will be matched with that of anotherclass member AT RANDOM, and your bonus points will be based on the payofftable above. There is to be no discussion of your strategy choices.B)You will be matched with your neighbor and may discuss your strategy choice ifyou wish.Payoffs are in GameBucks.TableArt's StrategyCollude DefectCollude (3,3)(0,2)Bob's StrategyDefect(2,0)(1,1)What will you do? Go for the big reward with a "collude" strategy or protect yourself with an "defect" strategy?Student name ____________________________My strategy is (circle one)ColludeDefect3)Discussion:a.Results of the in-class game.b.Give other examples of Schelling points in coordination games. Ideally,these should come from the students, but the following instances maystimulate the discussion if it comes slowly:i.Driving on the right or left-hand side of the road.ii.Speaking the same language.iii.Choosing a profession. Assumption: if both choose the sameprofession, it does not pay well because it is too crowded. Howmany business majors in the class? Engineering? Communications,etc?5. Answers to Exercises and Discussion Questions1.Solving the Game. Explain the advantages and disadvantages of NashEquilibrium as a solution concept for noncooperative games.Nash equilibrium is based on the idea that each player chooses the best response tothe strategy chosen by the other player. This is a clear concept of rationality wheneach person chooses in isolation from the other. Among the shortcomings are 1)Nash equilibrium may not be unique, posing the problem of determining which oftwo or more Nash equilibria may actually be chosen by rational agents, and 2) considering only the list of strategies for the game in normal form, that is, the“pure” strategies, there may not be a Nash equilibrium.2.Location, Location, Location (Again) Not all location problems have similarsolutions. Here is another one: Gacey's and Mimbel's are deciding where to puttheir stores in Metropolis, the town across the river from Gotham City. The three strategies for Metropolis are to locate downtown, in Old Town, or in the Garden District. The payoffs are shown in Table E1.Table E1 Payoffs in a New Location GameGacey'sDowntown Old Town Garden DistrictDowntown70,6060,12080,100Old Town110,7040,40120,110Mimbel'sGardenDistrict120,80110,12050,50Does this game have Nash equilibria? What strategies, if so? Which strategies would you predict that Gacey's and Mimbel's would choose? Compare and contrast this game with the location game in the chapter. What would you say about the relative importance of congestion in the location decisions of the firms in the two cases?A table modified to show the highest payouts for each player for each decision is as follows:Gacey's Downtown Old Town Garden District Downtown 70, 6060, 12080, 100Old Town110, 7040, 40120, 110M i m b e l 's Garden District 120, 80110, 12050, 50There are two Nash Equilibria. When Gacey’s locates in Old Town, Mimbels will locate in the Garden District, and vice versa. Which solution will actually be chosen is not definite.This problem is different from the one in the chapter since there are 2 NashEquilibriums instead of one, which requires a little guesswork as to which one will be the final solution. It is similar in that there is not a dominant strategy equilibrium.Congestion must be more of a problem in this scenario than in the chapterproblem. There is never a Nash equilibrium when both pick the same site. This could be explained by the congestion problem3. Drive on. Two cars meet, crossing, at the intersection of Pigtown Pike and Hiccup Lane. Each has two strategies: wait or go. The payoffs are shown in Table E2.Table E2. The Drive On Game Mercedeswait go wait0,01,5Buick go 5,1-100,-100Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibria? What strategies, if so? Would you predict which strategies rational drivers would choose in this game?Which? Why? Pigtown Borough has decided to put a stoplight at this intersection. How could that make a difference in the game?Here is a table modified to show the maximum payout for each driver:Mercedes Wait Go Wait0, 05, 1B u i c kGo 5, 1-100,-100Once again, there are 2 Nash Equilibria. They are for the Buick to wait and the Mercedes go, or vice versa.To determine which will happen requires guesswork. The personality of thedrivers might determine what happens. If I were in the Mercedes, I would probably not want to risk an expensive car getting damaged. Someone else, say in a CL600, mightfigure that his car is faster and that he can beat the other driver. Also, one of the drivers might just wave the other on rather than have both wait or both go.It is possible that both drivers might wait rather than run the risk of an accident, i.e. choose a risk dominant strategy.The stoplight would provide a Schelling Point to select for the equilibrium at which the driver with the green light chooses go.4. Rock, Paper, Scissors. Here is another common school-yard game called Rock, Paper, Scissors. Two children (we will call them Susan and Tess) simultaneously choose a symbol for rock, paper or scissors. The rules for winning and losing are:Paper covers rock (paper wins over rock)Rock breaks scissors (rock wins over scissors)Scissors cut paper (scissors win over paper)The payoff table is shown as Table E3.Table E3. Rock, Paper, ScissorsSusanpaper stone scissors.paper0,01,-1-1,1Tessstone-1,10,01,-1scissors1,-1-1,10,0Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibria? What strategies, if so? How do you think the little girls will try to play the game?Here is a table modified to show the best responses.Susanpaper stone scissors.paper0,01,-1-1,1Tessstone-1,10,01,-1scissors1,-1-1,10,0We see that there are no dominant strategies, nor are there Nash equilibriain terms of the strategies shown here. We have no basis (so far) to decide how the girls will play the game.NOTE TO INSTRUCTOR For the purist, it is not correct to say here that “thereare no Nash equilibria,” since this game has a mixed-strategy equilibrium. But, of course, we will not cover mixed strategy equilibria until a later chapter. Thecorrect statement is that there is no equilibrium in pure strategies.5. The Great Escape. Refer to Chapter 2, Question 2.Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibrium? What strategies, if so? How can these two opponents each rationally choose a strategy?WardenGuard walls Inspect cellsclimb No escape, success inpreventing escape Escape,failurePrisonerdig Escape,failure No escape, success inpreventing escapeThe numerical payoffs can be assigned in many different ways. Here is a simple version that interprets “no escape” as minus one for the prisoner, plus one for the warden, and “escape” as vice versa. As the underlines show, there is no Nash equilibrium. Thus far, we have no basis to say how a rational person would choose strategies in this case.WardenGuard walls Inspect cellsclimb-1,11,-1Prisonerdig1,-1-1,16. Sibling Rivalry. Refer to Chapter 2, Question 1.Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Determine all the Nash equilibria in this game. Do some Nash Equilibria seem likelier to occur than others? Why?Irismath litmath 3.7, 3.8 4.0, 4.0Julialit 3.8, 4.0 3.7, 4.0If the siblings act independently, rationally and with self- interest (non-cooperatively), we can find two Nash equilibrium's strategies: (literature, math), (math, literature).We note that there is a Schelling point in this game: (Math, Lit) yields a certain 4.0 for both girls, which is a reason it might attract attention, and probably is more likely to be observed.7. Hairsyle.Shaggmopp, Inc. and Shear Delight are hair-cutting salons in the same strip mall, each groping for a market niche. Each can choose one of three styles: punker, contemporary sophisticate, or traditional. Those are their strategies. They already have somewhat different images, based on the personalities of the proprietors, as the names may suggest. The payoff table is shown as Table E4.Table E4. Payoffs for HaircuttersShearpunker sophisticate traditionalpunker35,2050,4060,30Shaggmoppsophisticate30,4025,2535,55traditional20,4040,4520,20Are there any dominant strategies in this game? Is there a dominant strategy equilibrium? Are there any Nash equilibria? How many? Which? How do you know?Once again, here is the modified table:ShearPunkerSophisticate Traditional Punker 35, 2050, 4060, 30Sophisticate 30, 4025, 2535, 55S h a g g m o p pTraditional20, 4040, 4520, 20Shaggmopp’s best strategy is to go punker regardless of what Shear does. This is his dominant strategy. Since Shear has no such dominant strategy, there is no dominant strategy equilibrium.The only Nash equilibrium is when Shear decides to go with the sophisticate look.Since Shear knows that Shaggmopp will probably go punk rather than sophisticate, it will choose sophisticate.6. Quiz questionPlaced on the next page for convenience in copying and printing.Student name ____________________________Quiz – Game TheoryFelix and Oscarina share their home with two cats. Felix, who has a sharp sense of smell, would like for the cat boxes to be cleaned twice a week. Oscarina, whose sense of smell is less acute, would be satisfied if they were cleaned once a week. Each would prefer not to be the one to clean the cat boxes. Their payoffs are shown on the following table.Oscarinadon't clean clean once clean twicedon't clean-5,-30,-17,-5Felixclean once-2,45,26,-4clean twice0,51,32,-3Find any and all Nash equilibria for the catbox game? Are there dominated strategies? Which? Is there a dominant strategy equilibrium? Explain.Answer:A payoff table with best responses underlined follows:Oscarinadon't clean clean once clean twicedon't clean-5,-30,-17,-5Felixclean once-2,45,26,-4clean twice0,51,32,-3The Nash equilibrium is where Felix cleans the cat box twice and Oscarina never cleans. “Clean twice” is a dominated strategy for Oscarina. Since the best response for each person depends on the strategy chosen by the other, there is no dominant strategy equilibrium.It seems that Felix, whose need is greater, will empty the catbox, if the two companions act noncooperatively. Now, it may seem odd that people who live together would act noncooperatively , but life is strange, and odd things do happen. However, a couple of years ago, Oscarina gave Felix a Christmas present – a year of catbox cleaning – and has renewed the gift, so love triumphs after all.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章习题
一、如果T次重复齐威王田忌赛马,双方在该重复博弈中的策略是什么?博弈结果如何?
答:因为这是零和博弈,结论比较具体。
重复Nash 均衡,均以1/6的概率选择各个策略,期望收益分别为1和-1。
因为这是竞争性的零和博弈,无论是有限次重复博弈还是无限次的重复博弈,均不能达成合作的条件。
二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。
答:火车站和机场餐饮业的服务的顾客往往是一次性的,回头客和常客也比较少,价格高,质量差,一次性博弈。
效率也比较低。
商业区和居民区的餐饮业和商业服务业,回头客和常客比较多,比较注重信誉,质优、价廉,重复博弈。
效率也比较高。
三、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?
答:动态博弈的逆向归纳法可以用于有限次重复博弈,但不能用于无限次重复博弈,主要用逆向归纳法。
无限次重复博弈的效率往往高于有限次重复博弈。
当重复次数较少不一定考虑贴现问题,但无限次重复博弈必须考虑贴现问题。
启发:重视有限次与无限次的区别,区分和研究这两类博弈,在实践方面重要启发是促进和保持经济的长期稳定和可持续发展,提高社会经济效率是非常有意义的。
四、判断下列表述是否正确,并作简单讨论:
(1)有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。
答:不一定。
对于有两个以上纯策略纳什均衡的条件下就不一定。
如“触发策略”就不是。
(2)有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。
答:是,根据子博弈完美纳什均衡的要求,最后一次必须是原博弈的一个纳什均衡。
(3)无限次重复博弈均衡解的得益一定优于原博
弈均衡解的得益。
答:错。
如严格竞争的零和博弈就不优于。
(4)无限次重复古诺产量博弈不一定会出现合谋生产垄断产量的现象。
答:正确。
合谋生产垄断产量是有条件的,由贴现率来反映,当不满足条件时,就不能构成激励。
(5)如果博弈重复无限次或者每次结束的概率足够小,而得益的时间贴现率 充分接近1,那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。
答:这就是无限次重复博弈的民间定理。
(6)触发策略所构成的均衡都是子博弈完美纳什均衡。
答:错误。
触发策略本身并不能排除重复博弈中不可信的威胁和承诺,因此由触发策略构成的不一定是子博弈完美纳什均衡。
五、为什么消费者偏好去大商店买东西而不太信赖走街穿巷的小商贩?
答:去大商店买东西,重复博弈——合作诚信问题;走街穿巷的小商贩,一次性博弈——没有合作的必要,存在不诚信和欺诈。
建立信用制度和诚信档案的必要性。
六、寡头的古诺产量博弈中,如果市场需求130P Q =-,边际成本30C =且没有固定成本,贴现因子0.9δ=。
如果该市场有长期稳定性,问两个厂商能否维持垄断产量?
解:⎩⎨⎧---=
---=222121121130)13030)130q q q q q q q q ((ππ,古诺产量 3100*2
*
1==q q ,利润为:910000*2*1==ππ 垄断产量q q q 30)130--=(π,
250050==⇒m m q π, 市场长期稳定的,
12502=m π 1250011250112502=-=+++δ
δδ)( ,9.0=δ 如果一厂商偏离:111130)25130q q q ---=
(π,5.371=⇒q ,25.1406**1=π 那么:)
()(δδδδ-+=+++191000025.140691000025.14062 1250025.114061000025.1406《=+=
因此,坚持垄断产量是明智的。
七、如果上一题厂商1的边际成本该为10,厂商2的边际成本仍然是30。
假设市场仍然是长期稳定的,而且两个厂商已经达成了厂商1生产3/4,厂商2生产1/4的垄断产量分配协议,问这种协议是否能够长期维持?
解:⎩⎨⎧---=
---=222121121130)13010)130q q q q q q q q ((ππ,古诺产量 3803140*2*1==q q ,,利润为:9
6400919600*2*1==ππ, 垄断产量Q Q Q Q 3025.01075.0)130⨯-⨯--=(π,
2115Q Q -=,
5.57=⇒m Q ,产量分别为:125.43,375.14;9375.6103125.269521==m m ππ,
如果两个厂商均不偏离:375.610919375.610125.2695313125.2695=-=-δ
δ, 厂商1偏离:
2111111625.10510)375.14130q q q q q -=---=(π,
8125.521=q ,16.27891=π
1960016.27899
1960016.27892+=+++)( δδ 125.2695316.22389<=不偏离
厂商2偏离:
222230)125.43130q q q ---=(π,4375.282=q ,
6914
.8082=π
64006914.8089
64006914.8082+=+++)( δδ 375.61096914.7208>=偏离
还可以计算出不同的δ,可以进一步讨论。
八、两个人合作开发一项产品,能否成功与两个人的工作态度有关,设成功概率如下:
再假设成功时每人有4单位的利益,失败则双方都没有利益,偷懒本身有1单位的利益。
问该博弈无限次重复博弈的均衡是什么?
解:根据问题的假设,该博弈的得益矩阵如下:
一次性博弈显然是囚徒困境式博弈,唯一的纳什均衡两人都偷懒,双方的期望得益都是2。
在无限次重复博弈中,假设双方为了在共同努力方面实现合作采取如下的触发策略:开始时努力,一旦发现对方不努力,则自己也偷懒。
我们可以分析当
贴现因子
δ符合什么条件时,该策略构成子博弈完美纳什均衡。
不偏离:)
()(δδδ-=+++149149
2 偏离:)
()(δδδ-+=+++12212252 当满足:)()(δδ-+≥-1221149,也就是2
1≥δ时采取这种触发策略是正确的,否则,偏离是正确的。
当2
1≥δ时,两博弈方都采用这样的触发策略是本博弈的子博弈完美纳什均衡;如果21<δ,则上述触发策略组合不是子博弈完美纳什均衡,两人都会采取偷懒的策略。
(注:文档可能无法思考全面,请浏览后下载,供参考。
可复制、编制,期待你的好评与关注!)。