博弈论第4章答案

合集下载

博弈论谢识予第四五章参考答案

博弈论谢识予第四五章参考答案

第四章参考答案2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。

在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。

这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。

3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。

从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次16重复博弈中无法直接运用,因为没有最后一次重复。

因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。

此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。

从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。

例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。

两类重复博弈民间定理的差异也说明了这一点。

最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。

上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。

6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。

这两个纳什均衡的得益都帕累托劣于(B,S)。

一次性博弈中效率较高的(B,S)不可能实现。

博弈论基础讲义-第四章

博弈论基础讲义-第四章

第四章动态不完全信息博弈第一节. 序贯均衡的内涵一.问题的提出1.序贯理性2.一致信念二.序贯均衡的内涵1.例子2.定义a.行为战略b.序贯理性c.一致信念3.存在性三.序贯均衡的计算1.例子:一般计算2.例子:分析应用第二节. 序贯均衡的应用一.教育和信号传递1.假设2.分析二.垄断限价模型1.假设2.分析三.声誉模型1.假设2.分析四.序贯均衡之再精炼1.剔除劣弱战略2.直观标准3.垄断限价模型第四章不完全信息动态博弈第一节.序贯均衡的内涵一.问题的提出1.序贯理性——参与人在所有情况决策都是理性的,即在给定信念的条件下,以及其他参与人的选择条件下,自身选择是最优的例1:子博弈最优——纳什均衡(,)L l是否合理?——如果参与人2有机会选择,肯定选r而不是l;——(,)L l不是子博弈精炼纳什均衡。

例2:单点信息集最优——纳什均衡(,,)D a l是子博弈纳什均衡;——但如果参与人2有机会选择,但肯定选择d;——(,,)D a l不满足单点信息集理性。

例3:多点信息集最优——纳什均衡(,)A r是子博弈精炼纳什均衡;——(,)A r不满足多点信息集理性。

2.一致信念例1:与客观事实一致u=是否合理?——参与人2的信念2/3——2/3u=是不合理的,因为任何到达参与人2信息集都不可能产生此后验概率;——后验信念必须与先念信念保持一致。

例2:前后信念一致——参与人2的第2个信息集上的信念,是否合理?——不合理,给定参与人战略和第1个信息集的信念,利用贝叶斯法则计算信念与此不一致;——参与人前后信念保持一致。

例3:独立偏离——参与人3的信念0.9u =是否合理?——参与人1和参与人3的偏离是独立的,所以参与人3的合理信念为0.1u =;——不同参与人之间的偏离是独立的总结,一致信念要求:参与人偏离最小化,,参与人之间偏离是独立的;二.序贯均衡的定义1.例子——定义参与人1在信息集1.1和1.3以及参与人2在2.2上的序贯理性;——定义信息集1.3和2.2的信念?2.定义a.行为战略:参与人在某个信息集到行动集映射,——如果某个状态真正发生,参与人如何决策;——序贯理性是否满足?b.序贯理性:在任何信息集上,参与人在给定信念和所有后续行为战略,选择自身行为战略最大化预期效用。

博弈论(第四章)

博弈论(第四章)
谢富纪 2009年3月 11
2.有限次重复博弈
有唯一纯策略纳什均衡博弈的有限次重复博弈
有限次重复博弈的囚徒困境博弈,可以理解成警察 给两人两次交代的机会。
囚 徒2 坦白 不坦白
囚 徒 1
坦白
不坦白
-5, -5
-8, 0
0, -8
-1, -1
谢富纪 2009年3月
12
2.有限次重复博弈
因为重复博弈全过程是一种动态博弈过程,从第二 阶段开始。 此前的博弈已是既成的事实,而在此后又没有任何 的后继阶段,因此实现本阶段最大利益是两博弈 方在该阶段的唯一原则。结果是(坦白,坦白),
谢富纪 2009年3月
29
2.有限次重复博弈
本博弈中之所以不能或不能部分实现最佳结果
(A,A),是因为在两次重复博弈中博弈方没
有运用触发策略的条件或者说机会。后面的选择 并不取决于第一次博弈的结果。
谢富纪 2009年3月
30
2.有限次重复博弈
厂商2 得益
(1,4) (1.5,3) (3,3)
谢富纪 2009年3月
17
2.有限次重复博弈
削价竞争博弈
高价 寡 高价 头 1 低价
寡头2
低价
100,100 20,150 150,20 70,70
由于两个寡头在同一市场的竞争可以看作维持很 长时间,因此可以看作是重复博弈。然而结果是 令人遗憾的。
谢富纪 2009年3月 18
2.有限次重复博弈
两个悖论
谢富纪 2009年3月
27
2.有限次重复博弈
两市场博弈的重复博弈
厂商 2 A 厂A 商 1 B B
3,3
1,4
4,1
0,0

博弈论第四章

博弈论第四章

(1)起始结是一个单结的信息结;
(2)子博弈保留了原博弈的所有结构。 则称它为原博弈的一个子博弈(子博弈)。
按照博弈树的延伸的时序,或者按照博弈 树生长的时序,我们用一个扁椭圆形的虚 线的圈,把所论局中人在同一个时点的若
干决策节点罩起来,成为他的一个信息集。
(1)起始结是一个单结的信息结
x1
L L 1 2 S L 2 S (1,1) (2,2) 1 (-1,-1) (-1,-1) S 2 L L S (2,2)
镇上能卖6000元;但如果另一家商铺同时在小镇上卖
鞭炮,价格下跌使得这批鞭炮只能卖4000元。纳什均
衡是什么?
• 假设甲先行动,商铺乙看到对方的选择后再决定是否
进货,子博弈精炼纳什均衡是什么?
如果甲先行动,但在博弈开始前商铺主乙有一次行动A 的机会,利用子博弈精炼均衡概念分析下述两种情况下
的博弈结果: 何行动他都不会改变这个决定;
一颗大树表示一个博弈,一颗小树同样可以表示
一个博弈。如果小树是大树的一颗子树,并且
小树表示的博弈不破坏大树表示的博弈的结构,
那么小树表示的博弈,就叫做大树表示的博弈
的子博弈。
一、子博弈(sub-game)
子博弈定义:在一个扩展型博弈中,如果一 个博弈由它的一个决策结及其所有后续结 构成,并满足:
信息集的时候,面临决策的局中人对于博弈迄今的历史是
不清楚的,他不清楚博弈具体走到了他的这个信息集里面 的哪个决策节点。
在市场进入博弈中,包含3个子博弈(包括原博 弈)。而在囚徒博弈中,只有一个子博弈(?)
收益: A
B 容忍
进入 抵抗 A 不进入 B
B
抵赖
B 抵赖
-1 ,-1 -9 ,0 0 ,-9

博弈论课后习题

博弈论课后习题

Document serial number [UU89WT-UU98YT-UU8CB-UUUT-UUT108]第一章导论1、什么是博弈博弈论的主要研究内容是什么2、设定一个博弈模型必须确定哪儿个方面3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。

4、"囚徒的困境”的内在根源是什么举出现实中囚徒的困境的具体例子。

5、博弈有哪些分类方法,有哪些主要的类型6、你正在考虑是否投资100万元开设一家饭店。

假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。

如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。

逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。

请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。

第二章完全信息静态博弈1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么2、为什么说纳什均衡是博弈分析中最重要的概念3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。

4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响5、下面的得益矩阵表示两博弈方之间的一个静态博弈。

该博弈有没有纯策略纳什均衡t専弈的结果是什么6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。

7、博弈方1和2就如何分10 000元进行讨价还价。

假设确定了以下规则:双方同时提出自己要求的数额S1和S2, 0< sl,s2< 10 000,如果sl+s2W10 000,则两博弈方的要求都得到满足,即分别得到si和s2, 但如果是sl+s2>10 000,则该笔钱就被没收。

大学mooc博弈论(首师大)满分章节测验答案

大学mooc博弈论(首师大)满分章节测验答案

第一讲认识博弈论1单选(10分)博弈论的基本要素以下内容,除了()。

A.策略与策略集B.均衡C.支付与支付函数D.局中人正确答案:B你选对了2单选(10分)博弈论的基本假设是强调()。

A.均衡状态B.利益最大化C.个人理性D.集体理性正确答案:C你选对了3单选(10分)哪种表述模型更适合表示二人博弈()。

A.特征函数式B.标准式C.扩展式D.以上都不适合正确答案:B你选对了4单选(10分)根据人们行动为相互作用时,参与人能否达成一个具有约束力的协议,可将博弈分为( )。

A.静态博弈与动态博弈B.常和博弈与非常和博弈C.完全信息博弈与不完全信息博弈D.合作博弈与非合作博弈正确答案:D你选对了5单选(10分)“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”出自哪位诺贝尔经济学奖获得者的名言( )。

A.1994年诺贝尔经济学奖获得者John·NashB.2012年诺贝尔经济学奖获得者Lloyd S. ShapleyC.2005年诺贝尔经济学奖获得者Robert·AumannD.1970年诺贝尔经济学奖获得者Paul A. Samuelson正确答案:D你选对了6多选(15分)博弈论的研究特点包括()。

A.博弈论存在信息的对称性B.博弈论涉及的决策者至少为两人C.博弈论存在信息的不对称性D.博弈论需要考虑其他决策者的决策对自身利益的影响正确答案:B、C、D你选对了7多选(15分)“囚徒困境”反映了()。

A.“看不见的手”是有力的,但不是万能的B.个人理性通过市场机制导致社会福利最优的结论并不总是成立的C.个体理性与集体理性的冲突D.以自我利益为目标的“理性”行为,最终导致了两个囚徒得到相对较劣的收益正确答案:A、B、C、D你选对了8判断(5分)博弈论是一种以数学为基础、研究发生对抗与冲突时如何选择最优策略的一门学问。

正确答案:√你选对了9判断(5分)博弈论是单向的理性决策。

经济博弈第四章

经济博弈第四章

(三)贝叶斯原则 在不完全信息的博弈中,至少有一个参与人只知道其他参 与人是若干种可能类型中的一种,但不能确切地知道他是哪一种 特定类型时,就只能在主观判断其他参与人是哪种类型的基础上 进行自己的战略选择。 贝叶斯原则的意思是,如果在博弈时对其他参与人的类型 没有确定性了解,且不知道其发生的客观概率,则可在主观概率 的基础上进行判断,而这个主观概率是根据贝叶斯公式计算出来 的。 即如果用 i (1 ,,i1 ,i1 ,, n ) 表示除i之外的所有参人的类型 (1 ,, n ) ( i , i ) 。称 pi ( i i ) 为参与人i的条件概率, 即给定参与人i属于类型 i 的条件下,他有关其他参与人属于 i 的概率。则有∶ p ( ) p( i , i ) i i i p( i ) 如果类型的分布是独立的,pi ( i i ) p( i )。
* a i ( i ) 的情况下最大化自己的期望效用函数 u i 。换言之,战略组合
* a* {a1* (1 ),, an ( n )} 是一个贝叶斯纳什均衡,如果对于所有的i, ai Ai ( i ), 有 a * ( ) arg max p ( )u {a , a * ( ); , }
第一节 不完全信息静态博弈和贝叶斯纳什均衡 一、不完全信息静态博弈的概念
(一)不完全信息
在完全信息博弈中是假定有关参与人的支付函数是“共同知 识” 。但现实中的许多博弈并不满足这个要求。比如,当你与一 个陌生人打交道时,你并不知道他的特征(如他喜欢什么,不喜欢 什么)。实际中,即使与你长期共事的人,也很难说你对它有完全 的了解;当你想买(或卖)一件古董时,你并不知道卖主愿意脱手 的最低价格(或买主愿意出的最高价格);当一个企业想进入某个 市场时,它并不清楚在位者的成本函数等等。 但博弈论中的不完全信息是指博弈中的参与人对其他参与人 (包括他自己)对博弈局势有关的事前信息了解不充分,而不是指 博弈进行中对博弈进程信息的了解不充分。

博弈论与信息经济学-4.不完全信息动态博弈

博弈论与信息经济学-4.不完全信息动态博弈

I11
L
p
M
I21
R
1-p
1 3
U
2 1
B
0 0
U
0 2
B
0 1
根据局中人2的推断可知,局中人2选 R 的期望支付为 1 p ,选 U
的期望支付为
p 2(1 p) 2 p

L R

A D
I31

U

B
A
D
4 4 4
1 1 1
5 5 0
2 2 2
3 3 0
均衡(L,B,A)并不是一个合理的均衡。因为如果博 弈进入参与人2的信息集,参与人2应该选择U而不 是B。 不可能用子博弈精炼纳什均衡的概念剔除(L,B,A), 但可以使用精炼贝叶斯均衡剔除这个不合理的均衡。
( A, L, L' ) r1( A, L, L' ) r2 ( A, L, L' ) r3 ( A, L, L' )
r3 ( A, L, L' ) {L' , R'}

( A, L, L' ) 为纳什均衡。
{( A, L, L' ), p 0} 对于要求1与3的满足是显然的,现考虑要求2

给定局中人的推断,局中人的策略必须满足序贯理性的要求。即在每一信息
集中,应该行动的局中人(以及局中人随后的策略),对于给定的该局中人 的推断,以及其余局中人随后的策略(其中“随后的策略”是在达到给定的 信息集之后,包括了其后可能发生的每种情况的完全的行动计划)必须是最 优反应。

博弈论第四章

博弈论第四章

4 非完全信息动态博弈4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。

参与人2 不知道t,但知道t的概率分布。

博弈的时序:(1)参与人1选择行动a1∈A1;(2)参与人2观察a1,选择a2∈A2博弈的收益:u1(a1, a2, t), u2(a1, a2, t )u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2例:1 RL M 13p 2 1- pL'R'L'R'2 0 0 01 0 1 2标准式表示参与人 2L'R'L2,10,0参与人 1 M0, 20,1R1, 31, 3纯战略纳什均衡: (L,L'), (R,R')均为子博弈精炼纳什均衡(无子博弈)。

但是(R, R')不可信。

排除不可信的纳什均衡:要求1 参与人必须有一个推断(belief).要求2 参与者的战略必须满足序贯理性(sequentially rational).定义: 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下,博弈以正的概率到达该集.要求3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。

例要求3的说明参与人1的类型空间:{ t1,t2,t3,t4 }行动空间:A= { L,R}推断p i: 观察到L后,参与人1的类型是t i的概率。

推断q i: 观察到R后,参与人1的类型是t i的概率。

p1 + p2 + p3 + p4 = 1q1 + q2 + q3 + q4= 1N如果参与人1的战略: t 1选 L ,t 2选 L , t 3选R ,t 4 选R 。

参与人2对p i 与 q i 的推断:p 1 = 3.02.02.0+= 0.4, p 2 = 3.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,例 3个参与人的博弈。

博弈论第四章 完全且完美信息动态博弈

博弈论第四章 完全且完美信息动态博弈

0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
精的扩展式表述包括四个要素:
✓ 参与人集合(Player) ✓ 每个参与人的战略集合(Strategy) ✓ 博弈的顺序(Order) ✓ 由战略组合决定的每个参与人的支付(Payoff)
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
精选PPT
12
动态博弈的 战略
精选PPT
13
动态博弈的战略的表述
✓ 战略:参与人在给定信息集的情况下选择行动的规则,它规定参 与人在什么情况下选择什么行动,是参与人的“相机行动方案”。
si表示第i个参与人的特定战略
Si si代表第i个参与人所有可选战 择略 的集合
如果n个参与人每人选择战 一略 个, n维向量s (s1,s2, ,si, ,sn)称为一个战略组合 si表示第i个人选择的战略
精选PPT
6
扩展式表示的一个例子
精选PPT
7
博弈树始于 局中人1 的一个决策结点,这时1
要从L和R中作出选择,如果局中人1选择L,其后就
到达 局中人2 的一个决策结点,这时,局中人2要
从L′和R′中作出选择。类似地,如果局中人1选择R, 则将到达局中人2的另一个决策结点。
这时局中人2从L′和R′中选择行动。无论局中人2 选择了哪一个,都将到达终结点 (即博弈结束)且两 局中人分别得到相应终点节下面的收益。

博弈论各章节课后习题答案 (4)

博弈论各章节课后习题答案 (4)

第四章谈判与协调1.帕累托占优均衡和纳什均衡的关系是什么?纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。

这样的策略组合构成一个均衡局势,并命名为纳什均衡。

纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。

一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。

在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。

其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。

在博弈中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ∗∗∗⋯0i s ∗,0()()i i i j P s P s ∗∗>1,2,,,1,2,,i n j m==⋯⋯则称为博弈G 的帕累托占优纳什均衡。

可见帕累托占有纳什均衡是纳什均衡中收益最大0i s ∗的一种均衡。

2.分别找出具有下列性质的2人博弈的例子。

(1)不存在纯策略纳什均衡;(2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。

(1)不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡(2)该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均衡。

很显然,(和平,和平)是一个帕累托占优纳什均衡。

2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为:TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+200002122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。

试分别基于古诺模型和纳什谈判模型求解两企业的利润。

解:由和400010Q p =−12Q q q =+得124000.1()p q q =−+战争和平国家1战争-5,-58,-10和平-10,810,10所以:[]21121114000.1()(0.120100000)q q q q q π=−+−++211213800.10.2100000q q q q =−−−[]22122224000.1()(0.43220000)q q q q q π=−+−++221223680.10.520000q q q q =−−−12113800.10.40q q q π∂=−−=∂21223680.10q q q π∂=−−=∂21123800.10.403680.10q q q q −−=⎧⎨−−=⎩求解方程组得12880280q q =⎧⎨=⎩将,代入到,中去得到最优解1q 2q 1π2π*1*25488019200ππ⎧=⎪⎨=⎪⎩4.你能否对如下的CG-2×2博弈中x 的变化设计出一些实验方案,来讨论是帕累托占优思想还是风险占优思想在策略选择中起主要作用。

35博弈论-第四章

35博弈论-第四章

第四章完全信息动态博弈更为现实的考虑是将静态博弈动态化,动态化后,纳什均衡这一概念是否仍然有效呢?答案是部分有效的。

如果不存在动态不一致,那么纳什均衡在完全信息动态博弈中仍不失为一个有用的均衡概念,但纳什均衡概念本身并不能保证不出现动态不一致,为了克服这一点在纳什均衡的基础上生产了所谓子博弈完美均衡。

而这一章,我们将围绕这子博弈完美均衡来展开。

第一节完美信息与完全但不完美信息完全信息动态博弈可以分为两类,即完美信息与完全但不完美信息。

所谓的完美信息博弈,是指博弈中的后行动者始终能够观察到前行动者的行动,因而动态博弈中不存在参与者同时行动这样的情况。

而完全但不完美信息博弈,则指动态博弈中,至少存在两个参与者同时行动的情况,因而“后行动者”无法观察到“前行动者”的行动。

我们不妨用两个例子来加以说明。

例4.1 动态囚徒困境囚徒1图4-1 动态囚徒困境例4.2 取消管制政府图4-2 取消管制与图4-2完全等价的表示方法见图4-3。

政府图4-3 取消管制定义4.1完美信息动态博弈就是不存在同时行动的完全信息动态博弈。

显然,运用策略式来描述动态博弈会非常不便,特别是当信息不完全时更是如此,为了更简便地描述动态博弈,我们将引入一种新的博弈表达式——扩展式。

第二节动态博弈的扩展式我们把博弈中所有从开始到结束的行动序列称为全历史(Terminal history),而用参与者函数来表示在每一个全历史上,在博弈进行到某个阶段时谁来行动。

因而要完整地描述一个动态博弈,必须具备四个要素:(1)参与者集合;(2)全历史集合;(3)参与者函数;(4)偏好。

如果我们把全历史表示成一个行动序列(a1, a2,…, a K)(K为自然数,当K→∞时,就表示无穷动态博弈),那么(a1, a2, …, a m),其中m K≤,就称为全历史(a1, a2, …, a K)的子历史(Subhistory)。

当m < K时,(a1,a2, …, a m)就是全历史(a1, a2, …, a K)的真子历史(Proper subhistory)。

博弈论第4章答案

博弈论第4章答案

R R M 4.1.a 标准式1↖2 L ’ R ’4,1 0,0 3,0 0,1 2,2 2,2纯战略纳什均衡:( L, L ’ ) ( R, R ’ )子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ )精炼贝叶斯纳什均衡:( L, L ’ )4.1.b 标准式1↖2 L ’ M ’ R ’1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4纯战略纳什均衡:( R, M ’ )子博弈精炼纳什均衡:( R, M ’ )精炼贝叶斯均衡: 没有4.2标准式1↖2 L ’ R ’2,2 2,2 3,0 0,1 0,1 3,0六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。

求混合战略精炼贝叶斯均衡:设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p −−参与者2选择L ’和R ’的概率分别为,(1)q q −在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212120*1*1*0*p p p p p p +=+⇒=给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则:12121212[3*0*(1)][0*3*(1)]2*(1)41:**,*112p q q p q q p p p p p p q +−=+−=−−====又 联立得 所以 L LML LM L RL4.3答案(见4.5)4.4表示方法第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号;第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a )[(,),(,),1/2][(,),(,),1/2][(,),((1),),1/2][(,),(,),1,0]R R u u p R R d u p R R d u u p L R u d p q αα><+−===(b )[(,),(,),1/2,2/3][(,),(,),1,0][(,),(,),0,1]L L u u p q L R d u p q R L u d p q =<====中文版习题4.5答案(a )[(,),(,),1/3,1/2]R R u d p q >=(b )12121212[(,,),(,),1/3,1/2][(,,),(,),1/2,0]L L L u u p p q q L L R u d p p q q ==+<==+=。

博弈论习题及解答

博弈论习题及解答

※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)2. 分别用规范式和扩展式表示下面的博弈。

两个相互竞争的企业考虑同时推出一种相似的产品。

如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。

企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? (见教材)4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。

例子:厂商之间的价格战,广告竞争等。

※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? (见教材)2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。

先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。

然后用划线法求出该矩阵博弈的纯策略Nash均衡。

乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。

乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知,该矩阵博弈没有纯策略Nash均衡。

由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。

解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线,如下图,图中粗的折线,就是F(x)的图象由图可知,纳什均衡点与β1无关,所以原问题化为新的2*2矩阵博弈:由公式计算得:。

经济博弈论思考题答案(部分)

经济博弈论思考题答案(部分)

第1章思考题:(纳什均衡)1、有三位学者获得了1994年的诺贝尔经济学奖,博弈论对现代经济学的基础性意义得到承认。

试问该年诺贝尔经济学获奖者排名的先后顺序意味什么?你认为决定这三位学者排名先后的关键性贡献及其特别意义如何?答:每位学者的贡献都是建立在前者理论基础之上的,排名考虑的因素是理论的原创性。

纳什提出了纳什均衡概念,建立了一种互动分析模式;泽尔腾以纳什均衡为基础建立了策略性思维的动态分析模式;海萨尼提出海萨尼转换及其均衡体系。

2、有人说,数学对于经济学有不可或缺的支持作用。

试以纳什均衡的经济学应用实例来说明这种支持作用的特别意义?同时以你选择的博弈应用实例(博弈应用文章)为基础说明博弈均衡数学表达式的简明与繁复各自意味什么?答:博弈论学科对数学工具的利用使得博弈论乃至经济学成为一门真正的科学。

博弈均衡数学表达式的简明与繁复意味着背景事实的简明与繁复。

4、不管是完全信息博弈,还是不完全信息博弈,博弈论都与现实经济问题有很高契合度,甚至可以说:博弈的高度抽象性=经济分析的概念模型=互动思维模式。

对此,你的见解如何?有可以证明这个等式正确的博弈实例存在吗?答:博弈论模型中的元素就是对经济分析中因素的抽象,分析方法就是关注各个参与人之间的互动及相互之间的影响。

第2章思考题:(博弈逻辑)1、为什么可以说纳什均衡就是策略互动均衡与信念互动均衡?为什么从纳什均衡的核心内涵出发就可以推论出博弈逻辑的三种方式:策略互动逻辑、信念互动逻辑与自利互动逻辑?答:因为从最简化意义来看,博弈均衡就是纳什均衡,博弈均衡就是互为最适反应。

在实际上,每个博弈方策略互动选择都存在相应的信念互动选择。

在完全信息博弈中,纳什均衡隐含了特定形式的信念互动均衡,而在不完全信息博弈中,信念互动均衡才被凸显出来。

因此纳什均衡=策略互动均衡+信念互动均衡。

因为纳什均衡的核心内涵可以从策略互动,信念互动和自利假设三方面来理解。

7、有人说:不论是狭义自利假设还是广义自利假设,不论是完全信息博弈还是不完全信息博弈,不论是个体性策略互动还是群体性策略互动,都有对应的现实第3章思考题:(完全信息博弈)8、多主体博弈不同于两主体博弈的典型特征是什么?为什么说多主体博弈中的破坏者或建设者并不是绝对的?试以多主体博弈实例为基础,说明支持纳什均衡存在的先验性假设的特别意义?答:典型特征是可能存在所谓的“破坏者”或“建设者”,这些可能其破坏者或建设者作用的第三方,其策略选择的可能变化对其自身利益影响不大(并无影响),但却会对其他博弈方的得益支付产生很大的,甚至是决定性的影响。

博弈论第四章习题

博弈论第四章习题

第四章习题一、如果T次重复齐威王田忌赛马,双方在该重复博弈中的策略是什么?博弈结果如何?答:因为这是零和博弈,结论比较具体。

重复Nash 均衡,均以1/6的概率选择各个策略,期望收益分别为1和-1。

因为这是竞争性的零和博弈,无论是有限次重复博弈还是无限次的重复博弈,均不能达成合作的条件。

二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。

答:火车站和机场餐饮业的服务的顾客往往是一次性的,回头客和常客也比较少,价格高,质量差,一次性博弈。

效率也比较低。

商业区和居民区的餐饮业和商业服务业,回头客和常客比较多,比较注重信誉,质优、价廉,重复博弈。

效率也比较高。

三、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?答:动态博弈的逆向归纳法可以用于有限次重复博弈,但不能用于无限次重复博弈,主要用逆向归纳法。

无限次重复博弈的效率往往高于有限次重复博弈。

当重复次数较少不一定考虑贴现问题,但无限次重复博弈必须考虑贴现问题。

启发:重视有限次与无限次的区别,区分和研究这两类博弈,在实践方面重要启发是促进和保持经济的长期稳定和可持续发展,提高社会经济效率是非常有意义的。

四、判断下列表述是否正确,并作简单讨论:(1)有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。

答:不一定。

对于有两个以上纯策略纳什均衡的条件下就不一定。

如“触发策略”就不是。

(2)有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。

答:是,根据子博弈完美纳什均衡的要求,最后一次必须是原博弈的一个纳什均衡。

(3)无限次重复博弈均衡解的得益一定优于原博弈均衡解的得益。

答:错。

如严格竞争的零和博弈就不优于。

(4)无限次重复古诺产量博弈不一定会出现合谋生产垄断产量的现象。

答:正确。

合谋生产垄断产量是有条件的,由贴现率来反映,当不满足条件时,就不能构成激励。

(5)如果博弈重复无限次或者每次结束的概率足够小,而得益的时间贴现率 充分接近1,那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。

吉本斯-博弈论基础答案

吉本斯-博弈论基础答案
2
1 2 的收益贴现到t期可得 1 − δ (a − c) / 8 , 1 2 2 触发战略有效的条件是: 1 − δ (a − c ) / 8 > (a − c) / 4 ,得到: δ > 1/ 2
(可参见谢识予的《经济博弈论》习题解答) 。 2.14 略 2.15 (1)垄断的产量、价格、利润: π=Q(a-Q)-CQ 利润最大化时:a-2Q=C,从而 Q=(a-c)/2. 此时价格为(a-c)/2。 (2)古诺均衡下的产量、价格、利润: π=(a-∑qi) qi -cqi
(*)
因 此 当 增 加 S 时 , U1 ( I c − S ) 会 减 小 , 同 时 , d ( S + B ) / dS > 0 , ∴ S + B 会 增 加 ,
∴ U 2 ( S + B ) 会增加,因为(*)式, U 2 ( S + B ) 增加的幅度比 U1 ( I1 − S ) 减小的幅度大,所以
如果参与者推断自然选择左边博弈的概率23参与者2选l如果参与者推断自然选择左边博弈的概率23参与者2选l和选r无差异如果参与者推断自然选择左边博弈的概率23参与者2选r如果参与者推断自然选择左边博弈的概率23参与者2选l如果参与者推断自然选择左边博弈的概率23参与者2选l和选r无差异如果参与者推断自然选择左边博弈的概率23参与者2选r自然选择左边博弈时参与者1选t参与者2选l
由 一 阶 条 件 ∂π i / ∂qi = 0 , 可 得 : qi = (a − q− i − c) / 2 … … ( 1)
* *
( 1) 式 两 端 乘 以 2, 再 减 qi , 可 得 : qi = a − Q − c … … ( 2), 对 于 任 意 的 i 都 成 立 。

博弈论——精选推荐

博弈论——精选推荐

博弈论第1章博弈论基本模型1、在⼀个博弈中,所有的局中⼈都选择合作⾏为,该博弈是否为合作博弈?答:如果在⼀项活动中,参与⼈具有合作的意向,⽽合作的⾏为⼜能得到有⼒的保障,则称这种博弈活动为合作博弈。

存在有⼒的保障,实际上说明了合作博弈问题的博弈⽅之间既存在共同利益,但利益⼜不完全⼀致。

⽽事实上合作博弈协议的内容除了约定⾏为以外就是利益分配,达成协议的前提是通过讨价还价就利益分割达成⼀致。

因此,并不是所有局中⼈选择合作⾏为,就是合作博弈。

2、完全信息静态博弈问题必须⽤策略型博弈模型刻画,完全信息动态博弈模型必须⽤扩展型博弈模型刻画,是否正确?答:不正确。

博弈论模型从形式可分为策略型模型与扩展型模型。

扩展型模型完整地刻画了⼀项博弈活动。

策略型博弈模型的结构简单,但它忽略了博弈的时序与信息,其侧重点在于分析参与⼈的策略选择。

只不过是相对⽽⾔,对于信息完全静态博弈⽤策略型博弈刻画更为合适;对信息完全的动态博弈,⽤扩展型博弈模型描述更为合适。

3、⼀个博弈问题既可⽤策略型博弈模型刻画,也可⽤扩展型博弈模型刻画,是否正确?答:博弈论从形式可分为策略型和扩展型模型。

扩展型完全地刻画了⼀项博弈活动,⽽策略型则结构简单,忽略了博弈的时序与信息,重点在于分析参与⼈的策略选择。

因此,对于⼀个博弈问题,要视乎所要解决的问题是完整的还是只分析参与⼈的策略选择。

4、策略就是⾏动吗?答:○1称参与⼈i∈N在博弈中所有可能选择的⾏动构成的集合A i为局中⼈i的⾏动集合。

A i中的元素a i称为局中⼈i的⾏为。

○2局中⼈i=1,2,…,n的策略集合⽤Si表⽰,S i中的元素si称为局中⼈i的策略。

它定义为局中⼈i的信息集类I i到⾏动集Ai的映射:S i:I i→A i,S i(I ik)=a i∈A i,i=1,2,…,r i○3从以上的定义,清楚地表明了策略是信息集的映射,⾏动是映射值,两者是不同的。

5、策略与⾏动何时是⼀致的?答:在静态博弈模型中,局中⼈的策略与⾏动等同。

博弈论 战略分析入门第四章课后题答案

博弈论 战略分析入门第四章课后题答案

Instructor’s Guide to Game Theory: A Nontechnical Introduction to theAnalysis of StrategyChapter 4. Nash Equilibrium1.Objectives and ConceptsThe principle objective of this chapter is to introduce the Nash equilibrium and to convey some notion of the range of possibilities and applications, including the possibilities that there may be no Nash equilibria in pure strategies and the possibility that there may be plural Nash equilibria. (Since mixed strategy equilibria are not introduced until Chapter 8, it is not possible to give a meaningful definition of pure strategies at this point, and is necessary to talk around it a bit.) Important subsidiary concepts are coordination games and Schelling points (or focal point equilibria), heuristic methods of finding the Nash equilibria, such as underlining, and refinement of Nash equilibrium.The chapter begins with an example that is based on Warren Nutter’s game-theoretic version of Bertrand competition, except that in this instance a kind of quality competition is considered. The solution to this game can be found by iterated elimination of dominated strategies (which will not be covered until Chapter 11) and reflects the intuition that it is best to be just one step ahead of the competition. Thus, while it does not have a dominant strategy equilibrium, it has some dominated strategies and a unique Nash equilibrium, and hopefully forms a natural bridge from the study of dominant strategy equilibrium.Games with plural equilibria are introduced with the game of Choosing Radio Formats. The idea that history (or other clues) can establish a Schelling point also comes in with this example. The Market Day game reinforces the idea that plural Nashequilibria can have explanatory value – explaining the persistence of what seem to be arbitrary conventions. Games without Nash equilibria (in pure strategies) are introduced with an escape-evasion game. This is an important category in itself, though the most important applications are in differential games and thus beyond the scope of the book.Accordingly, the concepts areNash EquilibriumUnique Nash EquilibriaFinding Nash EquilibriaPlural Nash EquilibriaThe difficulty of choosing among plural Nash equilibriaSchelling PointsCustom, convention and history as Schelling pointsSchelling points from the logic of the gameRefinementGames without Nash equilibria in pure strategies2. Common Study ProblemsStudents who have not yet grasped the best-response idea will find Nash equilibria even more difficult than dominant strategy equilibria. This is the crisis point for students who have not “got” best response. The best response tables (such as table 2 in the chapter) are designed to make this a little easier, so urge the student to rely on them and on underlining as intermediate steps in their analysis. I sometimes suggest to mystudents that they physically move their fingers along the column or row to pick out the biggest payoff. Making the solution as mechanical as possible will help students over that hump. Another (less troubling) problem is the relationship between Nash and dominant strategy equilibria. Taking dominant strategy equilibria first is a pedagogical convenience, since it is a little easier and will be familiar to students who have seen the Prisoner’s Dilemma in another class, but it can produce the impression that dominant strategy equilibria are not Nash equilibria. The Venn diagram (Figure 1) is meant to speak to that problem, and may need some stress in class.3. For Business StudentsThe key business concepts for this chapter are strategies of location and market niche, in the Location, Location, Location example, but also in the Radio Formats example and in the Hairstyle example in the exercises and discussion questions.4. Class AgendaFirst hour:1)Quiz on earlier material2)Introductory presentation: Nash Equilibria•Assignments3)Discussion: The Blonde Problem AgainSecond Hour:1)Discussion of quiz and assignments2)Play a coordination game in class, with random matching and without discussion.A handout description of the game is given on the next page.Another Random-Matching Two-Person GameOnce again, each person chooses between the strategies of collusion or defecting from the collusive arrangement.Put in your name and circle one of the two statements: either "my strategy is collude" or "my strategy is defect." Your instructor will tell you whether to follow directions A) or B) below.A)After you turn it in, your strategy choice will be matched with that of anotherclass member AT RANDOM, and your bonus points will be based on the payofftable above. There is to be no discussion of your strategy choices.B)You will be matched with your neighbor and may discuss your strategy choice ifyou wish.Payoffs are in GameBucks.TableArt's StrategyCollude DefectCollude (3,3)(0,2)Bob's StrategyDefect(2,0)(1,1)What will you do? Go for the big reward with a "collude" strategy or protect yourself with an "defect" strategy?Student name ____________________________My strategy is (circle one)ColludeDefect3)Discussion:a.Results of the in-class game.b.Give other examples of Schelling points in coordination games. Ideally,these should come from the students, but the following instances maystimulate the discussion if it comes slowly:i.Driving on the right or left-hand side of the road.ii.Speaking the same language.iii.Choosing a profession. Assumption: if both choose the sameprofession, it does not pay well because it is too crowded. Howmany business majors in the class? Engineering? Communications,etc?5. Answers to Exercises and Discussion Questions1.Solving the Game. Explain the advantages and disadvantages of NashEquilibrium as a solution concept for noncooperative games.Nash equilibrium is based on the idea that each player chooses the best response tothe strategy chosen by the other player. This is a clear concept of rationality wheneach person chooses in isolation from the other. Among the shortcomings are 1)Nash equilibrium may not be unique, posing the problem of determining which oftwo or more Nash equilibria may actually be chosen by rational agents, and 2) considering only the list of strategies for the game in normal form, that is, the“pure” strategies, there may not be a Nash equilibrium.2.Location, Location, Location (Again) Not all location problems have similarsolutions. Here is another one: Gacey's and Mimbel's are deciding where to puttheir stores in Metropolis, the town across the river from Gotham City. The three strategies for Metropolis are to locate downtown, in Old Town, or in the Garden District. The payoffs are shown in Table E1.Table E1 Payoffs in a New Location GameGacey'sDowntown Old Town Garden DistrictDowntown70,6060,12080,100Old Town110,7040,40120,110Mimbel'sGardenDistrict120,80110,12050,50Does this game have Nash equilibria? What strategies, if so? Which strategies would you predict that Gacey's and Mimbel's would choose? Compare and contrast this game with the location game in the chapter. What would you say about the relative importance of congestion in the location decisions of the firms in the two cases?A table modified to show the highest payouts for each player for each decision is as follows:Gacey's Downtown Old Town Garden District Downtown 70, 6060, 12080, 100Old Town110, 7040, 40120, 110M i m b e l 's Garden District 120, 80110, 12050, 50There are two Nash Equilibria. When Gacey’s locates in Old Town, Mimbels will locate in the Garden District, and vice versa. Which solution will actually be chosen is not definite.This problem is different from the one in the chapter since there are 2 NashEquilibriums instead of one, which requires a little guesswork as to which one will be the final solution. It is similar in that there is not a dominant strategy equilibrium.Congestion must be more of a problem in this scenario than in the chapterproblem. There is never a Nash equilibrium when both pick the same site. This could be explained by the congestion problem3. Drive on. Two cars meet, crossing, at the intersection of Pigtown Pike and Hiccup Lane. Each has two strategies: wait or go. The payoffs are shown in Table E2.Table E2. The Drive On Game Mercedeswait go wait0,01,5Buick go 5,1-100,-100Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibria? What strategies, if so? Would you predict which strategies rational drivers would choose in this game?Which? Why? Pigtown Borough has decided to put a stoplight at this intersection. How could that make a difference in the game?Here is a table modified to show the maximum payout for each driver:Mercedes Wait Go Wait0, 05, 1B u i c kGo 5, 1-100,-100Once again, there are 2 Nash Equilibria. They are for the Buick to wait and the Mercedes go, or vice versa.To determine which will happen requires guesswork. The personality of thedrivers might determine what happens. If I were in the Mercedes, I would probably not want to risk an expensive car getting damaged. Someone else, say in a CL600, mightfigure that his car is faster and that he can beat the other driver. Also, one of the drivers might just wave the other on rather than have both wait or both go.It is possible that both drivers might wait rather than run the risk of an accident, i.e. choose a risk dominant strategy.The stoplight would provide a Schelling Point to select for the equilibrium at which the driver with the green light chooses go.4. Rock, Paper, Scissors. Here is another common school-yard game called Rock, Paper, Scissors. Two children (we will call them Susan and Tess) simultaneously choose a symbol for rock, paper or scissors. The rules for winning and losing are:Paper covers rock (paper wins over rock)Rock breaks scissors (rock wins over scissors)Scissors cut paper (scissors win over paper)The payoff table is shown as Table E3.Table E3. Rock, Paper, ScissorsSusanpaper stone scissors.paper0,01,-1-1,1Tessstone-1,10,01,-1scissors1,-1-1,10,0Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibria? What strategies, if so? How do you think the little girls will try to play the game?Here is a table modified to show the best responses.Susanpaper stone scissors.paper0,01,-1-1,1Tessstone-1,10,01,-1scissors1,-1-1,10,0We see that there are no dominant strategies, nor are there Nash equilibriain terms of the strategies shown here. We have no basis (so far) to decide how the girls will play the game.NOTE TO INSTRUCTOR For the purist, it is not correct to say here that “thereare no Nash equilibria,” since this game has a mixed-strategy equilibrium. But, of course, we will not cover mixed strategy equilibria until a later chapter. Thecorrect statement is that there is no equilibrium in pure strategies.5. The Great Escape. Refer to Chapter 2, Question 2.Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibrium? What strategies, if so? How can these two opponents each rationally choose a strategy?WardenGuard walls Inspect cellsclimb No escape, success inpreventing escape Escape,failurePrisonerdig Escape,failure No escape, success inpreventing escapeThe numerical payoffs can be assigned in many different ways. Here is a simple version that interprets “no escape” as minus one for the prisoner, plus one for the warden, and “escape” as vice versa. As the underlines show, there is no Nash equilibrium. Thus far, we have no basis to say how a rational person would choose strategies in this case.WardenGuard walls Inspect cellsclimb-1,11,-1Prisonerdig1,-1-1,16. Sibling Rivalry. Refer to Chapter 2, Question 1.Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Determine all the Nash equilibria in this game. Do some Nash Equilibria seem likelier to occur than others? Why?Irismath litmath 3.7, 3.8 4.0, 4.0Julialit 3.8, 4.0 3.7, 4.0If the siblings act independently, rationally and with self- interest (non-cooperatively), we can find two Nash equilibrium's strategies: (literature, math), (math, literature).We note that there is a Schelling point in this game: (Math, Lit) yields a certain 4.0 for both girls, which is a reason it might attract attention, and probably is more likely to be observed.7. Hairsyle.Shaggmopp, Inc. and Shear Delight are hair-cutting salons in the same strip mall, each groping for a market niche. Each can choose one of three styles: punker, contemporary sophisticate, or traditional. Those are their strategies. They already have somewhat different images, based on the personalities of the proprietors, as the names may suggest. The payoff table is shown as Table E4.Table E4. Payoffs for HaircuttersShearpunker sophisticate traditionalpunker35,2050,4060,30Shaggmoppsophisticate30,4025,2535,55traditional20,4040,4520,20Are there any dominant strategies in this game? Is there a dominant strategy equilibrium? Are there any Nash equilibria? How many? Which? How do you know?Once again, here is the modified table:ShearPunkerSophisticate Traditional Punker 35, 2050, 4060, 30Sophisticate 30, 4025, 2535, 55S h a g g m o p pTraditional20, 4040, 4520, 20Shaggmopp’s best strategy is to go punker regardless of what Shear does. This is his dominant strategy. Since Shear has no such dominant strategy, there is no dominant strategy equilibrium.The only Nash equilibrium is when Shear decides to go with the sophisticate look.Since Shear knows that Shaggmopp will probably go punk rather than sophisticate, it will choose sophisticate.6. Quiz questionPlaced on the next page for convenience in copying and printing.Student name ____________________________Quiz – Game TheoryFelix and Oscarina share their home with two cats. Felix, who has a sharp sense of smell, would like for the cat boxes to be cleaned twice a week. Oscarina, whose sense of smell is less acute, would be satisfied if they were cleaned once a week. Each would prefer not to be the one to clean the cat boxes. Their payoffs are shown on the following table.Oscarinadon't clean clean once clean twicedon't clean-5,-30,-17,-5Felixclean once-2,45,26,-4clean twice0,51,32,-3Find any and all Nash equilibria for the catbox game? Are there dominated strategies? Which? Is there a dominant strategy equilibrium? Explain.Answer:A payoff table with best responses underlined follows:Oscarinadon't clean clean once clean twicedon't clean-5,-30,-17,-5Felixclean once-2,45,26,-4clean twice0,51,32,-3The Nash equilibrium is where Felix cleans the cat box twice and Oscarina never cleans. “Clean twice” is a dominated strategy for Oscarina. Since the best response for each person depends on the strategy chosen by the other, there is no dominant strategy equilibrium.It seems that Felix, whose need is greater, will empty the catbox, if the two companions act noncooperatively. Now, it may seem odd that people who live together would act noncooperatively , but life is strange, and odd things do happen. However, a couple of years ago, Oscarina gave Felix a Christmas present – a year of catbox cleaning – and has renewed the gift, so love triumphs after all.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

R R M 4.1.a 标准式
1↖2 L ’ R ’
4,1 0,0 3,0 0,1 2,2 2,2
纯战略纳什均衡:( L, L ’ ) ( R, R ’ )
子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ )
精炼贝叶斯纳什均衡:( L, L ’ )
4.1.b 标准式
1↖2 L ’ M ’ R ’
1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4
纯战略纳什均衡:( R, M ’ )
子博弈精炼纳什均衡:( R, M ’ )
精炼贝叶斯均衡: 没有
4.2
标准式
1↖2 L ’ R ’
2,2 2,2 3,0 0,1 0,1 3,0
六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。

求混合战略精炼贝叶斯均衡:
设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p −−
参与者2选择L ’和R ’的概率分别为,(1)q q −
在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212
120*1*1*0*p p p p p p +=+⇒=
给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则:
121212
12[3*0*(1)][0*3*(1)]2*(1)
41:**,*112
p q q p q q p p p p p p q +−=+−=−−===
=又 联立得 所以 L L
M
L L
M L R
L
4.3答案(见4.5)
4.4
表示方法
第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号;
第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a )
[(,),(,),1/2]
[(,),(,),1/2]
[(,),((1),),1/2][(,),(,),1,0]
R R u u p R R d u p R R d u u p L R u d p q αα><+−===
(b )
[(,),(,),1/2,2/3]
[(,),(,),1,0][(,),(,),0,1]
L L u u p q L R d u p q R L u d p q =<====
中文版习题4.5答案
(a )
[(,),(,),1/3,1/2]R R u d p q >=
(b )
12121212[(,,),(,),1/3,1/2]
[(,,),(,),1/2,0]
L L L u u p p q q L L R u d p p q q ==+<==+=。

相关文档
最新文档