博弈论第四章习题.doc

合集下载

博弈论基础讲义-第四章

博弈论基础讲义-第四章

第四章动态不完全信息博弈第一节. 序贯均衡的内涵一.问题的提出1.序贯理性2.一致信念二.序贯均衡的内涵1.例子2.定义a.行为战略b.序贯理性c.一致信念3.存在性三.序贯均衡的计算1.例子:一般计算2.例子:分析应用第二节. 序贯均衡的应用一.教育和信号传递1.假设2.分析二.垄断限价模型1.假设2.分析三.声誉模型1.假设2.分析四.序贯均衡之再精炼1.剔除劣弱战略2.直观标准3.垄断限价模型第四章不完全信息动态博弈第一节.序贯均衡的内涵一.问题的提出1.序贯理性——参与人在所有情况决策都是理性的,即在给定信念的条件下,以及其他参与人的选择条件下,自身选择是最优的例1:子博弈最优——纳什均衡(,)L l是否合理?——如果参与人2有机会选择,肯定选r而不是l;——(,)L l不是子博弈精炼纳什均衡。

例2:单点信息集最优——纳什均衡(,,)D a l是子博弈纳什均衡;——但如果参与人2有机会选择,但肯定选择d;——(,,)D a l不满足单点信息集理性。

例3:多点信息集最优——纳什均衡(,)A r是子博弈精炼纳什均衡;——(,)A r不满足多点信息集理性。

2.一致信念例1:与客观事实一致u=是否合理?——参与人2的信念2/3——2/3u=是不合理的,因为任何到达参与人2信息集都不可能产生此后验概率;——后验信念必须与先念信念保持一致。

例2:前后信念一致——参与人2的第2个信息集上的信念,是否合理?——不合理,给定参与人战略和第1个信息集的信念,利用贝叶斯法则计算信念与此不一致;——参与人前后信念保持一致。

例3:独立偏离——参与人3的信念0.9u =是否合理?——参与人1和参与人3的偏离是独立的,所以参与人3的合理信念为0.1u =;——不同参与人之间的偏离是独立的总结,一致信念要求:参与人偏离最小化,,参与人之间偏离是独立的;二.序贯均衡的定义1.例子——定义参与人1在信息集1.1和1.3以及参与人2在2.2上的序贯理性;——定义信息集1.3和2.2的信念?2.定义a.行为战略:参与人在某个信息集到行动集映射,——如果某个状态真正发生,参与人如何决策;——序贯理性是否满足?b.序贯理性:在任何信息集上,参与人在给定信念和所有后续行为战略,选择自身行为战略最大化预期效用。

博弈论(第四章)

博弈论(第四章)
谢富纪 2009年3月 11
2.有限次重复博弈
有唯一纯策略纳什均衡博弈的有限次重复博弈
有限次重复博弈的囚徒困境博弈,可以理解成警察 给两人两次交代的机会。
囚 徒2 坦白 不坦白
囚 徒 1
坦白
不坦白
-5, -5
-8, 0
0, -8
-1, -1
谢富纪 2009年3月
12
2.有限次重复博弈
因为重复博弈全过程是一种动态博弈过程,从第二 阶段开始。 此前的博弈已是既成的事实,而在此后又没有任何 的后继阶段,因此实现本阶段最大利益是两博弈 方在该阶段的唯一原则。结果是(坦白,坦白),
谢富纪 2009年3月
29
2.有限次重复博弈
本博弈中之所以不能或不能部分实现最佳结果
(A,A),是因为在两次重复博弈中博弈方没
有运用触发策略的条件或者说机会。后面的选择 并不取决于第一次博弈的结果。
谢富纪 2009年3月
30
2.有限次重复博弈
厂商2 得益
(1,4) (1.5,3) (3,3)
谢富纪 2009年3月
17
2.有限次重复博弈
削价竞争博弈
高价 寡 高价 头 1 低价
寡头2
低价
100,100 20,150 150,20 70,70
由于两个寡头在同一市场的竞争可以看作维持很 长时间,因此可以看作是重复博弈。然而结果是 令人遗憾的。
谢富纪 2009年3月 18
2.有限次重复博弈
两个悖论
谢富纪 2009年3月
27
2.有限次重复博弈
两市场博弈的重复博弈
厂商 2 A 厂A 商 1 B B
3,3
1,4
4,1
0,0

博弈论第四章

博弈论第四章

(1)起始结是一个单结的信息结;
(2)子博弈保留了原博弈的所有结构。 则称它为原博弈的一个子博弈(子博弈)。
按照博弈树的延伸的时序,或者按照博弈 树生长的时序,我们用一个扁椭圆形的虚 线的圈,把所论局中人在同一个时点的若
干决策节点罩起来,成为他的一个信息集。
(1)起始结是一个单结的信息结
x1
L L 1 2 S L 2 S (1,1) (2,2) 1 (-1,-1) (-1,-1) S 2 L L S (2,2)
镇上能卖6000元;但如果另一家商铺同时在小镇上卖
鞭炮,价格下跌使得这批鞭炮只能卖4000元。纳什均
衡是什么?
• 假设甲先行动,商铺乙看到对方的选择后再决定是否
进货,子博弈精炼纳什均衡是什么?
如果甲先行动,但在博弈开始前商铺主乙有一次行动A 的机会,利用子博弈精炼均衡概念分析下述两种情况下
的博弈结果: 何行动他都不会改变这个决定;
一颗大树表示一个博弈,一颗小树同样可以表示
一个博弈。如果小树是大树的一颗子树,并且
小树表示的博弈不破坏大树表示的博弈的结构,
那么小树表示的博弈,就叫做大树表示的博弈
的子博弈。
一、子博弈(sub-game)
子博弈定义:在一个扩展型博弈中,如果一 个博弈由它的一个决策结及其所有后续结 构成,并满足:
信息集的时候,面临决策的局中人对于博弈迄今的历史是
不清楚的,他不清楚博弈具体走到了他的这个信息集里面 的哪个决策节点。
在市场进入博弈中,包含3个子博弈(包括原博 弈)。而在囚徒博弈中,只有一个子博弈(?)
收益: A
B 容忍
进入 抵抗 A 不进入 B
B
抵赖
B 抵赖
-1 ,-1 -9 ,0 0 ,-9

博弈论课后习题

博弈论课后习题

Document serial number [UU89WT-UU98YT-UU8CB-UUUT-UUT108]第一章导论1、什么是博弈博弈论的主要研究内容是什么2、设定一个博弈模型必须确定哪儿个方面3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。

4、"囚徒的困境”的内在根源是什么举出现实中囚徒的困境的具体例子。

5、博弈有哪些分类方法,有哪些主要的类型6、你正在考虑是否投资100万元开设一家饭店。

假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。

如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。

逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。

请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。

第二章完全信息静态博弈1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么2、为什么说纳什均衡是博弈分析中最重要的概念3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。

4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响5、下面的得益矩阵表示两博弈方之间的一个静态博弈。

该博弈有没有纯策略纳什均衡t専弈的结果是什么6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。

7、博弈方1和2就如何分10 000元进行讨价还价。

假设确定了以下规则:双方同时提出自己要求的数额S1和S2, 0< sl,s2< 10 000,如果sl+s2W10 000,则两博弈方的要求都得到满足,即分别得到si和s2, 但如果是sl+s2>10 000,则该笔钱就被没收。

(完整word版)博弈论练习题

(完整word版)博弈论练习题

1、纳什均衡一定是上策均衡,但并非每一个上策均衡都是纳什均衡。

(×)2、如果重复博弈的次数较少,但两家厂商都具有完全理性,则相互合作仍能实现。

(×)1、贝叶斯纳什均衡属于哪种博弈中的均衡状态?(C )A、完全信息静态博弈;B、完全信息动态博弈;C、不完全信息静态博弈;D、不完全信息动态博弈。

2、下列正确的表述是(A )。

A、任何市场竞争都可由市场博弈来概括B、剔除不可置信的威胁后的纳什均衡属于精炼贝叶斯纳什均衡C、股票投资者之间的博弈属于零和博弈D、“摸着石子过河”属于完全信息动态博弈3、下述错误的表述是(C )。

A、现实中,信息不对称比信息对称更为普遍B、道德风险源于代理人的理性行为C、父子合开的小企业中不存在委托——代理问题D、委托人与代理人的利益几乎不可能完全一致4、右图为某一博弈的得益矩阵,据此可知:(D. )A.甲与乙均没有上策B.甲与乙均有上策C.甲有上策而乙没有上策D.甲没有上策而乙有上策5、对于右下图表示的博弈,其上策均衡或纳什均衡A.左上角B.右上角C.左下角D.右下角6、乒乓球团体赛中双方出场阵营的选择和确定属于(A. )。

A.静态博弈B.动态博弈C.零和博弈D.合作博弈7、就足球比赛中的比分而言,比赛属于( B )。

A.零和博弈B.变和博弈C.常和博弈D.静态博弈8、就排球比赛中的输赢结果而言,比赛属(A. )。

A.零和博弈B.变和博弈C. 常和博弈D.静态博弈假设有10 名劳动者,其中10 - x名是低能力的,另外x名是高能力的。

这10 名劳动者是企业的潜在员工。

现在,企业因业务扩展需要招聘1 名高能力劳动者。

又假设这10 名劳动者都渴望到这家企业去工作。

假设企业对高能力者愿意支付2元的工资,对低能力者支付1元的工资;高能力劳动者保留工资是1元,低能力者保留工资是0.5元。

请回答如下一些问题:1)假设信息是完全的(即劳动者的能力写在脸上,人人皆知),企业具有完全的谈判能力(即只支付员工保留工资水平的工资),则招聘结果将如何?由于信息是完全的,企业将大大降低招聘的风险,并以高能力劳动者可以接受的保留工资1元,从X名高能力劳动者中招聘到一名员工,市场交易顺利进行。

博弈论 课后习题答案

博弈论 课后习题答案

博弈论课后习题答案第四部分课后习题答案1. 参考答案:括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙的得益,而b表示甲的得益。

在第三阶段,如果,则乙会选择不打官司。

这时逆推回第二阶段,甲会选择a,0不分,因为分的得益2小于不分的得益4。

再逆推回第一阶段,乙肯定会选择不借,因为借的最终得益0比不借的最终得益1小。

在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是(a,b)。

a,0逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为(a,b)。

b,2在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0),当a,1时乙肯定会选择借,最后双方得益为(a,b)。

在第二阶段如果,则甲会选择a,1b,2分,此时双方得益为(2,2)。

再逆推回第一阶段,乙肯定会选择借,因为借的得益2大于不借的得益1,最后双方的得益(2,2)。

根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况:(1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0得益(1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益(a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。

要本博弈的“威胁”,即“打”是可信的,条件是。

要本博弈的“承诺”,即a,0“分”是可信的,条件是且。

a,0b,2注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。

不过最终的结果并不会超出上面给出的范围。

2. 参考答案:静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。

博弈论课后习题

博弈论课后习题

第一章导论1、什么是博弈博弈论的主要研究内容是什么2、设定一个博弈模型必须确定哪几个方面3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。

4、“囚徒的困境”的内在根源是什么举出现实中囚徒的困境的具体例子。

5、博弈有哪些分类方法,有哪些主要的类型6、你正在考虑是否投资100万元开设一家饭店。

假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。

如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。

逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。

请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。

第二章完全信息静态博弈1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么2、为什么说纳什均衡是博弈分析中最重要的概念3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。

4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响5、下面的得益矩阵表示两博弈方之间的一个静态博弈。

该博弈有没有纯策略纳什均衡博弈的结果是什么6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。

7、博弈方1和2就如何分10 000元进行讨价还价。

假设确定了以下规则:双方同时提出自己要求的数额S1和S2,0≤s1,s2≤10000,如果s1+s2≤10 000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10 000,则该笔钱就被没收。

问该博弈的纯策略纳什均衡是什么如果你是其中一个博弈方,你会要求什么数额,为什么8、设古诺模型中有n家厂商、qi 为厂商i的产量,Q=q1+…+qn 为市场总产量、P为市场出清价格,且已知P=P(Q)=a-Q(当Q<a时,否则P=0)。

博弈论第四章

博弈论第四章

4 非完全信息动态博弈4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。

参与人2 不知道t,但知道t的概率分布。

博弈的时序:(1)参与人1选择行动a1∈A1;(2)参与人2观察a1,选择a2∈A2博弈的收益:u1(a1, a2, t), u2(a1, a2, t )u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2例:1 RL M 13p 2 1- pL'R'L'R'2 0 0 01 0 1 2标准式表示参与人 2L'R'L2,10,0参与人 1 M0, 20,1R1, 31, 3纯战略纳什均衡: (L,L'), (R,R')均为子博弈精炼纳什均衡(无子博弈)。

但是(R, R')不可信。

排除不可信的纳什均衡:要求1 参与人必须有一个推断(belief).要求2 参与者的战略必须满足序贯理性(sequentially rational).定义: 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下,博弈以正的概率到达该集.要求3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。

例要求3的说明参与人1的类型空间:{ t1,t2,t3,t4 }行动空间:A= { L,R}推断p i: 观察到L后,参与人1的类型是t i的概率。

推断q i: 观察到R后,参与人1的类型是t i的概率。

p1 + p2 + p3 + p4 = 1q1 + q2 + q3 + q4= 1N如果参与人1的战略: t 1选 L ,t 2选 L , t 3选R ,t 4 选R 。

参与人2对p i 与 q i 的推断:p 1 = 3.02.02.0+= 0.4, p 2 = 3.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,例 3个参与人的博弈。

博弈论第四章 完全且完美信息动态博弈

博弈论第四章 完全且完美信息动态博弈

0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
精的扩展式表述包括四个要素:
✓ 参与人集合(Player) ✓ 每个参与人的战略集合(Strategy) ✓ 博弈的顺序(Order) ✓ 由战略组合决定的每个参与人的支付(Payoff)
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
精选PPT
12
动态博弈的 战略
精选PPT
13
动态博弈的战略的表述
✓ 战略:参与人在给定信息集的情况下选择行动的规则,它规定参 与人在什么情况下选择什么行动,是参与人的“相机行动方案”。
si表示第i个参与人的特定战略
Si si代表第i个参与人所有可选战 择略 的集合
如果n个参与人每人选择战 一略 个, n维向量s (s1,s2, ,si, ,sn)称为一个战略组合 si表示第i个人选择的战略
精选PPT
6
扩展式表示的一个例子
精选PPT
7
博弈树始于 局中人1 的一个决策结点,这时1
要从L和R中作出选择,如果局中人1选择L,其后就
到达 局中人2 的一个决策结点,这时,局中人2要
从L′和R′中作出选择。类似地,如果局中人1选择R, 则将到达局中人2的另一个决策结点。
这时局中人2从L′和R′中选择行动。无论局中人2 选择了哪一个,都将到达终结点 (即博弈结束)且两 局中人分别得到相应终点节下面的收益。

经济博弈论(第三版)复习题及答案%20谢识予著

经济博弈论(第三版)复习题及答案%20谢识予著
1
自然 赚(35%) 我 开 不开 开 不开 亏(65%)
(300) (100)
(0)Байду номын сангаас(100)
(b)如果我是风险中性的,那么根据开的期望收益与不开收益的比较: 0.35×300+0.65×0=105>100 肯定会选择开。 (c)如果成功的概率降低到 0.3,那么因为这时候开的期望收益与不开的收 益比较: 0.30×300+0.70×0=90<100 因此会选择不开,策略肯定会变化。 (d)如果我是风险规避的,开的期望收益为: 0.9×(0.35×300+0.65×0)=0.9×105=94.5<100 因此也会选择开。 (e)如果我是风险偏好的,那么因为开的期望收益为: 1.2×(0.35×300+0.65×0)=1.2×105=126>100 因此这时候肯定会选择开。 10、首先需要注意的是,在该博弈方的得益单位不同,逃犯得到的是增加或 者减少的刑期(年) ,而看守得到的则是奖金(元) ,因此除非先利用效用概念折 算成相同的单位,否则两博弈方的得益相互之间不能比较和加减。 直接采用单位不同的得益,该博弈的得益矩阵如下: 看 路线一 -10,1000 10,0 守 路线二 10,0 -10,1000
其实,根据该得益矩阵不难得到与上述动态博弈相同的结论,仍然是工人会 选择偷懒和老板会选择克扣。这个博弈实际上与囚徒的困境是相似的。
第二章复习题
4,5,5,7,9,10
第二章参考答案
4、多重纳什均衡不会影响纳什均衡的一致预测性质。这是因为一致预测性 不是指各个博弈方有一致的预测, 而是指每个博弈方自己的策略选择与自己的预
逃 犯
路线一 路线二
该博弈的扩展形表示如下:
逃犯 路线一 看守 路线一 路线二 路线一 路线二 路线二

4博弈论基础作业及答案.doc

4博弈论基础作业及答案.doc

博弈论基础作业一、名词解释纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识见PPT二、问答题1 •举出囚徒困境和智猪博弈的现实例子并进行分析。

囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等;以屮小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负, 一个学校最好不减负,因为这样做,可以带來比其他学校更高的升学率。

给定其他学校不减负,这个学校的最佳应对也是不减负。

否则自己的升学率就比其他学校低。

因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。

每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。

请用同样的方法分析其他例子。

智猪博弈的例子:大金业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。

而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。

但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。

因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。

请用同样的方法分析其他例子。

2•请用博弈论來说明“破釜沉舟”和“穷寇勿追”的道理。

破釜沉舟是一个承诺行动。

H的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。

也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。

否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。

穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。

否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。

口己也会付出更大的代价。

3.当求职者向企业声明自己能力强吋,企业未必相信。

但如果求职者拿出自己的各种获奖证书吋,却能在一定程度上传递自己能力强的信息。

这是为什么?由于口头声明几乎没有成本,因此即便是能力差的求职者也会向企业声明自己能力强。

博弈论各章节课后习题答案 (4)

博弈论各章节课后习题答案 (4)

第四章谈判与协调1.帕累托占优均衡和纳什均衡的关系是什么?纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。

这样的策略组合构成一个均衡局势,并命名为纳什均衡。

纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。

一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。

在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。

其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。

在博弈中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ∗∗∗⋯0i s ∗,0()()i i i j P s P s ∗∗>1,2,,,1,2,,i n j m==⋯⋯则称为博弈G 的帕累托占优纳什均衡。

可见帕累托占有纳什均衡是纳什均衡中收益最大0i s ∗的一种均衡。

2.分别找出具有下列性质的2人博弈的例子。

(1)不存在纯策略纳什均衡;(2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。

(1)不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡(2)该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均衡。

很显然,(和平,和平)是一个帕累托占优纳什均衡。

2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为:TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+200002122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。

试分别基于古诺模型和纳什谈判模型求解两企业的利润。

解:由和400010Q p =−12Q q q =+得124000.1()p q q =−+战争和平国家1战争-5,-58,-10和平-10,810,10所以:[]21121114000.1()(0.120100000)q q q q q π=−+−++211213800.10.2100000q q q q =−−−[]22122224000.1()(0.43220000)q q q q q π=−+−++221223680.10.520000q q q q =−−−12113800.10.40q q q π∂=−−=∂21223680.10q q q π∂=−−=∂21123800.10.403680.10q q q q −−=⎧⎨−−=⎩求解方程组得12880280q q =⎧⎨=⎩将,代入到,中去得到最优解1q 2q 1π2π*1*25488019200ππ⎧=⎪⎨=⎪⎩4.你能否对如下的CG-2×2博弈中x 的变化设计出一些实验方案,来讨论是帕累托占优思想还是风险占优思想在策略选择中起主要作用。

35博弈论-第四章

35博弈论-第四章

第四章完全信息动态博弈更为现实的考虑是将静态博弈动态化,动态化后,纳什均衡这一概念是否仍然有效呢?答案是部分有效的。

如果不存在动态不一致,那么纳什均衡在完全信息动态博弈中仍不失为一个有用的均衡概念,但纳什均衡概念本身并不能保证不出现动态不一致,为了克服这一点在纳什均衡的基础上生产了所谓子博弈完美均衡。

而这一章,我们将围绕这子博弈完美均衡来展开。

第一节完美信息与完全但不完美信息完全信息动态博弈可以分为两类,即完美信息与完全但不完美信息。

所谓的完美信息博弈,是指博弈中的后行动者始终能够观察到前行动者的行动,因而动态博弈中不存在参与者同时行动这样的情况。

而完全但不完美信息博弈,则指动态博弈中,至少存在两个参与者同时行动的情况,因而“后行动者”无法观察到“前行动者”的行动。

我们不妨用两个例子来加以说明。

例4.1 动态囚徒困境囚徒1图4-1 动态囚徒困境例4.2 取消管制政府图4-2 取消管制与图4-2完全等价的表示方法见图4-3。

政府图4-3 取消管制定义4.1完美信息动态博弈就是不存在同时行动的完全信息动态博弈。

显然,运用策略式来描述动态博弈会非常不便,特别是当信息不完全时更是如此,为了更简便地描述动态博弈,我们将引入一种新的博弈表达式——扩展式。

第二节动态博弈的扩展式我们把博弈中所有从开始到结束的行动序列称为全历史(Terminal history),而用参与者函数来表示在每一个全历史上,在博弈进行到某个阶段时谁来行动。

因而要完整地描述一个动态博弈,必须具备四个要素:(1)参与者集合;(2)全历史集合;(3)参与者函数;(4)偏好。

如果我们把全历史表示成一个行动序列(a1, a2,…, a K)(K为自然数,当K→∞时,就表示无穷动态博弈),那么(a1, a2, …, a m),其中m K≤,就称为全历史(a1, a2, …, a K)的子历史(Subhistory)。

当m < K时,(a1,a2, …, a m)就是全历史(a1, a2, …, a K)的真子历史(Proper subhistory)。

博弈论第4章答案

博弈论第4章答案

R R M 4.1.a 标准式1↖2 L ’ R ’4,1 0,0 3,0 0,1 2,2 2,2纯战略纳什均衡:( L, L ’ ) ( R, R ’ )子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ )精炼贝叶斯纳什均衡:( L, L ’ )4.1.b 标准式1↖2 L ’ M ’ R ’1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4纯战略纳什均衡:( R, M ’ )子博弈精炼纳什均衡:( R, M ’ )精炼贝叶斯均衡: 没有4.2标准式1↖2 L ’ R ’2,2 2,2 3,0 0,1 0,1 3,0六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。

求混合战略精炼贝叶斯均衡:设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p −−参与者2选择L ’和R ’的概率分别为,(1)q q −在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212120*1*1*0*p p p p p p +=+⇒=给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则:12121212[3*0*(1)][0*3*(1)]2*(1)41:**,*112p q q p q q p p p p p p q +−=+−=−−====又 联立得 所以 L LML LM L RL4.3答案(见4.5)4.4表示方法第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号;第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a )[(,),(,),1/2][(,),(,),1/2][(,),((1),),1/2][(,),(,),1,0]R R u u p R R d u p R R d u u p L R u d p q αα><+−===(b )[(,),(,),1/2,2/3][(,),(,),1,0][(,),(,),0,1]L L u u p q L R d u p q R L u d p q =<====中文版习题4.5答案(a )[(,),(,),1/3,1/2]R R u d p q >=(b )12121212[(,,),(,),1/3,1/2][(,,),(,),1/2,0]L L L u u p p q q L L R u d p p q q ==+<==+=。

博弈论习题及解答

博弈论习题及解答

※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)2. 分别用规范式和扩展式表示下面的博弈。

两个相互竞争的企业考虑同时推出一种相似的产品。

如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。

企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? (见教材)4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。

例子:厂商之间的价格战,广告竞争等。

※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? (见教材)2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。

先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。

然后用划线法求出该矩阵博弈的纯策略Nash均衡。

乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。

乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知,该矩阵博弈没有纯策略Nash均衡。

由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。

解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线,如下图,图中粗的折线,就是F(x)的图象由图可知,纳什均衡点与β1无关,所以原问题化为新的2*2矩阵博弈:由公式计算得:。

博弈论第四章习题

博弈论第四章习题

第四章习题一、如果T次重复齐威王田忌赛马,双方在该重复博弈中的策略是什么?博弈结果如何?答:因为这是零和博弈,结论比较具体。

重复Nash 均衡,均以1/6的概率选择各个策略,期望收益分别为1和-1。

因为这是竞争性的零和博弈,无论是有限次重复博弈还是无限次的重复博弈,均不能达成合作的条件。

二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。

答:火车站和机场餐饮业的服务的顾客往往是一次性的,回头客和常客也比较少,价格高,质量差,一次性博弈。

效率也比较低。

商业区和居民区的餐饮业和商业服务业,回头客和常客比较多,比较注重信誉,质优、价廉,重复博弈。

效率也比较高。

三、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?答:动态博弈的逆向归纳法可以用于有限次重复博弈,但不能用于无限次重复博弈,主要用逆向归纳法。

无限次重复博弈的效率往往高于有限次重复博弈。

当重复次数较少不一定考虑贴现问题,但无限次重复博弈必须考虑贴现问题。

启发:重视有限次与无限次的区别,区分和研究这两类博弈,在实践方面重要启发是促进和保持经济的长期稳定和可持续发展,提高社会经济效率是非常有意义的。

四、判断下列表述是否正确,并作简单讨论:(1)有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。

答:不一定。

对于有两个以上纯策略纳什均衡的条件下就不一定。

如“触发策略”就不是。

(2)有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。

答:是,根据子博弈完美纳什均衡的要求,最后一次必须是原博弈的一个纳什均衡。

(3)无限次重复博弈均衡解的得益一定优于原博弈均衡解的得益。

答:错。

如严格竞争的零和博弈就不优于。

(4)无限次重复古诺产量博弈不一定会出现合谋生产垄断产量的现象。

答:正确。

合谋生产垄断产量是有条件的,由贴现率来反映,当不满足条件时,就不能构成激励。

(5)如果博弈重复无限次或者每次结束的概率足够小,而得益的时间贴现率 充分接近1,那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。

吉本斯-博弈论基础答案

吉本斯-博弈论基础答案
2
1 2 的收益贴现到t期可得 1 − δ (a − c) / 8 , 1 2 2 触发战略有效的条件是: 1 − δ (a − c ) / 8 > (a − c) / 4 ,得到: δ > 1/ 2
(可参见谢识予的《经济博弈论》习题解答) 。 2.14 略 2.15 (1)垄断的产量、价格、利润: π=Q(a-Q)-CQ 利润最大化时:a-2Q=C,从而 Q=(a-c)/2. 此时价格为(a-c)/2。 (2)古诺均衡下的产量、价格、利润: π=(a-∑qi) qi -cqi
(*)
因 此 当 增 加 S 时 , U1 ( I c − S ) 会 减 小 , 同 时 , d ( S + B ) / dS > 0 , ∴ S + B 会 增 加 ,
∴ U 2 ( S + B ) 会增加,因为(*)式, U 2 ( S + B ) 增加的幅度比 U1 ( I1 − S ) 减小的幅度大,所以
如果参与者推断自然选择左边博弈的概率23参与者2选l如果参与者推断自然选择左边博弈的概率23参与者2选l和选r无差异如果参与者推断自然选择左边博弈的概率23参与者2选r如果参与者推断自然选择左边博弈的概率23参与者2选l如果参与者推断自然选择左边博弈的概率23参与者2选l和选r无差异如果参与者推断自然选择左边博弈的概率23参与者2选r自然选择左边博弈时参与者1选t参与者2选l
由 一 阶 条 件 ∂π i / ∂qi = 0 , 可 得 : qi = (a − q− i − c) / 2 … … ( 1)
* *
( 1) 式 两 端 乘 以 2, 再 减 qi , 可 得 : qi = a − Q − c … … ( 2), 对 于 任 意 的 i 都 成 立 。

博弈论 战略分析入门第四章课后题答案

博弈论 战略分析入门第四章课后题答案

Instructor’s Guide to Game Theory: A Nontechnical Introduction to theAnalysis of StrategyChapter 4. Nash Equilibrium1.Objectives and ConceptsThe principle objective of this chapter is to introduce the Nash equilibrium and to convey some notion of the range of possibilities and applications, including the possibilities that there may be no Nash equilibria in pure strategies and the possibility that there may be plural Nash equilibria. (Since mixed strategy equilibria are not introduced until Chapter 8, it is not possible to give a meaningful definition of pure strategies at this point, and is necessary to talk around it a bit.) Important subsidiary concepts are coordination games and Schelling points (or focal point equilibria), heuristic methods of finding the Nash equilibria, such as underlining, and refinement of Nash equilibrium.The chapter begins with an example that is based on Warren Nutter’s game-theoretic version of Bertrand competition, except that in this instance a kind of quality competition is considered. The solution to this game can be found by iterated elimination of dominated strategies (which will not be covered until Chapter 11) and reflects the intuition that it is best to be just one step ahead of the competition. Thus, while it does not have a dominant strategy equilibrium, it has some dominated strategies and a unique Nash equilibrium, and hopefully forms a natural bridge from the study of dominant strategy equilibrium.Games with plural equilibria are introduced with the game of Choosing Radio Formats. The idea that history (or other clues) can establish a Schelling point also comes in with this example. The Market Day game reinforces the idea that plural Nashequilibria can have explanatory value – explaining the persistence of what seem to be arbitrary conventions. Games without Nash equilibria (in pure strategies) are introduced with an escape-evasion game. This is an important category in itself, though the most important applications are in differential games and thus beyond the scope of the book.Accordingly, the concepts areNash EquilibriumUnique Nash EquilibriaFinding Nash EquilibriaPlural Nash EquilibriaThe difficulty of choosing among plural Nash equilibriaSchelling PointsCustom, convention and history as Schelling pointsSchelling points from the logic of the gameRefinementGames without Nash equilibria in pure strategies2. Common Study ProblemsStudents who have not yet grasped the best-response idea will find Nash equilibria even more difficult than dominant strategy equilibria. This is the crisis point for students who have not “got” best response. The best response tables (such as table 2 in the chapter) are designed to make this a little easier, so urge the student to rely on them and on underlining as intermediate steps in their analysis. I sometimes suggest to mystudents that they physically move their fingers along the column or row to pick out the biggest payoff. Making the solution as mechanical as possible will help students over that hump. Another (less troubling) problem is the relationship between Nash and dominant strategy equilibria. Taking dominant strategy equilibria first is a pedagogical convenience, since it is a little easier and will be familiar to students who have seen the Prisoner’s Dilemma in another class, but it can produce the impression that dominant strategy equilibria are not Nash equilibria. The Venn diagram (Figure 1) is meant to speak to that problem, and may need some stress in class.3. For Business StudentsThe key business concepts for this chapter are strategies of location and market niche, in the Location, Location, Location example, but also in the Radio Formats example and in the Hairstyle example in the exercises and discussion questions.4. Class AgendaFirst hour:1)Quiz on earlier material2)Introductory presentation: Nash Equilibria•Assignments3)Discussion: The Blonde Problem AgainSecond Hour:1)Discussion of quiz and assignments2)Play a coordination game in class, with random matching and without discussion.A handout description of the game is given on the next page.Another Random-Matching Two-Person GameOnce again, each person chooses between the strategies of collusion or defecting from the collusive arrangement.Put in your name and circle one of the two statements: either "my strategy is collude" or "my strategy is defect." Your instructor will tell you whether to follow directions A) or B) below.A)After you turn it in, your strategy choice will be matched with that of anotherclass member AT RANDOM, and your bonus points will be based on the payofftable above. There is to be no discussion of your strategy choices.B)You will be matched with your neighbor and may discuss your strategy choice ifyou wish.Payoffs are in GameBucks.TableArt's StrategyCollude DefectCollude (3,3)(0,2)Bob's StrategyDefect(2,0)(1,1)What will you do? Go for the big reward with a "collude" strategy or protect yourself with an "defect" strategy?Student name ____________________________My strategy is (circle one)ColludeDefect3)Discussion:a.Results of the in-class game.b.Give other examples of Schelling points in coordination games. Ideally,these should come from the students, but the following instances maystimulate the discussion if it comes slowly:i.Driving on the right or left-hand side of the road.ii.Speaking the same language.iii.Choosing a profession. Assumption: if both choose the sameprofession, it does not pay well because it is too crowded. Howmany business majors in the class? Engineering? Communications,etc?5. Answers to Exercises and Discussion Questions1.Solving the Game. Explain the advantages and disadvantages of NashEquilibrium as a solution concept for noncooperative games.Nash equilibrium is based on the idea that each player chooses the best response tothe strategy chosen by the other player. This is a clear concept of rationality wheneach person chooses in isolation from the other. Among the shortcomings are 1)Nash equilibrium may not be unique, posing the problem of determining which oftwo or more Nash equilibria may actually be chosen by rational agents, and 2) considering only the list of strategies for the game in normal form, that is, the“pure” strategies, there may not be a Nash equilibrium.2.Location, Location, Location (Again) Not all location problems have similarsolutions. Here is another one: Gacey's and Mimbel's are deciding where to puttheir stores in Metropolis, the town across the river from Gotham City. The three strategies for Metropolis are to locate downtown, in Old Town, or in the Garden District. The payoffs are shown in Table E1.Table E1 Payoffs in a New Location GameGacey'sDowntown Old Town Garden DistrictDowntown70,6060,12080,100Old Town110,7040,40120,110Mimbel'sGardenDistrict120,80110,12050,50Does this game have Nash equilibria? What strategies, if so? Which strategies would you predict that Gacey's and Mimbel's would choose? Compare and contrast this game with the location game in the chapter. What would you say about the relative importance of congestion in the location decisions of the firms in the two cases?A table modified to show the highest payouts for each player for each decision is as follows:Gacey's Downtown Old Town Garden District Downtown 70, 6060, 12080, 100Old Town110, 7040, 40120, 110M i m b e l 's Garden District 120, 80110, 12050, 50There are two Nash Equilibria. When Gacey’s locates in Old Town, Mimbels will locate in the Garden District, and vice versa. Which solution will actually be chosen is not definite.This problem is different from the one in the chapter since there are 2 NashEquilibriums instead of one, which requires a little guesswork as to which one will be the final solution. It is similar in that there is not a dominant strategy equilibrium.Congestion must be more of a problem in this scenario than in the chapterproblem. There is never a Nash equilibrium when both pick the same site. This could be explained by the congestion problem3. Drive on. Two cars meet, crossing, at the intersection of Pigtown Pike and Hiccup Lane. Each has two strategies: wait or go. The payoffs are shown in Table E2.Table E2. The Drive On Game Mercedeswait go wait0,01,5Buick go 5,1-100,-100Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibria? What strategies, if so? Would you predict which strategies rational drivers would choose in this game?Which? Why? Pigtown Borough has decided to put a stoplight at this intersection. How could that make a difference in the game?Here is a table modified to show the maximum payout for each driver:Mercedes Wait Go Wait0, 05, 1B u i c kGo 5, 1-100,-100Once again, there are 2 Nash Equilibria. They are for the Buick to wait and the Mercedes go, or vice versa.To determine which will happen requires guesswork. The personality of thedrivers might determine what happens. If I were in the Mercedes, I would probably not want to risk an expensive car getting damaged. Someone else, say in a CL600, mightfigure that his car is faster and that he can beat the other driver. Also, one of the drivers might just wave the other on rather than have both wait or both go.It is possible that both drivers might wait rather than run the risk of an accident, i.e. choose a risk dominant strategy.The stoplight would provide a Schelling Point to select for the equilibrium at which the driver with the green light chooses go.4. Rock, Paper, Scissors. Here is another common school-yard game called Rock, Paper, Scissors. Two children (we will call them Susan and Tess) simultaneously choose a symbol for rock, paper or scissors. The rules for winning and losing are:Paper covers rock (paper wins over rock)Rock breaks scissors (rock wins over scissors)Scissors cut paper (scissors win over paper)The payoff table is shown as Table E3.Table E3. Rock, Paper, ScissorsSusanpaper stone scissors.paper0,01,-1-1,1Tessstone-1,10,01,-1scissors1,-1-1,10,0Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibria? What strategies, if so? How do you think the little girls will try to play the game?Here is a table modified to show the best responses.Susanpaper stone scissors.paper0,01,-1-1,1Tessstone-1,10,01,-1scissors1,-1-1,10,0We see that there are no dominant strategies, nor are there Nash equilibriain terms of the strategies shown here. We have no basis (so far) to decide how the girls will play the game.NOTE TO INSTRUCTOR For the purist, it is not correct to say here that “thereare no Nash equilibria,” since this game has a mixed-strategy equilibrium. But, of course, we will not cover mixed strategy equilibria until a later chapter. Thecorrect statement is that there is no equilibrium in pure strategies.5. The Great Escape. Refer to Chapter 2, Question 2.Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibrium? What strategies, if so? How can these two opponents each rationally choose a strategy?WardenGuard walls Inspect cellsclimb No escape, success inpreventing escape Escape,failurePrisonerdig Escape,failure No escape, success inpreventing escapeThe numerical payoffs can be assigned in many different ways. Here is a simple version that interprets “no escape” as minus one for the prisoner, plus one for the warden, and “escape” as vice versa. As the underlines show, there is no Nash equilibrium. Thus far, we have no basis to say how a rational person would choose strategies in this case.WardenGuard walls Inspect cellsclimb-1,11,-1Prisonerdig1,-1-1,16. Sibling Rivalry. Refer to Chapter 2, Question 1.Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Determine all the Nash equilibria in this game. Do some Nash Equilibria seem likelier to occur than others? Why?Irismath litmath 3.7, 3.8 4.0, 4.0Julialit 3.8, 4.0 3.7, 4.0If the siblings act independently, rationally and with self- interest (non-cooperatively), we can find two Nash equilibrium's strategies: (literature, math), (math, literature).We note that there is a Schelling point in this game: (Math, Lit) yields a certain 4.0 for both girls, which is a reason it might attract attention, and probably is more likely to be observed.7. Hairsyle.Shaggmopp, Inc. and Shear Delight are hair-cutting salons in the same strip mall, each groping for a market niche. Each can choose one of three styles: punker, contemporary sophisticate, or traditional. Those are their strategies. They already have somewhat different images, based on the personalities of the proprietors, as the names may suggest. The payoff table is shown as Table E4.Table E4. Payoffs for HaircuttersShearpunker sophisticate traditionalpunker35,2050,4060,30Shaggmoppsophisticate30,4025,2535,55traditional20,4040,4520,20Are there any dominant strategies in this game? Is there a dominant strategy equilibrium? Are there any Nash equilibria? How many? Which? How do you know?Once again, here is the modified table:ShearPunkerSophisticate Traditional Punker 35, 2050, 4060, 30Sophisticate 30, 4025, 2535, 55S h a g g m o p pTraditional20, 4040, 4520, 20Shaggmopp’s best strategy is to go punker regardless of what Shear does. This is his dominant strategy. Since Shear has no such dominant strategy, there is no dominant strategy equilibrium.The only Nash equilibrium is when Shear decides to go with the sophisticate look.Since Shear knows that Shaggmopp will probably go punk rather than sophisticate, it will choose sophisticate.6. Quiz questionPlaced on the next page for convenience in copying and printing.Student name ____________________________Quiz – Game TheoryFelix and Oscarina share their home with two cats. Felix, who has a sharp sense of smell, would like for the cat boxes to be cleaned twice a week. Oscarina, whose sense of smell is less acute, would be satisfied if they were cleaned once a week. Each would prefer not to be the one to clean the cat boxes. Their payoffs are shown on the following table.Oscarinadon't clean clean once clean twicedon't clean-5,-30,-17,-5Felixclean once-2,45,26,-4clean twice0,51,32,-3Find any and all Nash equilibria for the catbox game? Are there dominated strategies? Which? Is there a dominant strategy equilibrium? Explain.Answer:A payoff table with best responses underlined follows:Oscarinadon't clean clean once clean twicedon't clean-5,-30,-17,-5Felixclean once-2,45,26,-4clean twice0,51,32,-3The Nash equilibrium is where Felix cleans the cat box twice and Oscarina never cleans. “Clean twice” is a dominated strategy for Oscarina. Since the best response for each person depends on the strategy chosen by the other, there is no dominant strategy equilibrium.It seems that Felix, whose need is greater, will empty the catbox, if the two companions act noncooperatively. Now, it may seem odd that people who live together would act noncooperatively , but life is strange, and odd things do happen. However, a couple of years ago, Oscarina gave Felix a Christmas present – a year of catbox cleaning – and has renewed the gift, so love triumphs after all.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章习题
一、如果T次重复齐威王田忌赛马,双方在该重复博弈中的策略是什么?博弈结果如何?
答:因为这是零和博弈,结论比较具体。

重复Nash 均衡,均以1/6的概率选择各个策略,期望收益分别为1和-1 o
因为这是竞争性的零和博弈,无论是有限次重复博弈还是无限次的重复博弈,均不能达成合作的条件。

二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。

答:火车站和机场餐饮业的服务的顾客往往是一次性的,回头客和常客也比较少,价格高,质量差,一次性博弈。

效率也比较低。

商业区和居民区的餐饮业和商业服务业,回头客和常客比较多,比较注重信誉,质优、价廉,重复博弈。

效率也比较高。

三、有限次重复博弈和无限次重复博弈有什么区
别?这些区别对我们有什么启发?
答:动态博弈的逆向归纳法可以用于有限次重复博弈,但不能用于无限次重复博弈,主要用逆向归纳
法。

无限次重复博弈的效率往往高于有限次重复博弈。

当重复次数较少不一定考虑贴现问题,但无限次重复博弈必须考虑贴现问题。

启发:重视有限次与无限次的区别,区分和研究这两类博弈,在实践方面重要启发是促进和保持经济的长期稳定和可持续发展,提高社会经济效率是非常有意义的。

四、判断下列表述是否正确,并作简单讨论:
(1)有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。

答:不一定。

对于有两个以上纯策略纳什均衡的条件下就不一定。

如“触发策略”就不是。

(2)有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。

答:是,根据子博弈完美纳什均衡的要求,最后一次必须是原博弈的一个纳什均衡。

(3)无限次重复博弈均衡解的得益一定优于原博
弈均衡解的得益。

答:错。

如严格竞争的零和博弈就不优于。

(4)无限次重复古诺产量博弈不一定会出现合谋
生产垄断产量的现象。

答:正确。

合谋生产垄断产量是有条件的,由贴现率来反映,当不满足条件时,就不能构成激励。

(5)如果博弈重复无限次或者每次结束的概率足够小,而得益的时间贴现率$充分接近1,那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。

答:这就是无限次重复博弈的民间定理。

(6)触发策略所构成的均衡都是子博弈完美纳什均衡。

答:错误。

触发策略本身并不能排除重复博弈中不可信的威胁和承诺,因此由触发策略构成的不一定是子博弈完美纳什均衡。

五、为什么消费者偏好去大商店买东西而不太信赖走街穿巷的小商贩?
答:去大商店买东西,重复博弈——合作诚信问题;走街穿巷的小商贩,一次性博弈——没有合作的必要,存在不诚信和欺诈。

建立信用制度和诚信档案的必要性。

六、寡头的古诺产量博弈中,如果市场需求p=130-2,边际成本 C = 30且没有固定成本,贴现因子$ = 0.9。

如果该市场有长期稳定性,问两个厂商能否维持垄断产量?
解:『=(130-/-必-30气古诺产量
[刀)—(130 —q、— % )公—3。


* * 100 * * 10000
01=02=-^,利泅为:羽=缶=3—
垄断产量勿= (13O — 0)g — 3Og,
A q,n = 50,兀m = 2500
市场长期稳定的,翕= 1250
2
1250(1 + ^ +罗+.・.)=^^ = 12500, 3 = 0.9 1-3
如果一厂商偏离:勿]=(130 - 25 - 0)0 - 30., n% =37.5, <=1406.25
成,山皿* 10000,£ £2、牌皿* 100003
那么:1406.25 + ---- (3+罗+••.) = 1406.25 + --
9 9(1- $)
= 1406.25 +10000 = 11406.2502500
因此,坚持垄断产量是明智的。

七、如果上一题厂商1的边际成本该为10,厂商
2695.312 51 — 5 二
610.937
51一3
=
2的边际成本仍然是30。

假设市场仍然是长期稳定的, 而且两个厂商已经达成了厂商1生产3/4,厂商2生产1/4的垄断产量分配协议,问这种协议是否能够长期维持?
解.J 羽=(13。

-01 -02)01 T°01古诺产量
[刀2 =(130-01 - 02)02 - 3002
* 140 * 80 打心乌* 19600 * 6400
0 =^~902=§,木j/门为:心=—-—,刀2=-g-
垄断产量71= (130 - Q)Q- 0.75 x 102 - 0.25 x 300,
= 115Q_Q2,
=> Q n = 57.5 ,产量分别为:43.125 , 14.375 ;
心加=2695.3125, 7T2tn= 610.9375
如果两个厂商均不偏离:
厂商1偏离:
丸1 = (130 -14.375 - %-10/ = 105.625/ -g:, q x
=52.8125,徇=278926
2789.16 +以迎(^+郡+・・・)= 2789.16 + 19600
9
=22389.16 < 26953.125 不偏离
厂商2偏离:
勿2 = (130-43.125 -02)02 -3。

02,02 = 28.4375,
"2 =808.6914
808.6914 +竺匹($+普+...)= 808.6914 + 6400
9
=7208.6914 > 6109.375 偏离
还可以计算出不同的3,可以进一步讨论。

八、两个人合作开发一项产品,能否成功与两个
人的工作态度有关,设成功概率如下:
B
A
努力偷懒努力9/163/8偷懒3/81/4
再假设成功时每人有4单位的利益,失败则双方
都没有利益,偷懒本身有1单位的利益。

问该博弈无限次重复博弈的均衡是什么?
解:根据问题的假设,该博弈的得益矩阵如下:
B
A
努力偷懒
努力9/4, 9/43/2, 5/2偷懒5/2, 3/22, 2
一次性博弈显然是囚徒困境式博弈,唯一的纳什
均衡两人都偷懒,双方的期望得益都是2。

在无限次重复博弈中,假设双方为了在共同努力
当满足:
4(1 —3) 一 2 (1 也就是S>-时采取这
2
方面实现合作采取如下的触发策略:开始时努力,一旦发现对方不努力,则自己也偷懒。

我们可以分析当贴现因子3符合什么条件时,该策略构成子博弈完美纳什均衡。

.、Q Q
不偏离:一(1 + 3+$2 +...)=——
4 4(1 — 3)
c 1 o
偏离:- + 2(J + ^2+--*) = - + —^―
2 2 (D
种触发策略是正确的,否则,偏离是正确的。

当曷时,两博弈方都采用这样的触发策略是本
博弈的子博弈完美纳什均衡;如果驾,则上述触发策略组合不是子博弈完美纳什均衡,两人都会采取偷懒的策略。

相关文档
最新文档