【博弈论基础】(吉本斯)课后习题答案

合集下载

博弈论课后习题

博弈论课后习题

第一章导论1、什么是博弈?博弈论的主要研究内容是什么?2、设定一个博弈模型必须确定哪几个方面?3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。

4、“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。

5、博弈有哪些分类方法,有哪些主要的类型?6、你正在考虑是否投资100万元开设一家饭店。

假设情况是这样的:你决定开,则0.35的概率你讲收益300万元(包括投资),而0.65的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择?(c)如果你是风险规避的,且期望得益的折扣系数为0.9,你的策略选择是什么?(d)如果你是风险偏好的,期望得益折算系数为1.2,你的选择又是什么?7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。

如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。

逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。

请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。

第二章完全信息静态博弈1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么?2、为什么说纳什均衡是博弈分析中最重要的概念?3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。

4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响?5、下面的得益矩阵表示两博弈方之间的一个静态博弈。

该博弈有没有纯策略纳什均衡?博弈的结果是什么?6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。

7、博弈方1和2就如何分10000元进行讨价还价。

假设确定了以下规则:双方同时提出自己要求的数额S1和S2,,如果s1+s2≤10000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10000,则该笔钱就被没收。

【博弈论基础】(吉本斯)课后习题答案

【博弈论基础】(吉本斯)课后习题答案

混 合 战 略 纳 什 均 衡 矛 盾 , 假 设 不 成 立 , 原 命 题 得 证 。
猪 头 非 整 理 ebwf@
3
Gibbons《博弈论基础》第二章习题解答(部分)
2.1 采用逆向归纳法,先最大化家长的收益:给定孩子的行动 A,来选择自己的行动 B,
MaxV ( I p − B) + k ( I c + B)
2 2 时 , 生 产 qm / 2 的 一 方 的 利 润 为 π 2 = 5(a − c) / 48 , 生 产 qc 的 一 方 的 利 润 为
π 3 = 5(a − c)2 / 36 ; 双 方 都 生 产 qc 时 , 每 一 方 的 利 润 都 为 π 4 = (a − c) 2 / 9 。 以 标 准 式 表 示
2 1 2 2
{( (2w − w ) /(w + w ), (2w
1.14
− w1 ) /( w1 + w2 ) ) , ( (2 w1 − w2 ) /( w1 + w2 ), (2 w2 − w1 ) /( w1 + w2 ) )}
*
证 明 : 在 混 合 战 略 纳 什 均 衡 中 , 参 与 人 i 的 混 合 战 略 为 pi , 其 中 选 择 第 j 个 纯 战 略 sij 的 概 率 为 pij 。 用 反 证 法 证 明 。 假 设 pij > 0 , 且 sij 是 第 一 个 被 重 复 剔 除 劣 战 略 所 剔 除 的 战 略 。 那 么 参 与 人 i 必 定 存 在 另 一
针 对 上 面 的 博 弈 , 设 参 与 人 1 的 战 略 为 ( p,1-p), 参 与 人 2 的 战 略 为 ( q,1-q)。 则 对 于 1 来 说 , 2q* + 4(1 − q* ) = 3q* + 2(1 − q* ) , 得 : q* = 2 / 3 ; 对 于 2 来 说 , 4(1 − p ) = 2 p + 3(1 − p ) , 得 p = 1/ 3 。

博弈论课后习题答案

博弈论课后习题答案

博弈论课后习题答案博弈论课后习题答案博弈论是一门研究决策和策略的学科,它涉及到多个参与者之间的相互作用和决策过程。

在博弈论的学习过程中,习题是非常重要的一部分,通过解答习题可以加深对博弈论概念和原理的理解。

下面是一些常见博弈论习题的答案,希望对大家的学习有所帮助。

1. 两人囚徒困境博弈在囚徒困境博弈中,两个囚犯被关押在不同的牢房里,检察官给每人提供了一个选择:合作(合作供认)或背叛(沉默)。

如果两人都合作,那么每个人的刑期都会较短;如果两人都背叛,那么每个人的刑期都会较长;如果一个人合作而另一个人背叛,那么背叛的人将会获得较短的刑期,而合作的人将会获得较长的刑期。

答案:在囚徒困境博弈中,每个囚犯都会追求自己的最大利益。

根据博弈论的原理,无论对方选择什么,背叛都是最优策略。

因此,两人都会选择背叛,最终导致双方都获得较长的刑期。

2. 石头剪刀布博弈石头剪刀布是一种常见的博弈游戏,两个参与者同时出示石头、剪刀或布,根据两者的选择,结果会有不同的得分。

答案:在石头剪刀布博弈中,每个参与者都有三种选择,而且每种选择的胜负关系都不同。

根据博弈论的原理,最优策略是随机选择,使得对手无法预测自己的选择。

这样做可以最大程度地减少对手的获胜概率。

3. 拍卖博弈拍卖是一种常见的博弈形式,参与者通过竞价来争夺一个物品或服务。

在拍卖中,不同的拍卖规则和策略会对结果产生影响。

答案:在拍卖博弈中,最常见的策略是以自己的估值为基准进行竞价。

如果一个参与者的估值高于其他参与者,那么他可以通过竞价来获得物品或服务。

然而,如果其他参与者也有较高的估值,那么竞价将会继续上升,直到只剩下一个竞价者。

在这种情况下,最高的竞价者将会获得物品或服务,但是他需要支付他的竞价。

4. 价格战博弈价格战是一种常见的博弈形式,不同的公司通过调整价格来争夺市场份额。

在价格战中,公司的利润和市场份额会受到价格策略的影响。

答案:在价格战博弈中,最优策略取决于对手的策略和市场需求。

博弈论 课后习题答案

博弈论 课后习题答案

博弈论课后习题答案第四部分课后习题答案1. 参考答案:括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙的得益,而b表示甲的得益。

在第三阶段,如果,则乙会选择不打官司。

这时逆推回第二阶段,甲会选择a,0不分,因为分的得益2小于不分的得益4。

再逆推回第一阶段,乙肯定会选择不借,因为借的最终得益0比不借的最终得益1小。

在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是(a,b)。

a,0逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为(a,b)。

b,2在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0),当a,1时乙肯定会选择借,最后双方得益为(a,b)。

在第二阶段如果,则甲会选择a,1b,2分,此时双方得益为(2,2)。

再逆推回第一阶段,乙肯定会选择借,因为借的得益2大于不借的得益1,最后双方的得益(2,2)。

根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况:(1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0得益(1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益(a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。

要本博弈的“威胁”,即“打”是可信的,条件是。

要本博弈的“承诺”,即a,0“分”是可信的,条件是且。

a,0b,2注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。

不过最终的结果并不会超出上面给出的范围。

2. 参考答案:静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。

博弈论基础 (罗伯特.吉本斯 著) 中国社会科学出版社 课后答案

博弈论基础 (罗伯特.吉本斯 著) 中国社会科学出版社 课后答案

+
B)i V
′′(I
p
V ′′(I p − B)

B)
+
kU
′′
2
(S
*
+
B)
+
U

2
(S
*
+
B)i V
′′(I
p
kU
′′
2
(S
*
+
B)

B
)
+
kU
′′
2
(
S
*
+
B)
hda =
U

2
(S
*
+
B)i V
′′(I
p
kU
′′
2
(S
*
+
B)

B)
+
kU
′′
2
(
S
*
+
B)
.k > 0 = f (S′)
www So S* < S′ . If child save more, i.e. S′ , both the parent’s and child’s payoffs could be
)2
+
(1 −
π
)
1 i( 2
aL − 2
c
)2
)
.
22
1−δ
In
period
with
demand aH , payoff from deviating is
(aH − c)2 ; 2
in period with
demand

博弈论基础 习题2

博弈论基础 习题2

博弈论基础 习题2【第四讲 完全信息动态博弈】1、 分别求下图所示的两个扩展式表述博弈的SPNE :2、 在历史上,卓文君与司马相如一见钟情,但是卓文君的父亲卓王孙却反对文君和相如在一起,于是有了以下版本的“文君当垆”博弈。

博弈由卓文君先行动,她有两个选择:与司马相如“私奔”(从而过着当垆卖酒的清贫生活)与“不私奔”。

如果选择不私奔,博弈结束,文君失去了如意郎君,其支付为1 ,而其父得到了他意愿的结果,其支付为1。

如果文君选择与司马相如私奔,那么在观察到文君的行动后轮到卓王孙行动,他有两个选择:“默许”与“断绝父女关系”。

如果默许,那么文君的支付为2,卓王孙的支付为0;如果选择了断绝关系,那么文君的支付为 1.5 ,卓王孙的支付为2 。

(1)画出这个动态博弈的博弈树;(2)将该博弈树用静态博弈的策略式支付矩阵表述出来,并利用划线法找出所有的纯策略纳什均衡;(3)那一(几)个均衡你认为是不合理的?为什么?找出这个动态博弈的SPNE3、 考虑如下的双寡头市场策略性投资模型:企业1和企业2目前的单位生产成本都是2c 。

企业1筹划引进一项新技术使单位生产成本降至1c ,但是该项技术需要的投资为f 。

第一阶段,企业1选择是否投资;第二阶段,企业2可以观察到企业1的投资决策,在企业1做出是否投资的决策之后,两个企业同时选择产量。

假定市场反需求函数为1214()p q q ,这里1q 、2q 分别是企业1、2选择的产量,p 是市场价格。

试问f 取什么值时,企业1将会投资引进新技术?【第五讲 多阶段博弈与重复博弈】1、 考虑第五讲课文中介绍的“囚徒困境-复仇”二阶段博弈。

请构建博弈双方的一个策略组合,使得第一阶段的行动选择(,)F m 能够作为一个SPNE 结果出现(贴现因子1 )。

2、 两个生产完全同质产品的厂商进行着价格博弈,若两个厂商都采用垄断价格(合作)则各自得到垄断利润的一半2m,一个厂商单独略微削价则可独得全部垄断利润m,恶性竞争(价格一直降到边际成本)则利润都为零。

第一章习题和答案

第一章习题和答案

第三章 习题1. 考虑如下贝叶斯博弈:(1)自然决定支付矩阵(a )或(b),概率分别为u 和1u -;(2)参与人1知道自然的选择,即知道自然选择支付矩阵(a )或(b),但是参与人不知道自然的选择;(3)参与人1和参与2同时行动(参与人1选择T 或B 时不知参与人的选择,参与人2选择L 或R 不知参与人1的选择)。

给出这个博弈的扩展式表述并求纯战略贝叶斯均衡。

2. 考虑如下扰动的性别战博弈,其中i t 服从[]0,1的均匀分布, 01ε<<,1t 和2t 是独立的, i t 是参与人i 的私人信息。

a.求出以上博弈所有纯战略贝叶斯均衡。

b.证明当0ε→时,以上贝叶斯均衡和完全信息的混合战略纳什均衡相同。

3. 考虑如下标准式博弈的均衡,存在的唯一纳什均衡就是每个参与人i 都以1/2的概率选择H 。

利用海萨应纯化定理,构造一个扰动的不完全信息博弈,其纯战略贝叶斯纳什均衡收敛于以下完全信息的混合战略均衡(Gibbons 书中习题3.5)。

4. 在一个5人参加的私人价值的一级价格拍卖中0.82i i b v =+是贝叶斯纳什均衡,i b 是参与i 的叫价,i v 是参与人i 的价值信息,独立的服从于[]6,7的均衡分布。

利用显示原理构造一个直接机制,均衡结果与以上贝叶斯纳什均衡完全相同。

5. 一个垄断企业的成本函数为().c q q k θ=+,其中q 是产量,θ为边际成本,k 是固定成本。

假定θ是私人信息,固定成本k 和市场需求()q q p =是共同信息。

考虑如下直接机制{(),(),},p T θθθ其中p 为政府规定的价格,T 是政府对企业的补偿,θ是企业自己报告的成本。

a.证明如果(),(),p T k θθθ==则企业会谎报边际成本。

b.在()p θθ=时,如何规定()T θ才能诱使企业说实话。

6. 两个企业同时决定是否进入一个市场。

企业i 的进入成本[0,)i θ∈∞是私人信息,i θ是服从分布函数()i F θ的随机变量以及分布密度()i f θ严格大于零,并且1θ和2θ两者独立。

“博弈论”习题及参考答案

“博弈论”习题及参考答案

“博弈论”习题及参考答案《博弈论》习题⼀、单项选择题1.博弈论中,局中⼈从⼀个博弈中得到的结果常被称为()。

A. 效⽤B. ⽀付C. 决策D. 利润2.博弈中通常包括下⾯的内容,除了()。

A.局中⼈B.占优战略均衡C.策略D.⽀付3.在具有占优战略均衡的囚徒困境博弈中()。

A.只有⼀个囚徒会坦⽩B.两个囚徒都没有坦⽩C.两个囚徒都会坦⽩D.任何坦⽩都被法庭否决了4.在多次重复的双头博弈中,每⼀个博弈者努⼒()。

A.使⾏业的总利润达到最⼤B.使另⼀个博弈者的利润最⼩C.使其市场份额最⼤D.使其利润最⼤5.⼀个博弈中,直接决定局中⼈⽀付的因素是()。

A. 策略组合B. 策略C. 信息D. ⾏动6.对博弈中的每⼀个博弈者⽽⾔,⽆论对⼿作何选择,其总是拥有惟⼀最佳⾏为,此时的博弈具有()。

A.囚徒困境式的均衡B.⼀报还⼀报的均衡C.占优策略均衡D.激发战略均衡7.如果另⼀个博弈者在前⼀期合作,博弈者就在现期合作;但如果另⼀个博弈者在前⼀期违约,博弈者在现期也违约的策略称为()。

A.⼀报还⼀报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。

A.博弈双⽅都获胜B.博弈双⽅都失败C.使得先采取⾏动者获胜D.使得后采取⾏动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当⼀个垄断竞争⾏业是由⼀个主导企业控制时B.当⼀个寡头⾏业⾯对的是重复博弈时C.当⼀个垄断⾏业被迫重复地与⼀个寡头⾏业博弈时D. 当⼀个寡头⾏业进⾏⼀次博弈时10.⼀个企业采取的⾏为与另⼀个企业在前⼀阶段采取的⾏为⼀致,这种策略是⼀种()。

A.主导策略B.激发策略C.⼀报还⼀报策略D.主导策略11.关于策略式博弈,正确的说法是()。

A. 策略式博弈⽆法刻划动态博弈B. 策略式博弈⽆法表明⾏动顺序C. 策略式博弈更容易求解D. 策略式博弈就是⼀个⽀付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中⼈选择的⼀套⾏动计划;B. 参与博弈的每⼀个局中⼈都有若⼲个策略;C. ⼀个局中⼈在原博弈中的策略和在⼦博弈中的策略是相同的;D. 策略与⾏动是两个不同的概念,策略是⾏动的规则,⽽不是⾏动本⾝。

吉本斯博弈论基础pdf

吉本斯博弈论基础pdf

吉本斯博弈论基础pdf
吉本斯博弈论基础主要包括以下几个方面:
1.参与者:在博弈论中,参与者是决策的主体,可以是个人、组织或国家等。

在吉本斯博弈论中,参与者通常被视为具有有限理性的个体,他们根据自身的利益和偏好进行决策。

2.战略:战略是参与者在博弈中的选择,可以是合作或竞争等不同的行为方式。

在吉本斯博弈论中,战略的制定需要考虑对手的反应和预期,以达到最优的决策效果。

3.收益:收益是参与者在博弈中的结果,可以是经济利益、社会地位等。

在吉本斯博弈论中,收益的分配取决于参与者的策略选择和博弈规则的设定。

4.均衡:均衡是博弈中的一种状态,指所有参与者的最优策略组合。

在吉本斯博弈论中,均衡的概念非常重要,它是分析博弈结果和预测未来行为的基础。

5.动态博弈:动态博弈是指参与者的决策和行动有先后顺序,后行动者可以根据先行动者的行为做出最优的决策。

在吉本斯博弈论中,动态博弈的分析需要考虑时间因素和信息不完全等因素。

总的来说,吉本斯博弈论基础主要包括参与者、战略、收益、均衡和动态博弈等几个方面。

这些基础概念和分析方法构成了吉本斯博弈论的基本框架,为研究决策制定和行为模式提供了重要的理论支持。

4博弈论基础作业及答案.doc

4博弈论基础作业及答案.doc

博弈论基础作业一、名词解释纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识见PPT二、问答题1 •举出囚徒困境和智猪博弈的现实例子并进行分析。

囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等;以屮小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负, 一个学校最好不减负,因为这样做,可以带來比其他学校更高的升学率。

给定其他学校不减负,这个学校的最佳应对也是不减负。

否则自己的升学率就比其他学校低。

因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。

每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。

请用同样的方法分析其他例子。

智猪博弈的例子:大金业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。

而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。

但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。

因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。

请用同样的方法分析其他例子。

2•请用博弈论來说明“破釜沉舟”和“穷寇勿追”的道理。

破釜沉舟是一个承诺行动。

H的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。

也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。

否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。

穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。

否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。

口己也会付出更大的代价。

3.当求职者向企业声明自己能力强吋,企业未必相信。

但如果求职者拿出自己的各种获奖证书吋,却能在一定程度上传递自己能力强的信息。

这是为什么?由于口头声明几乎没有成本,因此即便是能力差的求职者也会向企业声明自己能力强。

博弈论各章节课后习题答案 (2)

博弈论各章节课后习题答案 (2)
乙企业
高质量
低质量
甲企业
高质量 低质量
50,50 900,600
100,800 -20,-30
该矩阵博弈还有一个混合的纳什均衡
Q=a+d-b-c= -970,q=d-b= -120,R= -1380,r= -630,可得 x = 12 , y = 63 97 138
因此该问题的混合纳什均衡为 ((12 , 85), ( 63 , 75 )) 。 97 97 138 138
i =1 j=1
i =1 j=1
4
q
* i
=0,p*=c,
说明此时各厂商的产品价格等于边际成本,这时的市场已是完全竞争市场。
9. 对于下列的威慑进入博弈,首先计算垄断情况下的产量与价格组合,再计算存在竞争的
情况下两企业的产量与价格组合,并对这两种情况下的结果作比较分析。假定进入者相信垄
断在位者在随后的阶段将会维持它的产量水平。市场需求曲线由方程 p=10-2Q 给出,其中 p
并设企业 i 生产产量 qi 的总成本 Ci(qi)=cqi,这里 c 是常数,并假设 c<a。企业同时就产量进 行决策。求出该博弈的纳什均衡。当 n 趋于无穷大时,会发生什么情况?
解:厂商 i 的利润为:πi=p(Q)-cqi=(a-Q-c)qi
令 ∂πi ∂q i
=
0
,则有:q
* i
=a-c-Q*
由表达式(2.3.13)~(2.3.16)可得如下不等式组
Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1
将这些数据代入(2.3.19)和(2.3.22),可得混合策略 Nash 均衡(( 1 , 8 ),( 4 , 3 )) 99 77

博弈论各章节课后习题答案

博弈论各章节课后习题答案

9. 求如图所示完全信息动态博弈的子博弈完美纳什均衡(图中数字(a,b,c)分别表示局中人 1、
2、3 的 收 益 )。
1
A1
A2
3
2
C1
C2
B1
B2
(4,2,3)
(1,7,8) 3
C1
C2 C1
3
C2
(5,4,3) (7,6,6) (2,1,9) (0,4,2)
答:局中人 1 采取 A2 行 动 ,局中人 2 采取行动 B1 时,局中人 3 必然采取 C2 行 动( 因为 3<6), 因而该博弈的顶点只能是(7,6,6)。同样对于局中人 3 右边一个子博弈,必然采取 C1 行动 (9>2),因而该博弈的顶点只能是(2,1,9)。进而原博弈简化为:
的定价,qi是企业i的需求量。假设企业生产没有固定成本,并且边际成本为常数c,c<a.假定博弃 重复无穷多次,每次的价格都立即被观察到,企业使用触发策略。求使垄断价格可以作为完美 均衡结果出现的最低贴现因子δ,并解释δ与n的关系。
分以下几个步骤进行。
1)计算纳什均衡 当企业 i 选择价格 pi,其它企业选择价格 pj(j=1,2,…,n,j≠i)时,企业 i 的利润为: πi = (pi − c)qi = (pi − c)(a − pi + b(p1 + p2 + ⋯ + pi−1 + pi+1 + ⋯ + pn )) ,i=1,2,…,n
∂π2 ∂q 2
= a − q1
− 2q2
− q3
−c=0
∂π3 ∂q3
=
a
− q1
− q2
− 2q3
−c

博弈论习题解答.doc

博弈论习题解答.doc

博弈论习题解答一、判断题1.X,只要任一博弈方单独改变策略不会增加得益,策略组合就是纳什均衡了。

2.V3.V4.X,某些情况下参与者具有先动优势,例如进入市场的博弈。

5.V6.X,逆向归纳法最基本的特征就是能排除扩展式博弈中所有不可信行为,包括不可信威胁和不可信承诺。

7.V8.X,对于零和博弈或者不满足合作条件的其他博弈来说,无限次重复博弈并不意味着效率的提局,得益不一定同。

9.V10.X,有些是故意隐瞒自己的行为。

11.X,在一个子博弈中出现的必须是完整的信息集,由于多节点信息集开始的博弈必然分割一个信息集,因此不可能是个子博弈。

12.X,不完美信息是指没有完美信息而非完全没有信息。

13.X,是因为其他参与者必然会考虑这些行为选择并作为他们自己选择行为的依据。

即使参与者自己不设定针对自己所有类型的行为选择,其他参与者也会替他考虑,弄清楚其他参与者对自己策略的判断。

14.X,仍然可能后悔,因为古玩交易的价格和利益不仅取决于古玩的实际价值和自己的估价,还取决于对方的估价和愿意接受的成交价格,因此仅仅自己做出正确的估价并不等于实现了最大的潜在利益。

15.X,不一定,因为可能消息的发送方的类型与接收方利益无关,或者消息接收方的行为与发送方的利益无关。

16.X,经济学并没有证明;教育是作为重要的信号,反映劳动力的素质。

17.V18.V19.X,纳什均衡是指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。

20.X,参与者总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标。

参与者A参与者A参与人1二、计算题1.纯策略均衡解为(D, R) 参与者B设3以y的概率执行L策略,对A来说选择混合策略则有1XY +2X(1— Y)=4XY +6X(1— Y)得/ = 4〉1,这是不可能的,故无混合战略均衡。

2.由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

所 以 所 有 的 qi 都 相 等 。 由 此 , 将 Q =
* *
∑q
i
* i
= nqi* 代 入 ( 2) 式 , 可 得 :
qi* = (a − c) /(n + 1) , Q* = n(a − c) /(n + 1) , p* = (a + nc) /(n + 1) 。
当 n 趋 近 于 无 穷 时 , p* 趋 近 于 边 际 成 本 c, 市 场 趋 近 于 完 全 竞 争 市 场 。 1.5 双 方 都 生 产 qm / 2 时 , 每 一 方 的 利 润 都 为 π 1 = ( a − c ) / 8 ; 一 方 生 产 qm / 2 , 另 一 方 生 产 qc
* * * * c1 < c2 < a 且 2c2 > a + c1 时 , 纳 什 均 衡 解 为 角 点 解 , 即 q1 = (a − c1 ) / 2 , q2 = 0。 此 题 目
说 明 : 当 厂 商 的 生 产 成 本 有 较 大 差 异 时 , 具 有 成 本 优 势 的 厂 商 将 垄 断 整 个 市 场 , 而 处 于 成 本 劣 势 的 厂 商 将 退 出 市 场 。 1.7 简 单 证 明 (c,c)为 唯 一 的 纳 什 均 衡 。 首 先 , 给 定 对 方 定 价 c, 己 方 定 价 c 时 , 利 润 为 0。 而 己 方 定 价 高 于 c 时 , 利 润 为 0, 低 于 c 时 , 利 润 为 负 。 所 以 给 定 对 方 定 价 c, 己 方 定 价 c 是 最 优 反 应 , 这 对 于 双 方 都 成 立 , 也 即 (c,c) 是 纳 什 均 衡 。 其 次 , 由 于 不 存 在 固 定 成 本 , 所 以 市 场 中 企 业 的 定 价 不 可 能 低 于 c。 而 双 方 定 价 都 高 于 c 时 , 每 一 方 理 论 上 都 倾 向 于 定 价 低 于 对 方 但 无 限 接 近 对 方 , 从 而 占 据 整 个 市 场 , 从 而 此 时 没 有 稳 定 的 均 衡 ; 而 一 方 定 价 高 于 c、 另 一 方 定 价 为 c 同 样 不 够 成 稳 定 均 衡 , 因 为 定 价 为 c 的 企 业 更 倾 向 于 定 价 高 于 c 但 低 于 另 一 方 的 定 价 。 由 此 , 可 以 证 明 纳 什 均 衡 (c,c)的 唯 一 性 。 1.8 如 果 有 两 个 候 选 人 , 唯 一 的 纯 战 略 纳 什 均 衡 为 x1 = x2 = 0.5 , 即 两 候 选 人 集 聚 于 中 点 , 平
居 中 点 没 有 稳 有 人 会 个 候 选 体 方 法
猪 头 非 整 理 ebwf@
2
Gibbons《 博 弈 论 基 础 》 习 题 解 答 ( CENET)
第 一 章
1.9 略 1.10 按 照 求 解 混 合 战 略 纳 什 均 衡 的 方 法 去 解 这 些 博 弈 , 发 现 不 存 在 混 合 战 略 纳 什 均 衡 , 也 就 证 明 了 。 过 程 略 。 1.11 首 先 重 复 剔 除 严 格 劣 战 略 , 可 得 下 面 的 博 弈 : L T M 2, 0 3, 4 R 4, 2 2, 3
混 合 战 略 纳 什 均 衡 矛 盾 , 假 设 不 成 立 , 原 命 题 得 证 。
猪 头 非 整 理 ebwf@
3
Gibbons《博弈论基础》第二章习题解答(部分)
2.1 采用逆向归纳法,先最大化家长的收益:给定孩子的行动 A,来选择自己的行动 B,
MaxV ( I p − B) + k ( I c + B)
也 即 , 此 博 弈 的 纯 战 略 纳 什 均 衡 为 ( s1 , s2 ), 且 满 足 s1 + s2 = 1 , 0 ≤ s1 , s2 ≤ 1 。
* * * * * *
1.4 对 于 第 i个 厂 商 , 其 目 标 为 最 大 化 自 己 的 利 润 , 即 :
* max π i = max( p − c)qi = max(a − qi − q− i − c ) qi ; qi ≥ 0 qi ≥ 0
B
一阶条件:
V ' ( I p − B) = k ,
⇒ B* = I p ( A) − V '−1 (k )
*
接着最大化孩子的收益,给定家长的反应函数 B ,来选 A:
MaxU ( I c ( A) + I p ( A) − V ' −1 (k ))
A
一阶条件:
' U ' ( I c + B* )[ I c' ( A) + I p ( A)] = 0
qm/2 qc q’
π 1 , π1
π3 ,π2 π1 , π 5
π2 ,π3
π 5 , π1 π6 ,π7 π8 ,π8
π4 ,π4
π7 ,π6
其 中 , π 5 = ( a − c) /16 , π 6 = ( a − c) /18 , π 7 = ( a − c) /12 , π 8 = 0 。 此 博 弈 符 合 题
针 对 上 面 的 博 弈 , 设 参 与 人 1 的 战 略 为 ( p,1-p), 参 与 人 2 的 战 略 为 ( q,1-q)。 则 对 于 1 来 说 , 2q* + 4(1 − q* ) = 3q* + 2(1 − q* ) , 得 : q* = 2 / 3 ; 对 于 2 来 说 , 4(1 − p ) = 2 p + 3(1 − p ) , 得 p = 1/ 3 。
* * * *
则 原 博 弈 的 1.12 按 照 1.11 的 1.13 此 博 弈 有 两 纯 战 略 纳 什 混 合 战 略 纳
1
混 合 战 略 纳 什 均 衡 为 : { (1/3, 2/3, 0), (2/3, 0, 1/3) }。 解 法 , 可 得 混 合 战 略 纳 什 均 衡 为 : { (2/3, 1/3), (3/4, 1/4) }。 过 程 略 。 个 纯 战 略 纳 什 均 衡 、 一 个 混 合 战 略 纳 什 均 衡 。 均 衡 为 :( 向 企 业 1 申 请 , 向 企 业 2 申 请 );( 向 企 业 2 申 请 , 向 企 业 1 申 请 )。 什 均 衡 为 :
2 2 2
目 要 求 , 即 ( qc , qc )是 唯 一 的 纳 什 均 衡 , 并 且 在 纳 什 均 衡 下 , 每 一 企 业 的 福 利 都 要 比 他 们 相 互 合 作 时 低 , 但 两 个 企 业 都 没 有 严 格 劣 战 略 。 1.6 当 0 < c1 , c2 < a / 2 时 , 易 求 均 衡 产 量 q1 = ( a + c2 − 2c1 ) / 3 , q2 = ( a + c1 − 2c2 ) / 3 。 而 当
第 一 章
( qc , qc )。 因 为 π 1 > π 4 , 所 以 均 衡 状 态 时 , 每 一 企 业 的 福 利 都 要 比 他 们 相 互 合 作 时 下 降 。 至 于 q’, 不 妨 令 q ' = ( a − c ) / 2 , 则 同 理 可 得 如 下 标 准 式 : qm/2 qc q’
* *
分 两 定 偏 如 人 请
全 侧 的 离 果 的 参
部 , 均 中 有 相 见
选 票 。 下 面 简 单 证 明 : 无 论 两 候 选 人 都 在 中 点 右 侧 , 都 在 中 点 左 侧 , 还 是 分 每 一 候 选 人 都 倾 向 于 比 另 一 候 选 人 更 接 近 中 点 以 获 得 超 过 半 数 的 选 票 , 所 以 衡 ; 都 在 中 点 时 , 每 个 人 都 有 1/2 的 胜 出 概 率 , 而 偏 离 必 定 输 掉 选 举 , 所 以 没 点 。 由 此 得 证 上 述 均 衡 为 唯 一 的 纯 战 略 纳 什 均 衡 。 三 个 候 选 人 , 可 以 用 类 似 于 上 面 的 方 法 证 明 不 存 在 纯 战 略 纳 什 均 衡 : 无 论 三 对 位 置 如 何 , 都 不 会 形 成 稳 定 的 均 衡 。 所 以 题 目 要 求 的 是 混 合 纳 什 均 衡 。 具 Hotelling, H. (1929) “Stability in Competition”, Economic Journal 39: 41-57.
为 : qm/2 qc
qm/2 qc
π1 , π 1
π3 ,π2
π2 ,π3 π4 ,π4
qm/2, 从 而 最 后 的 均 衡 为
1
因 为 π1 < π 3 , π 2 < π 4 , 所 以 每 一 方 都 有 一 个 严 格 劣 战 略 , 即
猪 头 非 整 理 ebwf@
Gibbons《 博 弈 论 基 础 》 习 题 解 答 ( CENET)
Gibbons《 博 弈 论 基 础 》 习 题 解 答 ( CENET)
第 一 章
1.1 略 1.2 不 会 被 重 复 剔 除 严 格 劣 战 略 剔 除 的 战 略 是 : T, M, L, R; 纯 战 略 纳 什 均 衡 是 (T, R)和 (M, L)。 1.3
* * 设 此 博 弈 的 纯 战 略 纳 什 均 衡 是 ( s1 , s2 )。 * * * s1} = max{1 − s2 , 0} = 1 − s2 对 于 参 与 人 1 来 说 , s1 = max{ max * s1 , max ; * 0 ≤ s1 ≤1− s2 1− s2 < s1 ≤1 * * 同 理 , s2 。 = 1 − s1
由 一 阶 条 件 ∂π i / ∂qi = 0 , 可 得 : qi = (a − q− i − c)Biblioteka / 2 … … ( 1)* *
相关文档
最新文档