博弈论练习2答案

合集下载

博弈论第二章习题

问题1：博弈方2就如何分10000元钱进行讨价还价。

假设确定了以下原则：双方提出自己要求的数额1s 和2s ，10000021≤≤s s ，。

如果设博弈方1和，1000021≤+s s ，则两博弈方的要求都得到满足，即分得1s 和2s ；但如果1000021>+s s ，则该笔钱就被没收。

问该博弈的纯策略纳什均衡是什么？如果你是其中一个博弈方，你会选择什么数额，为什么？解：112111210000()010000s s s u s s s ≤-⎧=⎨>-⎩，那么，1210000s s =-221222110000()010000s ss u s s s ≤-⎧=⎨>-⎩那么，2110000s s =-它们是同一条直线，1210000s s +=上的任意点12(,)s s ，都是本博弈的纯策略的Nash 均衡。

假如我是其中一个博弈方，我将选择15000s =元，因为(5000,5000)是比较公平和容易接受的。

它又是一个聚点均衡。

问题2：设古诺模型中有n 家厂商。

i q 为厂商i 的产量，n q q q Q +++= 21为市场总产量。

P 为市场出清价格，且已知Q a Q P P -==)(（当a Q <时，否则0=P ）。

假设厂商i 生产产量i q 的总成本为ii i i cq q C C ==)(，也就是说没有固定成本且各厂的边际成本都相同，为常数)(a c c <。

假设各厂同时选择产量，该模型的纳什均衡是什么？当趋向于无穷大时博弈分析是否仍然有效？解：1()ni i i j i j pq cq a c q q π==-=--∑，1,2,,i n =令20ii j j ii a c q q q π≠∂=---=∂∑，1,2,,i n =解得：***121na c q q q n -====+，2***121na c n πππ-⎛⎫==== ⎪+⎝⎭当n 趋向于无穷大时，这是一个完全竞争市场，上述博弈分析方法其实已经失效。

博弈论基础吉本斯课后习题答案

i如一直使用垄断价格则每个企业收益每期都一样为iac28p如在t期某企业违背了战略t1期开始双方的收益相同都为0在t期它的最大收益为ac42考虑此企业只是把价格边际上减少一点点所有的利润都归它如不违背则把以后无限期11dac28的收益贴现到t期可得1触发战略有效的条件是
Gibbons《博弈论基础》习题解答（ CENET）
π1 , π1
qc
π3 ,π2
q’
π1 ,π5
π2 ,π3 π4,π4 π7 ,π6
π5 ,π1 π6 ,π7 π8 ,π8
其中， π5 = (a − c)2 /16 ， π 6 = (a − c)2 /18 ， π 7 = (a − c)2 /12 ， π8 = 0 。此博弈符合题
Max A
U
(
I
c
(
A)
+
I
p
(
A)
−
V
'−1
(k
))
一阶条件：
U
'(Ic
+
B*
)[
I
' c
( A)
+
I
' p
(
A)]
=
0
由于 U 是递增又严格凹的，U ' (Ic + B*) ≠ 0
这与孩子的选择可是全家的收入最大化的一阶条件相同：
I
' c
(
A)
+
I
' p
(
A)
=
0
2.2 采用逆向归纳法，先最大化家长的收益：给定的孩子的行动 S，来选择自己的行动 B,
率为 pi*j 。用反证法证明。

“博弈论”习题及参考答案

《博弈论》习题一、单项选择题1.博弈论中，局中人从一个博弈中得到的结果常被称为（）。

A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容，除了（）。

A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中（）。

A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中，每一个博弈者努力（）。

A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中，直接决定局中人支付的因素是（）。

A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言，无论对手作何选择，其总是拥有惟一最佳行为，此时的博弈具有（）。

A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作，博弈者就在现期合作；但如果另一个博弈者在前一期违约，博弈者在现期也违约的策略称为（）。

A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中，合作策略会导致（）。

A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候，囚徒困境式博弈均衡最可能实现（）。

A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致，这种策略是一种（）。

A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈，正确的说法是（）。

A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的（）：A. 策略是局中人选择的一套行动计划；B. 参与博弈的每一个局中人都有若干个策略；C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的；D. 策略与行动是两个不同的概念，策略是行动的规则，而不是行动本身。

国开电大博弈与决策(重庆)测验二参考答案

对
错
【答案】：对
题目19.下面哪一项物品具有非排他性（）
A.城市公共汽车
B.艺术博物馆
C.收费的高速公路
D.国防
【答案】：国防
题目20.纳什定理说明在任何一个有n个博弈方存在的有限博弈中，都至少存在一个纳什均衡。
对
错
【答案】：对
题目21.市场交易中普遍存在的讨价还价属于哪种博弈。（）
A.完全信息动态博弈
对
错
【答案】：错
题目3.在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。
对
错
【答案】：错
题目4.子博弈可以从一个多节点信息集开始。
对
错
【答案】：错
题目5.在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。
对
错
【答案】：错
题目6.策略式博弈，正确的说法是（）
A.策略式博弈更容易求解
d.双方都独立依照自己的利益行事，则双方不能得到最好的结果
【答案】：双方都独立依照自己的利益行事，则双方不能得到最好的结果
题目8.下列关于策略的叙述哪个是错误的（）
A.一个局中人在原博弈中的策略和在子博弈中的策略是相同的
B.参与博弈的每一个局中人都有若干个策略
C.策略与行动是两个不同的概念，策略是行动的规则，而不是行动本身
对
错
【答案】：对
题目25.在一个博弈中博弈方可以有很多个。
对
错
【答案】：对
B.策略式博弈无法刻划动态博弈
C.策略式博弈就是一个支付矩阵
D.策略式博弈无法表明行动顺序
【答案】：策略式博弈无法表明行动顺序
题目7.囚徒困境说明（）

大学mooc博弈论(首师大)满分章节测验答案

第一讲认识博弈论1单选(10分)博弈论的基本要素以下内容，除了（）。

A.策略与策略集B.均衡C.支付与支付函数D.局中人正确答案：B你选对了2单选(10分)博弈论的基本假设是强调（）。

A.均衡状态B.利益最大化C.个人理性D.集体理性正确答案：C你选对了3单选(10分)哪种表述模型更适合表示二人博弈（）。

A.特征函数式B.标准式C.扩展式D.以上都不适合正确答案：B你选对了4单选(10分)根据人们行动为相互作用时，参与人能否达成一个具有约束力的协议，可将博弈分为( )。

A.静态博弈与动态博弈B.常和博弈与非常和博弈C.完全信息博弈与不完全信息博弈D.合作博弈与非合作博弈正确答案：D你选对了5单选(10分)“要想在现代社会做一个有文化的人，你必须对博弈论有一个大致了解”出自哪位诺贝尔经济学奖获得者的名言( )。

A.1994年诺贝尔经济学奖获得者John·NashB.2012年诺贝尔经济学奖获得者Lloyd S. ShapleyC.2005年诺贝尔经济学奖获得者Robert·AumannD.1970年诺贝尔经济学奖获得者Paul A. Samuelson正确答案：D你选对了6多选(15分)博弈论的研究特点包括（）。

A.博弈论存在信息的对称性B.博弈论涉及的决策者至少为两人C.博弈论存在信息的不对称性D.博弈论需要考虑其他决策者的决策对自身利益的影响正确答案：B、C、D你选对了7多选(15分)“囚徒困境”反映了（）。

A.“看不见的手”是有力的，但不是万能的B.个人理性通过市场机制导致社会福利最优的结论并不总是成立的C.个体理性与集体理性的冲突D.以自我利益为目标的“理性”行为，最终导致了两个囚徒得到相对较劣的收益正确答案：A、B、C、D你选对了8判断(5分)博弈论是一种以数学为基础、研究发生对抗与冲突时如何选择最优策略的一门学问。

正确答案：√你选对了9判断(5分)博弈论是单向的理性决策。

博弈论习题及解答

※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?（见教材）2. 分别用规范式和扩展式表示下面的博弈。

两个相互竞争的企业考虑同时推出一种相似的产品。

如果两家企业都推出这种产品，那么他们每家将获得利润400万元；如果只有一家企业推出新产品，那么它将获得利润700万元,没有推出新产品的企业亏损600万元；如果两家企业都不推出该产品，则每家企业获得200万元的利润。

企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? （见教材）4. 产生“囚犯困境”的原因是什么？你能否举出现实经济活动中囚徒困境的例子？原因：个体理性与集体理性的矛盾。

例子：厂商之间的价格战，广告竞争等。

※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? （见教材）2. 剔除以下规范式博弈中的严格劣策略，再求出纯策略纳什均衡。

先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。

然后用划线法求出该矩阵博弈的纯策略Nash均衡。

乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。

乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知，该矩阵博弈没有纯策略Nash均衡。

由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。

解：设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线，如下图，图中粗的折线，就是F(x)的图象由图可知，纳什均衡点与β1无关，所以原问题化为新的2*2矩阵博弈：由公式计算得：。

博弈论课后习题答案

博弈论课后习题答案博弈论课后习题答案博弈论是一门研究决策和策略的学科，它涉及到多个参与者之间的相互作用和决策过程。

在博弈论的学习过程中，习题是非常重要的一部分，通过解答习题可以加深对博弈论概念和原理的理解。

下面是一些常见博弈论习题的答案，希望对大家的学习有所帮助。

1. 两人囚徒困境博弈在囚徒困境博弈中，两个囚犯被关押在不同的牢房里，检察官给每人提供了一个选择：合作（合作供认）或背叛（沉默）。

如果两人都合作，那么每个人的刑期都会较短；如果两人都背叛，那么每个人的刑期都会较长；如果一个人合作而另一个人背叛，那么背叛的人将会获得较短的刑期，而合作的人将会获得较长的刑期。

答案：在囚徒困境博弈中，每个囚犯都会追求自己的最大利益。

根据博弈论的原理，无论对方选择什么，背叛都是最优策略。

因此，两人都会选择背叛，最终导致双方都获得较长的刑期。

2. 石头剪刀布博弈石头剪刀布是一种常见的博弈游戏，两个参与者同时出示石头、剪刀或布，根据两者的选择，结果会有不同的得分。

答案：在石头剪刀布博弈中，每个参与者都有三种选择，而且每种选择的胜负关系都不同。

根据博弈论的原理，最优策略是随机选择，使得对手无法预测自己的选择。

这样做可以最大程度地减少对手的获胜概率。

3. 拍卖博弈拍卖是一种常见的博弈形式，参与者通过竞价来争夺一个物品或服务。

在拍卖中，不同的拍卖规则和策略会对结果产生影响。

答案：在拍卖博弈中，最常见的策略是以自己的估值为基准进行竞价。

如果一个参与者的估值高于其他参与者，那么他可以通过竞价来获得物品或服务。

然而，如果其他参与者也有较高的估值，那么竞价将会继续上升，直到只剩下一个竞价者。

在这种情况下，最高的竞价者将会获得物品或服务，但是他需要支付他的竞价。

4. 价格战博弈价格战是一种常见的博弈形式，不同的公司通过调整价格来争夺市场份额。

在价格战中，公司的利润和市场份额会受到价格策略的影响。

答案：在价格战博弈中，最优策略取决于对手的策略和市场需求。

博弈论试题及答案

博弈论试题及答案【正文】博弈论试题及答案一、选择题1.博弈论是研究：A. 地理分布B. 人类视力C. 决策制定D. 古典文学答案：C2.下列哪个不是博弈论中常见的概念？A. 纳什均衡B. 优势策略C. 输家效应D. 零和博弈答案：C3.描述纳什均衡的最佳方式是：A. 所有参与者都达到最佳策略B. 至少有一个参与者达到最佳策略C. 所有参与者都达到次优策略D. 至少有一个参与者达到次优策略答案：A4.下列哪个案例体现了零和博弈的情况？A. 两国签订贸易协定B. 赌徒在赌博中争夺赌注C. 两家公司合作推出新产品D. 好友一起玩棋盘游戏答案：B5.下列哪个不是博弈论的应用之一？A. 经济决策B. 政治博弈C. 生物进化D. 音乐创作答案：D二、填空题1.博弈论最早由_____________等人于20世纪40年代提出。

答案：冯·诺依曼（John von Neumann）2.博弈论是研究参与者间的_____________和_____________的学科。

答案：互动行为；决策制定3.零和博弈是指参与者的利益总和恒为_____________。

答案：零4.博弈论中的最佳策略指的是在其他参与者采取某个策略时，使某一参与者的_____________最大化的策略。

答案：利益5.斯坦福大学的_____________教授以其对博弈论的突出贡献而获得2005年诺贝尔经济学奖。

答案：约翰·纳什（John Nash）三、简答题1.简要解释博弈论中的纳什均衡。

答：纳什均衡是博弈论中的一个重要概念，指的是在参与者选择自己最佳策略的情况下，不存在任何一个参与者可以通过单独改变自己的策略来获得更好收益的状态。

简言之，纳什均衡是一种理性选择下的稳定状态。

2.举例说明博弈论在实际生活中的应用。

答：博弈论在经济学、政治学、生物学等领域中都有广泛应用。

例如，在贸易谈判中，两个国家之间的博弈就是典型的博弈论应用。

南开大学智慧树知到“经济学”《初级博弈论》网课测试题答案2

南开大学智慧树知到“经济学”《初级博弈论》网课测试题答案（图片大小可自由调整）第1卷一.综合考核(共15题)1.当静态贝叶斯博弈中博弈方的一个策略组合是贝叶斯纳什均衡时，意味着不会有任何一个博弈方想要改变自己策略中的哪怕只是一种类型下的一个行动。

()A.正确B.错误2.有限理性意味着所有博弈方都不会采用完全理性博弈的均衡策略。

()A.正确B.错误3.乙向甲索要1000元，并且威胁甲如果不给就与他同归于尽。

当然甲不一定会相信乙的威胁。

请用扩展形表示该博弈，并找出纯策略纳什均衡和子博弈完美纳什均衡。

4.若对一个博弈运用严格下策反复消去法后，如果该博弈的策略组合中只有惟一一个幸存下来，这个策略组合就是该博弈的结果。

()A.正确B.错误5.不允许存在有约束力协议的博弈称为非合作博弈。

()A.错误B.正确6.教育程度在劳动力市场招聘员工时受到重视的理由是，经济学已经证明教育对于提高劳动力素质有不可替代的作用。

()A.正确B.错误7.囚徒的困境博弈中的(坦白，坦白)不是一个上策均衡。

()A.错误B.正确8.追求集体利益最大化称为“集体理性”。

()A.正确B.错误9.因为零和博弈中博弈方之间的关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。

()A.正确B.错误10.无限次重复博弈均衡解的得益一定优于原博弈均衡解的得益。

()A.错误B.正确11.因为上策均衡反映了所有博弈方的绝对偏好，因此非常稳定，根据上策均衡可以对博弈结果作出最肯定的预测。

()A.错误B.正确12.静态贝叶斯博弈与完全信息博弈之间在策略和策略空间相同。

()A.正确B.错误13.古玩市场的交易中买卖双方的后悔都来自于自己对古玩价值判断的失误，若预先对价值的判断是正确的，那么交易者肯定不会后悔。

()A.正确B.错误14.不完美信息动态博弈的基本特征之一是博弈方之间在信息方面是不对称的。

()A.正确B.错误15.因为零和博弈中博弈方之间的关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。

经济博弈论习题答案

经济博弈论习题答案经济博弈论是研究在不同经济主体之间存在利益冲突和相互依赖的情况下，如何通过策略选择来实现最优结果的学科。

以下是一些经济博弈论习题的答案示例：# 习题一：囚徒困境问题描述：两个犯罪嫌疑人被分别关押，且不能相互沟通。

检察官分别向他们提出交易：如果其中一个认罪而另一个不认罪，认罪者将获得轻判，而不认罪者将受到重判。

如果两人都认罪，他们将都受到中等程度的惩罚。

如果两人都不认罪，他们将因为证据不足而受到最轻的惩罚。

答案：在囚徒困境中，尽管两人都不认罪是最优的集体结果，但出于个人理性，每个人都倾向于认罪以避免最坏的结果。

因此，最终两人都认罪，导致一个次优的结果。

# 习题二：纳什均衡问题描述：考虑一个双寡头市场，两个公司A和B可以选择高成本或低成本生产。

如果一家公司选择低成本而另一家选择高成本，低成本公司将获得全部市场份额。

如果两家都选择低成本，他们将分享市场但利润较低。

如果两家都选择高成本，他们将获得较高的利润但市场份额相同。

| | A选择低成本 | A选择高成本 ||-|-|--|| B选择低成本 | 利润高，市场份额大 | 利润低，市场份额相同 | | B选择高成本 | 利润低，市场份额相同 | 利润高，市场份额相同 |答案：在这个博弈中，纳什均衡是两家公司都选择高成本生产。

因为无论对方选择什么策略，每一家都没有动机单方面改变策略，因为改变策略会导致利润降低。

# 习题三：拍卖理论问题描述：一个物品正在拍卖，有两个竞拍者，物品的真实价值为V。

每个竞拍者对物品的估值是私人信息，且他们知道对方可能的估值。

竞拍者i的估值为v_i，且v_1和v_2是独立的，都服从[0, V]的均匀分布。

答案：在第一价格密封拍卖中，竞拍者的最优策略是按照自己的估值减去一个与对手估值分布相关的期望值来出价。

具体来说，竞拍者i的最优出价b_i是v_i减去v_i的期望值，考虑到对手的估值分布。

在这种情况下，竞拍者的出价将是他们估值的线性函数。

博弈论各章节课后习题答案 (2)

（1）
( q1*, q*2,⋯, q*n )组成该博弈的纯策略纳什均衡点。
2
∑ 式（1）两边同时求和，可得：
n
q*i
=
Q*
=
n(a
−
c
−
Q* )
，于是
Q*
=
n (a n +1
−
c)
，
i =1
q*
=
a
−c
−
Q*
=
a−c n +1
，此时
p*=a-Q*=
a + nc n +1
，当
n
趋于无群大时，有
Q*=a-c,
(aij + d)x*i y j 是成立的 , 此即为 XA2Y* ≤ X*A2Y* ≤ X*A2Y 。所以
i =1 j=1
i =1 j=1
(X*,Y*)是矩阵博弈 G2 的纳什均衡点,并且
mn
mn
∑ ∑ ∑ ∑ v(G2) =
(a ij
+
d)x
* i
y*j
=
aijx*i y*j + d = v(G1) + d
第二章完全信息的静态博弈和纳什均衡
1. 什么是纳什均衡? （见教材）
2. 剔除以下规范式博弈中的严格劣策略，再求出纯策略纳什均衡。
先剔除甲的严格劣策略 3,再剔除乙的严格劣策略 2,得如下矩阵博弈。然后用划线法求出该矩
阵博弈的纯策略 Nash 均衡。
乙
甲
1
3
1
2,0 4,2
2
3,4 2,3
3. 求出下面博弈的纳什均衡。
该博弈的纳什均衡为下图的线段 AB：即：s1+s2=100,s1,s2∈[0,100]。

博弈论第二章答案

2
nc + a a − c a−c a−c ⋅ −c⋅ = n +1 n +1 n +1 n +1
企业违背垄断产量时的各期利润：
n −1 (a − c ) − qi πi = a − qi − cqi 2n ∂π i (n − 1)(a − c) =a− − qi − q j − c = 0 ∂qi 2n n +1 (n + 1)a + (3n − 1)c (a − c), p = 4n 4n 2 (n + 1) 利润为 (a − c) 2 16n 2 ⇒ qi =
仅供参考！！
-4-
E-mail:beckham.23@
2
出），只要任何一方违背时，以后就转向阶段博弈的价格 pi = c 。如一直使用垄断价格，则每个企业收益每期都一样为， π i = (a − c) / 8 如在t期某企业违背了战略， t+1期开始双方的收益相同都为0，在t期它的最大收益为 ( a − c) / 4 （考虑此企业只是把价格边际上减少一点点，所有的利润都归它），如不违背则把以后无限期
一阶条件：
V ' ( I p − B) = kU 2' ( S + B) ，
反应函数满足：
−1 < dB* / dS = kU 2" /(−kU 2" − V " ) < 0 即，孩子储蓄减少，家
*
长给予更高的赠与。接着最大化孩子的收益：给定反应函数 B ，来选 S：
MaxU1 ( I c − S ) + U 2 ( S + B* )
∂π i = a − ∑ qi − qi − c = 0 ∂qi a−c (i = 1,2,3 n) n +1

博弈论基础习题2

博弈论基础习题2【第四讲完全信息动态博弈】1、分别求下图所示的两个扩展式表述博弈的SPNE ：2、在历史上，卓文君与司马相如一见钟情，但是卓文君的父亲卓王孙却反对文君和相如在一起，于是有了以下版本的“文君当垆”博弈。

博弈由卓文君先行动，她有两个选择：与司马相如“私奔”（从而过着当垆卖酒的清贫生活）与“不私奔”。

如果选择不私奔，博弈结束，文君失去了如意郎君，其支付为1 ，而其父得到了他意愿的结果，其支付为1。

如果文君选择与司马相如私奔，那么在观察到文君的行动后轮到卓王孙行动，他有两个选择：“默许”与“断绝父女关系”。

如果默许，那么文君的支付为2，卓王孙的支付为0；如果选择了断绝关系，那么文君的支付为 1.5 ，卓王孙的支付为2 。

（1）画出这个动态博弈的博弈树；（2）将该博弈树用静态博弈的策略式支付矩阵表述出来，并利用划线法找出所有的纯策略纳什均衡；（3）那一（几）个均衡你认为是不合理的？为什么？找出这个动态博弈的SPNE3、考虑如下的双寡头市场策略性投资模型：企业1和企业2目前的单位生产成本都是2c 。

企业1筹划引进一项新技术使单位生产成本降至1c ，但是该项技术需要的投资为f 。

第一阶段，企业1选择是否投资；第二阶段，企业2可以观察到企业1的投资决策，在企业1做出是否投资的决策之后，两个企业同时选择产量。

假定市场反需求函数为1214()p q q ，这里1q 、2q 分别是企业1、2选择的产量，p 是市场价格。

试问f 取什么值时，企业1将会投资引进新技术？【第五讲多阶段博弈与重复博弈】1、考虑第五讲课文中介绍的“囚徒困境-复仇”二阶段博弈。

请构建博弈双方的一个策略组合，使得第一阶段的行动选择(,)F m 能够作为一个SPNE 结果出现（贴现因子1 ）。

2、两个生产完全同质产品的厂商进行着价格博弈，若两个厂商都采用垄断价格（合作）则各自得到垄断利润的一半2m，一个厂商单独略微削价则可独得全部垄断利润m，恶性竞争（价格一直降到边际成本）则利润都为零。

博弈论课后题答案

博弈论课后题答案(总9页)--本页仅作为文档封面，使用时请直接删除即可----内页可以根据需求调整合适字体及大小--;第二章第三章PPT问题第四章第五章第六章一、用柠檬原理和逆向选择的思想解释老年人投保困难的原因。

答：“柠檬原理”是在信息不完美且消费者缺乏识别能力的市场中，劣质品赶走优质品，最后搞垮整个市场的机制。

“逆向选择”是在同样不完美信息和消费者缺乏识别能力的市场中，当价格可变时，价格和商品质量循环下降，市场不断向低端发展的机制.高龄人群的保险市场是一个典型的柠檬原理和逆向选择会起作用，从而会导致发展困难的市场。

老年人的健康情况差别很大，比年轻人之间的差别要大得多，而保险公司要了解老年人投保人的实际健康状况又很困难或成本很高，这就造成了保险公司对老年投保人健康状况的信息不完美。

则保险公司就无法根据每个老年投保人的实际健康情况确定不同的保费率，只能根据平均健康情况确定保费率。

这种平均保费率对健康情况很差的老年人是合算的，但对健康状况较好的老年人则不合算。

因此前者倾向于投保，后者则不愿意投保，这就会导致投保的老年人的平均健康情况会很差。

这使得保险公司的赔付风险大大提高，不仅不能赢利而且要亏损，从而失去经营老年保险的积极性，最终导致老年人的投保难问题。

这就是柠檬原理作用的结果。

如果允许调整保费率，那么保险公司为了避免亏损会上调保费率。

而这又会使得原来投保或者准备投保者中相对较健康的老人退出，从而投保老人的平均健康状况会变得更差。

如此循环，最终保费会升得很高而投保老人的平均健康情况则会越来越差，对市场的发展当然是很不利。

这就是逆向选择作用的结果。

二、为什么消费者偏好去大商店买东西而不太信赖走街穿巷的小商贩消费者去大商店更接近无限次重复博弈，商场提供高质量产品的概率更大，虽然个别消费者不一定能对商店以往售出商品的质量作出反应，但消费者群体肯定可以作出反应，因此大商店保持高质量符合自己的长期利益，一股会自觉保证质量，从而消费者也比较可以信任大商店的商品。

经济博弈论试题及答案

经济博弈论试题及答案（正文部分）第一部分：试题1. 请简要解释什么是经济博弈论。

2. 请列举并解释博弈论中的一些重要概念，如纳什均衡、占优策略和囚徒困境等。

3. 在实际生活中，经济博弈论有哪些应用领域？请举例说明。

4. 什么是合作博弈？请阐述合作博弈的特点，并提供一个相关的实例。

5. 请简述零和博弈与非零和博弈的区别，并给出一个具体案例。

第二部分：答案1. 经济博弈论是一种集合数学、经济学和策略分析于一体的理论框架，用于研究决策者在相互关联的环境中做出决策时所面临的策略选择和结果影响。

2. (1) 纳什均衡：指在博弈中，所有参与者都选择最优策略时所构成的一组策略组合，使得没有一个参与者单方面改变策略可以使自己的收益提高。

(2) 占优策略：指在博弈中，一方参与者在某种策略下收益最大化，无论其他参与者采用何种策略。

(3) 囚徒困境：是博弈论中的一个经典案例，描述的是两个囚犯是否应该合作以最大化自己的收益。

在该案例中，即使合作能带来最优结果，囚犯之间因互相不信任而往往选择背叛。

3. 经济博弈论在实际生活中有广泛的应用。

例如：(1) 在企业竞争中，博弈论可以帮助企业决定定价策略和市场竞争策略，以及对手可能采取的行动。

(2) 在国际贸易谈判中，博弈论可以用于分析各个国家的利益诉求和谈判策略，以实现最优结果。

(3) 在环境保护领域，博弈论可以用于研究各个利益相关方之间的博弈行为，以促进合作与共识。

4. 合作博弈是指参与者在博弈中通过合作来实现收益最大化的行为。

合作博弈的特点包括：(1) 合作和沟通：参与者可以进行合作，共同制定策略，并通过沟通交流来实现最优结果。

(2) 利益共享：参与者之间共享合作所带来的利益，以实现总体收益的最大化。

(3) 长期合作：合作博弈通常需要参与者在长期内保持合作，以实现稳定的收益。

例子：两个企业在同一个市场上竞争，它们可以选择合作并共同制定定价策略，以实现最大化利润。

通过长期合作和有序竞争，两个企业可以避免价格战和利润损失。

博弈论习题参考答案(2)

《博弈论》习题参考答案（第2次作业）一、选择题1.B2.C3.A4.A5.B6.ABCD7.C 8.B 9.C二、判断正误并说明理由1.F 上策均衡是比纳什均衡更严格的均衡概论2.T 上策均衡是比纳什均衡更严格的均衡概论3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈4.F 博弈双方偏好存在差异的条件下，一个博弈模型中可能存在2个纳什均衡，如性别战5.T 零和博弈指参与博弈各方在严格竞争下，一方收益等于另一方损失，博弈各方收益与损失之和恒为零，所以双方不存在合作可能性6.T 上策均衡是通过严格下策消去法（重复剔除下策）所得到的占优策略，只能有一个纳什均衡7.F 纳什均衡是上策的集合，指在给定的别人策略情况下，博弈方总是选择利益相对较大的策略，并不保证结果是最好的。

8.F 局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标9.T 纳什均衡是上策的集合，指在给定的别人策略情况下，没有人会改变自己的策略而减低自己的收益10.F 局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标11.F 局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型，但是领导者的利润比古诺模型时高三、计算与分析题1、（1）画出A 、B 两企业的损益矩阵。

（2）求纯策略纳什均衡。

（做广告，做广告）2、画出两企业的损益矩阵求纳什均衡。

（1）画出A 、B 两企业的损益矩阵（2）求纳什均衡。

两个：（原价，原价），（涨价，涨价） 3、假定某博弈的报酬矩阵如下：甲乙左右上下(1)如果（上，左）是上策均衡，那么，a>?, b>?, g<?, f>? 答：a>e, b>d, f>h, g<c(2)如果（上，左）是纳什均衡，上述哪几个不等式必须满足？答：a>e, b>d 4、答：（1）将这一市场用囚徒困境的博弈加以表示。

博弈论各章节课后习题答案

9. 求如图所示完全信息动态博弈的子博弈完美纳什均衡（图中数字(a,b,c)分别表示局中人 1、
2、3 的收益）。
1
A1
A2
3
2
C1
C2
B1
B2
(4,2,3)
(1,7,8) 3
C1
C2 C1
3
C2
(5,4,3) (7,6,6) (2,1,9) (0,4,2)
答：局中人 1 采取 A2 行动，局中人 2 采取行动 B1 时，局中人 3 必然采取 C2 行动（因为 3<6），因而该博弈的顶点只能是(7,6,6)。同样对于局中人 3 右边一个子博弈，必然采取 C1 行动（9>2），因而该博弈的顶点只能是(2,1,9)。进而原博弈简化为：
的定价,qi是企业i的需求量。假设企业生产没有固定成本,并且边际成本为常数c,c<a.假定博弃重复无穷多次,每次的价格都立即被观察到,企业使用触发策略。求使垄断价格可以作为完美均衡结果出现的最低贴现因子δ,并解释δ与n的关系。
分以下几个步骤进行。
1)计算纳什均衡当企业 i 选择价格 pi,其它企业选择价格 pj(j=1,2,…,n,j≠i)时,企业 i 的利润为: πi = (pi − c)qi = (pi − c)(a − pi + b(p1 + p2 + ⋯ + pi−1 + pi+1 + ⋯ + pn )) ,i=1,2,…,n
∂π2 ∂q 2
= a − q1
− 2q2
− q3
−c=0
∂π3 ∂q3
=
a
− q1
− q2
− 2q3
−c

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

111111111111111111博弈论练习题（四）一、什么是子博弈精炼纳什均衡？答：将纳什均衡中包含的不可置信的威胁策略剔除出去。

它要求参与者的决策在任何时点上都是最优的。

由于剔除了不可置信的威胁，在许多情况下，精炼纳什均衡也就缩小了纳什均衡的个数。

只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。

或者说，组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。

二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大？为什么？答：正确，博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性，这是静态博弈的范畴。

除此之外，还要求相关的参与者具有层次较高的“交互理性”，要求不同个体之间在理性和行为方面具有一种“默契”。

即，人们的自身利益的最大化不仅取决于自己的选择，还取决于与之相关的其他人的选择与行为，那么为了实现自己的最大利益，个体的理性决策就必须考虑他人的理性选择与行为。

作为博弈论的基础，交互理性是其基本的理性要求。

博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。

也就是，每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略，还需知晓各种情况下自己最终的收益或其概率分布，并且每个博弈参与者都知道各个参与者掌握这些信息；更为重要的是，每个博弈参与者都知道所有参与者都是理性的，都知道其他博弈参与者知道所有参与者都是理性的，都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。

理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设，是实现交互理性和理性主义的纳什均衡的基本前提，这些，都是动态博弈的范畴。

因此说，参与者理性问题对动态博弈的分析影响更大。

三、纳什均衡和精炼纳什均衡存在哪些问题？答：纳什均衡存在的问题：(1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡，它是通过概率来计算纳什均衡，在这种均衡下，给定其他参与人的策略选择概率，每个参与人都可以为自己确定选择每一种策略的最优概率。

(2)在论及纳什均衡时，我们假设参与人是完全理性的，而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。

而现实并非如此。

精炼纳什均衡存在的问题：有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈，G（T）是重复T次的重复博弈。

那么，如果G有唯一的纳什均衡，重复博弈G（T）的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。

这个定理成立的条件是单阶段纳什均衡的“唯一性” ，若纳什均衡不是唯一的，上述定理的结论就不一定成立。

四、有限次重复博弈和无限次重复博弈有什么区别？这些区别对我们有什么启发？答：有限次重复博弈与无限次重复博弈都属于动态博弈，对于有限次博弈，收益是每次收益的简单相加，可以采取子博弈纳什均衡的方法求解，即逆推法；但无限次博弈却不能采取；此外，有限次博弈中博弈的双方都还是关注的是自己短期的利益，而无限次博弈中博弈的双方可能针对某项事情达成协议，达到共谋，为共同的利益而选择自己的行动，达到整体的最优，供应链契约即类似。

五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡？答：博弈重复次数有限，意味着存在所有参与人都可以预测到的“最后一次”。

在最后的阶段博弈中，如果某一参与人选择了自己的占优战略，给其他参与人造成损失，则其他参与人不可能报复。

所有的参与人都明白这一点，因而在最后一次阶段博弈中都会选择占优战略，换句话说，在给定最后阶段所有参与人都会选择占优战略的前提下，所有的参与人在倒数第二阶段的博弈中也都会选择占优战略。

由此从最后的阶段开始，逐个阶段进行推理，可以得出以下结论：在阶段博弈有唯一的纳什均衡时，有限次重复博弈的唯一子博弈精炼纳什均衡结果，是阶段博弈的纳什均衡重复。

这就是说，每个阶段博弈出现的都是一次性博弈的均衡结果。

六、无限次重复博弈均衡解的得益一定会优于原博弈均衡解的得益吗？答：不一定。

例如：无限次重复博弈的古诺博弈，此博弈是相同博弈重复无限次，当冷酷战略是整个博弈的纳什均衡时，当然也就是每个阶段的纳什均衡。

此时，无限次重复古诺博弈的冷酷战略已意味着是两厂商在两种战略间进行选择的囚徒困境博弈，一是选择生产垄断产量的一半Q/2，另一是选择生产背叛产量时，冷酷战略是无限次重复古诺博弈的一个子博弈精炼纳什均衡。

贴现因子较大说明未来的利益较大，对两厂商都有较大的吸引力，一般情况下，两厂商不会为了短期利益而背叛对方而失去较大的长远利益，即两厂商都有坚持冷酷战略的积极性。

而当时，意味着冷酷战略不再是一个子博弈精炼纳什均衡。

贴现因子较小说明未来的利益对两厂商都不具有吸引力，选择背叛才是两厂商的最优选择。

这种条件下，博弈无限次重复也不能提高一次性博弈的得益。

七、触发战略所构成的均衡都是子博弈精炼纳什均衡吗？答：“触发战略”是这样一种战略∶首先试探合作，如果对方合作，则给予奖励；如果对方不合作，则给以惩罚。

在原博弈有多个纳什均衡的条件下，在重复博弈时，通过触发战略提高了双方的收益。

首先，在第二次博弈时意味着该博弈结束，而均衡结果是原博弈的纳什均衡，双方都没有偏离的意愿；其次，第一次选的策略虽不是原博弈的纳什均衡，如果某一方偏离会增加收益，但这样会遭到对方第二次选另外的策略的惩罚而损失收益，使总得益减少。

预见到这一点，只顾眼前不顾长远的偏离是得不偿失的事，因此双方会坚持选使总收益最大的策略。

所以，触发战略构成的均衡都是子博弈精炼纳什均衡。

八、什么是冷酷战略？什么是针锋相对战略？什么是最小最大战略？答：冷酷战略也称为触发战略，这种战略做法是∶1、参与人在博弈开始时均选择合作；2、只要对方一直选择合作，则继续合作下去，但当某一时刻对方选择了不合作，则一直永远选择不合作来惩罚对方的背叛行为。

针锋相对战略：参与人在博弈开始时选择合作；在时期t选择对方在时期t-1期所采用的战略，即如果对方在t-1期背叛（不合作），则自己在t期也选择背叛。

最小最大战略：最小最大战略是指当违规者不采取合作行为而对他进行惩罚时，违规者可能得到的最严厉的制裁的战略（相应的，违规者为了减少惩罚对自己的影响，而使自己得益最大的战略。

练习题（五）一、若你正在考虑收购一家公司的一万股股票，卖方的开价是2元/股。

根据经营情况的好坏，该公司股票的价值对你来说有1元/股和5元/股两种可能，但只有卖方知道经营的真实情况，你只知经营好、坏的概率各为0.5。

如果公司经营不好时，卖方做到使你无法识别真实情况的“包装”费为5万元，你是否会按卖方的价格买下这些股票？如果“包装”费仅为0.5万元，你会如何选择？答：当卖方使买房无法识别真实情况的包装费为5万元时，买方的股票价值期望值为E=0.5 ×﹙1-5﹚+0 .5×5=0.5元/股在这种情况下，无法接受卖方给出的价格当卖方的包装费为0.5万元时，买方的股票价值期望值为E=0.5 ×﹙1-0.5﹚+0 .5×5=2.75元/股在这种情况下，接受卖方给出的价格二、现实生活中常常是既有部分卖假冒伪劣产品的厂商会打出“质量三包”、“假一罚十”等旗号，也有一些卖假冒伪劣产品的厂商声明“售出商品概不退换”。

问这两类厂商有什么不同，他们各自战略的根据是什么？答：第一类厂商实行战略的根据是：“最大最小战略”，根据无限次重复博弈中的子博弈精炼纳什均衡实际上是参与人相互合作的结果，要使合作成功，其战略中必须要有惩罚措施。

所谓最小最大战略是指当违规者不采取合作行为而对他进行惩罚时，违规者可能得到的最严厉的制裁的战略。

第二类厂商采取战略的根据是：“冷酷战略”，任何为了短期利益的背叛行为的所得对长期利益而言都是微不足道的，且会遭到对方一直背叛的冷酷打击，故参与人有积极性为自己建立一个乐于合作的声誉，同时也有积极性惩罚对方的背叛行为。

三、在有两个投标者的暗标拍卖中，投标者的估价独立分布于[0，1]且两人的估价相同，则贝叶斯纳什均衡是什么？博弈的结果是什么？如果两投标者知道他们的估价是相同的，结果会发生什么变化？解：两个人投标人为i ，j,投标者i 的支付如下：最终解得，拍卖的对称贝叶斯均衡战略为∶同理可得，对投标人j 也可得到相同的结论即，在只有两个投标人时，这个博弈的贝叶斯均衡是，每个投标人的出价是其实际价值的一半。

如果两个投标者知道他们的估价相同，即信息是完全的，买者之间的竞争将使卖者得到买者价值的全部。

四、“说实话”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。

答：“说实话的直接机制”。

即如果所设计的直接机制能使得各投标人讲真话，也就是声明自己的真实类型（如对商品的真实价值）是贝叶斯纳什均衡，则称这样的直接机制为⎪⎩⎪⎨⎧<=->-=j i j i i i j i i i i j i i s s s s s s s s s s u ,0,2/)(),(θθθ；2/*i i s θ=2/*j j s θ=“说实话的直接机制”。

也称为“激励—相容”或“鼓励—响应”机制。

如果代理人从讲真话中得到稍高的效用，则讲真话变为强均衡。

事实上，如果讲真话的效用足够强，则代理问题以及与之相联系的成本将会消失，能保证博弈方都按他们的真实类型行为并获得理想的结果。

五、静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型设定行为选择，是因为能够迷惑其他博弈方，从而可以获得对自己更有利的均衡。

答：正确。

不完全信息静态博弈的静态贝叶斯纳什均衡实际上是这样一种类型依从型战略组合∶给定自己的类型和别人类型的概率分布情况下，每个参与人最大化自己的期望效用。

博弈方需要针对自己的所有可能类型设定行为选择，是因为能够迷惑其他博弈方，从而可以获得对自己更有利的均衡六、什么是贝叶斯纳什均衡？答：n 人不完全信息静态博弈：的纯战战略贝叶斯纳什均衡是一个类型依存战略组合，其中每个参与人i 在给定自己的类型和其他参与人类型依存战略，的情况下最大化自己的期望效用函数，换言之，战略组合是一个贝叶斯纳什均衡，如果对于所有的i ，有，贝叶斯纳什均衡实际上是这样一种类型依从型战略组合∶给定自己的类型和别人类型的概率分布情况下，每个参与人最大化自己的期望效用。

七、拍卖（招标）有哪几种常用的方式？答：（1）最高价格密封出价拍卖（一级密封价格拍卖）（2）次高价格密封出价拍卖（维克瑞拍卖）（3）双方叫价拍卖（4）最高价格公开出价拍卖（英国式拍卖）（5）降价式拍卖（荷兰式拍卖）八、机制设计的基本原理是什么？什么是“直接机制”与“显示原理”？答：机制设计的基本原理是：选择一个博弈规则，最大化自己的期望效用函数。