策略博弈习题部分解答

合集下载

博弈数学测试题及答案

博弈数学测试题及答案

博弈数学测试题及答案一、选择题(每题2分,共20分)1. 以下哪个不是博弈论中的基本概念?A. 纳什均衡B. 混合策略C. 马尔可夫链D. 纯策略答案:C2. 在零和博弈中,以下哪个说法是正确的?A. 参与者的收益总和为零B. 参与者的损失总和为零C. 参与者的总收益为零D. 参与者的总损失为零答案:A3. 以下哪个不是博弈论中的策略类型?A. 纯策略B. 混合策略C. 静态策略D. 动态策略答案:D4. 博弈论中的“囚徒困境”主要说明了什么?A. 合作总是最优选择B. 个体理性可能导致集体非理性C. 集体理性总是最优选择D. 个体非理性可能导致集体理性答案:B5. 在博弈论中,以下哪个不是纳什均衡的特点?A. 每个参与者都选择了自己的最优策略B. 每个参与者的策略都是对其他参与者策略的最佳响应C. 参与者可以通过改变策略来获得更好的结果D. 所有参与者都达到了自己可能的最大收益答案:C6. 以下哪个是博弈论中的合作博弈?A. 囚徒困境B. 石头剪刀布C. 公共品博弈D. 零和博弈答案:C7. 在博弈论中,哪个术语描述了参与者在没有沟通的情况下做出决策?A. 沟通博弈B. 非合作博弈C. 同时博弈D. 顺序博弈答案:C8. 以下哪个不是博弈论中的结果类型?A. 帕累托效率B. 纳什均衡C. 社会福利最大化D. 个人最优答案:D9. 在博弈论中,以下哪个不是博弈的分类?A. 完全信息博弈B. 不完全信息博弈C. 静态博弈D. 动态博弈答案:C10. 以下哪个是博弈论中的“重复博弈”?A. 参与者只进行一次决策B. 参与者进行多次决策C. 参与者在博弈中没有记忆D. 参与者在博弈中不能交流答案:B二、填空题(每空1分,共10分)1. 博弈论是由数学家______提出的。

答案:约翰·冯·诺伊曼2. 博弈论中的“纳什均衡”是由______命名的。

答案:约翰·纳什3. 在博弈论中,如果参与者的策略选择是相互独立的,这种博弈被称为______博弈。

博弈论战略分析入门课后练习题含答案

博弈论战略分析入门课后练习题含答案

博弈论战略分析入门课后练习题含答案题目翻译:
1.两个人轮流选择从1到7之间的数字,不能重复选择,哪个人最后选
择7就赢了。

如果两个人都采用最优策略,第一个选择数字的人能否保证获胜?
2.有两个球队A和B,比赛规则为A队挑选一个数字k,B队猜测这个
数字是奇数还是偶数。

如果B队猜错了,A队获胜;反之,B队获胜。

如果A队更喜欢奇数,那么它们应该挑选多少奇数呢?
解答:
1.第一个选择数字的人不能保证获胜,因为第二个人可以选择数字4,
让第一个人面临两个选择:选择数字2或6。

无论哪个数字,第二个人都可以接下来选择数字3,然后赢得游戏。

所以第一个人不能获胜。

2.如果A队总是选择奇数,那么B队的最优策略是选择奇数。

因为如果
A队选择奇数,B队就获胜,如果A队选择偶数,B队有50%的机会猜对,平局的概率为25%,B队的总胜率为75%。

因此A队最好选择所有奇数,这样B 队只有50%的机会获胜。

思路解析:
1.对于第一道题,我们需要根据规则分析游戏的局面,然后确定最优策
略。

在此基础上,我们可以找到第一个人的必胜策略,或者证明无论如何第一个人都不能获胜。

2.对于第二道题,我们需要考虑两个球队的思考方式,并且理解如何最
小化选手的期望获胜率。

这也需要一些概率的基础知识。

以上就是本次博弈论战略分析入门课后练习题答案。

希望这些题目能够帮助您加深对博弈论和战略分析的理解,进一步提升您的分析能力和决策能力!
1。

博弈论课后习题答案

博弈论课后习题答案

博弈论课后习题答案博弈论课后习题答案博弈论是一门研究决策和策略的学科,它涉及到多个参与者之间的相互作用和决策过程。

在博弈论的学习过程中,习题是非常重要的一部分,通过解答习题可以加深对博弈论概念和原理的理解。

下面是一些常见博弈论习题的答案,希望对大家的学习有所帮助。

1. 两人囚徒困境博弈在囚徒困境博弈中,两个囚犯被关押在不同的牢房里,检察官给每人提供了一个选择:合作(合作供认)或背叛(沉默)。

如果两人都合作,那么每个人的刑期都会较短;如果两人都背叛,那么每个人的刑期都会较长;如果一个人合作而另一个人背叛,那么背叛的人将会获得较短的刑期,而合作的人将会获得较长的刑期。

答案:在囚徒困境博弈中,每个囚犯都会追求自己的最大利益。

根据博弈论的原理,无论对方选择什么,背叛都是最优策略。

因此,两人都会选择背叛,最终导致双方都获得较长的刑期。

2. 石头剪刀布博弈石头剪刀布是一种常见的博弈游戏,两个参与者同时出示石头、剪刀或布,根据两者的选择,结果会有不同的得分。

答案:在石头剪刀布博弈中,每个参与者都有三种选择,而且每种选择的胜负关系都不同。

根据博弈论的原理,最优策略是随机选择,使得对手无法预测自己的选择。

这样做可以最大程度地减少对手的获胜概率。

3. 拍卖博弈拍卖是一种常见的博弈形式,参与者通过竞价来争夺一个物品或服务。

在拍卖中,不同的拍卖规则和策略会对结果产生影响。

答案:在拍卖博弈中,最常见的策略是以自己的估值为基准进行竞价。

如果一个参与者的估值高于其他参与者,那么他可以通过竞价来获得物品或服务。

然而,如果其他参与者也有较高的估值,那么竞价将会继续上升,直到只剩下一个竞价者。

在这种情况下,最高的竞价者将会获得物品或服务,但是他需要支付他的竞价。

4. 价格战博弈价格战是一种常见的博弈形式,不同的公司通过调整价格来争夺市场份额。

在价格战中,公司的利润和市场份额会受到价格策略的影响。

答案:在价格战博弈中,最优策略取决于对手的策略和市场需求。

博弈论十五道题以及答案

博弈论十五道题以及答案

博弈论十五道题以及答案1.博弈理论在哪些方面扩展了传统的新古典经济学?2.法律和信誉是维持市场有序运行的两个基本机制。

请结合重复博弈理论谈谈信誉机制发生作用的几个条件。

3.经济发展史表明,在本来不认识的人之间建立相互之间的信任关系是经济发展的关键。

为什么?4.在传统社会中,即使没有法律,村民之间也可以建立起高度的信任。

请结合博弈理论解释其原因。

5.在旅游地很容易出现假货,而在居民小区的便利店则很少出现假货,请结合博弈论的相关理论进行解释。

6.你如何理解“Credible threats or promises about future behavior can influence current behavior”这句话的?7.有效的法律制度对经济发展具有什么作用?请结合博弈理论谈谈你的理解。

8.试用博弈理论解释家族企业为什么难以实行制度化管理?9.固定资产投资为什么可以作为一种可置信的承诺?10.以汽车保险为例谈谈因为信息不对称所可能产生的道德风险问题,并提出一种解决道德风险的方案。

11.以公司为例,谈谈所有者与经营者的分离可能产生的道德风险问题。

12.在波纳佩岛上,谁能种出特别大的山药,谁的社会地位就高,谁就能赢得人们的尊敬并可担任公共职务。

请结合信号传递模型谈谈波纳佩岛上的这种奇异风俗。

13.一位男生在女朋友过生日时送给女朋友三百元人民币,他的女朋友往往感觉受到了侮辱。

而他女朋友可能会欣然接受父母亲的现金礼物。

请解释其中可能的原因。

14.<圣经>(旧约)中记载了两个母亲争夺一个孩子的故事。

一次,两个女人为争夺一个婴儿争扯到所罗门王殿前,她们都说婴儿是自己的,请所罗门王作主。

所罗门王稍加思考后作出决定:将婴儿一刀劈为两段,两位妇人各得一半。

这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成两半。

听罢这位妇人的求诉,所罗门王立即作出最终裁决——婴儿是这位请求不杀婴儿的妇人的,应归于她。

博弈论考试题及答案

博弈论考试题及答案

博弈论考试题及答案一、选择题(每题2分,共20分)1. 博弈论中的“囚徒困境”是指什么?A. 两个囚犯相互合作B. 两个囚犯相互背叛C. 两个囚犯中一个合作一个背叛D. 两个囚犯相互猜疑答案:B2. 以下哪个不是博弈论中的基本概念?A. 策略B. 收益C. 公平D. 纳什均衡答案:C3. 在零和博弈中,一个玩家的损失等于另一个玩家的收益,这意味着:A. 总收益为零B. 总收益为正C. 总收益为负D. 总收益不确定答案:A4. 博弈论中的“混合策略”是指:A. 玩家随机选择策略B. 玩家固定选择一种策略C. 玩家根据对手的策略选择策略D. 玩家不使用策略答案:A5. 以下哪个是博弈论中的“完全信息”博弈?A. 拍卖博弈B. 石头剪刀布C. 桥牌D. 信息不对称博弈答案:C6. 博弈论中的“重复博弈”指的是:A. 博弈只进行一次B. 博弈进行多次C. 博弈进行无限次D. 博弈进行有限次但次数未知答案:B7. 以下哪个是博弈论中的“动态博弈”?A. 零和博弈B. 非零和博弈C. 同时博弈D. 顺序博弈答案:D8. 在博弈论中,如果一个策略组合是纳什均衡,那么:A. 每个玩家都有动机单方面改变策略B. 每个玩家都满足于当前策略C. 至少有一个玩家不满意当前策略D. 所有玩家都不满意当前策略答案:B9. 博弈论中的“合作博弈”是指:A. 玩家之间可以形成联盟B. 玩家之间不能形成联盟C. 玩家之间只能通过竞争来获得收益D. 玩家之间只能通过合作来获得收益答案:A10. 以下哪个是博弈论中的“公共知识”?A. 每个玩家的收益函数B. 每个玩家的策略选择C. 每个玩家的偏好D. 每个玩家的个人信息答案:A二、简答题(每题10分,共30分)1. 简述博弈论中的“纳什均衡”概念。

答案:纳什均衡是指在一个博弈中,每个玩家都选择了自己的最优策略,并且没有玩家能够通过单方面改变策略来提高自己的收益。

在纳什均衡状态下,每个玩家的策略是对其他玩家策略的最优反应。

博弈论各章节课后习题答案 (2)

博弈论各章节课后习题答案 (2)

(1)
( q1*, q*2,⋯, q*n )组成该博弈的纯策略纳什均衡点。
2
∑ 式(1)两边同时求和,可得:
n
q*i
=
Q*
=
n(a

c

Q* )
,于是
Q*
=
n (a n +1

c)

i =1
q*
=
a
−c

Q*
=
a−c n +1
,此时
p*=a-Q*=
a + nc n +1
,当
n
趋于无群大时,有
Q*=a-c,
(aij + d)x*i y j 是成 立的 , 此即 为 XA2Y* ≤ X*A2Y* ≤ X*A2Y 。所以
i =1 j=1
i =1 j=1
(X*,Y*)是矩阵博弈 G2 的纳什均衡点,并且
mn
mn
∑ ∑ ∑ ∑ v(G2) =
(a ij
+
d)x
* i
y*j
=
aijx*i y*j + d = v(G1) + d
第二章 完全信息的静态博弈和纳什均衡
1. 什么是纳什均衡? (见教材)
2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。
先剔除甲的严格劣策略 3,再剔除乙的严格劣策略 2,得如下矩阵博弈。然后用划线法求出该矩
阵博弈的纯策略 Nash 均衡。


1
3
1
2,0 4,2
2
3,4 2,3
3. 求出下面博弈的纳什均衡。
该博弈的纳什均衡为下图的线段 AB:即:s1+s2=100,s1,s2∈[0,100]。

博弈论复习题及答案DOC

博弈论复习题及答案DOC

可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:(1)双方都不涨价,各得利润10单位;(2)可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)双方都涨价,可口可乐利润140,百事可乐利润35;画出两企业的损益矩阵求纳什均衡。

9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。

如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。

如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。

(1)将这一市场用囚徒困境的博弈加以表示。

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。

答:(1)用囚徒困境的博弈表示如下表:(2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(60000>0);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。

若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。

由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。

12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出:(1)有哪些结果是纳什均衡?(2)两厂商合作的结果是什么?答(1)(低价,高价),(高价,低价)(2)(低价,高价)13、A、B两企业利用广告进行竞争。

若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润。

博弈论习题解答 浙江大学

博弈论习题解答 浙江大学

xi ≤ M
0,
∑ xi > M
3
∑ 因此,对于参与人 i 来说,只要采用 xi = M − x j 都能实现自己的最大收益,也就是说,在 j≠i
∑ 该博弈中有着多个纳什均衡,所有使得 xi = M ,0 ≤ xi ≤ M 成立的战略组合都是该博弈的纯战
略纳什均衡。
7.考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。
必须使得这四种战略的期望效用相同,因此,必须满足以下四个方程:
⎧b − d = c − a
⎪ ⎨
c

a
=
c

b
⎪⎩c − b = a − c
解得:a=b=c=d,所以 a=b=c=d=1/4。同理可得参与人 2 的战略,所以该博弈的唯一混
合策略纳什均衡是参与者以 1/4 的概率随机选择各自的四个纯战略。
1
与企业
2
提出申请。
8.考虑存在事前交流的性别战博弈。在丈夫决定去看足球还是芭蕾之前,丈夫有机会向妻子传递 以下信息:我们在足球场见面,或者我们在芭蕾馆见面。当以上信息交流完成以后,两者同时决 定去足球场还是去芭蕾馆。博弈支付如下:如果两者在足球场见面,则丈夫获得 3,妻子获得 1; 如果两者在芭蕾馆见面,则丈夫获得 1,妻子获得 3;在其他条件下两者的支付都是 0。
(3)假定甲选择企业 1 的概率为α ,选择企业 2 的概率为1− α ;乙选择企业 1 的概率为 β ,选
择企业 2 的概率为1− β ,则甲选择企业 1 的期望收益为 W1 β +W1(1− β ) ,选择企业 2 的期望收
2
益为 W 2β + W 2 (1− β ) ,由二者相等可得乙选择两个企业的概率分别为: β = 2W1−W 2 ,

博弈论复习题及答案

博弈论复习题及答案

博弈论复习题及答案1. 博弈论中,非合作博弈与合作博弈的主要区别是什么?答案:非合作博弈是指参与者之间没有约束性协议的博弈,每个参与者都独立地选择自己的策略以最大化自己的利益。

而合作博弈则允许参与者之间形成具有约束力的协议,共同合作以达到共同的目标。

2. 什么是纳什均衡?答案:纳什均衡是指在一个博弈中,每个参与者都选择了最优策略,并且考虑到其他参与者的策略后,没有参与者有动机单方面改变自己的策略。

3. 零和博弈与非零和博弈有何不同?答案:零和博弈是指博弈中所有参与者的收益总和为零,即一个参与者的收益必然导致另一个参与者的损失。

非零和博弈则是指参与者的收益总和不为零,参与者之间可能存在合作共赢的情况。

4. 如何判断一个博弈是否存在纯策略纳什均衡?答案:可以通过构建博弈的收益矩阵,然后寻找每个参与者在其他参与者策略给定的情况下的最佳响应策略。

如果存在一组策略,使得每个参与者在其他参与者策略不变的情况下,都没有动机改变自己的策略,那么这个策略组合就是一个纯策略纳什均衡。

5. 混合策略纳什均衡与纯策略纳什均衡有何不同?答案:纯策略纳什均衡是指参与者在均衡状态下选择的策略是确定的,而混合策略纳什均衡则是指参与者在均衡状态下选择的策略是随机的,每个策略都有一定的概率被选择。

6. 什么是支配策略?答案:支配策略是指在博弈中,无论其他参与者选择什么策略,某个参与者选择该策略都能获得比其他策略更好的结果。

7. 博弈论中的“囚徒困境”说明了什么?答案:“囚徒困境”说明了即使合作对所有参与者都有利,但由于缺乏信任和沟通,参与者可能会选择对自身最有利的策略,导致集体结果不是最优的。

8. 什么是博弈论中的“倒后归纳法”?答案:“倒后归纳法”是一种解决动态博弈的方法,通过从博弈的最后阶段开始,逆向分析每个阶段的最优策略,直到博弈的初始阶段。

9. 博弈论在经济学中的应用有哪些?答案:博弈论在经济学中的应用非常广泛,包括但不限于市场结构分析、拍卖理论、合同理论、产业组织、宏观经济政策分析等。

策略博弈习题部份解答

策略博弈习题部份解答

博弈论与政治第三小组作业第二章名词说明:一、理性行为(rational behavior):参与人精于算计并严格依照其最优策略行事。

其中理性有两个重要的内涵:一个人对自己的利益完全了解,并能完美地计算出何种行动能够最大化其利益。

二、不完美信息(imperfect information):在博弈的每一个行动时点上,参与人可能无法得悉决策所需的全数信息。

这包括相关的外部环境——比如天气——的不确信性,和对方先前或当前的行动。

这种情形称为不完美信息。

3、不完全信息(incomplete information):当一个参与人比另一个参与人了解更多信息时,阴谋狡计就会产生。

这种情形称为不完全信息。

4、合作博弈(cooperative game):博弈论利用两个专门术语来区分协议具有强制力和不具有强制力的情形。

假设协议对参与人行为具有强制力,那么称此类博弈为合作博弈。

五、非合作博弈(noncooperate game):个体参与人可依照其利益采取行动,那么称此类博弈为非合作博弈。

第三章名词说明:一、中间评估函数(intermediate valuation function):给予非终点结支付的规那么被称为中间评估函数。

二、先动优势(firstmover advantage):在博弈的进程中先做决策带来的优势。

先动优势来自于将其自身置于一个优势地位和迫使其他参与人同意它的许诺能力。

后动优势(second-mover advantage):在博弈的进程中后做决策带来的优势。

后动优势源于自己可对他人选择做出的灵活性。

第四章名词说明:一、占优策略(dominant strategy)、劣策略(dominated strategy):每一个博弈中的参与者通常都拥有不止一个竞争策略,其所有策略的集合组成了该企业的策略集。

在参与者各自的策略集中,若是存在一个与其他竞争对手可能采取的策略无关的最优选择,那么称其为占优策略(Dominant Strategy),与之相对的其他策略那么为劣势策略。

博弈论习题及解答

博弈论习题及解答

※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)2. 分别用规范式和扩展式表示下面的博弈。

两个相互竞争的企业考虑同时推出一种相似的产品。

如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。

企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? (见教材)4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。

例子:厂商之间的价格战,广告竞争等。

※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? (见教材)2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。

先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。

然后用划线法求出该矩阵博弈的纯策略Nash均衡。

乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。

乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知,该矩阵博弈没有纯策略Nash均衡。

由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。

解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线,如下图,图中粗的折线,就是F(x)的图象由图可知,纳什均衡点与β1无关,所以原问题化为新的2*2矩阵博弈:由公式计算得:。

博弈论复习题及答案

博弈论复习题及答案

博弈论复习题及答案博弈论是研究决策者在相互影响的情况下如何做出决策的理论。

以下是一些博弈论的复习题及答案,供学习者参考:一、选择题1. 博弈论中最基本的博弈类型是什么?A. 零和博弈B. 非零和博弈C. 完全信息博弈D. 不完全信息博弈答案: A. 零和博弈2. 在博弈论中,纳什均衡指的是什么?A. 一种博弈的最终结果B. 一种博弈的初始状态C. 一种策略组合,其中没有任何一个参与者能够通过单方面改变策略而获得更好的结果D. 一种策略组合,其中所有参与者都希望改变策略以获得更好的结果答案: C. 一种策略组合,其中没有任何一个参与者能够通过单方面改变策略而获得更好的结果3. 囚徒困境中,两个囚犯的最优策略是什么?A. 相互合作B. 相互背叛C. 一个合作,一个背叛D. 一个背叛,一个合作答案: B. 相互背叛二、简答题1. 解释什么是“混合策略”并给出一个例子。

答案:混合策略是指参与者在博弈中选择不同策略的概率分布。

例如,在石头、剪刀、布的游戏中,一个玩家可能会以1/3的概率选择石头,1/3的概率选择剪刀,和1/3的概率选择布,这就是一个混合策略的例子。

2. 描述什么是“重复博弈”以及它与单次博弈的区别。

答案:重复博弈是指同样的博弈结构在一定时间内多次进行。

与单次博弈相比,重复博弈允许参与者根据对手过去的行动来调整自己的策略,这可能会导致合作行为的出现,因为参与者会考虑到未来博弈的潜在收益。

三、论述题1. 论述博弈论在经济学中的应用,并给出至少两个具体的例子。

答案:博弈论在经济学中有广泛的应用。

例如:- 拍卖理论:博弈论可以用来分析拍卖中的竞价行为,确定最优的拍卖机制。

- 竞争策略:企业在制定市场进入、定价和广告策略时,会使用博弈论来预测竞争对手的行为并做出相应的决策。

2. 讨论囚徒困境在现实世界中可能的应用场景,并解释为什么合作有时是困难的。

答案:囚徒困境在现实世界中的应用场景包括但不限于:- 国际关系:国家之间的军备竞赛可以看作是囚徒困境的一种形式,合作减少军备可以带来共同的利益,但由于缺乏信任,每个国家都倾向于增加自己的军备。

策略博弈复习题及答案

策略博弈复习题及答案

策略博弈复习题及答案1. 什么是纳什均衡?纳什均衡是指在一个博弈中,每个参与者选择了自己的最优策略,并且考虑到其他参与者的策略选择后,没有任何一个参与者能够通过单方面改变策略来获得更好的结果。

换句话说,当所有参与者都选择了自己的最优策略时,就达到了纳什均衡。

2. 描述囚徒困境的基本结构。

囚徒困境是一个典型的非零和博弈,涉及两个参与者,他们各自面临合作或背叛的策略选择。

如果两人都选择合作,他们都会获得中等的收益;如果一个合作而另一个背叛,背叛者将获得最大的收益,而合作者则会受到惩罚;如果两人都选择背叛,他们都会得到最差的收益。

3. 博弈论中的混合策略是什么?混合策略是指参与者在博弈中以一定的概率选择不同的纯策略。

在混合策略中,参与者不是每次都选择相同的策略,而是根据一定的随机化规则在不同策略之间做出选择。

4. 举例说明什么是博弈的动态演化。

博弈的动态演化是指随着时间的推移,博弈参与者的策略选择可能会发生变化。

例如,在重复博弈中,参与者可能会根据之前博弈的结果调整自己的策略,以期望在未来获得更好的收益。

这种策略的调整和演化过程就是博弈的动态演化。

5. 如何识别一个博弈是否具有多个纳什均衡?要识别一个博弈是否具有多个纳什均衡,可以分析每个参与者的最优反应函数。

如果存在多个策略组合,使得每个参与者在给定其他参与者策略的情况下,都没有动机单方面改变策略,那么这个博弈就具有多个纳什均衡。

6. 什么是合作博弈和非合作博弈的区别?合作博弈和非合作博弈的主要区别在于参与者是否可以形成具有约束力的协议。

在合作博弈中,参与者可以达成协议并共同执行,而在非合作博弈中,参与者不能形成具有约束力的协议,他们只能独立选择自己的策略。

7. 描述博弈论在经济学中的应用。

博弈论在经济学中有广泛的应用,包括市场结构分析、拍卖理论、合同理论、产业组织等。

通过博弈论,经济学家可以分析不同市场参与者在特定情境下的策略选择,以及这些选择如何影响市场结果。

博弈文化考试题及答案

博弈文化考试题及答案

博弈文化考试题及答案一、单项选择题(每题2分,共10题)1. 博弈论中,纳什均衡是指在非合作博弈中,每个参与者都选择了最优策略,且无法通过单方面改变策略来获得更好的结果。

以下哪个选项不是纳什均衡的定义?A. 每个参与者都选择了最优策略B. 无法通过单方面改变策略来获得更好的结果C. 参与者之间存在合作D. 每个参与者都选择了最优策略,且无法通过单方面改变策略来获得更好的结果答案:C2. 在博弈论中,零和博弈是指所有参与者的收益总和为零的博弈。

以下哪个选项描述了零和博弈的特征?A. 一个参与者的收益增加,另一个参与者的收益减少B. 所有参与者的收益总和不为零C. 参与者之间可以进行合作D. 一个参与者的收益增加,不影响其他参与者的收益答案:A3. 博弈论中的囚徒困境是指两个理性个体做出的最优选择,却导致集体结果不是最优的情况。

以下哪个选项不是囚徒困境的特征?A. 个体理性导致集体非理性B. 参与者之间存在合作的可能性C. 参与者做出的最优选择导致集体结果不是最优D. 参与者之间缺乏沟通答案:B4. 在博弈论中,动态博弈是指参与者的决策是顺序进行的,每个参与者的决策都依赖于前一个参与者的决策。

以下哪个选项描述了动态博弈的特征?A. 参与者的决策是同时进行的B. 参与者的决策不依赖于前一个参与者的决策C. 参与者的决策是顺序进行的D. 参与者之间不存在互动答案:C5. 在博弈论中,混合策略是指参与者在决策时随机选择不同策略的概率分布。

以下哪个选项不是混合策略的特点?A. 参与者在决策时随机选择不同策略B. 参与者的策略选择是确定的C. 参与者的策略选择遵循一定的概率分布D. 参与者的策略选择可以影响对手的决策答案:B6. 在博弈论中,完全信息博弈是指所有参与者都完全知道博弈的结构和所有参与者的收益函数。

以下哪个选项描述了完全信息博弈的特征?A. 参与者对博弈的结构和收益函数一无所知B. 参与者只知道博弈的结构,不知道收益函数C. 参与者对博弈的结构和收益函数完全了解D. 参与者只知道自己的收益函数,不知道博弈的结构答案:C7. 在博弈论中,贝叶斯博弈是指参与者对博弈的某些信息不完全了解,但知道其他参与者可能的信息分布。

战略博弈习题答案

战略博弈习题答案

战略博弈习题答案战略博弈习题答案战略博弈是一种通过推演和思考来制定最优决策的过程。

在这个过程中,我们需要分析各种可能的情况和对手的行为,以制定最佳的策略。

下面将给出几个战略博弈习题的答案,希望能够帮助读者更好地理解和应用战略博弈的原理。

习题一:囚徒困境在囚徒困境中,两个囚徒面临合作与背叛的选择。

如果两个囚徒都选择合作,则每个人都会获得较轻的刑罚;如果两个囚徒都选择背叛,则每个人都会获得较重的刑罚;如果一个囚徒选择合作而另一个囚徒选择背叛,则合作的囚徒将会受到极重的刑罚,而背叛的囚徒将会获得较轻的刑罚。

答案:在囚徒困境中,最稳定的策略是背叛。

因为无论对方选择合作还是背叛,背叛都能够保证自己获得较轻的刑罚。

这是一个典型的非合作博弈,每个囚徒都会选择背叛,因为他们无法相信对方会选择合作。

习题二:博弈论中的狼羊菜问题在一个河边,有一只狼、一只羊和一堆菜。

现在农夫要将它们一只一只地运到河对岸,但是他只能带一样东西过河。

而且,如果农夫不在场时,狼会吃羊,羊会吃菜。

答案:农夫首先带羊过河,然后回来自己过河,然后带狼过河,但是农夫带狼过河后,要把狼放在对岸,然后回到河这边,再带羊过河,最后带菜过河。

这样可以确保在任何时候都不会有狼吃羊或羊吃菜的情况发生。

习题三:拍卖策略在拍卖中,不同的竞拍者会根据自己的估价来决定出价。

最终,出价最高的竞拍者将赢得物品,并支付自己的出价。

答案:在拍卖中,最理性的策略是出价等于自己对物品的估价。

这样可以最大程度地保证自己以最低的价格赢得物品。

然而,在实际拍卖中,竞拍者还需要考虑其他竞拍者的行为,以及拍卖的规则和策略。

因此,拍卖策略的制定需要综合考虑多种因素。

总结:战略博弈是一个复杂而有趣的领域,它涉及到许多数学和逻辑原理。

在解决战略博弈问题时,我们需要深入分析各种可能的情况和对手的行为,以制定最佳的策略。

本文给出了几个常见的战略博弈习题的答案,希望能够帮助读者更好地理解和应用战略博弈的原理。

“博弈论”习题参考附标准答案

“博弈论”习题参考附标准答案

“博弈论”习题参考附标准答案博弈论博弈论是研究人类决策制定和行为选择的一门学科,它涉及到多个参与者之间的冲突和利益博弈。

通过分析和建模参与者的决策过程,博弈论可以帮助我们理解和预测各种决策情况,并提供策略和解决方案。

本文将介绍几个典型的博弈论习题,并附上标准答案作为参考。

1. 囚徒困境囚徒困境是博弈论中最著名的问题之一。

假设两名囚徒被捕,检察官分别问他们是否承认自己犯罪。

如果只有一个人承认犯罪,他会得到从轻判决;如果两人都承认,他们将得到较重的判决;如果两人都否认,那么他们将得到较轻的判决。

但是,由于彼此的不信任和利益冲突,囚徒往往会选择自私的策略,即承认犯罪。

这个问题可以用一个博弈矩阵来表示:囚徒B承认囚徒B否认囚徒A承认 -5,-5 -10,0囚徒A否认 0,-10 -1,-1其中左上角的数字表示囚徒A和B都承认犯罪时的判决结果,右下角的数字表示囚徒A和B都否认犯罪时的判决结果。

通过分析博弈矩阵,可以发现最优策略是双方都选择否认犯罪。

2. 纳什均衡纳什均衡是博弈论的一个重要概念,它指的是参与者在给定其他参与者策略的情况下,无法通过单方面改变自己策略来获得更好结果的状态。

以两个司机选择路线为例,假设他们可以选择两条路线,每个司机希望自己的路线时间最短。

若两个司机都选择第一条路线,他们的到达时间相同,这是一个纳什均衡;若一个司机选择第一条路线,另一个司机选择第二条路线,他们的到达时间将不同,这不是一个纳什均衡状态。

3. 合作与背叛合作与背叛是博弈论中经常出现的主题,也是人们日常生活和商业交易中的重要决策。

例如,两个公司可以选择合作开展某项业务,也可以选择相互竞争。

合作可以带来双方共同的利益,但也需要相互信任;而背叛则是一种自私的策略,可以追求个体利益,但可能破坏双方的合作关系。

4. 平衡策略在博弈论中,平衡策略指的是使得参与者无法通过改变自己的策略来达到更好结果的策略选择。

在一些特殊的情况下,博弈存在多个平衡策略。

博弈论习题解答.doc

博弈论习题解答.doc

博弈论习题解答一、判断题1.X,只要任一博弈方单独改变策略不会增加得益,策略组合就是纳什均衡了。

2.V3.V4.X,某些情况下参与者具有先动优势,例如进入市场的博弈。

5.V6.X,逆向归纳法最基本的特征就是能排除扩展式博弈中所有不可信行为,包括不可信威胁和不可信承诺。

7.V8.X,对于零和博弈或者不满足合作条件的其他博弈来说,无限次重复博弈并不意味着效率的提局,得益不一定同。

9.V10.X,有些是故意隐瞒自己的行为。

11.X,在一个子博弈中出现的必须是完整的信息集,由于多节点信息集开始的博弈必然分割一个信息集,因此不可能是个子博弈。

12.X,不完美信息是指没有完美信息而非完全没有信息。

13.X,是因为其他参与者必然会考虑这些行为选择并作为他们自己选择行为的依据。

即使参与者自己不设定针对自己所有类型的行为选择,其他参与者也会替他考虑,弄清楚其他参与者对自己策略的判断。

14.X,仍然可能后悔,因为古玩交易的价格和利益不仅取决于古玩的实际价值和自己的估价,还取决于对方的估价和愿意接受的成交价格,因此仅仅自己做出正确的估价并不等于实现了最大的潜在利益。

15.X,不一定,因为可能消息的发送方的类型与接收方利益无关,或者消息接收方的行为与发送方的利益无关。

16.X,经济学并没有证明;教育是作为重要的信号,反映劳动力的素质。

17.V18.V19.X,纳什均衡是指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。

20.X,参与者总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标。

参与者A参与者A参与人1二、计算题1.纯策略均衡解为(D, R) 参与者B设3以y的概率执行L策略,对A来说选择混合策略则有1XY +2X(1— Y)=4XY +6X(1— Y)得/ = 4〉1,这是不可能的,故无混合战略均衡。

2.由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。

战略博弈习题答案

战略博弈习题答案

战略博弈习题答案战略博弈习题答案在现代社会中,战略博弈已经成为了一种普遍存在的现象。

无论是在商业领域、政治舞台还是日常生活中,我们都在不经意间参与着各种博弈。

在这篇文章中,我们将探讨一些常见的战略博弈习题,并给出相应的答案。

一、囚徒困境囚徒困境是博弈论中的一个经典问题。

假设有两个囚犯,被警察分别关在不同的房间里。

警察给每个囚犯提供了一个选择:如果两人都保持沉默,那么两人都将被判轻罪;如果其中一个人供认而另一个人保持沉默,供认的人将被判无罪,而保持沉默的人将被判重罪;如果两人都供认,那么两人都将被判重罪。

这个问题的关键在于囚犯之间的合作与背叛。

如果两人都选择合作,即保持沉默,那么他们都能避免受到重罪的惩罚。

然而,由于彼此之间缺乏信任,囚犯往往会选择背叛,即供认。

这样一来,虽然囚犯之间的利益得到了最大化,但整体利益却减少了。

因此,囚徒困境的最佳策略是合作。

如果两人都能够建立起互信,共同选择保持沉默,那么他们都能够避免受到重罪的惩罚,实现最佳的结果。

二、鸽子与鹰的博弈鸽子与鹰的博弈是另一个常见的战略博弈问题。

假设有两个玩家,一个是鸽子,一个是鹰。

他们分别可以选择合作或者背叛对方。

如果两个玩家都选择合作,那么他们将共同获得奖励;如果一个玩家选择合作而另一个玩家选择背叛,那么背叛的玩家将获得更大的奖励,而合作的玩家将受到惩罚;如果两个玩家都选择背叛,那么他们将受到双方都不愿意看到的惩罚。

在这个问题中,鸽子代表着合作,鹰代表着背叛。

如果两个玩家都选择合作,他们都能够获得奖励,实现最佳的结果。

然而,由于彼此之间的不信任,玩家往往会选择背叛,以获取更大的奖励。

这样一来,虽然个体利益得到最大化,但整体利益却减少了。

因此,鸽子与鹰的最佳策略是合作。

只有通过建立起互信,共同选择合作,才能够实现最佳的结果。

三、零和博弈零和博弈是一种特殊的博弈形式,其中一个玩家的收益等于另一个玩家的损失。

在这种博弈中,玩家之间存在着强烈的对抗性。

博弈论习题和参考答案与解析

博弈论习题和参考答案与解析

博弈论?习题一、单项选择题1.博弈论中,局中人从一个博弈中得至口的结果常被称为〔〕. A?效用B.支付C.决策D.利润2.博弈中通常包括下面的内容,除了〔〕.A.局中人B.占优战略均衡C策略D?支付3.在具有占优战略均衡的囚徒困境博弈中〔〕.A.只有一个囚徒会坦白氏两个囚徒都没有坦白C?两个囚徒都会坦白D.任何坦白都被法庭否决了4.在屡次重复的双头博弈中,每一个博弈者努力〔〕.A.使行业的总利润到达最大B?使另一个博弈者的利润最小C?使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是〔〕A.策略组合B.策略C信息D.行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最正确行为,此时的博弈具有〔〕0A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D?激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为〔〕.A.一报还一报的策略B.激发策略8.在囚徒困境的博弈中,合作策略会导致〔〕oA博弈双方都获胜B博弈双方都失败C使得先米取行动者获胜D使得后米取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现〔〕oA.当一个垄断竞争行业是由一个主导企业限制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D.当一个寡头行业进行一次博弈时一个企业米取的彳丁为10.与另一个企业在前一阶段采取的行为一致〞这种策略是一种〔〕A.主导策略B.激发策略C.一报还一报策略D.主导策略11-关于策略式博弈,正确的说法是〔〕0A.策略式博弈无法刻划动态博弈B.策略式博弈无法说明行动顺序C.策略式博弈更容易求解D.策略式博弈就是一个支付矩阵12.以下关于策略的表达哪个是错误的〔〕:A.策略是局中人选择的一套行动方案;B.参与博弈的每一个局中人都有假设干个策略;C.一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D.策略与行动是两个不同的概念,策略是行动的规那么,而不是行动本身.13.囚徒困境说明〔〕:A.双方都独立依照自己的利益行事,那么双方不能得到最好的结果;B.如果没有某种约束,局中人也可在〔抵赖,抵赖〕的根底上到达均衡;C.双方都依照自己的利益行事,结果一方赢,一方输;D.每个局中人在做决策时,不需考虑对手的反响14.一个博弈中,直接决定局中人损益的因素是〔〕:A.策略组合B.策略C信息D.行动15.动态博弈参与者在关于博弈过程的信息方面是〔〕A不对称的B对称的C不确定的D无序的16.古诺模型表达了寡头企业的〔〕决策模型A本钱B价格C产量D质量17.伯特兰德模型表达了寡头企业〔〕决策模型.A本钱价格C产量 D 质量18.用囚徒困境来说明两个寡头企业的情况,说明了:〔〕A、每个企业在做决策时,不需考虑竞争对手的反响E. 一个企业制定的价格对其它企业没有影响C、企业为了预防最差的结果,将不能得到更好的结果D、一个企业制定的产量对其它企业的产量没有影响19.子博弈精炼纳什均衡〔〕:A.是一个一般意义上的纳什均衡;B.和纳什均衡没有什么关系;C.要求某一策略组合在每一个子博弈上都构成一个纳什均衡;D.要求某一策略组合在原博弈上都构成一个纳什均衡.20.在一般产品销售市场上,以下哪种原因导致了逆向选择.〔〕A产品质量的不确定性B私人信息C公共信息D产品价格21.完全信息动态博弈参与者的行动是〔〕A无序的B有先后顺序的C不确定的D因环境改变的22.市场交易中普遍存在的讨价还价属于哪种博弈.〔〕A完全信息静态博弈B完全信息动态博弈C不完全信息静态博弈D不完全信息动态博弈23.下面哪种模型是一种动态的寡头市场博弈模型〔〕A古诺模型B伯川德模型C斯塔克尔伯格模型D田忌齐威王赛马24?博弈方根据一组选定的在两种或两种以上可能行为中随机选择的策略为血玄〔、A纯策略B混合策略C激发策略D 一报还一报策略25.影响重复博弈均衡结果的主要因素是〔〕A博弈重复的次数B信息的完备性C支付的大小DA和B26.在动态博弈战略行动中,只有当局中人从实施某一威胁所能获得的总收益()不实施该威胁所获得的总收益时,该威胁才是可信的.A大于B等于C小于D以上都有可能二、判断正误并简要说明理由I,纳什均衡一定是上策均衡,上策均衡一定是纳什均衡.2?在一个博弈中博弈方可以有很多个.3.在一个博弈中只可能存在一个纳什均衡.4.由于零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈.5.在一个博弈中如果存在多个纳什均衡那么不存在上策均衡.6.曲于两个罪犯只打算犯罪一次〞所以被捕后才出现了不合作的问题即囚徒困境.但如果他们打算重复合伙屡次,比方说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供.7,在博弈中纳什均衡是博弈双方能获得的最好结果.8.在博弈中如果某博弈方改变策略后得益增加那么另一博弈方得益减少.9,纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合.10.囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是由于两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长.11.斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润.12.在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系〞使重复博弈无法实现更高效率均衡的关键问题.13.子博弈精炼纳什均衡不是一个纳什均衡.14.零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡.15.原博弈惟一的纳什均衡本身是帕雷托效率意义上最正确战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别.16.在动态博弈中,由于后行动的博弈方可以先观察对方行为后再选择行为 ,因此总是有利的.入计算与分析题1、A、B两企业利用广告进行竞争.假设A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;假设A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;假设A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;假设A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润.〔,〕画出A、B两企业的损益矩阵.〔2 〕求纯策略纳什均衡.2、可口可乐与百事可乐〔参与者〕的价格决策:双方都可以保持价格不变或者提升价格〔策略〕;博弈的目标和得失情况表达为利润的多少〔收益〕;利润的大小取决于双方的策略组合〔收益函数〕;博弈有四种策略组合,其结局是:〔1〕双方都不涨价,各得利润10单位;〔2 〕可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30 ;(3 )可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30 ;(4 )双方都涨价,可口可乐利润140,百事可乐利润35 ;画出两企业的损益矩阵求纳什均衡.3、假定某博弈的报酬矩阵如下:(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>?(2 )如果(上,左)是纳什均衡,上述哪几个不等式必须满足4、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场.如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元.如果一方在价格决策方面选择合作而另一方却选择降低价格,那么合作的厂商获利将为零,竞争厂商将获利900000元.(1)将这一市场用囚徒困境的博弈加以表示.(2 )解释为什么均衡结果可能是两家公司都选择竞争性策略.5、博弈的收益矩阵如下表:⑴如果(上/左)是占优策略均衡/那么a、b、c、d、G、f、g、h之间必然满足哪些关系〔尽量把所有必要的关系式都写出来〕〔2 〕如果〔上,左〕是纳什均衡,那么〔1〕中的关系式哪些必须满足〔3 〕如果〔上,左〕是上策均衡,那么它是否必定是纳什均衡为什么〔4 〕在什么情况下,纯策略纳什均衡不存在6、猪圈里有一头大猪和_头小猪,猪圈的一头有一个饲料槽,另一头装有限制饲料供给的按钮.按一下按钮就会有,0个单位饲料进槽,但谁按谁就要付出2个单位的本钱.谁去按按纽那么谁后到;都去按那么同时到.假设大猪先到,大猪吃到9个单位,小猪吃到一个单位;假设同时到,大猪吃7个单位,小猪吃3个单位;假设小猪先到,大猪吃六个单位,小猪吃4个单位.求〔1〕各种情况组合扣除本钱后的支付矩阵〔2 〕求纳什均衡.7、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润〔单位:万元〕由以下图的得益矩阵给出:1〕有哪些结果是纳什均衡(2 )两厂商合作的结果是什么8、求出以下博弈的所有纯策略纳什均衡.9、求出下面博弈的纳什均衡(含纯策略和混合10、根据两人博弈的损益绸邛仲I答问题:(1) ◎出两人各自的金部策略.图示均衡点.(2 )求出斯塔克博格rstackelberg )均衡情况下的产量、价格和利润.(3)说明导致上述两种均衡结果差异的原因.13.下面的得益矩阵两博弈方之间的一个静态博弈,该博弈有没有纯策略的纳什均衡,博弈的结果是什么14.两个兄弟分一块冰激凌.哥哥先提出一个分割比例 ,弟弟可以接受或拒绝,接受那么按哥哥的提议分割,假设拒绝就自己提出一个比例.但这时候冰激凌已化得只剩1/2 了,对弟弟提议的比例哥哥也可以接受或拒绝,假设接受那么按弟弟的建议分割,假设拒绝冰激凌会全部化光.由于兄弟之间不应该做损人不利己的是“因此我们假设接受和拒绝利益相同时兄弟俩都会接受.求该博弈的子博弈完美纳什均衡.15?如果学生在测试之前全面复习,考好的概率为90%,如果学生只复习一局部重点,那么有50% 的概率考好.全面复习花费的时间tl = 100小时,重点复习之需要花费t2=20小时.学生的效用函数为:U二W-2巳其中W是测试成绩,有上下两种分数Wh和Wl, e为努力学习的时间.问老师如何才能促使学生全面复习16?在以下监工与工人之间的博弈中,试用划线法分析该博弈有无纯策略纳什均衡;如果没有,那么写出混合策略纳什均衡的结果.监工17 ?求解以下博弈的纳什均衡.博弈方29 18 ?某人正在打一场官司,不请律师肯定会输,请律师后的结果与律师的努力程度有关.假设当律师努力工作〔100小时〕时有50%的概率能赢,律师不努力工作<10小时〕那么只有15%的概率能赢.如果诉讼获胜可得到250万元赔偿,失败那么没有赔偿.由于委托方无法监督律师的工作,因此双方约定根据结果付费,赢官司律师可获赔偿金额的10%,失败那么律师一分钱也得不到.如果律师的效用函数为m 0.05e,其中m是报酬e是努力小时数,且律师有时机本钱5万元.求这个博弈的均衡.四、论述题Is解释"囚犯困境;并举商业案例说明.2、用〃小偷与守卫的博弈"说明〃鼓励〔监管〕悖论"博弈论?习题参考答案>单项选择题r 5 B. B. C.D ' A.11 15. B. C. A.6 10 C. A. A.D. C.16 20 C. B. C.21 26. B. B. C. B. D. A.,判断正误并简要说明理由1. F 上策均衡是比纳什均衡更严格的均衡.所以上策均衡一定是纳什均衡 一定是上策均衡,2. T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈3. IF 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在多个纳什均衡4. T 零和博弈才旨参与博弈各方在严格竞争下,一方收益等于另一方损失与损失之和恒为零,所以双方不存在合作可能性而纳什均衡不 ,如性别战.,博弈各方收益 ,只能有一个5.T上策均衡是通过严格下策消去法〔重复剔除下策〕所得到的占优策略纳什均衡6.IF只要两囚犯只打算合作有限次,其最优策略均为招供.比方最后一次合谋,两小偷被抓住了,由于将来没有合作时机了,最优策略均为招供.回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢.依此类推,对于有限次内的任何一次,两小偷均不可能合作.7.F纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的.团F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.T虽然斯塔格伯格模型各方利润总和小于古诺模型〞但是领导者的利润比古诺模型时12..T无限次重复博弈没有结束重复确实定时间;而在有限次重复博弈中,存在最后一次重复,并且正是有结束重复确实定时间,使重复博弈无法实现更高效率均衡.13.F子博弈精炼纳什均衡一定是一个纳什均衡.14.F零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡.15.T原博弈惟一的纳什均衡本身是帕雷托效率意义上最正确战略组合,因此不管是重复有限次还是无限次,不会和一次性博弈有区别.16.F动态博弈是指各博弈方的选择和行动又先后次序的博弈.动态博弈的信息盯以是不对称的.所以策略分为先发制人和.斯塔克伯格博弈揭示“先发制人〞更有禾L而"后发制人"后行动的博弈方可以先观察对方行为后再选择行为反而处于不利境地.三、计算与分析题Is (1)(2)纯策略纳什均衡为(做广告,做广告),(不做广告,不做广告)得长价-20, 30140,35纳什均衡〔不涨价,不涨价〕,〔涨价,涨价〕.从帕累托均衡角度,为〔涨价,涨价〕3、〔 1〕如果〔上/左〕是上策均衡,那么,a>e b>d, g<c, f>h 〔2 〕如果〔上〕左〕是纳什均衡,a>e b>d,不等式必须满足新华航空北方航空 合作竞争50, 50 90, 00, 90 6, 65、 略纳什均衡为〔按,等〕 7、略8、纯策略纳什均衡〔氏甲〕,〔⑴不存在纯策略纳什均衡合作肓争⑵设甲选择"U"的概率为概率为1-P1乙选择"『的概率为P2,贝V选择" R" 的概率为1-P2对甲而言,最正确策略是按定的概率选〃上"和‘下’,使乙选择“左〃和〃右"的期望值相等即PI*8+ (l-PI) *0-P1*1+ (1-P1) *5解得PI = 5/12即⑸12, 7/12 )按5/12概率选〃上“、7/12概率选〃下"为甲的混合策略Nash均衡对乙而言,最正确策略是按一定的概率选“左“和“右",使乙选择〃上"和‘下’的期望值相等即P2*5+(l-P2)*0- P2*2 + (l-P2)*4即(4/7, 3/7肢4/7概率选‘左’、3/7概率选"右"为乙的混合策略Nash均衡10、略.11、见笔记12、见笔记.13、首先,运用严格下策反复消去法的思想,不难发现在博弈方1的策略中,B是相对于T的严格下策.把博弈方1的B策略消去后又可以发现,博弈方2的策略中C是相对于R的严格下策,从而也可以消去.两个博弈方各消去一个策略后的博弈是如下的两人2X 2博弈,己经不存在任何严格下策.再运用划线或箭头法,很容易发现这个2X2博弈有两个纯策略纳什均衡(M,L )和(1R ) 0由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系,一次性静态博弈的结果不能肯定.由于双方在该博弈中可能采取混合策略,因此实际上该博弈的结果可以是4个纯策略组合中的任何一个.14.假设哥的方案是SI: 1-S1淇中S1是自己的份额,弟的方案是S2: 1-S2, S2是哥的份额,那么可用如下的扩展形表示该博弈:Hi SiC5V2eS? 2)CO O)运用逆推归纳法先分析最后一阶段哥的选择.由于只要接受的利益不少于不接受的利益哥就会接受,因此在这个阶段只要弟的方案满足S2/2 $0,也就是S2$0,哥就会接受,否那么不会接受.由于冰激凌的份额不可能是负数,也就是说由于哥不接受弟的方案冰激凌会全部化掉〞因此任何方案哥都会接受.现在回到前一阶段弟的选择.由于弟知道后一阶段哥的选择方法,因此知道如果不接受前一阶段哥提出的比例,自己可以取S2=0,独享此时还未化掉的1/2块冰激凌;如果选择接受前一阶段哥的提议,那么自己将得到出1,显然只要l-Sn/2 ,即S1W1/2,弟就会接受哥的提议.再回到第一阶段哥的选择.哥清楚后两个阶段双方的选择逻辑和结果 ,因此他在这一阶段选择Sl = 1/2,正是能够被弟接受的自己的最大限度份额,超过这个份额将什么都不能得到,因此SI二1/2是最正确选择.综上,该博弈的子博弈完美纳什均衡是:哥哥开始时就提议按(1/2J/2)分割,弟弟接受.15.此题中老帅的调控于段高分和低分的差距.该博弈的扩•展形如下:只有当Ul» U2时学生才会选择全面复习.根据Ul» U2我们可以算出Wh- WD 400o这就是老师能有效全面复习需要满足的条件.其实在奖学金与成绩挂钩时,Wh- W1也可以理解成不同等奖学金的差额.16泄有纯策略均衡,只有混合策略均衡((0. 25,0.75 ),(0. 5,0. 5 ))17. 可以根据画线法求得有唯一纯策略均衡(上,左)18.参见第15题四、论述题1、解释〃囚犯困境〃,并举商业案例说明.(1)假设条件举例:两囚徒被指控是一宗罪案的同案犯.他们被分别关在不同的牢房无法互通信息.各囚徒都被要求坦白罪行.如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年.(2)囚徒困境的策略矩阵表.每个囚徒都有两种策略:坦白或不坦白.表中的数字分别代表囚徒甲和乙的得益.囚徒乙3〕分析:通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都〃坦白〃.给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白.这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不管对方如何选择,个人的最优选择是坦白.其结果是双方都坦白.4〕商业案例:寡头垄断厂商经常发现它们自己处于一种囚徒的困境.当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润.但卡特尔协定不是一个纳什均衡,由于给尢双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润.2用〞小偷与守卫的博弈〃说明〃鼓励〔监管〕悖论〃.〔1〕假设条件举例:偷窃和预防偷窃是小偷和门卫之间进行博弈的一场游戏.门卫可以不睡觉,或者睡觉.小偷可以采取偷、不偷两种策略.如果小偷知道门卫睡觉, 他的最正确选择就是偷;如果门卫不睡觉,他最好还是不偷.对于门卫,如果他知道小偷想偷,他的最正确选择是不睡觉,如果小偷采取不偷,自己最好去睡觉.〔2 〕小偷与门卫的支付矩阵表〔假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住〕:。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论与政治第三小组作业第二章名词解释:1、理性行为(rational behavior):参与人精于算计并严格按照其最优策略行事。

其中理性有两个重要的内涵:一个人对自己的利益完全了解,并能完美地计算出何种行动可以最大化其利益。

2、不完美信息(imperfect information):在博弈的每一个行动时点上,参与人可能无法获悉决策所需的全部信息。

这包括相关的外部环境——比如天气——的不确定性,以及对方先前或当前的行动。

这类情况称为不完美信息。

3、不完全信息(incomplete information):当一个参与人比另一个参与人了解更多信息时,阴谋诡计就会产生。

这类情况称为不完全信息。

4、合作博弈(cooperative game):博弈论使用两个专门术语来区分协议具有强制力和不具有强制力的情况。

若协议对参与人行为具有强制力,则称此类博弈为合作博弈。

5、非合作博弈(noncooperate game):个体参与人可根据其利益采取行动,则称此类博弈为非合作博弈。

第三章名词解释:1、中间评估函数(intermediate valuation function):赋予非终点结支付的规则被称为中间评估函数。

2、先动优势(firstmover advantage):在博弈的过程中先做决策带来的优势。

先动优势来自于将其自身置于一个优势地位以及迫使其他参与人接受它的承诺能力。

后动优势(second-mover advantage):在博弈的过程中后做决策带来的优势。

后动优势源于自己可对他人选择做出的灵活性。

第四章名词解释:1、占优策略(dominant strategy)、劣策略(dominated strategy):每一个博弈中的参与者通常都拥有不止一个竞争策略,其所有策略的集合构成了该企业的策略集。

在参与者各自的策略集中,如果存在一个与其他竞争对手可能采取的策略无关的最优选择,则称其为占优策略(Dominant Strategy),与之相对的其他策略则为劣势策略。

占优策略是博弈论(game theory)中的专业术语,所谓的占优策略就是指无论竞争对手如何反应都属于本企业最佳选择的竞争策略。

2、占优可解(dominance solvable):在规模较大的博弈中,或许没有单个策略占优于其他所有的策略,但可能也存在一些策略劣于其他某些策略。

如果参与人发现自己处于这样一种博弈中,他们可以通过将劣策略从可选策略中剔除的办法求得均衡。

剔除劣策略缩小了博弈的规模,得到的“新”的博弈又可能出现对于同一个参与人或其他参与人而言的另外一些劣策略,进而又可以继续剔除这些劣策略;或者在“新”的博弈中,某个参与人存在占优策略。

重复剔除劣策略的过程可以剔除劣策略或缩小博弈的规模,直到不能进一步剔除为止。

如果这个过程最后只剩下一个唯一的结果,那么这个博弈就被称为占优可解。

3、聚点(focal point):参与人得以成功协调所依赖的这种共同预期策略称为聚点。

4、预期收敛(convergence of expectation):如果参与人在博弈中具备的共同认识,那么他们关于行动的预期会收敛到一个平衡点,即预期收敛。

5、零和博弈(zero-sum game)在一些博弈中,博弈双方的利益是完全相对的。

对参与人的每个策略组合而言,一个参与人的支付就是另一个人支付的相反数,我们称这种博弈为零和博弈。

6、纳什均衡(Nash equilibrium)纳什均衡可以定义为这昂的一种策略组合:其中每个参与人的策略都是对其他人的策略的最优反应。

或者有这样一个策略组合,每个参与人都选择了一个相应的策略,并且具备如下性质:(1)每个参与人都对其他参与人的策略有正确的信念;(2)给定每个参与人关于其他参与人策略的信念,自己所选择的策略是最优的。

第五章名词解释:1、最优反应曲线(best-response curves):列出收益函数后,求导得到的函数所对应的曲线即为最优反应曲线。

2、最优反应原则(best-response rule):最大化其支付的最优定价的集合就是最优反应原则。

5. 第二章作业题1(a)这是一个博弈。

因为不同口味的酸乳酪可能会给这些杂货店老板带来不同的收益。

(b)这是一个博弈。

因为如果这两个少女考虑到对方在舞会时要穿的衣服来选择自己要穿什么衣服才会让自己更加有利。

比如避免出现两个人穿同样衣服的情况出现。

(c)这是一个决策。

因为这位大学生在做出选择的时候不用考虑到他人的反应。

(d)这是一个博弈。

因为微软和网景公司在作出定价的时候都要考虑到对方的反应对自己的影响。

(e )这是一个决策。

因为这位州长候选人只需按照自己的意愿去选择自己的竞选搭档即可,不必考虑到其他人的反应对自己的决策带来的影响。

4(a )预期支付=0.5*20+0.1*50+0.4*0=15(元)(b )预期支付=0.5*50+0.5*0=25(元)(c )预期支付=0.8*0+0.1*50+0.1*20=7(元)第三章作业题1决策结:2个终点结:6个 决策结:3个 终点结:9个(c决策结:4个Array终点结:8个2解:(a)s方向,即(1,0)(b)s-u方向,即(3,3,3,)(c)s-n-S-n-N方向,即(4,5)4解:错,在序贯行动博弈中,先手不一定会获胜。

因为在序贯行动博弈中,不单会有先动优势,使得对手被迫做出次一级的选择;同时也存在后动优势,即可以依据别人的选择做出相应的反应,具有灵活性。

比如,如果猜拳变成序贯行动博弈的话,那么,一定是后动的人有绝对优势。

5解:有博弈树得到均衡点为(3,3),即波音公司采用和平竞争,而空中客车参与竞争。

7.此题为必胜策略题:先手占优势,只要先手第一轮出“1”,之后每轮保证与对方说的之和为11即可获胜;后手在先手未说“1”时,与对方说的凑成12,然后之后每轮与对方凑成11即可获胜。

7. 第四章作业题1,这句话不对,因为虽然某个参与人有一个占优策略,但是在这个占优策略的前提下,另外一个参与人可能会做出不同的选择,使得有占优策略的人不能得到对他来说最好的结果。

例如下面的这个博弈过程(教材75页)如果联邦储备银行认为国会会选择“预算平衡”,那么它自己则会选择“低利率”(因为这样它可以得到支付4而不是支付3);但如果它认为国会会选择“预算赤字”,则它选择“高利率”将会更好些(这样可以得到支付2而不是支付1)。

由此可见,联邦储备银行不存在占优策略,而国会却有占优策略。

如果国会认为联邦储备银行会选择“低利率”,国会最优选择是“预算赤字”而不是“预算平衡”;如果国会认为联邦储备银行会选择“高利率”,它的最优选择仍是“预算赤字”而不是“预算平衡”。

因此,“预算赤字”是国会的占优策略。

但是这个博弈的平衡点式国会选择“预算赤字”而联邦储备银行选择“高利率”;并不是对国会的最好结果,这是因为当国会选择“预算赤字”这个最优策略的时候,联邦储备银行可以预见到它的这一选择,从而选择“高利率”。

2.的时候,行会选择“下”,纳什平衡点是(Max,Min)=(2,2)。

根据最大最小值也可以验证,如上面的表格。

的时候,列会选择“右”,所以纳什平衡点是(Max,Min)=(3,3)。

根据最大最小值也可以验证,如上面的表格。

(c)3,来得到更多的支付,纳什平衡点是(6,5)来得到更多的支付,纳什平衡点是右下方的(1,1);同样“列”的占优策略是选择“右”,当“列”选择“右”的时候,“行”会选择“下”来得到更多的支付,纳什平衡点是右下方的(1,1)来获得最大的支付。

(10,10)为纳什平衡点,表格中红色的部分表示被划掉过。

或者用逐格检查的方法也可以实现。

寻找过程,对于“列”在每一行中划掉对“列”来说支付最小的两个策略组合,对于“行”在每一列中划掉对“行”来说支付最小的两个策略。

最后看哪个策略组合没有被划掉过,就是纳什平衡点。

因为支付最大的组合并不一定是纳什均衡点所在的地方,这个博弈中(1,2)是平衡点,但是这个平衡点对应的不是支付最大的点,所以要使用参与人的策略而不知识均衡时的支付来描述均衡。

4.7.表格如图所示:红色的字和数字对应所获利益,此处默认快乐和时间的单决策,所以没有均衡点。

4.11其中经过简单的连续删除分析(由于其实两人对称),可知其中的考虑B ,C 两人时的均衡点为红字所示!而对于A 来说没有重合的,所以没有nash 均衡点。

第五章第2题Qx =44−2Px +Py;Qy =44−2Py +Px .泽维尔每周的利润:Bx =(Px −8)Qx =(Px −8)(44−2Px +Py )为使Bx 最大,可让Bx 对Px 求导数,使得导数值为0;即:dPxdBx =(44−2Px +Py )−2(Px −8)=Py −4Px +60=0 Py −4Px +60=0为泽维尔的最优反应规则。

伊冯娜每周的利润:)244)(6()6(Px Py Py Qy Py By +--=-=为使By 最大,可让By 对Py 求导数,使得导数值为0;即:0)6(2)244(=--+-=Py Px Py dPydBy ; 0456=+-Px Py ;这就是伊冯娜的最优反应规则。

解出交点即为纳什平衡点:Px=19.73Py=18.93(b)泽维尔的最优反应曲线没有变化,而伊冯娜的最优反应曲线产生变化,伊冯娜的最优反应曲线向下移动了一个单位。

产生这种变化的原因是伊冯娜通过重新安排工作和裁掉一些员工将服务每个顾客的成本降低到了6美元。

所以伊冯娜的最优反应曲线方程产生了变化。

相关文档
最新文档