博弈论复习题(1)

合集下载

大学博弈论试题及答案

大学博弈论试题及答案

大学博弈论试题及答案一、选择题(每题2分,共20分)1. 在博弈论中,非合作博弈是指:A. 参与者之间可以达成协议B. 参与者之间不能达成协议C. 参与者之间必须达成协议D. 参与者之间只能通过合作达到目标答案:B2. 纳什均衡是博弈论中的一个概念,它描述了一种情况,即:A. 所有参与者都处于最优策略B. 至少有一个参与者处于非最优策略C. 所有参与者都处于非最优策略D. 至少有一个参与者可以单方面改变策略以获得更好的结果答案:A3. 囚徒困境中,如果两个参与者都选择合作,那么:A. 他们都将获得最大收益B. 他们都将获得最小收益C. 他们都将获得中等收益D. 他们中的一个将获得最大收益,另一个获得最小收益答案:C4. 零和博弈是指:A. 一个参与者的收益等于另一个参与者的损失B. 参与者的总收益为零C. 参与者的总损失为零D. 参与者的总收益和总损失相等答案:B5. 在博弈论中,策略是指:A. 参与者的行动计划B. 参与者的收益C. 参与者的损失D. 参与者的支付结构答案:A6. 博弈论中的“混合策略”是指:A. 参与者随机选择策略B. 参与者总是选择相同的策略C. 参与者的策略是固定的D. 参与者的策略是预先确定的答案:A7. 博弈论中的“支配策略”是指:A. 无论对手选择什么策略,都是最优的策略B. 只有在特定情况下才是最优的策略C. 只有在对手选择特定策略时才是最优的策略D. 参与者总是选择的策略答案:A8. 博弈论中的“重复博弈”是指:A. 博弈只进行一次B. 博弈进行多次,但每次都是独立的C. 博弈进行多次,且参与者的记忆会影响后续决策D. 博弈进行多次,但参与者不能记住之前的决策答案:C9. 在博弈论中,如果一个策略在任何情况下都不是最优的,那么这个策略被称为:A. 支配策略B. 支配策略的反面C. 支配策略的替代D. 非支配策略答案:B10. 博弈论中的“共同知识”是指:A. 所有参与者都知道的信息B. 只有部分参与者知道的信息C. 参与者之间的秘密D. 参与者之间共享的信念答案:A二、填空题(每题2分,共20分)1. 在博弈论中,如果一个策略在任何情况下都不是最优的,那么这个策略被称为________。

博弈论习题[1]

博弈论习题[1]
一、完全信息静态博弈
习题 2
解: 令(L,M,R)是参与人 A 的 战 略 ;( U,M,D)是参与人 B 的战略。从表 1A.2 中可以看出,对 于参与人 B 而言,M 战略是严格劣于 R 战略,按照重复提出的占有均衡剔除 M 战略,则得出 如表(a)博弈。在表(a)博弈,参与人 A 的 M 和 D 战略严格劣于 U 战略,重复剔除 M 和 D 战略,得出表(b)博弈。该博弈为单人决策,则重复剔除的占优均衡为(U,L)。
r3 ( A, A, A) = r3 ( A, A, B) = r3 (A, A, C) = {A, B, C} r3 ( A, B, A) = r3 ( A, B, B) = r3 (A, B, C) = {A, C} r3 ( A, C, A) = r3 ( A, C, B) = r3 ( A, C, C) = {C} r3 (B, A, A) = r3 (B, A, B) = r3 (B, A, C) = {A, C} r3 (B, B, A) = r3 (B, B, B) = r3 (B, B, C) = {B, C} r3 (B, C, A) = r3 (B, C, B) = r3 (B, C, C) = {C} r3 (C, A, A) = r3 (C, A, B) = r3 (C, A, C) = {C} r3 (C, B, A) = r3 (C, B, B) = r3 (C, B, C) = {C} r3 (C, C, A) = r3 (C, C, B) = r3 (C, C, C) = {A, B, C}
(0,0)律师得到 100 (0,0)律师得到 100)
通过上面的支付矩阵,我们可以得出答案,只有 A 和 B 都做出选择得到 50 的时候,他
们才能得到钱,不多一分也不少分,如果有一方想多得,二者将一分也得不到,钱全部归律

博弈论复习题及答案完整版

博弈论复习题及答案完整版

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】一、名词解释(每题7分,共28分)1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。

2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。

用策略性思维来分析问题,从中找出合理策略,实现目标最优。

3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。

4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。

5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。

每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。

二、简要回答问题(每题10分,共40分)1、博弈的基本要素有哪些?基本特点是什么?答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。

博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。

2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。

3、猎鹿博弈反映的基本思想是什么?答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。

4、什么是道德风险?有什么办法可以解决道德风险问题?答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。

博弈论习题1

博弈论习题1

1、一逃犯从关押他的监狱中逃走,一看守奉命追捕。

如果逃
犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。

逃犯逃脱可少坐10年牢,但一旦被抓住则要
加刑10年;看守抓住逃犯能得1000元奖金。

请用得益矩阵表示该博弈。

2、你正在考虑是否投资100万元开设一家饭店。

假设情况是
这样的:你决定开,则0.35的概率你将收益300万元(包
括投资),而0.65的概率你将全部亏损掉;如果你不开,
则你能保住本钱但也不会有利润。

请你:
(1)用得益矩阵表示该博弈。

(2)如果你是风险中性者,你会怎样选择?
(3)如果你是风险规避者,且期望得益的折扣系数为0.9,你的策略选择是什么?
3、假设长虹和创维这两家彩电生产商都可以选择集中力量研
发生产低档产品或高档产品,但他们在选择时都不知道对方的选择。

假设他们在不同选择下的收益矩阵如下图所示。

请问:该博弈的均衡是什么?。

“博弈论”习题及参考答案

“博弈论”习题及参考答案

《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。

A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。

A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。

A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。

A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。

A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。

A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。

A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。

A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。

A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。

A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。

博弈论考试题及答案

博弈论考试题及答案

博弈论考试题及答案一、选择题(每题2分,共20分)1. 博弈论中的“囚徒困境”是指什么?A. 两个囚犯相互合作B. 两个囚犯相互背叛C. 两个囚犯中一个合作一个背叛D. 两个囚犯相互猜疑答案:B2. 以下哪个不是博弈论中的基本概念?A. 策略B. 收益C. 公平D. 纳什均衡答案:C3. 在零和博弈中,一个玩家的损失等于另一个玩家的收益,这意味着:A. 总收益为零B. 总收益为正C. 总收益为负D. 总收益不确定答案:A4. 博弈论中的“混合策略”是指:A. 玩家随机选择策略B. 玩家固定选择一种策略C. 玩家根据对手的策略选择策略D. 玩家不使用策略答案:A5. 以下哪个是博弈论中的“完全信息”博弈?A. 拍卖博弈B. 石头剪刀布C. 桥牌D. 信息不对称博弈答案:C6. 博弈论中的“重复博弈”指的是:A. 博弈只进行一次B. 博弈进行多次C. 博弈进行无限次D. 博弈进行有限次但次数未知答案:B7. 以下哪个是博弈论中的“动态博弈”?A. 零和博弈B. 非零和博弈C. 同时博弈D. 顺序博弈答案:D8. 在博弈论中,如果一个策略组合是纳什均衡,那么:A. 每个玩家都有动机单方面改变策略B. 每个玩家都满足于当前策略C. 至少有一个玩家不满意当前策略D. 所有玩家都不满意当前策略答案:B9. 博弈论中的“合作博弈”是指:A. 玩家之间可以形成联盟B. 玩家之间不能形成联盟C. 玩家之间只能通过竞争来获得收益D. 玩家之间只能通过合作来获得收益答案:A10. 以下哪个是博弈论中的“公共知识”?A. 每个玩家的收益函数B. 每个玩家的策略选择C. 每个玩家的偏好D. 每个玩家的个人信息答案:A二、简答题(每题10分,共30分)1. 简述博弈论中的“纳什均衡”概念。

答案:纳什均衡是指在一个博弈中,每个玩家都选择了自己的最优策略,并且没有玩家能够通过单方面改变策略来提高自己的收益。

在纳什均衡状态下,每个玩家的策略是对其他玩家策略的最优反应。

博弈论考试试题及答案

博弈论考试试题及答案

博弈论考试一试题以及答案所以,希望您起码在某些题目上有优秀的表现。

2、要求您独立达成全部题目,您的答案(主要指论述题)与其余同学若有显然相同,纯属互相剽窃,绝非偶合。

3、本试卷题目的难度必定足以充足展现您的才能,希望您能够尽可能达成全部的题目,以便最大限度地显示您的水平,无愧于您作为天之宠儿的盛誉。

4、希望您和任课老师博弈的均衡结局是:您全力以赴并优秀地达成了全部的题目,迫使老师不得不给您一个高分。

6、请把你学号的尾数除以 3,把余数填在封面相应的地点。

1、第一题( 20 分):要求第一用文字论述你所经历的案例,然后用抽象成博弈论模型并进行剖析。

(3)学号尾数除以 3 余 2 的同学剖析:举一个你所经历的斗鸡博弈的实例,在实质博弈中你采纳什么行动让你是成为“猛士”的;答: 1996 年长虹公司与海尔公司价钱战。

在实质的博弈中,我或许虚张阵容给他人以心理上的打击进而击溃他人的心理防线,迫使敌手做出退步。

进而成为猛士 .2、第二题( 20 分):请举例说明以下说法能否正确,结构博弈模型详细说明,论述原由。

( 3)学号尾数除以 3 余 2 的同学判断剖析“知道的越多越好”答:达尔文的生物进化论说明,人生活在世界上实质上就是和他人竞争。

物竞天择适者生计。

在竞争强烈的社会中,时机只看重有准备的人,知道得越多,此后遇到问题解决问题的能力也就越强,时机也就越多,利润也越大。

在以下结构的博弈论模型中能够反应出来。

乙多少甲多5,510,0少0,100,0对于甲而言,知道的少利润为零,所以甲选择知道多,对于乙也相同。

依据占优策略均衡,甲乙将同时选择知道得多进而( 5,5)达到纳什均衡。

所以对于甲乙而言,知道得多的,将利润越大,“知道得越多越好” 。

3、第三题( 20 分):( 3)学号尾数除以 3 余 2 的同学做:以下是皇帝与元勋博弈的战略表达式,剖析三种不一样状况的均衡结果,联合有关历史事实对此中的差别进行议论。

博弈论复习题及答案

博弈论复习题及答案

垄断利润 (3)其他企业触发战略,将价格降到等于边际成本,所有的企业利润为零。 参考答案: (1)设每个企业的边际成本为c,固定成本为0 P=a-Q TR=P*Q=(a-Q)*Q MR=a-2Q 因为:MR=MC a-2Q=c 则:Q=(a-c)/2 P=(a+c)/2 π=(P-c)*Q=(a-c)2/4 每家企业的利润为(a-c)2/4n (2)假设A企业自主降价,虽然只是微小的价格调整,但足以占领整个市场 , 获得所有的垄断利润——(a-c)2/4 (3)其他企业在下一期采取冷酷策略,使得所有企业的利润为0 考虑: A企业不降价: (a-c)2/4n, (a-c)2/4n, …… A企业降价: (a-c)2/4, 0, …… 使垄断价格可以作为完美均衡结果,就要使得不降价的贴现值大于等于降价的贴 现值。 设贴现因子为δ A不降价的贴现值: [(a-c)2/4n][1/(1- δ)] A降价的现值: (a-c)2/4 于是:[(a-c)2/4n][1/(1- δ)]≥ (a-c)2/4 解得: δ≥1-1/n
足:
i (s*) Pi (s*) i (s*) Pi (sc )
54 5 1
1 4
,即只有当贴现因子 >1/4
时,才存在子博弈完美
纳什均衡。
7、在Bertrand价格博弈中,假定有n个生产企业,需求函数为P=a-Q,其中P是市 场价格,Q是n个生产企业的总供给量。假定博弈重复无穷多次,每次的价格都立 即被观测到,企业使用“触发策略”(一旦某个企业选择垄断价格,则执行“冷 酷策略”)。求使垄断价格可以作为完美均衡结果出现的最低贴现因子δ是多少。 并请解释δ与n的关系。 分析:此题可分解为3个步骤 (1)n个企业合作,产量总和为垄断产量,价格为垄断价格,然后平分利润。 (2)其中一个企业采取欺骗手段降价,那个这家企业就占有的全部市场,获得

博弈论复习题及答案

博弈论复习题及答案

一、名词解释(每题7分,共28分)1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。

2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。

用策略性思维来分析问题,从中找出合理策略,实现目标最优。

3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。

4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。

5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。

每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。

二、简要回答问题(每题10分,共40分)1、博弈的基本要素有哪些?基本特点是什么?答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。

博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。

2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。

3、猎鹿博弈反映的基本思想是什么?答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。

4、什么是道德风险?有什么办法可以解决道德风险问题?答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。

博弈论复习题及答案

博弈论复习题及答案

博弈论复习题及答案1. 博弈论中,非合作博弈与合作博弈的主要区别是什么?答案:非合作博弈是指参与者之间没有约束性协议的博弈,每个参与者都独立地选择自己的策略以最大化自己的利益。

而合作博弈则允许参与者之间形成具有约束力的协议,共同合作以达到共同的目标。

2. 什么是纳什均衡?答案:纳什均衡是指在一个博弈中,每个参与者都选择了最优策略,并且考虑到其他参与者的策略后,没有参与者有动机单方面改变自己的策略。

3. 零和博弈与非零和博弈有何不同?答案:零和博弈是指博弈中所有参与者的收益总和为零,即一个参与者的收益必然导致另一个参与者的损失。

非零和博弈则是指参与者的收益总和不为零,参与者之间可能存在合作共赢的情况。

4. 如何判断一个博弈是否存在纯策略纳什均衡?答案:可以通过构建博弈的收益矩阵,然后寻找每个参与者在其他参与者策略给定的情况下的最佳响应策略。

如果存在一组策略,使得每个参与者在其他参与者策略不变的情况下,都没有动机改变自己的策略,那么这个策略组合就是一个纯策略纳什均衡。

5. 混合策略纳什均衡与纯策略纳什均衡有何不同?答案:纯策略纳什均衡是指参与者在均衡状态下选择的策略是确定的,而混合策略纳什均衡则是指参与者在均衡状态下选择的策略是随机的,每个策略都有一定的概率被选择。

6. 什么是支配策略?答案:支配策略是指在博弈中,无论其他参与者选择什么策略,某个参与者选择该策略都能获得比其他策略更好的结果。

7. 博弈论中的“囚徒困境”说明了什么?答案:“囚徒困境”说明了即使合作对所有参与者都有利,但由于缺乏信任和沟通,参与者可能会选择对自身最有利的策略,导致集体结果不是最优的。

8. 什么是博弈论中的“倒后归纳法”?答案:“倒后归纳法”是一种解决动态博弈的方法,通过从博弈的最后阶段开始,逆向分析每个阶段的最优策略,直到博弈的初始阶段。

9. 博弈论在经济学中的应用有哪些?答案:博弈论在经济学中的应用非常广泛,包括但不限于市场结构分析、拍卖理论、合同理论、产业组织、宏观经济政策分析等。

博弈论习题与参考答案

博弈论习题与参考答案

1.假设古诺寡头模型中有n 个企业,令i q 代表企业i 的产量,且1n Q q q =++表示市场总产量,假设需求函数为()p Q a Q =-(其中Q a <)。

假设企业i 的成本函数为()i i i C q cq =,即没有固定成本,且边际成本为常数c ,我们假设c 小于需求函数中的常数a 。

根据古诺模型,所有企业同时做出产量决策。

求纳什均衡。

当n 趋于无穷时,将会出现什么情况? 【参考答案】第i 个企业的利润最大化问题为:**Max (,)()i i i i i i i q q a q q q cq π--=---,其中*i q -表示所有其他企业的产量之和。

注意这个式子利用了纳什均衡的定义。

由一阶条件0iiq π∂=∂,可得 **2i ia q c q ---=(1)将(1)式两侧同乘以2,再减去*i q 可得:***()i i i q a q q c -=-+-注意,在上式中***=i i q q Q -+,因此,我们有**i q a Q c =--(2)由此可知,每一个企业的最优产量都相等,因此**=i Q nq ,代入(2)式可得:*1()1i q a c n =-+ 由此可得()**1i nQ nq a c n ==-+ *11a n p c n n =+++ 因此,当n →∞时,*=p c ,即均衡价格等于边际成本,市场为完全竞争市场。

作业1 .P(q)=120-q, q=q1+q2, Ci(qi)=0, i=1,2 用反复删除严格劣势求古诺均衡。

2. 找出BOS 博弈的混合策略均衡。

r D 1-r Z3.某产品市场中只有三个企业,市场的需求函数为()p Q a Q =-,其中123Q q q q =++。

每一个企业的的成本函数为()i i i C q cq =,其中c 为常数,1,2,3i =。

企业的产量决策顺序为:(1)企业1先选择自己的产量1q ;(2)企业2和企业3观察到1q ,并同时选择2q 和3q 。

《经济博弈论》期末考试复习题及参考答案

《经济博弈论》期末考试复习题及参考答案

《经济博弈论》期末考试复习题及参考答案一、单项选择题1、博弈论中,参与人的策略有()A 有限的B 无限的C 有限和无限两种情况D 以上都不对参考答案:C解释:在博弈论中,参与人的策略可以是有限的,也可以是无限的,具体取决于博弈的类型和设定。

2、下列属于完全信息静态博弈的是()A 囚徒困境B 斗鸡博弈C 市场进入博弈D 以上都是参考答案:D解释:囚徒困境、斗鸡博弈和市场进入博弈都属于完全信息静态博弈。

3、在一个两人博弈中,如果双方都知道对方的策略空间和收益函数,这被称为()A 完全信息博弈B 不完全信息博弈C 静态博弈D 动态博弈参考答案:A解释:完全信息博弈意味着博弈中的参与人对彼此的策略空间和收益函数都有清晰的了解。

4、占优策略均衡一定是纳什均衡,纳什均衡()是占优策略均衡。

A 一定B 不一定C 一定不D 以上都不对参考答案:B解释:占优策略均衡是一种更强的均衡概念,占优策略均衡一定是纳什均衡,但纳什均衡不一定是占优策略均衡。

5、对于“囚徒困境”博弈,()A 双方都独立依照自身利益行事,结果限于最不利的局面B 双方都独立依照自身利益行事,导致最好的选择C 双方进行合作,得到了最好的结果D 以上说法都不对参考答案:A解释:在“囚徒困境”中,每个囚徒都从自身利益出发选择坦白,最终导致双方都受到较重的惩罚,这是一种个体理性导致集体非理性的结果。

二、多项选择题1、以下属于博弈构成要素的有()A 参与人B 策略C 收益D 信息E 均衡参考答案:ABCDE解释:博弈的构成要素通常包括参与人、策略、收益、信息和均衡等。

参与人是进行博弈的主体;策略是参与人在博弈中可选择的行动方案;收益是参与人采取不同策略所得到的结果;信息是参与人对博弈局面的了解程度;均衡是博弈的稳定状态。

2、常见的博弈类型有()A 完全信息静态博弈B 完全信息动态博弈C 不完全信息静态博弈D 不完全信息动态博弈参考答案:ABCD解释:这四种博弈类型是根据信息是否完全和博弈的进行时态来划分的。

博弈论复习题及答案

博弈论复习题及答案

可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:(1)双方都不涨价,各得利润10单位;(2)可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)双方都涨价,可口可乐利润140,百事可乐利润35;画出两企业的损益矩阵求纳什均衡。

9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。

如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。

如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。

(1)将这一市场用囚徒困境的博弈加以表示。

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。

;若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。

若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。

由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。

12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出:(1)有哪些结果是纳什均衡(2)两厂商合作的结果是什么答(1)(低价,高价),(高价,低价)(2)(低价,高价)13、A、B两企业利用广告进行竞争。

若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A 企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A 企业可获得30万元利润,B企业可获得6万元利润。

博弈论考研试题及答案

博弈论考研试题及答案

博弈论考研试题及答案试题:博弈论考研模拟试题一、单项选择题(每题2分,共10分)1. 在博弈论中,非合作博弈与合作博弈的主要区别在于()。

A. 参与者的数量B. 参与者是否可以形成具有约束力的协议C. 博弈的支付结构D. 博弈的时间顺序2. 囚徒困境中,如果两个参与者都选择背叛对方,那么他们将()。

A. 获得最大的个人利益B. 获得最大的集体利益C. 获得最小的个人利益D. 获得最小的集体利益3. 纳什均衡的概念是由哪位数学家提出的?()A. 约翰·纳什B. 约翰·冯·诺伊曼C. 让·梯若尔D. 莱昂尼德·赫维茨4. 在完全信息博弈中,每个参与者都完全知道博弈的结构和其他所有参与者的()。

A. 收益B. 策略C. 收益和策略D. 偏好5. 动态博弈与静态博弈的主要区别在于()。

A. 参与者的互动次数B. 是否存在随机因素C. 参与者的知识水平D. 博弈的支付方式二、简答题(每题10分,共20分)1. 简述零和博弈和非零和博弈的区别,并各举一例。

2. 解释什么是“弱支配策略”和“强支配策略”,并给出一个包含这两种策略的博弈例子。

三、计算题(每题15分,共30分)1. 考虑一个两人博弈,参与者A和B分别有两个策略:高风险(H)和低风险(L)。

支付矩阵如下:| B\ | H | LA \H | 3,2 | 4,1L | 2,3 | 1,4计算并找出这个博弈的纳什均衡。

2. 假设一个市场上有两个公司,公司1和公司2,它们可以选择高广告投入(H)或低广告投入(L)。

支付矩阵如下:| 2\ | H | L1 \H | 100,100 | 80,120L | 120,80 | 60,60计算并找出这个博弈的纳什均衡,并讨论如果公司能够形成合作协议,他们可能如何改变策略。

四、论述题(每题20分,共20分)1. 论述博弈论在经济学中的应用,并举例说明。

答案:一、单项选择题1. B2. C3. A4. C5. A二、简答题1. 零和博弈是指在一个博弈中,一个参与者的收益恰好等于另一个参与者的损失,总和为零。

博弈论复习题及答案

博弈论复习题及答案

博弈论复习题及答案博弈论是研究决策者在相互影响的情况下如何做出决策的理论。

以下是一些博弈论的复习题及答案,供学习者参考:一、选择题1. 博弈论中最基本的博弈类型是什么?A. 零和博弈B. 非零和博弈C. 完全信息博弈D. 不完全信息博弈答案: A. 零和博弈2. 在博弈论中,纳什均衡指的是什么?A. 一种博弈的最终结果B. 一种博弈的初始状态C. 一种策略组合,其中没有任何一个参与者能够通过单方面改变策略而获得更好的结果D. 一种策略组合,其中所有参与者都希望改变策略以获得更好的结果答案: C. 一种策略组合,其中没有任何一个参与者能够通过单方面改变策略而获得更好的结果3. 囚徒困境中,两个囚犯的最优策略是什么?A. 相互合作B. 相互背叛C. 一个合作,一个背叛D. 一个背叛,一个合作答案: B. 相互背叛二、简答题1. 解释什么是“混合策略”并给出一个例子。

答案:混合策略是指参与者在博弈中选择不同策略的概率分布。

例如,在石头、剪刀、布的游戏中,一个玩家可能会以1/3的概率选择石头,1/3的概率选择剪刀,和1/3的概率选择布,这就是一个混合策略的例子。

2. 描述什么是“重复博弈”以及它与单次博弈的区别。

答案:重复博弈是指同样的博弈结构在一定时间内多次进行。

与单次博弈相比,重复博弈允许参与者根据对手过去的行动来调整自己的策略,这可能会导致合作行为的出现,因为参与者会考虑到未来博弈的潜在收益。

三、论述题1. 论述博弈论在经济学中的应用,并给出至少两个具体的例子。

答案:博弈论在经济学中有广泛的应用。

例如:- 拍卖理论:博弈论可以用来分析拍卖中的竞价行为,确定最优的拍卖机制。

- 竞争策略:企业在制定市场进入、定价和广告策略时,会使用博弈论来预测竞争对手的行为并做出相应的决策。

2. 讨论囚徒困境在现实世界中可能的应用场景,并解释为什么合作有时是困难的。

答案:囚徒困境在现实世界中的应用场景包括但不限于:- 国际关系:国家之间的军备竞赛可以看作是囚徒困境的一种形式,合作减少军备可以带来共同的利益,但由于缺乏信任,每个国家都倾向于增加自己的军备。

“博弈论”习题及参考答案

“博弈论”习题及参考答案

《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为( )。

A.效用B.支付C.决策 D.利润2.博弈中通常包括下面的内容,除了( )。

A.局中人 B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中( )。

A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力( )。

A.使行业的总利润达到最大 B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是( )。

A. 策略组合 B. 策略C. 信息 D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。

A.囚徒困境式的均衡 B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。

A.一报还一报的策略 B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致( )。

A.博弈双方都获胜 B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D.当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种( )。

A.主导策略 B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是( )。

A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的( ):A. 策略是局中人选择的一套行动计划;B.参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。

博弈论复习题及答案

博弈论复习题及答案
的知识; 支付(payoff)函数
是参与人从博弈中获得的效用水平,它是所有参与人策略或行动的 函数,是每个参与人很关心的东西; 结果(outcome) 是指博弈分析者感兴趣的要素的集合,常用支付矩阵或收益矩阵来 表示; 均衡(equilibrium) 是所有参与人的最优策略或行动的组合。 静态博弈 指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采 取什么样的行动; 动态博弈 指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选 择的行动。 博弈 就是一些个人、队组或其他组织,面对一定的环境条件,在一定的 规则下,同时或先后,一次或多次,从各自允许选择的行为或策略 中进行选择并加以实施,各自取得相应结果的过程。 零和博弈: 也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同 变和博弈: 零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问 题的重要性。 完全信息静态博弈
l已知q1ac在前面我们分析同时行动的古诺博弈中得出的r2q1和上式完全一致两者的不同之处在于这里的r2q1是企业2对企业1已观测到的产量的真实反应而在古诺的分析中r2q1是企业2对假定的企业1的产量的最优反应且企业1的产量选择是和企业2同时作出的
博弈论
判断题(每小题1分,共15分)
囚徒困境说明个人的理性选择不一定是集体的理性选择。(√ ) 子博弈精炼纳什均衡不是一个纳什均衡。(× ) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博 弈。( ) 博弈中知道越多的一方越有利。( ×) 纳什均衡一定是上策均衡。 (× ) 上策均衡一定是纳什均衡。 (√) 在一个博弈中只可能存在一个纳什均衡。 (×) 在一个博弈中博弈方可以有很多个。 (√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ ) 在博弈中纳什均衡是博弈双方能获得的最好结果。 (× ) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。 (× ) 上策均衡是帕累托最优的均衡。 (×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈 就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行

博弈论期末试题及答案

博弈论期末试题及答案

博弈论期末试题及答案一、选择题(每题2分,共40分)1. 博弈论的核心概念是:A. 均衡分析B. 策略分析C. 利润分析D. 收益分析2. Nash均衡是指:A. 所有玩家达到最优结果B. 没有玩家可以通过改变策略获得更好结果C. 所有玩家都选择相同的策略D. 所有玩家都选择不同的策略3. 在零和博弈中,一方的收益是另一方的:A. 收益的相反数B. 收益的平方C. 收益的负数D. 收益的倒数4. 最优响应策略是指:A. 在对手的策略给定时,玩家自己的最优策略B. 在对手的策略给定时,对手的最优策略C. 利用数学模型计算得到的最优策略D. 随机选择的策略5. 以下哪个是非合作博弈的扩展形式:A. 矩阵形式B. 博弈树形式C. 序列形式D. 重复博弈形式6. 当两位玩家在重复博弈中都选择合作策略时,他们的总收益是:A. 最大化的B. 最小化的C. 平均化的D. 不确定7. 最优子博弈在博弈树中的作用是:A. 寻找博弈的子集B. 确定博弈过程的时间C. 减少博弈的复杂性D. 避免剪枝8. 以下哪个是非合作博弈的解决概念:A. 纳什均衡B. 支配策略C. 策略剖析D. 相对策略9. 在纳什均衡中,每个玩家都是:A. 个体理性的B. 无知的C. 合作的D. 随机的10. 在博弈论中,支配策略指的是:A. 无论对手选择什么策略,都能带来最好结果的策略B. 无论自己选择什么策略,都能带来最好结果的策略C. 无论对手选择什么策略,都会带来最坏结果的策略D. 无论自己选择什么策略,都会带来最坏结果的策略二、简答题(每题10分,共20分)1. 请解释什么是零和博弈,并举例说明。

零和博弈是一种博弈模型,其中一个玩家的收益等于另一个玩家的损失,总收益为零,也就是说一方的利益必然导致另一方的损失。

举例来说,两个商家在一个市场上销售相同的商品,他们之间的竞争就可以看作是零和博弈。

一方的销售额的增加必然导致另一方的销售额减少。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.设一四阶段两博弈方之间的动态博弈如图所示。

试找出全部子博弈,讨论该博弈中的可信性问题,求子博弈完美纳什均衡策略组合和博弈的结果。

2.假设一个工会是一个寡头垄断市场中所有企业唯一的劳动力供给者,就像汽车工人联合会对于通用、福特、克莱斯勒等大的汽车厂家。

令博弈各方行动的时间顺序如下:(1)工会确定单一的工资要求w ,适用于所有的企业(2)每家企业i 了解到w ,然后同时分别选择各自的雇佣水平L i ;(3)工会的收益为(w-w α)L ,其中w α为工会成员到另外的行业谋职可取得的收入,L=L 1+…L n 为工会在本行业企业的总就业水平;企业i 的利润为π(w ,L i ),其中决定企业i 利润水ABB A h g (2,4)(8,5)(3,6)(4,3)b (5,3)a c d f e平的要素如下。

所有企业都有同样的生产函数:产出等于劳动力q i=L i。

市场总产出为Q=q1+…+q n时的市场出清价格为p(Q)=a-Q。

为使问题简化,假设企业除了工资支出外没有另外的资本。

求出此博弈的子博弈精炼解。

在子博弈精炼解中,企业的数量是如何影响工会的效应的?为什么?(吉本斯2.2节 2.7答案)3.下图所示的同时行动博弈重复进行两次,并且第二阶段开始前双方可观测到第一阶段的结果,不考虑贴现因素。

变量x大于4,因而(4,4)在一次性博弈中并不是一个均衡收益。

对什么样的x,(双方参与者同时采取)下述战略是一个子博弈完美纳什均衡?第一阶段选择Q i,如果第一阶段的结果为(Q1,Q2),在第二阶段选择P i;如果第一阶段的结果为(y,Q2),其中y≠Q1,第二阶段选择R i;如果第一阶段的结果为(Q1,z),其中z≠Q1,第二阶段选择S i;如果第一阶段结果为(y,z),其中y≠Q1,且z≠Q2,则在第二阶段选P iP2 Q2 R2 S2P1Q1R1S1(2.10吉本斯)思路:逐个分析上述的四种情形:第一种情形,第一阶段选择Qi,第二阶段选择Pi,即双方均采取合作的策略,得益均为6;第二种情形和第三种情形下,实际上有一方是采取了不合作,其得益为x,另一方即利益受损方得益为2;第四种情形实际上是双方都不采取合作的策略,而根据题目要求,对于x,下述战略是一个子博弈精炼纳什均衡,所以x必须小于双方均合作时的收益6,否则第一种情形不会出现,因为既然x>6了,双方均会选择不合作而使情形一不会出现。

由题目先前给定的条件x<4,综合之得x的取值为(4,6)。

(可参见教材68页的分析)4.两个人A,B分一个冰淇淋。

第一阶段A提出分割方案,B可以接受或者拒绝,接受则博弈结束,若拒绝B提出分配方案;同样,A可以接受或者拒绝,如果拒绝,就提出自己的分配比例。

博弈结束。

假定接受的利益和拒绝的利益相同的时候,大家都会选择接受。

冰淇淋在每个阶段会化掉1/3(整体的1/3)。

试分析这个博弈的子博弈完美纳什均衡是什么。

如果每阶段冰淇淋只化掉1/3,采用逆向归纳法。

最后一个阶段应该是A在分,如果B拒绝,两人都是0,A的分配不会使B得到的更差,所以为了最大化自己的利益,A便让自己得到1/3,B一丁点也得不到。

为了防止这一点,在第二阶段B分配的时候,就不会让A 分到的比1/3少,否则A会拒绝,B就得不到好处了。

B会将剩下的2/3平分,两人各得1/3。

深知这一点后,第一阶段在冰淇淋没化的时候A如果让B得到的不少于1/3,B就不会拒绝。

这样A可以将2/3分给自己,1/3分给B,实现自己利益最大化。

此时便达到了纳什均衡如果每阶段冰淇淋只化掉1/3,采用逆向归纳法。

最后一个阶段应该是A在分,如果B拒绝,两人都是0,A的分配不会使B得到的更差,所以为了最大化自己的利益,A便让自己得到1/3,B一丁点也得不到。

为了防止这一点,在第二阶段B分配的时候,就不会让A 分到的比1/3少,否则A会拒绝,B就得不到好处了。

B会将剩下的2/3平分,两人各得1/3。

深知这一点后,第一阶段在冰淇淋没化的时候A如果让B得到的不少于1/3,B就不会拒绝。

这样A可以将2/3分给自己,1/3分给B,实现自己利益最大化。

此时便达到了纳什均衡5. 两个寡头企业进行价格竞争博弈,企业1的利润函数是()q c aq p ++--=21π,企业2的利润函数是()p b q +--=22π,其中p 是企业1的价格,q 是企业2的价格。

求: (1)两企业同时决策的纯策略纳什均衡; (2)企业1先决策的子博弈完美纳什均衡; (3)企业2先决策的子博弈完美纳什均衡;(4)是否存在参数a ,b ,c 的特定值或范围,使得两个企业都希望自己先决策(博弈论习题【1】P9 习题三)6. 试分析为什么在很多商业街上麦当劳与肯德基都是选在商业街的中心段,且比邻而居。

(博弈论习题【1】P5 最后一句)假设在一条繁华的商业街有A、B、C、D、E五个商业点可以作为开店的位置,每个商业点消费者数量相同,麦当劳和肯德基可以选择A、B、C、D、E五个地点中任意一个作为店址。

(1)两家店不同时决策。

不妨设肯德基先决策,麦当劳再决策(这也符合中国实际情况,中国肯德基数量为麦当劳的3倍,整体发展优于麦当劳,所以一般会先有肯德基),而消费者会选择距离他们最近的店面去消费,若距离一样,则消费者以等概率选择两家店。

基于以上假设就可以对参与人麦当劳(记为M)、肯德基(记为K)决策进行分析。

K首先进行决策,作为一个理性决策者,K会考虑M的决策。

若K选择A,则M会选择B,此时,K只能得到A的顾客,其收益不妨记为1,而M的收益则为4,这显然不是最优策略。

若K选择B,则M会选择C,在这种情况下,K的收益为2,M的收益为3。

按照这样的思路分析下去,可以得知K选择C是最优策略。

此时,无论M选择哪里作为店址,K的收益都不会小于M。

之后轮到M进行决策,若选择A,则K的收益为3.5,M的收益为1.5,不是最佳应对。

以此对每个店址进行分析,可知M选择C是对K选择C的最佳应对。

在这种情况下,K和M 的收益都为2.5,两家店平分所有的顾客,两家店的决策也互为最佳应对,达到了纳什均衡。

所以,肯德基和麦当劳的店址会选择在同一地点。

(2)两家店同时决策。

此时两家店的收益矩阵,如下:在这种情况下,直接寻找纳什均衡不是那么容易,但是通过上面的收益矩阵可以看出,对于肯德基,策略A和策略E是严格非优策略,因为在肯德基选择A或E的任何场合,它也可以通过选择B来获得一个严格的较高收益。

与此类似,对于麦当劳,策略A和策略E也是严格非优策略,因为在任何场合,麦当劳可以选择通过选择B来获得一个严格的较高收益。

理性的参与人不会有任何兴趣去选择采取一个非优策略,因为那总是可以通过一个其他收益更高的策略来替代。

因此,肯德基不会选择A和E,并且因为麦当劳知道这个博弈的结构,包括肯德基的收益情况,所以麦当劳也知道肯德基不会采取选择A和E。

因此这两个策略在博弈中会被有效的去除。

同样的道理,对于麦当劳也是如此。

这是,我们可以得到一个化简后的博弈收益矩阵,这个矩阵只包括B、C、D三个策略,如下:这时可以再次发现对于肯德基,策略B和D是严格非优策略,对于麦当劳,策略B和D也是严格非优策略,化简后对于每个参与人都只有一种策略C,即可得到策略组(C,C)。

当然一种更简单和更方便的方法是直接发现该博弈结构中存在纳什均衡(C,C)。

这表明肯德基和麦当劳同时决策时,最后的结果也会是两家店选址在一起。

综合上面的讨论,可见肯德基和麦当劳总是比邻而开,并不是偶然,而是理性博弈后的必然。

7. 设有一批选民在一个单位区间从左(x=0)到右(x=1)均匀分布,为一个职位参加竞选的每个候选人同时选择其竞选基地(即在x=0与1之间的一个点)。

选民观察候选人的选择,然后每一投票人把票投给其基地离自己最近的候选人。

比如,如果有两个候选人,他们分别在x=0.3和x=0.6选择基地,则处于x=0.45左边的所有选民都会把票投给候选人1,右边的人都会把票投给候选人2,这样候选人2就可以得到55%的选票赢得这场选举。

假设候选人只关心他能否当选,他们根本一点都不关心其基地。

如果有两个候选人,博弈的纯策略纳什均衡是什么?(吉本斯1。

8)8. 假定古诺的寡头垄断模型中有n个企业,令qi代表企业i的产量,且Q=q1+……+qn表示市场总产量,p表示市场出清价格,并假设反需求函数由p(Q)=a-Q给出(设Q<a,其他情况下p=0).并设企业i生产出的qi的总成本Ci(qi)=cqi,即没有固定成本,且边际成本为常数c,这里设c<a,根据古诺的假定,企业同时就产量进行决策。

求出博弈的纳什均衡。

当n趋向于无穷时,将会发生什么情况?(博弈论习题【1】P3 第八题)不完全信息博弈1. 考虑两企业采用伯川德竞争,即静态情况下的价格竞争。

两企业间存在着信息不对称,并且产品存在差异。

对企业i 的需求(,)i i j i i j q p p a p b p =--,两企业的成本都为0。

企业i 的需求对企业j 价格的敏感程度有可能高,也可能较低,也就是说,b i 可能等于b H ,也可能等于b L ,这里b H ﹥b L ﹥0。

对每个企业,b i =b H 的概率为θ,b i =b H 的概率为1-θ,并且与b j 的值无关。

每一企业知道自己的b i ,但不知道对方的,所有这些都是共同知识。

此博弈中的行动空间、类型空间、推断以及效用函数各是什么?双方的策略空间各是什么?此博弈对称的纯策略贝叶斯纳什均衡应满足那些条件?求出这样的均衡解。

2、试分析下面完全但不完美动态博弈的贝叶斯精炼均衡。

贝叶斯精炼均衡应该满足如下四个条件:条件 1:在各个信息集处,轮到选择的博弈方必须有关于博弈达到该信息集中每个节点的可能性的“判断”。

对非单节点信息集,一个“判断”就是博弈达到该信息集中各个节点可能性的概率分布,对单节点信息集,则可理解为“判断达到该节点的概率为1”条件2:给定轮到选择博弈方的“判断”,他的后续策略必须是“序列理性”的。

即在给定此判断和“其他博弈方后续策略”的情况下,该博弈方其后的行为选择意在使自己的期望得益最大。

条件3:在均衡路径上的信息集处,“判断”要符合贝叶斯法则和各博弈方的均衡策略。

条件4:在非均衡路径上的信息集处,“判断”也要符合贝叶斯法则和各博弈方在此处可能有的均衡策略。

当一个策略组合及相应的判断满足这四个条件时称为“完美贝叶斯均衡”。

第一种解释分析:上图是一个有三个博弈方的三阶段不完美信息动态博弈。

在该博弈中,博弈方3 的信息集是一个两节点信息集。

如果博弈方1第一阶段选F ,则博弈过程会经历多节点信息集假设博弈方3“判断”博弈方2选L 和R 的概率分别是 p 和1-p,最终共有四种可能的结果,各方得益如图所示。

相关文档
最新文档