博弈与决策测验1-4答案

合集下载

智慧树知到《博弈策略与完美思维》章节测试题[完整答案]

智慧树知到《博弈策略与完美思维》章节测试题[完整答案]

智慧树知到《博弈策略与完美思维》章节测试题[完整答案]见面课:信号博弈2、如果动态博弈的一个策略组合不仅在均衡路径上是纳什均衡,而且在非均衡路径上也是纳什均衡,这就是该动态博弈的一个子博弈完美纳什均衡。

A.对B.错正确答案:对3、颤抖手均衡解决了博弈方犯错误的问题,因此能够保证它的预测一定就是实际博弈的结果。

A.对B.错正确答案:错4、不完全信息动态博弈分析的基本方法也是逆推归纳法。

A.对B.错正确答案:错5、在动态经济博弈论问题中,各个博弈方的选择和博弈的结果,与各个博弈方在各个博弈阶段选择各种行为的可信程度有很大关系。

B.错正确答案:对见面课:纳什均衡与应用1、在囚徒困境的博弈中,两个囚徒合作的策略会形成( )。

A.纳什均衡B.占优策略均衡C.重复剔除的占优均衡D.非纳什均衡正确答案:非纳什均衡2、在社会福利博弈中,流浪汉和政府博弈的均衡属于( )。

A.纯战略纳什均衡B.混合战略纳什均衡C.重复剔除的占优均衡D.占优策略均衡正确答案:混合战略纳什均衡3、合作博弈就是博弈方采取相互合作态度的博弈。

A.对B.错正确答案:错4、任何理性的博弈方都不可能采用严格下策。

A.对正确答案:对5、在考虑混合策略的情况下,我们不可利用重复剔除的方法进行分析求解。

A.对B.错正确答案:对6、囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。

A.对B.错正确答案:错见面课:纳什生平故事漫谈1、下列哪个博弈属于零和博弈( )。

A.囚徒困境B.懦夫博弈C.智猪博弈D.硬币博弈正确答案:硬币博弈2、“敌不动,我不动”指的就是纳什均衡。

A.对正确答案:对3、员工选择偷懒还是努力工作实际上是一个囚徒困境的博弈问题。

A.对B.错正确答案:错4、纳什均衡一定是占优策略均衡。

A.对B.错正确答案:错5、一个参与人的纳什均衡策略是面对其他参与人的均衡策略时的最优选择。

博弈与决策题库

博弈与决策题库

题库一、名词解释1.动态博弈动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。

2.逆向归纳法对于动态博弈,特别是在完全信息条件下,最简单的方法就是逆向归纳法。

就是从最后一个阶段或者最后一个子博弈开始逆推向上,逐步向前倒推以求解动态博弈均衡。

3.重复博弈重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题。

4. 第二价格密封拍卖是由1996年诺贝尔经济学奖获得者威廉•维克瑞设计的,因而又被称为是“维克瑞拍卖”,具体规则如下:每个竞标者分别向拍卖方提交自己的报价,而且他们不知道别人的出价,出价最高的竞标者获得该物品,并按所有的出价中仅次于最高出价的第二高价格支付给卖家。

5.完全信息是指所有参与者各自选择行动的不同组合所决定的收益对所有参与者来说是共同知识。

共同知识就是你知道,我知道,你知道我知道的信息。

6.子博弈直观的含义是原博弈的一个部分,它本身也可以作为一个博弈进行分析,博弈树的一个子树所代表的博弈就是子博弈,子博弈的起始点是某个选择的终点,包括这个终点及所有后续结及枝及终点结之后的收益,构成了一个子博弈树,这个博弈树所代表的博弈称为子博弈。

7.公共信息如果有些信息是博弈参与者都知道的,或者是所有有关的参与者都知道的,这些信息就叫“公共信息”或者“共同知识”。

8.贝叶斯纳什均衡不完全信息静态博弈的均衡称为贝叶斯纳什均衡。

是指在不完全信息静态博弈中在给定自己类型以及其他参与者的类型与策略选择之间关系的条件下,使得自己的期望效用最大。

9.博弈论博弈论是指研究多个个体或团队在特定条件制约下的对局中,利用相关方的策略而实施对应策略的科学。

10.纳什均衡对于每一个参与者来说是这样一种组合,即给定其他参与者的策略,每一个参与者的这个策略能使其效用最大化。

其含义为:当博弈的所有参与者在某一选定的策略组合下都没有动机(单方面)偏离自己选定的策略时,该组合策略就是纳什均衡。

国开电大博弈与决策(重庆)测验四参考答案

国开电大博弈与决策(重庆)测验四参考答案

题目1.信息是博弈的筹码,掌握的信息越多,正确决策的可能性就越大。



【答案】:对
题目2.“私人信息”的存在才导致了“信息不对称”的出现,就是指某些行为人拥有但另一些行为人不拥有的信息。



【答案】:对
题目3.在法律上,当某人A授权某人B代表A从事某种活动时,就发生了“委托—代理”关系。

其中A是“代理人”,B是“委托人”。



【答案】:错
题目4.在信息经济学中,拥有私人信息的一方常被称为“委托人”,就是知情者;处于信息劣势的一方则被称作“代理人”,就是不知情者。



【答案】:错
题目5.博弈中没有私人信息的一方为减弱非对称信息对自己的不利影响,也可以采取某些办法,比如契约或者某种条件,区别不同类型的交易对象,这是信号甄别问题。



【答案】:对
题目6.“柠檬市场”的概念由美国经济学家约瑟夫?斯蒂格利茨首先提出。



【答案】:错。

博弈论复习试题与答案

博弈论复习试题与答案

博弈论判断题(每小题1分,共15分)囚徒困境说明个人的理性选择不一定是集体的理性选择。

(√)子博弈精炼纳什均衡不是一个纳什均衡。

(×)若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。

()博弈中知道越多的一方越有利。

(×)纳什均衡一定是上策均衡。

(×)上策均衡一定是纳什均衡。

(√)在一个博弈中只可能存在一个纳什均衡。

(×)在一个博弈中博弈方可以有很多个。

(√)在一个博弈中如果存在多个纳什均衡则不存在上策均衡。

(√)在博弈中纳什均衡是博弈双方能获得的最好结果。

(×)在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。

(×)上策均衡是帕累托最优的均衡。

(×)因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。

(×)在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。

(×)在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。

囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。

(×)纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。

(√)多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。

(√)如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t<T,在t阶段的结局并不是G的Nash均衡。

博弈游戏试题与答案.doc

博弈游戏试题与答案.doc

1.简述静态博弈和动态博弈的概念,并举例说明。

(10分)博弈双方没有信息交换下同时选择行动或是不同时行动,但双方不知道对方将会采取什么具体行动的博弈就是静态博弈。

比如“囚徒困境”,双方不能交换信息,一方只能猜测推理对方会怎样做。

博弈双方的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择,这种有信息交换的博弈就是动态博弈。

比如说下棋,双方一先一后出棋,后一方可以看到前一方的行动,并据此来采取相应选择。

2.以“囚徒困境”说明什么是纳什均衡?(8分)纳什均衡是指符合博弈双方个体理性最佳选择的惟一平衡点,在这点上,任何一人单方面改变选择都只会得到较差的结果。

“囚徒困境”中,甲乙两名嫌疑犯,如果两人都坦白则各判8年;一人坦白一人不坦白,坦白的放出去,不坦白的判15年;如果两人都不坦白则各判15年。

假设甲乙两人同样聪明,而且都只关心减少自己的刑期,不在乎对方。

甲推理:假如乙不招供,他有两种选择①招供一马上获得自由;②不招供一坐牢1年。

假设乙招供,他也有两种选择①招供一坐牢8年;②不招供一坐牢15年。

由上可看出,不管乙招供不招供,甲选择招供都是对自己比较有利的。

无论是甲,还是乙,他们均推理得出最好的策略是“招认”这是他们最符合个人理性的选择。

双方均招认是“纳什均衡”——这是一个稳定的结果。

此时甲乙任一方单方面改变选择都只会得到较差的结果。

比如甲改变选择,不招供,他将获刑15年。

3.简述帕累托最优的概念,并举例说明(7分)帕累托最优是指资源分配的一种状态,在不使任何人境况变坏的情况下,而不可能再使某些人的处境变好,即在这个状态下如果有人试图将自己的处境变好,就一定要有人的处境变坏,没有人能够在不顺还别人的利益的同时使自己的利益得到提高。

比如一对热恋的情侣AB,他们的相恋是帕累托最优,此时第三者C追求A, AC相处更幸福,则A选择离开B,此时A失恋了,受到伤害。

就是指在原来的帕累托最优的状态下,A 试图将自己的处境变好,一定会让B的处境变坏。

电大(本)博弈与决策作业1-4复习过程

电大(本)博弈与决策作业1-4复习过程

博弈与决策 平时作业参考答案(1)一、名词解释1.博弈论:是指研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。

2.完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

3.静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道先采取行动的人采取的是什么行动。

4.动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。

5.非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行动的话,这种博弈类型就是非合作博弈。

6.纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的这个战略能使其期望效用最大化。

7.纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变自己的策略,这个策略就是纯策略。

8.纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改变自己的策略,否则会使策略组合令人后悔或者不满意。

二、请用剔除劣势策略的方法寻找以下博弈的最优策略。

要求: (1)写出剔除的步骤或顺序;(2)画出相应的剔除线;(3)给出最优的博弈结果。

乙甲答:(1)对甲而言,抵赖是劣势策略,用横线划去“抵赖”所对应的行;(2)对乙而言,抵赖是劣势策略,用竖线划去“抵赖”所对应的列; (3)余下的策略组合是(坦白,坦白),这就是该博弈的最优结果。

[注:步骤(1)(2)颠倒亦可]百事可乐答:(1)对可口可乐而言,高价是劣势策略,用横线划去“高价”所对应的行;(2)对百事可乐而言,高价是劣势策略,用竖线划去“高价”所对应的列;(3)余下的策略组合是(低价,低价),这就是该博弈的最优结果。

[注:步骤(1)(2)颠倒亦可]员工乙员工甲答:(1)对员工乙而言,策略R 是明显劣势策略,用竖线划去“R ”所对应的列;(2)对员工甲而言,在员工乙剔除R 策略之后,C 策略是劣势策略,用横线划去“C ”所对应的行; (3)对员工乙而言,此时劣势的策略是L ,用竖线划去“L ”所对应的列; (4)对员工甲而言,此时劣势的策略是D ,用竖线划去“D ”所对应的行; (5)余下的策略组合是(U ,M ),这就是该博弈的最优结果。

博弈与决策

博弈与决策

博弈与决策一、名词1.静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道先采取行动的人采取的是什么行动。

2.完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

3.博弈论:是指研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。

4.动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。

5.纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的这个战略能使其期望效用最大化。

6.非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行动的话,这种博弈类型就是非合作博弈。

7.纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变自己的策略,这个策略就是纯策略。

8.纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改变自己的策略,否则会使策略组合令人后悔或者不满意。

二、请用剔除劣势策略的方法寻找以下博弈的最优策略。

要求: (1)写出剔除的步骤或顺序;(2)画出相应的剔除线;(3)给出最优的博弈结果。

乙甲答:(1)对甲而言,抵赖是劣势策略,用横线划去“抵赖”所对应的行;(2)对乙而言,抵赖是劣势策略,用竖线划去“抵赖”所对应的列;(3)余下的策略组合是(坦白,坦白),这就是该博弈的最优结果。

[注:步骤(1)(2)颠倒亦可]百事可乐答:(1)对可口可乐而言,高价是劣势策略,用横线划去“高价”所对应的行;(2)对百事可乐而言,高价是劣势策略,用竖线划去“高价”所对应的列; (3)余下的策略组合是(低价,低价),这就是该博弈的最优结果。

[注:步骤(1)(2)颠倒亦可]员工乙员工甲答:(1)对员工乙而言,策略R 是明显劣势策略,用竖线划去“R ”所对应的列;(2)对员工甲而言,在员工乙剔除R 策略之后,C 策略是劣势策略,用横线划去“C ”所对应的行;(3)对员工乙而言,此时劣势的策略是L ,用竖线划去“L ”所对应的列; (4)对员工甲而言,此时劣势的策略是D ,用竖线划去“D ”所对应的行; (5)余下的策略组合是(U ,M ),这就是该博弈的最优结果。

“博弈论”习题及参考答案

“博弈论”习题及参考答案

“博弈论”习题及参考答案《博弈论》习题⼀、单项选择题1.博弈论中,局中⼈从⼀个博弈中得到的结果常被称为()。

A. 效⽤B. ⽀付C. 决策D. 利润2.博弈中通常包括下⾯的内容,除了()。

A.局中⼈B.占优战略均衡C.策略D.⽀付3.在具有占优战略均衡的囚徒困境博弈中()。

A.只有⼀个囚徒会坦⽩B.两个囚徒都没有坦⽩C.两个囚徒都会坦⽩D.任何坦⽩都被法庭否决了4.在多次重复的双头博弈中,每⼀个博弈者努⼒()。

A.使⾏业的总利润达到最⼤B.使另⼀个博弈者的利润最⼩C.使其市场份额最⼤D.使其利润最⼤5.⼀个博弈中,直接决定局中⼈⽀付的因素是()。

A. 策略组合B. 策略C. 信息D. ⾏动6.对博弈中的每⼀个博弈者⽽⾔,⽆论对⼿作何选择,其总是拥有惟⼀最佳⾏为,此时的博弈具有()。

A.囚徒困境式的均衡B.⼀报还⼀报的均衡C.占优策略均衡D.激发战略均衡7.如果另⼀个博弈者在前⼀期合作,博弈者就在现期合作;但如果另⼀个博弈者在前⼀期违约,博弈者在现期也违约的策略称为()。

A.⼀报还⼀报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。

A.博弈双⽅都获胜B.博弈双⽅都失败C.使得先采取⾏动者获胜D.使得后采取⾏动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当⼀个垄断竞争⾏业是由⼀个主导企业控制时B.当⼀个寡头⾏业⾯对的是重复博弈时C.当⼀个垄断⾏业被迫重复地与⼀个寡头⾏业博弈时D. 当⼀个寡头⾏业进⾏⼀次博弈时10.⼀个企业采取的⾏为与另⼀个企业在前⼀阶段采取的⾏为⼀致,这种策略是⼀种()。

A.主导策略B.激发策略C.⼀报还⼀报策略D.主导策略11.关于策略式博弈,正确的说法是()。

A. 策略式博弈⽆法刻划动态博弈B. 策略式博弈⽆法表明⾏动顺序C. 策略式博弈更容易求解D. 策略式博弈就是⼀个⽀付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中⼈选择的⼀套⾏动计划;B. 参与博弈的每⼀个局中⼈都有若⼲个策略;C. ⼀个局中⼈在原博弈中的策略和在⼦博弈中的策略是相同的;D. 策略与⾏动是两个不同的概念,策略是⾏动的规则,⽽不是⾏动本⾝。

电大课程《博弈与决策》练习题(四)

电大课程《博弈与决策》练习题(四)

《博弈与决策》练习题四一、名词解释1.英式拍卖:也称为公开拍卖或者增价拍卖,买者自由地相继出价,且出价是逐步提高的,直到没有人愿意支付更高的价格为止。

2.第二价格密封拍卖:每个竞标者分别向拍卖方提交自己的报价,而且他们不知道别人的出价,出价最高的竞标者将获得物品,并按所有的出价中仅次于最高出价的第二高价格支付给卖家。

3.私人价值拍卖:在这类拍卖中,拍品对不同竞标者的价值可能并非是独立的,每个竞标者都确切地知道该拍品对他本人的价值,但是却不能从其他竞标者的估价中得到对自己的估价任何有用的信息。

4.边缘政策博弈:是一种将博弈参与者和其他对手置于灾难发生的可能性逐步增大的风险中的一种战略,但是可怕的灾难结果实际上发生与否并不全在发出威胁一方的控制之中。

5.信号显示:具有信息优势的一方(拥有私人信息的一方)采取某种行动向信息劣势一方(不了解对方私人信息的一方)发送相关信号,来告诉对方自己的真实类型,这就是信号显示。

6.信号筛选:是在博弈中没有私人信息的一方为了减弱非对称信息对自己的不利影响,以便能够区别不同类型的交易对象而提出的一种交易方式。

7.道德风险:就是从事经济活动的代理人在最大限度地增进自身效用的同时做出不利于委托人的行动。

8.激励相容约束:委托人提供一个合约,让代理人在努力工作时所获得的收益大于不努力工作时的收益,这就是激励相容约束。

二、请分析以下问题。

1.小张有一件古董,他认为值30000元。

小李想买这件古董,他认为值50000元。

在二人不知道协商如何进行的情况下,请你分析一下可能的结果。

答:小张和小李双方可能在30000元至50000元之间的价格上成交。

2.在上面一个问题的基础上,小王也想买这件古董,也愿意出价50000元来买。

在不知道协商如何进行的情况下,而且小李和小王不会串通起来,请你分析一下可能的结果。

答:小张应该以50000元的价格卖给小李或者小王,而没有其他结果。

因为他们二人都认为该件物品值50000元,那么低于50000元的出价是不稳定的。

博弈答案

博弈答案

1.阐述什么是囚徒困境。

对于个人理性与集体理性的矛盾,新古典经济学与博弈论有什么不同的主张?答:两个共谋犯罪的人被关入监狱,不能互相沟通情况。

如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。

由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。

新古典经济学认为个人或者集体的矛盾可以通关过价格解决,博弈论强调个人理性和集体理性是冲突的,设计一种制度解决。

2. 社会福利博弈流浪汉 寻找工作 游荡救 济政府 不救济答:假设政府的混合战略为(,1)G σθθ-(即以θ的概率选择救济,以1-θ 的概率选择不救济),流浪汉的混合战略为(,1)Lσγγ=-(以γ的概率选择工作,以1-γ的概率选择游荡)。

那么政府的期望效用为[][](,)3(1)(1)(1)0(1)(51)G G L u σσθγγθγγθγγ=+--+--+-=-- 求导,令其为0,求出0.2γ=*即流浪汉以0.2的概率寻找工作,以0.8的概率游荡。

为了寻找政府的混合战略,考虑浪浪汉的最优化问题。

给定(,1),(,1)G L σθθσγλ=-=-流浪汉的期望效用为[][]21(1)(1)30(1)(21)3L u γθθγθθγθθ=+⋅-+-+⋅-=--+求导,令其为0,得到0.5θ=*政府以0.5的概率救济,以0.5的概率不救济。

3下面的两人博弈可以解释为两个寡头企业的价格竞争博弈,其中p 是企业1的价格,q 是企业2的价格。

企业1的利润函数是:π1=-(p-aq+c)2+q 企业2的利润函数是: π2=-(q-b)2+p 求解: (1) 两个企业同时决策时的(纯战略)纳什均衡 (2) 企业1先决策时的子博弈精炼纳什均衡 (3) 企业2先决策时的子博弈精炼纳什均衡(4) 是否存在某些参数值(a,b,c),使得每一个企业都希望自己先决策?解: (1) 根据两个企业的利润函数,得各自的反应函数为:求解得纳什均衡:(2) 企业1先决策根据逆推归纳法,先求企业2的反应函数()caq p c aq p p-=⇒=+--=∂∂021π()b q b q q=⇒=--=∂∂022πbq c ab p =-=()b q b q q=⇒=--=∂∂022π代入企业1的利润函数,得再求企业1的反应函数,得(3) 企业2先决策根据逆推归纳法,先求企业1的反应函数代入企业2的利润函数得 再求企业2的反应函数,得再代入企业1的反应函数,得(4) 因为只有先决策的利润大于后决策的利润时企业才希望先决策,因此得两个企业都希望先决策的条件为4.长度为1的线性城市,消费者在[0,1]上均匀分布,分布密度为1。

博弈与决策作业答案).doc

博弈与决策作业答案).doc

博弈与决策平时作业参考答案(2)一、名词解释1.不确定性:就是指经济行为者在爭先不能准确地知道口己的某种决策的结果,或者说,只要经济行为主体的一种决策的可能结果不止一种,就会产生不确定性。

2.最大期望收益法:就是在事件结果不确定的情况下,应该选择给他带来“期望收益”最人的策略。

3.混合策略:如果在每个给定信息下,参与者只能以某种概率选择不同地策略,就称为混合策略。

4.支付均等法:当一个参与者在均衡屮应用一个混合策略时,他所得到的支付必须与他在混合策略屮所应用的每一个纯策略的支付相同。

5.子博弈:如杲从第一阶段以外的某个阶段开始的后续博弈阶段,也有初始信息集,具备进行博弈所需要的各种信息,能够自成一个博弈,我们就将这个博弈阶段称为原动态博弈的一个“子博弈”。

6.逆向归纳法:从最后一个阶段或最后一个子博弈开始逆推上去,逐步向前倒推以求解动态博弈均衡,这就是逆向归纳法。

7.承诺:就是对愿意与你合作的人给予回报的方式。

8.空洞威胁:当发出威胁的博弈参与者选择威胁所宣称的行动策略时,对自己并没冇好处,这就不町信了,这叫做“空洞威胁”。

二、请用最大期望收益法寻找最优策略。

要求:(1)写出计算步骤;(2)给出蝕优的策略结果。

甲乙两家企业,为了市场份额的争夺,在价格定制问题上各有两种纯策略,如图2-1所示。

两家企业都知道口己在各个策略组合下的收益悄况,但绘并不知道対方的收益。

假设甲釆取U的概率为0.3,乙采取/?的概率为0.6o答:(1)当乙采取策略的可能性为0.6时,采取厶策略的可能性为0.4,那么甲据此判断采取自己的策略(/时所获得的可能的期望收益E(7(C/)=0.6x2+0.4x3=2.4。

甲釆取口己的策略D时所获得的可能的期望收益E(/(D)=0.6x4+0.4xl=2.8o很显然,甲应该选杼策略Q,因为EU(D)> EUS(2)当甲釆取(/策略的可能性为0.3时,采取Q策略的可能性为0.7,那么乙据此判断采取自己的策略厶时所获得的可能的期望收益E(/(L)=0.3xl+0.7x4=3.1 o乙采取自己的策略R时所获得的可能的期望收益E(/(7?)=0.3x4+0.7x2=2.6o很显然,乙应该选择策略厶,因为EU(L)> EU(R)。

博弈与决策测验答案

博弈与决策测验答案

测验一题目1博弈当中通常包括下面的内容,除了()。

正确的答案是:支付题目2题目3题目4题目5题目6题目7题目8题目9题目10题目11题目12题目13题目14题目15题目16题目17题目18题目19题目20题目21题目22题目23题目24题目25测验二题目2题目3题目4题目5题目6题目7题目8题目9题目1011题目12题目13题目14题目15题目16题目17题目18题目19题目20题目2122题目23题目24题目25测试三题目1题目2题目3题目4题目5题目67题目8KMRW声誉模型的提出者是美国经济学家曼柯?奥尔逊。

正确的答案是“错”。

题目9题目10声誉模型表明,博弈参与者具有外生的合作倾向。

正确的答案是“错”。

题目11题目12题目13题目14题目15题目16题目17题目18题目19题目20题目21题目22题目23题目24题目25测试四题目1题目2题目3题目4题目5题目6题目7题目8题目9题目10题目11题目12题目13题目14委托人提供一个合约,让代理人在努力工作时所获得的收益大于不努力工作时的收益,这就是激励相容约束。

正确的答案是“对”。

题目15题目16题目17题目18题目19题目20题目21题目22题目23题目24题目25如果一个企业设定了一系列岗位应聘条件,求职者根据这些条件,并针对自己的能力大小判断自己是否符合岗位要求,这就属于(? ? ? ?)问题。

正确答案是:信号筛选。

博弈论练习题2答案

博弈论练习题2答案

博弈论练习题(四)一、什么是子博弈精炼纳什均衡?答:将纳什均衡中包含的不可置信的威胁策略剔除出去。

它要求参与者的决策在任何时点上都是最优的。

由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。

只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。

或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。

二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么?答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。

除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。

即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。

作为博弈论的基础,交互理性是其基本的理性要求。

博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以与各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。

也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。

理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。

因此说,参与者理性问题对动态博弈的分析影响更大。

三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题:(1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。

战略博弈习题答案

战略博弈习题答案

战略博弈习题答案战略博弈习题答案战略博弈是一种通过推演和思考来制定最优决策的过程。

在这个过程中,我们需要分析各种可能的情况和对手的行为,以制定最佳的策略。

下面将给出几个战略博弈习题的答案,希望能够帮助读者更好地理解和应用战略博弈的原理。

习题一:囚徒困境在囚徒困境中,两个囚徒面临合作与背叛的选择。

如果两个囚徒都选择合作,则每个人都会获得较轻的刑罚;如果两个囚徒都选择背叛,则每个人都会获得较重的刑罚;如果一个囚徒选择合作而另一个囚徒选择背叛,则合作的囚徒将会受到极重的刑罚,而背叛的囚徒将会获得较轻的刑罚。

答案:在囚徒困境中,最稳定的策略是背叛。

因为无论对方选择合作还是背叛,背叛都能够保证自己获得较轻的刑罚。

这是一个典型的非合作博弈,每个囚徒都会选择背叛,因为他们无法相信对方会选择合作。

习题二:博弈论中的狼羊菜问题在一个河边,有一只狼、一只羊和一堆菜。

现在农夫要将它们一只一只地运到河对岸,但是他只能带一样东西过河。

而且,如果农夫不在场时,狼会吃羊,羊会吃菜。

答案:农夫首先带羊过河,然后回来自己过河,然后带狼过河,但是农夫带狼过河后,要把狼放在对岸,然后回到河这边,再带羊过河,最后带菜过河。

这样可以确保在任何时候都不会有狼吃羊或羊吃菜的情况发生。

习题三:拍卖策略在拍卖中,不同的竞拍者会根据自己的估价来决定出价。

最终,出价最高的竞拍者将赢得物品,并支付自己的出价。

答案:在拍卖中,最理性的策略是出价等于自己对物品的估价。

这样可以最大程度地保证自己以最低的价格赢得物品。

然而,在实际拍卖中,竞拍者还需要考虑其他竞拍者的行为,以及拍卖的规则和策略。

因此,拍卖策略的制定需要综合考虑多种因素。

总结:战略博弈是一个复杂而有趣的领域,它涉及到许多数学和逻辑原理。

在解决战略博弈问题时,我们需要深入分析各种可能的情况和对手的行为,以制定最佳的策略。

本文给出了几个常见的战略博弈习题的答案,希望能够帮助读者更好地理解和应用战略博弈的原理。

博弈论习题和参考答案与解析

博弈论习题和参考答案与解析

博弈论?习题一、单项选择题1.博弈论中,局中人从一个博弈中得至口的结果常被称为〔〕. A?效用B.支付C.决策D.利润2.博弈中通常包括下面的内容,除了〔〕.A.局中人B.占优战略均衡C策略D?支付3.在具有占优战略均衡的囚徒困境博弈中〔〕.A.只有一个囚徒会坦白氏两个囚徒都没有坦白C?两个囚徒都会坦白D.任何坦白都被法庭否决了4.在屡次重复的双头博弈中,每一个博弈者努力〔〕.A.使行业的总利润到达最大B?使另一个博弈者的利润最小C?使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是〔〕A.策略组合B.策略C信息D.行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最正确行为,此时的博弈具有〔〕0A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D?激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为〔〕.A.一报还一报的策略B.激发策略8.在囚徒困境的博弈中,合作策略会导致〔〕oA博弈双方都获胜B博弈双方都失败C使得先米取行动者获胜D使得后米取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现〔〕oA.当一个垄断竞争行业是由一个主导企业限制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D.当一个寡头行业进行一次博弈时一个企业米取的彳丁为10.与另一个企业在前一阶段采取的行为一致〞这种策略是一种〔〕A.主导策略B.激发策略C.一报还一报策略D.主导策略11-关于策略式博弈,正确的说法是〔〕0A.策略式博弈无法刻划动态博弈B.策略式博弈无法说明行动顺序C.策略式博弈更容易求解D.策略式博弈就是一个支付矩阵12.以下关于策略的表达哪个是错误的〔〕:A.策略是局中人选择的一套行动方案;B.参与博弈的每一个局中人都有假设干个策略;C.一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D.策略与行动是两个不同的概念,策略是行动的规那么,而不是行动本身.13.囚徒困境说明〔〕:A.双方都独立依照自己的利益行事,那么双方不能得到最好的结果;B.如果没有某种约束,局中人也可在〔抵赖,抵赖〕的根底上到达均衡;C.双方都依照自己的利益行事,结果一方赢,一方输;D.每个局中人在做决策时,不需考虑对手的反响14.一个博弈中,直接决定局中人损益的因素是〔〕:A.策略组合B.策略C信息D.行动15.动态博弈参与者在关于博弈过程的信息方面是〔〕A不对称的B对称的C不确定的D无序的16.古诺模型表达了寡头企业的〔〕决策模型A本钱B价格C产量D质量17.伯特兰德模型表达了寡头企业〔〕决策模型.A本钱价格C产量 D 质量18.用囚徒困境来说明两个寡头企业的情况,说明了:〔〕A、每个企业在做决策时,不需考虑竞争对手的反响E. 一个企业制定的价格对其它企业没有影响C、企业为了预防最差的结果,将不能得到更好的结果D、一个企业制定的产量对其它企业的产量没有影响19.子博弈精炼纳什均衡〔〕:A.是一个一般意义上的纳什均衡;B.和纳什均衡没有什么关系;C.要求某一策略组合在每一个子博弈上都构成一个纳什均衡;D.要求某一策略组合在原博弈上都构成一个纳什均衡.20.在一般产品销售市场上,以下哪种原因导致了逆向选择.〔〕A产品质量的不确定性B私人信息C公共信息D产品价格21.完全信息动态博弈参与者的行动是〔〕A无序的B有先后顺序的C不确定的D因环境改变的22.市场交易中普遍存在的讨价还价属于哪种博弈.〔〕A完全信息静态博弈B完全信息动态博弈C不完全信息静态博弈D不完全信息动态博弈23.下面哪种模型是一种动态的寡头市场博弈模型〔〕A古诺模型B伯川德模型C斯塔克尔伯格模型D田忌齐威王赛马24?博弈方根据一组选定的在两种或两种以上可能行为中随机选择的策略为血玄〔、A纯策略B混合策略C激发策略D 一报还一报策略25.影响重复博弈均衡结果的主要因素是〔〕A博弈重复的次数B信息的完备性C支付的大小DA和B26.在动态博弈战略行动中,只有当局中人从实施某一威胁所能获得的总收益()不实施该威胁所获得的总收益时,该威胁才是可信的.A大于B等于C小于D以上都有可能二、判断正误并简要说明理由I,纳什均衡一定是上策均衡,上策均衡一定是纳什均衡.2?在一个博弈中博弈方可以有很多个.3.在一个博弈中只可能存在一个纳什均衡.4.由于零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈.5.在一个博弈中如果存在多个纳什均衡那么不存在上策均衡.6.曲于两个罪犯只打算犯罪一次〞所以被捕后才出现了不合作的问题即囚徒困境.但如果他们打算重复合伙屡次,比方说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供.7,在博弈中纳什均衡是博弈双方能获得的最好结果.8.在博弈中如果某博弈方改变策略后得益增加那么另一博弈方得益减少.9,纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合.10.囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是由于两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长.11.斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润.12.在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系〞使重复博弈无法实现更高效率均衡的关键问题.13.子博弈精炼纳什均衡不是一个纳什均衡.14.零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡.15.原博弈惟一的纳什均衡本身是帕雷托效率意义上最正确战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别.16.在动态博弈中,由于后行动的博弈方可以先观察对方行为后再选择行为 ,因此总是有利的.入计算与分析题1、A、B两企业利用广告进行竞争.假设A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;假设A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;假设A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;假设A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润.〔,〕画出A、B两企业的损益矩阵.〔2 〕求纯策略纳什均衡.2、可口可乐与百事可乐〔参与者〕的价格决策:双方都可以保持价格不变或者提升价格〔策略〕;博弈的目标和得失情况表达为利润的多少〔收益〕;利润的大小取决于双方的策略组合〔收益函数〕;博弈有四种策略组合,其结局是:〔1〕双方都不涨价,各得利润10单位;〔2 〕可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30 ;(3 )可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30 ;(4 )双方都涨价,可口可乐利润140,百事可乐利润35 ;画出两企业的损益矩阵求纳什均衡.3、假定某博弈的报酬矩阵如下:(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>?(2 )如果(上,左)是纳什均衡,上述哪几个不等式必须满足4、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场.如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元.如果一方在价格决策方面选择合作而另一方却选择降低价格,那么合作的厂商获利将为零,竞争厂商将获利900000元.(1)将这一市场用囚徒困境的博弈加以表示.(2 )解释为什么均衡结果可能是两家公司都选择竞争性策略.5、博弈的收益矩阵如下表:⑴如果(上/左)是占优策略均衡/那么a、b、c、d、G、f、g、h之间必然满足哪些关系〔尽量把所有必要的关系式都写出来〕〔2 〕如果〔上,左〕是纳什均衡,那么〔1〕中的关系式哪些必须满足〔3 〕如果〔上,左〕是上策均衡,那么它是否必定是纳什均衡为什么〔4 〕在什么情况下,纯策略纳什均衡不存在6、猪圈里有一头大猪和_头小猪,猪圈的一头有一个饲料槽,另一头装有限制饲料供给的按钮.按一下按钮就会有,0个单位饲料进槽,但谁按谁就要付出2个单位的本钱.谁去按按纽那么谁后到;都去按那么同时到.假设大猪先到,大猪吃到9个单位,小猪吃到一个单位;假设同时到,大猪吃7个单位,小猪吃3个单位;假设小猪先到,大猪吃六个单位,小猪吃4个单位.求〔1〕各种情况组合扣除本钱后的支付矩阵〔2 〕求纳什均衡.7、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润〔单位:万元〕由以下图的得益矩阵给出:1〕有哪些结果是纳什均衡(2 )两厂商合作的结果是什么8、求出以下博弈的所有纯策略纳什均衡.9、求出下面博弈的纳什均衡(含纯策略和混合10、根据两人博弈的损益绸邛仲I答问题:(1) ◎出两人各自的金部策略.图示均衡点.(2 )求出斯塔克博格rstackelberg )均衡情况下的产量、价格和利润.(3)说明导致上述两种均衡结果差异的原因.13.下面的得益矩阵两博弈方之间的一个静态博弈,该博弈有没有纯策略的纳什均衡,博弈的结果是什么14.两个兄弟分一块冰激凌.哥哥先提出一个分割比例 ,弟弟可以接受或拒绝,接受那么按哥哥的提议分割,假设拒绝就自己提出一个比例.但这时候冰激凌已化得只剩1/2 了,对弟弟提议的比例哥哥也可以接受或拒绝,假设接受那么按弟弟的建议分割,假设拒绝冰激凌会全部化光.由于兄弟之间不应该做损人不利己的是“因此我们假设接受和拒绝利益相同时兄弟俩都会接受.求该博弈的子博弈完美纳什均衡.15?如果学生在测试之前全面复习,考好的概率为90%,如果学生只复习一局部重点,那么有50% 的概率考好.全面复习花费的时间tl = 100小时,重点复习之需要花费t2=20小时.学生的效用函数为:U二W-2巳其中W是测试成绩,有上下两种分数Wh和Wl, e为努力学习的时间.问老师如何才能促使学生全面复习16?在以下监工与工人之间的博弈中,试用划线法分析该博弈有无纯策略纳什均衡;如果没有,那么写出混合策略纳什均衡的结果.监工17 ?求解以下博弈的纳什均衡.博弈方29 18 ?某人正在打一场官司,不请律师肯定会输,请律师后的结果与律师的努力程度有关.假设当律师努力工作〔100小时〕时有50%的概率能赢,律师不努力工作<10小时〕那么只有15%的概率能赢.如果诉讼获胜可得到250万元赔偿,失败那么没有赔偿.由于委托方无法监督律师的工作,因此双方约定根据结果付费,赢官司律师可获赔偿金额的10%,失败那么律师一分钱也得不到.如果律师的效用函数为m 0.05e,其中m是报酬e是努力小时数,且律师有时机本钱5万元.求这个博弈的均衡.四、论述题Is解释"囚犯困境;并举商业案例说明.2、用〃小偷与守卫的博弈"说明〃鼓励〔监管〕悖论"博弈论?习题参考答案>单项选择题r 5 B. B. C.D ' A.11 15. B. C. A.6 10 C. A. A.D. C.16 20 C. B. C.21 26. B. B. C. B. D. A.,判断正误并简要说明理由1. F 上策均衡是比纳什均衡更严格的均衡.所以上策均衡一定是纳什均衡 一定是上策均衡,2. T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈3. IF 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在多个纳什均衡4. T 零和博弈才旨参与博弈各方在严格竞争下,一方收益等于另一方损失与损失之和恒为零,所以双方不存在合作可能性而纳什均衡不 ,如性别战.,博弈各方收益 ,只能有一个5.T上策均衡是通过严格下策消去法〔重复剔除下策〕所得到的占优策略纳什均衡6.IF只要两囚犯只打算合作有限次,其最优策略均为招供.比方最后一次合谋,两小偷被抓住了,由于将来没有合作时机了,最优策略均为招供.回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢.依此类推,对于有限次内的任何一次,两小偷均不可能合作.7.F纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的.团F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.T虽然斯塔格伯格模型各方利润总和小于古诺模型〞但是领导者的利润比古诺模型时12..T无限次重复博弈没有结束重复确实定时间;而在有限次重复博弈中,存在最后一次重复,并且正是有结束重复确实定时间,使重复博弈无法实现更高效率均衡.13.F子博弈精炼纳什均衡一定是一个纳什均衡.14.F零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡.15.T原博弈惟一的纳什均衡本身是帕雷托效率意义上最正确战略组合,因此不管是重复有限次还是无限次,不会和一次性博弈有区别.16.F动态博弈是指各博弈方的选择和行动又先后次序的博弈.动态博弈的信息盯以是不对称的.所以策略分为先发制人和.斯塔克伯格博弈揭示“先发制人〞更有禾L而"后发制人"后行动的博弈方可以先观察对方行为后再选择行为反而处于不利境地.三、计算与分析题Is (1)(2)纯策略纳什均衡为(做广告,做广告),(不做广告,不做广告)得长价-20, 30140,35纳什均衡〔不涨价,不涨价〕,〔涨价,涨价〕.从帕累托均衡角度,为〔涨价,涨价〕3、〔 1〕如果〔上/左〕是上策均衡,那么,a>e b>d, g<c, f>h 〔2 〕如果〔上〕左〕是纳什均衡,a>e b>d,不等式必须满足新华航空北方航空 合作竞争50, 50 90, 00, 90 6, 65、 略纳什均衡为〔按,等〕 7、略8、纯策略纳什均衡〔氏甲〕,〔⑴不存在纯策略纳什均衡合作肓争⑵设甲选择"U"的概率为概率为1-P1乙选择"『的概率为P2,贝V选择" R" 的概率为1-P2对甲而言,最正确策略是按定的概率选〃上"和‘下’,使乙选择“左〃和〃右"的期望值相等即PI*8+ (l-PI) *0-P1*1+ (1-P1) *5解得PI = 5/12即⑸12, 7/12 )按5/12概率选〃上“、7/12概率选〃下"为甲的混合策略Nash均衡对乙而言,最正确策略是按一定的概率选“左“和“右",使乙选择〃上"和‘下’的期望值相等即P2*5+(l-P2)*0- P2*2 + (l-P2)*4即(4/7, 3/7肢4/7概率选‘左’、3/7概率选"右"为乙的混合策略Nash均衡10、略.11、见笔记12、见笔记.13、首先,运用严格下策反复消去法的思想,不难发现在博弈方1的策略中,B是相对于T的严格下策.把博弈方1的B策略消去后又可以发现,博弈方2的策略中C是相对于R的严格下策,从而也可以消去.两个博弈方各消去一个策略后的博弈是如下的两人2X 2博弈,己经不存在任何严格下策.再运用划线或箭头法,很容易发现这个2X2博弈有两个纯策略纳什均衡(M,L )和(1R ) 0由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系,一次性静态博弈的结果不能肯定.由于双方在该博弈中可能采取混合策略,因此实际上该博弈的结果可以是4个纯策略组合中的任何一个.14.假设哥的方案是SI: 1-S1淇中S1是自己的份额,弟的方案是S2: 1-S2, S2是哥的份额,那么可用如下的扩展形表示该博弈:Hi SiC5V2eS? 2)CO O)运用逆推归纳法先分析最后一阶段哥的选择.由于只要接受的利益不少于不接受的利益哥就会接受,因此在这个阶段只要弟的方案满足S2/2 $0,也就是S2$0,哥就会接受,否那么不会接受.由于冰激凌的份额不可能是负数,也就是说由于哥不接受弟的方案冰激凌会全部化掉〞因此任何方案哥都会接受.现在回到前一阶段弟的选择.由于弟知道后一阶段哥的选择方法,因此知道如果不接受前一阶段哥提出的比例,自己可以取S2=0,独享此时还未化掉的1/2块冰激凌;如果选择接受前一阶段哥的提议,那么自己将得到出1,显然只要l-Sn/2 ,即S1W1/2,弟就会接受哥的提议.再回到第一阶段哥的选择.哥清楚后两个阶段双方的选择逻辑和结果 ,因此他在这一阶段选择Sl = 1/2,正是能够被弟接受的自己的最大限度份额,超过这个份额将什么都不能得到,因此SI二1/2是最正确选择.综上,该博弈的子博弈完美纳什均衡是:哥哥开始时就提议按(1/2J/2)分割,弟弟接受.15.此题中老帅的调控于段高分和低分的差距.该博弈的扩•展形如下:只有当Ul» U2时学生才会选择全面复习.根据Ul» U2我们可以算出Wh- WD 400o这就是老师能有效全面复习需要满足的条件.其实在奖学金与成绩挂钩时,Wh- W1也可以理解成不同等奖学金的差额.16泄有纯策略均衡,只有混合策略均衡((0. 25,0.75 ),(0. 5,0. 5 ))17. 可以根据画线法求得有唯一纯策略均衡(上,左)18.参见第15题四、论述题1、解释〃囚犯困境〃,并举商业案例说明.(1)假设条件举例:两囚徒被指控是一宗罪案的同案犯.他们被分别关在不同的牢房无法互通信息.各囚徒都被要求坦白罪行.如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年.(2)囚徒困境的策略矩阵表.每个囚徒都有两种策略:坦白或不坦白.表中的数字分别代表囚徒甲和乙的得益.囚徒乙3〕分析:通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都〃坦白〃.给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白.这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不管对方如何选择,个人的最优选择是坦白.其结果是双方都坦白.4〕商业案例:寡头垄断厂商经常发现它们自己处于一种囚徒的困境.当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润.但卡特尔协定不是一个纳什均衡,由于给尢双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润.2用〞小偷与守卫的博弈〃说明〃鼓励〔监管〕悖论〃.〔1〕假设条件举例:偷窃和预防偷窃是小偷和门卫之间进行博弈的一场游戏.门卫可以不睡觉,或者睡觉.小偷可以采取偷、不偷两种策略.如果小偷知道门卫睡觉, 他的最正确选择就是偷;如果门卫不睡觉,他最好还是不偷.对于门卫,如果他知道小偷想偷,他的最正确选择是不睡觉,如果小偷采取不偷,自己最好去睡觉.〔2 〕小偷与门卫的支付矩阵表〔假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住〕:。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

测验一
题目1
博弈当中通常包括下面的内容,除了()。

正确的答案是:支付
题目2
题目3
题目4
题目5
题目6
题目7
题目8
题目9
题目10
正确的答案是:国防题目11
题目12
题目13
题目14
题目15
题目16
题目17
题目18
题目19
题目20
题目21
题目22
题目23
题目24
题目25
测验二
题目2
题目3
题目4
题目5
题目6
题目7
题目8
题目9
题目10
题目11
题目12
题目13
题目14
题目15
题目16
题目17
题目18
题目19
题目20
题目21
题目22
题目23
题目24
题目25
测试三题目1
题目2
题目3
题目4
题目5
题目6
题目7
题目8
KMRW声誉模型的提出者是美国经济学家曼柯•奥尔逊。

正确的答案是“错”。

题目9
题目10
声誉模型表明,博弈参与者具有外生的合作倾向。

正确的答案是“错”。

题目11
题目12
题目13
题目14
题目15
题目16
题目17
题目18
题目19
题目20
题目21
题目22
题目23
题目24
题目25
测试四题目1
题目2
题目3
题目4
正确的答案是“错”。

题目5
题目6
题目7
题目8
题目9
题目10
题目11
题目12
题目13
题目14
委托人提供一个合约,让代理人在努力工作时所获得的收益大于不努力工作时的收益,这就是激励相容约束。

正确的答案是“对”。

题目15
题目16
题目17
题目18
题目19
题目20
题目21
题目22
题目23
题目24
题目25
如果一个企业设定了一系列岗位应聘条件,求职者根据这些条件,并针对自己的能力大小判断自己是否符合岗位要求,这就属于()问题。

正确答案是:信号筛选。

相关文档
最新文档