策略博弈习题部分解答

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论与政治第三小组作业

第二章名词解释:

1、理性行为(rational behavior):参与人精于算计并严格按照其最优策略行事。其中理性有两个重要的内涵:一个人对自己的利益完全了解,并能完美地计算出何种行动可以最大化其利益。

2、不完美信息(imperfect information):在博弈的每一个行动时点上,参与人可能无法获悉决策所需的全部信息。这包括相关的外部环境——比如天气——的不确定性,以及对方先前或当前的行动。这类情况称为不完美信息。

3、不完全信息(incomplete information):当一个参与人比另一个参与人了解更多信息时,阴谋诡计就会产生。这类情况称为不完全信息。

4、合作博弈(cooperative game):博弈论使用两个专门术语来区分协议具有强制力和不具有强制力的情况。若协议对参与人行为具有强制力,则称此类博弈为合作博弈。

5、非合作博弈(noncooperate game):个体参与人可根据其利益采取行动,则称此类博弈为非合作博弈。

第三章名词解释:

1、中间评估函数(intermediate valuation function):赋予非终点结支付的规则被称为中间评估函数。

2、先动优势(firstmover advantage):在博弈的过程中先做决策带来的优势。先动优势来自于将其自身置于一个优势地位以及迫使其他参与人接受它的承诺能力。

后动优势(second-mover advantage):在博弈的过程中后做决策带来的优势。后动优势源于自己可对他人选择做出的灵活性。

第四章名词解释:

1、占优策略(dominant strategy)、劣策略(dominated strategy):

每一个博弈中的参与者通常都拥有不止一个竞争策略,其所有策略的集合构成了该企业的策略集。在参与者各自的策略集中,如果存在一个与其他竞争对手可能采取的策略无关的最优选择,则称其为占优策略(Dominant Strategy),与之相对的其他策略则为劣势策略。

占优策略是博弈论(game theory)中的专业术语,所谓的占优策略就是指无论竞争对手如何反应都属于本企业最佳选择的竞争策略。

2、占优可解(dominance solvable):

在规模较大的博弈中,或许没有单个策略占优于其他所有的策略,但可能也存在一些策略劣于其他某些策略。如果参与人发现自己处于这样一种博弈中,他

们可以通过将劣策略从可选策略中剔除的办法求得均衡。剔除劣策略缩小了博弈的规模,得到的“新”的博弈又可能出现对于同一个参与人或其他参与人而言的另外一些劣策略,进而又可以继续剔除这些劣策略;或者在“新”的博弈中,某个参与人存在占优策略。重复剔除劣策略的过程可以剔除劣策略或缩小博弈的规模,直到不能进一步剔除为止。如果这个过程最后只剩下一个唯一的结果,那么这个博弈就被称为占优可解。

3、聚点(focal point):

参与人得以成功协调所依赖的这种共同预期策略称为聚点。

4、预期收敛(convergence of expectation):

如果参与人在博弈中具备的共同认识,那么他们关于行动的预期会收敛到一个平衡点,即预期收敛。

5、零和博弈(zero-sum game)

在一些博弈中,博弈双方的利益是完全相对的。对参与人的每个策略组合而言,一个参与人的支付就是另一个人支付的相反数,我们称这种博弈为零和博弈。

6、纳什均衡(Nash equilibrium)

纳什均衡可以定义为这昂的一种策略组合:其中每个参与人的策略都是对其他人的策略的最优反应。

或者有这样一个策略组合,每个参与人都选择了一个相应的策略,并且具备如下性质:(1)每个参与人都对其他参与人的策略有正确的信念;(2)给定每个参与人关于其他参与人策略的信念,自己所选择的策略是最优的。

第五章名词解释:

1、最优反应曲线(best-response curves):列出收益函数后,求导得到的函数所对应的曲线即为最优反应曲线。

2、最优反应原则(best-response rule):最大化其支付的最优定价的集合就是最优反应原则。

5. 第二章作业题

1

(a)这是一个博弈。因为不同口味的酸乳酪可能会给这些杂货店老板带来不同的收益。

(b)这是一个博弈。因为如果这两个少女考虑到对方在舞会时要穿的衣服来选择自己要穿什么衣服才会让自己更加有利。比如避免出现两个人穿同样衣服的情况出现。

(c)这是一个决策。因为这位大学生在做出选择的时候不用考虑到他人的反应。(d)这是一个博弈。因为微软和网景公司在作出定价的时候都要考虑到对方的

反应对自己的影响。

(e )这是一个决策。因为这位州长候选人只需按照自己的意愿去选择自己的竞选搭档即可,不必考虑到其他人的反应对自己的决策带来的影响。

4

(a )预期支付=0.5*20+0.1*50+0.4*0=15(元)

(b )预期支付=0.5*50+0.5*0=25(元)

(c )预期支付=0.8*0+0.1*50+0.1*20=7(元)

第三章作业题

1

决策结:

2个

终点结:6个 决策结:3个 终点结:9个

(c

决策结:4个Array终点结:8个

2

解:(a)s方向,即(1,0)

(b)s-u方向,即(3,3,3,)

(c)s-n-S-n-N方向,即(4,5)

4

解:错,在序贯行动博弈中,先手不一定会获胜。因为在序贯行动博弈中,不单会有先动优势,使得对手被迫做出次一级的选择;同时也存在后动优势,即可以依据别人的选择做出相应的反应,具有灵活性。比如,如果猜拳变成序贯行动博弈的话,那么,一定是后动的人有绝对优势。

5

解:有博弈树得到均衡点为(3,3),即波音公司采用和平竞争,而空中客车参与

竞争。

相关文档
最新文档