博弈论复习题及答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、名词解释(每题7分,共28分)
1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。
2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。
3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。
4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。
5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。
二、简要回答问题(每题10分,共40分)
1、博弈的基本要素有哪些?基本特点是什么?
答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。
2、什么是性别战博弈?请求出其中的纳什均衡?
答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。
3、猎鹿博弈反映的基本思想是什么?
答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。
4、什么是道德风险?有什么办法可以解决道德风险问题? 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。
三、计算题(16分)
1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。
F 2 B 2 F 1
B 1 答:根据上方的矩阵图,我们可得出其博弈中存在两种策略的纳什均衡:分别是H 选择F1和N 选择F2,以及H 选择B1和N 选择B2
N H
2、A、B两者博弈:A首先行动,可以选择“左”或者“右”的行动;B后行动,有“L”和“R”的行动,其收益如下:当A选左,B选L时,A的收益为2 ,B的收益为3;当A 选左,B选R时,A的收益为1 ,B的收益为4;当A选右,B选L时,A的收益为3 ,B的收益为1;当A选右,B选R时,A的收益为0 ,B的收益为2。请画出该博弈的博弈树,并求出该博弈的均衡解。
四、论述题(16分)
1、请结合你的工作或生活,谈谈对行动的可信性的理解,有什么方法可以建立可信的策略行动。
答:每一种策略性行动都面临着可信性的问题,人们不一定相信策略性行动的提出者会实施其行动。因此提出者必须做一些辅助工作让人相信他会在第二阶段实施他已宣布的事。
比如,工作中管理者对员工上班时间玩游戏的态度有所不同。一些管理者对员工很宽容,并不惩罚玩游戏的员工。另一些管理者则十分严厉,会处罚玩游戏的员工。一些管理者虽然说了会处罚的承诺,但禁不住员工的好话及其它员工的求情,就原谅了员工。从博弈论角度分析,假设三种管理者手下的员工各方面都相同,哪一种管理者将得到最高的支付呢?管理者对玩游戏的态度可以是“处罚”或“原谅”,员工可以“玩游戏”或“不玩游戏”,如下表所示:
管理者并不希望自己不近人情,故他们最好的结果就是(4,3),最不好的结果就是(1,1);余下的两个策略,因管理者希望员工不玩游戏,故(3,2)好于(2,4)。员工最喜欢(4,3),最不好的结果也是(1,1),余下的,员工(2,4)好于(3,2)。在此博弈中,若同时行动,或者是管理者后行动,与处罚带来的1和3的支付相比,原谅能带来2和4,是占优策略。此时,员工则会选择玩游戏。最终,均衡的结果是(2,4)。而如果管理者一开始就承诺“处罚”的话,员工会发现不玩游戏会更好,于是管理者得到了支付3。但是如果有员工曾被管理者原谅,可能他就会认为管理者心软,不相信管理者做出的“处罚”承诺,从而玩游戏。此时,就会得到一个最坏的结果,即(处罚,玩游戏),其支付仅为(1,1)。
通过采取某种行动,改变博弈以得到更好的结果,这就是策略行动。策略行动分:承诺、威胁及许诺。这三种策略性行动最重要的,是必须让博弈的其他参与人相信策略性行动的提出者在第二阶段中确实会做其在第一阶段中宣布的事。而在此每一种策略行动都面临着可信性的问题,人们不一定相信策略行动的提出者会实施其行动。因此仅仅宣布是不够的。在第一阶段,提出者必须做一些辅助工作让人相信其会在第二阶段做已宣布的事。上述博弈中涉及的是管理者对玩游戏员工“处罚”态度的承诺。在这个事件中,管理者为了从策略行动中获得好处,他所做的承诺不能和同时行动博弈的均衡策略一样,因此管理者选择了“处罚”的承诺,
这个策略行动改变了员工的期望和行动。一旦员工相信这种承诺,则他们会不玩游戏,从而得到(3,2)的支付。如果员工们尝试玩一次游戏,管理者可能会原谅他们,理由是“只此一次”,这里就存在了使策略性行动不付诸实践的诱惑,使得承诺的可信性下降。如果最终员工不再相信“处罚”的承诺,则他们会玩游戏,从而最终管理者和员工只得到(1,1)的支付,双方利益均受损。这就是管理者铁石心肠的原因。因为他清楚破例原谅员工一次的危险性。因此,管理者需要做一些事情来确立他策略行动的可信性,即让其他参与人相信他们的行动如违背你的承诺,你将一定会付诸实践,而不会因人情等引诱而放弃。避免危险的办法通常只有一个,那就是绝不越雷池半步。并且管理者们需要找到某些方法使其的拒绝合理可信,同时提高其策略行动的可信性。第一、通过减少未来行动的自由,排除引诱行动,只能实施策略行动中所确定的行动。例如,管理者可以拿规章制度或工作纪律做挡箭牌,这些制度纪律一旦制定则个别管理者就不能在任何特殊情况下破例。这样做,就等于将“原谅”行动从他们的选择组合中剔除了,因此他只能实施“处罚”的承诺。规则的存在让员工相信管理者不可能再改变想法,所以此时管理者“处罚”的承诺就是可信的了。第二、改变未来的支付,减少引诱行动的支付使实施策略行动成为最佳行动。管理者可以通过几次毫不让步的处罚建立起严厉的声誉,虽然毫不让步的处罚可能不是一件愉快的事,也可能违背管理者的本意,但这在漫长的工作生涯中是有好处的。因为如果一个管理者被认为非常严厉,就没有员工想用借口搪塞他,而他也