博弈论考题

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论考题

一、囚徒困境

概念来源：囚徒困境的故事讲的是，两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。警察告诉每个人：如果两人都抵赖，各判刑一年；如果两人都坦白，各判八年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。于是，每个囚徒都面临两种选择：坦白或抵赖。然而，不管同伙选择什么，每个囚徒的最优选择是坦白：如果同伙抵赖、自己坦白的话放出去，不坦白的话判一年，坦白比不坦白好；如果同伙坦白、自己坦白的话判八年，不坦白的话判十年，坦白还是比不坦白好。结果，两个嫌疑犯都选择坦白，各判刑八年。如果两人都抵赖，各判一年，显然这个结果好。但这个帕累托改进办不到，因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是，人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。

解说：如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。

囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：

若对方沉默时，背叛会让我获释，所以会选择背叛。

若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。

二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑8年。

这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑1年，总体利益更高，结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。

实例：

（1）军备竞赛

在政治学中，两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择：增加军备（背叛）、或是达成削减武器协议（合作）。两国都无法肯定对方会遵守协议，因此两国最终会倾向增加军备。似乎自相矛盾的是，虽然增加军备会是两国的“理性”行为，但结果却显得“非理性”（例如会对经济造成损坏等）。这可视作遏制理论的推论，就是以强大的军事力量来遏制对方的进攻，以达到和平。

（2）关税战

两个国家，在关税上可以有以两个选择:

提高关税，以保护自己的商品。（背叛）

与对方达成关税协定，降低关税以利各自商品流通。（合作）

当一国因某些因素不遵守关税协定，独自提高关税（背叛），另一国也会作出同样反应（亦背叛），这就引发了关税战，两国的商品失去了对方的市场，对本身经济也造成损害（共同背叛的结果）。然后二国又重新达成关税协定。（重复博弈的结果是将发现共同合作利益最大。）

（3）广告战

商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。

两个公司互相竞争，二公司的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告，收入增加很少但成本增加。但若不提高广告质量，生意又会被对方夺走。

此二公司可以有二选择：

互相达成协议，减少广告的开支。（合作）

增加广告开支，设法提升广告的质量，压倒对方。（背叛）

若二公司不信任对方，无法合作，背叛成为支配性策略时，二公司将陷入广告战，而广告成本的增加损害了二公司的收益，这就是陷入囚徒困境。在现实中，要二互相竞争的公司达成合作协议是较为困难的，多数都会陷入囚徒困境中。

囚徒困境是博弈论的一个经典案例。

当双方经过多次博弈后，彼此认识到其中的最优选择方案，从理论上讲大家会形成默契：保持同进共退策略，这就是你所说的解决！

但，需要指出的是“多次”这个前提，首先，博弈次数必须是未知，大家都不知道哪一次会是这个游戏的结束；其次，双方在形成默契前，每次游戏结束后，彼此需知道对方在游戏中的策略以备下次选择的参考。

二、博弈均衡

简介:均衡是平衡的意思，在经济学中，均衡即表示相关量处于稳定值；在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。

博弈均衡:指使博弈各方实现各自认为的最大效用，即实现各方对博弈结果的满意，使各方实际得到的效用和满意程度是不同的。在博弈均衡中，所有参与者都不想改变自己的策略的这样一种相对静止的状态。

博弈各方的关系不仅体现一种利益上的竞争，更要体现出各方的合作关系。比如，企业间通过收购、兼并等方法进行资产重组，以实现其双赢战略，正是博弈均衡的现实体现。博弈实质上是由动态的竞争（讨价还价）到相对静态的合作”博弈均衡“的一个变动过程，所以博弈均衡不仅是市场竞争的需要，也是企业发展的内在要求。

演变过程:著名经济学家马歇尔早就说过，经济学有两大研究路径：一是沿着来源于经典牛顿力学的均衡思想；一是沿着来源于生态学的演化思想。纵观经济学的发展历史可以看出这两种思路一直在此起彼伏地斗争着。1890年马歇尔出版了标志着新古典经济学形成的《经济学原理》一书后，均衡思想占据了统治地位，成为经济学家研究的主要方法。运用数学领域的“不动点定理”证明纳什均衡(Nash 1951)的存在性，使得纳什成为第一个用不动点定理于经济学研究的经济学家，他因此获得了1994年的诺贝尔经济学奖；此后，经济学家德布鲁(Debru 1954)应用“不动点定理”证明了一般均衡的存在而获得了1983年的诺贝尔经济学奖，他们的工作把均衡思想推向了高潮。物理学的中均衡就是不动，其前提条件就是：物理学中的变量多数是可以控制的，并且一般是与时间无关的。但运用均衡思想来研究在时间上不满足可逆性的社会人行为就显得有点牵强附会了，为了迎合均衡思想，经济学家给参与人附加如理性、完全信息等不切实际的假定，使得经济学离现实越来越远了，这正是理性框架下难以得到合理结论的一个主要原因。随着经典博弈理论、生态理论及心理学理论研究的深入发