博弈论课文翻译
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
搏弈论
阿维纳什•迪克斯特&巴里•内尔巴夫
1搏弈是有关策略的科学。它试图以数学和逻辑的方法来帮助搏弈者作出决策,在一系列纷繁复杂的搏弈中应采取何种策略来保证自己获得最大利益。搏弈论研究的搏弈的范围包括了从下棋到抚育儿童,从网球竞技到公司转手。但是所有的博弈都具有一个共同的特征:相互作用。也就是说,每一个博弈者的博弈结果取决于所有博弈参与者的策略选择。在零和搏弈中,搏弈者的利益之间是完全冲突的,因此一方的得利必然导致另一方的损失。更多具有代表性的例子还有会导致共同得利(正和)搏弈和共同损失(负和)搏弈,同样的情况还会发生在另外一些冲突中。
2搏弈论研究的先驱者是普林斯顿数学家约翰•冯•诺依曼。在早先的一段时间里,研究的重点被放在了完全冲突(零和)搏弈(非合作搏弈)上,其他的搏弈当时被认为是以合作形式出现。也就是说,搏弈要求参与者共同地选择和实施他们的行为.最近的研究则把重点放在了那些既不属于零和搏弈也不属于绝对合作搏弈的情况上,在这些搏弈中,搏弈者自主地选择搏弈行为,但他们之间的相互关系中充满了合作与竞争。
3搏弈行为与我们在中性环境中所作的各种决定有着根本性的不同。要说明这一点,我们可以思考一下伐木工人和军队将军所作决定之间的不同。当伐木工人决定要如何砍树时,他不会考虑树木本身会有什么反抗,他所处的环境为中性。而当将军决定要消灭敌军时,他必须提前预料到并消除敌军的反抗。与这一例子中的将军相类似,一个搏弈者必须认识到他与其他机智且怀有争胜之心的竞争者之间的相互作用,他自己所作的决定也必须能够同时应对可能出现的合作或冲突。‖
4搏弈的实质是搏弈者采取策略之间的相互依赖性。这种策略性的相互依赖表现为两个不同的类别:连续策略之间的相互作用以及联立策略之间的相互作用。就前者而言,搏弈者依次采取行动,每个人都会注意其他搏弈者先前的行为。就后者而言,搏弈者同时采取行动,每个人都会忽略其他搏弈者当前的行为。
5对连续策略博弈中的某一博弈这来说,一个普遍的原则就是放眼前方,及时反思和总结。每个博弈者应该弄清楚其他博弈者会对他当前的策略行为做出怎样的回应,他自己将如何应对等情况。博弈者要预料到他的最初决定会最终导致何种结果,并且运用对形势的判断来计划好当前的最佳策略。在考虑其他博弈者会如何应对时,博弈者必须能设身处地地换位思考,而不能把自己的主观判断强加与人。
6从理论上说,采取固定次序行动的任何连续博弈都可以圆满地完成。我们可以通过预测每个可能的结果来决定各个博弈者的最佳策略。例如象井字棋(tic-tac-toe)这样的简单游戏由于可以以这样的方式完成,因而并不具有挑战性。但诸如象象棋等的其他博弈,即使是借助电脑的帮助,由于其本身的计算过程过于复杂而难以在实践中去实施。因此,博弈者往往会会依据经验提前对形势作出判断并尽可能的评估最终的局面。
7与连续策略博弈的线形思维不同的是,采取共发性策略的博弈要求逻辑思维。在忽略其他参与者当前策略的情况下,尽管博弈者们同时采取行动,每一个参与者必须清楚的意识同时还会有其他的参与者在依次关注整个博弈过程。这时的思维模式可描述为:我想他认为我会这样考虑…。因此,博弈者必须从全体博弈者的立场出发并努力判断出最终的博弈结果。每个参与者的个人最佳行为都是全局谋划中不可或缺的一部分。
8运用普林斯顿数学家约翰•纳什提出的均衡概念,可以推导出这种逻辑思维的结论。我们寻求一系列的策略组合,每个博弈者都会有自己的选择,当所有的对手们在实施他们决定的最佳策略时,我们所做的选择应该对自己是最有利的。换句话说,每个博弈者都会对其他人的策略作出最优化的应对。
9有时, 无论其他博弈者如何行动,博弈的一方的最佳策略组合始终如一,这被称作这一博弈者的优策略。在其他情况下,如果博弈者的策略始终于己不利,则被称作劣策略,其含义是指无论其他博弈者如何行动,对手的策略总是优于自己。因此,谋求策略均衡应该从寻找优策略和消除劣策略开始。
10当我们把博弈的结果表述为一种均衡的时候,并不是基于以下的假设:即博弈的每个参与者的个人最佳策略将会带来共同的最优化结果。确实也存在着一些糟糕的例子,比如囚徒困境(见下文),由于囚徒们都追求个人私利的最大化而导致了全体参与者的困境。
11纳什的关于均衡的定义还不能完全解决联立策略博弈中逻辑推理思考的问题,有些博弈包含多种此类的均衡,而有些博弈却并不包含这样的均衡。纳什均衡也还没有清楚地说明关于导致均衡的动态过程。尽管有这样的一些缺陷,纳什均衡的定义已被证明在分析策略性互动时具有重要作用。‖
12以下策略性互动的实例可以说明博弈论的一些基本理论框架:
13囚徒困境。两个嫌疑犯分别被审问,每个人都可以招供或保持沉默。如果嫌犯A保持沉默,嫌犯B可以通过招供而获得较轻的发落。如果嫌犯A招供,嫌犯B最好选择招供以免被从重处理。这时招供就是嫌犯B的优策略。同样的情况也适用与B。因此,在均衡的情况下双方都选择招供。如果双方均缄口不言也都可相安无事。由于合作分裂所导致的长远性损失远比招供而获得的暂时性得利严重,所以这样的合作行为会在博弈中反复进行下去。在这种情况下,一般推荐采取针锋相对的策略。
14混合性策略。在一些冲突中,任何规律性的行为都会被对手发觉并利用。因而,通过采取混合性策略来迷惑对手就显的非常重要。我们可以从体育运动中找到一些典型的例子,比如足球运动中的特定情况下选择跑位还是传球,网球比赛中选择击打近网球还是底线球,博弈论都为提高洞察力和掌握混合性策略恰当的火候提供了参考。
15战略性行动。博弈者可以通过运用威吓和许诺来改变其他对手对其行动的预测,从而诱使他们采取对其有利的行为或改变他们对己不利的行为。为了取得成功,威吓和许诺必须是可信的。这往往会导致出现一些问题,原因就在于当需要采取以上策略时,通常实施威吓和许诺而获益往往会付出较大的代价。博弈论研究几种提高可信度的方法,一个基本的原则就是威吓和许诺要在符合博弈者利益的前提下减少自身未来行动的自由度。通过这样的方式,博弈者可以避免自己违背承诺,或者避免产生对对手冒犯的纵容。
16例如,当柯台斯到墨西哥后,烧掉了战船,故意没有给自己留下撤军的退路。由于没有返城的船只,柯台斯面对的只有战胜并征服对手或被对手消灭掉两种可能。尽管他的士兵在数量上处于绝对劣势,但这种血战至死的威胁使得对手的士气变的低落,印第安军队面对这样意志坚定的对手时,他们选择了退却。宝丽来公司在拒绝共享即时成像市场时也采取了类似的策略,当时它决定与任何挤占该市场的对手拼个你死我活。当柯达公司试图染指即时成像业时,宝丽来调动了所有的资源进行反击。14年后, 宝丽来公司在与柯达公司的诉讼中获胜,重新赢得了在即时成像市场的垄断地位。
17使威吓变得可信的另一个方法是运用冒险性的边缘化策略,这一策略的风险在于: 如果其他博弈者未能按照威吓的要求去做的话,结果对大家将是一损俱损。托马斯•谢林在他的《冲突策略》一书中介绍说,边缘化策略就是故意使局势变的无法控制的策略,正是由于局势的无法收拾可能令其他对手难以接受,从而迫使对手作出妥协。
18讨价还价。两个博弈者一起来分蛋糕,每个人都想要一个大块,双方都倾向于尽快达成一致。当两个人依次开始提议分配时,放眼前方和反思总结的博弈原则决定了均衡的份额,双方这时可以立即达成一致,但时间的延误决定了双方的份额,竞争中缺乏耐心的一方只能分得较小的蛋糕。
19隐瞒和公开信息。当博弈的一方掌握其他各方不了解的信息时,他会急于隐瞒这一