纳什平衡Nash Equilibrium

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

纳什平衡Nash Equilibrium
2010-02-11 16:48:59
纳什平衡（Nash Equilibrium），又称为非合作赛局平（Non-Cooperative Games），是博弈论的一个重要概念，以约翰•纳什命名。

定义：
如果某情况下无一参与者可以独自行动而增加收益，则此策略组合被称为纳什均衡点。

例子：
经典的例子就是囚徒困境，囚徒困境是一个非零和博弈。

大意是：一个案子的两个嫌疑犯被分开审讯，警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被立即释放，而对方将被判刑十年；如果两人均招供，将均被判刑两年。

如果两人均不招供，将最有利，只被判刑半年。

于是，两人同时陷入招供还是不招供的两难处境。

但两人无法沟通，于是从各自的利益角度出发，都依据各自的理性而选择了招供，这种情况就称为纳氏均衡点。

这时，个体的理性利益选择是与整体的理性利益选择不一致的。

囚犯甲的博弈矩阵囚犯甲
招供不招供
囚犯乙招供判刑两年甲判刑十年；乙即时获释
不招供甲即时获释；乙判刑十年判刑半年
基于经济学中Rational agent的前提假设，两个囚犯符合自己利益的选择是坦白招供，原本对双方都有利的策略不招供从而均被判刑半年就不会出现。

事实上，这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”（也叫非合作均衡），换言之，在此情况下，无一参与者可以“独自行动”（即单方面改变决定）而增加收获。

学术争议和批评：
第一，纳什（Nash）的关于非合作（non-cooperative）博弈论的平衡不动点解（equilibrium/fixpoint）学术证明是非构造性的（non-constructive），就是说纳什用角谷静夫不动点定理（Kakutani fixed point theorem）证明了平衡不动点解是存在的，但却不能指出以什么构造算法如何去达到这个平衡不动点解。

这种非构造性的发现对现实生活里的博弈的作用是有限的，即使知道平衡不动点解存在，在很多情况下却找不到，因此仍不能解决问题。

在数学意义上，纳什并没有超越角谷静夫不动点定理。

经过《美丽心灵》的Sylvia Nasar（书作者）和Ron Howard（电影作者）这样的主流媒体的介入，角谷静夫（Kakutani）在这些人的作品里被完全忽略。

有人认为，“纳什平衡”（Nash equilibrium）的更合适的名字应该叫作“角谷静夫—纳什博弈论不动点”（Kakutani-Nash game-theoretic fixed point）或“角谷静夫—纳什平衡”（Kakutani-Nash equilibrium），没有角谷静夫不动点定理，纳什的证明没有多大学术意义。

《美丽心灵》完全忽视角谷静夫之关键贡献的作法有待商榷。

第二，的非合作（non-cooperative）博弈论模型仅仅是突破了博弈论中的一个局限。

一个更大的局限是，博弈论面对的往往是由几十亿节点的庞大对象构成的社会、经济等复杂行为，但冯•诺伊曼（V on Neumann）和的研究是针对两三个节点的小规模博弈论（有人称之为tiny-scale toy case）。

这个假设的不完善处，可能比假设大家都是合作的（cooperative）更严重。

因为在经济学里，一个庞大社会里的人极不可能全部都是合作的，非合作的情况通常在庞大对象的情形中更普遍，而在两三个节点的小规模经济中倒反而影响较小。

既然改了合作前提为非合作前提，却仍然停留在两三个节点的小规模博弈论中，这是一个不可忽视的缺陷。

最近香港城市大学和北京清华大学的学者群邓小铁、姚期智在基于复杂度理论的大规模博弈论上有所进展。

MIT的一位计算机科学博士生的博士论文(PDF /costis/thesis.pdf )——获得2008年度美国计算机协会学位论文奖——认为经济学家的推测是错误的，找到纳什均衡点是几乎不可能的事。

目前担任MIT电机工程和计算机科学系助理教授的Constantinos Daskalakis与UC伯克利的Christos Papadimitriou、英国利物浦大学的Paul Goldberg合作，证明对某些博弈来说，穷全世界所有计算机之力，在整个宇宙寿命的时间内也计算不出纳什均衡点。

Daskalakis相信，计算机找不到，人类也不可能找到。

纳什均衡属于NP问题，Daskalakis证明它属于NP问题的一个子集，不是通常认为的NP-完全问题，而是PPAD-完全问题。

这项研究成果被一些计算机科学家认为是十年来博弈论领域的最大进展。