纳什均衡&帕累托最优&一般均衡的联系
纳什均衡

纳什均衡简介纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。
实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。
然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。
阿尔伯特·塔克(Alberttucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。
它发展了本身很有意义的n人有限非合作博弈的概念和性质。
并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。
在概念和方法两方面,该论文都是作者的独立创造。
”纳什均衡例子博弈论中一个著名的例子就是囚徒困境。
囚徒困境是一个非零和博弈,说的是两个嫌疑犯甲和乙私人民宅联手作案,被警方逮住但未获证据。
警方于是将两个嫌疑犯分开审讯。
警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。
纳什均衡理论课件

迭代逼近法
总结词
通过不断迭代和调整策略来逼近纳什均 衡。
VS
详细描述
迭代逼近法是一种通过不断迭代和调整参 与者的策略,以逐渐逼近纳什均衡的方法 。这种方法可以在不知道具体的纳什均衡 的情况下,通过迭代过程找到近似解。
04
纳什均衡的扩展与深化
非合作博弈中的纳什均衡
要点一
总结词
非合作博弈中,纳什均衡是指参与人选择策略时,没有达 成任何协议或合作,各自追求自身利益的最大化。
纳什均衡理论课件
目录 CONTENTS
• 纳什均衡理论概述 • 纳什均衡的分类与特性 • 纳什均衡的证明方法 • 纳什均衡的扩展与深化 • 纳什均衡理论的现实应用 • 纳什均衡理论的前沿研究与展望
01
纳什均衡理论概述
定义与概念
纳什均衡定义:在博弈中,如果每个参与者的策略都是针对其他参与者的最优策略 ,则该博弈状态被称为纳什均衡。
社会学
纳什均衡理论在社会学中用于研究社会行为、合作与冲突 、社会规范等领域,揭示了社会现象背后的博弈逻辑。
生物学
在生物学中,纳什均衡理论用于研究生物种群竞争、进化 策略等领域,解释了生物种群之间的生存竞争与演化现象 。
政治学
在政治学中,纳什均衡理论用于分析国际关系、政治竞争 等领域,揭示了权力与利益分配的博弈逻辑。
社会冲突管理
在处理社会冲突时,可运用纳什 均衡理论来分析各方的利益和策 略,寻求最优解决方案。
公共资源管理
在管理公共资源时,政府可运用 纳什均衡理论来分析个体和团体 的竞争策略,制定最佳资源分配 方案。
06
纳什均衡理论的前沿研究与展望
当前研究热点与难点
热点
复杂系统中的纳什均衡、多智能 体系统中的纳什均衡、网络博弈 中的纳什均衡
解释现实中的纳什均衡现象

VS
政治联盟
在某些政治体系中,政治家或政党可能会 结成联盟,以增加自己的政治影响力。这 种联盟的形成也可以看作是一种纳什均衡 。
国际贸易
关税壁垒
在国际贸易中,国家可能会采取关税 壁垒来保护本国产业。如果所有国家 都采取这种策略,最终可能导致全球 贸易量下降,形成纳什均衡。
自由贸易协定
为了避免关税壁垒带来的负面影响, 国家之间可能会达成自由贸易协定, 降低或取消关税。这种协定的达成也 可以看作是一种纳什均衡。
激励机制
设计合理的奖励机
制
通过设计合理的奖励机制,激励 参与者采取合作行为,避免陷入 纳什均衡。
惩罚不合作行为
对采取不合作行为的参与者进行 适当的惩罚,以减少不合作行为 的发生,促进合作。
引入竞争机制
通过引入竞争机制,激励参与者 采取更好的策略和行为,打破纳 什均衡。
信息披露
增加信息透明度
通过增加信息透明度,减少信息不对称,让参与者更好地了解彼此 的策略和行为,从而避免陷入纳什均衡。
它是一种非合作博弈均衡,基于参与 者理性假设和自利原则,是博弈论中 的基本概念之一。
纳什均衡的重要性
揭示博弈中策略选择的本质
纳什均衡揭示了博弈中参与者策略选择的本质,即为了实 现自身利益最大化,参与者会选择对自己最有利的策略。
指导政策制定
在政策制定中,了解纳什均衡的存在及其特点,有助于政 府制定出更有效的政策,引导市场主体理性决策。
解释现实中的纳什均衡现象
目录
• 纳什均衡简介 • 纳什均衡的实例 • 现实生活中的纳什均衡现象 • 如何应对纳什均衡现象 • 纳什均衡的未来研究方向
01纳什均衡简介源自定义与概念纳什均衡是指在博弈论中,一种所有 参与者都不愿意偏离的策略组合,即 每个参与者都认为当前策略是最好的 ,不会选择其他策略。
纳什均衡

纳什均衡纳什均衡,又称为非合作赛局平衡,是博弈论的一个重要概念,以约翰·纳什命名。
如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点。
1.基本定义假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。
所有局中人策略构成一个策略组合(Strategy Profile)。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。
即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡,从实质上说,是一种非合作博弈状态。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。
纳什均衡也不意味着博弈双方达到了一个整体的最优状态。
2. 具体分类纳什均衡可以分成两类:“纯战略纳什均衡”和“混合战略纳什均衡”。
要说明纯战略纳什均衡和混合战略纳什均衡,要先说明纯战略和混合战略。
所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。
特别地是,纯战略决定在任何一种情况下要做的移动。
战略集合是由玩家能够施行的纯战略所组成的集合。
而混合战略是对每个纯战略分配一个机率而形成的战略。
混合战略允许玩家随机选择一个纯战略。
混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。
因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。
当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。
故“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。
并不是每个赛局都会有纯战略纳什均衡,例如“钱币问题"就只有混合战略纳什均衡,而没有纯战略纳什均衡。
不过,还是有许多赛局有纯战略纳什均衡(如协调赛局,囚徒困境和猎鹿赛局)。
博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。
两个囚徒互相揭发,就是一种纳什均衡。
对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。
也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。
这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。
博弈策略稳定,博弈结果也稳定。
之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。
之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。
2、纳什均衡意义重大。
纳什均衡提出,震动整个经济学界。
诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。
”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。
”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。
”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。
纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。
读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。
但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。
这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。
从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。
更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。
Q2:怎样运用纳什均衡?1、分析囚徒困境。
纳什均衡的概念

纳什均衡的概念纳什均衡是博弈论中的重要概念,指的是在一个博弈中,所有参与者都选择了自己的最佳策略,不存在更好的选择,即达到了一种均衡状态。
纳什均衡是在参与者之间相互博弈的情况下,每个参与者都选择了自己的最佳策略,并且其他参与者也同时选择了最佳策略,从而实现了一种平衡状态。
纳什均衡最早由约翰·纳什提出,他于1950年发表了研究博弈论的著名论文《非合作博弈》。
在该论文中,纳什定义了纳什均衡,并利用数学方法证明了简单博弈的纳什均衡存在性。
由于纳什均衡的提出和研究,他获得了1994年的诺贝尔经济学奖。
纳什均衡的理论适用范围非常广泛,涵盖了众多社会科学领域,如经济学、政治学、社会学等。
在经济学领域,纳什均衡被广泛运用于市场竞争、价格确定、产出决策等方面的分析。
在政治学领域,纳什均衡被应用于国际关系、选举竞争等问题的研究。
在社会学领域,纳什均衡被用于解析社会合作、集体行动的机制等等。
为了更好地理解纳什均衡的概念,我们可以通过一个具体的博弈案例来说明。
假设有两个企业A和B在某个市场上销售相同的产品,它们可以选择两种不同的定价策略:高价策略和低价策略。
企业A和B都知道,如果它们选择相同的策略,市场将会处于均衡状态;如果它们选择不同的策略,市场将会出现不稳定的情况。
在这个博弈中,我们可以使用一个博弈表来表示两个企业的策略和回报。
假设高价策略带来的利润分别为5和2,低价策略带来的利润分别为3和4。
根据这个博弈表,我们可以得到以下结论:如果企业A选择高价策略,那么企业B选择高价策略可以带来较高的利润,所以企业B将会选择高价策略。
如果企业A选择低价策略,那么企业B选择低价策略可以带来较高的利润,所以企业B同样会选择低价策略。
综上所述,无论企业A选择高价策略还是低价策略,企业B都会选择低价策略,从而形成了一个纳什均衡。
在这种均衡状态下,企业A的最佳策略是低价策略,而企业B的最佳策略也是低价策略,两个企业都无法通过改变自己的策略来获得更高的利润。
纳什均衡概念名词解释

纳什均衡概念名词解释纳什均衡是博弈论中的一个重要概念,它描述了博弈双方在特定条件下做出的最优策略选择,这个选择不会被单方面的改变,否则对于另一方来说,选择其他策略反而更劣。
1. 概念解释纳什均衡的概念可以从两个方面进行解释。
从个人角度看,纳什均衡是指当每一个人都实施最优策略时,其它人不能从自己的策略中获得进一步的盈利收益;从社会角度看,纳什均衡则是指,当所有人都做出了最优策略时,整个社会得到了最大的总收益。
2. 纳什均衡的前提条件在博弈论中,纳什均衡并不是所有博弈都存在的。
对于一个博弈,存在纳什均衡需要满足以下条件:(1)所有博弈者都采取了最优策略,即无法通过改变策略来提高自己的收益;(2)每个博弈者的策略是对其他博弈者实施的策略的最佳反应;(3)每个博弈者都清楚地了解其他博弈者的策略。
3. 纳什均衡的类型在实际的博弈中,纳什均衡可以分为三种类型:(1)纯策略均衡:指每位参与者都只选定一个策略,并根据它的期望收益来进行决策,不存在概率因素。
(2)混合策略均衡:指每位参与者按一定的概率选定多个策略,并根据它的期望收益来进行决策,存在概率因素。
(3)多重纳什均衡:指博弈中存在多个均衡策略组合,每个均衡策略组合都符合博弈的前提条件。
4. 纳什均衡的意义和应用纳什均衡是博弈论的一个核心概念,其意义和应用非常广泛。
首先,纳什均衡可以用来预测和解释现实生活中的决策行为,如市场竞争、政府政策制定等。
其次,纳什均衡也可以用来指导协商和谈判的过程。
最后,纳什均衡还可以用来研究其他领域的决策行为,如军事战略、生态环境等。
综上所述,纳什均衡是博弈论中的一个重要概念,它描述了博弈双方在特定条件下做出的最优策略选择,是一种使得所有参与者都满意的稳定状态。
纳什均衡的应用领域非常广泛,其理论和方法也在不断地发展和完善。
名词解释 纳什均衡

名词解释纳什均衡
纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
纳什均衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。
在每个参与者都只有有限种策略选择并允许混合策略的前提下,纳什均衡一定存在。
以两家公司的价格大战为例,价格大战存在着两败俱伤的可能在对方不改变价格的条件下既不能提价,否则会进一步丧失市场;也不能降价,,因为会出现赔本甩卖。
于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是纳什均衡。
我们用一个浅显的例子来解释。
假如你喜欢一个女孩儿,现在这个女孩儿把你当做很好很好的朋友。
如果你表白,女孩儿可能会觉得这样当朋友太尴尬,那以后可能一起玩的机会都没有了。
如果女孩儿把你拒绝了,她也会失去一个很好的朋友,这一点对现在的她来说也是比较糟糕的结果。
于是,你们俩谁都不愿意主动做出改变,也不愿意了解互相的根本想法,
即是纳什均衡。
你们俩在信息不完全的情况下达到了貌似最优解,但是在外人看来却不是。
纳什均衡

纳什均衡在政治学中的应用
选举策略:候选人在竞选活动中的决策和策略选择 政治谈判:国家间在谈判过程中的策略选择和利益平衡 国际关系:国家间在合作与竞争中的决策和策略选择 政治制度设计:政治制度设计中的决策和策略选择,如选举制度、议会制度等
纳什均衡在管理学中的应用
战略决策:企业在市场竞争中,通过纳什均衡分析,制定最优策略。 组织结构:纳什均衡理论可以帮助企业优化组织结构,提高管理效率。 激励机制:纳什均衡理论在企业激励机制设计中,可以指导企业制定有效的激励措施。 谈判与合作:纳什均衡理论在企业谈判与合作中,可以帮助企业实现利益最大化。
纳什均衡的应用
博弈论:纳什均衡是博弈论的核心概念,用于分析各种博弈问题 经济学:纳什均衡在经济学中广泛应用,如市场均衡、价格均衡等 政治学:纳什均衡在政治学中用于分析政治博弈,如选举、谈判等 社会学:纳什均衡在社会学中用于分析社会现象,如群体行为、社会规范等
纳什均衡的求解方法
第二章
纳什均衡的求解条件
纳什均衡
目录
CONTENTS
01 纳什均衡的概念 02 纳什均衡的求解方法 03 纳什均衡与博弈论 04 纳什均衡的局限性
05 纳什均衡纳什均衡的定义
纳什均衡是指在 一个博弈中,每 个参与者的策略 都是对其他参与 者策略的最优反 应。
纳什均衡是博弈 论中的一个重要 概念,由约翰·纳 什提出。
纳什均衡的求解步骤
确定博弈的 参与者和策 略集
建立支付矩 阵,表示参 与者在不同 策略下的收 益
计算每个参 与者的最佳 反应策略
检查是否存 在纳什均衡, 即每个参与 者的策略都 是对其他参 与者策略的 最佳反应
如果存在纳 什均衡,则 求解得到均 衡策略;如 果不存在, 则重新调整 策略集或支 付矩阵,重 复步骤3-4。
纳什均衡原理

纳什均衡原理
纳什均衡,英文是 Nash Equilibrium,也有人叫它“非合作均衡”、“非合作博弈均衡”,它是一个比较抽象的概念,需要运用数学的知识才能理解。
纳什均衡是指在一个博弈中,每一个人在做选择时都不能确定其他人是否会做同样的选择。
这个时候,如果一方做出了某种选择,那么另一方就会做出相应的反应。
这个反应的结果,就是双方都选择了一种对自己最有利的行为。
比如在博弈论中有这样一个例子:两个人在玩猫捉老鼠游戏,一个人是猫,另一个人是老鼠。
这个时候如果两个人都不敢抓老鼠,因为如果抓了老鼠的话,那他们俩都会被关进笼子里;如果两个人都抓老鼠的话,那他们俩都会被关进笼子里;但是如果两个人都不抓老鼠的话,那么他们俩都会被关进笼子里。
那么结果是怎样呢?这就是纳什均衡的结果。
在这个游戏中,如果只有一个人选择了不抓老鼠的话,那就只有他自己被关进笼子里;如果两个人都选择了不抓老鼠的话,那就是他们两个都被关进笼子里。
—— 1 —1 —。
纳什均衡与囚徒困境

交通拥堵中的纳什均衡
在交通拥堵中,如果所有驾驶员都选择走某一 条路,那么这条路就会变得非常拥堵。
如果一个驾驶员选择走另一条路,那么他可能 会更快地到达目的地,但其他驾驶员也可能会 效仿,导致另一条路也变得拥堵。
纳什均衡在交通拥堵中的表现为:所有驾驶员 都选择走同一条路,形成一种稳定的交通状态。
公共资源中的纳什均衡
建立信任
通过建立信任机制,让囚犯相 信对方不会出卖自己,从而都
选择抵赖。
引入第三方监管
由第三方监管机构介入,制定 规则并监督执行,确保双方都 遵守规则。
改变奖励机制
改变奖励机制,使得双方都选 择抵赖成为最优解,例如将坦 白惩罚变得更重。
增加沟通机会
让囚犯有更多的沟通机会,了 解对方的想法和处境,从而更
企业竞争中的囚徒困境
价格战
01
企业为了争夺市场份额,可能会采取降价策略,但这种策略可
能导致整个行业的利润下降。
技术研发
02
企业在研发新技术时面临投入不足或过度投入的困境,如何平
衡研发投入与市场收益是一大挑战。
广告策略
03
企业在广告投放上可能存在囚徒困境,过多的广告投入可能增
加品牌知名度,但也可能导致广告费用过高而降低利润。
01
02
03
公共资源是指那些不属于任何个 人或组织的资源,如海洋、森林、 空气等。
在公共资源的使用中,如果每个 人或组织都过度使用资源,那么 资源将会被耗尽或使用 资源,导致资源的过度消耗和破 坏,形成一种稳定的竞争状态。
05 囚徒困境的实例分析
促进学科发展
纳什均衡与囚徒困境的研究推动了博弈论和其他相关学科的发展,促进了学术交流和知识创新。
纳什均衡的定义和应用范围

纳什均衡的定义和应用范围一、定义在不完全信息博弈当中,所有参与博弈的人策略构成一个策略组。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成,即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡又称为非合作博弈均衡,由美国数学家约翰·纳什在1950年提出,他的论文《Non-cooperative Games》奠定了现代博弈论的基础。
1994年,纳什因在博弈论领域的杰出贡献获得诺贝尔经济学奖。
纳什均衡描述了一种策略组合,在这种组合中,任何一个参与者都无法通过单方面改变自己的策略来获得更好的结果。
换句话说,当每个玩家都在使用纳什均衡中的策略时,没有人有动力去偏离自己的策略。
具体来说,在一个包含多个参与者的博弈中,如果每个参与者的策略都是对其他参与者策略的最佳回应,则这个策略组合称为纳什均衡。
二、纳什均衡的应用纳什均衡的应用非常广泛。
在经济学中,可用于帮助解释和预测市场竞争、拍卖设计和定价策略等行为。
在政治学中,可用于分析选举策略、联盟形成和国际关系中的策略选择。
在生物学中,进化博弈理论通过运用纳什均衡来解释动物行为和进化稳定策略。
在社会科学中,纳什均衡用于研究社会规范、合作行为和冲突解决机制。
此外,纳什均衡还在计算机科学中的网络设计、算法博弈论和多代理系统中应用广泛。
纳什均衡作为博弈论中的重要概念,指导着决策制定者在互动环境中做出理性选择的策略。
纳什均衡的应用不仅帮助我们理解和解释了许多现实世界中的决策行为,同时也为我们提供了指导理性决策的思路和方法。
我们可以进一步探索纳什均衡的变种形式和扩展应用,以更好地解决互动决策问题。
纳什均衡

什么是纳什均衡呢?纳什均衡名称来源及简介:纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰〃纳什命名…约翰〃纳什1948年作为年轻数学博士生进入普林斯顿大学。
其研究成果见于题为《非合作博弈》(1950)的博士论文。
该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。
纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。
他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。
该解概念后来被称为纳什均衡。
纳什均衡定义:假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。
所有局中人策略构成一个策略组合(Strategy Profile)。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。
即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡经典案例:囚徒困境(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。
)假设有两个小偷A和B联合犯事、私入民宅被警察抓住。
警方将两人分别臵于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。
如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。
如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
表2.2给出了这个博弈的支付矩阵。
表2.2囚徒困境博弈——————————————————————————┃ B ┃ B ┃————————┃————————┃————————┃┃坦白┃抵赖┃————————┃————————┃————————┃A 坦白┃–8, –8 ┃0, –10 ┃————————┃————————┃————————┃A 抵赖┃–10, 0 ┃–1, –1 ┃————————┃————————┃————————┃关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。
纳什均衡

纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。
纳什均衡是一种策略组合, 在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成, 只有最优策略才可以达成纳什均衡.
例子:囚徒困境。
一个事件中不止一个纳什均衡。
完全信息动态博弈,子博弈精炼纳什均衡。
不可置信的威胁策略剔除.
不完全信息动态博弈,贝叶斯纳什均衡。
在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。
给定其他参与人的战略选择,每个参与人的最优战略依赖于自己的类型。
由于每个参与人仅知道其他参与人有关类型的分布概率,而不知道其真实类型,因而,他不可能知道其他参与人实际上会选择什么战略。
但是,他能够正确地预测到其他参与人的选择与其各自的有关类型之间的关系。
在给定自己的类型,以及给定其他参与人的类型与战略选择之间关系的条件下,使得自己的期望效用最大化。
纳什均衡

3.加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。
当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为 1,其他的则为 0。
故“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱币问题"就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。
囚徒困境博弈
A╲B 坦白 抵赖
坦白 -8,-8 0,-10
抵赖 -10,0 -1,-1
关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
纳什均衡定义

纳什均衡定义
纳什均衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。
纳什证明了在每个参与者都只有有限种策略选择并允许混合策略的前提下,纳什均衡定存在。
以两家公司的价格大战为例,价格大战存在着两败俱伤的可能,在对方不改变价格的条件下既不能提价,否则会进一步丧失市场;也不能
降价,因为会出现赔本甩卖。
于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案。
相互作用的经济主体假定其他主体所选择的战略为既定时,选择自己的最优战略的状态,也就是纳什均衡。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
纳什均衡&帕累托最优&一般均衡的联系
Review----博弈论&纳什均衡
⏹博弈论模型可以用五个方面来描述:
⏹G = {P, A, S, I, U )
⏹P: 为局中人, 博弈的参与者, 也称为博弈方,局中人是能够独立决策,
独立承担责任的个人或组织, 局中人以最终实现自身利益最大化为目标.
⏹A: 为各局中人的所有可能的策略或行动的集合. 根据该集合是有限还
是无限, 可分为有限博弈和无限博弈, 后者表现为连续对策、重复博弈和微分对策等.
⏹S: 博弈的进程, 也是博弈进行的次序. 局中人同时行动的一次性决策
的博弈, 称为静态博弈; 局中人行动有先后次序, 称为动态博弈.
⏹I: 博弈信息, 能够影响最后博弈结局的所有局中人的情报. 信息在博弈
中占重要的地位, 博弈的赢得很大程度上依赖于信息的准确度与多寡.
⏹得益信息是博弈中的重要信息, 如果博弈各方对各种局势下所有局中
人的得益状况完全清楚, 称之为完全信息博弈. 反之为不完全信息博弈.
⏹在动态博弈中还有一类信息: 轮到行动的博弈方是否完全了解此前对
方的行动. 如果完全了解则称之为具有完美信息的博弈. 反之称为不完美信息的动态博弈。
由于信息不完美, 博弈的结果只能是概率期望, 而不能像完美信息博弈那样有确定的结果.
⏹U: 为局中人获得利益, 也是博弈各方追求的最终目标. 根据各方得益
的不同情况, 分为零和博弈与变和博弈. 零和博弈中各方利益之间是完全对立的. 变和博弈有可能存在合作关系, 争取双赢局面.
纳什均衡
⏹纳什均衡就是博弈中每个博弈方, 各一个策略构成的一个策略组合。
其中每个博弈方的策略, 都是根据针对所有其他博弈方的策略构成的, 并且是最佳反应。
⏹所谓“最佳反应”,指的是该策略带给采用它的博弈方的利益或期望
利益, 大于或至少不小于其他任何策略能够带来的利益。
⏹在经济学中, 人们给纳什均衡是这样定义的: “在给定它的竞争者的行
为以后, 各厂商采取它能采取的最好行为。
”
⏹“给定你的策略, 我的策略是我最好的策略; 给定我的策略, 你的策略
也是你最好的策略”, 这正是“纳什均衡”概念在两人博弈情况下最通俗直观的表达方式。
(“我所做的是给定你所做的我所能做的最好的, 你所做的是给定我所做的你所能做的最好的。
)
Review----帕累托最优
⏹帕累托最优(Pareto Optimality)是博弈论中的重要概念,并且在经济
学,工程学和社会科学中有着广泛的应用。
⏹帕累托最优所描述的是这样一种状态,即社会无法进一步组织生产或
消费,以增进某人的满足程度,而同时却不会减少其他人的福利。
即没有一个人的境遇能在不使别人的境遇变得更糟的情况下变得更好。
⏹一方面,帕累托最优是指没有进行帕累托改进的余地的状态;另一方
面,帕累托改进是达到帕累托最优的路径和方法。
⏹帕累托最优是公平与效率的“理想王国”。
假定由于市场变化而境
况变好的人能够补偿境况变差的人,帕累托最优或者产出的经济效率水平将是总剩余最大化时的生产和消费水平,这时消费者的收益和生产者的成本之差最大,即净收益最大。
在福利经济学中,生产资源的配置达到的最大效率或最适度(或称最优)的经济状态。
⏹达到帕累托最优时,会同时满足以下3个条件:
⏹交换最优:即使再交易,个人也不能从中得到更大的利益。
此时对任
意两个消费者,任意两种商品的边际替代率是相同的,且两个消费者的效用同时得到最大化。
⏹生产最优:这个经济体必须在自己的生产可能性边界上。
此时对任意
两个生产不同产品的生产者,需要投入的两种生产要素的边际技术替代率是相同的,且两个消费者的产量同时得到最大化。
⏹产品混合最优:经济体产出产品的组合必须反映消费者的偏好。
此时
任意两种商品之间的边际替代率必须与任何生产者在这两种商品之间的边际产品转换率相同。
一般均衡
一般均衡是指一个经济中追逐自身消费利益最大化的消费者在市场的引导之下最终会达到的一个交换状态, 在该状态中每位消费者都使自身消费利益最大化。
因此, 它特指消费者在市场的引导下所达到的一般交换结果。
从正统经济学角度比较三者区别
⏹一般均衡是指一个经济中追逐自身消费利益最大化的消费者在市场的
引导之下最终会达到的一个交换状态, 在该状态中每位消费者都使自身消费利益最大化。
因此, 它特指消费者在市场的引导下所达到的一般交换结果。
⏹帕累托最优则是用来描述这样一种经济状态, 在该状态中没有一个人
能够在不损害其他人利益的前提下, 使自身利益得到改进, 即指人们没有共同改进各自利益机会的状态。
因此, ,帕累托最优常被用来说明经济社会达到一种没有互利或互惠机会的效率状态。
⏹纳什均衡则是20世纪80年代初才被广泛使用的一个概念, 它描述的是
这样一个状态, 在该状态没有一个经济主体人愿意单方面改变自己的消费或生产计划, 也就是如果经济主体人自己单方面改变消费或生产计划只会使自己的处境更坏。
⏹在一个交换经济中, 如果消费者通过完全竞争的交换互动达到了一个满足商品价值与商品交换价格相等的最终商品交换, 那么该商品交换对应的消费配置就是一个一般均衡的消费配置。
⏹由此可见, 一般均衡配置的最优性就在于它是众多最终商品交换中使商品价值和商品交换价格统一的商品交换。
这意味着当经济达到一般均衡状态时, 每个消费者对商品交换都感到买卖公平。
所以, 在所有的最终商品交换中,一般均衡的消费配置是最理想和最优的一种经济状态。
⏹由此可说明一般均衡的消费配置本身就是最优和最有效率的配置。
(优于其他任何均衡)
⏹纳什均衡描述的是策略互动的经济主体人之间可能达到的一种稳定状态, 这种稳定性是经济主体人单方面不愿意改变的。
如果互动是在不同的规则或制度安排之下进行的, 那么所达到的稳定状态或纳什均衡是不一样的。
因此, 纳什均衡是一个与规则和制度安排有关的稳定状态, 它比帕累托最优和一般均衡更具一般性。
⏹但它的缺点也在于它的一般性, 这种一般性使得在同一个博弈中有可能存在多个纳什均衡解, 因而无法预见主体
⏹人的策略互动行为。
⏹从经济核心理论我们知道, 经济中持有一定初始禀赋的消费者, 通过自
由竞争的交换互动经济会达到核心的交换结果, 在此所说的自由竞争意指:
⏹(1)消费者具有自由选择交易对手的权利;(2)消费者认为有更好
的交易对象时, 有自由更换交易对手的权利。
⏹这种宏观的核心交换结果(纳什均衡)描述了经济中均衡市场的交换
关系。
当我们把市场定义为存在一定交换关系的消费者群体时, 这种交换关系就刻画了经济的稳定市场。
⏹此时, 市场的稳定性是从两个方面来看:(1)每一个消费者无法在自
己所处的交换群体(市场)中找到更好的交换对手;(2)也无法在其他的交换群体(市场)中找到更好的交换对手。
⏹也就是说这种稳定关系是消费者个人无法单方面改变的纳什均衡。
显
然, 核心的交换结果是帕累托最优的,但不一定是一般均衡。
总结
⏹上述已说明一般均衡是比帕累托最优更优的结果。
可是, 如果这种自由竞争的商品交换(博弈)是可重复的, 那么博弈的纳什均衡解是一个一般均衡的解。
⏹由此可知, 自由竞争的商品交换(博弈)的纳什均衡是帕累托最优, 而无限重复地进行自由竞争的商品交换(重复博弈)所得到的纳什均衡, 不仅是帕累托最优的, 而且还是一般均衡最优的。