纳什均衡
纳什均衡
纳什均衡简介
纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以
约翰·纳什命名。在一
个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组
合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
纳什均衡的得来
关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在
普林斯顿大学攻读博士学位时完成
的。实际上,博弈论的研究起始于1944年冯·诺依曼(
Von Neumann)和
奥斯卡·摩根斯坦
(Oscar Morgenstern)合著的《博弈论和经济行
为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(
mixed strategies)”的情况下,
证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈
(Non-cooperative Game)”理论,进而
对“合作博弈
(Cooperative Game)”和“
非合作博弈”做了明确
的区分和定义。阿尔伯特·塔克(Albert
tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。”
纳什均衡的完整定义
纳什均衡的完整定义
纳什均衡是博弈论中一种解的概念,它是指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。
简介
纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
历史背景
关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。实际上,博弈论的研究起始于1944年约翰·冯·诺依曼(Von Neumann)和奥斯卡·摩根斯特恩(Oscar Morgenstern)合著的《博弈论和经济行为》。然而却是纳什首
先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性[1] ,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。”
纳什均衡的概念
纳什均衡的概念
纳什均衡是博弈论中的重要概念,指的是在一个博弈中,所有参与者都选择了自己的最佳策略,不存在更好的选择,即达到了一种均衡状态。纳什均衡是在参与者之间相互博弈的情况下,每个参与者都选择了自己的最佳策略,并且其他参与者也同时选择了最佳策略,从而实现了一种平衡状态。
纳什均衡最早由约翰·纳什提出,他于1950年发表了研究博弈论的著名论文《非合作博弈》。在该论文中,纳什定义了纳什均衡,并利用数学方法证明了简单博弈的纳什均衡存在性。由于纳什均衡的提出和研究,他获得了1994年的诺贝尔经济学奖。
纳什均衡的理论适用范围非常广泛,涵盖了众多社会科学领域,如经济学、政治学、社会学等。在经济学领域,纳什均衡被广泛运用于市场竞争、价格确定、产出决策等方面的分析。在政治学领域,纳什均衡被应用于国际关系、选举竞争等问题的研究。在社会学领域,纳什均衡被用于解析社会合作、集体行动的机制等等。
为了更好地理解纳什均衡的概念,我们可以通过一个具体的博弈案例来说明。假设有两个企业A和B在某个市场上销售相同的产品,它们可以选择两种不同的定价策略:高价策略和低价策略。企业A和B都知道,如果它们选择相同的策略,市场将会处于均衡状态;如果它们选择不同的策略,市场将会出现不稳定的情况。
在这个博弈中,我们可以使用一个博弈表来表示两个企业的策略和回报。假设高价策略带来的利润分别为5和2,低价策略带来的利润分别为3和4。根据这个博弈表,我们可以得到以下结论:
如果企业A选择高价策略,那么企业B选择高价策略可以带来较高的利润,所以企业B将会选择高价策略。
纳什均衡概念名词解释
纳什均衡概念名词解释
纳什均衡是博弈论中的一个重要概念,它描述了博弈双方在特定
条件下做出的最优策略选择,这个选择不会被单方面的改变,否则对
于另一方来说,选择其他策略反而更劣。
1. 概念解释
纳什均衡的概念可以从两个方面进行解释。从个人角度看,纳什均衡
是指当每一个人都实施最优策略时,其它人不能从自己的策略中获得
进一步的盈利收益;从社会角度看,纳什均衡则是指,当所有人都做
出了最优策略时,整个社会得到了最大的总收益。
2. 纳什均衡的前提条件
在博弈论中,纳什均衡并不是所有博弈都存在的。对于一个博弈,存
在纳什均衡需要满足以下条件:
(1)所有博弈者都采取了最优策略,即无法通过改变策略来提高自己
的收益;
(2)每个博弈者的策略是对其他博弈者实施的策略的最佳反应;
(3)每个博弈者都清楚地了解其他博弈者的策略。
3. 纳什均衡的类型
在实际的博弈中,纳什均衡可以分为三种类型:
(1)纯策略均衡:指每位参与者都只选定一个策略,并根据它的期望
收益来进行决策,不存在概率因素。
(2)混合策略均衡:指每位参与者按一定的概率选定多个策略,并根
据它的期望收益来进行决策,存在概率因素。
(3)多重纳什均衡:指博弈中存在多个均衡策略组合,每个均衡策略
组合都符合博弈的前提条件。
4. 纳什均衡的意义和应用
纳什均衡是博弈论的一个核心概念,其意义和应用非常广泛。首先,
纳什均衡可以用来预测和解释现实生活中的决策行为,如市场竞争、
政府政策制定等。其次,纳什均衡也可以用来指导协商和谈判的过程。
最后,纳什均衡还可以用来研究其他领域的决策行为,如军事战略、生态环境等。
简述纳什均衡的概念。
、
、
简述纳什均衡的概念。
纳什均衡(Nash Equilibrium,或称纳什均衡点)是指在包
含两个或以上参与者的非合作博弈(Non-cooperative game)中,假设每个参与者都知道其他参与者的均衡策略的情况下,没有参与者可以透过改变自身策略使自身受益时的一个概念解。
纳什均衡的必要条件:
•是非合作博弈,不可提前沟通。
•博弈参与者均具备理性思维。
•博弈各方的行为是同时进行。
•纳什均衡并非是博弈的唯一结果。
纳什均衡
纳什均衡在博弈论中的地位
纳什均衡是博 弈论的核心概 念之一,它描 述了在策略互 动中,参与者 的最优策略选
择。
纳什均衡是博 弈论研究的重 要工具,可以 帮助分析各种 策略互动问题, 如囚徒困境、 智猪博弈等。
纳什均衡在博 弈论中的应用 广泛,包括经 济、政治、社
会等领域。
纳什均衡理论 的发展和完善, 为博弈论的研 究和应用提供 了坚实的理论
纳什均衡的应用
博弈论:纳什均衡是博弈论的核心概念,用于分析各种博弈问题 经济学:纳什均衡在经济学中广泛应用,如市场均衡、价格均衡等 政治学:纳什均衡在政治学中用于分析政治博弈,如选举、谈判等 社会学:纳什均衡在社会学中用于分析社会现象,如群体行为、社会规范等
纳什均衡的求解方法
第二章
纳什均衡的求解条件
纳什均衡的求解实例
囚徒困境:两个囚犯,合作或背叛,纳什均衡为(背叛,背叛) 智猪博弈:大猪和小猪,等待或按按钮,纳什均衡为(小猪等待,大猪按按钮) 斗鸡博弈:两个司机,向左或向右,纳什均衡为(向左,向左) 酒吧博弈:两个酒吧,降价或不降价,纳什均衡为(不降价,不降价)
纳什均衡与博弈论
第三章
纳什均衡
目录
CONTENTS
01 纳什均衡的概念 02 纳什均衡的求解方法 03 纳什均衡与博弈论 04 纳什均衡的局限性
05 纳什均衡的实际应用
纳什均衡的含义及应用
纳什均衡的含义及应用
纳什均衡是一种博弈论的概念,主要用于描述多方参与者在决策过程中,通过权衡自身利益和其他参与者的利益,达成一种相互协调的状态。纳什均衡是由美国数学家约翰·纳什提出的,他在1950年代中期发表了关于非合作博弈的研究成果,为博弈论的发展做出了重要贡献。
在纳什均衡中,每个参与者根据其他参与者的策略选择,以最大化自己的利益为目标,而不考虑其他参与者的选择。这种情况下,没有任何一方能够通过改变自己的策略获得更大利益,而参与者之间的策略选择形成一种稳定状态,这就是纳什均衡。
纳什均衡的应用非常广泛。在经济学中,纳什均衡被用来分析市场竞争、战略合作等问题。在市场竞争中,各家企业都会根据市场条件和对手的策略选择自己的定价和产量,通过纳什均衡分析可以预测市场的价格和供需关系。在战略合作中,多方参与者需要通过协商决策达成一致,纳什均衡可以用来帮助找到最佳的合作策略。
此外,纳什均衡还被应用于政治学、社会学、生物学、心理学等领域。在政治学中,纳什均衡可以用来分析选举竞争、国际关系等问题;在社会学中,纳什均衡可以用于研究人类社会的合作行为和冲突行为;在生物学中,纳什均衡可以用来解释生物进化中的竞争和合作现象;在心理学中,纳什均衡可以用来研究人类决策行为和合作意愿。
纳什均衡的研究也为决策理论提供了重要的思路。传统的决策理论认为人们会根据最大期望效用准则进行决策,但纳什的研究表明,当存在多个参与者时,人们往往不仅会考虑自己的最大效用,还会考虑其他人的策略选择。因此,纳什的研究为决策理论添加了一种新的分析维度。
纳什均衡微观经济学名词解释
纳什均衡微观经济学名词解释
纳什均衡是指在一个非合作性(即每个参与者都独立做决策)的博弈中,所有参与者采取最优策略的集合。在纳什均衡中,没有任何一位参与者能够通过单方面改变自己的策略而使自己获利,也不存在任何一种合作可能会提高所有参与者收益的情况。纳什均衡是博弈论中最基本也是最重要的概念之一。
霍林特法则的纳什均衡
霍林特法则的纳什均衡
霍特林法则,又被称为空间竞争法则,认为在一个理性市场中,两个竞争者的最佳策略就是越来越相似。这是因为,如果一个企业改变其策略,而另一个企业不随之调整,那么第一个企业的收益可能会降低。因此,企业往往会选择跟随对方的策略进行调整,以维持或增加自己的市场份额。
纳什均衡是博弈论中的重要概念,指的是在非合作博弈中,所有参与者都不愿意改变自己的策略,因为其他参与者的策略都是最优的。换句话说,在一个策略组合中,任何参与者单方面改变策略都不会得到好处。
因此,根据霍特林法则和纳什均衡的概念,我们可以推断:在一个竞争市场中,如果两个企业采取相似的策略,那么他们之间的竞争就可能达到一个纳什均衡的状态。这是因为,如果一个企业单方面改变策略,可能会失去与另一个企业相竞争的优势,而这正是纳什均衡所描述的情况。
纳什均衡的原理与应用
纳什均衡的原理与应用
1. 纳什均衡的定义
纳什均衡,又称为纳什平衡,是博弈论中的一个概念,由美国数学家约翰·纳什于1950年提出。它是博弈论研究中的一个重要成果,揭示了多方参与的博弈中可
能存在的平衡点。
2. 纳什均衡的原理
纳什均衡的原理基于参与者在博弈中追求个人利益的假设,即每个参与者都会
尽力追求自己的利益最大化。在纳什均衡中,没有任何一个参与者可以通过改变自己的策略来提高自己的利益,而其他参与者保持不变。
3. 纳什均衡的应用
纳什均衡具有广泛的应用领域,尤其在经济学、社会科学和工程领域中有重要
的地位。以下是一些纳什均衡的应用实例:
• 3.1 经济学
–拍卖机制:在拍卖中,卖家和买家之间的竞争决定了最终的价格。纳什均衡理论可以帮助分析卖家和买家的策略选择,以及最终的
价格形成。
–垄断定价:在垄断市场中,垄断者面临价格选择的问题。纳什均衡可以帮助垄断者确定最优的价格策略。
• 3.2 社会科学
–博弈论研究:纳什均衡是博弈论中的核心概念,用于描述多方博弈中的平衡点。社会科学研究中,纳什均衡被广泛应用于对人类行
为和决策的建模和原理研究。
–合作与竞争:纳什均衡理论可以帮助分析合作与竞争的关系。
在合作环境中,纳什均衡可以帮助确定最优的合作策略。
• 3.3 工程领域
–交通流控制:纳什均衡理论可以用于交通流控制系统的设计,帮助优化交通流的分配和调度。通过分析交通参与者的决策行为,可以
建立交通流动的纳什均衡模型,从而提高交通系统的效率。
–电力市场:电力市场中的供求关系影响着电力价格的形成。
纳什均衡理论可以用于分析电力市场中各个参与者的策略选择,从而优
纳什均衡
博弈论中一种解的概念
01 简介
03 分类 05 重Baidu Nhomakorabea影响
目录
02 历史背景 04 经典案例
纳什均衡是博弈论中一种解的概念,它是指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面 改变自己的策略(其他玩家策略不变)都不会提高自身的收益。
简介
纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。 在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策 略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定 义为纳什均衡。
2.扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的 交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括 扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。
3.加强了经济学研究的深度。
经典案例
囚徒困境
硬币正反
(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。)
假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对 每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都 被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌疑人没有坦白而是抵赖, 则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
纳什均衡微观经济学名词解释
纳什均衡微观经济学名词解释
纳什均衡是微观经济学中的一个重要概念,指的是在博弈论中,多个决策者在互相影响下,选择最优策略的一种状态。它是由美国数学家约翰·纳什提出的,因此得名。
在纳什均衡中,每个决策者都会选择最优的策略,同时考虑到其他决策者的选择。这种状态下,所有决策者都无法通过单方面改变策略来提高自己的利益,因为其他决策者也会相应地调整自己的策略,从而保持均衡状态。
具体来说,纳什均衡有以下几个特点:
1.每个决策者都选择最优策略。在纳什均衡中,每个决策者都会选择能够最大化自己利益的策略。
2.所有决策者的策略相互独立。在纳什均衡中,每个决策者的策略都是独立的,没有任何一个决策者能够通过单方面改变自己的策略来影响其他决策者的策略。
3.所有决策者都认为其他决策者的策略不会改变。在纳什均衡中,每个决策者都认为其他决策者的策略不会改变,因此不会试图通过改变自己的策略来影响其他决策者的策略。
纳什均衡的应用非常广泛,尤其是在经济学中。例如,在市场竞争中,每个厂商都会根据市场需求和竞争对手的策略来选择自己的生产策略,从而达到最大化利润的目的。在这种情况下,如果每个厂商都选择最优策略,并认为其他厂商的策略不会改变,那么市场就会达到纳什均衡状态。
除了经济学之外,纳什均衡还被广泛应用于政治学、社会学、心理学等领域。例如,在国际关系中,不同国家之间的互动往往也是一个博弈过程,每个国家都会根据自己的利益来选择策略。在这种情况下,如果每个国家都选择最优策略,并认为其他国家的策略不会改变,那么国际关系也会达到纳什均衡状态。
纳什均衡点
纳什均衡点:
纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
微观经济学纳什均衡
微观经济学纳什均衡
微观经济学纳什均衡是一种重要的博弈论方法,以解决多个参与者在竞争中达成最优策略的问题。纳什均衡在经济学、政治学和社会学等领域广泛应用,为决策者提供了优化交互的理论基础。在这篇文章中,我们将探讨纳什均衡的基本概念、应用范围和实际案例。
什么是纳什均衡?
纳什均衡是指一个博弈中所有参与者做出最优策略的状态。博弈表示多个参与者面临不同的选项,根据其他参与者的行为做出决策,并在最终结果中获得利益或损失。纳什均衡是在假设所有参与者都知道其他人的战略和最终结果的情况下得出的,通过寻找参与者最大化利益的策略来确定最终状态。
纳什均衡的概念描述了一个节点,称为均衡点。在均衡点上,每个参与者的策略形成了一种稳定的状态,使得任何人采取不同策略都会使其利益有所减少。纳什均衡不一定是最优策略或最优结果,但对于所有参与者来说,选择这个策略就是最合理的。
纳什均衡的应用范围
纳什均衡可以用于解决一系列经济和社会问题,例如市场竞争、资本博弈、国际贸易和环境政策等。在市场竞争中,企业、供应商和消费者都会对价格和数量做出决策,纳什均衡可以帮助我们预测市场价格和数量的稳定状态。在资本博弈中,银行、交易商和投资者参与多重游戏,纳什均衡可以测量资本流动方向与趋势。在国际贸易中,不同国家参与进出口贸易会影响市场价值和公平分配,纳什均衡可以帮助我们确定进出口关税和贸易协议的最优方案。在环境政策中,制定人员需要考虑经济效益和环境保护之间的平衡,纳什均衡可以帮助我们制定环保监管和税收政策。
实际应用案例
在经济学中,纳什均衡在实际应用中具有重要的作用。以下是几个应用案例:
名词解释纳什均衡
名词解释纳什均衡
纳什均衡是一种博弈论概念,指的是在博弈参与者之间达到的一种策略组合,其中每个参与者选择的策略是最佳响应其他参与者的策略。
在纳什均衡下,没有任何参与者有动机单独改变自己的策略,因为这样做不会带来更好的结果。换句话说,每个参与者已经采取了最佳策略,给予其他参与者的策略选择。
纳什均衡的概念可以应用于各种博弈情境,包括合作博弈和非合作博弈。在合作博弈中,参与者可以相互合作以实现共同利益,而在非合作博弈中,参与者之间缺乏合作。无论是合作还是非合作博弈,纳什均衡都描述了一种稳定的策略选择。
纳什均衡的概念由约翰·纳什于1950年代开发,并在他的博士论文中首次提出。由于其重要性和广泛的应用,纳什均衡成为博弈论中的关键概念,并且对于理解和分析各种博弈情境具有重要意义。
纳什均衡
纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。纳什均衡是一种策略组合, 在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成, 只有最优策略才可以达成纳什均衡.
例子:囚徒困境。一个事件中不止一个纳什均衡。
完全信息动态博弈,子博弈精炼纳什均衡。不可置信的威胁策略剔除.
不完全信息动态博弈,贝叶斯纳什均衡。在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。给定其他参与人的战略选择,每个参与人的最优战略依赖于自己的类型。由于每个参与人仅知道其他参与人有关类型的分布概率,而不知道其真实类型,因而,他不可能知道其他参与人实际上会选择什么战略。但是,他能够正确地预测到其他参与人的选择与其各自的有关类型之间的关系。在给定自己的类型,以及给定其他参与人的类型与战略选择之间关系的条件下,使得自己的期望效用最大化。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 画出得益矩阵
猎人博弈得益矩阵
乙
猎鹿
打兔
10
4
甲 猎鹿 10
0
0
4
打兔 4
4
博弈论故事之五--高薪养廉
• “高薪养廉”是公务员制度方面的一种理论,我们分 析一下“高薪”为什么能养廉?
• 假设甲乙为一家单位的主任和书记关系密切的国家公 务员,7代表现在政府给他们的高薪。如果两人受贿, 因为串谋而一时不被人发现,他们可以达到9的位置; 而一旦“东窗事发”,他就要被撤职查办, 不受贿一 方得8
)
的最佳对策,也即
ui (si*,
s* i 1
,
si*
,
s* i 1
,...sn*
)
ui
(si*
,
s* i 1
,
sij
,
si*1,...sn*
)
对任意 si j Si 都成立,则称 (si*, sn* ) 为 G 的一个纳什
均衡
纳什均衡的一致预测性质
•一致预测:
– 如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会 利用该预测或者这种预测能力,选择与预测结果不一致的策略,即没 有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈 的最终结果
•博弈方i 的得益:ui
•博弈:G {S1, Sn;u1, un}
•纳什均衡:在博弈G {S1, Sn;u1, un} 中,如果由各个博弈
方的各一个策略组成的某个策略组合(si*, sn* ) 中,任一博弈
方i
的策略,都是对其余博弈方策略的组合
( si* ,
s* i 1
,
s* i 1
,...sn*
• 做法: – 首先找出某博弈人的严格下策,把这个严格下策剔除后,剩下的是一 个不包含已剔除劣策略的新的博弈;然后再剔除这个新的博弈中的严 格下策;继续这个过程,直到没有劣策略存在。如果剩下的策略组合 是唯一的,这个唯一的策略组合就是严格下策反复消去法的均衡
严格下策反复消去法
左中
右
左
中
上 1,0 1,3 0,1
囚
徒
-3,-3
0, -6
情 侣
困
-6, 0
-1, -1
博
境
弈
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
2, 1 0, 0
0, 0 1, 3
纳什均衡的定义
•纳什均衡:所有参与人的最优策略的组合--给定该策略中 别人的选择,没有人有积极性改变自己的选择。
•策略空间:S1, Sn
•博弈方i 的第 j个策略:si j Si
– 稳定的和自我强制的,所以是真正可预测的 – 反之,不具有一致预测性的博弈结果,则难以避免预测和行为之间的
矛盾,甚至是自我否定的。
•只有纳什均衡才具有一致预测的性质 •一致预测性是纳什均衡的本质属性 •一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致 的可能
寻找纳什均衡
C1
C2
C3
R1
• 混合策略:在博弈 G {S1, Sn;u1, un} 中,博弈方i 的策略 空间为 Si {si1, s,ik }则博弈方i 以概率分布
pi ( pi1, pik ) 随机在其 k个可选策略中选择的“策略”,
称为一个“混合策略”,0其 中pij 1 j 1对, , k
都成立,且
pi1 pik 1
• 也有时:情侣博弈中,用划线法有两个策略组合同时下面划线,这意味着 两个策略组合中的双方策略都是对对方策略的最佳对策--都具有内在的 稳定性--但具体那一个会出现,无法确定。
划线法
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
囚 徒
-5, -5
0, -8
情来自百度文库侣
困
-8, 0
境
-1, -1
博
• 静态:博弈方是同时决策的,或者虽然各博弈方决策的 时间不一定真正一致,但他们在做决策时互相不知道其 他博弈方的策略。
• 完全信息静态博弈:各博弈方同时决策,且所有博弈方 对各方得益都了解的博弈。
• 如何求这一类博弈的解呢?--博弈的结果如何?-- 博弈各方最终的策略组合?
上策均衡法
• 上策均衡:一个博弈的某个策略组合中的所有策略都是 各个博弈方各自的上策
得五体投地,她怎么肯放过正宗俄罗斯的芭蕾舞剧《胡桃夹子》?这么说,一
个在家里看电视直播的足球,一个去剧院看芭蕾舞演出不就得了?问题在于他
们是热恋中的情侣,分开各自度过这难得的周末时光,才是最不乐意的事情。
这样一来,他们就面临一场温情笼罩下的“博弈”
• 在情侣博弈中, 我们不妨这样给大海和小丽的“满意程度”赋值:如果大 海看球让小丽一个人去看芭蕾,双方的满意程度都为0;两人一起去看足球, 大海的满意程度为2,小丽的满意程度为1;两人一起去看芭蕾,大海的满意程 度为1,小丽的满意程度为2。应该不会有小丽独自看球而大海独自去看芭蕾的 可能,不过人们还是把它写出来,设想因此双方的满意程度都是-1。
• 混合策略扩展博弈:博弈方在混合策略的策略空间(概率
分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩
展博弈)
• 混合策略纳什均衡:包含混合策略的策略组合,构成纳什 均衡—任何博弈一方单独改变自己的策略,或者随机选择各个 纯策略的概率分布,都不能给自己增加任何利益
求混合策略纳什均衡
• 思路:
• 试着用一个得益矩阵来描述大海和丽娟的情侣博弈
情侣博弈的得益矩阵
小丽
足球
芭蕾
足球
1
2
0 0
大海
芭蕾
-1
-1
2 1
靠左走还是靠右走
• 在一个没有交通规范的农村小路骑自行车,你应该走 在道路的哪一边?
• 假如别人靠右(左)走,你也 靠右(左)走,则不会 相撞;反之,假如别人靠右(左)走,而你却反其道 而行之,偏要靠左(右)走,则必然相撞。
• 画出智猪博弈的得益矩阵
“智猪博弈”(boxed pigs)
•
小猪
按 等待
大
按
5,1 4,4
猪
等待 9,-1 0,0
经典博弈之四--猎人博弈
• 设想在古代的一个地方,有两个猎人。那时候,狩猎是人们的 主要生计。为了简单起见,假设主要的猎物只有两种: 鹿,兔子。 在古代,人类的狩猎手段还比较落后,弓箭威力也有限。在这样的 条件下,我们可以进一步假设,两个猎人一起去猎鹿,才能猎获一 只鹿,如果一个猎人单兵作战,他只能打到4只兔子。如果他打兔 子,你去猎鹿,他可以打到4只兔子,而你一无所获,得0。
pA+pB=1;
pC+pD=1
策略
得益
博弈方1 (0.8,0.2) 2.6
博弈方2 (0.8,0.2) 2.6
齐威王田忌赛马
Pa 上中下
齐 Pb 上下中 威 Pc 中上下 王 Pd 中下上
Pe 下上中 Pf 下中上
Pg
上 中 下
3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
ph
上 下 中
100,100 0,0
50,101
R2
50,0 1,1
60,0
R3
0,300 0,0 200,200
纳什均衡:举例
• 广告博弈
战略
企业2
做广告 不做广告
企业1
做广告 4,4 15,1 不做广告 1,15 10,10
• 纳什均衡:(做广告,做广告)
上次的作业
• 画出田忌赛马的得益矩阵 • 画出猜硬币博弈的得益矩阵 • 画出石头、剪子、布的得益矩阵 • 能否用我们今天的几种方法得到均衡解
• 失效原因
– 不同策略之间没有绝对的优劣,而只存在相对的、有条件的 优劣
划线法
• 思路:
– 以策略之间的相对优劣关系,而不是绝对优劣关系为基础 – 先找出自己针对其他博弈方每种策略或策略组合(多人博弈)的最佳对策,
然后在此基础上,通过对其他博弈方策略选择的判断, 预测可能的结果和确 定自己的最优策略
1,0 1,3
下 0,4 0,2 2,0
0,4 0,2
左
中
1,0 1,3
严格下策反复消去法
• 智猪博弈
小猪
按 等待
大
按
5,1 4,4
猪
等待 9,-1 0,0
严格下策反复消去法
• 适用面:
– 严格下策反复消去法的适用面比上策均衡要更大些 – 但也有很多博弈问题没有严格下策:田忌赛马、猜硬币、情
侣博弈、交通博弈、石头剪刀布、、、--此时,该方法失 效。 – 最大的用处:简化博弈
– 与划线法一样都是基于策略之间的相对优劣关系进行分析的, 所得到的结果也是一致的。
– 如果能,则从所分析的策略组合对应的得益数组引一箭头, 到改变策略后策略组合对应的得益数组
– 最后,只有指向,没有离开的策略组合为均衡解--稳定- -没有人愿意单独改变
箭头法
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
弈
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
2, 1 0, 0
0, 0 1, 3
课堂习题
• 用划线法求出均衡解
C1
C2
C3
R1
0,4 4,0 5,3
R2 4,0 0,4 5,3
R3 3,5 3,5 6,6
箭头法
• 思路:
– 对博弈中的每一个策略组合进行分析,考察在每个策略组合 处各个博弈方能否通过单独改变自己的策略而增加得益
经典博弈故事之二--情侣博弈
•
大海和小丽正在热恋。难得的周末又到了,安排什么节目呢?周末晚上,
中国足球队要在世界杯外围赛中和伊朗队做生死之战。大海是个超级球迷,国
内的甲级联赛都不肯放过,何况是不争气的国家队的生死大战?也正好是这个
周末的晚上,俄罗斯一个著名芭蕾舞团莅临该市演出芭蕾舞剧《胡桃夹子》。
丽娟最崇尚钢琴、芭蕾这样的高雅艺术,对斯拉夫民族的歌唱和芭蕾更是崇拜
– 上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他 带来的得益始终高于其它的策略,至少不低于其他策略的策略
– 囚徒的困境中的“坦白”;双寡头削价中“低价”。
• 上策均衡反应了所有方的绝对偏好,因此是非常稳定 , 可以作出最肯定的预测。
• 上策均衡不是普遍存在的,所以该方法失效 • 失效原因:
囚 坦白 徒
1 不坦白
囚徒 2
坦白
不坦白
-3, -3
0, -6
-6, 0
-1, -1
两个罪犯的得益矩阵
严格下策反复消去法
• 严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总 是比另一种策略给他带来的收益小的策略
• 思路: – 任何理性的博弈方都不可能选择严格下策 – 把不可能选择的严格下策先排除掉--排除法,从而留下较好的策略
? • 你觉得它们的最佳应对策略是什么?
严格竞争博弈和混合策略的引进
一、猜硬币博弈
盖 正面 硬 币 反面 方
猜硬币方
正面
反面
-1, 1
1, -1
1, -1
-1, 1
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略--保持随机性
这类博弈很多,引出混合策略纳什均衡概念
混合策略、混合策略博弈 和混合策略纳什均衡
1,-1 3,-3 -1,1 1,-1 1,-1 1,-1
• 假设行走顺利,每人获益为1,相撞,则获益为-1, • 画出得益矩阵
交通博弈
乙
靠左行
靠右行
靠左行
甲
靠右行
1,1 -1,-1
-1,-1 1,1
经典博弈故事之三--智猪博弈
• 笼子里面有两只猪,一只比较大,一只比较小。笼子很长,一头 有一个按钮,另一头是饲料的出口和食槽。按一下按钮,将有相当 于10个单位的猪食进槽,但是按按钮以后跑到食槽所需要付出“劳 动”,加起来要消耗相当于2个单位的猪食。问题是按钮和食槽分 置笼子的两端,按按钮的猪付出劳动跑到食槽的时候,坐享其成的 另一头猪早已吃了不少。如果大猪先到,大猪呼啦啦吃到9个单位, 小猪只能吃到1个单位;如果同时到达,大猪吃到7个单位;小猪吃 到3个单位;如果小猪先到,小猪可以吃到4个单位,而大猪吃到6 个单位。
• 只有,两方均被划线的策略组合,才是稳定的策略--表明给定一方采用 该策略组合中的策略,则另一方也愿意采用该策略组合中的策略,该策略 组合具有稳定性。
• 但是,许多博弈根本不不存在确定性的结果,划线法失效,比如猜硬币- -没有一个策略组合是双方同时愿意接受的,这样的博弈根本不可能有可 以预言的博弈结果
– 各个博弈方选择的纯策略的概率分布,要求 满足使对方或其他博弈方采用不同策略的期 望收益相同
一个例子
该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析
博弈方1的混合策略
pA 3 pB 1 pA 2 pB 5
博 弈A 方B 1
博弈方2
C
D
2, 3 5, 2
3, 1 1, 5
博弈方2的混合策略
pC 2 pD 5 pC 3 pD 1
• 画出得益矩阵
博弈论故事之五--高薪养廉
• 我们把数据改变一下,变成薪水只有2, 两个串谋,同时受贿还是得9;一方受贿, 一方不受贿,则分别为2,3。
• 得益矩阵?
高薪养廉的得益矩阵
乙
受贿
不受贿
受
9
甲贿 9
8 0
不
0
受
贿8
7
乙
7
受贿
不受贿
受
9
贿9
0
甲
不
0
受 贿
3
2
完全信息静态博弈
• 完全信息:各博弈方都完全了解所有博弈方各种情况下 得益