定义纳什均衡定义纳什均衡-上海财经大学经济学院
简述纳什均衡的完整定义
简述纳什均衡的完整定义纳什均衡是经济学中一种非常重要的概念,它可以帮助研究者更好地理解和分析商业市场中的结构和行为,从而制定更有效和合理的市场规则和监管政策。
纳什均衡是由美国经济学家纳什在1952年提出的,它是一种经济系统中发现的一种特殊状态,在该状态下每一方都达到了自我利益的最优化,也即互利共赢的状态。
完整的定义:纳什均衡是一种经济系统中的元素之间的特殊状态,在该状态下参与者均衡主体之间的行为,使他们能够达到自身利益最大化的最佳状态,也即互利共赢的状态。
纳什均衡可以用于研究各种市场状况下的抉择决策,其中每一方都在实现自身利益的同时,也有利于其他参与者获取最大利益。
在具体的经济学中,纳什均衡的概念有着十分重要的地位,它是研究市场结构及其行为的基础。
纳什均衡的概念可以用来分析商业市场的作用、判断行为的合理性以及指导政府有效地实施市场监管政策。
从宏观层面来讲,纳什均衡是一种很有效的解决问题的方法,因为它可以使所有参与者都能实现利益最大化;而从微观层面来讲,纳什均衡可以帮助研究者了解市场结构中某一方可能采取的行为态度,以及市场如何做出反应。
纳什均衡的分析模型包含了三个基本假设:第一,存在多个参与者,每一方都希望达到最大的利益;第二,这些参与者都具有完备的信息;第三,参与者之间可以自由协商。
这三个基本假设能够帮助研究者更好地理解市场行为的决定因素。
另外,纳什均衡独特的结构特性也是其重要的特点之一。
它可以通过对各种不同的定价策略和其他参数,来模拟不同类型的商业市场,从而帮助研究者更好地理解市场中的不同类型行为。
此外,纳什均衡也被用于评估政府政策的影响,以及制定公平、合理的市场规则。
它可以帮助研究者更好地分析政府改革举措的影响,以及确定最有效的市场监管政策。
总之,纳什均衡是一个概念非常重要的概念,它不仅可以帮助研究者更好地理解和分析商业市场中的结构和行为,而且可以帮助研究者更好地分析政府改革举措和市场监管政策的影响。
纳什均衡理论课件
迭代逼近法
总结词
通过不断迭代和调整策略来逼近纳什均 衡。
VS
详细描述
迭代逼近法是一种通过不断迭代和调整参 与者的策略,以逐渐逼近纳什均衡的方法 。这种方法可以在不知道具体的纳什均衡 的情况下,通过迭代过程找到近似解。
04
纳什均衡的扩展与深化
非合作博弈中的纳什均衡
要点一
总结词
非合作博弈中,纳什均衡是指参与人选择策略时,没有达 成任何协议或合作,各自追求自身利益的最大化。
纳什均衡理论课件
目录 CONTENTS
• 纳什均衡理论概述 • 纳什均衡的分类与特性 • 纳什均衡的证明方法 • 纳什均衡的扩展与深化 • 纳什均衡理论的现实应用 • 纳什均衡理论的前沿研究与展望
01
纳什均衡理论概述
定义与概念
纳什均衡定义:在博弈中,如果每个参与者的策略都是针对其他参与者的最优策略 ,则该博弈状态被称为纳什均衡。
社会学
纳什均衡理论在社会学中用于研究社会行为、合作与冲突 、社会规范等领域,揭示了社会现象背后的博弈逻辑。
生物学
在生物学中,纳什均衡理论用于研究生物种群竞争、进化 策略等领域,解释了生物种群之间的生存竞争与演化现象 。
政治学
在政治学中,纳什均衡理论用于分析国际关系、政治竞争 等领域,揭示了权力与利益分配的博弈逻辑。
社会冲突管理
在处理社会冲突时,可运用纳什 均衡理论来分析各方的利益和策 略,寻求最优解决方案。
公共资源管理
在管理公共资源时,政府可运用 纳什均衡理论来分析个体和团体 的竞争策略,制定最佳资源分配 方案。
06
纳什均衡理论的前沿研究与展望
当前研究热点与难点
热点
复杂系统中的纳什均衡、多智能 体系统中的纳什均衡、网络博弈 中的纳什均衡
纳什均衡的完整定义
纳什均衡的完整定义纳什均衡是博弈论中一种解的概念,它是指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。
简介纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
历史背景关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。
实际上,博弈论的研究起始于1944年约翰·冯·诺依曼(Von Neumann)和奥斯卡·摩根斯特恩(Oscar Morgenstern)合著的《博弈论和经济行为》。
然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性[1] ,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。
阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。
它发展了本身很有意义的n人有限非合作博弈的概念和性质。
并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。
在概念和方法两方面,该论文都是作者的独立创造。
解释现实中的纳什均衡现象
VS
政治联盟
在某些政治体系中,政治家或政党可能会 结成联盟,以增加自己的政治影响力。这 种联盟的形成也可以看作是一种纳什均衡 。
国际贸易
关税壁垒
在国际贸易中,国家可能会采取关税 壁垒来保护本国产业。如果所有国家 都采取这种策略,最终可能导致全球 贸易量下降,形成纳什均衡。
自由贸易协定
为了避免关税壁垒带来的负面影响, 国家之间可能会达成自由贸易协定, 降低或取消关税。这种协定的达成也 可以看作是一种纳什均衡。
激励机制
设计合理的奖励机
制
通过设计合理的奖励机制,激励 参与者采取合作行为,避免陷入 纳什均衡。
惩罚不合作行为
对采取不合作行为的参与者进行 适当的惩罚,以减少不合作行为 的发生,促进合作。
引入竞争机制
通过引入竞争机制,激励参与者 采取更好的策略和行为,打破纳 什均衡。
信息披露
增加信息透明度
通过增加信息透明度,减少信息不对称,让参与者更好地了解彼此 的策略和行为,从而避免陷入纳什均衡。
它是一种非合作博弈均衡,基于参与 者理性假设和自利原则,是博弈论中 的基本概念之一。
纳什均衡的重要性
揭示博弈中策略选择的本质
纳什均衡揭示了博弈中参与者策略选择的本质,即为了实 现自身利益最大化,参与者会选择对自己最有利的策略。
指导政策制定
在政策制定中,了解纳什均衡的存在及其特点,有助于政 府制定出更有效的政策,引导市场主体理性决策。
解释现实中的纳什均衡现象
目录
• 纳什均衡简介 • 纳什均衡的实例 • 现实生活中的纳什均衡现象 • 如何应对纳什均衡现象 • 纳什均衡的未来研究方向
01纳什均衡简介源自定义与概念纳什均衡是指在博弈论中,一种所有 参与者都不愿意偏离的策略组合,即 每个参与者都认为当前策略是最好的 ,不会选择其他策略。
纳什均衡
纳什均衡纳什均衡,又称为非合作赛局平衡,是博弈论的一个重要概念,以约翰·纳什命名。
如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点。
1.基本定义假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。
所有局中人策略构成一个策略组合(Strategy Profile)。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。
即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡,从实质上说,是一种非合作博弈状态。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。
纳什均衡也不意味着博弈双方达到了一个整体的最优状态。
2. 具体分类纳什均衡可以分成两类:“纯战略纳什均衡”和“混合战略纳什均衡”。
要说明纯战略纳什均衡和混合战略纳什均衡,要先说明纯战略和混合战略。
所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。
特别地是,纯战略决定在任何一种情况下要做的移动。
战略集合是由玩家能够施行的纯战略所组成的集合。
而混合战略是对每个纯战略分配一个机率而形成的战略。
混合战略允许玩家随机选择一个纯战略。
混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。
因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。
当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。
故“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。
并不是每个赛局都会有纯战略纳什均衡,例如“钱币问题"就只有混合战略纳什均衡,而没有纯战略纳什均衡。
不过,还是有许多赛局有纯战略纳什均衡(如协调赛局,囚徒困境和猎鹿赛局)。
纳什均衡的概念
纳什均衡的概念纳什均衡是博弈论中的重要概念,指的是在一个博弈中,所有参与者都选择了自己的最佳策略,不存在更好的选择,即达到了一种均衡状态。
纳什均衡是在参与者之间相互博弈的情况下,每个参与者都选择了自己的最佳策略,并且其他参与者也同时选择了最佳策略,从而实现了一种平衡状态。
纳什均衡最早由约翰·纳什提出,他于1950年发表了研究博弈论的著名论文《非合作博弈》。
在该论文中,纳什定义了纳什均衡,并利用数学方法证明了简单博弈的纳什均衡存在性。
由于纳什均衡的提出和研究,他获得了1994年的诺贝尔经济学奖。
纳什均衡的理论适用范围非常广泛,涵盖了众多社会科学领域,如经济学、政治学、社会学等。
在经济学领域,纳什均衡被广泛运用于市场竞争、价格确定、产出决策等方面的分析。
在政治学领域,纳什均衡被应用于国际关系、选举竞争等问题的研究。
在社会学领域,纳什均衡被用于解析社会合作、集体行动的机制等等。
为了更好地理解纳什均衡的概念,我们可以通过一个具体的博弈案例来说明。
假设有两个企业A和B在某个市场上销售相同的产品,它们可以选择两种不同的定价策略:高价策略和低价策略。
企业A和B都知道,如果它们选择相同的策略,市场将会处于均衡状态;如果它们选择不同的策略,市场将会出现不稳定的情况。
在这个博弈中,我们可以使用一个博弈表来表示两个企业的策略和回报。
假设高价策略带来的利润分别为5和2,低价策略带来的利润分别为3和4。
根据这个博弈表,我们可以得到以下结论:如果企业A选择高价策略,那么企业B选择高价策略可以带来较高的利润,所以企业B将会选择高价策略。
如果企业A选择低价策略,那么企业B选择低价策略可以带来较高的利润,所以企业B同样会选择低价策略。
综上所述,无论企业A选择高价策略还是低价策略,企业B都会选择低价策略,从而形成了一个纳什均衡。
在这种均衡状态下,企业A的最佳策略是低价策略,而企业B的最佳策略也是低价策略,两个企业都无法通过改变自己的策略来获得更高的利润。
2016考研:什么是“纳什均衡”
2016考研:什么是“纳什均衡”缅怀纳什:什么是“纳什均衡”我们一起来回顾纳什均衡的概念及定义:纳什均衡是博弈论最重要、最一般化的均衡概念。
它是指所有参与人战略的这样一种组合:在这一组合中,给定其他参与人的战略,没有任何人有积极性改变自己的战略。
换言之,构成纳什均衡的战略对每个人都是最优的。
缅怀纳什:什么是“纳什均衡”常老师认为这样的一种定义首先有点晦涩难懂,其次缩小了纳什均衡的应用范畴,老师在讲经济学中一直强调纳什均衡是生活中、经济学中等等一切最重要最一般化的均衡概念。
纳什均衡就是均衡,因为任何一种均衡如果不满足纳什均衡的条件,就压根不能称为均衡。
通俗地理解:均衡首要的特征是一种“稳定的结果”,即每个人做出选择后,不想再去改变了,为什么不想再去改变了?因为没有更好的选择了,我已经选择了对我来说最好的选择。
纳什均衡特别强调了什么时候才能稳定:人都是自私的,在现有条件下,只有每个人都得到了最大的满足,才不会有人去破坏约定。
这是稳定的基本条件。
经济学基础理论“看不见的手”为什么说纳什均衡改变了经济学的基础理论呢?我们先来看看经济学的基础理论是什么?亚当斯密1776年在《国富论》里提出了“看不见的手”理论。
什么是“看不见的手”即市场机制,价格机制即在市场中,价格作为一种信息引导着资源的配置,最终达到的均衡是有效率的。
这里面的均衡跟纳什均衡的定义完全一模一样,纳什并没有否定。
纳什否定的是“有效率”。
传统经济理论认为:市场机制中,个人追求自身利益最大化,最终会导致集体利益最大化,即是有效率的。
纳什的创新之处就是否定了这样一种观点:个人按照自身利益最大化去决策,达到的结果并不一定意味着集体利益最大化。
即个人利益最大化与集体利益最大化并不总是一致的,是有冲突的。
《美丽心灵》里的片段看过这部奥斯卡最佳影片的同学都应该还记得酒吧里舞会的那种情景,大家都在尽情调侃的时候,纳什一个人搬着桌子在那里学习,然后就是这样一种场景诱导他有了新的发现,最后带着满足的笑容匆匆离开时说了这样一句经典台词:“Adam Smith is wrong”。
Game_04_纳什均衡(纯策略)
3. 信念的协调
• 例:投资博弈
• 信念与行动一致
– 每个人对他人策略选择有着正确的信念 参与者 2 X L 参与者 1 F T 1, 0 0, 3 2, 1 Y 2, 2 0, 1 0, 0 Z 0, 1 2, 1 1, 2
9 10
乙 投资 甲 投资 不投资 (5, 5) 不投资 (-10, 0)
投资 不投资
(5, 5) (0, -10)
投资博弈:N=2
• 称策略组合 (投资,投资)、 (不投资,不投资) 为纳什均衡
– 没有单方偏离激励,具有自我实施性质
定义:纳什均衡
• 策略组合 s*=(s*1, s*2)是纳什均衡,如果 – 参与者的策略互为最优反应 • u1 (s*1, s*2) ≥ u1 (s1, s*2) – s*1=b1(s*2) s b (s 任意 s1 ∈S1
乙 投资 甲 投资 不投资 (5, 5) (0, -10) 不投资 (-10, 0) (0, 0)
5
• u2 (s*1, s*2) ≥ u2 (s*1, s2) – s*2=b2(s*1)
任意 s2 ∈S2
6
1
2. 纳什均衡与占优
• 占优策略组合:(坦白,坦白)
–是纳什均衡
2. 纳什均衡与占优
• 重复剔除严格劣策略得到的唯一策略组合: (X,X)
15
c
甲 c d (0, 0) (2, -1))
⎧ si if s1 +s 2 ≤ 100 ui ( s ) = ⎨ ⎩0 if s1 +s 2 >100
i = 1, 2
16
16
例:分饼博弈
• 参与者 i 的最优反应函数
例:分饼博弈
纳什均衡
弈
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
2, 1 0, 0
0, 0 1, 3
课堂习题
• 用划线法求出均衡解
C1
C2
C3
R1
0,4 4,0 5,3
R2 4,0 0,4 5,3
R3 3,5 3,5 6,6
箭头法
• 思路:
– 对博弈中的每一个策略组合进行分析,考察在每个策略组合 处各个博弈方能否通过单独改变自己的策略而增加得益
– 与划线法一样都是基于策略之间的相对优劣关系进行分析的, 所得到的结果也是一致的。
– 如果能,则从所分析的策略组合对应的得益数组引一箭头, 到改变策略后策略组合对应的得益数组
– 最后,只有指向,没有离开的策略组合为均衡解--稳定- -没有人愿意单独改变
箭头法
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
经典博弈故事之二--情侣博弈
•
大海和小丽正在热恋。难得的周末又到了,安排什么节目呢?周末晚上,
中国足球队要在世界杯外围赛中和伊朗队做生死之战。大海是个超级球迷,国
内的甲级联赛都不肯放过,何况是不争气的国家队的生死大战?也正好是这个
周末的晚上,俄罗斯一个著名芭蕾舞团莅临该市演出芭蕾舞剧《胡桃夹子》。
丽娟最崇尚钢琴、芭蕾这样的高雅艺术,对斯拉夫民族的歌唱和芭蕾更是崇拜
– 稳定的和自我强制的,所以是真正可预测的 – 反之,不具有一致预测性的博弈结果,则难以避免预测和行为之间的
矛盾,甚至是自我否定的。
•只有纳什均衡才具有一致预测的性质 •一致预测性是纳什均衡的本质属性 •一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致 的可能
纳什均衡
纳什均衡在政治学中的应用
选举策略:候选人在竞选活动中的决策和策略选择 政治谈判:国家间在谈判过程中的策略选择和利益平衡 国际关系:国家间在合作与竞争中的决策和策略选择 政治制度设计:政治制度设计中的决策和策略选择,如选举制度、议会制度等
纳什均衡在管理学中的应用
战略决策:企业在市场竞争中,通过纳什均衡分析,制定最优策略。 组织结构:纳什均衡理论可以帮助企业优化组织结构,提高管理效率。 激励机制:纳什均衡理论在企业激励机制设计中,可以指导企业制定有效的激励措施。 谈判与合作:纳什均衡理论在企业谈判与合作中,可以帮助企业实现利益最大化。
纳什均衡的应用
博弈论:纳什均衡是博弈论的核心概念,用于分析各种博弈问题 经济学:纳什均衡在经济学中广泛应用,如市场均衡、价格均衡等 政治学:纳什均衡在政治学中用于分析政治博弈,如选举、谈判等 社会学:纳什均衡在社会学中用于分析社会现象,如群体行为、社会规范等
纳什均衡的求解方法
第二章
纳什均衡的求解条件
纳什均衡
目录
CONTENTS
01 纳什均衡的概念 02 纳什均衡的求解方法 03 纳什均衡与博弈论 04 纳什均衡的局限性
05 纳什均衡纳什均衡的定义
纳什均衡是指在 一个博弈中,每 个参与者的策略 都是对其他参与 者策略的最优反 应。
纳什均衡是博弈 论中的一个重要 概念,由约翰·纳 什提出。
纳什均衡的求解步骤
确定博弈的 参与者和策 略集
建立支付矩 阵,表示参 与者在不同 策略下的收 益
计算每个参 与者的最佳 反应策略
检查是否存 在纳什均衡, 即每个参与 者的策略都 是对其他参 与者策略的 最佳反应
如果存在纳 什均衡,则 求解得到均 衡策略;如 果不存在, 则重新调整 策略集或支 付矩阵,重 复步骤3-4。
纳什均衡定义
纳什均衡定义:假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。
所有局中人策略构成一个策略组合(Strategy Profile)。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。
即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
囚徒困境(prisoner's dilemma ):两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
来源囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。
警察知道两人有罪,但缺乏足够的证据。
警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。
于是,每个囚徒都面临两种选择:坦白或抵赖。
然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。
结果,两个嫌疑犯都选择坦白,各判刑八年。
如果两人都抵赖,各判一年,显然这个结果好。
但这个帕累托改进办不到,因为它不能满足人类的理性要求。
囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
主旨囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
经济博弈论第五章 离散博弈中的纳什均衡
票
支付矩阵如下: 3投A 2 A B C 2, A 0, 0 2, 1 B 0, 0 2, C 0, 0 2, 0, 0 1, 2, 1 2, 0, 0 2, 0, 0 2, 0, 0 0, 1, 2 3投B 2 A B C 3投C 2
股 东 投 票
2, A 0, 0 1, 1 B 2, 1 1, C 2, 1
1, 2, 1 1, 2, 1 1, 2, 1
1, 2, 1 1, 2, 1 0, 1, 2
A B C
2, 0, 0, A 0, 1, 1, 0 2 2 1
0 B 1, 2 0, C 1, 2
1, 2, 1 0, 1, 2
0, 1, 2 0, 1, 2
股 东 投
均衡求解如下:5个纳什均衡 (AAA)(ACC)(BBB)(BBC)(CCC) 一个纳什均衡不能排除一个参与者使用弱劣策略的可能性 3投A 3投B 3投C
嫌疑人2 坦白 嫌疑人 1 不坦白 坦白 -2,-2 -3,0 不坦白 0,-3 -1,-1 转弯 赛车手2
转弯 赛车手 1 不转弯
2, 2 3, 1
不转弯
1, 3 0, 0
都有占优策略, 有1个纳什均衡
都没有占优策略, 有2个纳什均衡
司机2
左边行驶
右边行驶
-1,-1 1,1
行 驶
司机1
左边行驶 右边行驶
0,1,0
1,0,0
参与者3采取策略D2
TR TR D2 D3 1,0,0 1,0,0 1,0,0 D1 1,0,0 1,0,0 1,0,0 D3 1,0,0 1,0,0 1,0,0
求解结果如下:19个纳什均衡。 说明纳什均衡定义不够严格,对我们的帮助很有限。
什么是“纳什均衡”?电影《美丽心灵》完全搞错了!
什么是“纳什均衡”?电影《美丽心灵》完全搞错了!美国时间23日,数学家约翰·纳什与妻子阿莉西亚在新泽西乘出租车时不幸车祸身亡,一颗巨星就此陨落。
我们常在著名概念“纳什均衡”中听到他的名字,但纳什均衡究竟是什么?大部分人都一知半解。
下面这条问答就用最简明的例子来解读这个伟大的博弈论概念:问题:什么是纳什均衡?电影《美丽心灵》里对纳什均衡的表述,是对的吗?魏郎尔回答:因为美丽心灵这部电影,弄得好多人没有真的懂纳什均衡是在说啥……电影里的大意是这样:四个朋友在酒吧里看上了一个美女,都想去搭讪,纳什说,如果我们按照亚当斯密的观点,每人都只为自己着想,一上来就都去找她,就会互相干扰,最后谁也得不到。
但是大家(按照纳什的观点)既考虑自己的利益,又考虑整体的利益,分别各自去找她的同伴,结果就是大家都获益。
但是,这特么根本不是纳什均衡呀……定义:在非合作类博弈中,如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处。
(纳什证明了,如果允许混合策略,那么任何一个博弈,只要参与者数量是有限的、参与者可以选择的纯策略也是有限的,那么这个博弈至少有一个纳什均衡。
)(另外,别把纳什均衡和囚徒困境混了。
纳什均衡是个广泛得多的概念。
)例子:打猎。
两个猎人出发去打猎。
假设一头鹿有400公斤肉,但必须两人合作才能打到,一个人打什么都获得不了。
同地区有一群兔子,一共有200公斤肉,两人合作可以全部打完,但一个人打也可以获得100公斤肉。
两个猎人各自都知道对方的平衡策略,但不能通过任何方式影响对方的决策。
最终的结果会怎样?那么,A 鹿B 鹿: 200,200A 鹿B 兔: 0,100A 兔B 鹿: 100,0A 兔B 兔: 100,100这里面有两个纳什均衡。
(1)两人都猎鹿:任何一人单方切换成猎兔子,都会让自己的收益从200跌到100。
(2)两人都猎兔子:任何一人单方切换成猎鹿,都会让自己的收益从100跌到0。
《博弈论与信息经济学》纳什均衡
情侣博弈中,如果双方都预见到对方的策略,并选择相同的策略 ,形成完美纳什均衡。
04
信息经济学与纳什均衡
信息经济学的基本概念
信息经济学是一门研究信息不对称条件下市场交易行为的学科。 它探讨了信息不对称如何影响市场交易,以及如何通过制度安排 来减少信息不对称对市场交易的影响。
信息经济学主要关注信息获取、信息传递、信息披露和信息甄别 的成本和效益,以及这些因素如何影响市场交易和资源配置。
纳什均衡的未来研究方向
放宽假设条件
未来的研究可以尝试放宽纳什均衡的假设条 件,使其更接近现实情况,提高理论的适用 性。
探索混合策略
混合策略是纳什均衡中的一个重要概念,但目前对 其研究还不够深入,未来可以进一步探索混合策略 的性质和应用。
博弈论与其他学科的交叉 研究
可以尝试将博弈论与其他学科(如心理学、 社会学等)进行交叉研究,以更全面地理解 人类行为和市场现象。
信息经济学还涉及到公共品、外部性、垄断等其他市场失灵问题,旨在通过合理的制度安排来解决这些 问题,促进市场的有效运行和社会福利的最大化。
05
纳什均衡的实例分析
囚徒困境的纳什均衡
总结词
在囚徒困境中,两个囚犯都有坦白和抵赖两种选择,最终的纳什均衡是两个囚犯都选择 坦白,即(坦白,坦白)。
详细描述
在囚徒困境中,两个囚犯都有坦白和抵赖两种选择。如果一个囚犯选择抵赖,而另一个 选择坦白,那么选择抵赖的囚犯将会被判刑更长时间。然而,如果两个囚犯都选择抵赖 ,他们都将被判刑较短时间。但由于囚犯之间无法建立信任,最终的纳什均衡是两个囚
纳什均衡在经济学中的影响与贡献
01
丰富了经济学理论
纳什均衡为经济学提供了一种重 要的分析工具,丰富了经济学理 论体系。
纳什均衡与囚徒困境
交通拥堵中的纳什均衡
在交通拥堵中,如果所有驾驶员都选择走某一 条路,那么这条路就会变得非常拥堵。
如果一个驾驶员选择走另一条路,那么他可能 会更快地到达目的地,但其他驾驶员也可能会 效仿,导致另一条路也变得拥堵。
纳什均衡在交通拥堵中的表现为:所有驾驶员 都选择走同一条路,形成一种稳定的交通状态。
公共资源中的纳什均衡
建立信任
通过建立信任机制,让囚犯相 信对方不会出卖自己,从而都
选择抵赖。
引入第三方监管
由第三方监管机构介入,制定 规则并监督执行,确保双方都 遵守规则。
改变奖励机制
改变奖励机制,使得双方都选 择抵赖成为最优解,例如将坦 白惩罚变得更重。
增加沟通机会
让囚犯有更多的沟通机会,了 解对方的想法和处境,从而更
企业竞争中的囚徒困境
价格战
01
企业为了争夺市场份额,可能会采取降价策略,但这种策略可
能导致整个行业的利润下降。
技术研发
02
企业在研发新技术时面临投入不足或过度投入的困境,如何平
衡研发投入与市场收益是一大挑战。
广告策略
03
企业在广告投放上可能存在囚徒困境,过多的广告投入可能增
加品牌知名度,但也可能导致广告费用过高而降低利润。
01
02
03
公共资源是指那些不属于任何个 人或组织的资源,如海洋、森林、 空气等。
在公共资源的使用中,如果每个 人或组织都过度使用资源,那么 资源将会被耗尽或使用 资源,导致资源的过度消耗和破 坏,形成一种稳定的竞争状态。
05 囚徒困境的实例分析
促进学科发展
纳什均衡与囚徒困境的研究推动了博弈论和其他相关学科的发展,促进了学术交流和知识创新。
纳什均衡的定义和应用范围
纳什均衡的定义和应用范围一、定义在不完全信息博弈当中,所有参与博弈的人策略构成一个策略组。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成,即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡又称为非合作博弈均衡,由美国数学家约翰·纳什在1950年提出,他的论文《Non-cooperative Games》奠定了现代博弈论的基础。
1994年,纳什因在博弈论领域的杰出贡献获得诺贝尔经济学奖。
纳什均衡描述了一种策略组合,在这种组合中,任何一个参与者都无法通过单方面改变自己的策略来获得更好的结果。
换句话说,当每个玩家都在使用纳什均衡中的策略时,没有人有动力去偏离自己的策略。
具体来说,在一个包含多个参与者的博弈中,如果每个参与者的策略都是对其他参与者策略的最佳回应,则这个策略组合称为纳什均衡。
二、纳什均衡的应用纳什均衡的应用非常广泛。
在经济学中,可用于帮助解释和预测市场竞争、拍卖设计和定价策略等行为。
在政治学中,可用于分析选举策略、联盟形成和国际关系中的策略选择。
在生物学中,进化博弈理论通过运用纳什均衡来解释动物行为和进化稳定策略。
在社会科学中,纳什均衡用于研究社会规范、合作行为和冲突解决机制。
此外,纳什均衡还在计算机科学中的网络设计、算法博弈论和多代理系统中应用广泛。
纳什均衡作为博弈论中的重要概念,指导着决策制定者在互动环境中做出理性选择的策略。
纳什均衡的应用不仅帮助我们理解和解释了许多现实世界中的决策行为,同时也为我们提供了指导理性决策的思路和方法。
我们可以进一步探索纳什均衡的变种形式和扩展应用,以更好地解决互动决策问题。
纳什均衡微观经济学名词解释
纳什均衡微观经济学名词解释纳什均衡是微观经济学中的一个重要概念,指的是在博弈论中,多个决策者在互相影响下,选择最优策略的一种状态。
它是由美国数学家约翰·纳什提出的,因此得名。
在纳什均衡中,每个决策者都会选择最优的策略,同时考虑到其他决策者的选择。
这种状态下,所有决策者都无法通过单方面改变策略来提高自己的利益,因为其他决策者也会相应地调整自己的策略,从而保持均衡状态。
具体来说,纳什均衡有以下几个特点:1.每个决策者都选择最优策略。
在纳什均衡中,每个决策者都会选择能够最大化自己利益的策略。
2.所有决策者的策略相互独立。
在纳什均衡中,每个决策者的策略都是独立的,没有任何一个决策者能够通过单方面改变自己的策略来影响其他决策者的策略。
3.所有决策者都认为其他决策者的策略不会改变。
在纳什均衡中,每个决策者都认为其他决策者的策略不会改变,因此不会试图通过改变自己的策略来影响其他决策者的策略。
纳什均衡的应用非常广泛,尤其是在经济学中。
例如,在市场竞争中,每个厂商都会根据市场需求和竞争对手的策略来选择自己的生产策略,从而达到最大化利润的目的。
在这种情况下,如果每个厂商都选择最优策略,并认为其他厂商的策略不会改变,那么市场就会达到纳什均衡状态。
除了经济学之外,纳什均衡还被广泛应用于政治学、社会学、心理学等领域。
例如,在国际关系中,不同国家之间的互动往往也是一个博弈过程,每个国家都会根据自己的利益来选择策略。
在这种情况下,如果每个国家都选择最优策略,并认为其他国家的策略不会改变,那么国际关系也会达到纳什均衡状态。
需要注意的是,纳什均衡并不一定是最优的状态。
在某些情况下,虽然达到了纳什均衡状态,但是每个决策者的利益都不是最大化的。
因此,在实际应用中,需要根据具体情况来判断纳什均衡是否是最优的选择。
总之,纳什均衡是微观经济学中的一个重要概念,具有广泛的应用价值。
通过了解纳什均衡的原理和特点,我们可以更好地理解市场竞争、国际关系等领域中的博弈过程,从而更好地制定策略和决策。
第2章 纳什均衡
PA δ UB = PB
B类消费者购买商品A B类消费者购买商品B
q 用 q A 表示消费者对于产品A的需求量; B 表 示消费者对于产品B的需求量.则 0 PA > PB +δ qA = nA PB δ ≤ PA ≤ PB +δ n +n PA < P δ A B B
为纳什均
衡的充要条件是对任何局中人,支付差为
* * u i ( s i* , s i ) u i ( s i , s i ) ≥ 0
,而与这个差
值是多少无关,由此可导出纳什均衡的一个性质: 纳什均衡的不变性
命题2.1 设 命题
G = N, S1 , , Sn , u1 , , u n
为已知策略型博弈.下不变. 正仿射变换 对 ,令 i∈N
ui' ( s) = δ iui ( s) + Ci ,其中
δ i > 0 ,则G与
' G' = N,S1,,Sn , u1,, u'n 有相同的纳什均衡.
(2)纳什均衡在支付函数的局部变换 局部变换下不变. 局部变换 给定
si ∈S i
定义2.2表明,局中人i的最优化反应映射 ri (s) 仅与 s i 有关. 反应函数 当 ri (s) 为单点集时,称 ri (s ) 为局中人i的最优反应函数 最优反应函数,简称 最优反应函数 反应函数.这时将 ri (s ) 记为 BRi (s i ) . 反应函数
定义2.3 最优反应映射 定义
G的纳什均衡可由以下划线法 划线法求得. 划线法 例2.4在囚徒困境问题中,其支付矩阵为
C C ( 5, 5 ) D ( 8, 0 )
纳什均衡数学定义
纳什均衡,简单地说就是多人参加的博弈中,每个人根据他人的策略制定自己的最优策略,所有人的这些策略组成一个策略组合,在这个策略组合中,没有人会主动改变自己的策略,因为那样会降低他的收益。
只要没有人作出策略调整,这个时候,所有参与者的策略便达成了一种平衡,这种平衡便是纳什均衡。
纳什均衡主要用来研究非合作博弈中的均衡,因此也被称作非合作博弈均衡。
纳什均衡的一个特别之处在于通俗易懂,有人把纳什均衡比喻成锅里的乒乓球。
如果你把几个乒乓球放到锅里,它们便会向锅底滚去,并在锅底相互碰撞,最后停止不动的时候便达成一种平衡,这个时候如果动了其中的一个,其它乒乓球便会受影响,如果想要保持这种平衡,就不能动任何一个乒乓球,一直保持下去。
这个比喻中,乒乓球代表个体参与者的策略,乒乓球最后停留在锅底形成的平衡便是纳什均衡。
纳什均衡的概念来自纳什的两篇博士论文《n人博弈中的均衡点》和《非合作博弈》,在论文中纳什介绍了合作性博弈与非合作性博弈的区别,并对纳什均衡做出了定义。
纳什均衡的创立,是纳什对博弈论开拓性的发展,其贡献是任何人都无法比拟的,在他之前博弈论就像一条窄窄的胡同,而纳什则推倒了胡同两边的墙,从而拓展了人们思维的视野和眼界,他不仅使人们看到的更多,而且使人们看得更高更远,同时也为人们提供了解决问题的方法和途径。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
:定义: 纳什均衡策略式博弈中策略组合是个纳什均衡如果给定•策略式博弈中,策略组合s כ是一个纳什均衡,如果给定其他参与者选择了策略组合s כ−i ,对每一个参与者i 而言选收益都不低于选择其他任何策略即择策略的s*i 收益都不低于选择其他任何策略。
即,u i (s כ) ≥ u i (s i , s כ−i ) for every s i ∈S i •s*i ∈arg Max u i (s i , s כ−i )= u i (s כ1, …, s כi-1, s i , s כi+1, …s כN )for all for alli ∈I •s*i ∈B i (s*-i ) for all i ∈I(Vickrey 例:二级价格密封拍卖(Vickrey 拍卖)•SPA(c r c, r ):–入场费:c=0–拍卖底价:r=0–策略:b i (v ) ∈{ No} ∪[ r , ∞)v ∈[0, 1]支付:如果不报价收益为–支付:如果不报价,收益为0如果报价,那么-- if i i i i v z c b z>⎧(,,)()() if - if i i i i i i ii i u b z c p b v z c b z c b z⎪=−−=⎨⎪<⎩–其他竞拍人的最高报价z = Max {b -i }–p (b i ):当出现平局时的竞拍人i 赢得拍卖的概率例:英式拍卖(级价格公开叫价)一级价格公开叫价按钮拍卖(button auction)•button auction–每个人都有一个按钮,–按着按钮:表示继续参加拍卖–不按按钮:表示退出,一旦退出不能再次加入–当只有个人仍然按着按钮时,价格不再上升,拍卖当只有一个人仍然按着按钮时价格不再上升拍卖结束。
–假设:当竞拍人按着按钮时,不知道有多少人还按着(v) ∈{ No} ∪[ r, ∞)v∈[0, 1]•竞拍人的策略集:bi如果–c=0, r=0, b(v)=v是每个竞拍人的弱占优策略–w E= v(2)=w2–E[w E]= E[w2]第十讲混合策略夏纪军上海财经大学经济学院L10L10. 混合策略均衡• A. 混合策略• B. 期望支付函数期望支付数• C. 混合策略纳什均衡C• D.D. 报警博弈• F. Approaching Cars •G. 专家诊断博弈例猜硬币博弈Player 2•例:猜硬币博弈1, -1-1, 1Tail(1-q )Head (p )Head (q )Player 1Player 2-1, 11, -1Tail (1-p )Player 1•混合策略–参与者1:Head 1•以p 的概率选择Head,以1-p 的概率选择Tail•概率分布:α1=(Prob(s 1=Head), Prob(s 1=Tail)=(p , 1-p )参与者–2:•以q 的概率选择Head,以1-q 的概率选择Tail 概率分布(P b(H d)P b(T il)1•概率分布:α2=(Prob(s 2=Head), Prob(s 2=Tail)=(q , 1-q )混合策略定义•定义:–参与者的混合策略是定义在参与者纯策略集上的一个概率分布设定了选择每个纯策略的概率概率分布,设定了选择每个纯策略的概率。
–S i ={s i 1,s i 2, …, s i k }–αi =(Prob(s i 1), …., Prob(s ik ))–参与者i 的混合策略集:∆S i–混合策略组合:α=(α1,α2,…,αn )A A.混合策略Player 2L (C (R (1L (q 1) C (q 2)R (1-q 1-q 2)Player 1T (p 1)0, 23, 31, 1M (4, 00, 42, 3参与者Player 1M (p 2),,,B (1-p 1-p 2)3, 45, 10, 7•1:–纯策略集:{T, M, B }混合策略–混合策略:α1=(p 1, p 2,1-p 1-p 2)•α1(T)=p 1, α1(M)=p 2, α1(B)=1-p 1-p 2.2:•参与者2: –α2=(q 1, q 2,1-q 1-q 2)B B. 期望支付函数Player 2Head(q)Tail(1-q)Player 1Head (p)-1 , 11, -1 Tail(1-p)1, -1-1 , 1•给定策略组合(α1, α2)= ((p, 1-p), ( q,1-q))A{(H H)(H T)(T H)(T T)}–A={(H,H), (H,T), (T,H), (T,T)}–g(α1, α2)(H H)(1(H T)(1(T H)(1)(1(T T))=(pqο(H,H), p(1-q)ο(H,T), (1-p)qο(T,H), (1-p)(1-q)ο(T,T))–参与者1 的期望支付E)(H H)+(1(H T)Eu1(α1, α2) = pq u1(H,H)+p(1-q)u1(H,T)+(1-p)qu1(T,H)+ )+(1-p)(1-q)u1(T,T)B B.期望支付函数Player 2Head(q)Tail(1-q )Head (p)11Player 1Head (p)-1 , 11, -1Tail(1-p)1, -1-1 , 1•给定策略组合(α1, α2)=((p , 1-p ), ( q,1-q ))–参与者1 的期望支付Eu 1(α1, α2) = pq u 1(H,H)+p (1-q )u 1(H,T)+(1-qu (T,H)+ )+(1-)(1-u (T,T)(p )q 1())(p )(q )1()= p [q u 1(H,H)+(1-q )u 1(H,T)]+(1-) [qu (T,H)+ )+(1-u (T,T)](p )[q 1(,))(q )1(,)]= p ·u 1(H, α2)+(1-p ) ·u 1(T, α2 )=p · (1-2)+(1-) · (2q-1p (q )(p )(q )B B.期望支付函数Player 2Head(q)Tail(1-q )Player 1Head (p)-1 , 11, -1Tail(1p)11•给定策略组合, 1-), ( 1-Tail(1-p)1, -1-1 , 1((p ,p ),(q,q ))–参与者1 的期望支付•Eu α, α) =pEu (H, α)+(1-pEu (T, α2(1,2)p 1(,2)(p )p 1(,2)=p·(1-2q )+(1-p )·(2q-1)–2参与者2 的期望支付函数•Eu 2(α1, α2) = qEu 2(α1,H) + (1-q )Eu 2(α1,T)=q·p-)+(1-)·(1-2 q (2p 1)+(1q )(12p )B B. 期望支付函数Player 2L CL C RPlayer1T0, 23, 31, 1 M4, 00, 42, 3Player 1M ,,,B3, 45, 10, 7•混合策略: α1=( p1, p2, p3); α2=(q1, q2, q3)•参与者1的期望支付:–EU1(α1, α2) = p1[q1·0+ q2·3 + q3·1]+ p[q·4+q·0+q·2]2123+ p3[q1·3 + q2·5 + q3·0]=α(T) EU(T, α)+α(M) EU(M, α)+α(B) EU(B, α) 112112112B B.期望支付函数–EU α, α)1(1,2)=α1(T) EU 1(T, α2)+α1(M) EU 1(M, α2)+α1(B) EU 1(B, α2))EU ∑–1111211112(,)()(,s S EU s s αααα∈=)()()∑2211222112(,,s S EU s s u s s αα∈=⎡11221121122112(,)()()(,)s S s S EU s s u s s αααα∈∈⎤=⎢⎥⎣⎦∑∑11221122112,()()(,)s S s S s s u s s αα∈∈=∑策略式博弈(含混合策略)定义个•: ( vNM 偏好策略式博弈) 一个vNM 策略式博弈由以下几部分构成:–参与者集合–每个参与者的纯策略集–每个参与者对所有混合策略组合的偏好关系,以及表示该好关系的期望支付函数。
⎡(,)()()(,)i i i i i i i i i i i i i i s S s S EU s s u s s αααα−−−−−−∈∈⎤=⎢⎥⎣⎦∑∑()()(,)i i i i i i i s s u s s αα−−−=∑,i i i is S s S −−∈∈C C.混合策略均衡•定义:–一个混合策略组合α* 是一个(混合策略)纳什均衡,如果对所有的参与者i 都有:EU i (α*i , α*-i ) EU i (αi , α*-i ) ∀αi ∈∆S i .•纯策略NE :策略式博弈中,策略组合s 是一个纳什均衡,如果对每一个参与者i 都有u s ) ≥ u s , s −) for every s ∈S i ()i (i ,i )y i iC C.混合策略均衡混合策略组合•α* 是纳什均衡当且仅当对所有的参与者都有α*i ∈B i (α*-i )•如果每个参与者都有最优反应函数b i (α-i ),那么混*合策略组合α 是纳什均衡的充分必要条件是:–α*i = b i (α*-i ) i =1,2,…,NC C.混合策略均衡:例1Player 2Player 2HeadTailHead -1 , 11, -1Player 1,,Tail1, -1-1 , 1p 1-p•参与者1 的最优反应函数B 1(q ):q1-qp 1Max p ∈[0,1]Eu 1(p , q ) = p·(1-2q )+(1-p )·(2q-1)–Eu ′1=2-4qB 1(q )1/2•For q <0.5, p =1•For q>0.5, p =0For q=05[01]1q1/2•For q=0.5, p ∈[0,1]C C.混合策略均衡:例1Player 2Player 2HeadTailHead -1 , 11, -1Player 1,,Tail1, -1-1 , 1p 1-p•参与者2 的最优反应函数B 2(p ):q1-qMax q ∈[0,1]Eu 2(p , q ) =q·(2p-1)+(1-q )·(1-2q )–Eu ′2=4 p-2p 1B 2(p )B 1(q )•For p <0.5, q =0•For p>0.5, q =1For =05[01]1/2•For p =0.5, q ∈[0,1] 1q1/2C C.混合策略均衡:例1Player 2•参与者1的最优反应函数B 1(q ):–For q <0.5, p =1F <05y Head Tail Pl 1Head -1 , 11, -1p –For q <0.5, p =0–For q=0.5, p ∈[0,1]•2B ):q1-qPlayer 1Tail1, -1-1 , 11-p参与者的最优反应函数2(p )–For p <0.5, q =0–For p>0.5, q =1F 05[01]Mixed strategyNash equilibriump1–For p =0.5, q ∈[0,1] •((0.5,0.5)((0.5,0.5))1/2NE :((0.5,0.5)((0.5, 0.5)) –p = 0.5 ∈B 1(0.5)–q = 0.5 ∈B 2(0.5)1q1/2The Stag hunt例2:The Stag hunt ()()•给定α1=(p ,1-p ) 和α2=(q ,1-q ) –参与者1•EU 1(α1, α2)= pq·2 +p (1-q )·0 + (1-p )q·1 + (1-p )(1-q )·1=2 pq-p-q+1∂EU 1/∂p=2q-1–最优反应函数•For q >0.5, p =1;•For q <0.5, p =0;Hare(1-q)Stag (q)Hunter 2•For q =0.5, p ∈[0.1].(2,2)(0,1)Stag(p)Hunter 1(1,0)(1,1)Hare(1-p)Hunter 1The Stag hunt例2:The Stag hunt ()()•给定α1=(p ,1-p ) 和α2=(q ,1-q ) –参与者1 的最优反应⎧q1NE 2•1 1 if 0.5()[0,1] if 0.5if q B q q >⎪==⎨1/2NE 3–类似的,参与者2 的最优反应0 if 0.5q ⎪<⎩⎧p1/21NE 1•2 1 if 0.5()[0,1] if 0.5if 05p B p p >⎪==⎨–所以,存在三个混合策略纳什均衡•NE1:((10)(10));NE2:((01)(01));NE3:((55)(55))0 if 0.5p ⎪<⎩NE1: ((1,0),(1,0)); NE2: ((0,1),(0,1)); NE3: ((.5,.5),(.5,.5))期望支付函数的性质I S }•策略式博弈{I, S i , u i }, 给定混合策略组合(α1,…,αn )(,)()(,)i i i iiiiiEU s EU s αααα−−=∑•例子: 狩猎博弈给定)i is S ∈–(α1,α2 ), 参与者1的期望支付Eu 1(α1 ,α2 ) = p· u 1(S, α2) + (1-p )·u 1(H, α2)Max p harestag Hunter 2(2,2)(0,1)stagHunter 1(1,0)(1,1)hareHunter 1Appendix•Maxα∈[0,1]U(α)= α·x + (1-α)·y()()–如果x>y: α*=1y–如果x<y: α*=0–如果x=y: α*∈[0.1]•如果我们知道0<α*<1, 那么一定有x= y.如果我们知道,那么就有≤y •α*=0, x y.同理•Max p ∈[0,1] Eu 1(α1,α2 ) = p· u 1(S, α2) + (1-p )·u 1(H, α2)–u (S, α) >u (H, α) : p =1如果1(,2)1(,2)p –如果u 1(S, α2) <u 1(H, α2) : p =0–u (S )=(H ):[01]如果1(S, α2) u 1(H, α2) : p ∈[0.1]Hunter 2harestag Hunter 2(2,2)(0,1)11staghareHunter 1(1,0)(,)同理M E )(S )(1)(H •Max p ∈[0,1]Eu 1(α1,α2 ) = p· u 1(S, α2) + (1-p )·u 1(H, α2)•令α*=((p*,1-p*), (q*,1-q*))是纳什均衡,–如果0<p*<1, ,即,α1*(S)>0, α1*(H)>0•那么一定有u (S, α*) =u (H, α*) .那么定有1(,2)1(,2)–NE3: ((.5,.5),(.5,.5))•(S,*)=0.5*2+0.5*0=1u 1(S, α2) 0.520.501•u 1(H, α2*)=0.5*1+0.5*1=1•*,S =u *,H hare stag Hunter 2u 2(α1, S )u 2(α1, H )(2,2)(0,1)stagHunter 1(1,0)(1,1)hareHunter 1同理)()()(•Max p ∈[0,1]Eu 1(p , q ) = p· u 1(S, α2) + (1-p )·u 1(H, α2)•α*=((p*,1-p*), (q*,1-q*是纳什均衡,令((p ,p ),(q ,q ))是纳什均衡–如果p *=0, α1*(S)=0, α1*(H)=1>0•(S *)(H *)那么就有u 1(S, α2) ≤u 1(H, α2) .–NE1: ((1,0),(1, 0))•(S *)=1*2+0*0=2u 1(S, α2) 12+002•u 1(H, α2*)=1*1+0*1=1hare stag Hunter 2(2,2)(0,1)stagHunter 1(1,0)(1,1)hareHunter 1l i iD. Employee Monitoring•员工可以选择努力工作或偷懒员以选择努力作或偷懒•工资:$ w,但是一旦被发现偷懒那么得到0。