纳什均衡不动点
纳什均衡点
纳什均衡点纳什均衡点纳什均衡点(港译:纳殊均衡点),又称为非合作博弈均衡点,是博弈论的一个重要概念,以约翰·纳什命名。
如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。
[编辑本段]例子经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。
大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。
于是,两人同时陷入招供还是不招供的两难处境。
如果两人均不招供,将最有利,只被判刑三年。
但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。
这时,个体的理性利益选择是与整体的理性利益选择不一致的。
囚犯甲的博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年;乙判刑一年不招供甲判刑一年;乙判刑十年甲判刑三年基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三年就不会出现。
事实上,这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。
[编辑本段]学术争议和批评第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。
这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下达不到并不能解决问题。
[来源请求]在数学意义上,纳什并没有超越角谷静夫不动点定理。
纳什平衡Nash Equilibrium
纳什平衡Nash Equilibrium2010-02-11 16:48:59纳什平衡(Nash Equilibrium),又称为非合作赛局平(Non-Cooperative Games),是博弈论的一个重要概念,以约翰•纳什命名。
定义:如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点。
例子:经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。
大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。
如果两人均不招供,将最有利,只被判刑半年。
于是,两人同时陷入招供还是不招供的两难处境。
但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。
这时,个体的理性利益选择是与整体的理性利益选择不一致的。
囚犯甲的博弈矩阵囚犯甲招供不招供囚犯乙招供判刑两年甲判刑十年;乙即时获释不招供甲即时获释;乙判刑十年判刑半年基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。
事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。
学术争议和批评:第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。
这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下却找不到,因此仍不能解决问题。
名词解释 纳什均衡
名词解释纳什均衡
纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
纳什均衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。
在每个参与者都只有有限种策略选择并允许混合策略的前提下,纳什均衡一定存在。
以两家公司的价格大战为例,价格大战存在着两败俱伤的可能在对方不改变价格的条件下既不能提价,否则会进一步丧失市场;也不能降价,,因为会出现赔本甩卖。
于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是纳什均衡。
我们用一个浅显的例子来解释。
假如你喜欢一个女孩儿,现在这个女孩儿把你当做很好很好的朋友。
如果你表白,女孩儿可能会觉得这样当朋友太尴尬,那以后可能一起玩的机会都没有了。
如果女孩儿把你拒绝了,她也会失去一个很好的朋友,这一点对现在的她来说也是比较糟糕的结果。
于是,你们俩谁都不愿意主动做出改变,也不愿意了解互相的根本想法,
即是纳什均衡。
你们俩在信息不完全的情况下达到了貌似最优解,但是在外人看来却不是。
群体博弈Nash平衡存在性定理与Brouwer不动点定理
群体博弈Nash平衡存在性定理与Brouwer不动点定理杨光惠; 武文俊; 杨辉【期刊名称】《《贵阳学院学报(自然科学版)》》【年(卷),期】2019(014)003【总页数】3页(P15-17)【关键词】群体博弈; Nash平衡; Brouwer不动点定理【作者】杨光惠; 武文俊; 杨辉【作者单位】贵州大学数学与统计学院贵州贵阳550025【正文语种】中文【中图分类】O2251 引言著名的Brouwer不动点定理[1]是不动点理论中一个重要的结果,其在博弈论和数理经济中有关平衡点的存在性具有广泛的应用[2-7]。
1950年,Nash提出n人非合作博弈模型,并运用Brouwer不动点定理证明了平衡点的存在性[3-4]。
这一结果堪称Brouwer不动点定理应用的经典之作。
1962年, Uzawa运用Brouwer不动点定理于一般均衡理论中深刻揭示了Brouwer不动点定理与Walras平衡点存在性定理的等价性[5]。
近些年, Brouwer不动点定理的等价刻画仍然是一个研究热点。
在博弈论中, Brouwer不动点定理可由Nash平衡存在性定理推出[6-8]。
事实上,Brouwer不动点定理的等价刻画, 不仅为Brouwer不动点提供了特定的诠释, 更重要的是揭示了相应的平衡点存在性定理的深刻性。
受以上文献的启发,本文将研究群体博弈的Nash平衡存在性定理与著名的Brouwer不动点定理的等价性。
2 预备知识首先,介绍重要的Brouwer不动点定理。
引理1(Brouwer不动点定理):设C⊂Rn是一非空有界闭凸集,f:C→C连续,则映射f的不动点必存在,即存在x*∈C,使f(x*)=x*。
接下来,介绍群体博弈模型及其Nash平衡概念,参见[9]。
设Γ={1,2,…,Ρ}表示包含Ρ个群体的一个社会,其中每个群体中代理人个体数量(统计意义上)充分大但有限。
本文假设每一群体p∈Γ中代理人构成总量为单位1的连续统,且有限纯策略集Sp={1,2,…,np},那么社会Γ中所有群体的纯策略总数为n=∑p∈Γnp。
纳什均衡
纳什均衡在政治学中的应用
选举策略:候选人在竞选活动中的决策和策略选择 政治谈判:国家间在谈判过程中的策略选择和利益平衡 国际关系:国家间在合作与竞争中的决策和策略选择 政治制度设计:政治制度设计中的决策和策略选择,如选举制度、议会制度等
纳什均衡在管理学中的应用
战略决策:企业在市场竞争中,通过纳什均衡分析,制定最优策略。 组织结构:纳什均衡理论可以帮助企业优化组织结构,提高管理效率。 激励机制:纳什均衡理论在企业激励机制设计中,可以指导企业制定有效的激励措施。 谈判与合作:纳什均衡理论在企业谈判与合作中,可以帮助企业实现利益最大化。
纳什均衡的应用
博弈论:纳什均衡是博弈论的核心概念,用于分析各种博弈问题 经济学:纳什均衡在经济学中广泛应用,如市场均衡、价格均衡等 政治学:纳什均衡在政治学中用于分析政治博弈,如选举、谈判等 社会学:纳什均衡在社会学中用于分析社会现象,如群体行为、社会规范等
纳什均衡的求解方法
第二章
纳什均衡的求解条件
纳什均衡
目录
CONTENTS
01 纳什均衡的概念 02 纳什均衡的求解方法 03 纳什均衡与博弈论 04 纳什均衡的局限性
05 纳什均衡纳什均衡的定义
纳什均衡是指在 一个博弈中,每 个参与者的策略 都是对其他参与 者策略的最优反 应。
纳什均衡是博弈 论中的一个重要 概念,由约翰·纳 什提出。
纳什均衡的求解步骤
确定博弈的 参与者和策 略集
建立支付矩 阵,表示参 与者在不同 策略下的收 益
计算每个参 与者的最佳 反应策略
检查是否存 在纳什均衡, 即每个参与 者的策略都 是对其他参 与者策略的 最佳反应
如果存在纳 什均衡,则 求解得到均 衡策略;如 果不存在, 则重新调整 策略集或支 付矩阵,重 复步骤3-4。
第2章 纳什均衡
r ( s) = r1 ( s) × r2 ( s) × × rn ( s) = {(t1 , t 2 , , t n ) t i ∈ ri ( s), i = 1,2, , n}
称为博弈G的最优反应映射 最优反应映射. 最优反应映射 博弈的最优反应映射与纳什均衡之间的关系 定理2.1 s* ∈ S 为策略型博弈 G = N, S1,, Sn , u1,, u n 的 定理 纳什均衡的充要条件是 s * ∈ r ( s * ). 设 f (Y ) 为一集值映射.若 X ∈ f ( X ) ,称x为 f (Y ) 的不 不 动点. 动点 利用不动点概念,定理2.1可以如下叙述. 命题2.4 s*是策略型博弈G的纳什均衡的充要 命题 条件是 s*是最优反应映射 r (s) 的不动点,即 s*∈ r (s*) .
按 按
等待
(4, ) 4 ( 5 ,1 ) 等待 ( 9 , 1 ) ( 0 , 0 )
严格纳什均衡为大猪"按",小猪"等待".
例2.7 在例1.8中的大堤维护博弈中,支付矩阵为
维护 维护 不维护 ( 4 , 4 ) ( 14 , 10 ) ( 10 , 14 ) ( 10 , 10 ) 不维护
N , = {1,2} , G
给出. * * * * s 2 是局中人2对 设 s = ( s1 , s 2 ) 为G的纳什均衡.即 * * * s 2的最优反应. s 于 s1 的最优反应,1 是局中人1对于
(a1n , b1n ) (a2 n , b2 n ) (amn , bmn )
2.3 最优反应映射与纳什均衡
定义2.2 局中人的最优反应映射 定义 局中人i的最优反应映射是一个定义于策略组合集合S, 取值于 策略集 Si 的子集的集值映射(映射值为集合的映射称为集值映 S 射), ri ( s) S i ,满足
凸集,博弈论,不动点定理
凸集,博弈论,不动点定理1.引言1.1 概述概述:本文将探讨凸集、博弈论和不动点定理这三个重要的数学概念,并分析它们的定义、性质以及在实际应用中的作用。
通过研究这些概念,我们可以深入理解和应用它们在不同领域中的关联和相互关系。
凸集是一个几何概念,指的是在欧几里德空间中的一个集合,其中任意两点的连线上的所有点也都属于该集合。
凸集具有许多重要的性质,如可加性、局部性以及凸组合等,这些性质使得凸集在优化问题、经济学、几何学等领域中有广泛的应用。
博弈论是研究决策制定者之间相互关系与冲突的一门学科。
它涉及多个参与者之间的互动和决策,并通过分析不同的策略和结果来研究可能的决策结果。
博弈论的应用范围广泛,包括经济学、管理学、社会科学等领域,通过博弈论可以帮助我们预测和解决各种竞争和合作策略决策问题。
不动点定理是数学中的一个重要概念,指的是在某个映射函数下存在一个点,经过迭代作用后保持不变。
不动点定理在函数分析、拓扑学等领域中有广泛的应用,它可以用来证明存在性和收敛性等问题。
通过对凸集、博弈论和不动点定理的研究,我们可以进一步理解数学在实际问题中的应用和价值。
本文将详细介绍这些概念的定义、性质以及在实际问题中的应用,希望读者在阅读本文后能够对凸集、博弈论和不动点定理有更深入的理解,并进一步探索这些概念在其他领域中的应用和发展。
1.2文章结构文章结构部分的内容可以包括以下几点:1.2 文章结构本文将按照以下结构进行论述:第一部分为引言部分,介绍本篇文章的背景和主题。
该部分分为概述、文章结构和目的三个小节,分别对文章的整体情况、组成结构以及研究目的进行说明。
第二部分为凸集的内容,该部分分为定义和性质以及凸集的应用两个小节。
在定义和性质部分,我们会给出凸集的基本概念和相关性质的阐述,介绍凸集的形式以及其重要性。
接着,在凸集的应用部分,我们会介绍凸集在优化问题、经济学和几何学等领域的具体应用。
第三部分为博弈论的内容,该部分分为博弈论的基本概念和博弈论的应用两个小节。
不动点定理
不动点定理在经济学中的应用数本1301 王敏摘要不动点定理是拓扑学中很著名的定理,从一维到多维空间都保持这一性质。
其次,在经济学特别是在博弈论中不动点定理有着广泛的应用,比如证明纳什均衡或者一般均衡的存在性。
关键词:不动点、博弈论、纳什均衡一、不动点定理定义1:设X 是一个拓扑空间。
如果X 中有两个非空的隔离子集A 和B ,使得B A X ⋃=,则称X 是一个不连通空间;否则,称X 是一个连通空间。
]1[ 引理1:设X 是一个连通空间,R X →:f 是一个连续映射,则)(f X 是R 中的一个区间。
]1[引理2:(介值定理)设R b a f →],[:是闭区间],[b a 到实数空间R 的一个连续映射,则对于)(f a 和)(f b 之间的任何一个实数r ,存在],[z b a ∈使得z z =)(f 。
]1[ 定理:(不动点定理)设]1,0[]1,0[:f →是一个连续映射,则存在]1,0[z ∈使得z =)(z f 。
]1[证明:如果0)0(f =或者1)1(f =,则定理显然成立。
下设0)0(f >,1)1(f <。
定义映射R →]1,0[:f 使得对于任何]1,0[x ∈有)()(x f x x F -=。
容易验证f 是一个连续映射,并且这时又0)0(<F 和0)1(>F 。
因此根据介值定理可得存在]1,0[z ∈,使得0)z (=F ,即z z =)(f 。
布劳威尔不动点定理说明:对于一个拓扑空间中满足一定条件的连续函数f ,存在一个点0x ,使得00)(f x x =。
这个定理表明:在高维球面上,任意映到自身的一一连续映射,必定至少有一个点是不变的,即映射:f n E E →n 是一个连续映射,其中n E 是n 维闭球体,则存在z n E ∈,使得z z =)(f 。
二、博弈论和纳什均衡 博弈论又被称为对策论,既是现代数学的一个新分支,也是运筹学的一个重要学科。
第四章__纳什均衡的存在性与多重性
定义 4.5,一个点到集合的“对应”(correspondence) G : X → Y 是任何一个规定了对
X 中的每个点 x , G(x)是与 x 相对应的 Y 中的一个子集。
如果 X 和 Y 都是度量空间,则 X 和 Y 上的收敛和极限概念已经定义,这时有:
定义 4.6 ,一个对应 G:X→Y 是上半连续的(upper—hemicontinuous),当且仅当对每
静夫(Kakutani)不动点定理,而后者的证明只是前者的一个相对简单的运用。
我们所以要引用角谷静夫不动点定理,是因为在纳什均衡存在性证明中所遇到的反
应函数一般是多个因变量函数,即所谓对应(correspondence),而角谷静夫不动点定理正
好描述的是对应的一种性质。角谷静夫不动点定理是 Brouwer 不动点定理的推广,但其
所有的存在性定理证明都采用了不动点定理,这是因为,纳什均衡的概念在数学上
就是一个不动点的概念。在给出存在性定理及其证明之前,我们先来说明不动点的概念
和给出不动点定理。
什么是“不动点”呢?考虑一个方程 f (x) = x ,其中 x 为方程的解。我们将 f (⋅)视 为一种“变换”,即 f (⋅)是将 x 对应为 y = f (x)的变换,其中 x 和 y 分别是属于集合 X 和 Y 的两个元素,x ∈ Χ , y ∈Y 。如果 X = Y ,则方程 f (x) = x 的几何意义就是:变换 f (⋅)将 x 变为自己,即 x 在 f (⋅)变换下是不变的,故称 f (x) = x 的解为变换 f (⋅)的不动点。
于是 G 是上半连续的。 下面,我们将不动点概念扩充到对应的情形。
定义 4.7,一个对应 F: S → S 的一个不动点是 S 中任一满足 x ∈ F (x) 的 x 。
政治学中的游戏理论研究
政治学中的游戏理论研究近年来,政治学中的游戏理论受到越来越多的关注,成为政治学研究中的重要分支。
游戏理论以博弈论为基础,通过对参与者间互动的分析,研究在不完全信息和不确定性环境下,参与者在博弈过程中作出的决策,并探讨这些决策对最终结果的影响。
一、游戏理论的概念游戏理论是一种数学模型,通常用于研究两个或多个参与者之间的互动。
这些参与者可能是个人、组织、政府等。
游戏主要由博弈者、策略、收益函数和解组成。
博弈者是参与游戏的个体,策略是博弈者在某一时刻作出的决策,收益函数是博弈者根据选定策略和其它博弈者的策略而获得的回报。
解是指确定在某种情况下,博弈者可采取的最佳策略以及这种策略所带来的结果。
二、博弈论中的重要概念在游戏理论中,有一些概念十分重要,需要掌握。
首先是纳什均衡:当博弈参与者的策略互相依存时,他们的最佳决策将是一种平衡状态。
纳什均衡指的是所有博弈参与者遵循自己的最佳策略时所达到的平衡点。
纳什均衡是一种不动点,当所有博弈参与者采取最佳策略时,其它参与者也会考虑这些策略,因此所有博弈参与者所作出的决策都不会改变。
其次是囚徒困境:一种最常见的博弈理论模型。
这个模型基于两个犯人因同一个罪行而被关押的情景。
犯人被提供了两种选择:供认或不供认。
如果两个犯人都不供认,则两人都只会被判轻刑;如果两个犯人都供认,则两人都会被判重刑;如果一个犯人供认而另一个犯人不供认,则前者会被判轻刑,后者会被判重刑。
三、游戏理论在实践中的应用游戏理论的应用不仅仅局限于学术领域,它在政治、经济、商业等方面都有着广泛的应用。
政治方面,游戏理论被广泛用于国际关系分析。
例如在军备竞赛中,双方国家会根据彼此的行动反应来调整自己的军备战略。
此时,游戏理论可以帮助我们理解如何制定稳定的军备战略,防止不必要的升级和对抗。
另外,游戏理论还可以用于社会政策评估。
例如在开展一项社会政策改革时,需要考虑各方的利益和反应,并设计出最合适的政策方案。
此时,游戏理论可以帮助我们预测各方的反应,并制定能够平衡各方利益的政策。
第2章 纳什均衡
PA δ UB = PB
B类消费者购买商品A B类消费者购买商品B
q 用 q A 表示消费者对于产品A的需求量; B 表 示消费者对于产品B的需求量.则 0 PA > PB +δ qA = nA PB δ ≤ PA ≤ PB +δ n +n PA < P δ A B B
为纳什均
衡的充要条件是对任何局中人,支付差为
* * u i ( s i* , s i ) u i ( s i , s i ) ≥ 0
,而与这个差
值是多少无关,由此可导出纳什均衡的一个性质: 纳什均衡的不变性
命题2.1 设 命题
G = N, S1 , , Sn , u1 , , u n
为已知策略型博弈.下不变. 正仿射变换 对 ,令 i∈N
ui' ( s) = δ iui ( s) + Ci ,其中
δ i > 0 ,则G与
' G' = N,S1,,Sn , u1,, u'n 有相同的纳什均衡.
(2)纳什均衡在支付函数的局部变换 局部变换下不变. 局部变换 给定
si ∈S i
定义2.2表明,局中人i的最优化反应映射 ri (s) 仅与 s i 有关. 反应函数 当 ri (s) 为单点集时,称 ri (s ) 为局中人i的最优反应函数 最优反应函数,简称 最优反应函数 反应函数.这时将 ri (s ) 记为 BRi (s i ) . 反应函数
定义2.3 最优反应映射 定义
G的纳什均衡可由以下划线法 划线法求得. 划线法 例2.4在囚徒困境问题中,其支付矩阵为
C C ( 5, 5 ) D ( 8, 0 )
布罗威尔不动点定理
布罗威尔不动点定理布罗威尔不动点定理,是数学中的一个基本定理,它为不动点的存在提供了一种简单而有力的方法,是针对许多科学领域中的问题提供一些意义和解答的有力工具。
本文将介绍布罗威尔不动点定理的定义、重要性和应用,并探讨其在数学和应用领域的实际应用。
定义首先,让我们来看看布罗威尔不动点定理的严格定义。
假设有一个函数f:C→C,其中C是一个非空完备的度量空间,即一个集合,它具有一个特定的距离函数,满足所有元素之间的距离都是有定义的。
如果函数f具有以下两个性质:1. Lipschitz条件:存在一个常数λ(λ>0),使得对于所有的x和y∈C,有d(f(x), f(y)) ≤ λd(x, y),其中d表示C中元素之间的距离。
2. 完备性:对于每个Cauchy序列{x_n},它的极限点y是唯一的,并且y∈C。
然后,我们称y∈C是f的不动点,如果f(y) = y。
换句话说,不动点是每个满足这个特定方程的点y∈C,y 被f保持不变。
那么,布罗威尔不动点定理指出:函数f 至少有一个不动点,即存在y∈C,使得f(y) = y。
应用布罗威尔不动点定理的应用非常广泛,特别适用于证明许多最优化问题的存在性和唯一性,如微分方程的解、概率论和统计学、经济学、金融学等领域。
例如,在微分方程中,布罗威尔不动点定理是解非线性偏微分方程和常微分方程的强有力的工具。
具体应用需要特定的约束条件和假设,但总的来说,定理表明:非线性微分方程至少有一个解,该解是一个不动点。
同样,定理也可以用于证明统计估计问题中的最优点存在性,从而有助于得出更好的符合数据的模型。
此外,布罗威尔不动点定理的一些应用还涉及经济学和金融学中最优化问题,如博弈论、资产定价模型、等。
例如,游戏理论中有一种著名的Brouwer fixed point theorem,称为纳什均衡,整个决策均衡可以被视为每个人决定保持策略不变的点。
其中,每个玩家在决定其策略时将考虑其他玩家的策略选择,以达到全面最大化自己的效用。
不动点定理,一般均衡及纳什均衡笔记
2 Brouwer’s Fixed Point Theorem
Brouwer’s fixed point theorem is proved by Brouwer’s fixed point theorem for unit ball. Through following two facts, we can reach Brouwer’s fixed point theorem. √ n • A unit ball B n and a ball with any ”radius”( α) Bα are homeomorphic.
d(Φ(x∗ ), x∗ )
Since ε > 0 is arbitrary here, we must then have d(Φ(x∗ ), x∗ ) = 0, which is possible only if Φ(x∗ ) = x∗ . To prove the uniqueness assertion, observe that if x ∈ X was another fixed point of Φ, we would then have d(x, x∗ ) = d(Φ(x), Φ(x∗ )) possible only if x = x∗ (since K < 1). Kd(x, x∗ ),which is
ε 2
for all m = M, M + 1, · · · , and hence d(Φ(x∗ ), xm+1 ) + d(xm+1 , x∗ ) = d(Φ(x∗ ), Φ(xm ) + d(xm+1 , x∗ ) Kd(x∗ , xm ) + d(xm+1 , x∗ ) ε ε < + 2 2
纳什均衡存在性定理中的相关解释
纳什均衡存在性定理中的相关解释教材(《经济博弈与应用》)p33,图2.1表明不动点是曲线()⋅f 与45o 线的交点。
当函数()x f 定义在[]1,0∈x 区间上且因变量()x f y =的值域也为[]1,0区间时,如果()x f 是连续的,则必然存在不动点。
图2.1 [0,1]区间上的自变换函数的不动点直接用来证明纳什存在性定理的不动点定理不是Brouwer角谷静夫(Kakutani)不动点定理。
定义1 S 是凸的(Convex)当且仅当对任意的M M R y R x ∈∈,及满足10≤≤λ的λ,只要S x ∈和S y ∈,则有()S y x ∈-+λλ1定义2 S 是闭的(Closed)当且仅当对每个收敛的序列()}{∞=1j j x ,如果对每个j 都有()S j x ∈,则有()S j x j ∈∞→lim定义3 R M 中的子集S 是开的(open)当且仅当它的补集R M /S 是闭的。
定义4 S 是有界的(bounded)当且仅当存在某个正数K 使得对S 中的每个元素x 都有∑∈≤Mm m K x定义5 当函数()x f 满足下述性质时,我们称其为凹的:()()()()()[]n R x x x f x f x x f ∈∈-+≥-+212121, 1,0,11λλλλλ如果当()1,0∈λ时上面的不等式严格成立,则称()x f 为严格凹的。
一个函数()x f 是凸的当且仅当函数-()x f 是凹的;()x f 为严格凸函数当且仅当-()x f 为严格凹函数。
x 第一季第二季第三季第四季)(x fx1拟凹函数是凹函数概念的一种推广,它包括了凹函数在内的一大类函数,而这类函数在经济学中有着广泛应用,关于拟凹函数的定义如下:定义6 函数()x f 定义在R n 中的子集D 上,当且仅当()x f 满足如下性质时,()x f 是拟凹的:()()()()()2121,min 1x f x f x x f ≥-+λλ ∈λ[0,1]显然,凹函数是拟凹的,但反过来并不成立,即拟凹函数不一定是凹函数。
纳什均衡数学定义
纳什均衡,简单地说就是多人参加的博弈中,每个人根据他人的策略制定自己的最优策略,所有人的这些策略组成一个策略组合,在这个策略组合中,没有人会主动改变自己的策略,因为那样会降低他的收益。
只要没有人作出策略调整,这个时候,所有参与者的策略便达成了一种平衡,这种平衡便是纳什均衡。
纳什均衡主要用来研究非合作博弈中的均衡,因此也被称作非合作博弈均衡。
纳什均衡的一个特别之处在于通俗易懂,有人把纳什均衡比喻成锅里的乒乓球。
如果你把几个乒乓球放到锅里,它们便会向锅底滚去,并在锅底相互碰撞,最后停止不动的时候便达成一种平衡,这个时候如果动了其中的一个,其它乒乓球便会受影响,如果想要保持这种平衡,就不能动任何一个乒乓球,一直保持下去。
这个比喻中,乒乓球代表个体参与者的策略,乒乓球最后停留在锅底形成的平衡便是纳什均衡。
纳什均衡的概念来自纳什的两篇博士论文《n人博弈中的均衡点》和《非合作博弈》,在论文中纳什介绍了合作性博弈与非合作性博弈的区别,并对纳什均衡做出了定义。
纳什均衡的创立,是纳什对博弈论开拓性的发展,其贡献是任何人都无法比拟的,在他之前博弈论就像一条窄窄的胡同,而纳什则推倒了胡同两边的墙,从而拓展了人们思维的视野和眼界,他不仅使人们看到的更多,而且使人们看得更高更远,同时也为人们提供了解决问题的方法和途径。
数学中的平衡问题——纳什均衡
数学中的平衡问题——纳什均衡当我们谈论场景中多个人或机器人在互动决策时,我们经常会提到“博弈”。
博弈是对决策者之间相互关注和互动的模型。
许多实际的应用都涉及博弈论,这也是为什么许多科学家、经济学家和社会学家都致力于探索博弈研究的原因。
最著名的、最有用的博弈理论之一是“纳什均衡”。
它是由美国经济学家约翰·纳什于1950年代提出的。
纳什均衡描述了一种状态,所有参与博弈的决策者都知道对于他们每个人的决策而言,对方的策略是什么,他们也知道对于对方的决策,最能带来什么结果。
在这种情况下,每个决策者都不会改变自己的策略,因为任何单独的变化都会使结果更差。
这种状态就是“纳什均衡”。
我们可以将纳什均衡类比为足球场上的两组队员之间的比赛:一方想向前发球,另一方想在另一个方向上拦截,因为他们都了解对手的意图,他们不会改变自己的策略。
要么拦截,要么护球,站在原地不动不是一个正确的自我利益选择。
一些经济学和社会科学领域的重要应用程序,如电力市场竞标、联合收益分配和医生和患者之间的博弈,都可以应用纳什均衡理论。
通常,在博弈理论中,我们涉及两种不同的博弈类型:合作和非合作博弈。
在一个合作的博弈中,决策者采取策略,以获得最大的共同收益。
在非合作博弈中,每个决策者都寻求最大化自身利益。
纳什均衡可以应用于这两种类型的博弈,但在非合作博弈中更为重要,因为每个决策者都要根据自身的需求和利益去决定最终的策略。
通过博弈论和纳什均衡,我们可以获得有关人类决策行为的重要见解。
无论是在经济学、社会学还是在人-机交互中,纳什均衡模型都可以被用于发现人们在决策过程中不确定性和动态变化之间的相互交互。
对于许多实际应用程序来说,使用纳什均衡可能是太过简略化了。
纳什均衡假设每个人都做出最佳决策,但在实际情况下,由于某些合法限制,人们需要做出不同想象力的、不确定的决策。
因此,除了使用纳什均衡以外,研究这些行为的许多新方法已经被提出。
事实证明,当人们参与到多人博弈中时,往往采用一些普遍规律。
纳什均衡点
纳什均衡点纳什均衡名称来源及简介:纳什均衡(Nash equilibrium)又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。
其研究成果见于题为《非合作博弈》(1950)的博士论文。
该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。
纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。
他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。
该解概念后来被称为纳什均衡。
纳什均衡定义:假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。
所有局中人策略构成一个策略组合(Strategy Profile)。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。
即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡点纳什均衡点(港译:纳殊均衡点),又称为非合作博弈均衡点,是博弈论的一个重要概念,以约翰·纳什命名。
如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。
经典的例子就是囚徒困境,囚徒困境是一个非零和博弈学术争议和批评第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。
这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下达不到并不能解决问题。
纳什均衡不动点
纳什均衡的存在性与多重性对于数学家来说,一个数学概念的存在性与唯一性是特别需要加以关注的。
这是因为,从形式逻辑角度看,如果某个事物并不存在,那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的,因为对于不存在的事物来说,任何关于它的陈述或判断都不可能加以证伪。
所以,倘若某个概念所对应的事物并不存在。
那么,关于这个概念所给出的研究结论都必然不存在被证伪的可能。
因而根据波普尔的证伪主义观点,这样的研究不具备科学上的意义。
所以,我们在对任何新提出来的数学概念加以系统研究之前,首先需要弄清楚所研究的对象事物是否存在。
有许多被称为伪科学的东西,它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。
譬如,所谓的特异功能或“超灵学”并未得到证实,而UFO研究迷们至今也未能拿出一件存在球外生命的证据,所以,特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。
除了存在性之外,概念事物的唯一性也是数学家们所关心的问题。
从纯理论的兴趣上看,数学家们更多地是从审美的角度上看待概念的唯一性,但从波普尔的证伪主义哲学看,模型均衡解的唯一性关系到模型的预测功能,从而是科学理论应基本具有的特征。
我们在第二章中曾指出,理论的预测功能是判别理论的科学性的准绳,而在第三章中,我们提出用纳什均衡作为模型的预测结果。
按照这样的逻辑,一个自然的推论就是:模型能否具有科学意义取决于纳什均衡的唯一性。
因为倘若纳什均衡不是唯一的,那么就难以根据模型对即将出现的结果加以预测,这种不确定性对于科学理论来说是不存在的。
再加上前面谈到的存在性问题,我们可以这样说,模型能否具有科学意义取决于纳什均衡的存在性和唯一性,因为这正是科学理论所具有的基本性质。
博弈论目前发展的情况是这样的:已经证明在非常一般的情况下,纳什均衡是存在的,这是一个好的结果;但是,在许多情形,模型的纳什均衡解不是唯一的,这被称为纳什均衡的多重性问题。
Nash均衡存在性证明
x* = f ( x *) 。
Kakutani’s 不动点定理: X 是 ℜl 空间中非空,紧的凸子集, f : X → X 是一个对应。如
果 f 满足:
(i) 对于所有的 x∈X,集合 f(x)非空且为凸, (ii) f 的图像是闭的,即,如果 xn→x,yn∈f(xn),yn→y,那么 y∈f(x)(或者说对应 f 是上半
di
s
i
,σ
∗ −i
σ
∗ i
si
= di
si ,σ −i * ,
同乘
ui
si
,σ
∗ −i
− ui
σ
∗ i
, 对 si加总
s i ∈Si
( ( ) ( )) ( ) ( ( ) ( )) ( ) ∑ ( ) ∑ ∑ ⎛
⇒⎜
σ
∗ i
si
ui
si
,
σ
∗ −i
− ui
σ
∗ i
⎞ ⎟
di
s
i
,σ
∗ −i
连续的(upper hemi-continuous,uhc)),
那么则存在 x* 使得 x*∈f(x*)。
( ) ( ) 引理 1.1:σ ∗ 是纳什均衡当且仅当 ui
σ∗
≥ ui
si
,
σ
∗ −i
对所有 i 与 si ∈ Si 均成立。
( ) ( ) 证 明 : 当 ui
σ∗
≥ ui
si
,σ
∗ −i
( ) 即存在 s∗ 使得 si∗ ∈ b s−∗i 对所有 i 成立。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
纳什均衡的存在性与多重性对于数学家来说,一个数学概念的存在性与唯一性是特别需要加以关注的。
这是因为,从形式逻辑角度看,如果某个事物并不存在,那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的,因为对于不存在的事物来说,任何关于它的陈述或判断都不可能加以证伪。
所以,倘若某个概念所对应的事物并不存在。
那么,关于这个概念所给出的研究结论都必然不存在被证伪的可能。
因而根据波普尔的证伪主义观点,这样的研究不具备科学上的意义。
所以,我们在对任何新提出来的数学概念加以系统研究之前,首先需要弄清楚所研究的对象事物是否存在。
有许多被称为伪科学的东西,它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。
譬如,所谓的特异功能或“超灵学”并未得到证实,而UFO研究迷们至今也未能拿出一件存在球外生命的证据,所以,特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。
除了存在性之外,概念事物的唯一性也是数学家们所关心的问题。
从纯理论的兴趣上看,数学家们更多地是从审美的角度上看待概念的唯一性,但从波普尔的证伪主义哲学看,模型均衡解的唯一性关系到模型的预测功能,从而是科学理论应基本具有的特征。
我们在第二章中曾指出,理论的预测功能是判别理论的科学性的准绳,而在第三章中,我们提出用纳什均衡作为模型的预测结果。
按照这样的逻辑,一个自然的推论就是:模型能否具有科学意义取决于纳什均衡的唯一性。
因为倘若纳什均衡不是唯一的,那么就难以根据模型对即将出现的结果加以预测,这种不确定性对于科学理论来说是不存在的。
再加上前面谈到的存在性问题,我们可以这样说,模型能否具有科学意义取决于纳什均衡的存在性和唯一性,因为这正是科学理论所具有的基本性质。
博弈论目前发展的情况是这样的:已经证明在非常一般的情况下,纳什均衡是存在的,这是一个好的结果;但是,在许多情形,模型的纳什均衡解不是唯一的,这被称为纳什均衡的多重性问题。
纳什在1950年代证明了纳什均衡的存在性定理,为非合作博弈打下了重要基础。
纳什的工作不仅解决了存在性问题,而且还为其后的博弈论研究提供了一整套方法论工具,即运用不动点定理(fixed point theorem)这一强有力的数学工具进行博弈论数学分析,这对后来的博弈论甚至数理经济学的发展产生了很大的影响。
纳什均衡的多重性问题至今仍是困扰博弈论学者的一个主要问题。
为了攻克这一问题,博弈论专家已经做出了许多贡献,如聚点均衡、相关均衡,子博弈精炼纳什均衡,颤抖手均衡,序贯均衡等概念的提出。
但不幸的是,这类努力还未使得多重均衡问题完全得到解决,许多博弈论专家正在这一领域进行着不懈的工作。
本章将给出纳什均衡的存在性定理和讨论存在多重均衡情况下的均衡选择问题。
4.1 纳什均衡的存在性定理自从纳什(1950)首先给出存在性定理及其证明之后,许多学者又相继提出了不同表述下的存在性定理和不同的证明方法。
这里,我们介绍Myerson(1991)给出的存在性定理和证明。
4.1.1 纳什均衡与不动点定理所有的存在性定理证明都采用了不动点定理,这是因为,纳什均衡的概念在数学上就是一个不动点的概念。
在给出存在性定理及其证明之前,我们先来说明不动点的概念和给出不动点定理。
什么是“不动点”呢?考虑一个方程()x x f =,其中x 为方程的解。
我们将()⋅f 视为一种“变换”,即()⋅f 是将x 对应为()x f y =的变换,其中x 和y 分别是属于集合X 和Y 的两个元素,X ∈x ,Y y ∈。
如果Y X =,则方程()x x f =的几何意义就是:变换()⋅f 将x 变为自己,即x 在()⋅f 变换下是不变的,故称()x x f =的解为变换()⋅f 的不动点。
一般地,我们可以将所有的方程都写为如下形式:()0=x y (4.1)在式(4.1)两端加上一个x ,则变为()x x x y =+。
令()()x x y x f +=则有()x x f =所以,一般地,方程求解的问题本质上是寻找变换的不动点问题。
对于这样一种非常一般地的问题,数学家们感到十分高兴的是居然在不太严格的条件下式(4.1)存在解,即不动点是较为广泛地存在的。
譬如,图4.1表明不动点是曲线()⋅f 与45o 线的交点。
当函数()x f 定义在[]1,0∈x 区间上且因变量()x f y =的值域也为[]1,0区间时,如果()x f 是连续的,则必然存在不动点。
图4.1 [0,1]区间上的自变换函数的不动点x )(x fx1那么,这种现象到底具有多大的一般性意义呢?数学家Brouwer 在很久以前就注意到这一现象,他得出了如下的一般性定理,即著名的Brouwer 不动点定理。
定理4.1(Brouwer ……)设()x f 是定义在集合X 上的实函数,且()X ∈x f ,X ∈∀x 。
如果()x f 是连续的,X 为一非空的有界凸闭集,则至少存在一个X x ∈*使()**x x f =。
即()x f 至少存在一个不动点[1]。
有意思的是,Brouwer 不动点定理存在很强的几何直观[2],但其数学证明却十分艰深,需要动用代数拓扑这类就是职业数学家也感到望而生畏的超级抽象数学工具[3]。
在此,我们不给出Brouwer 不动点定理的证明。
直接用来证明纳什存在性定理的不动点定理还不是Brouwer 不动点定理,而是角谷静夫(Kakutani)不动点定理,而后者的证明只是前者的一个相对简单的运用。
我们所以要引用角谷静夫不动点定理,是因为在纳什均衡存在性证明中所遇到的反应函数一般是多个因变量函数,即所谓对应(correspondence),而角谷静夫不动点定理正好描述的是对应的一种性质。
角谷静夫不动点定理是Brouwer 不动点定理的推广,但其自身的证明要用到Brouwer 不动点定理。
我们在这里不打算给出这两个不动点定理的证明,因为这类证明只是一种纯数学过程,但我们将给出纳什存在性定理的一种证明,因为了解存在性定理的证明过程有助于我们更好地理解纳什均衡。
为了解读角谷静夫不动点定理,我们先来准备一下一些有关的数学概念。
对于任一有限集M ,我们用R M 表示形如()M m m x x ∈=的所有向量组成的集合,其中对M 中每一个m ,第m 个分量m x 是实数域R 的一个元素。
为方便计,我们也可将R M 等价地理解为M 到R 上的所有函数组成的集合,这时R M 中x 的m 分量m x 也可被记为()m x 。
令S 是R M 中的一个子集,我们有如下定义:定义4.1 S 是凸的(Convex)当且仅当对任意的M M R y R x ∈∈,及满足10≤≤λ的λ,只要S x ∈和S y ∈,则有()S y x ∈-+λλ1这里,()()()()()M m y x y x y y x x m m M m m M m m ∈-+=-+==∈∈,11,,λλλλ 定义4.2,S 是闭的(Closed)当且仅当对每个收敛的序列()}{∞=1j j x ,如果对每个j 都有()S j x ∈,则有()S j x j ∈∞→lim定义4.3,R M 中的子集S 是开的(open)当且仅当它的补集R M /S 是闭的。
定义4.4,S 是有界的(bounded)当且仅当存在某个正数K 使得对S 中的每个元素x 都有∑∈≤Mm mK x定义4.5,一个点到集合的“对应”(correspondence)Y X G →:是任何一个规定了对X 中的每个点x ,()x G 是与x 相对应的Y 中的一个子集。
如果X 和Y 都是度量空间,则X 和Y 上的收敛和极限概念已经定义,这时有: 定义4.6 ,一个对应G:X →Y 是上半连续的(upper —hemicontinuous),当且仅当对每个序列()(){}∞=1,j j y j x ,如果对于每个j 有()X j x ∈和()j y ()()j x G ∈,而且序列(){}∞=1j j x 收敛于某个点X x ∈,又序列(){}∞=1j j y 收敛于某个点Y y ∈,则有)(x G y ∈定理 4.2,对应Y X G →:是上半连续的当且仅当集合()(){}x G y X x y x ∈∈,,是集合Y X ⨯中的一个闭子集。
证明:必要性。
记集合()(){}Y X x G y X x y x A ⨯⊂∈∈=,,. 设()()()j y j x Z j ,=为A 中一收敛序列,其中()X j x ∈,()()∞=∈,,1),( j j X g j y由上半连续性知()()⎪⎭⎫ ⎝⎛∈∞→∞→j x G j y j j lim lim显然有()X j x j ∈∞→lim故A Zj j ∈∞>lim ,所以A 为Y X ⨯中一闭子集。
充分性。
假设A 为Y X ⨯上的一个闭子集。
如果序列()(){}∞=1,j j y j x 中每个()j x 和()j y 都有()X j x ∈, ()()()j x G j y ∈且(){}∞=1j j x 收敛于x 和(){}∞=1j j y 收敛于y ,则()()()j y j x Z j ,=收敛于()y x ,。
由A 的闭性知()A y x ∈,,即()x G y ∈ 故G 为上半连续。
证毕!上半连续性是我们熟知的连续函数概念的一种推广,而函数的连续性比上半连续性要强一些,于是有定理4.3,如果Y X y →:是一个从X 到Y 的连续函数,且对X 中的每一个X 都有()(){}x y x G =,那么Y X G →:是一个点到集的上半连续对应。
证明:设序列()(){}∞=1,j j y j x ,且对每个j 有()X j x ∈和()()()j x G j y ∈,(){}∞=1j j x 收敛于x ,(){}∞=1j j y 收敛于y 。
由y 的连续性知()x y y = 故()x G y ∈于是G 是上半连续的。
下面,我们将不动点概念扩充到对应的情形。
定义4.7,一个对应F :S S →的一个不动点是S 中任一满足()x F x ∈的x 。
角谷静夫得出如下被广泛应用的一个重要定理。
定理4.4 (角谷不动点定理)令S 是一个有限维向量空间中任一非空有界闭凸子集。
设F :S S →是任一上半连续的点到集对应,且对S 中每个()x F x ,都是S 的一个非空凸子集。
那么,S 中一定存在某个x 使得()x F x ∈(Kakutani, 1941)角谷不动点定理说的是对于有限维向量空间中任一非空有界闭凸子集上的上半连续自对应来说,在一定条件下都至少存在一个不动点。
角谷不动点定理及其它的一系列相关定理的证明还可参见Burger(1963), Franklin (1980)和Border(1985)。