纳什均衡的存在性定理中的相关解释

合集下载

纳什均衡

纳什均衡

(-8,0)
(-1,-1)
精品课程《运筹学》
第二节 纳什均衡
对囚徒l来说,囚徒2有坦白和不坦白两种选 择,假设囚徒2选择的不坦白,则对囚徒l来说, 不坦白得益为一l,坦白得益为O,应该选择坦 白;假设囚徒2选择的是坦白,则囚徒1不坦白 得益为一8,坦白得益为一5,他更应该选择坦 白。囚徒2唯一的选择也是坦白。 例8.2.2 设某村庄有3个农户,该村有一片大 家都可自由牧羊的公共草地。由于这片草地的 面积有限,草的数量只能让数量有限的羊吃饱, 如果在此草地上放牧的羊的实际数量超
人的策略集为Si Si1,,Sik ,则他以概率分布
pi pi1, pik 随机在其k 个可选策略中选择的
“策略”称为一个混合策略,其中
精品课程《运筹学》
第二节 纳什均衡
O≤ pij≤1对 k
j=1,…, k都成立,且
pij =1。
j 1
由定义可以看出,纯策略也可看作混合策略。
定义8.2.3 如果一个策略 G =S1,S2,Sn;h1,h2,hn中,
S1*
,
S
* i
,
S
* i1
S
* n
的最佳策略,即
hi
(S1*
, S i*1
,
Si*
,
S
* i1
,
S
* n
)
hi (S1*,Si*1, Sij , Si*1,Sn*)
对任意 S ij Si 都成立则称
S1*
,
S
* 2
,
S
* n

一个纯策略纳什均衡。
精品课程《运筹学》
第二节 纳什均衡
例8.2.1 “囚徒的困境” 警察抓住了两个罪犯,但 是警察局缺乏足够的证据指证他们所犯的罪行。如果 罪犯中至少有一人供认犯罪,就能确认罪名成立。为 了得到所需的口供,警察将这两名罪犯分别关押以防 止他们串供或结成攻守同盟,并分别跟他们讲清了他 们的处境和面临的选择:如果他们两人都拒不认罪, 则他们会被以较轻的妨碍公务罪各判1年徒刑;如果两 人中有一人坦白认罪,则坦白者立即释放而另一人将 重判8年徒刑;如果两人都坦白认罪,则他们将被各判 5年监禁。

Nash均衡存在性证明

Nash均衡存在性证明
Brouwer’s 不动点定理:若 f : X → X 是连续函数,而且 X 是非空、紧的凸集合,则存在
x* = f ( x *) 。
Kakutani’s 不动点定理: X 是 ℜl 空间中非空,紧的凸子集, f : X → X 是一个对应。如
果 f 满足:
(i) 对于所有的 x∈X,集合 f(x)非空且为凸, (ii) f 的图像是闭的,即,如果 xn→x,yn∈f(xn),yn→y,那么 y∈f(x)(或者说对应 f 是上半
di
s
i

∗ −i
σ
∗ i
si
= di
si ,σ −i * ,
同乘
ui
si

∗ −i
− ui
σ
∗ i
, 对 si加总
s i ∈Si
( ( ) ( )) ( ) ( ( ) ( )) ( ) ∑ ( ) ∑ ∑ ⎛
⇒⎜
σ
∗ i
si
ui
si
,
σ
∗ −i
− ui
σ
∗ i
⎞ ⎟
di
s
i

∗ −i
连续的(upper hemi-continuous,uhc)),
那么则存在 x* 使得 x*∈f(x*)。
( ) ( ) 引理 1.1:σ ∗ 是纳什均衡当且仅当 ui
σ∗
≥ ui
si
,
σ
∗ −i
对所有 i 与 si ∈ Si 均成立。
( ) ( ) 证 明 : 当 ui
σ∗
≥ ui
si

∗ −i
( ) 即存在 s∗ 使得 si∗ ∈ b s−∗i 对所有 i 成立。

纳什均衡理论

纳什均衡理论

纳什均衡理论“纳什均衡”:在经济学中,我们都知道市场是一只看不见的手在配置资源,个人追求利益最大化,构成纳什均衡,但并非能达到整体最优。

市场可以说是在供求关系博弈中实现纳什均衡,众所周知市场仍有一定的缺陷,是否意味着纳什均衡无法达到最优呢?如今,纳什均衡已成为经济学中的新课题。

一、纳什均衡定义纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。

假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡。

所有局中人策略构成一个策略组合。

从实质上说,纳什均衡是一种非合作博弈状态。

纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。

纳什均衡也不意味着博弈双方达到了一个整体的最优状态,个人最优状态未必达到整体最优。

从经济学角度来看,所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。

换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

以两家公司的价格大战为例,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。

于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是纳什均衡。

类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局等。

二、纳什均衡分类纳什均衡可以分成两类:“纯战略纳什均衡”和“混合战略纳什均衡”。

要说明纯战略纳什均衡和混合战略纳什均衡,要先说明纯战略和混合战略。

所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。

特别地是,纯战略决定在任何一种情况下要做的移动。

战略集合是由玩家能够施行的纯战略所组成的集合。

博弈论纳什均衡

博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。

两个囚徒互相揭发,就是一种纳什均衡。

对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。

也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。

这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。

博弈策略稳定,博弈结果也稳定。

之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。

之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。

2、纳什均衡意义重大。

纳什均衡提出,震动整个经济学界。

诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。

”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。

”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。

”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。

纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。

读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。

但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。

这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。

从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。

更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。

Q2:怎样运用纳什均衡?1、分析囚徒困境。

纳什均衡解释

纳什均衡解释

纳什均衡解释纳什均衡解释是20世纪最经典的经济理论之一,被称为“经济学家荣誉柱”。

该理论源于美国经济学家纳什(John F. Nash Jr.)1950年提出的“均衡等式纳什均衡”理论。

根据这一理论,当玩家之间的利益冲突变得越来越激烈时,他们为了获得更多的利益而不断修改解决方案,直到达到均衡,这就是“纳什均衡”,也就是政治、经济学和公共政策分析中用于分析博弈类任务的核心思想。

“纳什均衡”理论涉及到一个两人游戏,玩家之间会根据收益最大化或收益最小化来决定选择的行为方式,最终的结果就是“均衡”,也就是说这两个玩家可以不断改变自身的收益,最终形成某种“均衡状态”。

纳什均衡的本质是,当双方都能选择的行动受到约束时,两个玩家所选择的行动必须是双方收益最大化的行动,或者也可以说是收益最优化的行动,这就是经济学家所说的“纳什均衡”。

纳什均衡解释了现实社会中各个方面,从经济学到行为经济学,具有极其重要的理论价值。

例如,在经济学中,纳什均衡理论可以用来解释价格形成以及市场供求关系;在政治学中,经济学家可以借助纳什均衡理论来研究国家之间的博弈关系和利益冲突;而在行为经济学中,纳什均衡理论也可以用来解释个人行为模式,包括玩家的信息处理、判断和选择行为等。

此外,纳什均衡还有助于社会决策者和管理者来识别某种决策面临的均衡点,从而采取合理的行动,改进政府决策模式,减少社会问题并营造有利于社会发展的良好氛围。

例如,在政治斗争中,在政府正确识别纳什均衡点的前提之下,对于某些利益集团的处理更加客观公正,从而解决利益冲突并促进公平正义。

综上所述,纳什均衡是一个十分重要的理论,它已经成为经济学和行为经济学中一项重要的核心理论,并且在政治、经济学和公共政策分析中有着重要的作用。

研究人员和决策者应借助纳什均衡理论来识别面临决策的均衡点,从而能够采取更准确、更务实的措施,促进社会和谐稳定发展,促进公平正义。

每日一词:纳什均衡

每日一词:纳什均衡

每日一词:纳什均衡1、术语解释️纳什均衡Nash Equilibrium,是指非合作博弈中,所有的博弈当事人都维持自己的支配性策略的均衡状态。

值得说明的是,支配性策略是参与方各自的最优策略,但不一定是总体的最佳策略。

相关概念解释:合作博弈cooperative game:博弈双方达成一致意见,双方基于互相信任的前提下,按照事先约定的策略来做决策。

非合作博弈non-cooperative game:只考虑自己的利益,而不和别人串谋的情况下进行博弈。

支配性策略dominant strategy:对任何一个博弈参与方,无论对手方采取什么策略,自己都维持不变的策略。

支配性策略是参与方的占优策略。

(如备考,不管科目难易,都得认真学习,认真学习就是考生的支配性策略)纳什均衡的几个注意点:•是非合作博弈,不允许串谋。

•博弈当事人都是理性人。

•博弈各方是同时出招的。

•不是任何博弈都会产生纳什均衡的。

2、知识扩展纳什均衡的应用:囚徒困境Prisoners' Dilemma假设情景:AB都是小偷,被警察逮住了,逮住以后要判罪,但警察也没有其他证据。

警察就把AB分别关在两个小黑屋里,按下表所示逐个进行审问,然后根据两个人的招供结果来判罪。

警察是这么审问的:先去A那边问,你到底招不招,可以招可以不招,但是要想清楚后果。

如果你沉默,你兄弟也保持沉默,那关个半年就把你们放了。

如果你沉默,你兄弟坦白了,那你兄弟会立即释放,而你会被关10年。

如果你坦白,你兄弟保持沉默,你会被立即释放,而你兄弟会被关10年。

如果你坦白,你兄弟也坦白了,那就各关你们2年。

然后警察去了B那边,和B讲了同样的话。

然后警察暂时撤离,留他们自己思考。

A心里会嘀咕:B无非就两种选择,要么坦白,要么沉默。

B沉默时:如果我也沉默,我会被关半年,如果我坦白,我不会关。

所以我还是坦白好;B坦白时:如果我也坦白,会被关两年,如果我沉默,会被关10年。

所以我还是坦白好。

纳什均衡

纳什均衡

纳什均衡在政治学中的应用
选举策略:候选人在竞选活动中的决策和策略选择 政治谈判:国家间在谈判过程中的策略选择和利益平衡 国际关系:国家间在合作与竞争中的决策和策略选择 政治制度设计:政治制度设计中的决策和策略选择,如选举制度、议会制度等
纳什均衡在管理学中的应用
战略决策:企业在市场竞争中,通过纳什均衡分析,制定最优策略。 组织结构:纳什均衡理论可以帮助企业优化组织结构,提高管理效率。 激励机制:纳什均衡理论在企业激励机制设计中,可以指导企业制定有效的激励措施。 谈判与合作:纳什均衡理论在企业谈判与合作中,可以帮助企业实现利益最大化。
纳什均衡的应用
博弈论:纳什均衡是博弈论的核心概念,用于分析各种博弈问题 经济学:纳什均衡在经济学中广泛应用,如市场均衡、价格均衡等 政治学:纳什均衡在政治学中用于分析政治博弈,如选举、谈判等 社会学:纳什均衡在社会学中用于分析社会现象,如群体行为、社会规范等
纳什均衡的求解方法
第二章
纳什均衡的求解条件
纳什均衡
目录
CONTENTS
01 纳什均衡的概念 02 纳什均衡的求解方法 03 纳什均衡与博弈论 04 纳什均衡的局限性
05 纳什均衡纳什均衡的定义
纳什均衡是指在 一个博弈中,每 个参与者的策略 都是对其他参与 者策略的最优反 应。
纳什均衡是博弈 论中的一个重要 概念,由约翰·纳 什提出。
纳什均衡的求解步骤
确定博弈的 参与者和策 略集
建立支付矩 阵,表示参 与者在不同 策略下的收 益
计算每个参 与者的最佳 反应策略
检查是否存 在纳什均衡, 即每个参与 者的策略都 是对其他参 与者策略的 最佳反应
如果存在纳 什均衡,则 求解得到均 衡策略;如 果不存在, 则重新调整 策略集或支 付矩阵,重 复步骤3-4。

2. Nash均衡存在性

2. Nash均衡存在性
即:Rn中非空紧凸子集到自己的映射必有不动点。 例如: – 单值映射f(x)=x2,x∈[0,1],显然f是[0,1] →[0,1]映射,应用此定理 可断定必存在不动点;求解x=x2,得到两个不动点x=0和1; – 若x∈(0,1),则没有不动点;若x∈[0,1)或(0,1],则有一个不动点; 但因定义域和值域不是紧致集,此定理不适用于对这种情况下的 不动点存在性判定; – 任何闭区间内的函数f(x)=x+1无不动点。由于定义域和值域不同, 因此此定理也不适用于此。 Brouwer不动点定理提供了不动点存在的充分非必要条件(sufficient but unnecessary)
School of Management, USTC
—4—
扩展知识点:Hessian矩阵 vs Jacobian矩阵
海赛(Hessian)矩阵 针对的函数类型 元素构成 元素形式 矩阵维度 说明 f(x)的梯度为
f ( x) f ( x) f ( x ) f , , , x2 xn x1
类似一元函数的导数 在给定点处得到对可微函数的最 优线性估计(切线)。
School of Management, USTC
—5—
不动点定理(Fixed Point Theorems)
Brouwer不动点定理:
设C是Rn中的非空紧凸子集,函数f: C→C连续,则必存在x∈C,使 x=f(x)。该点称为不动点(fixed point)。
a
f(λa+(1-λ)b)
λa+(1-λ)b
b
拟凸函数(quasi-convex function):
实值函数f(.)是拟凸的 iif 函数f(.)的定义域C为凸集 且∀a, b∈C和∀λ∈[0, 1],均有 f(λa+(1-λ)b)≤max{f(a), f(b)} 改为<则为严格拟凸,改为≥即为拟凹函数

纳什均衡和帕累托最优的相关定理

纳什均衡和帕累托最优的相关定理

认知无线网络行为分析与网络效能研究V1.0.0 (2011- 04-26)973项目;认知无线网络的全局性能优化;纳什均衡及帕累托最优的相关定理;1. 简介本文档主要分两大部分:第一部分,主要是纳什均衡的存在性与唯一性证明定理。

第二部分,帕累托最优的相关定理。

2. 纳什均衡纳什均衡定义 行动组合12(,,...,)k s s s *=s 是纳什均衡,则对于任意参与者i K ∈,有:(,)(,)i i i i i i i i u s u s for all s S --''≥∈s *s *简言之,就是给定其他参与者策略的情况下,每个参与者选择使自己效用最大化的策略。

所有参与者的策略构成的组合即为纳什均衡。

2.1 存在性定理定理2.1.1[1][2]:(1)对所有的i K ∈,策略空间(1,2,...,)i S i K =是欧式空间中一个非空的、紧的凸集; (2)效用函数()i u s 是连续的且对i s 是拟凹的。

说明:在数学中,欧几里得空间 nR 的子集S 是紧的,如果它是闭合的并且是有界的。

(注:若不是在欧式空间中,闭合且有界的集合不一定是紧集。

)如果一个集合所有的极限点都是这个集合中的点,那么这个集合是闭集。

S 是凸集是指,对满足01λ≤≤的λ,只要,x S y S ∈∈,那么就有(1)x y S λλ+-∈。

简单而言,就是S 中的任何两点之间的直线段都属于S 。

图 2-1左图为凸集,右图为非凸集定理2.1.2[3]:如果一个博弈G 是S-模博弈(S-modular games ,SMG ),则至少存在一个纯纳什均衡。

定义1(S-模博弈S-modular games ,SMG ) 一个博弈G ,如果满足:(1) i K ∀∈,i S 是欧式空间中的一个紧集; (2) i u 在s 上是上半连续;(3) ,i i i K s s --'∀∈∀≥,()(,)i i i i u s u s s -'-是不减的。

纳什均衡的存在性与多重性

纳什均衡的存在性与多重性

纳什均衡的存在性与多重性对于数学家来说,一个数学概念的存在性与唯一性是特别需要加以关注的。

这是因为,从形式逻辑角度看,如果某个事物并不存在,那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的,因为对于不存在的事物来说,任何关于它的陈述或判断都不可能加以证伪。

所以,倘若某个概念所对应的事物并不存在。

那么,关于这个概念所给出的研究结论都必然不存在被证伪的可能。

因而根据波普尔的证伪主义观点,这样的研究不具备科学上的意义。

所以,我们在对任何新提出来的数学概念加以系统研究之前,首先需要弄清楚所研究的对象事物是否存在。

有许多被称为伪科学的东西,它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。

譬如,所谓的特异功能或“超灵学”并未得到证实,而UFO研究迷们至今也未能拿出一件存在球外生命的证据,所以,特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。

除了存在性之外,概念事物的唯一性也是数学家们所关心的问题。

从纯理论的兴趣上看,数学家们更多地是从审美的角度上看待概念的唯一性,但从波普尔的证伪主义哲学看,模型均衡解的唯一性关系到模型的预测功能,从而是科学理论应基本具有的特征。

我们在第二章中曾指出,理论的预测功能是判别理论的科学性的准绳,而在第三章中,我们提出用纳什均衡作为模型的预测结果。

按照这样的逻辑,一个自然的推论就是:模型能否具有科学意义取决于纳什均衡的唯一性。

因为倘若纳什均衡不是唯一的,那么就难以根据模型对即将出现的结果加以预测,这种不确定性对于科学理论来说是不存在的。

再加上前面谈到的存在性问题,我们可以这样说,模型能否具有科学意义取决于纳什均衡的存在性和唯一性,因为这正是科学理论所具有的基本性质。

博弈论目前发展的情况是这样的:已经证明在非常一般的情况下,纳什均衡是存在的,这是一个好的结果;但是,在许多情形,模型的纳什均衡解不是唯一的,这被称为纳什均衡的多重性问题。

混合的策略纳什均衡

混合的策略纳什均衡

流浪汉 寻找工作 流浪
救济 政府
不救济
2 3,
1 -1,
3 -1,
0 0,
虽这模型没有PNE,却有下述的MNE:参与人以一定的概率选择某种 策略,然后计算相应于不同概率的期望效用。
2020/6/17
9
设:政府救济的概率θ=1/2 ; 不救济的概率1-θ=1/2。 流浪汉寻找工作的期望效用: 1/2×2+1/2 ×1=1.5 流浪的期望效用: 1/2×3+1/2 ×0=1.5
✓ 每个参与人都想猜透对方的策略,而每个 参与人又不愿意让对方猜透自己的策略。
这种博弈的类型是什么?如何找到均衡?
2020/6/17
3
2. 混合策略、混合策略博弈和混合策略纳什均衡
• 策略:
– 参与人在给定信息集的情况下选择行动的规则,它规定参与人在 什么情况下选择什么行动,是参与人的“相机行动方案”。
E1(正面)=(-1)×r+1×(1-r)=1-2r 参与人1选取反面的期望效用为
E1(反面)=1×r+(-1)×(1-r)=2r-1
2020/6/17
15
参与人1的期望效用为 E1= E1(正面)×q + E1(反面)×(1- q ) =(1-2r)(2q-1)
类似地,得到参与人2的期望效用为
E2= E2(正面)×r + E2(反面)×(1- r ) =(1-2q)(2r-1)
参与人2
正面
反面
参与人1
正面 反面
-1, 1 1,-1
1,-1 -1, 1
由划线法可知,该博弈不存在纳什均衡。 所以采取纯策略不存在稳定的纳什均衡解。
2020/6/17
2

纳什均衡定理:描述博弈论中的策略平衡状态

纳什均衡定理:描述博弈论中的策略平衡状态

纳什均衡定理:描述博弈论中的策略平衡状态第一章:引言1.1 研究背景博弈论是一门研究决策者之间互动的数学分析方法。

在博弈中,每个参与者都会制定自己的策略,希望能够最大化自己的利益。

然而,在一个复杂的博弈过程中,各个参与者之间的策略选择会相互影响,导致可能存在多种策略的组合,称为均衡状态。

纳什均衡定理正是描述了这种策略平衡状态的存在和性质。

1.2 研究目的本文旨在介绍纳什均衡定理的基本概念和原理,探讨其在博弈论中的重要性和应用。

通过深入理解纳什均衡定理,我们可以更好地分析和预测各个参与者在博弈中的行为,为决策者提供合理的策略选择。

第二章:纳什均衡定理的基本概念2.1 纳什均衡的定义纳什均衡是指在一个博弈中,每个参与者采取的策略都是最优的,即在其他参与者的策略已知的情况下,不会有任何一个参与者单方面改变自己的策略能够获得更高的收益。

换句话说,每个参与者的策略选择都是相互依赖的,不存在单独改变策略能够获得更好结果的可能。

2.2 纳什均衡的存在性纳什均衡并不总是存在于每个博弈中,它的存在性取决于博弈的性质和玩家的策略空间。

但是,在一大类博弈中,纳什均衡定理确保了至少存在一个纳什均衡。

这个定理的证明基于数学方法和最优化理论。

第三章:纳什均衡定理的重要性和应用3.1 理论研究纳什均衡定理为博弈论提供了一个重要的理论基础。

通过研究纳什均衡,我们可以深入理解博弈过程中的策略选择和决策行为。

许多经典的博弈问题,如囚徒困境、合作博弈、零和博弈等,都可以通过纳什均衡定理来分析和解决。

3.2 实际应用纳什均衡定理在经济学、政治学、社会学等领域都有广泛的应用。

在经济学中,纳什均衡被用来研究市场竞争、价格博弈等问题。

在政治学中,纳什均衡可以解释政府和个人之间的博弈和权力分配。

在社会学中,纳什均衡可以用来分析人类行为和社会规范的形成。

第四章:纳什均衡定理的扩展和改进4.1 非完全信息博弈纳什均衡定理最初是在完全信息博弈中提出的,即每个参与者都完全了解其他玩家的策略和收益函数。

第四章__纳什均衡的存在性与多重性

第四章__纳什均衡的存在性与多重性
m∈M
定义 4.5,一个点到集合的“对应”(correspondence) G : X → Y 是任何一个规定了对
X 中的每个点 x , G(x)是与 x 相对应的 Y 中的一个子集。
如果 X 和 Y 都是度量空间,则 X 和 Y 上的收敛和极限概念已经定义,这时有:
定义 4.6 ,一个对应 G:X→Y 是上半连续的(upper—hemicontinuous),当且仅当对每
静夫(Kakutani)不动点定理,而后者的证明只是前者的一个相对简单的运用。
我们所以要引用角谷静夫不动点定理,是因为在纳什均衡存在性证明中所遇到的反
应函数一般是多个因变量函数,即所谓对应(correspondence),而角谷静夫不动点定理正
好描述的是对应的一种性质。角谷静夫不动点定理是 Brouwer 不动点定理的推广,但其
所有的存在性定理证明都采用了不动点定理,这是因为,纳什均衡的概念在数学上
就是一个不动点的概念。在给出存在性定理及其证明之前,我们先来说明不动点的概念
和给出不动点定理。
什么是“不动点”呢?考虑一个方程 f (x) = x ,其中 x 为方程的解。我们将 f (⋅)视 为一种“变换”,即 f (⋅)是将 x 对应为 y = f (x)的变换,其中 x 和 y 分别是属于集合 X 和 Y 的两个元素,x ∈ Χ , y ∈Y 。如果 X = Y ,则方程 f (x) = x 的几何意义就是:变换 f (⋅)将 x 变为自己,即 x 在 f (⋅)变换下是不变的,故称 f (x) = x 的解为变换 f (⋅)的不动点。
于是 G 是上半连续的。 下面,我们将不动点概念扩充到对应的情形。
定义 4.7,一个对应 F: S → S 的一个不动点是 S 中任一满足 x ∈ F (x) 的 x 。

第二章 纳什均衡 《博弈论与经济》 PPT课件

第二章  纳什均衡 《博弈论与经济》 PPT课件

▪ G的纳什均衡可由以下划线法求得。
▪ 1.对局中人1的每个策略i (i 1,2,, m) ,寻找局中人2的最
优反应。若最优反应为
j
,即 bij
max
k 1,2,,n
bik
,则在支付矩
阵元素 bij 下划一短线。
▪ 2.对局中人2的每个策略 j ( j 1,2,, n) ,寻找局中人1的
最优反应,若最优反应为 i
▪ 考虑由商店A, B构成的市场,A与B分别销售不同品牌的商 品,进行价格竞争。假设生产的单位成本为零。消费者 分为两类, n A ( 0)个消费者偏好于产品A,nB ( 0)个消费者 偏好于产品B。A,B两种品牌价格分别为 PA , PB 。设消费 者可从A或B处购买单位商品。
▪ 用 0表示由于购买不喜欢的产品所付出的厌恶成本,假 设消费者具有如下的效用函数
按 等待
等按待
(5,1) (9,1)
4,4
(0, 0)
▪ 严格纳什均衡为大猪“按”,小猪“等待”。
▪ 例2.7 在例1.8中的大堤维护博弈中,支付矩阵为
维护
不维护
不维维护护 ((1
4,4) 0,1 4)
((1140,,1100))
▪ 利用划线法可得纳什均衡(维护,维护),(不维护, 不维护)。
▪ 为了保护生命财产的安全,政府可以立法,如果参与人
第2章 纳什均衡
2.1 纳什均衡的定义
▪ 纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概念都是建 立在纳什均衡基础之上的。
▪ 纳什均衡是个策略组合 s* (si*, s*i ) ,它满足两个要求。

1.对每个局中人 i N
,能够预期到对手采用策略组合s

03 混合策略纳什均衡

03 混合策略纳什均衡

博弈论 第三章 混合策略纳什均衡
第一节 混合策略与期望支付
二、期望支付 3、数学刻画 、 博弈G={S1,…,Sn;u1,…,un}, 参与人 的纯策略空间为 参与人i的纯策略空间为 博弈 … Si= {si1,…,sik} … 混合策略p 表示参与人i选择纯 混合策略 i=(pi1,…,pik) , pik=p(sik )表示参与人 选择纯 … 表示参与人 策略s 的概率, 策略 ik的概率,0≤ pik ≤1,∑ pik=1 , 在纯策略情形下, 支付u 在纯策略情形下 支付 i=ui(s),对任何一个给定纯策略 , 组合s=(s1,s2,…sn), ui取-确定值 组合 与混合策略相伴的是得益(支付 的不确定性。这时: 与混合策略相伴的是得益 支付)的不确定性。这时 支付 的不确定性 混合策略组合p=( … … 混合策略组合 (p1,…,pi,…,pn) 对应混合策略组合的期望支付 期望支付为 对应混合策略组合的期望支付为:πi(p)=πi(pi, p-i) 4、两个局中人的期望支付 、
i =1 j =1 j =1 i =1
m
n
n
m
小 偷
例:小偷与守卫的猫鼠博弈 π小偷=8rq+(-2)r(1-q)+0⋅ (1-r)q+0⋅ (1-r)(1-q) ⋅ ⋅
=r[q⋅8+(1-q)(-2)]+ (1-r)[q⋅0+(1-q)⋅0] ⋅ ⋅ ⋅ =2r(5q-1) π守卫= (-2)rq+0⋅ r(1-q)+8(1-p)q+0⋅ (1-p)(1-q) ⋅ ⋅ =q [r⋅(-2)+(1-r)8]+ (1-q)[r⋅0+(1-r)⋅0] ⋅ ⋅ ⋅ =2q(4-5r)

数学中的平衡问题——纳什均衡

数学中的平衡问题——纳什均衡

数学中的平衡问题——纳什均衡当我们谈论场景中多个人或机器人在互动决策时,我们经常会提到“博弈”。

博弈是对决策者之间相互关注和互动的模型。

许多实际的应用都涉及博弈论,这也是为什么许多科学家、经济学家和社会学家都致力于探索博弈研究的原因。

最著名的、最有用的博弈理论之一是“纳什均衡”。

它是由美国经济学家约翰·纳什于1950年代提出的。

纳什均衡描述了一种状态,所有参与博弈的决策者都知道对于他们每个人的决策而言,对方的策略是什么,他们也知道对于对方的决策,最能带来什么结果。

在这种情况下,每个决策者都不会改变自己的策略,因为任何单独的变化都会使结果更差。

这种状态就是“纳什均衡”。

我们可以将纳什均衡类比为足球场上的两组队员之间的比赛:一方想向前发球,另一方想在另一个方向上拦截,因为他们都了解对手的意图,他们不会改变自己的策略。

要么拦截,要么护球,站在原地不动不是一个正确的自我利益选择。

一些经济学和社会科学领域的重要应用程序,如电力市场竞标、联合收益分配和医生和患者之间的博弈,都可以应用纳什均衡理论。

通常,在博弈理论中,我们涉及两种不同的博弈类型:合作和非合作博弈。

在一个合作的博弈中,决策者采取策略,以获得最大的共同收益。

在非合作博弈中,每个决策者都寻求最大化自身利益。

纳什均衡可以应用于这两种类型的博弈,但在非合作博弈中更为重要,因为每个决策者都要根据自身的需求和利益去决定最终的策略。

通过博弈论和纳什均衡,我们可以获得有关人类决策行为的重要见解。

无论是在经济学、社会学还是在人-机交互中,纳什均衡模型都可以被用于发现人们在决策过程中不确定性和动态变化之间的相互交互。

对于许多实际应用程序来说,使用纳什均衡可能是太过简略化了。

纳什均衡假设每个人都做出最佳决策,但在实际情况下,由于某些合法限制,人们需要做出不同想象力的、不确定的决策。

因此,除了使用纳什均衡以外,研究这些行为的许多新方法已经被提出。

事实证明,当人们参与到多人博弈中时,往往采用一些普遍规律。

1.5 多重纳什均衡及其甄别

1.5  多重纳什均衡及其甄别
U 甲 D 乙 L R
0,0,10 -5,-5,0
-5,-5,0 1,1,-5

矩阵B
U 甲 D
L
R
-2,-2,0 -5,-5,0
-5,-5,0 -1,-1,5
1、上述博弈,如处于均衡(U,L,A),甲、乙共谋有共 上述博弈,如处于均衡(U
谋的激励,会导致结果(D 谋的激励,会导致结果(D,R,A) 纳什均衡的精髓:单独偏离没有好处。 纳什均衡的精髓:单独偏离没有好处。 但共谋偏离,那时均衡及前面介绍的方法就无法解决了。这 就需要抗共谋均衡的思想 就需要抗共谋均衡的思想。 抗共谋均衡的思想。 2、抗共谋均衡:与一般纳什均衡的区别,主要是在没有单 抗共谋均衡: 独偏离的激励的基础上,进一步引入了没有集体偏离的激 励的要求。即一个策略组合之所以成为抗共谋均衡,不仅 要求局中人在这个策略组合下没有单独偏离的激励,而且 也要求他们没有合伙集体偏离的激励。
(四)聚点均衡
在现实生活中,局中人可能会使用某些被博弈模型抽 象掉的信息来达到一个均衡,这些信息往往跟社会文化习 惯、局中人过去博弈的历史和经历有关。这就是聚点均衡 惯、局中人过去博弈的历史和经历有关。这就是聚点均衡 的思想。 对于一些即不存在帕累托优势,又不存在风险优势的 博弈,人们往往利用聚点均衡的思想来指导人们的行动。 如:交通靠左靠右问题;打电话续 接问题;看足球还是芭蕾舞;
L U 甲 D
R
5,1
4,4 图5
0,0 1,5
更为重要的是,奥蒙证明,如果每一个人收到不同的但 相关的信号,每个人都可以得到更高的期望效应。设想 两人同意由第三人通过掷骰子的办法决定每个人的选择, 如果1点或2点出现,A选择U;如果3 如果1点或2点出现,A选择U;如果3—6点出现,A选择 点出现,A D。B的情况相反:如果1—4点出现,B选择L,如果5—6 的情况相反:如果1 点出现,B选择L,如果5 点出现,B选择R 点出现,B选择R。假定第三方只告诉每个参与人选择什 么行动,而不透露什么点出现,。这样,当A被告诉D 么行动,而不透露什么点出现,。这样,当A被告诉D时, 他只知道3 他只知道3—6中的一个出现了,但并不知道是哪一个; 特别地他不知道B 特别地他不知道B被告诉选择什么。所以我们说每个人收 到的信号是相关的但不同的。下面我们说明上述规则是 一个纳什均衡。

博弈论与信息经济学-2-3纳什均衡存在性

博弈论与信息经济学-2-3纳什均衡存在性

应用Kakutani不动点定理 证明纳什均衡的存在性
• 最后,我们要证明,r(σ )是上半连续的,即: 如果一个序列(σ m,σ m)→(σ ,σ ),σ m∈r(σ m), 那么σ ∈r(σ ),从而,由于r是ri的笛卡尔积, 对所有的i,σ i∈ri(σ -i)。 • 假定不是这样,即存在一个序列(σ m,σ m)→ (σ ,σ ),σ m∈r(σ m),但σ r(σ ),那么,由 于r是ri的笛卡尔积,对某些i,σ iri(σ -i)。 • 这样的话,存在一个ε >0和一个σ i’使得 υ i(σ i’,σ -i)>υ i(σ i,σ -i)+3ε 。
反应函数与反应对应
• 在库诺特模型中,给定企业j的产量qj, 企业i的最优产量qi是唯一的,我们称qi = Ri(qj)为企业i的反应函数。 • 在两人混合战略均衡中,给定参与人j的 (均衡)混合战略σ j,参与人i可能有无 穷多个最优混合战略σ i,我们称σ i = ri(σ j)为i的反应对应。
应用Kakutani不动点定理 证明纳什均衡的存在性
• 其次,因为期望效用是混合概率的线性函数, 因而是连续的和拟凹的(quasi-concave),ri(σ ) 从而r(σ )是非空的(有界闭集上的连续函数一定 有最大值)。 • 拟凹函数:定义在凸集合ARN上的函数f: AR是拟凹的,如果其上面的轮廓集合{x A: f(x) t}是凸集合,即,如果对于任意的t R, x, x’ A和 [0,1],f(x) t和f(x’) t意味着 f(x + (1- )x’) t。
函数与对应
• 函数或映射是集合上点与点之间的联系规则, 对应(correspondence)是集合上点与子集之间的 联系规则。 • 简单地说,给定X上的一个点x,如果f(x)给出 唯一的一个点y∈Y,f(x)称为从X到Y的函数; 如果f(x)给出一个点集Y(x)Y,f(x)称为从X到 Y的对应。 • 函数或映射是对应的特例,即Y(x)只包含唯一 点的情况,而函数也可以看作是映射的特例, 因为映射允许集合的元素是非实数。

纳什均衡存在性定理中的相关解释

纳什均衡存在性定理中的相关解释

纳什均衡存在性定理中的相关解释教材(《经济博弈与应用》)p33,图2.1表明不动点是曲线()⋅f 与45o 线的交点。

当函数()x f 定义在[]1,0∈x 区间上且因变量()x f y =的值域也为[]1,0区间时,如果()x f 是连续的,则必然存在不动点。

图2.1 [0,1]区间上的自变换函数的不动点直接用来证明纳什存在性定理的不动点定理不是Brouwer角谷静夫(Kakutani)不动点定理。

定义1 S 是凸的(Convex)当且仅当对任意的M M R y R x ∈∈,及满足10≤≤λ的λ,只要S x ∈和S y ∈,则有()S y x ∈-+λλ1定义2 S 是闭的(Closed)当且仅当对每个收敛的序列()}{∞=1j j x ,如果对每个j 都有()S j x ∈,则有()S j x j ∈∞→lim定义3 R M 中的子集S 是开的(open)当且仅当它的补集R M /S 是闭的。

定义4 S 是有界的(bounded)当且仅当存在某个正数K 使得对S 中的每个元素x 都有∑∈≤Mm m K x定义5 当函数()x f 满足下述性质时,我们称其为凹的:()()()()()[]n R x x x f x f x x f ∈∈-+≥-+212121, 1,0,11λλλλλ如果当()1,0∈λ时上面的不等式严格成立,则称()x f 为严格凹的。

一个函数()x f 是凸的当且仅当函数-()x f 是凹的;()x f 为严格凸函数当且仅当-()x f 为严格凹函数。

x 第一季第二季第三季第四季)(x fx1拟凹函数是凹函数概念的一种推广,它包括了凹函数在内的一大类函数,而这类函数在经济学中有着广泛应用,关于拟凹函数的定义如下:定义6 函数()x f 定义在R n 中的子集D 上,当且仅当()x f 满足如下性质时,()x f 是拟凹的:()()()()()2121,min 1x f x f x x f ≥-+λλ ∈λ[0,1]显然,凹函数是拟凹的,但反过来并不成立,即拟凹函数不一定是凹函数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

纳什均衡的存在性定理中的相关解释
教材(《经济博弈与应用》)p33,图2.1表明不动点是曲线()⋅f 与45o 线的交点。

当函数()x f 定义在[]1,0∈x 区间上且因变量()x f y =的值域也为[]1,0区间时,如果()x f 是连续的,则必然存在不动点。

图2.1 [0,1]区间上的自变换函数的不动点
直接用来证明纳什存在性定理的不动点定理不是Brouwer 不动点定理,而是角谷静夫(Kakutani)不动点定理。

定义1 S 是凸的(Convex)当且仅当对任意的M M R y R x ∈∈,及满足10≤≤λ的λ,只要S x ∈和S y ∈,则有
()S y x ∈-+λλ1
定义2 S 是闭的(Closed)当且仅当对每个收敛的序列()}{∞=1
j j x ,如果对每个j 都有()S j x ∈,则有
()S j x j ∈∞→lim 定义3 R M 中的子集S 是开的(open)当且仅当它的补集R M /S 是闭的。

定义4 S 是有界的(bounded)当且仅当存在某个正数K 使得对S 中的每个元素x 都有
∑∈≤M
m m K x
定义5 当函数()x f 满足下述性质时,我们称其为凹的:
()()()()()[]n R x x x f x f x x f ∈∈-+≥-+212121, 1,0,11λλλλλ
x )(x f x 1
如果当()1,0∈λ时上面的不等式严格成立,则称()x f 为严格凹的。

一个函数()x f 是凸的当且仅当函数-()x f 是凹的;()x f 为严格凸函数当且仅当-()x f 为严格凹函数。

拟凹函数是凹函数概念的一种推广,它包括了凹函数在内的一大类函数,而这类函数在经济学中有着广泛应用,关于拟凹函数的定义如下:
定义6 函数()x f 定义在R n 中的子集D 上,当且仅当()x f 满足如下性质时,()x f 是拟凹的:
()()()()()2121,m in 1x f x f x x f ≥-+λλ ∈λ[0,1]
显然,凹函数是拟凹的,但反过来并不成立,即拟凹函数不一定是凹函数。

在下图中,函数()x f 是拟凹的,但不是凹的。

图 不是凹函数的拟凹函数
x 1 y 0 x 2 x ()
x f。

相关文档
最新文档