第十章 策略性博弈与纳什均衡

合集下载

平新乔《微观经济学十八讲》课后习题详解(策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》课后习题详解(策略性博弈与纳什均衡)

第10讲 策略性博弈与纳什均衡1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是50020D Q p =-(1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗?解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。

理由如下:假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。

其次,达到均衡时,A p 和B p 都不会严格大于10。

否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。

所以均衡价格一定满足10A p ≤,10B p ≤。

但是由于A p 的下限也是10,所以均衡时10A p =。

给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。

综上可知,均衡时的价格为10A p =,10B p ε=-。

(2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。

下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为:max pq cq ε>- ①其中10p ε=-,()5002010q ε=-⨯-,把这两个式子代入①式中,得到:()()0max 1085002010εεε>----⎡⎤⎣⎦解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为:()()500201010εε-⨯--⎡⎤⎣⎦。

(3)这个结果不是帕累托有效的。

因为厂商B 的产品的价格高于它的边际成本,所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。

博弈论和纳什均衡

博弈论和纳什均衡

博弈论和纳什均衡引言博弈论是一门研究决策制定者之间相互作用的学科。

纳什均衡是博弈论中的一个重要概念,表示在每个决策制定者根据自己的利益进行选择的情况下,不存在个体可以通过单独改变自己的策略来进一步获益的状态。

本文将介绍博弈论的基本概念和纳什均衡的理论,并探讨其在现实生活中的应用。

博弈论基本概念博弈论研究的对象是决策制定者之间的相互作用,其中包括两个或更多个决策制定者,每个决策制定者可以选择不同的策略。

博弈论的基本元素包括玩家、策略和收益。

玩家是决策制定者的角色,策略是玩家在每个决策点上可以采取的行动,收益是每个玩家在不同策略组合下所获得的利益。

博弈论中常见的博弈形式包括合作博弈和非合作博弈。

在合作博弈中,玩家之间可以进行合作并达成协议,而在非合作博弈中,玩家之间相互独立且没有协作的能力。

纳什均衡的概念纳什均衡是博弈论中的一个重要概念,由诺贝尔经济学奖得主约翰·纳什提出。

纳什均衡指的是在每个决策制定者根据自己的利益进行选择的情况下,不存在个体可以通过单独改变自己的策略来进一步获益的状态。

具体来说,在一个博弈中,如果每个玩家选择了一个策略组合,且任何一个玩家单独改变自己的策略都无法提高自己的收益,那么这个策略组合就是一个纳什均衡。

纳什均衡可以通过数学方法进行计算,其中最常用的方法是利用最优响应函数。

最优响应函数指的是一个玩家在其他玩家的策略给定时,可以最大化自己的收益的策略选择。

纳什均衡的特性纳什均衡具有以下几个重要的特性:1.独立于个体的理性决策:纳什均衡的形成不依赖于玩家之间的协商或合作,而是由每个玩家根据自己的利益进行独立的决策而达成的。

2.稳定性:在纳什均衡中,每个玩家都在最优响应下选择策略,没有动机或能力单独改变自己的策略来获得更好的结果。

这种稳定性使得纳什均衡成为一种理想的博弈状态。

3.不一定最优:纳什均衡并非一定是博弈的最优结果,即每个玩家获得的收益并不一定是最大化的。

纳什均衡是一种均衡状态,每个玩家在给定其他玩家的策略下无法获得更多的收益。

博弈论之策略型博弈与Nash均衡

博弈论之策略型博弈与Nash均衡

2. 博弈要素
• 局中人 • 策略
纯策略空间 Si={Si1, Si2,…, Siki}
• 盈利(支付)函数(payoff function): Ui(s)
3. 博弈的分类
• 从信息的角度:完全信息、不完全信息 • 从局中人行动的先后次序:静态博弈、
动态博弈 • 完全信息静态博弈
完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
1
2
1
4
6
0
6
8
3 12
1 46
0 68
U
局中人1 M
D
局中人2
L
R
4,3 6,2
2,1 3,6
3,0 2,8
局中人1 U
局中人2
L
R
4,3 6,2
• 合理,符合逻辑的过程,得到累次严优 的解为:
局中人2 L
局中人1 U
4,3
• 累次严优的局限性
严劣纯策略
• 定策略义σ:i*对,局使中得人si-的i某S-个i 纯策略si, 如果存在混合 Ui(σi*,s-i) ≥ Ui(si, s-i)
性别战(battle of sexes)
B 丈夫
F
妻子
B
F
1,2 0,0
0,0 2,1
腐败问题的博弈分析
政府
监督
不监督
受贿 官员
R-F, R,F-C- S
S
不受贿 0,- 0,0
C
贸易自由化的博弈分析
乙国
自由化
保护
自由化 甲国
保护
10, -10, 10 20
20, -5,-10 5
大户与散户的博弈模型
上市公司虚假信息披露行为的博弈分析

第十讲策略性博弈与纳什均衡

第十讲策略性博弈与纳什均衡

在这个博弈中, 直线X1+X2=1上的点都是纳什均衡, 故有穷个无个纳什均衡
X1+X2=1
(一)聚点均衡: 利用被博弈模型抽象掉的 信息来达到一个“聚点”均衡 信息: 信息 习惯,经历,文化背景,性格
(二)风险占优: 选择风险较小的结局
(三)帕雷托(Pareto)最优均衡
在不损害其他人的利益时, 不能增加自己的利益。
1 1 ( , ) 2 2
同理参与者I的最优策略为选择正、 反面的概率分布为
1 1 ( , ) 2 2
σ ij
是选择
S ij
ki j =1
的概率
ij
∑σ = 1 则概率密度 σ = (σ ,L , σ ) i i1 iki
j = 1L , ki 0 ≤ σ ij ≤ 1
称为i的一个混合策略,
混合策略纳什均衡
参与者I出反面的期望收益为:
δ (1) + (1 − δ )( −1) = 2δ − 1
这样参与者I出正反面的概率分布为 (p,1-p)时的期望收益为:
u1 ( p, δ ) = p(1 − 2δ ) + (1 − p)(2δ − 1) KKK = (1 − 2δ )(2 p − 1)
①如果
1 1 − 2δ < 0 ⇔ δ > 2
'' i
下式成立
u i ( s , s −i ) < u i ( s , s −i )
则称
s
' i
为相于 的严格下策。
s
'' i
• 我们把排除下策的过程叫做“简单占优”, 即只排除一次。一旦在第一个参与人排除 了一个策略之后,一个或几个策略会在此 基础上相继被排除 • 掉,则称占优过程为“相继占优” 或“重 叠占优”,只有“简单占优”,我们无法 预测博弈的最终结果。

策略博弈与纳什均衡

策略博弈与纳什均衡

结果
构模者在博弈进行了以后从 行动、收益与别的变量的数 值中取到的一组感兴趣的要 素的集合。
结果代表了的是博弈可能发 生的结局。
囚犯B
不揭发 揭发
囚 犯
不揭发 5,5 -1,6
A
揭发 6,-1 0,0
均衡
博弈中的均衡,记为 s* (s1* , s2* , , sn* ) ,是博弈中 n 个参与者各自都采
博弈里参与者是作出决策的个人。每个决策者 通过选择行动使自己效用极大化。
OPEC组织中,沙特和科威特是参与者,而中 国老百姓并不是参与者。
行动集与行动组合
行 动 集:参与者i 的行动集(action set),记为 Ai ai,是该参与者可能采取 的全部行动之集合。 行动组合:一个行动组合是一个有序集 a ai(i 1,2, n) ,是由一人博弈中 n 个 游戏者各取一个行动而组合成的。
行动是你采取的某种行动方式,只要可能,你都 可以采取;策略是一种有条件的应对行动方案;
行动是一种客观可能性,是可以观察到的。策略 是一种主观的、心理上的应变对策,你不可能观 察到对手心中的策略,并不能见到他心中会设计 好的应对的行动方案。
收益(payoff)
收益就是博弈后给参与者的效用。 参与者与别的参与者选择的策略的函数带给参与者的预期 效用。 收益只是博弈带给参与者的效用,收益不等同于结果。
第三讲 策略博弈与纳什均衡
第一节 基本概念
博弈是对许多人一个策略相互依存的构架中相互作用这 种情况的正式表述。 一个博弈的基本要素:
参与者players 行动actions 信息information 策略strategies 收益payoffs 结果outcomes 均衡equilibrium

策略博弈与纳什均衡

策略博弈与纳什均衡
3纳什均衡?假设n个参与博弈给定其他人战略的条件下每个人选择自己的最优战略所有参与人选择的战略一起构成一个参与博弈给定其他人战略的条件下每个人选择自己的最优战略所有参与人选择的战略一起构成一个战略组合所有参与人的最优战略组合则是纳什均衡
第三讲 策略博弈与纳什均衡
第一节 基本概念
博弈是对许多人一个策略相互依存的构架中相互作用这 种情况的正式表述。 一个博弈的基本要素:
ui (si , si ) ui (si, si )
即 si 是参与人 i 的严格占优策略,如果对于参与人 i 的竞争对手可能
选择的任何策略,它唯一使参与人 i 的支付最大化。
第三节 最优反应与纳什均衡
最优反应 1.所有别的游戏者的策略的表述
对于某一个策略组合s=(s1,s2…,si, …,sn), 我们记s-i=(s1,s2…,si-1, si+1 …,sn)
si* Bi (s*i ) for i I
第三,按照参与人之间是否合作分为合作博弈和非合作博弈。
合作博弈是指参与人之间有着一个对各方具有约束力的协议,参 与人在协议范围内进行的博弈。
反之,就是非合作博弈。
非合作博弈的类型可分为完全信息静态博弈,完全信息动态博弈, 不完全信息静态博弈,不完全信息动态博弈。
与上述四种博弈相对应的均衡概念:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium), 精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。
行动是你采取的某种行动方式,只要可能,你都 可以采取;策略是一种有条件的应对行动方案;

《西方经济学》讲义 第十章 博弈论初步

《西方经济学》讲义 第十章 博弈论初步

第十章博弈论初步一、教学目的使学生具备博弈论的思维,会使用博弈的方法来分析经济问题,掌握博弈论的基本概念和应用。

二、教学重点博弈论的基本概念、参与人、行动、信息,纯策略均衡,混合策略均衡。

三、教学难点纳什均衡的概念、策略选择。

四、教学方法讲授和讨论五、教学安排本章计划安排6学时六、教学步骤(一)课程导入传统博弈论纳什均衡解的概念是以博弈规则、参与者的理性以及参与者的收益函数都是共同知识为前提的。

现实生活中的人们并不是理性的,行为主体很难在短时间内准确地寻找到自己的最优决策,同时对其他主体的行为预测也同样不可能准确无误。

列举“囚徒困境”、“智猪博弈”的例子,引发学生对博弈的思考,理解策略的意义和应用性。

(二)课堂教学设计以寡头市场为例引入教学内容:我们知道,在寡头市场上(寡头市场又成为垄断市场。

它是指几家厂商控制整个市场的产品的生产和销售的这样一种市场组织),厂商们之间的行为是相互影响的,每个厂商都需要首先推测或者了解其他厂商对自己所要采取的某一行动的反应,然后在考虑到其他厂商这些反应方式的前提下,再采取对自己最有利的行动。

在寡头市场上的每一个厂商都是这样思考和行动的,因此,厂商之间行为的相互影响和相互作用的关系如同博弈。

(三)教案内容第一节博弈论和策略行为一、博弈论的含义博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。

策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动是指,每个人要根据其他人的可能反应来决定自己的决策和行动。

二、博弈的三个基本要素三个基本要素,即参与人、参与人的策略和参与人的支付。

所谓参与人(或称局中人),就是在博弈中进行决策的个体;所谓参与人的策略,指的是一项规则,根据该规则,参与人在博弈的每一时点上选择如何行动;所谓参与人的支付则是指,在所有参与人都选择了各自的策略且博弈已经完成之后,参与人获得的效用(或期望效用)。

西方经济学微观部分第十章博弈论初步

西方经济学微观部分第十章博弈论初步

策略1 策略2
b p 1 ( b 1 1 b 1 ) 2 ( 1 p 1 )b 2 ( 1 b 2 )2
b11

参 p1 略
A的p1 条件010,1混 合aaa策 000略为与人A p:2 策略12
a11 b21
a21
b12 a12
b22 a22
[习题] 博弈论初步
[习题] 博弈论 初步
p1
单击添加副标题
第十章 博弈论初 步
西方经济学 (微观部分)
*自嘲* 一介学究,惶惶似狗。 东拼西凑,闲来插柳。 或存疏漏,等着挨揍。 钱财无有,知识半斗。 交流携手,相逢美酒。 余望何求?潮起云收。
第十章 博弈论初步 目录
目 录 /CONTENTS
1
第一节 ○
博弈论和

策略行为
2
第二节
3
0 q10.7 1 p10.5 7
1
9– 8–
2
第三节 混合策略均衡 二、混合策略的纳什均衡
第三节 混合策 略均衡
二 混合策略的纳什均衡
❖ 即使纯策略的纳什均衡不存在,相应的混合策
略纳什均衡总会存在。
❖ 纯策略纳什均衡作为 ·q1 1 特例被包括在混合策 略纳什均衡之中。 0.7·
❖ 混合策略博弈的均衡
[案例] “华容 道”里的纳什
均衡(1)
小 道
孔 明
大 路
[案例]“华容道”里的纳什均衡(1)
[案例] “华容道”里的纳什均衡(1)
曹操 小道 大路
被擒
逃脱
擒住 逃脱
空等 被擒
空等
擒住
❖ 孔明曰:“亮夜观乾象,操贼未合身亡。 留这人情, 教云长做了,亦是美事。” 玄德曰:“先生神算,世所罕及!”

博弈论与纳什均衡

博弈论与纳什均衡

《博弈论与纳什均衡理论》姓名张贺祺学号 2010010404 专业政治经济学指导老师张秉云摘要博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。

即在给定别人策略的情况下,没有人有足够理由打破这种均衡。

纳什均衡,从实质上说,是一种非合作博弈状态。

关键字:博弈论;纳什均衡;合作博弈;非合作博弈目录摘要 (2)关键字 (2)一、引言 (4)二、博弈论与纳什均衡的主要内容 (4)(一)博弈论的主要思想 (4)(二)博弈论的分类 (5)三、经典案例 (7)(一)博弈论的经典案例 (7)(二)纳什均衡经典案例 (7)四、博弈论和纳什均衡的重要影响 (8)(一)博弈论的重要影响 (8)(二)纳什均衡的重要影响 (8)参考文献 (9)博弈论与纳什均衡理论一、引言近代对于博弈论的研究,开始于策墨咯(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。

1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。

纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的学科。

微观经济学第十章博弈论

微观经济学第十章博弈论

博弈论的基本概念
策略
参与者为达到最优目标而采取的 行动方案。
信息
参与者对其他参与者的行动或策 略的了解程度。
01
02
参与者
参与博弈的决策主体,可以是个 人、组织或国家。
03
04
收益
参与者在博弈中获得的利益或损 失。
博弈论的应用场景
01
02
03
04
商业竞争
企业间竞争策略、市场份额争 夺等。
政治外交
05
博弈论的实际应用
商业竞争中的博弈策略
竞争策略
企业可以利用博弈论来制定竞争 策略,例如通过分析竞争对手的
可能行动来制定最优反应。
合作博弈
企业也可以通过合作博弈来寻求共 赢,例如通过建立战略联盟或进行 合作研发来共同开拓市场或降低成 本。
市场进入与退出
博弈论可以帮助企业分析市场进入 和退出的可能性,以及制定相应的 策略。
感谢您的观看
THANKS
政策制定中的博弈论应用
政策制定
政府可以利用博弈论来制定政策, 例如通过分析利益相关方的博弈
行为来制定最优政策。
政策执行
政府也可以利用博弈论来分析政 策的执行效果,例如通过分析利 益相关方的反应来评估政策的可
行性。
政策调整
博弈论可以帮助政府根据利益相 关方的反应来调整政策,以实现
更好的政策效果。
国际关系中的博弈策略
纳什均衡的应用实例
囚徒困境
两个囚犯选择坦白或沉默,在给定对 方选择的情况下,自己选择坦白是最 优策略,最终导致两个囚犯都坦白, 实现了纳什均衡。
寡头竞争
公共资源过度使用
在公共资源的使用中,每个个体都追 求自身利益最大化,最终导致公共资 源过度使用,这也是一种纳什均衡的 现象。

策略性博弈与纳什均衡

策略性博弈与纳什均衡

二、纳什均衡: 1、纳什均衡的定义: 一个策略组合S*=(S1*,S2*, …,Sn*)被称 为纳什均衡,如果别的游戏者不背离这一组合, 就没有人背离他自己的最优反应S,换言之,对 于所有的i, Ui(Si*,S-i*) ≥ Ui(Si*,S-i*) 这也就是说,当参与博弈的每一个游戏者都选 择了自己最优反应策略时,并且这些最优反应 形成一个组合,便形成了纳什均衡
第十章 策略性博弈与纳什均衡
第一节 基本概念 第二节 策略博弈与占优 第三节 最优反应与纳什均衡 第四节 混合策略与最大最小策略
第一节 基本概念 一、游戏者: 博弈里的游戏者是作决策的个人。每个游 戏者的目标是通过选择行动使自己的效用极大 化。
二、行动或步骤: 指参与人的所有可能的策略或行动的集合。
B 左 上 右
A
1,0
1,1

-1000,0
2,1


感谢全体区域经济学同学的帮助,他们分 别是岳松、周岩、吕伟伟、余欢、王朝晖、高 佳虹、何佳琛
主讲:罗登义
在一个博弈中,博弈方i策略空间为 Si={Si1,Si2,…,Sin},则博弈方i以概率Pi=(pi1, pi2,…,pin)随机在其K个可选策略中选择的“策 略”,称为一个“混合策略”,其中0 《 Pij 《 1对 j=1,2,…,k都成立,且Pi1+…+pik=1
二、最大最小策略: 这是一种保守的策略,又是风险比较小的 策略。当游戏者想回避风险时,他会采取该策 略。
3、举例
囚徒B 不揭发 囚徒A 不揭发 揭发同伴 5 ,5 6,-1 揭发同伴 -1,6 0 ,0
4、纳什均衡不唯一的例证
丈夫 看拳击 妻子 看拳击 看芭蕾 4 ,5 0,0 看芭蕾 0,0 5 ,4

第10章 贝叶斯博弈与贝叶斯Nash均衡

第10章 贝叶斯博弈与贝叶斯Nash均衡
• 软弱的决斗者胆小怕事,总是退下来, 因此,强硬的决斗者选择冲上去。
Department of Mathematics
Northwest University
当参与人1为软弱者参与人2为强硬者时
2
U
D
U -4, -4
0, -2
1
D
0, 2
1, 0
• 博弈存在唯一的Nash均衡——(D, U)。
Department of Mathematics
Department of Mathematics
-4,-4
2,0
-2,0
0,1
Northwest University
如果“自然”选择参与人2的性格特征是“软弱”的, 则意味着参与人1与“软弱”的参与人2进行决斗,博 弈进入决策结x2,其支付由(2)决定。
N
强硬( p)
x0
软 弱(1 p)
1
x1
策略---概率: (U,U)---x
(U,D)---1-x
支付:
-4,-4
2,-2
参与人1期望支付: -4x+2(1-x)
软弱的参与人2: (1-p1)
由于参与人1为强硬,而当他预感到参与人2为软
弱时,参与人只会选择退缩,即
策略: (U,D)
支付: 2,0
期望支付: 2
v 1 ( U ) p 1 ( 4 x 2 ( 1 x ) ) 2 ( 1 p 1 ) 2 6 x p 1
Department of Mathematics
Northwest University
• Harsanyi转换:在原博弈中引入一个“虚 拟”参与人——“自然”(nature,用N表 示),构造一个参与人为两个决斗者和 “自然”的三人博弈。

高鸿业《西方经济学(微观部分)》(第2版)名校考研真题详解-第十章 博弈论初步【圣才出品】

高鸿业《西方经济学(微观部分)》(第2版)名校考研真题详解-第十章 博弈论初步【圣才出品】

第十章 博弈论初步一、名词解释1.占优策略均衡(中央财经大学2011研;兰州大学2014研)答:在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。

也就是说,无论其他参与人采取什么策略,该参与人的最优策略是唯一的,这样的策略称之为占优策略。

如表10-1所示,通过对支付矩阵的分析可以看出,如果A 、B 两厂商都是理性的,则这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个厂商都会选择做广告。

这种策略均衡称之为占优策略均衡。

表10-1 广告博弈的支付矩阵2.纳什均衡(华中科技大学2002研;中国海洋大学2002研;东北大学2003研;武汉大学2003、2007研;北京大学2004研;北京师范大学2005研;中南大学2005研;东华大学2006研;东北财经大学2007研;中南财经政法大学2007、2009研;中央财经大学2007研;财政部财政科学研究所2008研;华南师范大学2011研)答:纳什均衡又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰·纳什的名字命名。

纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略的情况下,他选择了最好的策略。

纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而没有人有积极性去打破这个均衡。

3.混合策略(东北大学2007研;华中科技大学2008研)答:混合策略是指在博弈中,博弈方的决策内容不是确定性的具体的策略,而是在一些策略中随机选择的概率分别的策略。

混合策略情况下的决策原则有以下两个:(1)博弈参与者互相不让对方知道或猜到自己的选择,因而必须在决策时利用随机性来选择策略,避免任何有规律性的选择。

(2)博弈参与者选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性倾向的某一种策略而在博弈中占上风。

4.以牙还牙策略(东北财经大学2012研)答:以牙还牙策略的内容是:所有的成员一开始是合作的。

纳什均衡与博弈论

纳什均衡与博弈论

纳什均衡与博弈论在现代社会中,人们的需求和利益往往是相互竞争的。

博弈论和纳什均衡的概念被应用于许多领域,从经济学到国际关系。

本文将讨论纳什均衡和博弈论的基本原理,以及它们在日常生活和各个领域中的应用。

博弈论是一种研究人们决策行为的数学模型。

在博弈论中,玩家的决策受到其他玩家的决策影响,每个玩家都试图找到一种最优的策略来实现自己的目标。

这种情况下,纳什均衡是博弈论中的一个重要概念。

纳什均衡是指在一个博弈中,所有参与者都选择了最佳策略,假设其他参与者的策略不变。

在纳什均衡下,没有任何一个参与者可以通过单方面改变策略来改善自身的结果。

也就是说,每个参与者都能够最大化自己的利益,而不能通过追求自己的利益来牺牲其他人的利益。

一个简单的例子可以帮助我们更好地理解纳什均衡。

假设有两个公司A和B同时决定要降价以吸引更多的顾客。

在这种情况下,每个公司都有两种策略,即降价和不降价。

当A和B都选择不降价时,他们的利润是最高的。

但是,如果A降价而B不降价,A将吸引更多的顾客并获得更高的利润。

同样,如果B降价而A不降价,B将获得更高的利润。

因此,在这种情况下,纳什均衡是A和B都选择不降价。

因为任何一方单方面降价都不会带来更好的结果。

纳什均衡不一定意味着最优解,它只是一种稳定的状态。

在现实生活中,人们往往需要根据具体情况做出决策。

博弈论和纳什均衡可以帮助我们理解他人的行为和决策,并最大化我们自己的利益。

博弈论和纳什均衡不仅在经济学中有广泛的应用,也在其他领域有重要的作用。

例如,在生物学中,许多动物会进行博弈以获取资源和繁殖权利。

在政治学中,博弈论可以解释国家之间的争端与合作。

在社会学中,博弈论可以用来研究人们在群体中的互动以及社会规则的形成。

此外,纳什均衡还可以应用于网络安全和信息传输领域。

当涉及到网络攻击和防御时,博弈论可以帮助我们预测黑客的行为并制定相应的防御策略。

在信息传输中,纳什均衡可以帮助我们设计有效的传输协议以确保数据的安全和可靠性。

博弈论中的博弈策略与纳什均衡

博弈论中的博弈策略与纳什均衡

博弈论中的博弈策略与纳什均衡博弈论是一门研究决策制定和行为选择的学科,主要应用于经济学、政治学、社会学等领域。

在博弈论中,博弈策略和纳什均衡是两个重要的概念。

本文将探讨博弈策略和纳什均衡的含义、应用以及相关案例。

一、博弈策略的概念博弈策略是指在博弈过程中参与者采取的行动方案。

博弈策略的选择会影响参与者的利益和最终的结果。

博弈策略可以分为纯策略和混合策略两种形式。

1. 纯策略纯策略是指在博弈中,参与者只选择一种特定的行动方案。

例如,在一个两人零和博弈中,参与者可以选择合作或背叛。

如果参与者选择合作,那么他们的策略就是纯策略“合作”;如果参与者选择背叛,那么他们的策略就是纯策略“背叛”。

2. 混合策略混合策略是指在博弈中,参与者以一定的概率选择不同的纯策略。

例如,在一个两人博弈中,参与者可以选择以50%的概率选择合作,以50%的概率选择背叛。

这样的策略就是混合策略。

二、纳什均衡的概念纳什均衡是博弈论中的一个重要概念,指的是在一个博弈中,每个参与者都选择了最优的策略,而且没有动机再次改变策略。

纳什均衡是一种稳定的策略状态,参与者无法通过改变自己的策略来获得更好的结果。

纳什均衡可以分为纯策略均衡和混合策略均衡两种形式。

1. 纯策略均衡纯策略均衡指的是在一个博弈中,每个参与者都选择了一个特定的纯策略,而且没有其他纯策略可以给他们带来更好的结果。

在纯策略均衡下,每个参与者的策略选择是最优的。

2. 混合策略均衡混合策略均衡指的是在一个博弈中,每个参与者以一定的概率选择不同的纯策略,而且没有其他混合策略可以给他们带来更好的结果。

在混合策略均衡下,每个参与者的策略选择是最优的。

三、博弈策略与纳什均衡的应用博弈策略和纳什均衡在许多领域都有广泛的应用,尤其是在经济学和政治学中。

下面将介绍一些实际案例。

1. 俘虏困境俘虏困境是一个经典的博弈论案例。

在这个案例中,两名嫌疑人被关押在不同的牢房,警察给他们提供了一个选择:如果两人都保持沉默,那么他们都只会被判处轻罪;如果其中一个人供认,而另一个人保持沉默,供认者将被免罪,而保持沉默者将被判处重罪;如果两人都供认,那么他们都将被判处重罪。

第十章---博弈论初步精选全文完整版

第十章---博弈论初步精选全文完整版
由于p1,p2和q1,q2的取值有无限多的可能,
甲 (式乙)
p.61
p.42
A B
混合策略组合及其支付也就有无限多的可能。
q.31 C 4,6 7,3

.q72 D 9,1 2,8 9
不存在纯策略均衡时的混合策略均衡3
• 条件混合策略:参与人在假定其他参与人按某一概率选择某一策略
的条件下设计的对自己而言具有相对优势的(即期望支付最大的)混合 策略,称为“条件混合策略”。
• 对乙而言,如果假定甲合作,那么乙合作的支付为6,比不合作的支付 多1,因此合作是甲合作条件下乙的条件策略;假定甲不合作,那么乙的 条件策略是也不合作,乙若合作支付只有1,不合作则可得到3。
• 条件策略组合:参与人以其他参与人选择某一策略为条件的条件策略与
作为它的条件的对方策略之间的组合,称为“条件优势策略组合”或
• 假q2=定1-(q1p代1,入p甲2)与、乙(各q自1,的q2期)望的支取付值表从达0到式1有无,限经多整可理能可,得把:p2=1-p1和 E甲= p1(7-10q1)+5q1+2(式1); E乙= 5q1(2p1-1)-7p1+8(式2)
• 每个参与人需要确定,在另一参与人为其混合策略选择某个概率值时, 己方混合策略的概率向量应怎样取值,才能使自己的期望支付最大。
e点的坐标是p1=0.5,q1=0.7,则纳什均衡 时p2=0.5,q2=0.3 。
q1 1
本题中混合策略的纳什均衡还可表示为:
((p1 , p2),(q1 ,q2) )= ((0.5 , 0.5),(0.7 , 0.3) )。 0.7 本题中,只有唯一的这个纳什均衡点。
1
q1<0.7
p1= [0,1] q1 = 0.7
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中南财经政法大学经济学院

j 1
J
2j 1
u ( s1k , s2 j )

参与人1 选择混合策略 1 ( 11 ,, 1k的期望效用为: )
v1 ( 1 , 2 )

1k k 1 j 1
K
J
2j 1
u ( s1k , s2 j )

k 1 j 1
第十章 策略性博弈与纳什均衡
主要学习问题: 一、博弈要素与博弈表示 二、占优策略与纳什均衡 三、混合策略
一、博弈要素与博弈表示
1、什么是博弈
博弈就是弈棋、赌胜,用于描述在有许多人参与的活动 中,由各自策略形成的求其最大利益的相互依存关系。 在社会经济决策活动中,几乎一切行为都可以用博弈理 论来说明。 即一些个人、团组或其他组织、面对一定的环境条件, 在一定的规则下,同时火线后,一次或多次,从各自 选择的行为或策略中进行选择并加以实施,各自取得 相应结构的过程。 博弈可以表示为

v2 ( 1 , 2 )

2j j 1 k 1
J
K
1k 2
u ( s1k , s2 j )

j 1 k 1
J
K
1k
2 j u2 ( s1k , s2 j )
中南财经政法大学经济学院

定义混合策略纳什均衡。它是指两个参与人的最优混合策略 [使期望效用函数最大化的混合策略(给定对方的混合策略) * ,, * 的组合。若 * ( 1 是一个纳什均衡,它必须满足: ) 2

ik 1. 1
K

n )代表混合策略组合 , 其中, i为i的一个混合策略 , 而 i 代表混合策略组合空间 • ( ). i
代表i的混合策略空间 ( ), ( ,, ,,
i i i 1 i( i , i )表示参与人 i的期望效用函数 [ i ( 1 , , i 1 , i 1 ,, n)是除i之外所有其他参与人的 混合 策略组合 , 它可被定义为 :

例二:猜谜游戏(猜硬币)(支付矩阵如下表)。
儿童B 正面 儿童A 正面 反面 -1,1 1,-1 反面 1,-1 -1,1
该博弈是一个零和博弈,没有纳什均衡。如(正 面,正面)不是纳什均衡,因为给定B选正面,A 的最优选择是反面。类似地,(反面,正面)、 (反面,反面)、(正面,反面)都不是纳什均 衡。 这两个例子虽然不存在上面所定义的纳什均衡, 但具有下面将要描述的混合策略纳什均衡。
(3)扩展型
对于动态博弈来说

a,1

b, 2
左 右
(2,5)
(1,13)
(1,3)
二、占优策略与纳什均衡
1、占优策略
占优策略是指博弈人的最优选择不依赖于其他人 的战略选择,即不论别人选择什么样的策略, 自己都选择最优的策略。 只要是严格的最优策略,与选择的顺序无关,如 果选择的策略是不严格的最优策略,最终的均 衡就取决于选择的顺序。


纯策略和混合策略纳什均衡。如果一个策略规定参与人在每一 个给定的信息情况下下只选择一种特定的行动,则称该策略为 纯策略。若一个策略规定参与人在给定信息情况下以某种概率 分布随机地选择不同的行动,则称该策略为混合策略。在博弈 的策略式表述中,混合策略可定义为在纯策略空间上的概率分 布。 定义:
在n个参与人的策略式表述 博弈G {S1 ,, Sn ; u1 ,, un } 中, 假定参与人 i有K个纯策略 : Si {si1 ,, siK }, 则概率分 布 i ( i1 ,, iK )称为i的一个混合策略 . ik ( sik )是 i选sik的概率, 对于所有的 k 1,, K ,0 ik 1,
4、博弈的表示
(1)得益矩阵
坦白
囚徒2
不坦白
囚 徒
坦白
不坦白
5, 5
0, 8
1
8, 0
1, 1
猜硬币方
正方 反方
盖 硬 币 方
正方 反方
1 ,1
1, 1
1, 1
1,1
博弈方2
石头 剪刀 布
博 弈 方
石头
剪刀 布
0, 0
1,1
1, 1
1, 1
1,1
1, 1
0, 0
1,1
* , * ) v ( , * ), • v1 ( 1 2 1 1 2 1 * , * ) v ( * , ), • v2 ( 1 2 1 1 2 2

1 2

一般地,我们有(下列定义):
在n个参与人的策略式表述 博弈G {S1 ,, S n ; u1 ,, un } * , , * , , * )是一个纳什均 中, 混合策略组合 * ( 1 i n 衡, 若对所有的 i 1,2,, n, 下式成立 : * * * • v i ( i , i ) vi ( i , i ), • i
G S1,
, Sn ; u1
, un
2、博弈的基本要素
博弈的参加者、 各个博弈方各自可选择的全部策略或行动的集合 进行博弈的次序 博弈方的得益 博弈的信息
3、博弈的分类
单人博弈和多人博弈 零和博弈、常和博弈和变和博弈 有限博弈和无限博弈 静态博弈、动态博弈和重复博弈 完全信息博弈与不完全信息博弈,在动态博弈中 存在完美信息的动态博弈和补完美信息的动态 博弈 合作博弈与非合作博弈
0, 4
A
1,3
0, 2
0,1

2, 0
(2)划线法
丈夫
时装 足球
妻 子
时装
2,1

0, 0
1, 3

足球
0, 0
(3)箭头法
猜硬币方
正面 反面
盖 硬 币 方
正面
1,1
1, 1
1, 1
反面
1,1
(4)解反应方程组
在古诺模型中经常用到这种方法 q
2
q1 f (q2 ) q2 f (q1 )
q
2
E
O
q
1
q1
三、混合策略


上面将纳什均衡定义为一组满足所有参与人的效用 * * * 最大化的策略组合。即 ( s1 是一个纳什 ,, si ,, sn ) * ). 均衡,当且仅当对所有的 i si* arg max ui ( si , s i , 根据该定义,有些博弈不存在纳什均衡。 例一:社会福利博弈(支付矩阵如下表)。
主要参考文献
1、张维迎:《博弈论与信息经济学》,上海三联书店、 上海人民出版社,第1篇。 2、谢识予:《经济博弈论》,复旦大学出版社。 3、[美]艾里克· 拉斯缪森;《博伊与信息》,北京大学出 版社。 4、平新乔:《微观经济学十八讲》,北京大学出版社, 第十、十一、十二讲。 5、肖红叶:《高级微观经济学》,中国金融出版社,第 10、11、12章。
K
J
1k
2 j u1 ( s1k , s2 j )
其中, 1k 2 j是参与人1选择s1k 且参与人2 选择 s2 j的概率,即 纯策略组合 ( s1k , s2 j发生的概率。 )
1 ( 11 ,, 1k ,参与人 ) 参与人1 选择 2选择 2 ( 21 ,, 2 J ) 参与人2的期望效用为:
1
0, 0
(2)函数型
q1 , q , q 2 3 若有三个不同的厂商,各自的产量分别为 则
i P qi 20 q1 q2 q3 qi
n
n i qi P( qi ) cqi qi P( qi ) c i 1 i 1
ui (s ,
i
, s ) ui (si ,
i 1
,s )
i 1
max ui (s ,
si Si i
1
, s , si , s ,
i 1
i 1
,s )
n
max ui (si , s )
求解纳什均衡的基本方法
(1)严格下策反复消去法
左 上

B

1, 0
小猪


等待
大 猪
3,1
2, 4
等待
7, 1
0, 0
智猪游戏
2、纳什均衡及其存在性
每个人的选择战略是其他参与人战略选择的最优 反映,它是在一个博弈中给定其他个博弈方选 定的条件下没个博弈方所选择的最优的策略。 这是各方都得到最大的收益,没有一个博弈方 会选择另外一个策略以试图改善自己的状况, 从自己的角度来说达到了帕累托最优的状态。 表示为:


vi ( i , i )
(
sS j 1
n
j
( s j )) ui ( s )
s2 J ) 以两人博弈为例。假设 S1 ( s11 ,, s1K ), S2 ( s21 ,,,即参与人 1有K个纯策略,参与人2有J个纯策略。若参与人相信参与人2的 混合策略 2 ( 21 ,, 2,则参与人 1选择纯策略 s1k 的期望效用 J) 为:

i
中南财经政法大学经济学院

社会福利博弈的支付矩阵
流浪汉 找工作 游荡
政府
救济
不救济
3,2
-1,1
-1,3
0,0
复习思考题
1、经济活动中,博弈均衡的基本内涵是什么? 这种均衡与理性变迁之间是否存在着一致性。 2、信息在进行博弈决策中的基本功能是如何影 响人民的收益的? 3、动态博弈中的基本分析特色是什么?什么样 的战略是不完全信息下最优的均衡策略?为什 么?
相关文档
最新文档