混合策略纳什均衡(上)2013
混合策略纳什均衡
![混合策略纳什均衡](https://img.taocdn.com/s3/m/45e4456ee3bd960590c69ec3d5bbfd0a7956d51a.png)
02
混合策略纳什均衡的基本理论
纳什均衡的定义与性质
纳什均衡的定义
在博弈中,如果每个玩家都采取自己的最优策略,那么整个博弈会达到一种均 衡状态,即所有参与者的利益达到最大化。
纳什均衡的性质
纳什均衡是一种自我稳定的状态,即使受到外部干扰,也会迅速恢复到原始状 态。此外,纳什均衡也是最优的,因为它使得每个参与者的利益都达到最大化 。
其次,现有的研究往往只关注特定的博弈模型, 对于更一般化的博弈模型,尤其是对于连续型博 弈和多阶段博弈的研究还比较缺乏。
首先,混合策略纳什均衡的概念和性质仍需进一 步深化和研究。例如,对于非完全信息博弈,如 何准确地刻画混合策略纳什均衡点的数量和分布 等问题仍需探索。
最后,现有的研究主要集中在理论层面,对于如 何将混合策略纳什均衡应用到实际问题中,如何 设计和制定有效的混合策略等问题还需要进一步 探讨。
未来研究方向与挑战
未来研究可以进一步拓展混合策略纳什均衡的应用领域,例如在经济学、政治学、社会学等领域的应 用。
另外,针对现有的研究不足,未来研究可以深入探索混合策略纳什均衡的性质和计算方法,以及如何设 计和制定有效的混合策略等问题。
此外,未来的研究还可以进一步拓展混合策略纳什均衡的理论框架,例如在多阶段博弈、不完全信息博 弈、非线性博弈等领域的研究。
略纳什均衡来分析。
在生物学领域的应用
在生物学中,混合策略纳什均衡可以用来研究生物种 群的进化稳定性和生态平衡。
在生态系统中,生物种群可以通过选择不同的繁殖、 迁徙、捕食等策略来适应环境变化,这种博弈关系可 以通过混合策略纳什均衡来分析。
在其他领域的应用
在社会学中,混合策略纳什均衡可以用来研究社会群 体中的合作与竞争关系。
3-混合策略的纳什均衡
![3-混合策略的纳什均衡](https://img.taocdn.com/s3/m/02b352fac1c708a1294a4407.png)
博弈论教学/混合策略的纳什均衡出自MyKnowledgeBase< 博弈论教学Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡目录■1 复习■2 混合策略(Mixed strategy)■2.1 举例/Example■2.2 概念■2.3 纯策略和混合策略■2.4 混合策略的争议■3 混合策略的纳什均衡■3.1 基本概念■3.2 混合策略纳什均衡的存在性/纳什定理■3.3 学术争议与批评■4 混合策略纳什均衡举例■4.1 社会福利博弈Social Welfare Game■4.1.1 博弈分析(方法1:收益无差异)■4.1.2 博弈分析(方法2:图形分析法)■4.1.3 博弈分析(方法3:导数(Derivative)极值法)■4.2 普通例子■4.3 审计博弈(Tax Game)■4.4 激励的悖论[5]■4.5 求解纳什均衡的一般方法■5 多重纳什均衡■5.1 多重纳什均衡举例■5.1.1 夫妻之争■5.1.2 制式问题■5.1.3 市场机会博弈■5.2 多重纳什均衡分析■5.2.1 帕累托上策均衡(Pareto Dominated Equilibrium)■5.2.1.1 帕累托最优Pareto optimality■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium)■5.2.1.3 举例分析■5.2.2 风险上策均衡(Risk-dominant Equilibrium)■5.2.3 聚点均衡(Focal Points Equilibrium)■5.2.4 相关均衡■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义■7 作业■8 参考文献pure strategy)相对应。
混合策略:在博弈中,博弈方的策略空间为,则博弈方i以概率分布随机在其选策略中选择的“策略”,称为一个“混合策略”,其中,对都成立,且。
讲座 混合策略纳什均衡
![讲座 混合策略纳什均衡](https://img.taocdn.com/s3/m/22e184fa700abb68a982fbef.png)
你 投资 消费
猎鹿博弈
混合策略均衡
什么是策略? -参与者的一个完全应急计划; -在各种情况下其它参与者认为该参与 者可能采取的行动。 混合策略是什么意思? -参与者随机选择他的纯策略。 -其它参与者不能确定他将采取的行动。
பைடு நூலகம் 混合策略纳什均衡
假设参与者选择混合策略。一个混合策略 架构 是混合策略纳什均衡的充分 必要条件是,对每一参与者i和每一 有
换言之,对每一个i和 Si是一个并不 比其它 Si 差的对 的最佳反应。
猎鹿博弈
假定:参与者2认为, 参与者1猎兔的概率是p p 1-p 他猎鹿的收益是: 他猎兔的收益是: 她对猎鹿猎兔无所谓的充分必要条件是:
猎鹿博弈中的混合策略均衡
猎鹿博弈中的最佳反应
讲座7 混合策略纳什均衡
14.12 博弈理论 穆罕默德·伊尔蒂兹
路线图
1、一些 2×2博弈 2、混合策略纳什均衡 3、小测验 4、应用与实例 1)高搜索成本下的价格竞争 2)鹰-鸽博弈 3)猜硬币
鹰-鸽博弈
上周的小测验问题
• 不用讨论,每位同学在纸上写下要么投 资要么消费。助教将把你们随机配对。 你的成绩是:
混合纳什均衡
![混合纳什均衡](https://img.taocdn.com/s3/m/c776652ab42acfc789eb172ded630b1c59ee9b8d.png)
混合纳什均衡纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。
”也就是说,所有人的战略都是最优的。
而讲解“纳什均衡”的最著名的案例就是“囚徒的困境”。
a,b两个囚徒,a坦白b抵赖,b判10年,a判1年.若两人均坦白则各判5年,若两人均抵赖则都判2年。
a,b 面临抉择。
显然最好的策略是双方都抵赖,结果是大家都只被判2年。
但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。
这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐1年,而他会坐10年牢,也是招了划算。
综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。
两个人都会动这样的脑筋,最终,两个人都选择了招,结果都被判5年刑期。
原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。
这就是著名的“囚徒困境”。
它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。
混合策略均衡求解的一个原则是混合策略均衡赋予正概率的所有纯策略的期望收益相等。
假设这是个两个玩家的游戏。
玩家a有2种纯策略a和b,不能相互支配。
玩家b有2种纯策略c和d,不能相互支配。
设a选a的几率是p,则选b的几率为1-p;设b选c的几率是q,则选d的几率为1-q当a取某一个p=p0,b获得的总效用不为自己q的取值而改变;b取某一个q=q0,a获得的总效用不为自己p 的取值而改变,此时我们说(p0,1-p0)和(q0,1-q0)是一对混合策略下的纳什均衡。
混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。
博弈论Game Theory2
![博弈论Game Theory2](https://img.taocdn.com/s3/m/5db14461f5335a8102d220a0.png)
划线法
在具有策略和利益相互依存的博弈问题中,各个 博弈方的得益既取决于自己选择的策略,还与其 他策略方选择的策略有关。因此,博弈方在决策 时必须考虑其他博弈方的存在和策略选择。 依据这种思想,科学的决策思路应该是:找出自 己针对其他博弈方每种策略和策略组合的最佳对 策,即自己的可选策略与其他博弈方每种策略配 合,给自己带来最大得益的策略,然后通过对其 他博弈方策略选择的判断,预测博弈的可能结果 和确定自己的最优策略。
举例
古诺的寡头模型 设一市场有两家厂商生产同样的产品。如果厂商1 的产量为q1,厂商2的产量为q2,则市场总产量为 Q = q1 + q2 。设市场出清价格P(可以将产品全 部卖出去的价格)是市场总产量的函数P = P(Q) = 8 -Q。再设两厂商的生产都无固定成本,且每 增加一单位产量的边际成本相等,C1 = C2 = 2, 即它们分别生产q1和q2单位产量的总成本分别为2 q1和2 q2 。最后强调两厂商同时决定各自的产量, 即他们在决策之前都不知道另一方的产量。
求解纳什均衡
博弈方就是n个农户,他们各自的策略空间就是他 们可能选择的羊群数目qi(i=1,2, …,n),取值范围, 当各户羊群数为q1, …qn时,在公共草地上放牧羊群 的总数为Q= q1+ q2+…+ qn,,每只羊的产出应是羊 群总数Q的函数V=v(Q)=v(q1+ q2+…+ qn).假设每 只羊的成本是不变的常数c,则农户i养qi只羊的得益 函数为:
u i q i V ( Q ) q i c q iV ( q 1 q 2 q n ) q i c
续
假设 n 3 , 即只有三个农户,每只 羊的产出函 数为 V 100 Q 100 ( q 1 q 2 q 3 ), 而成本 c 4 .这时,三个农户的得益 函数分别为 u 1 q 1 [100 ( q 1 q 2 q 3 )] 4 q 1 u 2 q 2 [100 ( q 1 q 2 q 3 )] 4 q 2 u 3 q 3 [100 ( q 1 q 2 q 3 )] 4 q 3 把上述得益函数看作连 续函数。
博弈论混合策略纳什均衡名词解释
![博弈论混合策略纳什均衡名词解释](https://img.taocdn.com/s3/m/eced515c6ad97f192279168884868762cbaebb7a.png)
博弈论混合策略纳什均衡名词解释
博弈论是研究决策者在相互影响下进行决策的数学理论。
在博
弈中,混合策略指的是玩家以一定的概率分布来选择纯策略的组合,而纳什均衡是指在博弈中,每个玩家都采取最优的策略,假设其他
玩家的策略不变。
混合策略纳什均衡则是指在博弈中,玩家以一定
的概率分布来选择策略的组合,并且不存在其他策略组合可以使得
任何一个玩家通过改变自己的策略来获得更好的收益。
换句话说,
混合策略纳什均衡是玩家在采取混合策略的情况下达到的稳定状态,使得任何玩家都无法通过改变自己的策略来获得更好的结果。
混合
策略纳什均衡在博弈论中具有重要的理论和实际意义,可以帮助分
析和预测玩家在博弈中的最优决策行为,以及博弈过程中可能出现
的稳定状态。
在实际应用中,混合策略纳什均衡被广泛运用于经济学、政治学、生物学等领域,对于理解和解决实际问题具有重要的
指导意义。
混合策略纳什均衡
![混合策略纳什均衡](https://img.taocdn.com/s3/m/70bf9aad9a89680203d8ce2f0066f5335a816720.png)
03 混合策略纳什均衡的证明 方法
反证法
总结词
通过假设不成立来证明均衡的存在。
详细描述
反证法是一种常用的证明方法,它首先假设与结论相反的命题成立,然后通过逻辑推理和数学推导,得出矛盾的 结论,从而证明原命题的正确性。在证明混合策略纳什均衡的存在时,反证法可以用来证明当其他玩家采取了最 优策略时,某个玩家采取混合策略能够达到最优结果。
唯一性意味着在给定对手策略的情况下,每个参与者都只有一个最优反应,从而 避免了复杂的策略互动和不确定性。
存在性
混合策略纳什均衡的存在性是指在某 些博弈中,至少存在一个策略组合, 使得每个参与者在给定其他参与者策 略的情况下,采用混合策略是最优的 。
存在性通常通过数学证明和计算机搜 索等方法来证明,但并不是所有博弈 都有混合策略纳什均衡。
混合策略纳什均衡
目录
CONTENTS
• 混合策略纳什均衡的定义 • 混合策略纳什均衡的特性 • 混合策略纳什均衡的证明方法 • 混合策略纳什均衡的应用场景 • 混合策略纳什均衡的局限性 • 混合策略纳什均衡的发展前景
01 混合策略纳什均衡的定义
定义
混合策略纳什均衡是一种博弈论中的均衡概念,它描述了在 给定对手策略的情况下,参与者如何选择最优策略以最大化 自己的期望收益。
代数法是一种通过数学符号和公式进行推 理和证明的方法。在证明混合策略纳什均 衡的存在时,代数法可以用来推导和证明 纳什均衡的条件和性质,利用代数性质和 技巧来证明均衡的存在。
04 混合策略纳什均衡的应用 场景
经济学
竞争策略分析
混合策略纳什均衡在经济学中被用于分析竞 争策略,特别是在不完全竞争市场和寡头垄 断市场中。通过混合策略纳什均衡,可以研 究企业在不确定环境下的最优反应,以及企 业如何通过调整其策略来应对竞争对手的行 为。
博弈论4
![博弈论4](https://img.taocdn.com/s3/m/96d7c52baf45b307e87197cf.png)
聚点均衡和相关均衡
聚点均衡 例 城市博弈 两个人把上海、哈尔滨、南京、长春分为 两组,每组两个城市。规定两人相同则都 得100元,两人不同则什么都没有。怎么 分组? 夫妻博弈中双方的生日、性格特点、重要 节日等都可以作为聚点的根据。
2013-7-13 25
V
小偷得益 (偷)
0
Pg* Pg
*’
1
Pt守卫睡的概率
-p
-p1
2013-7-13
11
用横坐标表示小偷偷的概率,纵坐标
表示保安的期望得益,则S到-D的连 线与横轴的交点就是小偷的混合策略。 另一个图形中V和-P的连线与横轴的 交点就是保安的混合策略。 我们还会发现如下有趣的现象。为了 减少偷窃,加重对小偷的惩罚会奏效 吗?加重惩罚→暂时小偷减少偷窃→ 保安提高睡觉的概率→小偷偷窃的期 望得益增加→小偷继续偷窃
2013-7-13 18
战争与和平博弈
国家2
战争 战争
国家1 和平 -5,-5 -10,8
和平
8,-10 10,10
(战争,战争)、(和平,和平)是两个纯 策略纳什均衡,双方和平具有帕累托优势。
2013-7-13 19
上述分析仍然有疑问,既然理性的国家之间不 会选择战争,那么世界历史上为什么会有那么 多战争呢?答案是决策者考虑短期利益、个人 或小集团利益更多;决策者缺乏理性;局部或 特定时期的战争的利益比上述博弈假设的大等。 还有先发制人对自己较为有利,对方选择战争 时自己还击比不还击损失小等都使得战争的机 会增大。 寡头市场的价格竞争与两国之间的战争与和平 的选择很相似。企业之间的价格竞争有时就是 一场战争。
混合战略纳什均衡
![混合战略纳什均衡](https://img.taocdn.com/s3/m/ea84622f76c66137ee061992.png)
五 混合战略纳什均衡
混合战略纳什均衡的含义: 纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的
最优选择。因此在社会福利博弈中, * 0.2 , *=0.5是唯一的混 合战略纳什均衡。
从反面来说,如果政府认为流浪汉选择寻找工作的概率严格小于 0.2,那么政府的唯一最优选择是纯战略:不救济;
4r-1=-r r=0.2
的概率现则救济还是不救济
五 混合战略纳什均衡
对 * 的0.2解释: 如果流浪汉以找工作的概率小于0.2, 则政府选择不救
济,如果大于0.2,政府选择救济 ,只有当概率等于0.2时, 政府才会选择混合战略或任何纯战略. 对 * 的0.解5 释 如果政府救济的概率大于0.5,流浪汉的最优选择是流 浪,如果政府救济的概率小于0.5,流浪汉的最优选择是 寻找工作.
n
vi ( i , i ) ( j (s j ))ui (s) sS j1
n个参与人的混合战略纳什均衡
让我们以两人博弈为例说明这一点。假定 S1 (s11, ,s1K,) 即参与人1有K个纯战略,参与人2有J个纯战略。若参与人1相 信参与人2的混合战略为 S 2 (s21, ,s2J ),那么,参与人1选 择纯战略 s1k 的期望效用为:
五 混合战略纳什均衡
社会福利博弈
流浪汉 寻找工作 流浪
政府
2 救济 3,
1 不救济 -1,
3 -1,
0 0,
设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的战略都是给定对方混合战略时的最优战略
五 混合战略纳什均衡
✓ 战略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
3 混合策略纳什均衡(1)
![3 混合策略纳什均衡(1)](https://img.taocdn.com/s3/m/4f8703e7a58da0116c1749e0.png)
扩展:二人博弈标准型
n人参与的策略式博弈混合策略定义
• i 表示局中人 i 的混合策略空间
• p ( p1,..., pi ,..., pn ), pi i 表示博弈的一个混合策
略组合
• i ( p) i ( p1,..., pi ,..., pn ) 表示局中人 i 在混合策略 组合 p ( p1,..., pi ,..., pn ) 下的期望支付,它是混 合策略组合 p 的函数。
3-2 反应函数法
• 寻找同时决策有限博弈的混合策略纳什均衡
• B的混合策略设定为(q,1-q)时,A的最佳 反应函数是:
UA( p, q) 2 p(1 2q) (2q 1)
• A的混合策略设定为(p,1-p)时,B的最 佳反应函数是:
UB ( p, q) 2q(2 p 1) (2 p 1)
游戏; • 另外4名同学负责以下工作
– 1名同学记录A分别出锤子剪子布的次数; – 1名同学记录A输和赢的次数 – 1名同学记录B分别出锤子剪子布的次数; – 1名同学记录B输和赢的次数
• 共进行30次 • 每个小组写下实验报告,内容包括:A和B选 择不同策略的次数;输赢的次数;怎么才能赢?
3-1混合策略、混合纳什均衡与期望 支付
数学语言表达
• 如果主体人对确定性收益x的效用为u(x),那么主体 人对不确定性收益X的效用就为E(u(X))。
• E(u(X))称为X的期望效用,常记为EU(X)。将X看作 自变量, EU(X)称为期望效用函数。
• 如果不确定性收益X退化成确定性收益x,则EU(X)= u(x),所以EU(X)可以同时表达主体人对确定性收益 和不确定性收益的效用。
条件混合策略的纳什均衡
![条件混合策略的纳什均衡](https://img.taocdn.com/s3/m/ce879f5478563c1ec5da50e2524de518964bd3cb.png)
条件混合策略的纳什均衡1. 引言嘿,大家好!今天咱们聊聊一个既有趣又有点深奥的话题——条件混合策略的纳什均衡。
听起来有点复杂?别担心,咱们用轻松的方式来聊,保证让你听得懂、记得住。
想象一下,你和你的朋友正在玩一个游戏,可能是扑克、棋类,或者甚至是猜拳。
这个游戏的关键在于,你的决策不仅仅取决于你自己的选择,还要考虑到对方的想法和选择。
这就是咱们今天要讲的核心——在不确定的情况下,怎样做出最优决策。
2. 纳什均衡简介2.1 什么是纳什均衡?那么,纳什均衡到底是个啥呢?简单说,就是一个状态,在这个状态下,任何一个玩家如果单独改变自己的策略,都会让自己变得更糟。
就像一场足球比赛,双方都在根据对方的表现调整策略,最终形成一种微妙的平衡。
你不动,我不动,大家都不动,这就是纳什均衡。
说白了,想要赢,你得懂得有时候不动也是一种策略。
2.2 条件混合策略接下来,咱们再说说“条件混合策略”。
乍一听,好像高深莫测,其实它就是在不同情况下随机选择不同的策略。
举个例子:想象你和朋友下棋,你可能在某一轮选择攻击,而在另一轮选择防守。
这种随机性可以让对手难以预测你的下一步动作,嘿,这就让游戏更有趣了,对吧?3. 条件混合策略的运用3.1 实际案例现在咱们把这个理论应用到实际中,看看它是如何运作的。
比如在商业竞争中,两家公司为了争夺市场份额,可能会在价格、广告和产品质量上进行博弈。
一家公司可能会在价格上采取“低价策略”,而另一家公司则可能选择“高价策略”,同时在广告上加大投入。
通过这样的条件混合策略,双方都可以在市场中找到一种平衡,既能保护自己的利益,又能不至于把对方逼得太狠。
3.2 生活中的例子不仅如此,这种策略在我们的日常生活中也屡见不鲜。
想象一下你和朋友一起去餐厅,点菜的时候总是考虑对方喜欢什么,而不是只顾着自己。
你可能今天想吃披萨,但考虑到对方可能更喜欢汉堡,你就故意“随机”选择一下,看看情况。
如果对方也点了披萨,嘿,你们就双赢了!这样的“条件混合策略”让你们的友谊更加稳固,岂不是一举两得?4. 结论通过上面的讨论,咱们发现,条件混合策略的纳什均衡不仅仅是个理论,还是生活中随处可见的智慧。
博弈论-混合策略纳什均衡
![博弈论-混合策略纳什均衡](https://img.taocdn.com/s3/m/7683f1fa52d380eb63946dd7.png)
整理版ppt
29
• 在这个博弈中,检查成本C越高,纳税人逃税的概率 越大;罚款F越高,纳税人逃税的概率越小;应纳税款 越大,纳税人逃税的概率反而越小。
• 应纳税款越大,纳税人逃税的概率反而越小?这
整理版ppt
15
讨论
• 上面的均衡要求每个参与人以特定的概率 选择纯策略。也就是说,一个参与人选择 不同策略的概率不是由他自己的支付决定 的,而是由他的对手的支付决定的。
• 正是由于这个原因,许多人认为混合策略 纳什均衡是一个难以令人满意的概念。
• 事实上,正是因为它在几个(或全部)策 略之间是无差异的,他的行为才难以预测, 混合策略纳什均衡才会存在。
不检查。
整理版ppt
26
之二
• 假设采用混合策略是税务机关的最优选择 那么给定p ,纳税人选择逃税和不逃税的期 望收益相等:
• -(a+F) p +0(1- p)= -a • 得p *=a/(a+F)
整理版ppt
27
说明
• 如果税收机关检查概率小于p*, • 即p<a/(a+F),纳税人的最优选择是逃税; • 如果税收机关检查的概率大于p*, • 即p=a/(a+F),纳税人的最优选择是不逃税; • 如果税收机关检查的概率等于p*, • 即p=a/(a+F),纳税人的选择无差异。
整理版ppt
33
夫妻之争的混合策略纳什均衡
看看这个博弈有几个均衡?
时装
丈夫
时装 妻 子
足球
2, 1 0, 0
足球 0, 0 1, 3
混合策略纳什均衡
![混合策略纳什均衡](https://img.taocdn.com/s3/m/7dc1fcee0508763231121293.png)
友军博弈
英 国 支持巴顿 支持蒙帅 支持巴顿 4,3 2,2 美国 1,1 3,4 支持蒙帅
友军博弈特征
两个(多个)纳什均衡 问题:博弈的最终结果?
第三章 混合策略纳什均衡
第三节 多重纳什均衡的选择 标准
第三节 多重纳什均衡的选择标准
一、帕累托优势标准:得益更大 (一)案例:战争与和平 C国 鹰战略 鸽战 略 -5,-5 8,-10 鹰战略 -10,8 10,10 A国 鸽战略
混合策略
小偷的混合策略 以p的概率偷,(p,1-p) 守卫的混合策略 以q的概率睡(q,1-q)
第一节 混合策略与期望支付
一、混合策略 (二)混合策略 2.相对概念:纯策略 每个参与人的非随机性选择 纯粹行动计划,p=100%,1-p=0
第一节 混合策略与期望支付
一、混合策略 (二)混合策略 3.数学刻画 给定博弈G={S1,…,Sn;u1,…,un}以及参 与人i的纯策略Si= {si1,…,sik} 概率分布pi=(pi1,…,pik)为混合策略 其中:0≤ pik ≤1,∑ pik=1, pik=p( sik ) 混合策略组合p=(p1,…,pi,…pn)
第三节 多重纳什均衡的选择标准
一、帕累托优势标准:得益更大 (二)纳什均衡的选择标准 帕累托优势标准 按照支付大小筛选纳什均衡
-5,-5 -10,8 8,-10 10,10
第三节多重纳什均衡的选择标准
二、风险优势标准:风险更小? (一)案例:串通作弊博弈 帕累托优 学生乙 势? 作弊 不作弊 作弊 9,9 0,8 学生甲 8,0 7,7 不作弊
第一节 混合策略与期望支付
二、期望支付 (二)数学刻画
1 ( p, q ) pi q j aij
03 混合策略纳什均衡
![03 混合策略纳什均衡](https://img.taocdn.com/s3/m/42c2a5294b73f242336c5fc5.png)
相关均衡例子 三个纳什均衡: 三个纳什均衡 (U,L)、(D,R) 和混合策略均衡[(1/2,1/2), (1/2,1/2)] 结果都不理想,不如(D,L)。
5)防联盟均衡 ) 博弈中若有三个及三个以上的局中人,就有可能部分人结 成“联盟”,在极大化联盟成员利益的同时损害了其他局 中人的利益。
甲 乙
2
( p, q ) = ∑∑ pi q j bij
i =1 j =1
混合策略纳什均衡 设 P * = ( P * , L, Pi* , L, Pn* ) 是 n 人策略式博弈 G = {S1 ,LSn ; u1 ,Lun } 1 的一个混合策略组合,如果对于所有的
i = 1, L , n ,
π i ( Pi* , P−*i ) ≥ π i ( Pi , P−*i ) 对于每一个 Pi ∈ ∑i 都成立,则称
i i
随机在其m个可选策略中选择的“策略”,称为一个“混合 策略”,其中 p ij 0≤
≤1
j 对,L, m =1
p 1i 都成立,且 + L + p im = 1
混合策略扩展博弈:博弈方在混合策略的策略空 混合策略扩展博弈 间(概率分布空间)的选择看作一个博弈,就是原 博弈的“混合策略扩展博弈。
L 0,0,10 -5,-5,0 A
R -5,-5,0 1,1,-5
乙 甲
L -2,-2,0 -5,-5,0 B
R -5,-5,0 -1,-1,5
U D
U D 丙
)、(D, , ) (U,L,A)、( ,R,B)——纯策略纳什均衡 , , )、( 纯策略纳什均衡 优于( , , ) (U,L,A) Pareto优于(D,R,B) , , ) 优于
2)制式问题
混合策略纳什均衡
![混合策略纳什均衡](https://img.taocdn.com/s3/m/dbe0fc0603d8ce2f00662368.png)
目录[隐藏]1 什么是混合策略纳什均衡2 解混合策略纳什均衡的方法3 混合策略纳什均衡的经典博弈——猜谜博弈[1]4 混合策略纳什均衡博弈与其他均衡的关系[1]5 参考文献[编辑][编辑][编辑]混合策略纳什均衡混合策略纳什均衡(Mixed Strategy Nash Equilibrium )什么是混合策略纳什均衡混合策略纳什均衡:在n 个参与人的博弈G={S 1 ,... S n ; u 1,...u n }中,混合策略组合构成一个纳什均衡,如果对于所有的i =1,2...,n 下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。
混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。
解混合策略纳什均衡的方法1、最大化支付法:即最大化各个参与人的效用函数。
2、支付相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略支付相等,构成方程组求解。
混合策略纳什均衡的经典博弈——猜谜博弈[1]两个局中人A 、B 手里各拿一枚硬币,每人可以选择正面向上或反面向上,然后同时亮出,如果两枚硬币正反面相同,B 付给A1元钱,如果两枚硬币正反面不相同,A 付给B1元钱。
在这种情况下,局中人A 、B 如何选择呢?下图给出这个博弈的双变量收益矩阵。
这是一个两人零和博弈,在每一个结局中一方所得即为另一方所失,即两个局中人的收益之和恰好等于零。
在双变量收益矩阵中采用画线的方法,在这个博弈中找不到纯策略纳什均衡。
那么,猜谜博弈是否存在混合策略纳什均衡呢?1950年纳什证明了任何有限博弈都至少存在一个纳什均衡(包括纯策略纳什均衡和混合策略纳什均衡)。
混合策略纳什均衡
![混合策略纳什均衡](https://img.taocdn.com/s3/m/d64ff3a1f242336c1fb95e3f.png)
企业也是随机地在交税与偷漏税之 间进行选择。税收部门与企业间进行的 是混合战略博弈。因为如果企业总是交 税,税务部门就最好不检查;但给定不 检查,企业就会偷漏税。所以,两者只 有在随机地检查与不检查,企业随机地 在偷漏税与交税之间选择,才会达成均 衡。
对于大企业,因一旦偷税数额就巨大,所 以,税务部门在随机检查时放在大企业上的可 能性就大一些;而给定税务部门检查大企业的 可能性较大,大企业偷漏税的行为就较少,否 则就容易被逮个正着。所以,偷漏税较多的就 是一些中小企业,大企业纳税的积极性较高。 同样的道理,在犯罪或对错误的监督惩罚博弈 中,也是混合博弈,人们可能总是大错不犯小 错不断。
这个故事曾经被很多人当作博弈论的例 子来演绎,但实际上这个故事与博弈论无关。 博弈论会假定所有局中人都是理性的,不能假 定一些局中人聪明而另一些局中人却是傻子。 当田忌出下马时,齐威王最好的选择是出下马 而不是上马。孙膑的计谋中假定齐威王是傻子 ,当田忌出下、上、中马时,他仍然按上、中 、下马出,当然要输了。事实上,当田忌出下 马时,齐威王应出下马,但齐威王出下马时, 田忌不应出下马而是出中马,但此时齐威王又 应出中马而不是下马了, ……。这样,博弈不 会有纯战略的均衡。
策略。
混合策略
◆混合策略定义:在n人博弈的策略式表述G ? ?S1,???, Sn;u1,???, un? 中,假定参与人 i 有K个纯策略:Si ? ?Si1,??,?SiK?,那么,概率
? ? 分布 pi ? pi1,??,?piK 称为 i 的一个混合策略,这里
pik ? p(sik ) 是 i 选择sik 的概率,对于所有
? 的 k ? 1,???, K,0 ? pik ? 1,
K 1
pik
?
纳什均衡
![纳什均衡](https://img.taocdn.com/s3/m/c6561c1a4431b90d6c85c75d.png)
定义纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡.所有局中人策略构成一个策略组合(Strategy Profile)。
纳什均衡,从实质上说,是一种非合作博弈状态。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。
纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。
经济学定义所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
Nash平衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。
Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,Nash平衡一定存在。
以两家公司的价格大战为例,Nash平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。
于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash平衡。
类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。
经典案例囚徒困境(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。
)假设有两个小偷A和B联合犯事、私入民宅被警察抓住。
警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。
如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。
混合策略纳什均衡
![混合策略纳什均衡](https://img.taocdn.com/s3/m/b04a7e200a1c59eef8c75fbfc77da26925c596fa.png)
混合策略纳什均衡简介混合策略纳什均衡是博弈论中的一个重要概念,用于描述多方参与的博弈情境中,每个参与者按照一定的概率分布选择不同的策略,使得任何人无法通过改变自己的策略来获得更好的结果。
在这种均衡状态下,每个参与者的预期收益最大化。
混合策略在传统的博弈理论中,参与者通常会选择一个确定性的策略来对抗其他参与者。
然而,在现实生活中,我们经常遇到的情况是,每个参与者都存在一定的不确定性和随机性,犹豫在不同的策略之间选择。
这时,混合策略就应运而生了。
混合策略是指参与者以一定的概率分布选择不同的策略来进行博弈。
例如,在一个石头剪刀布的游戏中,参与者可以以1/3的概率选择石头,1/3的概率选择剪刀,1/3的概率选择布。
这样的不确定性选择使得博弈更具有变数和策略性。
纳什均衡纳什均衡是由约翰·福布斯·纳什在20世纪50年代提出的一个概念,用于描述博弈理论中的均衡状态。
在纳什均衡中,每个参与者选择的策略都是最优的,即在其他参与者选择的策略下,自己无法通过改变策略来获得更好的收益。
通常情况下,纳什均衡是以确定性策略为基础进行定义的。
但是当参与者选择混合策略时,纳什均衡也可以被定义为每个参与者选择混合策略的概率分布,使得任何人都无法通过改变自己的概率分布来获得更高的收益。
混合策略纳什均衡的计算方法计算混合策略纳什均衡的方法主要是通过解析求解和数值求解两种方式。
解析求解解析求解是一种通过代数和数学推导的方式来找到混合策略纳什均衡的方法。
通过建立参与者的效用函数和概率分布函数等数学模型,应用最优化理论和微积分等数学工具,可以得到参与者的最优混合策略。
然而,解析求解的方法通常只适用于简单的博弈情境,并且求解过程繁琐复杂。
数值求解数值求解是一种通过计算机模拟和迭代计算的方式来找到混合策略纳什均衡的方法。
通过构建博弈模型,设定参与者的初始混合策略,然后通过迭代计算,逐渐优化参与者的混合策略,直到收敛到纳什均衡。
混合策略纳许均衡课件
![混合策略纳许均衡课件](https://img.taocdn.com/s3/m/587f614e0640be1e650e52ea551810a6f524c89b.png)
策略纳什均衡的算法优化。
混合策略纳什均衡与人工智能
02
随着人工智能的发展,可以尝试将混合策略纳什均衡应用于机
器学习和人工智能领域,以实现更高效和智能的决策。
混合策略纳什均衡与演化博弈论的结合
03
研究混合策略纳什均衡与演化博弈论的结合,可以更好地解释
现实生活中的动态博弈现象。
06
参考文献
参考文献
定义
混合策略纳什均衡课件
CONTENTSБайду номын сангаас
• 混合策略纳什均衡简介 • 混合策略纳什均衡的数学模型 • 混合策略纳什均衡的求解方法 • 混合策略纳什均衡的应用实例 • 混合策略纳什均衡的挑战与展
望 • 参考文献
01
混合策略纳什均衡简介
定义与概念
混合策略纳什均衡是一种博弈论中的概念,它描述了在给定对手策略的情况下,参 与者如何选择最优的行动方案。
定义策略空间
为每个参与人定义一个策略选 择的空间,这些策略可以是离 散的、连续的或混合的。
定义支付函数
根据每个参与人的策略选择, 定义他们的支付函数,即每个 参与人在该策略下的期望收益。
构建博弈矩阵
根据参与人的策略空间和支付 函数,构建一个博弈矩阵,用 以表示每个参与人选择不同策
略时的收益。
模型参数解 释
纳什均衡点或满足一定的收敛条件。
优化算法
优化算法是一种基于数学优化的方法,用于求解混合策略纳什均衡。
优化算法的基本步骤包括:定义一个目标函数,然后使用优化算法(如 梯度下降法、牛顿法等)寻找目标函数的最大值或最小值,从而得到纳
什均衡点。
优化算法的优点是能够快速找到纳什均衡点,适用于大规模问题。但缺 点是需要对问题进行数学建模,且对初始点的选择敏感。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机地从纯策略集合中选择一种纯策略作为实际的 行动。
新浪微博:一花一世界economics
2013年10月29日
混合策略包括原来的纯策略
10
混合策略概念是原来纯策略概念的推广。 混合策略(mixed strategy) 纯策略(pure strategy) 不确定性(uncertainty) 期望支付(expected payoff)
2013年10月29日
新浪微博:一花一世界economics
混合策略与纯策略有很大区别
9
在局中人只有两个纯策略可以选择的情形, 混合策略是一种按照什么概率选择这个纯策略, 按照什么策略选择那种纯策略的策略选择指示。 纯策略给每个局中人具体明确了一个非随机性的行
动计划。
而混合策略则表明,局中人可以按照一定的概率,
新浪微博:一花一世界economics
2013年10月29日
与混合策略相伴随的一个问题
11
是局中人支付的不确定性。 为了刻画不确定情形下局中人的支付, 我们需要借助期望支付的概念。 在博弈论中,当局中人并不清楚其他局中人的实际策
略选择时,他的支付便具有不确定性, 为此,他只能通过计算期望支付的方式来预测自己的 得益情况, 确定自己的策略选择。
新浪微博:一花一世界economics
2013年10月29日
重新定义纳什均衡
23
从二人同时决策博弈看, 混合策略纳什均衡必须是两个局中人的相对最优混合
策略的组合, 所谓相对最优混合策略, 是指在给定对方选择该相对最优混合策略的条件下, 能使局中人自身的期望支付达到最大的混合策略。
27
从定义3.2可以看出, 第二章中定义2.4给出的纳什均衡, 是现在给出的混合策略纳什均衡的特例。 所以相对于现在定义的比较广泛的混合
策略纳什均衡, 原来定义2.4定义的纳什均衡, 可以特别叫做纯策略纳什均衡。
新浪微博:一花一世界economics
2013年10月29日
具体来说,
表示局中人i之外所有其他局中人的混合策略组合。 至此,局中人i的期望支付可以具体定义为:
π i ( p ) = ∑s∈S (∏ j =1 p j ( s j ))ui ( s )
n
其中 ui ( s)是我们在纯策略情况熟悉的当所有局中人 采取s这个策略组合的时候局中人i之支付, n 而 正是所有局中人各自的策略选择正好 p ( s ) ∏ j j 组成纯策略组合s的概率。 j =1
新浪微博:一花一世界economics
对于任意的 p2 ∈ ∑ 2
2013年10月29日
更一般地,
25
对于一个有n个局中人参与的同时
决策博弈, 其混合策略纳什均衡 Nash equilibrium of mixed strategies 的定义可具体表述为:定义3.2
新浪微博:一花一世界economics
2013年10月29日
定义3.2混合策略纳什均衡
26
设
p* = ( p1*, , pi *, , pn *)
是n人策略式博弈
G = {S1 , , S n ; u1 , , un }
的一个混合策略组合。 如果对于所有的 i = 1, , n, π i ( pi *, p−i *) ≥ π i ( pi , p−i *)
混合策略纳什均衡
北京邮电大学 本科选修课程 《信息经济学》 高丛 1HUA1SHIJIE100@
在纳什均衡不存在或者不唯一的情形,
2
前面介绍的纳什均衡的定义和寻找纳什均衡的方法, 就不足以帮助我们对博弈的最终结果作出明确的预
测, 无法给参与博弈的局中人提供明确的决策建议。 因此,我们需要拓展纳什均衡的概念, 引入新的分析工具,
对存在多个纳什均衡的博弈和“不存在”纳什均衡
的博弈作进一步的讨论。
新浪微博:一花一世界economics
2013年10月29日
本章内容:
3
本章首先引入混合策略和期望支付的概念, 在此基础上定义混合策略纳什均衡, 然后具体介绍求解纳什均衡的反应函数法, 并给出混合策略纳什均衡的直观解释。 我们讨论多重纳什均衡的问题及其筛选标准。
需要说明的是,
14
期望支付的标准写法是EU, 从而甲的期望支付的标准写法是EUA, 但是在概率p和q明显出现的时候, 我们约定也可以写成UA(p,q), 表达式里面已经有期望的意思。 UB(p,q)与EUB的关系也是这样。
新浪微博:一花一世界economics
2013年10月29日
新浪微博:一花一世界economics
2013年10月29日
对有n个局中人参与的策略式博弈的 混合策略给出如下定义3.1 混合策略
20
在一个有n个局中人参与的策略式博弈中,
G = {S1 , , S n ; u1 , , un }
pi = ( pil , , piK )
假定局中人i有K个纯策略,即 则概率分布 其中
5
我们考虑一个“扑克牌对色游戏”
(game of color matching): 两人博弈, 每人从自己的扑克牌中抽一张出来,一起翻开。 如果颜色一样,甲输给乙一根火柴; 如果颜色不一样,甲赢得乙一根火柴。 为了确定起见, 我们不允许出“大鬼”和“小鬼”。
2013年10月29日
更一般地,二人博弈矩阵表示
15
S S
局中人1
2 1
1 1
b11
a11 a21
…
ห้องสมุดไป่ตู้
2 S2
局中人2
…
a1n a2 n
2 Sn
b12 … a12 b22 …
b1n b2 n
…
S
1 2
b21
a22
… …
新浪微博:一花一世界economics
…
S
1 m
am1
bm1
am 2
bm 2 …
amn
bmn
2013年10月29日
新浪微博:一花一世界economics
2013年10月29日
用比较学术化的语言,
24
如果
p* = ( p1*, p2 *)
是二人博弈的一个纳什均衡,它必须满足:
π 1 ( p1*, p2 *) ≥ π 1 ( p1 , p2 *)
和
对于任意的 p1 ∈ ∑ 1
π 2 ( p1*, p2 *) ≥ π 1 ( p1*, p2 )
二人博弈的数学表达
16
因为行局中人有m种可以选择的纯策略, 所以他的混合策略可以紧凑地表示为一个向量
p = ( p1 , p2 , , pm )
要求对每一个纯策略i都有 pi
∑i =1 pi = 1 。 ≥ 0 ,并且满足
m
同样,因为列局中人有n种可以选择的纯策略, 所以他的混合策略可以紧凑地表示为一个向量 要求对每一个纯策略j都有 q j
pi = 1,而 pk = 0 对任意 k ≠ i 都成立,
,以0的概率选择其他任何策略。 这时候,行局中人的纯策略可表述为
p = (0,0, .0,1,0, ,0)
其中1只在i的位置出现一次。 这样的向量一共有m个,正好对应局中人的m个纯策略。
新浪微博:一花一世界economics
Si = {sil , , siK }
0 ≤ pik ≤ 1,
∑
k k =1
pik = 1
称为局中人i的一个混合策略,这里 表示局中人i选择纯策略
新浪微博:一花一世界economics
pik = p ( sik )
Sik 的概率 k = 1, , K
2013年10月29日
本课程约定
21
用
28
如果 p* = ( p1*, , pi *, , pn *) 是一个现在定义的混合策略的纳什均衡, 但是对于每个 i = 1, , n * 概率分布 pi = ( pi1*, , piki *) 的分量中, 都只有一个是1,其余都是0,即所有概率分布 * * pi = ( pi1*, , piki *) 都取 pi = (1,0, ,0) * * pi = (0, ,0,1,0, ,0) 或者 pi = (0, ,0,1) 的形式,那么这个“混合”策略纳什均衡就是 原来定义2.4的(纯策略)纳什均衡。
∑ 表示局中人i的混合策略空间
i
Space of mixed strategies 于是,
p = ( p1 , , pi , , pn ), pi ∈ ∑i
就表示博弈的一个混合策略组合 Mixed strategy profile
pi 都是一个混合策略向量。 这时候,我们用 π i ( p ) = π i ( p1 , , pi , , pn ) 表示局中人i在混合策略组合 p = ( p1 , , pi , , pn )
新浪微博:一花一世界economics
“扑克牌对色游戏”
6
乙
红
黑
1
红 甲 黑
-1 1 1 -1
2013年10月29日
-1 -1 1
新浪微博:一花一世界economics
博弈论最重要的问题就是寻求博弈的稳定结果
7
上面这个简单的例子, 给我们提出了一个很重要的问题, 就是如何解决按照前面两章的定义
q = ( q1 , q2 , , qn )
≥ 0 ,并且满足∑ j =1 q j = 1 。
n
新浪微博:一花一世界economics
2013年10月29日
纯策略的数学表达
17
若对于某个纯策略i, 我们有 那么混合策略p对于行局中人来说就是i这一纯策略。 也就是说,行局中人i 相当于行局中人以1的概率选择策略i