_混合策略纳什均衡(张克勇2013)

合集下载

3-混合策略的纳什均衡

3-混合策略的纳什均衡

博弈论教学/混合策略的纳什均衡出自MyKnowledgeBase< 博弈论教学Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡目录■1 复习■2 混合策略(Mixed strategy)■2.1 举例/Example■2.2 概念■2.3 纯策略和混合策略■2.4 混合策略的争议■3 混合策略的纳什均衡■3.1 基本概念■3.2 混合策略纳什均衡的存在性/纳什定理■3.3 学术争议与批评■4 混合策略纳什均衡举例■4.1 社会福利博弈Social Welfare Game■4.1.1 博弈分析(方法1:收益无差异)■4.1.2 博弈分析(方法2:图形分析法)■4.1.3 博弈分析(方法3:导数(Derivative)极值法)■4.2 普通例子■4.3 审计博弈(Tax Game)■4.4 激励的悖论[5]■4.5 求解纳什均衡的一般方法■5 多重纳什均衡■5.1 多重纳什均衡举例■5.1.1 夫妻之争■5.1.2 制式问题■5.1.3 市场机会博弈■5.2 多重纳什均衡分析■5.2.1 帕累托上策均衡(Pareto Dominated Equilibrium)■5.2.1.1 帕累托最优Pareto optimality■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium)■5.2.1.3 举例分析■5.2.2 风险上策均衡(Risk-dominant Equilibrium)■5.2.3 聚点均衡(Focal Points Equilibrium)■5.2.4 相关均衡■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义■7 作业■8 参考文献pure strategy)相对应。

混合策略:在博弈中,博弈方的策略空间为,则博弈方i以概率分布随机在其选策略中选择的“策略”,称为一个“混合策略”,其中,对都成立,且。

混合策略纳什均衡名词解释

混合策略纳什均衡名词解释

混合策略纳什均衡名词解释
嘿,朋友们!今天咱来聊聊混合策略纳什均衡!这可不是什么晦涩难懂的概念哦。

想象一下,在一个竞争的场景里,就像一场激烈的游戏,大家都在绞尽脑汁地想着怎么出招。

混合策略纳什均衡呢,就是在这种情况下,各方参与者都没办法通过单独改变自己的策略来获得更好的结果。

它就好像是一场微妙的平衡舞蹈!每个人都要在不同的选择之间跳跃,找到那个最合适的组合。

不是单纯地选择一个固定的策略,而是有时候这样,有时候那样,让对手捉摸不透。

好比是下棋,你不能总是走同样的几步,得灵活多变,根据对手的反应随时调整。

而且啊,这个均衡可不是那么容易达到的哦,需要各方参与者不断地试探、博弈。

它不是那种一眼就能看穿的简单玩意儿,而是隐藏在复杂的互动之中。

就像在迷雾中寻找方向,需要耐心和智慧。

在现实生活中,混合策略纳什均衡也无处不在呢!商业竞争中,企业要考虑怎么定价、怎么推广,不就是在寻找这种微妙的平衡吗?政治博弈中,各方势力也在不断调整策略,试图达到对自己最有利的状态。

甚至在我们的日常生活中,比如和朋友玩游戏,或者在一些选择中纠结,都能看到混合策略纳什均衡的影子。

它让我们明白,有时候没有绝对的最佳策略,只有在不断变化中找到的相对平衡。

混合策略纳什均衡就是这么神奇,这么有趣!它让我们看到了竞争和互动的复杂性,也让我们更加懂得如何在各种情况下做出明智的选择。

所以啊,别小瞧了这个概念,它可是有着大用处呢!。

博弈论-混合策略纳什均衡

博弈论-混合策略纳什均衡
,以达到均衡状态。
政治学的案例分析
总结词:国际关系
详细描述:在国际关系中,混合策略纳什均衡可以用来解释 国家之间的竞争和合作。例如,两个国家可能会以一定的概 率选择不同的外交政策,例如结盟、中立或对抗,以达到各 自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中,混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如,捕食者 可能会采用追逐和放弃两种策略来捕猎猎物,而猎物也可能会采用逃跑和装死两种策略 来避免被捕食。最终,捕食者和猎物都以一定的概率随机选择不同的策略,以达到均衡
非合作博弈论
研究个体如何在不知道其 他个体如何行动的情况下 做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体, 可以是个人、组织或国
家。
行动
参与者根据给定的信息 所做出的决策。
信息
参与者在进行决策时所 拥有的数据、情报或知
识。
策略
参与者为达到最优结果 而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词:繁殖竞争
VS
详细描述:在生物种群中,不同个体 之间会存在繁殖竞争。为了最大化自 己的遗传贡献,个体可能会采用不同 的交配策略,例如追求高繁殖成功率 的策略或避免过度竞争的策略。混合 策略纳什均衡可以用来描述这种竞争 状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中,生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分 析繁殖过程的均衡结果,解释生物多样性的形成机制。
05 混合策略纳什均衡的案例 分析
经济学的案例分析

混合策略纳什均衡概述.ppt

混合策略纳什均衡概述.ppt

2019/4/8
博弈论第三章 第一讲 概念与方法
21
友军博弈特征
两个(多个)纳什均衡 问题:博弈的最终结果?
2019/4/8
博弈论第三章 第一讲 概念与方法
22
第三章 混合策略纳什均衡
第三节 多重纳什均衡的选择 标准
2019/4/8
博弈论第三章 第一讲 概念与方法
23
第三节 多重纳什均衡的选择标准
2019/4/8
博弈论第三章 第一讲 概念与方法
32
第三节多重纳什均衡的选择标准
三、聚点均衡 (二)聚点均衡 1.标准 使用社会文化习惯、博弈历史等信 息达到均衡 1、10、66、888 2.实质 规律性
2019/4/8
博弈论第三章 第一讲 概念与方法
33
第三节多重纳什均衡的选择标准
三、混合策略纳什均衡 给定策略式博弈G= {S1,…,Sn;u1,…,un}以及混合策略组 合p*=(p1*,…,pi*,…pn*) 对于所有i和pi∈∑i, ∑i——i的混合策 略空间 如果有:πi(pi*,p-i*)≥πi(pi’,p-i*) 则:混合策略组合p*=(p1*,…,pi*,…pn*) 为G的混合策略纳什均衡
上 甲 下


-2,-2,0 -5,-5,0

-5,-5,0 -1,-1,5
丙:B
博弈论第三章 第一讲 概念与方法
36
第三节多重纳什均衡的选择标准
五、抗共谋均衡 (二)共谋偏离(集体偏离)均衡的激励 1.如果集体偏离(上,左,A) (1)起因:甲、乙集体偏离,选(下,右, A) (2)结果:甲的支付0→1,乙的支付0→1 (3)结论:甲、乙有集体偏离的动机, (上,左,A)非抗共谋均衡

博弈论混合策略纳什均衡名词解释

博弈论混合策略纳什均衡名词解释

博弈论混合策略纳什均衡名词解释博弈论混合策略纳什均衡是指在博弈论中,当参与者不能确定选
择某一个策略时,采取混合策略的情况下达到的均衡状态。

具体来说,混合策略是指在一个博弈中,参与者以一定的概率选
择不同的纯策略。

而纳什均衡是指在一个博弈中,参与者无法通过单
独改变自己的选择来获得更好的结果,即不存在任何参与者可以通过
改变自己的策略来让其他参与者不再选择当前策略。

混合策略纳什均衡是指游戏中所有参与者以一定的概率选择不同
的纯策略,并且这种概率分配对于所有参与者都是最优的。

也就是说,在混合策略纳什均衡下,参与者没有更好的选择可供其采取,而其他
参与者也没有更好的概率分配可供其选择。

拓展:
在博弈论中,还有许多其他类型的均衡概念,例如纯策略纳什均衡、帕累托均衡、部分均衡等等。

纯策略纳什均衡是指游戏中参与者
以确定性的纯策略进行选择,使得没有参与者可以通过改变其策略来
获得更好的结果。

帕累托均衡是指在一个博弈中,不存在可以改善任
何一个参与者的情况。

部分均衡是指只有某些参与者达到均衡状态,而其他参与者未达到均衡状态。

博弈论是研究决策制定者在相互影响下进行决策的数学工具。

通过分析不同的博弈策略和可能的结果,博弈论可以帮助我们理解冲突和合作的情况,并提供一些决策建议。

混合纳什均衡

混合纳什均衡

混合纳什均衡纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。

”也就是说,所有人的战略都是最优的。

而讲解“纳什均衡”的最著名的案例就是“囚徒的困境”。

a,b两个囚徒,a坦白b抵赖,b判10年,a判1年.若两人均坦白则各判5年,若两人均抵赖则都判2年。

a,b 面临抉择。

显然最好的策略是双方都抵赖,结果是大家都只被判2年。

但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。

这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐1年,而他会坐10年牢,也是招了划算。

综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。

两个人都会动这样的脑筋,最终,两个人都选择了招,结果都被判5年刑期。

原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。

这就是著名的“囚徒困境”。

它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。

混合策略均衡求解的一个原则是混合策略均衡赋予正概率的所有纯策略的期望收益相等。

假设这是个两个玩家的游戏。

玩家a有2种纯策略a和b,不能相互支配。

玩家b有2种纯策略c和d,不能相互支配。

设a选a的几率是p,则选b的几率为1-p;设b选c的几率是q,则选d的几率为1-q当a取某一个p=p0,b获得的总效用不为自己q的取值而改变;b取某一个q=q0,a获得的总效用不为自己p 的取值而改变,此时我们说(p0,1-p0)和(q0,1-q0)是一对混合策略下的纳什均衡。

混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。

混合策略纳什均衡

混合策略纳什均衡
(红 ) r 1 1/2 0 1/2 1 q (红)
博弈论 第三章 混合策略纳什均衡
r*=R(q)
反应对应曲线
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
再看乙的最优反应,记为q*=R(r): 观察π乙(p甲, p乙)= 2q(2r-1)-(2r-1)
若r 1 / 2 2r 1 0, q越大越好 1, q* R( r ) [0,1], 若r 1 / 2 2r 1 0,无论q选什么都无影响 0, 若r 1 / 2 2r 1 0, q越小越好
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
先看甲的最优反应,记为r*=R(q): 观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0,无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
解:Max π甲(p甲, p乙) r Max π乙(p甲, p乙) q
f.o.c. 2r-1=0
r*=1/2
混合策略纳什均衡是甲在策略空间{红,黑}上以概率分布 p甲*= (1/2,1/2)进行选择,乙也在策略空间{红,黑}上以概率p乙*= (1/2,1/2)进行选择
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、支付最大化法
例:扑克牌对色游戏(p77)
无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q(-1)+(1-q) 1]+ (1-r)[q1+(1-q)(-1)] = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r1+(1-r)(-1)]+ (1-q)[r(-1)+(1-r)1] =2q(2r-1)-(2r-1) f.o.c. 1-2q=0 q*=1/2

混合策略纳什均衡

混合策略纳什均衡

03 混合策略纳什均衡的证明 方法
反证法
总结词
通过假设不成立来证明均衡的存在。
详细描述
反证法是一种常用的证明方法,它首先假设与结论相反的命题成立,然后通过逻辑推理和数学推导,得出矛盾的 结论,从而证明原命题的正确性。在证明混合策略纳什均衡的存在时,反证法可以用来证明当其他玩家采取了最 优策略时,某个玩家采取混合策略能够达到最优结果。
唯一性意味着在给定对手策略的情况下,每个参与者都只有一个最优反应,从而 避免了复杂的策略互动和不确定性。
存在性
混合策略纳什均衡的存在性是指在某 些博弈中,至少存在一个策略组合, 使得每个参与者在给定其他参与者策 略的情况下,采用混合策略是最优的 。
存在性通常通过数学证明和计算机搜 索等方法来证明,但并不是所有博弈 都有混合策略纳什均衡。
混合策略纳什均衡
目录
CONTENTS
• 混合策略纳什均衡的定义 • 混合策略纳什均衡的特性 • 混合策略纳什均衡的证明方法 • 混合策略纳什均衡的应用场景 • 混合策略纳什均衡的局限性 • 混合策略纳什均衡的发展前景
01 混合策略纳什均衡的定义
定义
混合策略纳什均衡是一种博弈论中的均衡概念,它描述了在 给定对手策略的情况下,参与者如何选择最优策略以最大化 自己的期望收益。
代数法是一种通过数学符号和公式进行推 理和证明的方法。在证明混合策略纳什均 衡的存在时,代数法可以用来推导和证明 纳什均衡的条件和性质,利用代数性质和 技巧来证明均衡的存在。
04 混合策略纳什均衡的应用 场景
经济学
竞争策略分析
混合策略纳什均衡在经济学中被用于分析竞 争策略,特别是在不完全竞争市场和寡头垄 断市场中。通过混合策略纳什均衡,可以研 究企业在不确定环境下的最优反应,以及企 业如何通过调整其策略来应对竞争对手的行 为。

混合战略纳什均衡

混合战略纳什均衡

五 混合战略纳什均衡
混合战略纳什均衡的含义: 纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的
最优选择。因此在社会福利博弈中, * 0.2 , *=0.5是唯一的混 合战略纳什均衡。
从反面来说,如果政府认为流浪汉选择寻找工作的概率严格小于 0.2,那么政府的唯一最优选择是纯战略:不救济;
4r-1=-r r=0.2
的概率现则救济还是不救济
五 混合战略纳什均衡
对 * 的0.2解释: 如果流浪汉以找工作的概率小于0.2, 则政府选择不救
济,如果大于0.2,政府选择救济 ,只有当概率等于0.2时, 政府才会选择混合战略或任何纯战略. 对 * 的0.解5 释 如果政府救济的概率大于0.5,流浪汉的最优选择是流 浪,如果政府救济的概率小于0.5,流浪汉的最优选择是 寻找工作.
n
vi ( i , i ) ( j (s j ))ui (s) sS j1
n个参与人的混合战略纳什均衡
让我们以两人博弈为例说明这一点。假定 S1 (s11, ,s1K,) 即参与人1有K个纯战略,参与人2有J个纯战略。若参与人1相 信参与人2的混合战略为 S 2 (s21, ,s2J ),那么,参与人1选 择纯战略 s1k 的期望效用为:
五 混合战略纳什均衡
社会福利博弈
流浪汉 寻找工作 流浪
政府
2 救济 3,
1 不救济 -1,
3 -1,
0 0,
设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的战略都是给定对方混合战略时的最优战略
五 混合战略纳什均衡
✓ 战略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。

混合策略纳什均衡计算方法(一)

混合策略纳什均衡计算方法(一)

混合策略纳什均衡计算方法(一)混合策略纳什均衡计算方法什么是混合策略纳什均衡混合策略纳什均衡是博弈论中的一个概念,指的是每个玩家都选择一定的概率来执行每一个可行的行动。

这样,游戏的结果不再是唯一的,而是有一定的概率分布。

如何计算混合策略纳什均衡计算混合策略纳什均衡需要用到线性规划的方法,具体步骤如下:1.确定每个玩家的策略空间,即每个玩家可选的所有策略。

2.建立概率分布矩阵,即每个玩家选择每个策略的概率。

3.利用概率分布矩阵和游戏的收益矩阵计算出每个玩家的期望收益。

4.建立线性规划模型来最大化每个玩家的期望收益。

5.求解线性规划模型得到混合策略纳什均衡。

混合策略纳什均衡的应用混合策略纳什均衡在实际应用中有广泛的应用。

比如在围棋、国际象棋等棋类游戏中,人类选手常常会使用混合策略来应对对手的不确定性。

同时,在市场竞争、拍卖、投资等领域,混合策略也可以用来帮助决策者做出最优的决策。

总结混合策略纳什均衡是博弈论中的重要概念,在实际应用中具有广泛的应用前景。

计算混合策略纳什均衡需要用到线性规划的方法,但具体计算步骤并不复杂。

我们可以通过深入理解和应用混合策略纳什均衡,来帮助我们更好地应对不确定性和竞争。

混合策略纳什均衡的优势混合策略纳什均衡作为一种考虑不确定性的策略,相较于确定性策略有以下优势:1.能够应对对手的随机性,减小被对手利用的风险;2.能够在一定程度上改变游戏的结果分布,增加自己的收益,同时降低失败的风险。

混合策略纳什均衡的局限性尽管混合策略纳什均衡具有很多优点,但是也存在以下局限性:1.混合策略需要玩家具有一定的判断力和计算能力,否则可能难以计算出最优解;2.没有一个确定的策略来保证获胜,更多地要依靠概率和运气;3.当游戏中有多个混合策略纳什均衡时,玩家可能难以选择最优的策略。

结语混合策略纳什均衡是一个重要的博弈论概念,应用范围广泛。

尽管混合策略存在一些局限性,但是这并不妨碍我们充分应用这一理论来帮助我们在不确定性和竞争中取得更好的结果。

条件混合策略的纳什均衡

条件混合策略的纳什均衡

条件混合策略的纳什均衡1. 引言嘿,大家好!今天咱们聊聊一个既有趣又有点深奥的话题——条件混合策略的纳什均衡。

听起来有点复杂?别担心,咱们用轻松的方式来聊,保证让你听得懂、记得住。

想象一下,你和你的朋友正在玩一个游戏,可能是扑克、棋类,或者甚至是猜拳。

这个游戏的关键在于,你的决策不仅仅取决于你自己的选择,还要考虑到对方的想法和选择。

这就是咱们今天要讲的核心——在不确定的情况下,怎样做出最优决策。

2. 纳什均衡简介2.1 什么是纳什均衡?那么,纳什均衡到底是个啥呢?简单说,就是一个状态,在这个状态下,任何一个玩家如果单独改变自己的策略,都会让自己变得更糟。

就像一场足球比赛,双方都在根据对方的表现调整策略,最终形成一种微妙的平衡。

你不动,我不动,大家都不动,这就是纳什均衡。

说白了,想要赢,你得懂得有时候不动也是一种策略。

2.2 条件混合策略接下来,咱们再说说“条件混合策略”。

乍一听,好像高深莫测,其实它就是在不同情况下随机选择不同的策略。

举个例子:想象你和朋友下棋,你可能在某一轮选择攻击,而在另一轮选择防守。

这种随机性可以让对手难以预测你的下一步动作,嘿,这就让游戏更有趣了,对吧?3. 条件混合策略的运用3.1 实际案例现在咱们把这个理论应用到实际中,看看它是如何运作的。

比如在商业竞争中,两家公司为了争夺市场份额,可能会在价格、广告和产品质量上进行博弈。

一家公司可能会在价格上采取“低价策略”,而另一家公司则可能选择“高价策略”,同时在广告上加大投入。

通过这样的条件混合策略,双方都可以在市场中找到一种平衡,既能保护自己的利益,又能不至于把对方逼得太狠。

3.2 生活中的例子不仅如此,这种策略在我们的日常生活中也屡见不鲜。

想象一下你和朋友一起去餐厅,点菜的时候总是考虑对方喜欢什么,而不是只顾着自己。

你可能今天想吃披萨,但考虑到对方可能更喜欢汉堡,你就故意“随机”选择一下,看看情况。

如果对方也点了披萨,嘿,你们就双赢了!这样的“条件混合策略”让你们的友谊更加稳固,岂不是一举两得?4. 结论通过上面的讨论,咱们发现,条件混合策略的纳什均衡不仅仅是个理论,还是生活中随处可见的智慧。

_混合策略纳什均衡(张克勇2013)

_混合策略纳什均衡(张克勇2013)
丈夫21000013时装足球时装足球妻子夫妻之争存在两个纯策略均衡22110000时装足球时装时装丈夫0013足球妻子夫妻之争还存在混合策略纳什均衡丈夫妻子的混合策略21000013时装c足球f时装c足球f妻子3001???????fpcpfpcpwwww丈夫的混合策略夫妻之争1002???????fpcpfpcphhhh夫妻之争博弈的混合策略纳什均衡策略博弈方1075025博弈方21323得益067075多重纳什均衡及其甄别?帕累托优势标准?风险优势标准?帕累托优势标准和风险优势标准帕累托优势标准和风险优势标准?聚点均衡?相关均衡?抗共谋均衡?看看这个博弈有几个纯策略纳什均衡
EUA p1 X 1 p 2 X 2 ... pnXn
政府和流浪汉的博弈
• 政府想帮助流浪汉,但前提是后者必须试图寻找工 作,否则,不予帮助;而流浪汉若知道政府采用救 济策略的话,他就不会寻找工作。他们只有在得不 到政府救济时才会寻找工作。他们获得的支付如图 所示:
流浪汉 寻找工作 救济 政府 不救济 游闲
3,2 -1 , 1
-1 , 3 0,0
假设政府救济的概率为 ;流浪汉找工作的概率为 ; 则 政府的期望效用函数为:
uG 3 11 1 01 5 1
解一: 支付最大化
uG 3 11 1 01 5 1
• 事实上,正是因为它在几个(或全部)策略之间 是无差异的,他的行为才难以预测,混合策略纳 什均衡才会存在。
讨论
• 尽管混合策略不像纯策略那样直观,但它确实是 一些博弈中参与人的合理行为方式。扑克比赛、 垒球比赛、划拳就是这样的例子,在这一类博弈 中,参与比赛的总是随机行动以使自己的行为不 被对方所预测。

《博弈论与信息经济学》混合战略纳什均衡--ppt课件全篇

《博弈论与信息经济学》混合战略纳什均衡--ppt课件全篇

放荡
32
-1 3
-1 1 0 0
1
ppt课件
假定父母选择支助的概率为p1,选择不支助的概率为p2 1- p1 ; 儿子选择立志的概率为q1,选择不立志的概率为q2 1- q1 。那么
对两个参与人,各自的盈利函数为:
v1
3 p1q1
1
p1q2
1
p2q1
5
p1q1
p1
q1
v2 2 p1q1 p2q1 3 p1q2 2 p1q1 q1 3 p1
一个混合战略均衡:p*, q* 3 4,1 4。
p

1
3/4 乙
O 1/4
12
1q
ppt课件
▪ 解法2:代数法
甲和乙的期望盈利:v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
v甲
p
v乙
q
4q 1 0 4p 3 0
p*
q*
3 4 1 4
13
ppt课件
▪ 例3(三人博弈)
K
pik 1,pik p sik 是i选择战略sik的概率,pi称为参与人i的混合战略。
k 1
i 代表i的混合战略空间,pi i 。
▪ (2)期望盈利
对于博弈G S1,..., Si ,..., Sn;u1,..., ui ,..., un,对应于s s1,..., si,..., sn 有p p1,..., pi ,..., pn ,pi i ,p表示局中人i的混合战略组合,那么,
2
即q 1 ,则p越小越好,而p的最小值只能取0;如果1 2q 0,
2
即q 1 ,则p能取任意值,即p 0,1。
2
对于乙来说,为使盈利达到最大,只有调整q。如果2 p 1 0,

混合策略纳什均衡

混合策略纳什均衡

目录[隐藏]1 什么是混合策略纳什均衡2 解混合策略纳什均衡的方法3 混合策略纳什均衡的经典博弈——猜谜博弈[1]4 混合策略纳什均衡博弈与其他均衡的关系[1]5 参考文献[编辑][编辑][编辑]混合策略纳什均衡混合策略纳什均衡(Mixed Strategy Nash Equilibrium )什么是混合策略纳什均衡混合策略纳什均衡:在n 个参与人的博弈G={S 1 ,... S n ; u 1,...u n }中,混合策略组合构成一个纳什均衡,如果对于所有的i =1,2...,n 下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。

混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。

解混合策略纳什均衡的方法1、最大化支付法:即最大化各个参与人的效用函数。

2、支付相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略支付相等,构成方程组求解。

混合策略纳什均衡的经典博弈——猜谜博弈[1]两个局中人A 、B 手里各拿一枚硬币,每人可以选择正面向上或反面向上,然后同时亮出,如果两枚硬币正反面相同,B 付给A1元钱,如果两枚硬币正反面不相同,A 付给B1元钱。

在这种情况下,局中人A 、B 如何选择呢?下图给出这个博弈的双变量收益矩阵。

这是一个两人零和博弈,在每一个结局中一方所得即为另一方所失,即两个局中人的收益之和恰好等于零。

在双变量收益矩阵中采用画线的方法,在这个博弈中找不到纯策略纳什均衡。

那么,猜谜博弈是否存在混合策略纳什均衡呢?1950年纳什证明了任何有限博弈都至少存在一个纳什均衡(包括纯策略纳什均衡和混合策略纳什均衡)。

博弈论教材2013-2

博弈论教材2013-2

第三章 纳什均衡及其应用3.1 混合策略纳什均衡1 鹰鸽博弈我们知道老鹰具有攻击性,而鸽子爱好和平。

在原始社会里有两个部落,可以做出两个行动:一是进攻一是和平,分别用鹰和鸽表示。

表1 鹰鸽博弈乙甲鹰 鸽该博弈的那是均衡为(鹰,鸽),(鸽,鹰)。

一些学者研究发现,在同一个地域内,“鹰”和“鸽”的比例为0.36:0.64。

事实上,设鹰鸽比为:1z z -,可以得出如下结果:()2514(1)1439E e z z z =-+-=-; ()95(1)514E d z z z =-+-=-90.3625z == 聪明的做法是:当鹰鸽比小雨0.36时,选择鹰策略;否则选择鸽策略。

使用混合策略方法分析:第一步:混合策略型表示:乙 鹰 鸽甲鹰 p 鸽 1-p第二步:计算期望效用:(925)514(259)514E p q q E q p p=-+-=++-甲乙第三步:作出最优反应函数91 259[0,1] 2590 25q p q q ⎧<⎪⎪⎪==⎨⎪⎪>⎪⎩若若若, 90 259[0,1] 259 1 25p q p p ⎧<⎪⎪⎪==⎨⎪⎪>⎪⎩如果如果如果 第四步:作出反应函数的图像第五步:根据交点,找出纳什均衡:其中(99,2525)是混合策略纳什均衡。

2 斗鸡博弈我的老家地处安徽最北部,苏鲁豫皖四省交界之处,东北处有条小河。

河边的棉花地里,经常有鹌鹑栖息在其间。

秋末冬初的农闲时节,小鹌鹑刚好长成。

村民结网捕鹌鹑把玩、斗鸟儿为乐。

每天早晨4点多钟出发,大约7点钟回来,雄性的鹌鹑留起来先要整夜整夜的熬鹌鹑、放在手里把鹌鹑,真正熟练了,才拿出来和别人的相斗。

设想两只鹌鹑要在场子里一决雌雄。

每只鹌鹑都有两个策略:攻击或逃跑。

由于两只鹌鹑实力相当,若同时选择进攻会两败俱伤;若一只进攻,一只逃跑,进攻者胜利。

逃跑的鹌鹑算是玩完了,以后再也没胆量进场子,主人也不回在把玩它,会用一块黑布把它的笼子蒙起来,培养成“叫子”,以后后捕鹌鹑的时候拎出去吸引同伴。

混合策略纳许均衡课件

混合策略纳许均衡课件

策略纳什均衡的算法优化。
混合策略纳什均衡与人工智能
02
随着人工智能的发展,可以尝试将混合策略纳什均衡应用于机
器学习和人工智能领域,以实现更高效和智能的决策。
混合策略纳什均衡与演化博弈论的结合
03
研究混合策略纳什均衡与演化博弈论的结合,可以更好地解释
现实生活中的动态博弈现象。
06
参考文献
参考文献
定义
混合策略纳什均衡课件
CONTENTSБайду номын сангаас
• 混合策略纳什均衡简介 • 混合策略纳什均衡的数学模型 • 混合策略纳什均衡的求解方法 • 混合策略纳什均衡的应用实例 • 混合策略纳什均衡的挑战与展
望 • 参考文献
01
混合策略纳什均衡简介
定义与概念
混合策略纳什均衡是一种博弈论中的概念,它描述了在给定对手策略的情况下,参 与者如何选择最优的行动方案。
定义策略空间
为每个参与人定义一个策略选 择的空间,这些策略可以是离 散的、连续的或混合的。
定义支付函数
根据每个参与人的策略选择, 定义他们的支付函数,即每个 参与人在该策略下的期望收益。
构建博弈矩阵
根据参与人的策略空间和支付 函数,构建一个博弈矩阵,用 以表示每个参与人选择不同策
略时的收益。
模型参数解 释
纳什均衡点或满足一定的收敛条件。
优化算法
优化算法是一种基于数学优化的方法,用于求解混合策略纳什均衡。
优化算法的基本步骤包括:定义一个目标函数,然后使用优化算法(如 梯度下降法、牛顿法等)寻找目标函数的最大值或最小值,从而得到纳
什均衡点。
优化算法的优点是能够快速找到纳什均衡点,适用于大规模问题。但缺 点是需要对问题进行数学建模,且对初始点的选择敏感。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 在社会经济现象中,存在着许多激励的悖论的现象,如为了 减少考试作弊的现象,应加大对监考人员失职的处罚其效 果更好等等. • 激励的悖论对我们制定政策和规章制度时带来了有益的思 考.
练习:混合策略的纳什均衡
下面的博弈是否存在纯策略的纳什均衡,如果没有采用混合 策略纳什均衡分析。试用支付最大化法和支付等值法两种 方法算一算混合策略的纳什均衡是多少?通过反应曲线,求 得混合策略的纳什均衡. 博弈方2
• 事实上,正是因为它在几个(或全部)策略之间 是无差异的,他的行为才难以预测,混合策略纳 什均衡才会存在。
讨论
• 尽管混合策略不像纯策略那样直观,但它确实是 一些博弈中参与人的合理行为方式。扑克比赛、 垒球比赛、划拳就是这样的例子,在这一类博弈 中,参与比赛的总是随机行动以使自己的行为不 被对方所预测。
纳什均衡是:政府以1/2的概 率选择救助,流浪汉以1/5的 概率选择找工作。
1/5
1
r
p 1
练习2:利用反应函数法找出情侣博弈的所有纳什均衡
丽娟 足球 足球 2 , 1 大海 芭蕾 0 , 0
芭蕾
0,0 1,2
2/3
0
1/3
1
q
激励的悖论
• 一小偷欲偷有守卫看守的仓库,若小偷去偷时 守卫睡觉(不负责),则小偷偷窃成功(令其 价值是V),若守卫没有睡觉(尽职尽责), 则小偷会被抓住坐牢(设其效用为-A);再假 设守卫睡觉而未被偷的效用为S,守卫睡觉而 被偷则被解雇,其效用为-D。写出得益矩阵, 并分析如果想减少小偷偷东西的现象发生,如何 做效果更好?
• 经济学上的监督博弈也是这样一个例子。如税收 检查、质量检查、惩治犯罪、雇主监督雇员等都 可以看成猜谜博弈。
§扑克牌对色游戏
• AB玩扑克牌对色游戏,每人都有红黑两张 扑克牌,约定如果出牌颜色一样,A输B赢, 如果出牌颜色不一样,则A赢B输。 • 找到这个博弈的纳什均衡。
B 红 红 A 黑 -1, 1 黑 1, -1
丈夫的混合策略
夫妻之争
ph (C) 2 ph ( F ) 0 ph (C) 0 ph ( F ) 1
激励的悖论
• 用支付最大化值求出:
A 1 q* V VA 1 A
当加大对小偷的处罚,守卫 偷懒的概率会增加 A q*小 偷偷东西的概率会减小 S p*
激励的悖论
• 从道理上讲,小偷偷东西是一种犯罪行为,而守恒不负责仅 是失职行为;从性质上讲,犯罪的性质比失职的性质严重得 多,理所当然应该加重对小偷的处罚,但从上面的分析可看 出,为了减少偷窃的现象,反而是加重对守卫处罚效果更好. 这就是激励的悖论!
3,2 -1 , 1
-1 , 3 0,0
假设政府救济的概率为 ;流浪汉找工作的概率为 ; 则 政府的期望效用函数为:
uG 3 11 1 01 5 1
解一: 支付最大化
uG 3 11 1 01 5 1
-1 , 3 0,0
假设政府救济的概率为 ;流浪汉找工作的概率为 ; 则流浪汉的期望效用函数为:
u L 2 11 1 3 01 (2 1) 3
解一:支付最大化
• 流浪汉的期望效用函数为:
u L 2 11 1 3 01 (2 1) 3
五 混合策略纳什均衡
• 纯策略(pure strategies):如果一个策略规 定参与人在一个给定的信息情况下只选择一 种特定的行动。 • 混合策略(mixed strategies):如果一个策 略规定参与人在给定的信息情况下,以某种 概率分布随机地选择不同的行动。 • 在静态博弈里,纯策略等价于特定的行动, 混合策略是不同行动之间的随机选择。
策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6
不同均衡概念的关系
占优均衡 DSE 重复剔除占优均衡 IEDE 纯战略纳什均衡
PNE 混合战略纳什均衡
MNE
监督博弈的纳税检查
• A 为应纳税款,C为检查成本, F是偷税罚款。 假定 C<A+F。不存在纯战略纳什均衡。请问: 如何才能降低纳税人逃税的可能性
u L 2 1 0
0.5
maxu G [3 (1 )] (1 )( )

maxu L [2 (1 )] 3(1 )

则 0.5, 0.2
解二: 支付等值法
• 政府选择救济策略
1
2
[1 2 ] 3
0, 当r 1 / 5 [0,1],当r 1 / 5 1, 当r 1 / 5
1, 当 1 / 2 r [0,1],当 1 / 2 0, 当 1 / 2

1 1/2 0
( * , r * ) (1 / 2,1 / 5)
1, 3
存在两个纯策略均衡
丈夫 时装 时装 妻 子 2, 1 足球 0, 0
足球
0, 0
1, 3
夫妻之争
还存在混合策略纳什均衡
丈夫 时 装C 妻 子 时装C 足球F 2, 1 0, 0 足 球F 0, 0 1, 3
妻子的混合策略
pw (C) 1 pw (F ) 0 pw (C) 0 pw (F ) 3
§ 期望支付
• 与混合策略(mixed strategies)相伴随的一个问 题,是局中人支付的不确定性(uncertainty).可用 期望支付(expected payoff)来描述——有个n可 能的取值X1,X2…,Xn ,并且这些取值发生的概率 分别为p1,p2,…,pn,那么我们可以将这个数量指 标的期望值定义为发生概率作为权重的所有可能 取值的加权平均,也就是
0
1/2
1
q
同理
U B ( p, q) 2q(2 p 1) (2 p 1)
因此B的最佳反应函数为
p 1
1, 当p 1 / 2 q [0,1],当p 1 / 2 0, 当p 1 / 2
p 1 1/2 0
1/2 0 1
q
( P* , q* ) (1/ 2,1/ 2)
1、假定政府采用混合策略:
G ,1 1 即政府以的概率选择救济, 的概率选择不救济。
2、流浪汉的混合策略为:
L ,1 1 即流浪汉以 的概率选择寻找工作, 的概率选择游闲。
解一: 支付最大化
流浪汉 找工作 游荡
政府 救济 不救济

• 解二: 支付等值法
如果一个混合策略是政府的最优选择,那一定意 味着流浪汉在寻找工作与游闲之间是无差异的, 即: 流浪汉
找工作 政府 救济 不救济 3,2 游荡 -1 , 3
-1 , 1
0,0
u L 1, 1 3 u L 0, 0.5
政府和流浪汉的博弈
(3,2) (-1,3) (-1,1) (0,0)
政府和流浪汉的博弈
• 思考:政府会采用纯策略吗?流浪汉呢?这 个博弈有没有纯策略的纳什均衡? • 那么政府和流浪汉最有可能采用什么策略? • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略,就可以采用针 对性的策略,使自己的支付增加。
求解混合策略纳什均衡
纳税人
逃税
税收机关 检查
不逃税
A-C+F,-A-F
A-C, -A
不检查 0,0
A,-A
课后作业:以“监督博弈”为关键词在学术期刊网上查找文献, 浏览至少三篇论文并精读一篇,写下笔记。
夫妻之争的混合策略纳什均衡
看看这个博弈有几个均衡?
丈夫 时装 时装 2, 1 足球 0, 0
妻 子
足球
0, 0
夫妻之争
EUA p1 X 1 p 2 X 2 ... pnXn
政府和流浪汉的博弈
• 政府想帮助流浪汉,但前提是后者必须试图寻找工 作,否则,不予帮助;而流浪汉若知道政府采用救 济策略的话,他就不会寻找工作。他们只有在得不 到政府救济时才会寻找工作。他们获得的支付如图 所示:
流浪汉 寻找工作 救济 政府 不救济 游闲
对上述效用函数求微分,得到政府最优化的一阶条 件为:
uG 5 1 0 0.2
就是说,从政府的最优化条件找到流浪汉混 合策略——流浪汉以0.2的概率选择寻找工作,0 .8 的概率选择游闲。
解一:支付最大化
流浪汉 找工作 游荡
政府 救济 不救济
3,2 -1 , 1
纳什均衡是:A和B出红牌还 是出黑牌的概率都是1/2.
1/2 1 q
反应函数法
练习1:利用反应函数法找出政府与流浪汉博弈的纳什均衡
流浪汉 找工作 游荡 政府 救济 不救济 3,2
-1 , 1
-1 , 3
0,0
假设政府救济的概率为 ;流浪汉找工作的概率为 ; 则
u (5 1) , u
• • • • • • 如果政府救济的概率小于0.5; 则流浪汉的最优选择是寻找工作; 如果政府救济的概率大于0.5; 则流浪汉的最优选择是游闲等待救济。 如果政府救济的概率正好等于0.5; 流浪汉的选择无差异。
讨论
• 上面的均衡要求每个参与人以特定的概率选择纯 策略。也就是说,一个参与人选择不同策略的概 率不是由他自己的支付决定的,而是由他的对手 的支付决定的。 • 正是由于这个原因,许多人认为混合策略纳什均 衡是一个难以令人满意的概念。
1, -1
-1, 1
例 扑克牌对色游戏 红 A
B

红 黑
-1 , 1 1 , -1
相关文档
最新文档