混合的策略纳什均衡
混合策略纳什均衡
02
混合策略纳什均衡的基本理论
纳什均衡的定义与性质
纳什均衡的定义
在博弈中,如果每个玩家都采取自己的最优策略,那么整个博弈会达到一种均 衡状态,即所有参与者的利益达到最大化。
纳什均衡的性质
纳什均衡是一种自我稳定的状态,即使受到外部干扰,也会迅速恢复到原始状 态。此外,纳什均衡也是最优的,因为它使得每个参与者的利益都达到最大化 。
其次,现有的研究往往只关注特定的博弈模型, 对于更一般化的博弈模型,尤其是对于连续型博 弈和多阶段博弈的研究还比较缺乏。
首先,混合策略纳什均衡的概念和性质仍需进一 步深化和研究。例如,对于非完全信息博弈,如 何准确地刻画混合策略纳什均衡点的数量和分布 等问题仍需探索。
最后,现有的研究主要集中在理论层面,对于如 何将混合策略纳什均衡应用到实际问题中,如何 设计和制定有效的混合策略等问题还需要进一步 探讨。
未来研究方向与挑战
未来研究可以进一步拓展混合策略纳什均衡的应用领域,例如在经济学、政治学、社会学等领域的应 用。
另外,针对现有的研究不足,未来研究可以深入探索混合策略纳什均衡的性质和计算方法,以及如何设 计和制定有效的混合策略等问题。
此外,未来的研究还可以进一步拓展混合策略纳什均衡的理论框架,例如在多阶段博弈、不完全信息博 弈、非线性博弈等领域的研究。
略纳什均衡来分析。
在生物学领域的应用
在生物学中,混合策略纳什均衡可以用来研究生物种 群的进化稳定性和生态平衡。
在生态系统中,生物种群可以通过选择不同的繁殖、 迁徙、捕食等策略来适应环境变化,这种博弈关系可 以通过混合策略纳什均衡来分析。
在其他领域的应用
在社会学中,混合策略纳什均衡可以用来研究社会群 体中的合作与竞争关系。
混合策略纳什均衡名词解释
混合策略纳什均衡名词解释
嘿,朋友们!今天咱来聊聊混合策略纳什均衡!这可不是什么晦涩难懂的概念哦。
想象一下,在一个竞争的场景里,就像一场激烈的游戏,大家都在绞尽脑汁地想着怎么出招。
混合策略纳什均衡呢,就是在这种情况下,各方参与者都没办法通过单独改变自己的策略来获得更好的结果。
它就好像是一场微妙的平衡舞蹈!每个人都要在不同的选择之间跳跃,找到那个最合适的组合。
不是单纯地选择一个固定的策略,而是有时候这样,有时候那样,让对手捉摸不透。
好比是下棋,你不能总是走同样的几步,得灵活多变,根据对手的反应随时调整。
而且啊,这个均衡可不是那么容易达到的哦,需要各方参与者不断地试探、博弈。
它不是那种一眼就能看穿的简单玩意儿,而是隐藏在复杂的互动之中。
就像在迷雾中寻找方向,需要耐心和智慧。
在现实生活中,混合策略纳什均衡也无处不在呢!商业竞争中,企业要考虑怎么定价、怎么推广,不就是在寻找这种微妙的平衡吗?政治博弈中,各方势力也在不断调整策略,试图达到对自己最有利的状态。
甚至在我们的日常生活中,比如和朋友玩游戏,或者在一些选择中纠结,都能看到混合策略纳什均衡的影子。
它让我们明白,有时候没有绝对的最佳策略,只有在不断变化中找到的相对平衡。
混合策略纳什均衡就是这么神奇,这么有趣!它让我们看到了竞争和互动的复杂性,也让我们更加懂得如何在各种情况下做出明智的选择。
所以啊,别小瞧了这个概念,它可是有着大用处呢!。
混合策略纳什均衡例子
混合策略纳什均衡例子混合策略纳什均衡是博弈论中的一个重要概念,指的是各参与者选择一个概率分布作为他们的策略,从而达到一个稳定的状态。
在混合策略纳什均衡中,没有任何参与者可以通过单独改变自己的策略来获得更好的结果。
一个经典的混合策略纳什均衡的例子是“岩石-剪刀-布”游戏。
在这个游戏中,两个参与者(称为玩家1和玩家2)可以选择出岩石、剪刀或布中的任意一种。
每一种选择都有一定的胜负规则:岩石胜剪刀,剪刀胜布,布胜岩石。
假设玩家1选择出岩石、剪刀和布的概率分别为p1、q1和r1,玩家2选择出岩石、剪刀和布的概率分别为p2、q2和r2。
两个玩家的利益可以用一个支付矩阵表示如下:| 岩石 | 剪刀 | 布-----------------------------岩石 | 0 | -1 | 1-----------------------------剪刀 | 1 | 0 | -1-----------------------------布 | -1 | 1 | 0在混合策略纳什均衡中,每个玩家选择的概率分布必须使得对于每一种选择,玩家都不希望改变自己的概率分布。
在这个例子中,我们可以通过计算来找到混合策略纳什均衡。
假设玩家1选择出岩石的概率为p1,则选择剪刀的概率为q1=1-p1-0=1-p1,选择布的概率为r1=0-0=0。
同样地,玩家2选择出岩石的概率为p2,则选择剪刀的概率为q2=1-p2-0=1-p2,选择布的概率为r2=0-0=0。
为了找到混合策略纳什均衡,我们需要检查每一种选择,并确保玩家对于每一种选择都不希望改变自己的概率分布。
在这个例子中,无论玩家1选择什么概率分布,玩家2都可以通过选择相应的概率分布来获得更好的结果。
所以,不存在一个混合策略纳什均衡。
总结起来,混合策略纳什均衡是博弈论中一种稳定的策略选择状态,即不存在任何参与者可以通过单独改变自己的策略来获得更好的结果。
岩石-剪刀-布游戏是一个经典的混合策略纳什均衡的例子,其中玩家的选择概率分布是关键因素。
博弈论-混合策略纳什均衡
政治学的案例分析
总结词:国际关系
详细描述:在国际关系中,混合策略纳什均衡可以用来解释 国家之间的竞争和合作。例如,两个国家可能会以一定的概 率选择不同的外交政策,例如结盟、中立或对抗,以达到各 自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中,混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如,捕食者 可能会采用追逐和放弃两种策略来捕猎猎物,而猎物也可能会采用逃跑和装死两种策略 来避免被捕食。最终,捕食者和猎物都以一定的概率随机选择不同的策略,以达到均衡
非合作博弈论
研究个体如何在不知道其 他个体如何行动的情况下 做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体, 可以是个人、组织或国
家。
行动
参与者根据给定的信息 所做出的决策。
信息
参与者在进行决策时所 拥有的数据、情报或知
识。
策略
参与者为达到最优结果 而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词:繁殖竞争
VS
详细描述:在生物种群中,不同个体 之间会存在繁殖竞争。为了最大化自 己的遗传贡献,个体可能会采用不同 的交配策略,例如追求高繁殖成功率 的策略或避免过度竞争的策略。混合 策略纳什均衡可以用来描述这种竞争 状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中,生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分 析繁殖过程的均衡结果,解释生物多样性的形成机制。
05 混合策略纳什均衡的案例 分析
经济学的案例分析
博弈论混合策略纳什均衡名词解释
博弈论混合策略纳什均衡名词解释博弈论混合策略纳什均衡是指在博弈论中,当参与者不能确定选
择某一个策略时,采取混合策略的情况下达到的均衡状态。
具体来说,混合策略是指在一个博弈中,参与者以一定的概率选
择不同的纯策略。
而纳什均衡是指在一个博弈中,参与者无法通过单
独改变自己的选择来获得更好的结果,即不存在任何参与者可以通过
改变自己的策略来让其他参与者不再选择当前策略。
混合策略纳什均衡是指游戏中所有参与者以一定的概率选择不同
的纯策略,并且这种概率分配对于所有参与者都是最优的。
也就是说,在混合策略纳什均衡下,参与者没有更好的选择可供其采取,而其他
参与者也没有更好的概率分配可供其选择。
拓展:
在博弈论中,还有许多其他类型的均衡概念,例如纯策略纳什均衡、帕累托均衡、部分均衡等等。
纯策略纳什均衡是指游戏中参与者
以确定性的纯策略进行选择,使得没有参与者可以通过改变其策略来
获得更好的结果。
帕累托均衡是指在一个博弈中,不存在可以改善任
何一个参与者的情况。
部分均衡是指只有某些参与者达到均衡状态,而其他参与者未达到均衡状态。
博弈论是研究决策制定者在相互影响下进行决策的数学工具。
通过分析不同的博弈策略和可能的结果,博弈论可以帮助我们理解冲突和合作的情况,并提供一些决策建议。
第三讲_混合策略纳什均衡
混合策略
◆混合策略定义:在n人博弈的策略式表述 G S1, , Sn ; u1, , un Si Si1, , SiK ,那么,概率 中,假定参与人 i 有K个纯策略: 分布 pi pi1 , , piK 称为 i 的一个混合策略,这里
pik p(sik ) 是 i 选择 sik 的概率,对于所有
这个故事曾经被很多人当作博弈论的例 子来演绎,但实际上这个故事与博弈论无关。 博弈论会假定所有局中人都是理性的,不能假 定一些局中人聪明而另一些局中人却是傻子。 当田忌出下马时,齐威王最好的选择是出下马 而不是上马。孙膑的计谋中假定齐威王是傻子 ,当田忌出下、上、中马时,他仍然按上、中 、下马出,当然要输了。事实上,当田忌出下 马时,齐威王应出下马,但齐威王出下马时, 田忌不应出下马而是出中马,但此时齐威王又 应出中马而不是下马了,……。这样,博弈不 会有纯战略的均衡。
-2,3
2,2
假定老板选择混合战略(0.2,0.8) 工人选择“偷懒”期望支付为(-1)×0.2+3×0.8=2.2 工人选择“不偷懒”(期望)支付为2×0.2+2×0.8=2 工人应选择“偷懒” 老板选择“监督” “不偷懒’……
假定老板选择混合战略(0.5, 0.5) 工人选择“偷懒”期望支付 0.5 为 (-1)×0.5+3×0.5=1 工人选择“不偷懒”期望支 0.5 付为2×0.5+2×0.5=2 工人应选择“不偷懒” 老板选择“不监督” 工人选择“偷懒’……
由 VA =VB 可得 :q=0.8 博弈方2:
VB =3q (1 q)
博 弈 方 1
A B
VC =3 p (1 p)
VD =2 p 5(1 p)
混合策略纳什均衡
博弈论 第三章 混合策略纳什均衡
r*=R(q)
反应对应曲线
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
再看乙的最优反应,记为q*=R(r): 观察π乙(p甲, p乙)= 2q(2r-1)-(2r-1)
若r 1 / 2 2r 1 0, q越大越好 1, q* R( r ) [0,1], 若r 1 / 2 2r 1 0,无论q选什么都无影响 0, 若r 1 / 2 2r 1 0, q越小越好
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
先看甲的最优反应,记为r*=R(q): 观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0,无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
解:Max π甲(p甲, p乙) r Max π乙(p甲, p乙) q
f.o.c. 2r-1=0
r*=1/2
混合策略纳什均衡是甲在策略空间{红,黑}上以概率分布 p甲*= (1/2,1/2)进行选择,乙也在策略空间{红,黑}上以概率p乙*= (1/2,1/2)进行选择
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、支付最大化法
例:扑克牌对色游戏(p77)
无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q(-1)+(1-q) 1]+ (1-r)[q1+(1-q)(-1)] = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r1+(1-r)(-1)]+ (1-q)[r(-1)+(1-r)1] =2q(2r-1)-(2r-1) f.o.c. 1-2q=0 q*=1/2
混合策略纳什均衡
03 混合策略纳什均衡的证明 方法
反证法
总结词
通过假设不成立来证明均衡的存在。
详细描述
反证法是一种常用的证明方法,它首先假设与结论相反的命题成立,然后通过逻辑推理和数学推导,得出矛盾的 结论,从而证明原命题的正确性。在证明混合策略纳什均衡的存在时,反证法可以用来证明当其他玩家采取了最 优策略时,某个玩家采取混合策略能够达到最优结果。
唯一性意味着在给定对手策略的情况下,每个参与者都只有一个最优反应,从而 避免了复杂的策略互动和不确定性。
存在性
混合策略纳什均衡的存在性是指在某 些博弈中,至少存在一个策略组合, 使得每个参与者在给定其他参与者策 略的情况下,采用混合策略是最优的 。
存在性通常通过数学证明和计算机搜 索等方法来证明,但并不是所有博弈 都有混合策略纳什均衡。
混合策略纳什均衡
目录
CONTENTS
• 混合策略纳什均衡的定义 • 混合策略纳什均衡的特性 • 混合策略纳什均衡的证明方法 • 混合策略纳什均衡的应用场景 • 混合策略纳什均衡的局限性 • 混合策略纳什均衡的发展前景
01 混合策略纳什均衡的定义
定义
混合策略纳什均衡是一种博弈论中的均衡概念,它描述了在 给定对手策略的情况下,参与者如何选择最优策略以最大化 自己的期望收益。
代数法是一种通过数学符号和公式进行推 理和证明的方法。在证明混合策略纳什均 衡的存在时,代数法可以用来推导和证明 纳什均衡的条件和性质,利用代数性质和 技巧来证明均衡的存在。
04 混合策略纳什均衡的应用 场景
经济学
竞争策略分析
混合策略纳什均衡在经济学中被用于分析竞 争策略,特别是在不完全竞争市场和寡头垄 断市场中。通过混合策略纳什均衡,可以研 究企业在不确定环境下的最优反应,以及企 业如何通过调整其策略来应对竞争对手的行 为。
混合策略纳什均衡
田忌的谋士孙膑了解了田忌的困境
后,就打听到这样一个消息:尽管齐威
王的上、中、下三匹马都要比田忌的对
应上、中、下三匹马好,但碰巧的是田
忌的上马可胜齐威王的中马,田忌的中
马可胜齐威王的下马。于是,孙膑为田
忌献计:下一次比赛中第一局时田忌出
下马对齐威王的上马输一局,第二局田
忌出上马对齐威王的中马,第三局田忌
9
对于大企业,因一旦偷税就数目巨大,所 以,税务部门在随机检查时放在大企业上的可 能性就大一些;而给定税务部门检查大企业的 可能性较大,大企业偷漏税的行为就较少,否 则就容易被逮个正着。所以,偷漏税较多的就 是一些中小企业,大企业纳税的积极性较高。 同样的道理,在犯罪或对错误的监督惩罚博弈 中,也是混合博弈,人们可能总是大错不犯小 错不断。
15
混合策略均衡
◆混合策略定义:在n人博弈的策略式表述G S1,, Sn;u1,,un 中,假定参与人 i 有K个纯策略:Si Si1,, SiK ,那么,概率
分布 pi pi1,, piK 称为参与人 i 的一个混合策略,这里
pik p(sik ) 是参与人 i 选择sik 的概率,对于所有
14
混合策略均衡
◆纯策略与纯策略纳什均衡 ➢ 纯策略:肯定会被选择——以100%的概率——被
选择的策略。
➢ 纯策略纳什均衡:各个参与人都选择纯策略的纳 什均衡。
◆混合策略与混合策略纳什均衡
➢ 混合策略:以一定的概率分布选择某几个行动的 策略。
➢ 混合策略纳什均衡:由参与人的混合策略构成的 纳什均衡。
当田忌出下、上、中马时,他仍然按上、中、
下马出,当然要输了。事实上,当田忌出下马
时,齐威王应出下马,但齐威王出下马时,田
混合策略纳什均衡
混合策略纳什均衡混合策略纳什均衡是博弈论中一个重要的概念。
纳什均衡是指在一个博弈中,每个参与者都选择了最优的策略,而且即使其他参与者知道其他参与者的策略,他们也无法从自己的策略中获得更大的利益。
而混合策略则是指参与者通过随机化选择不同策略的概率来达到最优策略。
本文将深入探讨混合策略纳什均衡的概念、特点以及计算方法。
首先,混合策略纳什均衡是指参与者通过一定概率选择不同策略的方式达到最优策略。
在混合策略中,每个参与者都拥有一个策略概率分布,表示他们在不同策略下的选择概率。
这样,在博弈中,每个参与者将根据其策略概率分布中的概率随机选择其中一种策略。
对于每个参与者而言,他们的目标是通过选择最优的策略概率分布来最大化自己的期望收益或最小化自己的期望损失。
其次,混合策略纳什均衡与纳什均衡相比具有以下特点。
首先,混合策略纳什均衡可以推翻完全信息博弈中的固定策略均衡结果。
在完全信息博弈中,参与者可以根据对其他参与者策略的了解来做出精确决策,因此均衡状态是唯一确定的。
而在混合策略博弈中,由于参与者通过概率选择不同策略,他们无法准确地预测其他参与者的策略,因此均衡状态不再是唯一确定的。
其次,混合策略纳什均衡可以引入不确定性,增加博弈的复杂性。
参与者无法准确地预测其他参与者的策略,因此他们需要通过一定的概率选择策略来平衡风险与收益。
最后,混合策略纳什均衡可以通过均衡态的共同选择来实现长期的稳定状态。
在混合策略纳什均衡中,参与者通过随机化选择策略,从而消除了其他参与者可以预测自己策略的可能性,增加了稳定性。
最后,计算混合策略纳什均衡的方法主要有以下两种。
一种是通过计算参与者的最优策略概率分布来确定混合策略纳什均衡。
这种方法主要基于线性规划技术,通过最大化或最小化参与者的期望收益或损失来确定最优的策略概率分布。
另一种方法是通过迭代算法来求解混合策略纳什均衡。
这种方法主要是通过反复更新参与者的策略概率分布,直到达到均衡状态。
混合策略纳什均衡
6.反应函数法 进行博弈分析的目的是为了最终找到博弈的均衡解,下面先
说一种反应函数法: 武大郎走后,猪八戒强烈要求孙悟空去化斋。孙悟空却
要求猪八戒去,最后,两人决定由猜枚的方法来决定由谁去: 两人各准备一个黑箱,黑箱中由两人放入不同数目的黑白棋 子,然后两人从对方的箱子中摸出一枚棋子,如果两枚棋子 的颜色一样,则孙悟空去化斋;不一样,则由猪八戒去。 那么,两人会将自己黑箱中的黑白子的比例设定为多少?
但孙悟空的付钱方法也非同常人,孙悟空也变出一个黑箱, 放了3张10元人民币和7张2元人民币进去,让武大郎从中摸
4.混合策略
一张钞票作为交易的报酬,武大郎会答应这样的付钱方法吗?
武大郎的期望支付:10×0.3+2×0.7=4.2(元) 很明显,作为一个精明的生意人,武大郎是不会同意的。 下面从支付矩阵的角度来讨论为什么武大郎不会同意:
用Si表示,Si={si1, si2, …,sin},其中sik(k=1,2
…n)表示一个策略。
纳什均衡是满足一定条件的,n个局中人的策略组合。
3.支
付:局中人参与博弈能得到的利益,用u表示,符号 ui(s1j,…,sik,…,snm),表示n个局中人分别
采用策略s1j,…,sik,…,snm时第i个局中人的支付。
4.混合策略
孙悟空
10(0.3) 饼8(0.5) 2(0.7)
8
8
武 大 郎
水4(0.5)
10
4
2
4
10
2
武大郎的期望支付:10×0.5×0.3+ 2×0.5×0.7 + 10×0.5×0.3 + 2×0.5×0.7=4.2(元) 孙悟空的期望支付:8×0.5×0.3+ 8×0.5×0.7 + 4×0.5×0.3 + 4×0.5×0.7=6(元)
混合策略纳什均衡计算方法(一)
混合策略纳什均衡计算方法(一)混合策略纳什均衡计算方法什么是混合策略纳什均衡混合策略纳什均衡是博弈论中的一个概念,指的是每个玩家都选择一定的概率来执行每一个可行的行动。
这样,游戏的结果不再是唯一的,而是有一定的概率分布。
如何计算混合策略纳什均衡计算混合策略纳什均衡需要用到线性规划的方法,具体步骤如下:1.确定每个玩家的策略空间,即每个玩家可选的所有策略。
2.建立概率分布矩阵,即每个玩家选择每个策略的概率。
3.利用概率分布矩阵和游戏的收益矩阵计算出每个玩家的期望收益。
4.建立线性规划模型来最大化每个玩家的期望收益。
5.求解线性规划模型得到混合策略纳什均衡。
混合策略纳什均衡的应用混合策略纳什均衡在实际应用中有广泛的应用。
比如在围棋、国际象棋等棋类游戏中,人类选手常常会使用混合策略来应对对手的不确定性。
同时,在市场竞争、拍卖、投资等领域,混合策略也可以用来帮助决策者做出最优的决策。
总结混合策略纳什均衡是博弈论中的重要概念,在实际应用中具有广泛的应用前景。
计算混合策略纳什均衡需要用到线性规划的方法,但具体计算步骤并不复杂。
我们可以通过深入理解和应用混合策略纳什均衡,来帮助我们更好地应对不确定性和竞争。
混合策略纳什均衡的优势混合策略纳什均衡作为一种考虑不确定性的策略,相较于确定性策略有以下优势:1.能够应对对手的随机性,减小被对手利用的风险;2.能够在一定程度上改变游戏的结果分布,增加自己的收益,同时降低失败的风险。
混合策略纳什均衡的局限性尽管混合策略纳什均衡具有很多优点,但是也存在以下局限性:1.混合策略需要玩家具有一定的判断力和计算能力,否则可能难以计算出最优解;2.没有一个确定的策略来保证获胜,更多地要依靠概率和运气;3.当游戏中有多个混合策略纳什均衡时,玩家可能难以选择最优的策略。
结语混合策略纳什均衡是一个重要的博弈论概念,应用范围广泛。
尽管混合策略存在一些局限性,但是这并不妨碍我们充分应用这一理论来帮助我们在不确定性和竞争中取得更好的结果。
4.混合战略纳什均衡
vJ (1,0; ,1 ) 0.9 0.2(1 )
vJ (0,1; ,1 ) 0.3 0.6(1 )
由
vJ (0,1; ,1 ) vJ (1,0; ,1 )
得: 同理得: 0.4 0.3
问题:
例4、监督博弈——税收
监督博弈是猜谜博弈的变种,它概括了诸如税收检查、 质量检查、惩罚犯罪、顾主监督雇员等;这里以税收为例进 纳税人 行讨论。 支付矩阵 逃税 不逃税 参与人 纯战略 税 检查 a-C+F , -a-F a-C , -a 税收机关 检查,不检查 收 机 不检查 0, 0 a , -a 纳税人 逃税,不逃税 关 右表概括了对应不同纯战略组合的支付矩阵,其中,a是 应纳税款;C是检查成本;F是罚款,假定C<a+F。 用 代表税收机关检查的概率, 代表纳税人逃税的 概率。给定 ,税收机关选择检查( =1)和不检查 ( =0)的期望收益分别为:………….. 给定 ,………… a C * , * 混合战略纳什均衡为:
aF aF
税收讨论:
一、监督博弈的纳什均衡与应纳税款a、对逃税的惩罚F、 以及检查成本C有关。 二、逃税者可制造虚假逃税信息,浪费查税人的资源。 类似的有战争中发射真假弹的问题。 三、有的博弈只有混合战略纳什均衡,但有的既有纯战 略又有混合战略纳什均衡,如性别战博弈。 四、奇数定理:几乎所有有限博弈都有有限奇数个纳什 均衡。
vG ( G , L ) [3 (1)(1 )] (1 )[ 0(1 )]
vG 效用最大化条件: 5 1 0
(5 1)
同理,流浪汉的期望效用函数: vL ( G , L ) 3 2 效用最大化条件为: vL 1 2 0 * 故: * 0.5 0.2
混合策略均衡计算方法
混合策略均衡计算方法
纯战略纳什均衡最简单的方法是划线法,先固定一个然后另一收益大就在下面划线,再固定另一个收益对另外一个量划线,最后两个都有线的就是纯战略纳什均衡,混合战略纳什均衡要计算,但是一个有限博弈的纯战略纳什均衡和混合战略纳什均衡个数之和一定是奇数,如果你求出的纯战略纳什均衡有偶数个,那么一定有另外一个混合战略纳什均衡。
混合策略纳什均衡:在n个参与人的博弈G={S1 ,... Sn ; u1 ,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:
也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。
混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。
混合战略纳什均衡原理
严格占优策略均衡、重复剔除的占优策略均衡、纯策略纳什均衡和混合策略纳什均衡。
一般将上述四种均衡统称为纳什均衡。
在这四种均衡概念中每种均衡依次是前一种均衡的扩展。
前一种均衡是后一种均衡的特例。
严格占优策略均衡是重复剔除的占优策略均衡的特例;重复剔除的占优策略均衡是纯策略纳什均衡的特例;纯策略纳什均衡是混合策略纳什均衡的特例。
如果将完全信息静态博弈中存在某种均衡的所有博弈定义为一个集合,那么就存在前一种均
衡的博弈集合是后一种均衡的博弈集合的子集。
混合策略纳什均衡
0
小偷
1 偷的概率
-D
- D’
加重对守卫的处罚:短期中的效果是使守卫尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概率
.
(*,r*)( S , P )
DSVP
小偷 偷不偷
守卫 睡 不睡 V,-D -P,0 0,S 0,0
小偷 得益(偷)
0
-P
V
守卫
1 睡的概率
- P’
加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会使得守卫更多的偷懒睡觉
p
1
1, 当p 1/ 2
q [0,1],当p 1/ 2
1/2
0, 当p 1/ 2
0
1q
p 1
(P*,q*)(1/2,1/2)
1/2
纳什均衡是:A和B出红牌还
是出黑牌的概率都是1/2.
0
反应函数法
1/2
1 q.
练习1:利用反应函数法找出政府与流浪汉博弈
政府 救济 不救济
丽娟 足球
芭蕾
妻子的混合策略
大海 足球 2 , 1 0 , 0 芭蕾 0 , 0 1 , 2
p w (F ) 2 p w (B ) 0 p w (F ) 0 p w (B ) 1
丈夫的混合策略
p h ( F ) 1 p h ( B ) 0 p h ( F ) 0 p h ( B ) 2
i(P i*,P * i)i(P i,P * i)对于每一个 Pi i 都成立,则称
混合策略组合 P *(P 1 *,,P i*,,P n *) 是这个博弈的一个纳什 均衡。
注意:在纳什均衡下,没有参与人有积极性单独偏离或改 变该策略或策略组合。
.
混合策略纳什均衡
友军博弈
英 国 支持巴顿 支持蒙帅 支持巴顿 4,3 2,2 美国 1,1 3,4 支持蒙帅
友军博弈特征
两个(多个)纳什均衡 问题:博弈的最终结果?
第三章 混合策略纳什均衡
第三节 多重纳什均衡的选择 标准
第三节 多重纳什均衡的选择标准
一、帕累托优势标准:得益更大 (一)案例:战争与和平 C国 鹰战略 鸽战 略 -5,-5 8,-10 鹰战略 -10,8 10,10 A国 鸽战略
混合策略
小偷的混合策略 以p的概率偷,(p,1-p) 守卫的混合策略 以q的概率睡(q,1-q)
第一节 混合策略与期望支付
一、混合策略 (二)混合策略 2.相对概念:纯策略 每个参与人的非随机性选择 纯粹行动计划,p=100%,1-p=0
第一节 混合策略与期望支付
一、混合策略 (二)混合策略 3.数学刻画 给定博弈G={S1,…,Sn;u1,…,un}以及参 与人i的纯策略Si= {si1,…,sik} 概率分布pi=(pi1,…,pik)为混合策略 其中:0≤ pik ≤1,∑ pik=1, pik=p( sik ) 混合策略组合p=(p1,…,pi,…pn)
第三节 多重纳什均衡的选择标准
一、帕累托优势标准:得益更大 (二)纳什均衡的选择标准 帕累托优势标准 按照支付大小筛选纳什均衡
-5,-5 -10,8 8,-10 10,10
第三节多重纳什均衡的选择标准
二、风险优势标准:风险更小? (一)案例:串通作弊博弈 帕累托优 学生乙 势? 作弊 不作弊 作弊 9,9 0,8 学生甲 8,0 7,7 不作弊
第一节 混合策略与期望支付
二、期望支付 (二)数学刻画
1 ( p, q ) pi q j aij
混合策略纳什均衡
目录[隐藏]1 什么是混合策略纳什均衡2 解混合策略纳什均衡的方法3 混合策略纳什均衡的经典博弈——猜谜博弈[1]4 混合策略纳什均衡博弈与其他均衡的关系[1]5 参考文献[编辑][编辑][编辑]混合策略纳什均衡混合策略纳什均衡(Mixed Strategy Nash Equilibrium )什么是混合策略纳什均衡混合策略纳什均衡:在n 个参与人的博弈G={S 1 ,... S n ; u 1,...u n }中,混合策略组合构成一个纳什均衡,如果对于所有的i =1,2...,n 下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。
混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。
解混合策略纳什均衡的方法1、最大化支付法:即最大化各个参与人的效用函数。
2、支付相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略支付相等,构成方程组求解。
混合策略纳什均衡的经典博弈——猜谜博弈[1]两个局中人A 、B 手里各拿一枚硬币,每人可以选择正面向上或反面向上,然后同时亮出,如果两枚硬币正反面相同,B 付给A1元钱,如果两枚硬币正反面不相同,A 付给B1元钱。
在这种情况下,局中人A 、B 如何选择呢?下图给出这个博弈的双变量收益矩阵。
这是一个两人零和博弈,在每一个结局中一方所得即为另一方所失,即两个局中人的收益之和恰好等于零。
在双变量收益矩阵中采用画线的方法,在这个博弈中找不到纯策略纳什均衡。
那么,猜谜博弈是否存在混合策略纳什均衡呢?1950年纳什证明了任何有限博弈都至少存在一个纳什均衡(包括纯策略纳什均衡和混合策略纳什均衡)。
混合策略纳什均衡
混合策略纳什均衡简介混合策略纳什均衡是博弈论中的一个重要概念,用于描述多方参与的博弈情境中,每个参与者按照一定的概率分布选择不同的策略,使得任何人无法通过改变自己的策略来获得更好的结果。
在这种均衡状态下,每个参与者的预期收益最大化。
混合策略在传统的博弈理论中,参与者通常会选择一个确定性的策略来对抗其他参与者。
然而,在现实生活中,我们经常遇到的情况是,每个参与者都存在一定的不确定性和随机性,犹豫在不同的策略之间选择。
这时,混合策略就应运而生了。
混合策略是指参与者以一定的概率分布选择不同的策略来进行博弈。
例如,在一个石头剪刀布的游戏中,参与者可以以1/3的概率选择石头,1/3的概率选择剪刀,1/3的概率选择布。
这样的不确定性选择使得博弈更具有变数和策略性。
纳什均衡纳什均衡是由约翰·福布斯·纳什在20世纪50年代提出的一个概念,用于描述博弈理论中的均衡状态。
在纳什均衡中,每个参与者选择的策略都是最优的,即在其他参与者选择的策略下,自己无法通过改变策略来获得更好的收益。
通常情况下,纳什均衡是以确定性策略为基础进行定义的。
但是当参与者选择混合策略时,纳什均衡也可以被定义为每个参与者选择混合策略的概率分布,使得任何人都无法通过改变自己的概率分布来获得更高的收益。
混合策略纳什均衡的计算方法计算混合策略纳什均衡的方法主要是通过解析求解和数值求解两种方式。
解析求解解析求解是一种通过代数和数学推导的方式来找到混合策略纳什均衡的方法。
通过建立参与者的效用函数和概率分布函数等数学模型,应用最优化理论和微积分等数学工具,可以得到参与者的最优混合策略。
然而,解析求解的方法通常只适用于简单的博弈情境,并且求解过程繁琐复杂。
数值求解数值求解是一种通过计算机模拟和迭代计算的方式来找到混合策略纳什均衡的方法。
通过构建博弈模型,设定参与者的初始混合策略,然后通过迭代计算,逐渐优化参与者的混合策略,直到收敛到纳什均衡。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
流浪汉 寻找工作 流浪
救济 政府
不救济
2 3,
1 -1,
3 -1,
0 0,
虽这模型没有PNE,却有下述的MNE:参与人以一定的概率选择某种 策略,然后计算相应于不同概率的期望效用。
2020/6/17
9
设:政府救济的概率θ=1/2 ; 不救济的概率1-θ=1/2。 流浪汉寻找工作的期望效用: 1/2×2+1/2 ×1=1.5 流浪的期望效用: 1/2×3+1/2 ×0=1.5
✓ 每个参与人都想猜透对方的策略,而每个 参与人又不愿意让对方猜透自己的策略。
这种博弈的类型是什么?如何找到均衡?
2020/6/17
3
2. 混合策略、混合策略博弈和混合策略纳什均衡
• 策略:
– 参与人在给定信息集的情况下选择行动的规则,它规定参与人在 什么情况下选择什么行动,是参与人的“相机行动方案”。
E1(正面)=(-1)×r+1×(1-r)=1-2r 参与人1选取反面的期望效用为
E1(反面)=1×r+(-1)×(1-r)=2r-1
2020/6/17
15
参与人1的期望效用为 E1= E1(正面)×q + E1(反面)×(1- q ) =(1-2r)(2q-1)
类似地,得到参与人2的期望效用为
E2= E2(正面)×r + E2(反面)×(1- r ) =(1-2q)(2r-1)
参与人2
正面
反面
参与人1
正面 反面
-1, 1 1,-1
1,-1 -1, 1
由划线法可知,该博弈不存在纳什均衡。 所以采取纯策略不存在稳定的纳什均衡解。
2020/6/17
2
上述博弈的特征是:
✓ 在这类博弈中,不存在纯策略纳什均衡。
✓ 参与人的支付取决于其他参与人的策略; 以某种概率分布随机地选择不同的行动。
• 这样,我们得到一个混合策略组合,每一个参与人的混合策略都是给 定对方混合策略是的最优选择,从而构成混合策略纳什均衡。
策略 期望收益 政府 (0.5, 0.5) -0.2 流浪汉 (0.2, 0.8) 1.5
2020/6/17
11
既然参与人在构成混合策略时选择不同纯策略之间是无差异的,他 为什么不选择一个特定的纯策略而要以特定的概率随机地选择不同的纯 策略呢?一个参与人选择混合策略目的是给其他参与人造成不确定性。
2020/6/17
23
混合策略反应函数
猜硬币博弈
r
1
rR1(q)
1/2
qR2(r)
1/2
1
盖
硬 正面
币 方
反面
猜硬币方
正面
反面
-1, 1 1, -1
1, -1 -1, 1
(r,1-r):盖硬币方选择正反面 的混合策略概率分布
(q,1-q):猜硬币方选择正反面 q 的混合策略概率分布
2020/6/17
寻找工作γ
救济θ 3 , 2 不救济1-θ -1 , 1
游荡1-γ
-1 , 3
0, 0
• 此时,流浪汉选择任何混合策略的期望效用都是1.5,则流浪汉的任 何一种策略(纯的γ=1或γ=0或混合的0<γ<1)都是政府所选择的混合策
略的最优反应。
2020/6/17
10
而当
γ=0.2 游荡
1-γ=0.8 寻找工作
4.2 混合策略纳什均衡的求解
➢ 支付最大化法 ➢ 支付等值法 ➢ 最优反应函数法
2020/6/17
13
1. 支付最大化法求纳什均衡——猜硬币博弈
参与人1的混合策略为σ1=(q, 1-q)(分别以概率q和1-q选择正面 和反面) ,
参与人2的混合策略为σ2=(r, 1-r) (分别以概率r和1-r选择正面
– 纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的 最优选择。因此在社会福利博弈中,γ*= 0.2 ,θ*= 0.5 是唯一的 混合策略纳什均衡。
2020/6/17
18
2. 支付等值法求纳什均衡
由上面的例子可以看出,参与人选择的混合策略均使对方选 择纯策略的期望效用相等,促使各方均采取严格策合策略。 所以求解混合策略纳什均衡也可以采取如下方法:
由一阶条件:E1 2(12r)0, E2 2(12q)0
q
r
r1, q1
2
2
1 *(1 2,1 2)和 2*(1 2,1 2)分 别 是 参 与 人 1 和 参 与 人 2 的
混 合 纳 什 均 衡 策 略 , (1 *,2 *)为 猜 币 博 弈 的 纳 什 均 衡 。
2020/6/17
16
社会福利博弈
成立,且 pi1Lpik 1
– 纯策略可以理解为混合策略的特例,即在诸多策略中,选择该纯 策略的概率为1,选其他纯策略的概率为0.
– 为何参与人可能会选择带不确定性的混合策略而放弃确定性的纯 策略?
• 参与人主观因素造成的犹豫不决 • 外在客观因素的不确定性带来应对策略的不确定性 • 迷惑对手:为了让其它参与人不能清楚了解自己的选择
• 纯策略:
– 如果一个策略规定参与人在每一个给定的信息情况下只选择一种 特定的行动,称为纯策略,简称“策略” ,即参与人在其策略空 间中选取唯一确定的策略。
• 混合策略:
– 如果一个策略规定参与人在给定的信息情况下以某种概率分布随 机地选择不同的行动,称为混合策略。参与人采取的不是明确唯 一的策略,而是其策略空间上的一种概率分布。
流浪汉
工作γ 流浪1- γ
救济θ
2
政
3,
府 不救济
1
1- θ -1,
3 -1,
0 0,
假 定 政 府 的 混 合 策 略 是 G ( ,1 ); 流 浪 汉 的 混 合 策 略 是 L ( ,1 )。 政府的期望效用函数为: v ( G , L ) (3 ( 1)(1 )
( s 1 j 1 ,s 2 j2 L ,s n jn ) S i { s i1 ,L ,s im i) –参与人的支付为 ui(s1j1,s2j2L,snjn)
–发生此情况的概率为 p1j1p2j2L pnjn
• 参与人的期望效用:
m 1 m 2 m n
E i(p ) L p 1j1p 2j2Lp n jnu i(s1j1,s2j2L,sn jn) j1 1j2 1 jn 1
如果一个混合策略(而不是纯策略) 府 不救济 -1,1 0, 0
是政府的最优选择,一定意味着政
府在救济与不救济之间是无差异的
41 = 0.2
2020/6/17
21
3. 最优反应函数法求纳什均衡
• 在讨论连续纯策略均衡时(如古诺模型),我们使用了反应 函数的概念。
• 现在我们可以使用反应对应的概念来描述一个参与人对应 于其他参与人混合策略的最优选择。
– 如果流浪汉寻找工作的概率小于0.2,政府的最优选择是不救济; 如果流浪汉寻找工作的概ቤተ መጻሕፍቲ ባይዱ大于0.2,政府的最优选择是救济 。
• 对 θ*= 0.5 的解释:
– 如果政府救济的概率大于0.5,流浪汉的最优选择是流浪;如果 政府救济的概率小于0.5,流浪汉的最优选择是寻找工作。
• 混合策略纳什均衡的含义:
2020/6/17
5
• 混合策略扩展博弈:
博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就 是原博弈的“混合策略扩展博弈”。
• 混合策略纳什均衡(MNE):
由最优的混合策略构成的混合策略组合:
*(*,*,,*)
12
n
即 , 如 果 对 于 所 有 的i1, 2, L, n, 有
ui(i*, *i)ui(i, *i), i Si
得r 1 2
类似地,令参与人2的纯战略期望效用相等得:q 1 2
2020/6/17
20
社会福利博弈
假定最优混合策略存在,给定流浪汉选择混合策略
(,1)
政府选择纯策略救济的期望效用为:
3 ( 1 )1 ( ) 4 1
流浪汉
选择纯策略不救济的效用为:
1 0(1)
政 救济
寻找工作 流浪
3, 2 -1, 3
• 混合策略均衡:反应对应(reaction correspondence) 在混合策略的范围内,博弈方的决策内容为选择概率分布, 最优反应函数就是一方对另一方的概率分布的反应。由于纯 策略可以理解为混合策略,因此实际上最优反应函数的概念, 也可以在混合策略概率分布之间反应的意义上统一起来。混 合战略纳什均衡也是反应函数的交叉点。
(1 )( 0 (1 )
(5 1) 求微分,得到政府最优化的一阶条件:
vG 5 1 0 故 * 0 .2
即:流浪汉以0.2的概率选择寻找工作,0.8的概率选择流浪。
同理可以根据流浪汉的期望效用函数找到政府的最优混合策略。
2020/6/17
17
• 对γ*= 0.2 的解释:
2020/6/17
4
• 混合策略 vs.纯策略 (不确定性 vs.确定性)
– 在博弈G{S1,Sn;u1,un}中,博弈方i的策略空间Si {si1,sik}, 则博弈方i以概率分布pi (pi1,L,pik)随机在其 k个可选策略中选
择的“策略”,称为一个“混合策略”,0其中pij 1对 j 1,,k都
寻找工作γ
游荡1-γ
救济θ 3 , 2 -1 , 3
救 济 : 30.210.80.2 不救济1-θ -1 , 1 0 , 0
不 救 济 : 10.200.80.2
• 如果流浪汉选择这个混合策略,政府的任何策略(混合的或纯的)带给 政府的期望效用为-0.2。特别的,以1/2的概率分别选择救济和不救济 当然也是政府对于流浪汉所选择的混合策略的最有反应。