混合策略纳什均衡

合集下载

混合策略纳什均衡

02
混合策略纳什均衡的基本理论
纳什均衡的定义与性质
纳什均衡的定义
在博弈中，如果每个玩家都采取自己的最优策略，那么整个博弈会达到一种均衡状态，即所有参与者的利益达到最大化。
纳什均衡的性质
纳什均衡是一种自我稳定的状态，即使受到外部干扰，也会迅速恢复到原始状态。此外，纳什均衡也是最优的，因为它使得每个参与者的利益都达到最大化。
其次，现有的研究往往只关注特定的博弈模型，对于更一般化的博弈模型，尤其是对于连续型博弈和多阶段博弈的研究还比较缺乏。
首先，混合策略纳什均衡的概念和性质仍需进一步深化和研究。例如，对于非完全信息博弈，如何准确地刻画混合策略纳什均衡点的数量和分布等问题仍需探索。
最后，现有的研究主要集中在理论层面，对于如何将混合策略纳什均衡应用到实际问题中，如何设计和制定有效的混合策略等问题还需要进一步探讨。
未来研究方向与挑战
未来研究可以进一步拓展混合策略纳什均衡的应用领域，例如在经济学、政治学、社会学等领域的应用。
另外，针对现有的研究不足，未来研究可以深入探索混合策略纳什均衡的性质和计算方法，以及如何设计和制定有效的混合策略等问题。
此外，未来的研究还可以进一步拓展混合策略纳什均衡的理论框架，例如在多阶段博弈、不完全信息博弈、非线性博弈等领域的研究。
略纳什均衡来分析。
在生物学领域的应用
在生物学中，混合策略纳什均衡可以用来研究生物种群的进化稳定性和生态平衡。
在生态系统中，生物种群可以通过选择不同的繁殖、迁徙、捕食等策略来适应环境变化，这种博弈关系可以通过混合策略纳什均衡来分析。
在其他领域的应用
在社会学中，混合策略纳什均衡可以用来研究社会群体中的合作与竞争关系。

混合策略纳什均衡例子

混合策略纳什均衡例子混合策略纳什均衡是博弈论中的一个重要概念，指的是各参与者选择一个概率分布作为他们的策略，从而达到一个稳定的状态。

在混合策略纳什均衡中，没有任何参与者可以通过单独改变自己的策略来获得更好的结果。

一个经典的混合策略纳什均衡的例子是“岩石-剪刀-布”游戏。

在这个游戏中，两个参与者（称为玩家1和玩家2）可以选择出岩石、剪刀或布中的任意一种。

每一种选择都有一定的胜负规则：岩石胜剪刀，剪刀胜布，布胜岩石。

假设玩家1选择出岩石、剪刀和布的概率分别为p1、q1和r1，玩家2选择出岩石、剪刀和布的概率分别为p2、q2和r2。

两个玩家的利益可以用一个支付矩阵表示如下：| 岩石 | 剪刀 | 布-----------------------------岩石 | 0 | -1 | 1-----------------------------剪刀 | 1 | 0 | -1-----------------------------布 | -1 | 1 | 0在混合策略纳什均衡中，每个玩家选择的概率分布必须使得对于每一种选择，玩家都不希望改变自己的概率分布。

在这个例子中，我们可以通过计算来找到混合策略纳什均衡。

假设玩家1选择出岩石的概率为p1，则选择剪刀的概率为q1=1-p1-0=1-p1，选择布的概率为r1=0-0=0。

同样地，玩家2选择出岩石的概率为p2，则选择剪刀的概率为q2=1-p2-0=1-p2，选择布的概率为r2=0-0=0。

为了找到混合策略纳什均衡，我们需要检查每一种选择，并确保玩家对于每一种选择都不希望改变自己的概率分布。

在这个例子中，无论玩家1选择什么概率分布，玩家2都可以通过选择相应的概率分布来获得更好的结果。

所以，不存在一个混合策略纳什均衡。

总结起来，混合策略纳什均衡是博弈论中一种稳定的策略选择状态，即不存在任何参与者可以通过单独改变自己的策略来获得更好的结果。

岩石-剪刀-布游戏是一个经典的混合策略纳什均衡的例子，其中玩家的选择概率分布是关键因素。

博弈论-混合策略纳什均衡

，以达到均衡状态。
政治学的案例分析
总结词：国际关系
详细描述：在国际关系中，混合策略纳什均衡可以用来解释国家之间的竞争和合作。例如，两个国家可能会以一定的概率选择不同的外交政策，例如结盟、中立或对抗，以达到各自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中，混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如，捕食者可能会采用追逐和放弃两种策略来捕猎猎物，而猎物也可能会采用逃跑和装死两种策略来避免被捕食。最终，捕食者和猎物都以一定的概率随机选择不同的策略，以达到均衡
非合作博弈论
研究个体如何在不知道其他个体如何行动的情况下做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体，可以是个人、组织或国
家。
行动
参与者根据给定的信息所做出的决策。
信息
参与者在进行决策时所拥有的数据、情报或知
识。
策略
参与者为达到最优结果而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词：繁殖竞争
VS
详细描述：在生物种群中，不同个体之间会存在繁殖竞争。为了最大化自己的遗传贡献，个体可能会采用不同的交配策略，例如追求高繁殖成功率的策略或避免过度竞争的策略。混合策略纳什均衡可以用来描述这种竞争状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中，生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分析繁殖过程的均衡结果，解释生物多样性的形成机制。
05 混合策略纳什均衡的案例分析
经济学的案例分析

博弈论混合策略纳什均衡名词解释

博弈论混合策略纳什均衡名词解释博弈论混合策略纳什均衡是指在博弈论中，当参与者不能确定选
择某一个策略时，采取混合策略的情况下达到的均衡状态。

具体来说，混合策略是指在一个博弈中，参与者以一定的概率选
择不同的纯策略。

而纳什均衡是指在一个博弈中，参与者无法通过单
独改变自己的选择来获得更好的结果，即不存在任何参与者可以通过
改变自己的策略来让其他参与者不再选择当前策略。

混合策略纳什均衡是指游戏中所有参与者以一定的概率选择不同
的纯策略，并且这种概率分配对于所有参与者都是最优的。

也就是说，在混合策略纳什均衡下，参与者没有更好的选择可供其采取，而其他
参与者也没有更好的概率分配可供其选择。

拓展：
在博弈论中，还有许多其他类型的均衡概念，例如纯策略纳什均衡、帕累托均衡、部分均衡等等。

纯策略纳什均衡是指游戏中参与者
以确定性的纯策略进行选择，使得没有参与者可以通过改变其策略来
获得更好的结果。

帕累托均衡是指在一个博弈中，不存在可以改善任
何一个参与者的情况。

部分均衡是指只有某些参与者达到均衡状态，而其他参与者未达到均衡状态。

博弈论是研究决策制定者在相互影响下进行决策的数学工具。

通过分析不同的博弈策略和可能的结果，博弈论可以帮助我们理解冲突和合作的情况，并提供一些决策建议。

第三讲_混合策略纳什均衡

混合策略
◆混合策略定义：在n人博弈的策略式表述 G S1, , Sn ; u1, , un Si Si1, , SiK ，那么，概率中，假定参与人 i 有K个纯策略：分布 pi pi1 , , piK 称为 i 的一个混合策略，这里
pik p(sik ) 是 i 选择 sik 的概率，对于所有
这个故事曾经被很多人当作博弈论的例子来演绎，但实际上这个故事与博弈论无关。博弈论会假定所有局中人都是理性的，不能假定一些局中人聪明而另一些局中人却是傻子。当田忌出下马时，齐威王最好的选择是出下马而不是上马。孙膑的计谋中假定齐威王是傻子，当田忌出下、上、中马时，他仍然按上、中、下马出，当然要输了。事实上，当田忌出下马时，齐威王应出下马，但齐威王出下马时，田忌不应出下马而是出中马，但此时齐威王又应出中马而不是下马了，……。这样，博弈不会有纯战略的均衡。

-2，3
2，2
假定老板选择混合战略（0.2，0.8) 工人选择“偷懒”期望支付为(-1)×0.2+3×0.8=2.2 工人选择“不偷懒”（期望）支付为2×0.2+2×0.8=2 工人应选择“偷懒” 老板选择“监督” “不偷懒’……

假定老板选择混合战略（0.5， 0.5) 工人选择“偷懒”期望支付 0.5 为 (-1)×0.5+3×0.5=1 工人选择“不偷懒”期望支 0.5 付为2×0.5+2×0.5=2 工人应选择“不偷懒” 老板选择“不监督” 工人选择“偷懒’……
由 VA =VB 可得：q=0.8 博弈方2：
VB =3q (1 q)
博弈方 1
A B
VC =3 p (1 p)
VD =2 p 5(1 p)

混合策略纳什均衡

(红 ) r 1 1/2 0 1/2 1 q （红）
博弈论第三章混合策略纳什均衡
r*=R(q)
反应对应曲线
第二节混合策略纳什均衡的求解方法
二、反应对应法
例：扑克牌对色游戏(p77)
再看乙的最优反应，记为q*=R(r)：观察π乙(p甲, p乙)= 2q(2r-1)-(2r-1)
若r 1 / 2 2r 1 0, q越大越好 1, q* R( r ) [0,1], 若r 1 / 2 2r 1 0，无论q选什么都无影响 0, 若r 1 / 2 2r 1 0, q越小越好
博弈论第三章混合策略纳什均衡
第二节混合策略纳什均衡的求解方法
二、反应对应法
例：扑克牌对色游戏(p77)
先看甲的最优反应，记为r*=R(q)：观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0，无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
解：Max π甲(p甲, p乙) r Max π乙(p甲, p乙) q
f.o.c. 2r-1=0
r*=1/2
混合策略纳什均衡是甲在策略空间{红，黑}上以概率分布 p甲*= （1/2，1/2）进行选择，乙也在策略空间{红，黑}上以概率p乙*= （1/2，1/2）进行选择
博弈论第三章混合策略纳什均衡
第二节混合策略纳什均衡的求解方法
二、支付最大化法
例：扑克牌对色游戏(p77)
无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q(-1)+(1-q) 1]+ (1-r)[q1+(1-q)(-1)] = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r1+(1-r)(-1)]+ (1-q)[r(-1)+(1-r)1] =2q(2r-1)-(2r-1) f.o.c. 1-2q=0 q*=1/2

混合策略纳什均衡

03 混合策略纳什均衡的证明方法
反证法
总结词
通过假设不成立来证明均衡的存在。
详细描述
反证法是一种常用的证明方法，它首先假设与结论相反的命题成立，然后通过逻辑推理和数学推导，得出矛盾的结论，从而证明原命题的正确性。在证明混合策略纳什均衡的存在时，反证法可以用来证明当其他玩家采取了最优策略时，某个玩家采取混合策略能够达到最优结果。
唯一性意味着在给定对手策略的情况下，每个参与者都只有一个最优反应，从而避免了复杂的策略互动和不确定性。
存在性
混合策略纳什均衡的存在性是指在某些博弈中，至少存在一个策略组合，使得每个参与者在给定其他参与者策略的情况下，采用混合策略是最优的。
存在性通常通过数学证明和计算机搜索等方法来证明，但并不是所有博弈都有混合策略纳什均衡。
混合策略纳什均衡
目录
CONTENTS
• 混合策略纳什均衡的定义 • 混合策略纳什均衡的特性 • 混合策略纳什均衡的证明方法 • 混合策略纳什均衡的应用场景 • 混合策略纳什均衡的局限性 • 混合策略纳什均衡的发展前景
01 混合策略纳什均衡的定义
定义
混合策略纳什均衡是一种博弈论中的均衡概念，它描述了在给定对手策略的情况下，参与者如何选择最优策略以最大化自己的期望收益。
代数法是一种通过数学符号和公式进行推理和证明的方法。在证明混合策略纳什均衡的存在时，代数法可以用来推导和证明纳什均衡的条件和性质，利用代数性质和技巧来证明均衡的存在。
04 混合策略纳什均衡的应用场景
经济学
竞争策略分析
混合策略纳什均衡在经济学中被用于分析竞争策略，特别是在不完全竞争市场和寡头垄断市场中。通过混合策略纳什均衡，可以研究企业在不确定环境下的最优反应，以及企业如何通过调整其策略来应对竞争对手的行为。

混合策略纳什均衡

11
田忌的谋士孙膑了解了田忌的困境
后，就打听到这样一个消息：尽管齐威
王的上、中、下三匹马都要比田忌的对
应上、中、下三匹马好，但碰巧的是田
忌的上马可胜齐威王的中马，田忌的中
马可胜齐威王的下马。于是，孙膑为田
忌献计：下一次比赛中第一局时田忌出
下马对齐威王的上马输一局，第二局田
忌出上马对齐威王的中马，第三局田忌
9
对于大企业，因一旦偷税就数目巨大，所以，税务部门在随机检查时放在大企业上的可能性就大一些；而给定税务部门检查大企业的可能性较大，大企业偷漏税的行为就较少，否则就容易被逮个正着。所以，偷漏税较多的就是一些中小企业，大企业纳税的积极性较高。同样的道理，在犯罪或对错误的监督惩罚博弈中，也是混合博弈，人们可能总是大错不犯小错不断。
15
混合策略均衡
◆混合策略定义：在n人博弈的策略式表述G S1,, Sn;u1,,un 中，假定参与人 i 有K个纯策略：Si Si1,, SiK ，那么，概率
分布 pi pi1,, piK 称为参与人 i 的一个混合策略，这里
pik p(sik ) 是参与人 i 选择sik 的概率，对于所有
14
混合策略均衡
◆纯策略与纯策略纳什均衡 ➢ 纯策略：肯定会被选择——以100%的概率——被
选择的策略。
➢ 纯策略纳什均衡：各个参与人都选择纯策略的纳什均衡。
◆混合策略与混合策略纳什均衡
➢ 混合策略：以一定的概率分布选择某几个行动的策略。
➢ 混合策略纳什均衡：由参与人的混合策略构成的纳什均衡。
当田忌出下、上、中马时，他仍然按上、中、
下马出，当然要输了。事实上，当田忌出下马
时，齐威王应出下马，但齐威王出下马时，田

混合策略纳什均衡

混合策略纳什均衡混合策略纳什均衡是博弈论中一个重要的概念。

纳什均衡是指在一个博弈中，每个参与者都选择了最优的策略，而且即使其他参与者知道其他参与者的策略，他们也无法从自己的策略中获得更大的利益。

而混合策略则是指参与者通过随机化选择不同策略的概率来达到最优策略。

本文将深入探讨混合策略纳什均衡的概念、特点以及计算方法。

首先，混合策略纳什均衡是指参与者通过一定概率选择不同策略的方式达到最优策略。

在混合策略中，每个参与者都拥有一个策略概率分布，表示他们在不同策略下的选择概率。

这样，在博弈中，每个参与者将根据其策略概率分布中的概率随机选择其中一种策略。

对于每个参与者而言，他们的目标是通过选择最优的策略概率分布来最大化自己的期望收益或最小化自己的期望损失。

其次，混合策略纳什均衡与纳什均衡相比具有以下特点。

首先，混合策略纳什均衡可以推翻完全信息博弈中的固定策略均衡结果。

在完全信息博弈中，参与者可以根据对其他参与者策略的了解来做出精确决策，因此均衡状态是唯一确定的。

而在混合策略博弈中，由于参与者通过概率选择不同策略，他们无法准确地预测其他参与者的策略，因此均衡状态不再是唯一确定的。

其次，混合策略纳什均衡可以引入不确定性，增加博弈的复杂性。

参与者无法准确地预测其他参与者的策略，因此他们需要通过一定的概率选择策略来平衡风险与收益。

最后，混合策略纳什均衡可以通过均衡态的共同选择来实现长期的稳定状态。

在混合策略纳什均衡中，参与者通过随机化选择策略，从而消除了其他参与者可以预测自己策略的可能性，增加了稳定性。

最后，计算混合策略纳什均衡的方法主要有以下两种。

一种是通过计算参与者的最优策略概率分布来确定混合策略纳什均衡。

这种方法主要基于线性规划技术，通过最大化或最小化参与者的期望收益或损失来确定最优的策略概率分布。

另一种方法是通过迭代算法来求解混合策略纳什均衡。

这种方法主要是通过反复更新参与者的策略概率分布，直到达到均衡状态。

混合策略纳什均衡

6.反应函数法进行博弈分析的目的是为了最终找到博弈的均衡解，下面先
说一种反应函数法：武大郎走后，猪八戒强烈要求孙悟空去化斋。孙悟空却
要求猪八戒去，最后，两人决定由猜枚的方法来决定由谁去：两人各准备一个黑箱，黑箱中由两人放入不同数目的黑白棋子，然后两人从对方的箱子中摸出一枚棋子，如果两枚棋子的颜色一样，则孙悟空去化斋；不一样，则由猪八戒去。那么，两人会将自己黑箱中的黑白子的比例设定为多少?
但孙悟空的付钱方法也非同常人，孙悟空也变出一个黑箱，放了3张10元人民币和7张2元人民币进去，让武大郎从中摸
4.混合策略
一张钞票作为交易的报酬，武大郎会答应这样的付钱方法吗？
武大郎的期望支付：10×0.3+2×0.7=4.2(元) 很明显，作为一个精明的生意人，武大郎是不会同意的。下面从支付矩阵的角度来讨论为什么武大郎不会同意:
用Si表示，Si={si1， si2， …，sin}，其中sik(k=1,2
…n)表示一个策略。
纳什均衡是满足一定条件的，n个局中人的策略组合。
3.支
付：局中人参与博弈能得到的利益，用u表示，符号 ui(s1j，…，sik，…，snm)，表示n个局中人分别
采用策略s1j，…，sik，…，snm时第i个局中人的支付。
4.混合策略
孙悟空
10（0.3）饼8（0.5） 2（0.7）
8
8
武大郎
水4（0.5）
10
4
2
4
10
2
武大郎的期望支付：10×0.5×0.3+ 2×0.5×0.7 + 10×0.5×0.3 + 2×0.5×0.7=4.2（元）孙悟空的期望支付：8×0.5×0.3+ 8×0.5×0.7 + 4×0.5×0.3 + 4×0.5×0.7=6（元）

混合策略纳什均衡计算方法(一)

混合策略纳什均衡计算方法(一)混合策略纳什均衡计算方法什么是混合策略纳什均衡混合策略纳什均衡是博弈论中的一个概念，指的是每个玩家都选择一定的概率来执行每一个可行的行动。

这样，游戏的结果不再是唯一的，而是有一定的概率分布。

如何计算混合策略纳什均衡计算混合策略纳什均衡需要用到线性规划的方法，具体步骤如下：1.确定每个玩家的策略空间，即每个玩家可选的所有策略。

2.建立概率分布矩阵，即每个玩家选择每个策略的概率。

3.利用概率分布矩阵和游戏的收益矩阵计算出每个玩家的期望收益。

4.建立线性规划模型来最大化每个玩家的期望收益。

5.求解线性规划模型得到混合策略纳什均衡。

混合策略纳什均衡的应用混合策略纳什均衡在实际应用中有广泛的应用。

比如在围棋、国际象棋等棋类游戏中，人类选手常常会使用混合策略来应对对手的不确定性。

同时，在市场竞争、拍卖、投资等领域，混合策略也可以用来帮助决策者做出最优的决策。

总结混合策略纳什均衡是博弈论中的重要概念，在实际应用中具有广泛的应用前景。

计算混合策略纳什均衡需要用到线性规划的方法，但具体计算步骤并不复杂。

我们可以通过深入理解和应用混合策略纳什均衡，来帮助我们更好地应对不确定性和竞争。

混合策略纳什均衡的优势混合策略纳什均衡作为一种考虑不确定性的策略，相较于确定性策略有以下优势：1.能够应对对手的随机性，减小被对手利用的风险；2.能够在一定程度上改变游戏的结果分布，增加自己的收益，同时降低失败的风险。

混合策略纳什均衡的局限性尽管混合策略纳什均衡具有很多优点，但是也存在以下局限性：1.混合策略需要玩家具有一定的判断力和计算能力，否则可能难以计算出最优解；2.没有一个确定的策略来保证获胜，更多地要依靠概率和运气；3.当游戏中有多个混合策略纳什均衡时，玩家可能难以选择最优的策略。

结语混合策略纳什均衡是一个重要的博弈论概念，应用范围广泛。

尽管混合策略存在一些局限性，但是这并不妨碍我们充分应用这一理论来帮助我们在不确定性和竞争中取得更好的结果。

4.混合战略纳什均衡

vJ (1,0; ,1 ) 0.9 0.2(1 )
vJ (0,1; ,1 ) 0.3 0.6(1 )
由
vJ (0,1; ,1 ) vJ (1,0; ,1 )
得：同理得： 0.4 0.3
问题：
例4、监督博弈——税收
监督博弈是猜谜博弈的变种，它概括了诸如税收检查、质量检查、惩罚犯罪、顾主监督雇员等；这里以税收为例进纳税人行讨论。支付矩阵逃税不逃税参与人纯战略税检查 a-C+F , -a-F a-C , -a 税收机关检查，不检查收机不检查 0, 0 a , -a 纳税人逃税，不逃税关右表概括了对应不同纯战略组合的支付矩阵，其中,a是应纳税款；C是检查成本；F是罚款，假定C<a+F。用代表税收机关检查的概率，代表纳税人逃税的概率。给定，税收机关选择检查（ =1）和不检查（ =0）的期望收益分别为：………….. 给定，………… a C * , * 混合战略纳什均衡为：
aF aF
税收讨论：
一、监督博弈的纳什均衡与应纳税款a、对逃税的惩罚F、以及检查成本C有关。二、逃税者可制造虚假逃税信息，浪费查税人的资源。类似的有战争中发射真假弹的问题。三、有的博弈只有混合战略纳什均衡，但有的既有纯战略又有混合战略纳什均衡，如性别战博弈。四、奇数定理：几乎所有有限博弈都有有限奇数个纳什均衡。
vG ( G , L ) [3 (1)(1 )] (1 )[ 0(1 )]
vG 效用最大化条件： 5 1 0
(5 1)
同理，流浪汉的期望效用函数： vL ( G , L ) 3 2 效用最大化条件为： vL 1 2 0 * 故： * 0.5 0.2

混合策略纳什均衡

0
小偷
1 偷的概率
-D
- D’
加重对守卫的处罚：短期中的效果是使守卫尽职在长期中并不能使守卫更尽职，但会降低盗窃发生的概率
.
(*,r*)( S , P )
DSVP
小偷偷不偷
守卫睡不睡 V，-D -P，0 0，S 0，0
小偷得益(偷)
0
-P
V
守卫
1 睡的概率
- P’
加重对小偷的处罚：短期内能抑制盗窃发生率长期并不能降低盗窃发生率，但会使得守卫更多的偷懒睡觉
p
1
1, 当p 1/ 2
q [0,1],当p 1/ 2
1/2
0, 当p 1/ 2
0
1q
p 1
(P*,q*)(1/2,1/2)
1/2
纳什均衡是：A和B出红牌还
是出黑牌的概率都是1/2.
0
反应函数法
1/2
1 q.
练习1：利用反应函数法找出政府与流浪汉博弈
政府救济不救济
丽娟足球
芭蕾
妻子的混合策略
大海足球 2 , 1 0 , 0 芭蕾 0 , 0 1 , 2
p w (F ) 2 p w (B ) 0 p w (F ) 0 p w (B ) 1
丈夫的混合策略
p h ( F ) 1 p h ( B ) 0 p h ( F ) 0 p h ( B ) 2
i(P i*,P * i)i(P i,P * i)对于每一个 Pi i 都成立，则称
混合策略组合 P *(P 1 *,,P i*,,P n *) 是这个博弈的一个纳什均衡。
注意：在纳什均衡下，没有参与人有积极性单独偏离或改变该策略或策略组合。
.

混合策略纳什均衡

友军博弈
英国支持巴顿支持蒙帅支持巴顿 4，3 2，2 美国 1，1 3，4 支持蒙帅
友军博弈特征
两个（多个）纳什均衡问题：博弈的最终结果？
第三章混合策略纳什均衡
第三节多重纳什均衡的选择标准
第三节多重纳什均衡的选择标准
一、帕累托优势标准：得益更大（一）案例：战争与和平 C国鹰战略鸽战略 -5，-5 8，-10 鹰战略 -10，8 10，10 A国鸽战略
混合策略
小偷的混合策略以p的概率偷，（p，1-p）守卫的混合策略以q的概率睡（q，1-q）
第一节混合策略与期望支付
一、混合策略（二）混合策略 2.相对概念：纯策略每个参与人的非随机性选择纯粹行动计划，p=100%,1-p=0
第一节混合策略与期望支付
一、混合策略（二）混合策略 3.数学刻画给定博弈G=｛S1，…,Sn;u1,…,un｝以及参与人i的纯策略Si= ｛si1,…,sik｝概率分布pi=（pi1,…,pik）为混合策略其中：0≤ pik ≤1，∑ pik=1， pik=p（ sik ）混合策略组合p=（p1,…,pi,…pn）
第三节多重纳什均衡的选择标准
一、帕累托优势标准：得益更大（二）纳什均衡的选择标准帕累托优势标准按照支付大小筛选纳什均衡
-5，-5 -10，8 8，-10 10，10
第三节多重纳什均衡的选择标准
二、风险优势标准：风险更小？（一）案例：串通作弊博弈帕累托优学生乙势？作弊不作弊作弊 9，9 0，8 学生甲 8，0 7，7 不作弊
第一节混合策略与期望支付
二、期望支付（二）数学刻画
1 ( p, q ) pi q j aij

混合纳什均衡

混合纳什均衡混合纳什均衡（MixedNashEquilibrium）是一种在博弈模型中用于表示多人游戏中多个参与者之间协商达成不同利益最优化解决方案的一种综合策略。

它最初由纳什（JohnNash）在1950年的著作中提出，作为一种游戏论中的重要概念，它在很多复杂的博弈中发挥着重要作用。

它是多人博弈的理论基础，在实体经济系统中也有应用。

混合纳什均衡的主要特点是每个参与者都拥有不同的策略，当每个参与者选择其中一种策略时，就能够使参与者的收益达到最大值。

混合纳什均衡的概念混合纳什均衡是多人博弈中最重要的概念之一，它是一种衡量博弈中参与者策略选择的综合结果。

一般情况下，博弈参与者有多种不同的选择，每个参与者也可以选择不同的策略，而混合纳什均衡是描述每个参与者选择某种策略的结果而实现的收益最大化。

当每个参与者选择了一种策略后，就可以使参与者的期望收益达到最大值。

混合纳什均衡在实体经济中的应用混合纳什均衡也可以被应用于实体经济中，比如政府改革。

政府制定改革政策时，通常会考虑政策的社会效应，如政策对收入分配的影响等。

使用混合纳什均衡的政策可以确保政策的实施会增加政府的收入，同时达到社会的最大利益。

例如，当使用混合纳什均衡来解决税收制度时，政府可以通过分析每个阶层的收入分配，制定出一种具有征税灵活性的税收体制，从而确保政府的税收收入和社会的分配公平。

在市场中，混合纳什均衡也可以用来解决政府与市场之间潜在的冲突。

混合纳什均衡可以帮助政府分析平衡市场经济供需关系，确定出最优的市场竞争环境。

总结混合纳什均衡是一种在博弈模型中用于表示多人游戏中多个参与者之间协商达成不同利益最优化解决方案的一种综合策略。

它最初由纳什（John Nash）在1950年的著作中提出。

每个参与者都拥有不同的策略，当每个参与者选择其中一种策略时，就能够使参与者的收益达到最大值。

混合纳什均衡不仅可以在博弈中应用，也可以在实体经济中应用，比如政府改革和市场竞争。

混合策略纳什均衡

目录[隐藏]1 什么是混合策略纳什均衡2 解混合策略纳什均衡的方法3 混合策略纳什均衡的经典博弈——猜谜博弈[1]4 混合策略纳什均衡博弈与其他均衡的关系[1]5 参考文献[编辑][编辑][编辑]混合策略纳什均衡混合策略纳什均衡（Mixed Strategy Nash Equilibrium ）什么是混合策略纳什均衡混合策略纳什均衡：在n 个参与人的博弈G={S 1 ,... S n ; u 1,...u n }中，混合策略组合构成一个纳什均衡，如果对于所有的i ＝1，2...，n 下式成立：也就是说，如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略，这个策略就构成一个纳什均衡，不管这个策略是混合策略还是纯策略。

混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策，其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值，否则，一个博弈者会选择那个期望值最高的策略而排除所有其他策略，这意味着原初的状态不是一个均衡。

解混合策略纳什均衡的方法1、最大化支付法：即最大化各个参与人的效用函数。

2、支付相等法：根据前面分析的猜硬币博弈中参与人的策略的思路，每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等，因此，解混合策略纳什均衡可以令参与人的各个纯策略支付相等，构成方程组求解。

混合策略纳什均衡的经典博弈——猜谜博弈[1]两个局中人A 、B 手里各拿一枚硬币，每人可以选择正面向上或反面向上，然后同时亮出，如果两枚硬币正反面相同，B 付给A1元钱，如果两枚硬币正反面不相同，A 付给B1元钱。

在这种情况下，局中人A 、B 如何选择呢?下图给出这个博弈的双变量收益矩阵。

这是一个两人零和博弈，在每一个结局中一方所得即为另一方所失，即两个局中人的收益之和恰好等于零。

在双变量收益矩阵中采用画线的方法，在这个博弈中找不到纯策略纳什均衡。

那么，猜谜博弈是否存在混合策略纳什均衡呢?1950年纳什证明了任何有限博弈都至少存在一个纳什均衡(包括纯策略纳什均衡和混合策略纳什均衡)。

混合策略纳什均衡

混合策略纳什均衡简介混合策略纳什均衡是博弈论中的一个重要概念，用于描述多方参与的博弈情境中，每个参与者按照一定的概率分布选择不同的策略，使得任何人无法通过改变自己的策略来获得更好的结果。

在这种均衡状态下，每个参与者的预期收益最大化。

混合策略在传统的博弈理论中，参与者通常会选择一个确定性的策略来对抗其他参与者。

然而，在现实生活中，我们经常遇到的情况是，每个参与者都存在一定的不确定性和随机性，犹豫在不同的策略之间选择。

这时，混合策略就应运而生了。

混合策略是指参与者以一定的概率分布选择不同的策略来进行博弈。

例如，在一个石头剪刀布的游戏中，参与者可以以1/3的概率选择石头，1/3的概率选择剪刀，1/3的概率选择布。

这样的不确定性选择使得博弈更具有变数和策略性。

纳什均衡纳什均衡是由约翰·福布斯·纳什在20世纪50年代提出的一个概念，用于描述博弈理论中的均衡状态。

在纳什均衡中，每个参与者选择的策略都是最优的，即在其他参与者选择的策略下，自己无法通过改变策略来获得更好的收益。

通常情况下，纳什均衡是以确定性策略为基础进行定义的。

但是当参与者选择混合策略时，纳什均衡也可以被定义为每个参与者选择混合策略的概率分布，使得任何人都无法通过改变自己的概率分布来获得更高的收益。

混合策略纳什均衡的计算方法计算混合策略纳什均衡的方法主要是通过解析求解和数值求解两种方式。

解析求解解析求解是一种通过代数和数学推导的方式来找到混合策略纳什均衡的方法。

通过建立参与者的效用函数和概率分布函数等数学模型，应用最优化理论和微积分等数学工具，可以得到参与者的最优混合策略。

然而，解析求解的方法通常只适用于简单的博弈情境，并且求解过程繁琐复杂。

数值求解数值求解是一种通过计算机模拟和迭代计算的方式来找到混合策略纳什均衡的方法。

通过构建博弈模型，设定参与者的初始混合策略，然后通过迭代计算，逐渐优化参与者的混合策略，直到收敛到纳什均衡。

混合策略纳许均衡课件

策略纳什均衡的算法优化。
混合策略纳什均衡与人工智能
02
随着人工智能的发展，可以尝试将混合策略纳什均衡应用于机
器学习和人工智能领域，以实现更高效和智能的决策。
混合策略纳什均衡与演化博弈论的结合
03
研究混合策略纳什均衡与演化博弈论的结合，可以更好地解释
现实生活中的动态博弈现象。
06
参考文献
参考文献
定义
混合策略纳什均衡课件
CONTENTSБайду номын сангаас
• 混合策略纳什均衡简介 • 混合策略纳什均衡的数学模型 • 混合策略纳什均衡的求解方法 • 混合策略纳什均衡的应用实例 • 混合策略纳什均衡的挑战与展
望 • 参考文献
01
混合策略纳什均衡简介
定义与概念
混合策略纳什均衡是一种博弈论中的概念，它描述了在给定对手策略的情况下，参与者如何选择最优的行动方案。
定义策略空间
为每个参与人定义一个策略选择的空间，这些策略可以是离散的、连续的或混合的。
定义支付函数
根据每个参与人的策略选择，定义他们的支付函数，即每个参与人在该策略下的期望收益。
构建博弈矩阵
根据参与人的策略空间和支付函数，构建一个博弈矩阵，用以表示每个参与人选择不同策
略时的收益。
模型参数解释
纳什均衡点或满足一定的收敛条件。
优化算法
优化算法是一种基于数学优化的方法，用于求解混合策略纳什均衡。
优化算法的基本步骤包括：定义一个目标函数，然后使用优化算法（如梯度下降法、牛顿法等）寻找目标函数的最大值或最小值，从而得到纳
什均衡点。
优化算法的优点是能够快速找到纳什均衡点，适用于大规模问题。但缺点是需要对问题进行数学建模，且对初始点的选择敏感。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(陈明德语 r 陈明德语) 陈明德语 1 3/4 q*=R(r)
0 1/4 1 q 钟信德语）（钟信德语）
博弈论第三章混合策略纳什均衡
第三节寻找多重纳什均衡
德语 r
二、反应对应法：情侣博弈反应对应法：
陈明法语 1-r
钟信德语 q 法语 1-q 2 1 3 1 0 3 0 2
反应对应曲线有三个交点：三个：反应对应曲线有三个交点：三个NE： r*=0, q*=0 纯策略（确定性）纯策略（确定性）
(红) r 红 1 1/2 0 1/2 1 q （红） r*=R(q) q*=R(r)
博弈论第三章混合策略纳什均衡
第二节混合策略纳什均衡的求解方法
二、反应对应法
作业：社会福利博弈。使用反应对应法找到纳什均衡。作业：社会福利博弈。使用反应对应法找到纳什均衡。
流浪汉寻找工作游荡救济政府不救济
s1
第四节纳什均衡的存在性
问题：是否所有的博弈都存在（纯的或混合的）？问题：是否所有的博弈都存在NE（纯的或混合的）？（纯策略）纳什均衡的存在性定理(Debreu,1952；纯策略）纳什均衡的存在性定理； Glicksberg,1952；Fan,1952)：；：考虑一个n人策略式博弈, 考虑一个n人策略式博弈,如果每个参与人的纯策略空间S 是欧氏空间中的非空、闭而有界）的凸集, 空间Si是欧氏空间中的非空、紧（闭而有界）的凸集,支付函数u 连续且对拟凹,则博弈存在一个纯策略Nash 连续且对s 付函数 i(s)连续且对si拟凹,则博弈存在一个纯策略Nash 均衡。均衡。（混合策略）纳什均衡的存在性定理 (Glicksberg,1952)：混合策略）：在n人策略式博弈中,如果每个参与人的纯粹策略空人策略式博弈中, 是欧氏空间中的非空、闭而有界）的凸集, 间Si是欧氏空间中的非空、紧（闭而有界）的凸集,如果支付函数u 为连续函数为连续函数, 支付函数 i(s)为连续函数,那么博弈至少存在一个混合策 Nash均衡均衡. 略Nash均衡.
乙
第二节混合策略纳什均衡的求解方法红q 黑 1-q
红r 1 -1 -1 1 -1 1 1 -1
二、反应对应法
例：扑克牌对色游戏(p77) 扑克牌对色游戏黑 1-r 无纯策略NE 无纯策略给定混合策略p 给定混合策略甲=(r,1-r); p乙=(q,1-q)
π甲(p甲, p乙)= 2r(1-2q)+(2q-1) 整理原则：一项含r，一项不含r 整理原则：一项含，一项不含 π乙(p甲, p乙)= 2q(2r-1)-(2r-1) 整理原则：一项含q，一项不含q 整理原则：一项含，一项不含甲
乙
第二节混合策略纳什均衡的求解方法红q 黑 1-q
二、支付最大化法
例：扑克牌对色游戏(p77) 扑克牌对色游戏
甲红r 1 -1 -1 1 1 -1 无纯策略NE 无纯策略黑 1-r 1 -1 给定混合策略p 给定混合策略甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q⋅(-1)+(1-q) ⋅1]+ (1-r)[q⋅1+(1-q)⋅(-1)] ⋅ ⋅ ⋅ = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r⋅1+(1-r)⋅(-1)]+ (1-q)[r⋅(-1)+(1-r)⋅1] ⋅ ⋅ ⋅ ⋅ =2q(2r-1)-(2r-1) 解：Max π甲(p甲, p乙) r Max π乙(p甲, p乙) q f.o.c. 1-2q=0 f.o.c. 2r-1=0 q*=1/2 r*=1/2
夫妻之争博弈
丈夫时装妻时装子足球 2， 1 ， 0， 0， 0 足球 0， 0 ， 1， 1， 3
博弈论第三章混合策略纳什均衡
第四节纳什均衡的存在性
不同均衡概念的关系
优势均衡
纯策略纳什均衡
混合策略纳什均衡
博弈论第三章混合策略纳什均衡
第四节纳什均衡的存在性
问题：是否所有的博弈都存在（纯的或混合的）？问题：是否所有的博弈都存在NE（纯的或混合的）？
一、支付最大化法
给定混合策略p 给定混合策略陈明=(r,1-r); p钟信=(q,1-q) Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q) r Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2r) q NE：(r*, q*)=(3/4, 1/4) ：
r*=3/4, q*=1/4 混合策略（不确定性）混合策略（不确定性） r*=1, q*=1 纯策略（确定性）纯策略（确定性）
q*=R(r)
(陈明德语 r 陈明德语) 陈明德语 1 3/4
r*=R(q)
0 1/4 1 q 钟信德语）（钟信德语）
博弈论第三章混合策略纳什均衡
第三节寻找多重纳什均衡
博弈论第三章混合策略纳什均衡
第四节纳什均衡的存在性
例：凹但不连续的支付函数二人博弈：策略空间为S 二人博弈：策略空间为S1=S2= (0, 1) 支付函数：支付函数：
s1= s2=
反应对应：反应对应：
s2
无纳什均衡
反应对应曲线：反应对应曲线：
1/3
1/3 博弈论第三章混合策略纳什均衡
（纯策略）纳什均衡的存在性定理(Debreu,1952；纯策略）纳什均衡的存在性定理； Glicksberg,1952；Fan,1952)：；：考虑一个n人策略式博弈, 考虑一个n人策略式博弈,如果每个参与人的纯策略空间S 是欧氏空间中的非空、闭而有界）的凸集, 空间Si是欧氏空间中的非空、紧（闭而有界）的凸集,支付函数u 连续且对拟凹,则博弈存在一个纯策略Nash 连续且对s 付函数 i(s)连续且对si拟凹,则博弈存在一个纯策略Nash 均衡。均衡。
按照NE的条件，一个策略组合如过是一个，按照的条件，一个策略组合如过是一个NE，那么其中的的条件每一个策略都是参与人针对其他参与人策略组合的最优反应，每一个策略都是参与人针对其他参与人策略组合的最优反应，在纯策略NE中这个“最优反应” 在纯策略中，这个“最优反应”可能是一个具体的纯策略 (离散情形，也可能是一个反应函数离散情形)，离散情形也可能是一个反应函数(reaction function,如连如连续情形、古诺模型)。而在一个混合策略NE中这个“ 续情形、古诺模型。而在一个混合策略中，这个“最优反应”将是一个概率或很多个概率——被称为“反应对被称为“ 反应”将是一个概率或很多个概率被称为应”(reaction correspondence)
3，2 -1，3 ，， -1，1 0，0 ，，
博弈论第三章混合策略纳什均衡
第三节寻找多重纳什均衡
例：情侣博弈
德语 r 陈明法语 1-r 钟信德语 q 法语 1-q 2 1 3 1 0 3 0 2
两个（多个）两个（多个）纯策略纳什均衡问题：纳什均衡找完了吗？有无混合策略纳什均衡？问题：纳什均衡找完了吗？有无混合策略纳什均衡？
博弈论第三章混合策略纳什均衡
乙
第二节混合策略纳什均衡的求解方法红q 黑 1-q
红r 1 -1 -1 1 -1 1 1 -1
二、反应对应法
例：扑克牌对色游戏(p77) 扑克牌对色游戏
甲黑 1-r 先看甲的最优反应，记为r 先看甲的最优反应，记为 *=R(q)：：观察π 观察甲(p甲, p乙)= 2r(1-2q)+(2q-1)
反应对应曲线
博弈论第三章混合策略纳什均衡
第二节混合策略纳什均衡的求解方戏
作为NE，各个参与人的反应应该同时为最优，作为，各个参与人的反应应该同时为最优，只有两个反应对应的交点满足 NE：r*=1/2, q*=1/2 ： NE支付为： π甲(p甲, p乙)= 2r(1-2q)+(2q-1)=0 支付为：支付为 π乙(p甲, p乙)= 2q(2r-1)-(2r-1)=0
双方NE支付双方支付: π陈明*=3，π钟信*=2 支付，
r*=3/4, q*=1/4 混合策略（不确定性）混合策略（不确定性）
双方NE支付双方支付: π陈明*=3/2，π钟信*=3/2 支付，
r*=1, q*=1
纯策略（确定性）纯策略（确定性）
双方NE支付双方支付: π陈明*=2，π钟信*=3 支付，
0 1/4 1 q 钟信德语）（钟信德语）
博弈论第三章混合策略纳什均衡
第三节寻找多重纳什均衡q 钟信法语 1-q 德语
二、反应对应法：情侣博弈反应对应法：
陈明再看钟信的最优反应，记为q 再看钟信的最优反应，记为 *=R(r)：：德语 r 法语 1-r 2 3 0 0 1 2 1 3
π钟信(p陈明, p钟信)=q(4r-3)+(3-2r)
若 r > 3 / 4 ⇔ 4 r − 3 > 0 , q 越大越好 1, q * = R ( r ) = [ 0 ,1], 若 r = 3 / 4 ⇔ 4 r − 3 = 0，无论 q 选什么都无影响 0, 若 r < 3 / 4 ⇔ 4 r − 3 < 0 , q 越小越好
反应对应曲线
博弈论第三章混合策略纳什均衡
乙
第二节混合策略纳什均衡的求解方法红q 黑 1-q
红r 1 -1 -1 1 -1 1 1 -1
二、反应对应法
例：扑克牌对色游戏(p77) 扑克牌对色游戏
甲黑 1-r 再看乙的最优反应，记为q 再看乙的最优反应，记为 *=R(r)：：观察π 观察乙(p甲, p乙)= 2q(2r-1)-(2r-1)