3-混合策略的纳什均衡

合集下载

博弈论三种均衡的异同

博弈论三种均衡的异同

问题:博弈论三种均衡的异同结合工作实践举一个例子,谈以下三种均衡的异同,1、占优策略均衡,2、纳什均衡,3、混合策略纳什均衡。

国企办公室当中的智猪博弈。

“大猪”们辛辛苦苦加班,工资一分也不多拿,“小猪”们一边逍遥自在,工资一分也不少拿,这种情况在国企办公室里比比皆是。

很遗憾,我就是“大猪”们中的一员,因为我们什么都缺,尤其缺能干的人,就是不缺人。

严格占优均衡(DSE)、重复剔除占优均衡(IEDE)、纯策略纳什均衡(PNE)、混合策略纳什均衡(MNE),前一个均衡是后一个均衡的特例,后一个均衡是前一个均衡的扩展,即DSE是IEDE的子集,IEDE是PNE的子集,PNE是MNE的子集。

他们的区别如下:1、占优策略“不管你怎么做,我所做的都是我能做得最好的。

”其他人无论采取什么策略,目前你采取的策略就是最优的,永远不会改变。

2、纳什均衡:在一种策略组合上,其他人不改变策略时,那么你就不会改变策略,因为目前最优。

★“给定你的做法后,我所做的是我能做得最好的。

”★“给定我的做法后,你所做的是你能做得最好的。

”★如果你有占优策略, 你可以使用此策略, 以不变应万变;★如果你没有占优策略, 你必须随机应变。

在达到了纳什均衡之后, 所有参与者都没有动机想再变了。

纳什均衡是常态,帕累托最优几乎不存在。

经典案例:囚徒困境。

3、混合策略纳什均衡由所有参与人的混合策略构成的纳什均衡。

有些博弈不存在纳什均衡,或者纳什均衡不唯一,如猜硬币博弈。

要想为博弈方的选择和博弈结果做明细的预测,就要用到混合策略纳什均衡。

混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。

混合战略纳什均衡及应用

混合战略纳什均衡及应用

混合战略纳什均衡及应用摘要:博弈论是运筹学的一个重要分支,类型众多。

其中,非合作博弈是现代博弈理论中的核心内容和重要基础。

本文在简要介绍了博弈论相关内容的基础上,重点介绍了非合作博弈中最重要、最核心的部分即Nash均衡。

在此基础上,以纳什均衡作为理论支撑点,结合得意矩阵分析解决了经济生活中的一些实际问题。

例如治理污水排放的制度设计问题。

关键词:博弈论;均衡点;得益矩阵;Nash均衡博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

非合作博弈是现代博弈理论中的核心内容和重要基础,而Nash均衡则是非合作博弈的核心部分。

要用博弈论解决现实经济生活中的决策问题,其关键在于如何根据行为中的支付矩阵得出纳什平衡点,通过分析决策者的心理活动来得到博弈模型,从而依据模型来针对生活中的实际问题制定相关的政策以预防不良现象的发生。

一、非合作博弈一般地,将不允许存在有约束力协议的博弈称为“非合作博弈”。

在该博弈中,每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策。

事实上,具有这种性质的策略组合,正是非合作博弈理论中最重要的一个概念——“纳什均衡”。

在博弈论里,有各种各样的均衡概念。

混合战略均衡是纳什均衡的一种,混合战略概念使博弈论的研究范围更加广泛。

混合战略纳什均衡在非合作博弈分析中具有十分关键的作用和地位,因此将着重介绍混合战略纳什均衡的定义。

显然,给定父母资助,儿子的最优战略是在家;给定儿子在家;父母的最优战略是不资助,给定父母不救济,儿子的最优战略是寻找工作;而给定儿子寻找工作,父母的最优战略是资助。

该博弈的显著特征是每个参与人都不能猜出对方的战略。

参与人是以一定的概率选择某种战略,故称这样的战略为混合战略。

在该博弈中,设想父母以的概率选择资助,的概率选择不资助。

那么,对儿子来说,选择寻找工作带来的期望效用为,选择在家带来的期望效用同样为。

可见,选择任何混合战略带来的期望效用都是相同的。

3 混合纳什均衡

3 混合纳什均衡

13
混合Nash均衡的解释(2)
纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最 优选择。因此在社会福利博弈中,* 0 . 2 , *=0.5是唯一的混合战略 纳什均衡。 从反面来说,如果政府认为流浪汉选择寻找工作的概率严格小于0.2, 那么政府的唯一最优选择是纯战略:不救济;
如果政府以1的概率选择不救济,流浪汉的最优选择是寻找工作,这 又将导致政府选择救济的战略,流浪汉则选择游荡。如此等等。
14
混合Nash均衡的解释(3)
流浪汉
政府
流浪汉
寻找工作的概率小于0.2
概率为1:不救济
寻找工作
政府 救济
15
猜谜游戏
求该猜谜游戏 的混合战略纳什 均衡
正面
1 -1, -1
5
社会福利博弈
寻找工作
2
流浪
3 -1,
救济
3, 1
0 0,
不救济
-1,
设:政府救济的概率:1/2 ;不救济的概率:1/2。
流浪汉:寻找工作的期望效用:1/2×2+1/2 ×1=1.5 流浪的期望效用: 1/2×3+1/2 ×0=1.5
因此,流浪汉的任何一种策略都是都是对政府混合战略的最优反应
6
社会福利博弈(2)
寻找工作
2 3, 1
流浪
3 -1, 0 0,
3r+(-1)(1-r)=4r-1
选择纯战略不救济的效用为:
-1r+0(1-r)=-r
如果一个混合战略(而不是纯战略) 是政府的最优选择,一定意味着政府 在救济与不救济之间是无差异的。
救济
不救济
-1,
4r-1=-r

纳什均衡概念名词解释

纳什均衡概念名词解释

纳什均衡概念名词解释纳什均衡是博弈论中的一个重要概念,它描述了博弈双方在特定条件下做出的最优策略选择,这个选择不会被单方面的改变,否则对于另一方来说,选择其他策略反而更劣。

1. 概念解释纳什均衡的概念可以从两个方面进行解释。

从个人角度看,纳什均衡是指当每一个人都实施最优策略时,其它人不能从自己的策略中获得进一步的盈利收益;从社会角度看,纳什均衡则是指,当所有人都做出了最优策略时,整个社会得到了最大的总收益。

2. 纳什均衡的前提条件在博弈论中,纳什均衡并不是所有博弈都存在的。

对于一个博弈,存在纳什均衡需要满足以下条件:(1)所有博弈者都采取了最优策略,即无法通过改变策略来提高自己的收益;(2)每个博弈者的策略是对其他博弈者实施的策略的最佳反应;(3)每个博弈者都清楚地了解其他博弈者的策略。

3. 纳什均衡的类型在实际的博弈中,纳什均衡可以分为三种类型:(1)纯策略均衡:指每位参与者都只选定一个策略,并根据它的期望收益来进行决策,不存在概率因素。

(2)混合策略均衡:指每位参与者按一定的概率选定多个策略,并根据它的期望收益来进行决策,存在概率因素。

(3)多重纳什均衡:指博弈中存在多个均衡策略组合,每个均衡策略组合都符合博弈的前提条件。

4. 纳什均衡的意义和应用纳什均衡是博弈论的一个核心概念,其意义和应用非常广泛。

首先,纳什均衡可以用来预测和解释现实生活中的决策行为,如市场竞争、政府政策制定等。

其次,纳什均衡也可以用来指导协商和谈判的过程。

最后,纳什均衡还可以用来研究其他领域的决策行为,如军事战略、生态环境等。

综上所述,纳什均衡是博弈论中的一个重要概念,它描述了博弈双方在特定条件下做出的最优策略选择,是一种使得所有参与者都满意的稳定状态。

纳什均衡的应用领域非常广泛,其理论和方法也在不断地发展和完善。

混合策略纳什均衡

混合策略纳什均衡

03 混合策略纳什均衡的证明 方法
反证法
总结词
通过假设不成立来证明均衡的存在。
详细描述
反证法是一种常用的证明方法,它首先假设与结论相反的命题成立,然后通过逻辑推理和数学推导,得出矛盾的 结论,从而证明原命题的正确性。在证明混合策略纳什均衡的存在时,反证法可以用来证明当其他玩家采取了最 优策略时,某个玩家采取混合策略能够达到最优结果。
唯一性意味着在给定对手策略的情况下,每个参与者都只有一个最优反应,从而 避免了复杂的策略互动和不确定性。
存在性
混合策略纳什均衡的存在性是指在某 些博弈中,至少存在一个策略组合, 使得每个参与者在给定其他参与者策 略的情况下,采用混合策略是最优的 。
存在性通常通过数学证明和计算机搜 索等方法来证明,但并不是所有博弈 都有混合策略纳什均衡。
混合策略纳什均衡
目录
CONTENTS
• 混合策略纳什均衡的定义 • 混合策略纳什均衡的特性 • 混合策略纳什均衡的证明方法 • 混合策略纳什均衡的应用场景 • 混合策略纳什均衡的局限性 • 混合策略纳什均衡的发展前景
01 混合策略纳什均衡的定义
定义
混合策略纳什均衡是一种博弈论中的均衡概念,它描述了在 给定对手策略的情况下,参与者如何选择最优策略以最大化 自己的期望收益。
代数法是一种通过数学符号和公式进行推 理和证明的方法。在证明混合策略纳什均 衡的存在时,代数法可以用来推导和证明 纳什均衡的条件和性质,利用代数性质和 技巧来证明均衡的存在。
04 混合策略纳什均衡的应用 场景
经济学
竞争策略分析
混合策略纳什均衡在经济学中被用于分析竞 争策略,特别是在不完全竞争市场和寡头垄 断市场中。通过混合策略纳什均衡,可以研 究企业在不确定环境下的最优反应,以及企 业如何通过调整其策略来应对竞争对手的行 为。

混合纳什均衡

混合纳什均衡

混合纳什均衡混合纳什均衡是一种多人博弈模型,也被称为“混合博弈”,可以模拟多方参与者协商、合作和竞争的过程。

这种理论是基于纳什均衡的,在纳什均衡中,每个参与者都有唯一的利益,各参与者的最优策略协作,从而达到最大的利益。

混合纳什均衡是一种非零和纳什均衡,这意味着在一局游戏中,所有参与者可以实现共赢的结果,而不是某些参与者的利益以牺牲其他参与者的利益为代价。

这种理论很有用,因为它可以帮助参与者解决复杂的多方协商问题,降低买卖双方的损失。

混合纳什均衡有三类参与者:合作者、竞争者和不确定者。

这三类参与者行为的不同可能会影响混合纳什均衡的最终结果。

首先,合作者是指参与者之间相互合作,面对游戏的结果,合作者会达成有利于双方的互惠交易。

其次,竞争者是指参与者之间存在竞争,他们拼劲、追求自身最大利益,甚至牺牲他人利益也在所不惜。

最后,不确定者是指参与者对其他参与者的行为不太清楚,不确定者在游戏中会被动地接受其他参与者的影响,不会太过激进地为自身争取利益。

混合纳什均衡的应用非常广泛,它可以用来模拟经济、政治和外交等领域中的多方协商。

例如,混合纳什均衡可以用来模拟多个国家的贸易谈判,各国可以混合地拼争,双赢共赢的结果也可以从混合纳什均衡中获得。

此外,混合纳什均衡还可以用于多方竞争,各参与者一方面决策自身利益,另一方面也考虑到他人利益,以免损害自己的利益。

混合纳什均衡由一系列经典模型构成,例如拉斯维加斯博弈、巴斯-马丁斯博弈、多人贪心渐近博弈和贝叶斯优化博弈等等。

这些经典模型可以帮助参与者更容易地找到最大利益的解决方案,从而使参与者可以面对复杂的多方协商游戏实现共赢。

混合纳什均衡受到了日益普及和重视。

从商业活动到政治事务,混合纳什均衡已经被广泛地应用,而且也取得了许多成功案例。

在政治领域,混合纳什均衡可以帮助各个利益派系达成协议,减少谈判的紧张和矛盾,从而使多方收获相对平衡的政治结果。

此外,混合纳什均衡也有不足之处,例如模型的复杂性使得集成分析变得更加困难,可能引发新的潜在问题,而且由于参与者的利益不断变化,使用混合纳什均衡可能无法达到预期的最终结果。

混合策略纳什均衡PPT课件

混合策略纳什均衡PPT课件
政府
不救济 (-1,1) (0,0) 8
政府和流浪汉的博弈ห้องสมุดไป่ตู้
• 思考:政府会采用纯策略吗?流浪汉呢?这 个博弈有没有纯策略的纳什均衡?
• ——跟你玩剪子石头布游戏一样,你会一直 采用纯策略吗?
• 那么政府和流浪汉最有可能采用什么策略? • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略,就可以采用针
4 1

如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
vG 1, 4 1 vG 0,
0.2
13
• 解二:支付等值法
如果一个混合策略是政府的最优选择,那一定意 味着流浪汉在寻找工作与游闲之间是无差异的, 即:
• 答案是否定的。 • 事实上,局中人的选择仍然是很有讲究的,
策略选择的好坏对局中人的利益仍然有很大 的影响。
• 在这个零和博弈里,无论双方采用哪种策略 组合,结果都是一方输一方赢,而输的一方 又总是可以通过单独改变策略而反输为赢。 如果哪个局中人能找到对手方的规律或者偏 好,他就能猜测到对手的策略而采用针对性 策略从而保证赢。
16
讨论
• 尽管混合策略不像纯策略那样直观,但它确实是 一些博弈中参与人的合理行为方式。扑克比赛、 垒球比赛、划拳就是这样的例子,在这一类博弈 中,参与比赛的总是随机行动以使自己的行为不 被对方所预测。
• 经济学上的监督博弈也是这样一个例子。如税收 检查、质量检查、惩治犯罪、雇主监督雇员等都 可以看成猜谜博弈。
11
• 解一:支付最大化
• 流浪汉的期望效用函数为:
L
2 1 0
0.5 12
解二:支付等值法

混合策略纳什均衡

混合策略纳什均衡

6.反应函数法 进行博弈分析的目的是为了最终找到博弈的均衡解,下面先
说一种反应函数法: 武大郎走后,猪八戒强烈要求孙悟空去化斋。孙悟空却
要求猪八戒去,最后,两人决定由猜枚的方法来决定由谁去: 两人各准备一个黑箱,黑箱中由两人放入不同数目的黑白棋 子,然后两人从对方的箱子中摸出一枚棋子,如果两枚棋子 的颜色一样,则孙悟空去化斋;不一样,则由猪八戒去。 那么,两人会将自己黑箱中的黑白子的比例设定为多少?
但孙悟空的付钱方法也非同常人,孙悟空也变出一个黑箱, 放了3张10元人民币和7张2元人民币进去,让武大郎从中摸
4.混合策略
一张钞票作为交易的报酬,武大郎会答应这样的付钱方法吗?
武大郎的期望支付:10×0.3+2×0.7=4.2(元) 很明显,作为一个精明的生意人,武大郎是不会同意的。 下面从支付矩阵的角度来讨论为什么武大郎不会同意:
用Si表示,Si={si1, si2, …,sin},其中sik(k=1,2
…n)表示一个策略。
纳什均衡是满足一定条件的,n个局中人的策略组合。
3.支
付:局中人参与博弈能得到的利益,用u表示,符号 ui(s1j,…,sik,…,snm),表示n个局中人分别
采用策略s1j,…,sik,…,snm时第i个局中人的支付。
4.混合策略
孙悟空
10(0.3) 饼8(0.5) 2(0.7)
8
8
武 大 郎
水4(0.5)
10
4
2
4
10
2
武大郎的期望支付:10×0.5×0.3+ 2×0.5×0.7 + 10×0.5×0.3 + 2×0.5×0.7=4.2(元) 孙悟空的期望支付:8×0.5×0.3+ 8×0.5×0.7 + 4×0.5×0.3 + 4×0.5×0.7=6(元)

3 混合策略纳什均衡(1)

3 混合策略纳什均衡(1)
UB ( p, q) 2q(2 p 1) (2 p 1)
扩展:二人博弈标准型
n人参与的策略式博弈混合策略定义
• i 表示局中人 i 的混合策略空间
• p ( p1,..., pi ,..., pn ), pi i 表示博弈的一个混合策
略组合
• i ( p) i ( p1,..., pi ,..., pn ) 表示局中人 i 在混合策略 组合 p ( p1,..., pi ,..., pn ) 下的期望支付,它是混 合策略组合 p 的函数。
3-2 反应函数法
• 寻找同时决策有限博弈的混合策略纳什均衡
• B的混合策略设定为(q,1-q)时,A的最佳 反应函数是:
UA( p, q) 2 p(1 2q) (2q 1)
• A的混合策略设定为(p,1-p)时,B的最 佳反应函数是:
UB ( p, q) 2q(2 p 1) (2 p 1)
游戏; • 另外4名同学负责以下工作
– 1名同学记录A分别出锤子剪子布的次数; – 1名同学记录A输和赢的次数 – 1名同学记录B分别出锤子剪子布的次数; – 1名同学记录B输和赢的次数
• 共进行30次 • 每个小组写下实验报告,内容包括:A和B选 择不同策略的次数;输赢的次数;怎么才能赢?
3-1混合策略、混合纳什均衡与期望 支付
数学语言表达
• 如果主体人对确定性收益x的效用为u(x),那么主体 人对不确定性收益X的效用就为E(u(X))。
• E(u(X))称为X的期望效用,常记为EU(X)。将X看作 自变量, EU(X)称为期望效用函数。
• 如果不确定性收益X退化成确定性收益x,则EU(X)= u(x),所以EU(X)可以同时表达主体人对确定性收益 和不确定性收益的效用。

第三讲 混合策略纳什均衡

第三讲 混合策略纳什均衡

混合策略均衡
工人 偷懒 监督 老板 不监督 1,-1 不偷懒 -1,2

-2,3
2,2
假定老板选择混合战略(0.2,0.8) 工人选择“偷懒”期望支付为(-1)×0.2+3×0.8=2.2 工人选择“不偷懒”(期望)支付为2×0.2+2×0.8=2 工人应选择“偷懒” 老板选择“监督” “不偷懒’……
例子1 为什么一般人总是小错不断,大 错不犯;偷税漏税的一般是中小企业, 大企业会老老实实地交税?
税务部门不会对所有企业的交税情 况每一次都去检查,因为这样做的成本 太高,得不偿失。所以,税务部门总是 随机地对企业的交税情况进行检查。
企业也是随机地在交税与偷漏税之 间进行选择。税收部门与企业间进行的 是混合战略博弈。因为如果企业总是交 税,税务部门就最好不检查;但给定不 检查,企业就会偷漏税。所以,两者只 有在随机地检查与不检查,企业随机地 在偷漏税与交税之间选择,才会达成均 衡。
两人只能玩混合战略博弈,齐威
王分别以1/6随机的概率选择出上、中 、下马的任一排列,田忌也如此。由于 齐威王存在绝对优势,他平均看来仍然 会赢田忌一千斤铜。
混合策略均衡
◆纯策略与纯策略纳什均衡 纯策略:肯定会被选择——以100%的概率——被 选择的策略。 ◆混合策略 混合策略:以一定的概率分布选择某几个行动的 策略。
??????11111111eupquacpquadpqubcpqubd?????????????????????????1222211110808308021020820202526????eupquacpquadpqubcpqubd???????????????多重均衡博弈和混合策略一夫妻之争的混合策略纳什均衡首先该博弈有两个纳什均衡本博弈的两个博弈方不会害怕对方猜到自己的选择他们主观上并不想隐藏自己的选择

博弈论第三章混合策略纳什均衡.

博弈论第三章混合策略纳什均衡.

如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
vG 1,

4
1 vG 0,


0.2
• 解二:支付等值法
如果一个混合策略是政府的最优选择,那一定意 味着流浪汉在寻找工作与游闲之间是无差异的, 即:
vL 1, 1 3 vL 0, 0.5
游闲
(3,2) (-1,3)
(-1,1) (0,0)
政府和流浪汉的博弈
• 思考:政府会采用纯策略吗?流浪汉呢?这 个博弈有没有纯策略的纳什均衡? • ——跟你玩剪子石头布游戏一样,你会一直 采用纯策略吗? • 那么政府和流浪汉最有可能采用什么策略? • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略,就可以采用针 对性的策略,使自己的支付增加。
L 2 1 0


0.5
解二:支付等值法
• 政府选择救济策略 • 政府选择不救济策略
0 1 期望效用 期望效用 vG 1, 3 11 vG 0, 1 01 4 1
EUA p1 X 1 p 2 X 2 ... pnXn
政府和流浪汉的博弈
• 政府想帮助流浪汉,但前提是后者必须试图寻 找工作,否则,不予帮助;而流浪汉若知道政 府采用救济策略的话,他就不会寻找工作。他 们只有在得不到政府救济时才会寻找工作。他 们获得的支付如图所示:
流浪汉
寻找工作
救济 政府 不救济
乙 红q 红p 甲 黑1-p -1, 1 1, -1 黑1-q 1, -1 -1, 1
§ 反应函数
• A的目标是期望支付越大越好。我们之所以把A的 期望支付整理成不含p的一项和含p的一项这个样 子,是因为A只能选择p而不能q,因此,A能通过 选择p来影响第一项,而不能直接影响第二项。 (1-2q)>0即q<1/2时,A把p选择等于1最好;当 (1-2q)<0即q>1/2时,A把p选择等于0最好;当 (1-2q)=0即q=1/2时,A可以在[0,1]之间随便 选择一个p。这样我们可以得到A的反应函数是, 同样道理我们可以得到B的反应函数。 • 0, 如果q>1/2 1, 如果p>1/2 • p [0,1], 如果q=1/2 q [0,1], 如果p=1/2 • 1, 如果q<1/2 0, 如果p<1/2

03 混合策略纳什均衡

03 混合策略纳什均衡

相关均衡例子 三个纳什均衡: 三个纳什均衡 (U,L)、(D,R) 和混合策略均衡[(1/2,1/2), (1/2,1/2)] 结果都不理想,不如(D,L)。
5)防联盟均衡 ) 博弈中若有三个及三个以上的局中人,就有可能部分人结 成“联盟”,在极大化联盟成员利益的同时损害了其他局 中人的利益。
甲 乙
2
( p, q ) = ∑∑ pi q j bij
i =1 j =1
混合策略纳什均衡 设 P * = ( P * , L, Pi* , L, Pn* ) 是 n 人策略式博弈 G = {S1 ,LSn ; u1 ,Lun } 1 的一个混合策略组合,如果对于所有的
i = 1, L , n ,
π i ( Pi* , P−*i ) ≥ π i ( Pi , P−*i ) 对于每一个 Pi ∈ ∑i 都成立,则称
i i
随机在其m个可选策略中选择的“策略”,称为一个“混合 策略”,其中 p ij 0≤
≤1
j 对,L, m =1
p 1i 都成立,且 + L + p im = 1
混合策略扩展博弈:博弈方在混合策略的策略空 混合策略扩展博弈 间(概率分布空间)的选择看作一个博弈,就是原 博弈的“混合策略扩展博弈。
L 0,0,10 -5,-5,0 A
R -5,-5,0 1,1,-5
乙 甲
L -2,-2,0 -5,-5,0 B
R -5,-5,0 -1,-1,5
U D
U D 丙
)、(D, , ) (U,L,A)、( ,R,B)——纯策略纳什均衡 , , )、( 纯策略纳什均衡 优于( , , ) (U,L,A) Pareto优于(D,R,B) , , ) 优于
2)制式问题

混合策略纳什均衡

混合策略纳什均衡

目录[隐藏]1 什么是混合策略纳什均衡2 解混合策略纳什均衡的方法3 混合策略纳什均衡的经典博弈——猜谜博弈[1]4 混合策略纳什均衡博弈与其他均衡的关系[1]5 参考文献[编辑][编辑][编辑]混合策略纳什均衡混合策略纳什均衡(Mixed Strategy Nash Equilibrium )什么是混合策略纳什均衡混合策略纳什均衡:在n 个参与人的博弈G={S 1 ,... S n ; u 1,...u n }中,混合策略组合构成一个纳什均衡,如果对于所有的i =1,2...,n 下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。

混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。

解混合策略纳什均衡的方法1、最大化支付法:即最大化各个参与人的效用函数。

2、支付相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略支付相等,构成方程组求解。

混合策略纳什均衡的经典博弈——猜谜博弈[1]两个局中人A 、B 手里各拿一枚硬币,每人可以选择正面向上或反面向上,然后同时亮出,如果两枚硬币正反面相同,B 付给A1元钱,如果两枚硬币正反面不相同,A 付给B1元钱。

在这种情况下,局中人A 、B 如何选择呢?下图给出这个博弈的双变量收益矩阵。

这是一个两人零和博弈,在每一个结局中一方所得即为另一方所失,即两个局中人的收益之和恰好等于零。

在双变量收益矩阵中采用画线的方法,在这个博弈中找不到纯策略纳什均衡。

那么,猜谜博弈是否存在混合策略纳什均衡呢?1950年纳什证明了任何有限博弈都至少存在一个纳什均衡(包括纯策略纳什均衡和混合策略纳什均衡)。

03 混合战略Nash均衡

03 混合战略Nash均衡

1
三、混合战略Nash均衡的求解
1. 支付最大化法; 2. 支付等值法;
• 社会福利博弈
流浪汉 寻找工作 流浪
救济 政府 不救济
3,2 -1,1
-1,3 0,0
没有一个策略组合构成纳什均衡
1、支付最大化法 、 流浪汉
寻找工作 流浪
假定政府的混合策略是 σ G = θ,− θ); ( 1 流浪汉的混合策略是 σ L = γ,− γ)。 ( 1 政府的期望效用函数为 : ( v( σ G, σ L) θ(3γ + − 1)(1 − γ)) = ( 0 + 1 − θ)( − γ + (1 − γ)) = θ(5γ − 1) γ − 求微分,得到政府最优 化的一阶条件: ∂ vG = 5γ − 1 = 0 ∂θ 故 γ * = 0 .2
• 例:
2
q b1 p
1
1−q b2 x2 , y2 x4 , y4

a1
x1 , y1 x3 , y3
1 − p a2
• 参与人1 的混合战略σ 1 = ( p,1 − p) ,参与人2 的 混合战略 σ 2 = (q,1 − q ) ; • 在混合战略组合σ = (σ 1 , σ 2 )下,战略组合 (a1 , b1 ) (a1 , b2 ) 、(a2 , b1 ) 、和 (a2 , b2 ) 出现的概率就分别 为 pq 、p (1 − q ) 、 − p ) q和(1 − p )(1 − q ) 。 (1
= pqy1 + (1 − p)qy3 + p (1 − q ) y2 + (1 − p)(1 − q) y4
二、混合战略Nash均衡
• 问题: 问题: 在“猜硬币”游戏中,参与人往往会以50%的概 率选择正面(O),以50%的概率选择反面(R),即 选择混合战略σ=(0.5,0.5)。如我们在介绍Nash 均衡的概念时一样,我们想知道,有没有参与 有没有参与 人会偏离混合战略σ 人会偏离混合战略 i=(0.5,0.5)呢? , 呢

110323混合策略纳什均衡多重均衡

110323混合策略纳什均衡多重均衡

正面p -1

反面1-p 1
乙 正面 q
1 1
-1 -1
反面 1-q
-1
1
多重纳什均衡及甄别
• 标准一:帕累托占优
猎鹿博弈Stag Hunt Game
两个猎人以狩猎为生,主要有两种 猎物——鹿和兔子,两人一起猎 鹿,才能猎获一只鹿,如果单枪 匹马,只能打到4只兔。
乙 猎鹿
10
甲 猎鹿 10
0
0
打兔 4
末考。他们没有参加考试,而是向教授撒了个谎,说他们本已从
弗吉尼亚大学往回赶,并安排好时间复习准备考试,但途中轮胎
爆了。由于没有备用胎,他们只好整夜呆在路边等待救援。现在
他们实在太累了,请求教授可否允许他们隔天补考?教授想了想
,同意了。
ቤተ መጻሕፍቲ ባይዱ
两人利用周一晚上好好准备了一番,胸有成竹地来参加周二
上午的考试。教授安排他们分别在两间教室做答。第一个题目在
参与人通过大家都能观 测到的共同信号(拥有 的共同知识)来选择行 动,并由此确定了博弈 结果。
规则:甲先到,则走甲 上乙左均衡;乙先到, 则走甲下乙右均衡。



1
0
甲上 5
0
4
5
下4
1
• 《圣经》上所罗门王的故事
• 两个女人抱着一个男婴来到所罗门王跟前, 要求他评判到底谁是真的母亲。所罗门王见 她们争执不下,便喝令侍卫拿一把剑来,要 把孩子劈成两半,一个母亲一半。这时其中 一个女人说:“大王,不要杀死孩子。把孩 子给她吧,我不和她争了”。所罗门王听了 却说:“这个女人才是真的母亲,把孩子给 她。”
抗共谋均衡coalition-proof equilibrium

混合策略纳许均衡课件

混合策略纳许均衡课件

策略纳什均衡的算法优化。
混合策略纳什均衡与人工智能
02
随着人工智能的发展,可以尝试将混合策略纳什均衡应用于机
器学习和人工智能领域,以实现更高效和智能的决策。
混合策略纳什均衡与演化博弈论的结合
03
研究混合策略纳什均衡与演化博弈论的结合,可以更好地解释
现实生活中的动态博弈现象。
06
参考文献
参考文献
定义
混合策略纳什均衡课件
CONTENTSБайду номын сангаас
• 混合策略纳什均衡简介 • 混合策略纳什均衡的数学模型 • 混合策略纳什均衡的求解方法 • 混合策略纳什均衡的应用实例 • 混合策略纳什均衡的挑战与展
望 • 参考文献
01
混合策略纳什均衡简介
定义与概念
混合策略纳什均衡是一种博弈论中的概念,它描述了在给定对手策略的情况下,参 与者如何选择最优的行动方案。
定义策略空间
为每个参与人定义一个策略选 择的空间,这些策略可以是离 散的、连续的或混合的。
定义支付函数
根据每个参与人的策略选择, 定义他们的支付函数,即每个 参与人在该策略下的期望收益。
构建博弈矩阵
根据参与人的策略空间和支付 函数,构建一个博弈矩阵,用 以表示每个参与人选择不同策
略时的收益。
模型参数解 释
纳什均衡点或满足一定的收敛条件。
优化算法
优化算法是一种基于数学优化的方法,用于求解混合策略纳什均衡。
优化算法的基本步骤包括:定义一个目标函数,然后使用优化算法(如 梯度下降法、牛顿法等)寻找目标函数的最大值或最小值,从而得到纳
什均衡点。
优化算法的优点是能够快速找到纳什均衡点,适用于大规模问题。但缺 点是需要对问题进行数学建模,且对初始点的选择敏感。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论教学/混合策略的纳什均衡
出自MyKnowledgeBase
< 博弈论教学
Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡
目录
■1 复习
■2 混合策略(Mixed strategy)
■2.1 举例/Example
■2.2 概念
■2.3 纯策略和混合策略
■2.4 混合策略的争议
■3 混合策略的纳什均衡
■3.1 基本概念
■3.2 混合策略纳什均衡的存在性/纳什定理
■3.3 学术争议与批评
■4 混合策略纳什均衡举例
■4.1 社会福利博弈Social Welfare Game
■4.1.1 博弈分析(方法1:收益无差异)
■4.1.2 博弈分析(方法2:图形分析法)
■4.1.3 博弈分析(方法3:导数(Derivative)极值法)
■4.2 普通例子
■4.3 审计博弈(Tax Game)
■4.4 激励的悖论[5]
■4.5 求解纳什均衡的一般方法
■5 多重纳什均衡
■5.1 多重纳什均衡举例
■5.1.1 夫妻之争
■5.1.2 制式问题
■5.1.3 市场机会博弈
■5.2 多重纳什均衡分析
■5.2.1 帕累托上策均衡(Pareto Dominated Equilibrium)
■5.2.1.1 帕累托最优Pareto optimality
■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium)
■5.2.1.3 举例分析
■5.2.2 风险上策均衡(Risk-dominant Equilibrium)
■5.2.3 聚点均衡(Focal Points Equilibrium)
■5.2.4 相关均衡
■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义
■7 作业
■8 参考文献
pure strategy)相对应。

混合策略:在博弈中,博弈方的策略空间为
,则博弈方i以概率分布随机在其
选策略中选择的“策略”,称为一个“混合策略”,其中,对
都成立,且。

混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作
定义:在博弈中,假设是一个混合策略,如果
成立,则称是一个混合策略纳什均衡(
Equilibrium)。

如果对于局中人及其的每一个混合策略,局中人关于的期望盈利至少与局中人关于的期望盈利一样大,即则称混合策略组合是这个博弈的一个纳什均衡。

纳什定理:在一个由个博弈方构成的博弈中,如果
的战略空间都是有限集(对),则该博弈至少存在一个纳什均衡(纯策略或者混合策略)。

设和为纳什均衡点,
,如果,则
如果,则对于任意的都是最大值;如果,则,上式取最大值。

同理,,可得,
两者的交点为(0.5,0.2),如图所示。

图形分析方法
这个问题不存在纯策略的纳什均衡。

假设政府救济的概率为,流浪汉找工作的概率为,则

,让、分别对和求导数,并令,即,,可得,,最后政府的收益为,流浪汉的收益为
的概率为,博弈方
为,则对于博弈方采取何种策略,其收益是不变化
的(即其分别采取策略
,可得;同
理,可以求得;最后可得博弈方1的收益为,博弈方。

相关文档
最新文档