博弈论-混合策略纳什均衡.ppt

合集下载

混合策略纳什均衡

混合策略纳什均衡
博弈论简介(3)
(混合策略纳什均衡)
一个不存在纳什均衡的例子
硬币配对——“零和博弈”(zero sum game)
甲乙各持一枚硬币,同时选择手中硬币的正反面。 若他们硬币的朝向相同,乙将赢得甲的硬币。反之,甲将赢得乙的硬币。
参与人乙 正面H
正面H -1,+1 +1,-1
反面T
+1,-1 -1,+1
按照无差异原则,均衡中的q应使这两个表达式相等。
硬币配对博弈的混合策略均衡
参与人2
正面H(q) 参与人1 正面H 反面T -1,+1 +1,-1 反面T(1-q) +1,-1 -1,+1
• 也就是:1-2q=2q-1,即q=0.5 • 对称地,可以得到参与人1的最佳应对p=0.5 • 因此,(0.5,0.5)是这个硬币配对博弈的混合策略纳什均衡(符合直
在各自概率策略的选择下,双方的期望收益互为最大(任何单方面 改变不会增加其收益) 纳什证明:具有有限参与者和有限纯策略集的博弈一定存在纳什均 衡(包括混合策略均衡) 一般来说,找到混合策略的纳什均衡是很困难的,但在某些特定条 件下能有系统的方法。
双人双策略、不含纯策略均衡的博弈——混合策略纳 什均衡
考虑硬币面向的博弈
他 正面H H 你 T +1,-1 -1,+1 -1,+1 反面T +1,-1
• 你若知道对方的策略是以0.7的 概率出H,你会采取什么策略? 如果他的概率是0.2呢?
• 你若知道对方的策略是以0.5的概率 出H,你会采取什么策略?
“0.5”策略在此有什么特别?
如果对方用0.5,我出什么都
混合策略的收益计算例子

博弈论完整版PPT课件

博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。

博弈论-混合策略纳什均衡

博弈论-混合策略纳什均衡
,以达到均衡状态。
政治学的案例分析
总结词:国际关系
详细描述:在国际关系中,混合策略纳什均衡可以用来解释 国家之间的竞争和合作。例如,两个国家可能会以一定的概 率选择不同的外交政策,例如结盟、中立或对抗,以达到各 自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中,混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如,捕食者 可能会采用追逐和放弃两种策略来捕猎猎物,而猎物也可能会采用逃跑和装死两种策略 来避免被捕食。最终,捕食者和猎物都以一定的概率随机选择不同的策略,以达到均衡
非合作博弈论
研究个体如何在不知道其 他个体如何行动的情况下 做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体, 可以是个人、组织或国
家。
行动
参与者根据给定的信息 所做出的决策。
信息
参与者在进行决策时所 拥有的数据、情报或知
识。
策略
参与者为达到最优结果 而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词:繁殖竞争
VS
详细描述:在生物种群中,不同个体 之间会存在繁殖竞争。为了最大化自 己的遗传贡献,个体可能会采用不同 的交配策略,例如追求高繁殖成功率 的策略或避免过度竞争的策略。混合 策略纳什均衡可以用来描述这种竞争 状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中,生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分 析繁殖过程的均衡结果,解释生物多样性的形成机制。
05 混合策略纳什均衡的案例 分析
经济学的案例分析

《博弈论:混合策略》课件

《博弈论:混合策略》课件
决策分析
在决策分析中,通过混合策略模型来评估各种可能决策的结果和影响。
社会行为
研究社会群体中个体间的相互作用和行为决策,混合策略模型可以提供有效的分析工具。
混合策过概率调整在不同策略之间灵活选择,能够获得更好的效益。
2
缺点
需要大量的计算和建模工作,对决策者的信息和计算能力有一定要求。
各个决策者的策略选择使得不再有单方 面改变策略能够提高自己效益的动机。
混合策略的解释
灯光与阴影
可以将混合策略比喻为灯光与阴影相互交错的场景, 决策者通过灯光与阴影来选择不同策略。
调色板
混合策略就像调色板上的颜料,不同的搭配可以得 到丰富多样的色彩。
混合策略的应用
经济领域
混合策略在市场竞争、拍卖等方面的应用,分析参与者的策略选择与结果。
总结和结论
混合策略是博弈论中重要的概念和分析工具,通过灵活的策略选择和纳什均衡理论,可以帮助决策者在不确定 环境中做出最优决策。
2 随机选择
个体在选择策略时以随机概率来决定每个可行策略的选择概率。
混合策略下的纳什均衡
1
混合纳什均衡
2
是混合策略博弈中的纳什均衡概念,表
示各个决策者通过随机策略选择达到均
衡状态。
3
纳什均衡
是博弈理论中的一个重要概念,指的是 在博弈过程中,每个决策者根据其他决 策者的行动选择了自己对应的策略。
均衡策略
博弈论:混合策略
博弈论研究决策者在不同利益关系下的选择与策略,并分析各个决策者所能 获得的效益。
博弈论的定义
博弈论研究个体或组织在面对不确定行为时的决策问题,通过数学模型来分 析各种策略和其结果。涉及多种经济、社会和政治场景。
混合策略的概念

博弈论-混合策略纳什均衡PPT课件

博弈论-混合策略纳什均衡PPT课件

4 1

如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
vG 1, 4 1 vG 0,
0.2
13
• 解二:支付等值法
如果一个混合策略是政府的最优选择,那一定意 味着流浪汉在寻找工作与游闲之间是无差异的, 即:
4
§剪刀、石头、布的游戏
• 因此,秘决在于—— • 自己的策略选择不能预先被对手方知道或猜
测到,在该博弈的多次重复中,博弈方一定 要避免自己的选择具有规律性; • 观察对手方策略选择是否具有规律或者偏好, 预先猜测对手策略,从而采用针对性策略赢 得这个博弈。
5
§ 第三章 混合策略纳什均衡
• 纯策略(pure strategies):如果一个策略 规定参与人在一个给定的信息情况下只选择 一种特定的行动。
• 混合策略(mixed strategies):如果一个策 略规定参与人在给定的信息情况下,以某种 概率分布随机地选择不同的行动。
• 在静态博弈里,纯策略等价于特定的行动, 混合策略是不同行动之间的随机选择。
6
§ 期望支付
• 与混合策略(mixed strategies)相伴随的一个问 题,是局中人支付的不确定性(uncertainty).可用 期望支付(expected payoff)来描述——有个n 可能的取值X1,X2…,Xn ,并且这些取值发生的概 率分别为p1,p2,…,pn,那么我们可以将这个数 量指标的期望值定义为发生概率作为权重的所有 可能取值的加权平均,也就是
对性的策略,使自己的支付增加。
9
求解混合策略纳什均衡
1、假定政府采用混合策略:
G ,1 即政府以的概率选择救济,1 的概率选择不救济。

《博弈论与信息经济学》纳什均衡的应用-PPT精选全文完整版

《博弈论与信息经济学》纳什均衡的应用-PPT精选全文完整版

pi 2 ln Y ln N 2 ln N 1 ln n 1 ln y 1
p
N
n
2 ln Y
N
n
1 ln
N
N
n
2 ln
N
1
N n 1 ln n 1 N n 1 ln y 1
si
2 ln Y
2 ln
N
2 ln
n
2
ln
y
1
s
N
n
2 ln Y
N
n
2 ln
N
N
n
2 ln
n
2
p 2 ln y 3 ln y 6 2 ln y 3 y 6 4 ln y 4 ln 3 2 ln 2
s
4 ln y
4 4 ln y 8ln 2
s p 8ln 2 4 ln 3 2 ln 2 4 ln 3 6 ln 2 ln 81 ln 64 2 ln 9 8 0
y ,
6
2
ln
y 3
ln
y 6
每一期的消费量y1
2 3
y,y2
1 3
y
10
博弈论与信息经济学
2024/10/15
b.社会效益最大化模式 假定以整个村庄的人对公地消费的总体效用达到最大化为目标,即公地问
题的社会最优问题。
ln c1
ln c2
2 ln
y
c1 c2
2
最优条件为:
c1
pi s
p
2024/10/15
16
博弈论与信息经济学
比较的结果说明:
1 从社会整体上看,以社会利益最大化为目的的消费管理
方式优于以个人利益最大化的消费管理方式;

混合策略纳什均衡

混合策略纳什均衡

03 混合策略纳什均衡的证明 方法
反证法
总结词
通过假设不成立来证明均衡的存在。
详细描述
反证法是一种常用的证明方法,它首先假设与结论相反的命题成立,然后通过逻辑推理和数学推导,得出矛盾的 结论,从而证明原命题的正确性。在证明混合策略纳什均衡的存在时,反证法可以用来证明当其他玩家采取了最 优策略时,某个玩家采取混合策略能够达到最优结果。
唯一性意味着在给定对手策略的情况下,每个参与者都只有一个最优反应,从而 避免了复杂的策略互动和不确定性。
存在性
混合策略纳什均衡的存在性是指在某 些博弈中,至少存在一个策略组合, 使得每个参与者在给定其他参与者策 略的情况下,采用混合策略是最优的 。
存在性通常通过数学证明和计算机搜 索等方法来证明,但并不是所有博弈 都有混合策略纳什均衡。
混合策略纳什均衡
目录
CONTENTS
• 混合策略纳什均衡的定义 • 混合策略纳什均衡的特性 • 混合策略纳什均衡的证明方法 • 混合策略纳什均衡的应用场景 • 混合策略纳什均衡的局限性 • 混合策略纳什均衡的发展前景
01 混合策略纳什均衡的定义
定义
混合策略纳什均衡是一种博弈论中的均衡概念,它描述了在 给定对手策略的情况下,参与者如何选择最优策略以最大化 自己的期望收益。
代数法是一种通过数学符号和公式进行推 理和证明的方法。在证明混合策略纳什均 衡的存在时,代数法可以用来推导和证明 纳什均衡的条件和性质,利用代数性质和 技巧来证明均衡的存在。
04 混合策略纳什均衡的应用 场景
经济学
竞争策略分析
混合策略纳什均衡在经济学中被用于分析竞 争策略,特别是在不完全竞争市场和寡头垄 断市场中。通过混合策略纳什均衡,可以研 究企业在不确定环境下的最优反应,以及企 业如何通过调整其策略来应对竞争对手的行 为。

混合策略纳什均衡

混合策略纳什均衡
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
先看甲的最优反应,记为r*=R(q): 观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0,无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
纯策略(确定性)
q*=R(r)
(陈明德语) r 1 3/4
r*=R(q)
0 1/4 1 q (钟信德语)
博弈论 第三章 混合策略纳什均衡
第三节 寻找多重纳什均衡
二、反应对应法:情侣博弈
支付的帕累托优势:初步印象 π陈明=r(4q-1)+2(1-q),π钟信=q(4r-3)+(3-2r) r*=0, q*=0 纯策略(确定性)
第三节 寻找多重纳什均衡
例:情侣博弈
两个(多个)纯策略纳什均衡 问题:纳什均衡找完了吗?有无混合策略纳什均衡?
一、支付最大化法
给定混合策略p陈明=(r,1-r); p钟信=(q,1-q) Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q) r Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77) 无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q)

博弈论 混合战略纳什均衡

博弈论   混合战略纳什均衡

正面 1 正面 -1, -1 反面 1,
反面 -1 1, 1 -1,
如何理解混合战略 ——虚张声势
一个参与人选择混合战略的目的是给其 他参与人造成不确定性,这样尽管其他 参与人知道他选择某个特定纯战略的概 率是多少,但不知道实际上对手会采用 哪个战略。正是因为它在几个战略之间 的无差异性,他的行为才难以预测,混 合战略均衡才会出现。
混合战略纳什均衡
战略:参与人在给定信息集的情况下选择行动的规则, 战略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动, 它规定参与人在什么情况下选择什么行动,是参与人 相机行动方案” 的“相机行动方案”。
纯战略: 纯战略:如果一个战略规定参与人在每一个给定的信 息情况下只选择一种特定的行动, 只选择一种特定的行动 息情况下只选择一种特定的行动,该战略为 纯战略。 纯战略。 混合战略: 混合战略:如果一个战略规定参与人在给定信息情况 下以某种概率分布随机地选择不同的行动 则该战略为混合战略。 则该战略为混合战略。
i i −i
∑∏
s∈ S j =1
j
j
i
n个参与人的混合战略纳什均衡
让我们以两人博弈为例说明这一点。 让我们以两人博弈为例说明这一点。假定 S 1 = ( s 11 ,⋅ ⋅ ⋅ , s 1 K ) , S 2 = ( 有 个纯战略, , s2J ) 即参与人1有 ⋅ ⋅个纯战略 参与人2有 个纯战略 若参与人1相 个纯战略。 即参与人s 21 ,⋅K个纯战略,参与人 有J个纯战略。若参与人 相 信参与人2的混合战略为 那么,参与人1选择纯 信参与人 的混合战略为 ,那么σ 2 参与人,⋅ 选择纯 , = (σ 21 ⋅ ⋅ , σ 2 J ) J 的期望效用为: 战略 的期望效用为: s 1 k ∑ σ u (s , s )

《博弈论与信息经济学》混合战略纳什均衡--ppt课件全篇

《博弈论与信息经济学》混合战略纳什均衡--ppt课件全篇

放荡
32
-1 3
-1 1 0 0
1
ppt课件
假定父母选择支助的概率为p1,选择不支助的概率为p2 1- p1 ; 儿子选择立志的概率为q1,选择不立志的概率为q2 1- q1 。那么
对两个参与人,各自的盈利函数为:
v1
3 p1q1
1
p1q2
1
p2q1
5
p1q1
p1
q1
v2 2 p1q1 p2q1 3 p1q2 2 p1q1 q1 3 p1
一个混合战略均衡:p*, q* 3 4,1 4。
p

1
3/4 乙
O 1/4
12
1q
ppt课件
▪ 解法2:代数法
甲和乙的期望盈利:v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
v甲
p
v乙
q
4q 1 0 4p 3 0
p*
q*
3 4 1 4
13
ppt课件
▪ 例3(三人博弈)
K
pik 1,pik p sik 是i选择战略sik的概率,pi称为参与人i的混合战略。
k 1
i 代表i的混合战略空间,pi i 。
▪ (2)期望盈利
对于博弈G S1,..., Si ,..., Sn;u1,..., ui ,..., un,对应于s s1,..., si,..., sn 有p p1,..., pi ,..., pn ,pi i ,p表示局中人i的混合战略组合,那么,
2
即q 1 ,则p越小越好,而p的最小值只能取0;如果1 2q 0,
2
即q 1 ,则p能取任意值,即p 0,1。
2
对于乙来说,为使盈利达到最大,只有调整q。如果2 p 1 0,

第二章 纳什均衡 《博弈论与经济》 PPT课件

第二章  纳什均衡 《博弈论与经济》 PPT课件

▪ G的纳什均衡可由以下划线法求得。
▪ 1.对局中人1的每个策略i (i 1,2,, m) ,寻找局中人2的最
优反应。若最优反应为
j
,即 bij
max
k 1,2,,n
bik
,则在支付矩
阵元素 bij 下划一短线。
▪ 2.对局中人2的每个策略 j ( j 1,2,, n) ,寻找局中人1的
最优反应,若最优反应为 i
▪ 考虑由商店A, B构成的市场,A与B分别销售不同品牌的商 品,进行价格竞争。假设生产的单位成本为零。消费者 分为两类, n A ( 0)个消费者偏好于产品A,nB ( 0)个消费者 偏好于产品B。A,B两种品牌价格分别为 PA , PB 。设消费 者可从A或B处购买单位商品。
▪ 用 0表示由于购买不喜欢的产品所付出的厌恶成本,假 设消费者具有如下的效用函数
按 等待
等按待
(5,1) (9,1)
4,4
(0, 0)
▪ 严格纳什均衡为大猪“按”,小猪“等待”。
▪ 例2.7 在例1.8中的大堤维护博弈中,支付矩阵为
维护
不维护
不维维护护 ((1
4,4) 0,1 4)
((1140,,1100))
▪ 利用划线法可得纳什均衡(维护,维护),(不维护, 不维护)。
▪ 为了保护生命财产的安全,政府可以立法,如果参与人
第2章 纳什均衡
2.1 纳什均衡的定义
▪ 纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概念都是建 立在纳什均衡基础之上的。
▪ 纳什均衡是个策略组合 s* (si*, s*i ) ,它满足两个要求。

1.对每个局中人 i N
,能够预期到对手采用策略组合s

4 纳什均衡

4 纳什均衡
在竞选的时候,两党互相攻击越来越厉害, 而实际政治纲领却越来越靠近。等到一个政党 因为攻击另一个政党获胜取代对对手上台以后, 选民发现,新政府较老政府并没有多少实质的 改变。
精选可编辑ppt
14
假设:选民的政治态度从 0到 1排列,越往左代 表越支持劳工阶层,越往右代表越支持企业主 的利益。如下图所示:
三家都在中点是否是一个稳定的纳什均衡? 若三家都不在一起,各据一点,能否存在一种
情况为纳什均衡?
精选可编辑ppt
17
结论: 当三家杂货铺为选址而竞争,他们会转来
转去跳个不停:只要三家不在一块儿,单独在 最旁边的一家就要往中间挤;而一旦挤到一块 儿,马上又有动机要偏离,就这样转个不停。
实际生活中存在着往中间挤和转个不停的行为, 如:
精选可编辑ppt
26
生活中具有后动优势的例子 帆船比赛:
1983年,美洲杯帆船赛决赛前4轮后, “自由女神号”在这项以7比4胜的比赛 中暂时以3胜1负的成绩领先,也就是只 要再赢一局,他们就可彻底打败对手 “澳大利亚二号”。
第5轮比赛开始了,“澳大利亚二号” 起步违规,不得不撤回,重新起步,故 “自由女神号”在比赛一开始又获得了 37秒的优势。
若甲认为乙选左与右的可能性是一半对一 半,则甲选“上”支付为:9×1/2+0× 1/2=4.5;选“下”支付为8×1/2 +7×1/2=7.5,所以,甲会选“下”。
实例:猎人捉兔还是捉鹿的博弈
用考试作弊编故事
精选可编辑ppt
32
关于风险厌恶的统计
究竟应取具有支付优势的NE还是取具有风险优
势的NE呢?
精选可编辑ppt
12
(2)商业中心区的形成
在城市街道上,我们常见到一些地

混合策略纳许均衡课件

混合策略纳许均衡课件

策略纳什均衡的算法优化。
混合策略纳什均衡与人工智能
02
随着人工智能的发展,可以尝试将混合策略纳什均衡应用于机
器学习和人工智能领域,以实现更高效和智能的决策。
混合策略纳什均衡与演化博弈论的结合
03
研究混合策略纳什均衡与演化博弈论的结合,可以更好地解释
现实生活中的动态博弈现象。
06
参考文献
参考文献
定义
混合策略纳什均衡课件
CONTENTSБайду номын сангаас
• 混合策略纳什均衡简介 • 混合策略纳什均衡的数学模型 • 混合策略纳什均衡的求解方法 • 混合策略纳什均衡的应用实例 • 混合策略纳什均衡的挑战与展
望 • 参考文献
01
混合策略纳什均衡简介
定义与概念
混合策略纳什均衡是一种博弈论中的概念,它描述了在给定对手策略的情况下,参 与者如何选择最优的行动方案。
定义策略空间
为每个参与人定义一个策略选 择的空间,这些策略可以是离 散的、连续的或混合的。
定义支付函数
根据每个参与人的策略选择, 定义他们的支付函数,即每个 参与人在该策略下的期望收益。
构建博弈矩阵
根据参与人的策略空间和支付 函数,构建一个博弈矩阵,用 以表示每个参与人选择不同策
略时的收益。
模型参数解 释
纳什均衡点或满足一定的收敛条件。
优化算法
优化算法是一种基于数学优化的方法,用于求解混合策略纳什均衡。
优化算法的基本步骤包括:定义一个目标函数,然后使用优化算法(如 梯度下降法、牛顿法等)寻找目标函数的最大值或最小值,从而得到纳
什均衡点。
优化算法的优点是能够快速找到纳什均衡点,适用于大规模问题。但缺 点是需要对问题进行数学建模,且对初始点的选择敏感。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

游闲
政府
救济 不救济
政府和流浪汉的博弈
• 思考:政府会采用纯策略吗?流浪汉呢?这 个博弈有没有纯策略的纳什均衡?
• ——跟你玩剪子石头布游戏一样,你会一直 采用纯策略吗?
• 那么政府和流浪汉最有可能采用什么策略? • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略,就可以采用针
对性的策略,使自己的支付增加。
§剪刀、石头、布的游戏
• 因此,秘决在于—— • 自己的策略选择不能预先被对手方知道或猜
测到,在该博弈的多次重复中,博弈方一定 要避免自己的选择具有规律性; • 观察对手方策略选择是否具有规律或者偏好, 预先猜测对手策略,从而采用针对性策略赢 得这个博弈。
§ 第三章 混合策略纳什均衡
• 纯策略(pure strategies):如果一个策略规 定参与人在一个给定的信息情况下只选择一 种特定的行动。
求解混合策略纳什均衡
1、假定政府采用混合策略:
G,1 即政府 的以 概率选1择 的 救概 济率 ,选择不
2、流浪汉的混合策略为:
L,1 即流浪 的汉 概以 率选择 1寻 的找 概工 率作 选, 择
解一:支付最大化
那么,政府的期望效用函数为:
v G G , L 3 1 1 1 0 1 5 1
• 政府选择救济策略
• 政府选择不救济策略
1
期望效用
0 期望效用
vG1, 3 11 vG0, 1 01
4 1
如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
v G 1 ,4 1 v G 0 , 0 .2
• 解二:支付等值法
如果一个混合策略是政府的最优选择,那一定意 味着流浪汉在寻找工作与游闲之间是无差异的, 即:
E A U p 1 X 1 p 2 X 2 . .p .n X n
政府和流浪汉的博弈
• 政府想帮助流浪汉,但前提是后者必须试图寻 找工作,否则,不予帮助;而流浪汉若知道政 府采用救济策略的话,他就不会寻找工作。他 们只有在得不到政府救济时才会寻找工作。他 们获得的支付如图所示:
流浪汉
寻找工作
§剪刀、石头、布的游戏
• 我们知道—— • 如果博弈只进行一次,我们无法明确预测博
弈的结果,不管是哪个博弈方,也不管他们 的选择是哪个策略,都不能保证得到较好的 结果。根据我们上一章所学的方法,这个博 弈没有纳什均衡。
• 那么是不是意味着这样的博弈中,你可以随 意选择,结果都一样呢?
§剪刀、石头、布的游戏
对上述效用函数求微分,得到政府最优化的一阶条件 为:
v G 5 1 0 0 .2
就是说,从政府的最优化条件找到流浪汉混合策略— —流浪汉以0.2的概率选择寻找工作,0 .8的概率选择 游闲。
• 解一:支付最大化
• 流浪汉的期望效用函数为:
L
2 1 0
0.5
解二:支付等值法
核心概念的根本原因之一。
§扑克牌对色游戏
• 甲乙玩扑克牌对色游戏,每人都有红黑两张 扑克牌,约定如果出牌颜色一样,甲输乙赢, 如果出牌颜色不一样,则甲赢乙输。
• 答案是否定的。
• 事实上,局中人的选择仍然是很有讲究的, 策略选择的好坏对局中人的利益仍然有很大 的影响。
• 在这个零和博弈里,无论双方采用哪种策略 组合,结果都是一方输一方赢,而输的一方 又总是可以通过单独改变策略而反输为赢。 如果哪个局中人能找到对手方的规律或者偏 好,他就能猜测到对手的策略而采用针对性 策略从而保证赢。
§ 第三章 混合策略纳什均衡
• 混合策略与期望支付 • 计算混合策略纳什均衡的三种方法 • 支付最大值法 • 支付等值法 • 反应函数法 • 多重纳什均衡及其甄别 • 混合博弈在现实经济中的运用案例排对应的同学玩剪刀、石 头、布的游戏.
• 玩二十次,将结果记下来 • 赢了十次以上同学举起手来 • 告诉我你有什么秘决 • 怎么样才能赢得多?
vL1,13vL0, 0.5
政府和流浪汉的博弈
• 如果政府救济的概率小于0.5; • 则流浪汉的最优选择是寻找工作; • 如果政府救济的概率大于0.5; • 则流浪汉的最优选择是游闲等待救济。 • 如果政府救济的概率正好等于0.5; • 流浪汉的选择无差异。
讨论
• 上面的均衡要求每个参与人以特定的概率 选择纯策略。也就是说,一个参与人选择 不同策略的概率不是由他自己的支付决定 的,而是由他的对手的支付决定的。
• 正是由于这个原因,许多人认为混合策略 纳什均衡是一个难以令人满意的概念。
• 事实上,正是因为它在几个(或全部)策 略之间是无差异的,他的行为才难以预测, 混合策略纳什均衡才会存在。
讨论
• 尽管混合策略不像纯策略那样直观,但它确实是 一些博弈中参与人的合理行为方式。扑克比赛、 垒球比赛、划拳就是这样的例子,在这一类博弈 中,参与比赛的总是随机行动以使自己的行为不 被对方所预测。
• 混合策略(mixed strategies):如果一个策 略规定参与人在给定的信息情况下,以某种 概率分布随机地选择不同的行动。
• 在静态博弈里,纯策略等价于特定的行动, 混合策略是不同行动之间的随机选择。
§ 期望支付
• 与混合策略(mixed strategies)相伴随的一个问 题,是局中人支付的不确定性(uncertainty).可用 期望支付(expected payoff)来描述——有个n可 能的取值X1,X2…,Xn ,并且这些取值发生的概率 分别为p1,p2,…,pn,那么我们可以将这个数量指 标的期望值定义为发生概率作为权重的所有可能 取值的加权平均,也就是
• 经济学上的监督博弈也是这样一个例子。如税收 检查、质量检查、惩治犯罪、雇主监督雇员等都 可以看成猜谜博弈。
纳什均衡的存在性
纳什定理:在一个由n个博弈方的博弈G {S1, Sn;u1, 中un ,}
如果n是有限的,且 都S是i 有限集(对 i 1,) ,n则该博弈
至少存在一个纳什均衡,但可能包含混合策略。 • 证明过程省略,主要根据是布鲁威尔和角谷的不动点定理。 • 纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析
相关文档
最新文档