博弈论-混合策略纳什均衡.ppt
合集下载
混合策略纳什均衡
博弈论简介(3)
(混合策略纳什均衡)
一个不存在纳什均衡的例子
硬币配对——“零和博弈”(zero sum game)
甲乙各持一枚硬币,同时选择手中硬币的正反面。 若他们硬币的朝向相同,乙将赢得甲的硬币。反之,甲将赢得乙的硬币。
参与人乙 正面H
正面H -1,+1 +1,-1
反面T
+1,-1 -1,+1
按照无差异原则,均衡中的q应使这两个表达式相等。
硬币配对博弈的混合策略均衡
参与人2
正面H(q) 参与人1 正面H 反面T -1,+1 +1,-1 反面T(1-q) +1,-1 -1,+1
• 也就是:1-2q=2q-1,即q=0.5 • 对称地,可以得到参与人1的最佳应对p=0.5 • 因此,(0.5,0.5)是这个硬币配对博弈的混合策略纳什均衡(符合直
在各自概率策略的选择下,双方的期望收益互为最大(任何单方面 改变不会增加其收益) 纳什证明:具有有限参与者和有限纯策略集的博弈一定存在纳什均 衡(包括混合策略均衡) 一般来说,找到混合策略的纳什均衡是很困难的,但在某些特定条 件下能有系统的方法。
双人双策略、不含纯策略均衡的博弈——混合策略纳 什均衡
考虑硬币面向的博弈
他 正面H H 你 T +1,-1 -1,+1 -1,+1 反面T +1,-1
• 你若知道对方的策略是以0.7的 概率出H,你会采取什么策略? 如果他的概率是0.2呢?
• 你若知道对方的策略是以0.5的概率 出H,你会采取什么策略?
“0.5”策略在此有什么特别?
如果对方用0.5,我出什么都
混合策略的收益计算例子
(混合策略纳什均衡)
一个不存在纳什均衡的例子
硬币配对——“零和博弈”(zero sum game)
甲乙各持一枚硬币,同时选择手中硬币的正反面。 若他们硬币的朝向相同,乙将赢得甲的硬币。反之,甲将赢得乙的硬币。
参与人乙 正面H
正面H -1,+1 +1,-1
反面T
+1,-1 -1,+1
按照无差异原则,均衡中的q应使这两个表达式相等。
硬币配对博弈的混合策略均衡
参与人2
正面H(q) 参与人1 正面H 反面T -1,+1 +1,-1 反面T(1-q) +1,-1 -1,+1
• 也就是:1-2q=2q-1,即q=0.5 • 对称地,可以得到参与人1的最佳应对p=0.5 • 因此,(0.5,0.5)是这个硬币配对博弈的混合策略纳什均衡(符合直
在各自概率策略的选择下,双方的期望收益互为最大(任何单方面 改变不会增加其收益) 纳什证明:具有有限参与者和有限纯策略集的博弈一定存在纳什均 衡(包括混合策略均衡) 一般来说,找到混合策略的纳什均衡是很困难的,但在某些特定条 件下能有系统的方法。
双人双策略、不含纯策略均衡的博弈——混合策略纳 什均衡
考虑硬币面向的博弈
他 正面H H 你 T +1,-1 -1,+1 -1,+1 反面T +1,-1
• 你若知道对方的策略是以0.7的 概率出H,你会采取什么策略? 如果他的概率是0.2呢?
• 你若知道对方的策略是以0.5的概率 出H,你会采取什么策略?
“0.5”策略在此有什么特别?
如果对方用0.5,我出什么都
混合策略的收益计算例子
博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
博弈论-混合策略纳什均衡
,以达到均衡状态。
政治学的案例分析
总结词:国际关系
详细描述:在国际关系中,混合策略纳什均衡可以用来解释 国家之间的竞争和合作。例如,两个国家可能会以一定的概 率选择不同的外交政策,例如结盟、中立或对抗,以达到各 自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中,混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如,捕食者 可能会采用追逐和放弃两种策略来捕猎猎物,而猎物也可能会采用逃跑和装死两种策略 来避免被捕食。最终,捕食者和猎物都以一定的概率随机选择不同的策略,以达到均衡
非合作博弈论
研究个体如何在不知道其 他个体如何行动的情况下 做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体, 可以是个人、组织或国
家。
行动
参与者根据给定的信息 所做出的决策。
信息
参与者在进行决策时所 拥有的数据、情报或知
识。
策略
参与者为达到最优结果 而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词:繁殖竞争
VS
详细描述:在生物种群中,不同个体 之间会存在繁殖竞争。为了最大化自 己的遗传贡献,个体可能会采用不同 的交配策略,例如追求高繁殖成功率 的策略或避免过度竞争的策略。混合 策略纳什均衡可以用来描述这种竞争 状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中,生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分 析繁殖过程的均衡结果,解释生物多样性的形成机制。
05 混合策略纳什均衡的案例 分析
经济学的案例分析
政治学的案例分析
总结词:国际关系
详细描述:在国际关系中,混合策略纳什均衡可以用来解释 国家之间的竞争和合作。例如,两个国家可能会以一定的概 率选择不同的外交政策,例如结盟、中立或对抗,以达到各 自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中,混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如,捕食者 可能会采用追逐和放弃两种策略来捕猎猎物,而猎物也可能会采用逃跑和装死两种策略 来避免被捕食。最终,捕食者和猎物都以一定的概率随机选择不同的策略,以达到均衡
非合作博弈论
研究个体如何在不知道其 他个体如何行动的情况下 做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体, 可以是个人、组织或国
家。
行动
参与者根据给定的信息 所做出的决策。
信息
参与者在进行决策时所 拥有的数据、情报或知
识。
策略
参与者为达到最优结果 而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词:繁殖竞争
VS
详细描述:在生物种群中,不同个体 之间会存在繁殖竞争。为了最大化自 己的遗传贡献,个体可能会采用不同 的交配策略,例如追求高繁殖成功率 的策略或避免过度竞争的策略。混合 策略纳什均衡可以用来描述这种竞争 状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中,生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分 析繁殖过程的均衡结果,解释生物多样性的形成机制。
05 混合策略纳什均衡的案例 分析
经济学的案例分析
《博弈论:混合策略》课件
决策分析
在决策分析中,通过混合策略模型来评估各种可能决策的结果和影响。
社会行为
研究社会群体中个体间的相互作用和行为决策,混合策略模型可以提供有效的分析工具。
混合策过概率调整在不同策略之间灵活选择,能够获得更好的效益。
2
缺点
需要大量的计算和建模工作,对决策者的信息和计算能力有一定要求。
各个决策者的策略选择使得不再有单方 面改变策略能够提高自己效益的动机。
混合策略的解释
灯光与阴影
可以将混合策略比喻为灯光与阴影相互交错的场景, 决策者通过灯光与阴影来选择不同策略。
调色板
混合策略就像调色板上的颜料,不同的搭配可以得 到丰富多样的色彩。
混合策略的应用
经济领域
混合策略在市场竞争、拍卖等方面的应用,分析参与者的策略选择与结果。
总结和结论
混合策略是博弈论中重要的概念和分析工具,通过灵活的策略选择和纳什均衡理论,可以帮助决策者在不确定 环境中做出最优决策。
2 随机选择
个体在选择策略时以随机概率来决定每个可行策略的选择概率。
混合策略下的纳什均衡
1
混合纳什均衡
2
是混合策略博弈中的纳什均衡概念,表
示各个决策者通过随机策略选择达到均
衡状态。
3
纳什均衡
是博弈理论中的一个重要概念,指的是 在博弈过程中,每个决策者根据其他决 策者的行动选择了自己对应的策略。
均衡策略
博弈论:混合策略
博弈论研究决策者在不同利益关系下的选择与策略,并分析各个决策者所能 获得的效益。
博弈论的定义
博弈论研究个体或组织在面对不确定行为时的决策问题,通过数学模型来分 析各种策略和其结果。涉及多种经济、社会和政治场景。
混合策略的概念
在决策分析中,通过混合策略模型来评估各种可能决策的结果和影响。
社会行为
研究社会群体中个体间的相互作用和行为决策,混合策略模型可以提供有效的分析工具。
混合策过概率调整在不同策略之间灵活选择,能够获得更好的效益。
2
缺点
需要大量的计算和建模工作,对决策者的信息和计算能力有一定要求。
各个决策者的策略选择使得不再有单方 面改变策略能够提高自己效益的动机。
混合策略的解释
灯光与阴影
可以将混合策略比喻为灯光与阴影相互交错的场景, 决策者通过灯光与阴影来选择不同策略。
调色板
混合策略就像调色板上的颜料,不同的搭配可以得 到丰富多样的色彩。
混合策略的应用
经济领域
混合策略在市场竞争、拍卖等方面的应用,分析参与者的策略选择与结果。
总结和结论
混合策略是博弈论中重要的概念和分析工具,通过灵活的策略选择和纳什均衡理论,可以帮助决策者在不确定 环境中做出最优决策。
2 随机选择
个体在选择策略时以随机概率来决定每个可行策略的选择概率。
混合策略下的纳什均衡
1
混合纳什均衡
2
是混合策略博弈中的纳什均衡概念,表
示各个决策者通过随机策略选择达到均
衡状态。
3
纳什均衡
是博弈理论中的一个重要概念,指的是 在博弈过程中,每个决策者根据其他决 策者的行动选择了自己对应的策略。
均衡策略
博弈论:混合策略
博弈论研究决策者在不同利益关系下的选择与策略,并分析各个决策者所能 获得的效益。
博弈论的定义
博弈论研究个体或组织在面对不确定行为时的决策问题,通过数学模型来分 析各种策略和其结果。涉及多种经济、社会和政治场景。
混合策略的概念
博弈论-混合策略纳什均衡PPT课件
4 1
如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
vG 1, 4 1 vG 0,
0.2
13
• 解二:支付等值法
如果一个混合策略是政府的最优选择,那一定意 味着流浪汉在寻找工作与游闲之间是无差异的, 即:
4
§剪刀、石头、布的游戏
• 因此,秘决在于—— • 自己的策略选择不能预先被对手方知道或猜
测到,在该博弈的多次重复中,博弈方一定 要避免自己的选择具有规律性; • 观察对手方策略选择是否具有规律或者偏好, 预先猜测对手策略,从而采用针对性策略赢 得这个博弈。
5
§ 第三章 混合策略纳什均衡
• 纯策略(pure strategies):如果一个策略 规定参与人在一个给定的信息情况下只选择 一种特定的行动。
• 混合策略(mixed strategies):如果一个策 略规定参与人在给定的信息情况下,以某种 概率分布随机地选择不同的行动。
• 在静态博弈里,纯策略等价于特定的行动, 混合策略是不同行动之间的随机选择。
6
§ 期望支付
• 与混合策略(mixed strategies)相伴随的一个问 题,是局中人支付的不确定性(uncertainty).可用 期望支付(expected payoff)来描述——有个n 可能的取值X1,X2…,Xn ,并且这些取值发生的概 率分别为p1,p2,…,pn,那么我们可以将这个数 量指标的期望值定义为发生概率作为权重的所有 可能取值的加权平均,也就是
对性的策略,使自己的支付增加。
9
求解混合策略纳什均衡
1、假定政府采用混合策略:
G ,1 即政府以的概率选择救济,1 的概率选择不救济。
《博弈论与信息经济学》纳什均衡的应用-PPT精选全文完整版
pi 2 ln Y ln N 2 ln N 1 ln n 1 ln y 1
p
N
n
2 ln Y
N
n
1 ln
N
N
n
2 ln
N
1
N n 1 ln n 1 N n 1 ln y 1
si
2 ln Y
2 ln
N
2 ln
n
2
ln
y
1
s
N
n
2 ln Y
N
n
2 ln
N
N
n
2 ln
n
2
p 2 ln y 3 ln y 6 2 ln y 3 y 6 4 ln y 4 ln 3 2 ln 2
s
4 ln y
4 4 ln y 8ln 2
s p 8ln 2 4 ln 3 2 ln 2 4 ln 3 6 ln 2 ln 81 ln 64 2 ln 9 8 0
y ,
6
2
ln
y 3
ln
y 6
每一期的消费量y1
2 3
y,y2
1 3
y
10
博弈论与信息经济学
2024/10/15
b.社会效益最大化模式 假定以整个村庄的人对公地消费的总体效用达到最大化为目标,即公地问
题的社会最优问题。
ln c1
ln c2
2 ln
y
c1 c2
2
最优条件为:
c1
pi s
p
2024/10/15
16
博弈论与信息经济学
比较的结果说明:
1 从社会整体上看,以社会利益最大化为目的的消费管理
方式优于以个人利益最大化的消费管理方式;
混合策略纳什均衡
03 混合策略纳什均衡的证明 方法
反证法
总结词
通过假设不成立来证明均衡的存在。
详细描述
反证法是一种常用的证明方法,它首先假设与结论相反的命题成立,然后通过逻辑推理和数学推导,得出矛盾的 结论,从而证明原命题的正确性。在证明混合策略纳什均衡的存在时,反证法可以用来证明当其他玩家采取了最 优策略时,某个玩家采取混合策略能够达到最优结果。
唯一性意味着在给定对手策略的情况下,每个参与者都只有一个最优反应,从而 避免了复杂的策略互动和不确定性。
存在性
混合策略纳什均衡的存在性是指在某 些博弈中,至少存在一个策略组合, 使得每个参与者在给定其他参与者策 略的情况下,采用混合策略是最优的 。
存在性通常通过数学证明和计算机搜 索等方法来证明,但并不是所有博弈 都有混合策略纳什均衡。
混合策略纳什均衡
目录
CONTENTS
• 混合策略纳什均衡的定义 • 混合策略纳什均衡的特性 • 混合策略纳什均衡的证明方法 • 混合策略纳什均衡的应用场景 • 混合策略纳什均衡的局限性 • 混合策略纳什均衡的发展前景
01 混合策略纳什均衡的定义
定义
混合策略纳什均衡是一种博弈论中的均衡概念,它描述了在 给定对手策略的情况下,参与者如何选择最优策略以最大化 自己的期望收益。
代数法是一种通过数学符号和公式进行推 理和证明的方法。在证明混合策略纳什均 衡的存在时,代数法可以用来推导和证明 纳什均衡的条件和性质,利用代数性质和 技巧来证明均衡的存在。
04 混合策略纳什均衡的应用 场景
经济学
竞争策略分析
混合策略纳什均衡在经济学中被用于分析竞 争策略,特别是在不完全竞争市场和寡头垄 断市场中。通过混合策略纳什均衡,可以研 究企业在不确定环境下的最优反应,以及企 业如何通过调整其策略来应对竞争对手的行 为。
混合策略纳什均衡
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
先看甲的最优反应,记为r*=R(q): 观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0,无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
纯策略(确定性)
q*=R(r)
(陈明德语) r 1 3/4
r*=R(q)
0 1/4 1 q (钟信德语)
博弈论 第三章 混合策略纳什均衡
第三节 寻找多重纳什均衡
二、反应对应法:情侣博弈
支付的帕累托优势:初步印象 π陈明=r(4q-1)+2(1-q),π钟信=q(4r-3)+(3-2r) r*=0, q*=0 纯策略(确定性)
第三节 寻找多重纳什均衡
例:情侣博弈
两个(多个)纯策略纳什均衡 问题:纳什均衡找完了吗?有无混合策略纳什均衡?
一、支付最大化法
给定混合策略p陈明=(r,1-r); p钟信=(q,1-q) Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q) r Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77) 无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q)
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
先看甲的最优反应,记为r*=R(q): 观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0,无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
纯策略(确定性)
q*=R(r)
(陈明德语) r 1 3/4
r*=R(q)
0 1/4 1 q (钟信德语)
博弈论 第三章 混合策略纳什均衡
第三节 寻找多重纳什均衡
二、反应对应法:情侣博弈
支付的帕累托优势:初步印象 π陈明=r(4q-1)+2(1-q),π钟信=q(4r-3)+(3-2r) r*=0, q*=0 纯策略(确定性)
第三节 寻找多重纳什均衡
例:情侣博弈
两个(多个)纯策略纳什均衡 问题:纳什均衡找完了吗?有无混合策略纳什均衡?
一、支付最大化法
给定混合策略p陈明=(r,1-r); p钟信=(q,1-q) Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q) r Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77) 无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q)
博弈论 混合战略纳什均衡
正面 1 正面 -1, -1 反面 1,
反面 -1 1, 1 -1,
如何理解混合战略 ——虚张声势
一个参与人选择混合战略的目的是给其 他参与人造成不确定性,这样尽管其他 参与人知道他选择某个特定纯战略的概 率是多少,但不知道实际上对手会采用 哪个战略。正是因为它在几个战略之间 的无差异性,他的行为才难以预测,混 合战略均衡才会出现。
混合战略纳什均衡
战略:参与人在给定信息集的情况下选择行动的规则, 战略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动, 它规定参与人在什么情况下选择什么行动,是参与人 相机行动方案” 的“相机行动方案”。
纯战略: 纯战略:如果一个战略规定参与人在每一个给定的信 息情况下只选择一种特定的行动, 只选择一种特定的行动 息情况下只选择一种特定的行动,该战略为 纯战略。 纯战略。 混合战略: 混合战略:如果一个战略规定参与人在给定信息情况 下以某种概率分布随机地选择不同的行动 则该战略为混合战略。 则该战略为混合战略。
i i −i
∑∏
s∈ S j =1
j
j
i
n个参与人的混合战略纳什均衡
让我们以两人博弈为例说明这一点。 让我们以两人博弈为例说明这一点。假定 S 1 = ( s 11 ,⋅ ⋅ ⋅ , s 1 K ) , S 2 = ( 有 个纯战略, , s2J ) 即参与人1有 ⋅ ⋅个纯战略 参与人2有 个纯战略 若参与人1相 个纯战略。 即参与人s 21 ,⋅K个纯战略,参与人 有J个纯战略。若参与人 相 信参与人2的混合战略为 那么,参与人1选择纯 信参与人 的混合战略为 ,那么σ 2 参与人,⋅ 选择纯 , = (σ 21 ⋅ ⋅ , σ 2 J ) J 的期望效用为: 战略 的期望效用为: s 1 k ∑ σ u (s , s )
《博弈论与信息经济学》混合战略纳什均衡--ppt课件全篇
放荡
32
-1 3
-1 1 0 0
1
ppt课件
假定父母选择支助的概率为p1,选择不支助的概率为p2 1- p1 ; 儿子选择立志的概率为q1,选择不立志的概率为q2 1- q1 。那么
对两个参与人,各自的盈利函数为:
v1
3 p1q1
1
p1q2
1
p2q1
5
p1q1
p1
q1
v2 2 p1q1 p2q1 3 p1q2 2 p1q1 q1 3 p1
一个混合战略均衡:p*, q* 3 4,1 4。
p
甲
1
3/4 乙
O 1/4
12
1q
ppt课件
▪ 解法2:代数法
甲和乙的期望盈利:v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
v甲
p
v乙
q
4q 1 0 4p 3 0
p*
q*
3 4 1 4
13
ppt课件
▪ 例3(三人博弈)
K
pik 1,pik p sik 是i选择战略sik的概率,pi称为参与人i的混合战略。
k 1
i 代表i的混合战略空间,pi i 。
▪ (2)期望盈利
对于博弈G S1,..., Si ,..., Sn;u1,..., ui ,..., un,对应于s s1,..., si,..., sn 有p p1,..., pi ,..., pn ,pi i ,p表示局中人i的混合战略组合,那么,
2
即q 1 ,则p越小越好,而p的最小值只能取0;如果1 2q 0,
2
即q 1 ,则p能取任意值,即p 0,1。
2
对于乙来说,为使盈利达到最大,只有调整q。如果2 p 1 0,
第二章 纳什均衡 《博弈论与经济》 PPT课件
▪ G的纳什均衡可由以下划线法求得。
▪ 1.对局中人1的每个策略i (i 1,2,, m) ,寻找局中人2的最
优反应。若最优反应为
j
,即 bij
max
k 1,2,,n
bik
,则在支付矩
阵元素 bij 下划一短线。
▪ 2.对局中人2的每个策略 j ( j 1,2,, n) ,寻找局中人1的
最优反应,若最优反应为 i
▪ 考虑由商店A, B构成的市场,A与B分别销售不同品牌的商 品,进行价格竞争。假设生产的单位成本为零。消费者 分为两类, n A ( 0)个消费者偏好于产品A,nB ( 0)个消费者 偏好于产品B。A,B两种品牌价格分别为 PA , PB 。设消费 者可从A或B处购买单位商品。
▪ 用 0表示由于购买不喜欢的产品所付出的厌恶成本,假 设消费者具有如下的效用函数
按 等待
等按待
(5,1) (9,1)
4,4
(0, 0)
▪ 严格纳什均衡为大猪“按”,小猪“等待”。
▪ 例2.7 在例1.8中的大堤维护博弈中,支付矩阵为
维护
不维护
不维维护护 ((1
4,4) 0,1 4)
((1140,,1100))
▪ 利用划线法可得纳什均衡(维护,维护),(不维护, 不维护)。
▪ 为了保护生命财产的安全,政府可以立法,如果参与人
第2章 纳什均衡
2.1 纳什均衡的定义
▪ 纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概念都是建 立在纳什均衡基础之上的。
▪ 纳什均衡是个策略组合 s* (si*, s*i ) ,它满足两个要求。
▪
1.对每个局中人 i N
,能够预期到对手采用策略组合s
4 纳什均衡
在竞选的时候,两党互相攻击越来越厉害, 而实际政治纲领却越来越靠近。等到一个政党 因为攻击另一个政党获胜取代对对手上台以后, 选民发现,新政府较老政府并没有多少实质的 改变。
精选可编辑ppt
14
假设:选民的政治态度从 0到 1排列,越往左代 表越支持劳工阶层,越往右代表越支持企业主 的利益。如下图所示:
三家都在中点是否是一个稳定的纳什均衡? 若三家都不在一起,各据一点,能否存在一种
情况为纳什均衡?
精选可编辑ppt
17
结论: 当三家杂货铺为选址而竞争,他们会转来
转去跳个不停:只要三家不在一块儿,单独在 最旁边的一家就要往中间挤;而一旦挤到一块 儿,马上又有动机要偏离,就这样转个不停。
实际生活中存在着往中间挤和转个不停的行为, 如:
精选可编辑ppt
26
生活中具有后动优势的例子 帆船比赛:
1983年,美洲杯帆船赛决赛前4轮后, “自由女神号”在这项以7比4胜的比赛 中暂时以3胜1负的成绩领先,也就是只 要再赢一局,他们就可彻底打败对手 “澳大利亚二号”。
第5轮比赛开始了,“澳大利亚二号” 起步违规,不得不撤回,重新起步,故 “自由女神号”在比赛一开始又获得了 37秒的优势。
若甲认为乙选左与右的可能性是一半对一 半,则甲选“上”支付为:9×1/2+0× 1/2=4.5;选“下”支付为8×1/2 +7×1/2=7.5,所以,甲会选“下”。
实例:猎人捉兔还是捉鹿的博弈
用考试作弊编故事
精选可编辑ppt
32
关于风险厌恶的统计
究竟应取具有支付优势的NE还是取具有风险优
势的NE呢?
精选可编辑ppt
12
(2)商业中心区的形成
在城市街道上,我们常见到一些地
精选可编辑ppt
14
假设:选民的政治态度从 0到 1排列,越往左代 表越支持劳工阶层,越往右代表越支持企业主 的利益。如下图所示:
三家都在中点是否是一个稳定的纳什均衡? 若三家都不在一起,各据一点,能否存在一种
情况为纳什均衡?
精选可编辑ppt
17
结论: 当三家杂货铺为选址而竞争,他们会转来
转去跳个不停:只要三家不在一块儿,单独在 最旁边的一家就要往中间挤;而一旦挤到一块 儿,马上又有动机要偏离,就这样转个不停。
实际生活中存在着往中间挤和转个不停的行为, 如:
精选可编辑ppt
26
生活中具有后动优势的例子 帆船比赛:
1983年,美洲杯帆船赛决赛前4轮后, “自由女神号”在这项以7比4胜的比赛 中暂时以3胜1负的成绩领先,也就是只 要再赢一局,他们就可彻底打败对手 “澳大利亚二号”。
第5轮比赛开始了,“澳大利亚二号” 起步违规,不得不撤回,重新起步,故 “自由女神号”在比赛一开始又获得了 37秒的优势。
若甲认为乙选左与右的可能性是一半对一 半,则甲选“上”支付为:9×1/2+0× 1/2=4.5;选“下”支付为8×1/2 +7×1/2=7.5,所以,甲会选“下”。
实例:猎人捉兔还是捉鹿的博弈
用考试作弊编故事
精选可编辑ppt
32
关于风险厌恶的统计
究竟应取具有支付优势的NE还是取具有风险优
势的NE呢?
精选可编辑ppt
12
(2)商业中心区的形成
在城市街道上,我们常见到一些地
混合策略纳许均衡课件
策略纳什均衡的算法优化。
混合策略纳什均衡与人工智能
02
随着人工智能的发展,可以尝试将混合策略纳什均衡应用于机
器学习和人工智能领域,以实现更高效和智能的决策。
混合策略纳什均衡与演化博弈论的结合
03
研究混合策略纳什均衡与演化博弈论的结合,可以更好地解释
现实生活中的动态博弈现象。
06
参考文献
参考文献
定义
混合策略纳什均衡课件
CONTENTSБайду номын сангаас
• 混合策略纳什均衡简介 • 混合策略纳什均衡的数学模型 • 混合策略纳什均衡的求解方法 • 混合策略纳什均衡的应用实例 • 混合策略纳什均衡的挑战与展
望 • 参考文献
01
混合策略纳什均衡简介
定义与概念
混合策略纳什均衡是一种博弈论中的概念,它描述了在给定对手策略的情况下,参 与者如何选择最优的行动方案。
定义策略空间
为每个参与人定义一个策略选 择的空间,这些策略可以是离 散的、连续的或混合的。
定义支付函数
根据每个参与人的策略选择, 定义他们的支付函数,即每个 参与人在该策略下的期望收益。
构建博弈矩阵
根据参与人的策略空间和支付 函数,构建一个博弈矩阵,用 以表示每个参与人选择不同策
略时的收益。
模型参数解 释
纳什均衡点或满足一定的收敛条件。
优化算法
优化算法是一种基于数学优化的方法,用于求解混合策略纳什均衡。
优化算法的基本步骤包括:定义一个目标函数,然后使用优化算法(如 梯度下降法、牛顿法等)寻找目标函数的最大值或最小值,从而得到纳
什均衡点。
优化算法的优点是能够快速找到纳什均衡点,适用于大规模问题。但缺 点是需要对问题进行数学建模,且对初始点的选择敏感。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
游闲
政府
救济 不救济
政府和流浪汉的博弈
• 思考:政府会采用纯策略吗?流浪汉呢?这 个博弈有没有纯策略的纳什均衡?
• ——跟你玩剪子石头布游戏一样,你会一直 采用纯策略吗?
• 那么政府和流浪汉最有可能采用什么策略? • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略,就可以采用针
对性的策略,使自己的支付增加。
§剪刀、石头、布的游戏
• 因此,秘决在于—— • 自己的策略选择不能预先被对手方知道或猜
测到,在该博弈的多次重复中,博弈方一定 要避免自己的选择具有规律性; • 观察对手方策略选择是否具有规律或者偏好, 预先猜测对手策略,从而采用针对性策略赢 得这个博弈。
§ 第三章 混合策略纳什均衡
• 纯策略(pure strategies):如果一个策略规 定参与人在一个给定的信息情况下只选择一 种特定的行动。
求解混合策略纳什均衡
1、假定政府采用混合策略:
G,1 即政府 的以 概率选1择 的 救概 济率 ,选择不
2、流浪汉的混合策略为:
L,1 即流浪 的汉 概以 率选择 1寻 的找 概工 率作 选, 择
解一:支付最大化
那么,政府的期望效用函数为:
v G G , L 3 1 1 1 0 1 5 1
• 政府选择救济策略
• 政府选择不救济策略
1
期望效用
0 期望效用
vG1, 3 11 vG0, 1 01
4 1
如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
v G 1 ,4 1 v G 0 , 0 .2
• 解二:支付等值法
如果一个混合策略是政府的最优选择,那一定意 味着流浪汉在寻找工作与游闲之间是无差异的, 即:
E A U p 1 X 1 p 2 X 2 . .p .n X n
政府和流浪汉的博弈
• 政府想帮助流浪汉,但前提是后者必须试图寻 找工作,否则,不予帮助;而流浪汉若知道政 府采用救济策略的话,他就不会寻找工作。他 们只有在得不到政府救济时才会寻找工作。他 们获得的支付如图所示:
流浪汉
寻找工作
§剪刀、石头、布的游戏
• 我们知道—— • 如果博弈只进行一次,我们无法明确预测博
弈的结果,不管是哪个博弈方,也不管他们 的选择是哪个策略,都不能保证得到较好的 结果。根据我们上一章所学的方法,这个博 弈没有纳什均衡。
• 那么是不是意味着这样的博弈中,你可以随 意选择,结果都一样呢?
§剪刀、石头、布的游戏
对上述效用函数求微分,得到政府最优化的一阶条件 为:
v G 5 1 0 0 .2
就是说,从政府的最优化条件找到流浪汉混合策略— —流浪汉以0.2的概率选择寻找工作,0 .8的概率选择 游闲。
• 解一:支付最大化
• 流浪汉的期望效用函数为:
L
2 1 0
0.5
解二:支付等值法
核心概念的根本原因之一。
§扑克牌对色游戏
• 甲乙玩扑克牌对色游戏,每人都有红黑两张 扑克牌,约定如果出牌颜色一样,甲输乙赢, 如果出牌颜色不一样,则甲赢乙输。
• 答案是否定的。
• 事实上,局中人的选择仍然是很有讲究的, 策略选择的好坏对局中人的利益仍然有很大 的影响。
• 在这个零和博弈里,无论双方采用哪种策略 组合,结果都是一方输一方赢,而输的一方 又总是可以通过单独改变策略而反输为赢。 如果哪个局中人能找到对手方的规律或者偏 好,他就能猜测到对手的策略而采用针对性 策略从而保证赢。
§ 第三章 混合策略纳什均衡
• 混合策略与期望支付 • 计算混合策略纳什均衡的三种方法 • 支付最大值法 • 支付等值法 • 反应函数法 • 多重纳什均衡及其甄别 • 混合博弈在现实经济中的运用案例排对应的同学玩剪刀、石 头、布的游戏.
• 玩二十次,将结果记下来 • 赢了十次以上同学举起手来 • 告诉我你有什么秘决 • 怎么样才能赢得多?
vL1,13vL0, 0.5
政府和流浪汉的博弈
• 如果政府救济的概率小于0.5; • 则流浪汉的最优选择是寻找工作; • 如果政府救济的概率大于0.5; • 则流浪汉的最优选择是游闲等待救济。 • 如果政府救济的概率正好等于0.5; • 流浪汉的选择无差异。
讨论
• 上面的均衡要求每个参与人以特定的概率 选择纯策略。也就是说,一个参与人选择 不同策略的概率不是由他自己的支付决定 的,而是由他的对手的支付决定的。
• 正是由于这个原因,许多人认为混合策略 纳什均衡是一个难以令人满意的概念。
• 事实上,正是因为它在几个(或全部)策 略之间是无差异的,他的行为才难以预测, 混合策略纳什均衡才会存在。
讨论
• 尽管混合策略不像纯策略那样直观,但它确实是 一些博弈中参与人的合理行为方式。扑克比赛、 垒球比赛、划拳就是这样的例子,在这一类博弈 中,参与比赛的总是随机行动以使自己的行为不 被对方所预测。
• 混合策略(mixed strategies):如果一个策 略规定参与人在给定的信息情况下,以某种 概率分布随机地选择不同的行动。
• 在静态博弈里,纯策略等价于特定的行动, 混合策略是不同行动之间的随机选择。
§ 期望支付
• 与混合策略(mixed strategies)相伴随的一个问 题,是局中人支付的不确定性(uncertainty).可用 期望支付(expected payoff)来描述——有个n可 能的取值X1,X2…,Xn ,并且这些取值发生的概率 分别为p1,p2,…,pn,那么我们可以将这个数量指 标的期望值定义为发生概率作为权重的所有可能 取值的加权平均,也就是
• 经济学上的监督博弈也是这样一个例子。如税收 检查、质量检查、惩治犯罪、雇主监督雇员等都 可以看成猜谜博弈。
纳什均衡的存在性
纳什定理:在一个由n个博弈方的博弈G {S1, Sn;u1, 中un ,}
如果n是有限的,且 都S是i 有限集(对 i 1,) ,n则该博弈
至少存在一个纳什均衡,但可能包含混合策略。 • 证明过程省略,主要根据是布鲁威尔和角谷的不动点定理。 • 纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析