纳什均衡ppt
合集下载
博弈论-混合策略纳什均衡PPT课件

25
说明
• 如果纳税人逃税的概率小于q*, • 则q<C/a+F ,税收机关的最优选择是不检
查; • 如果纳税人逃税的概率大于q*, • 则q>C/a+F ,税收机关的最优选择是检查; • 如果纳税人逃税的概率等于q*, • 则q=C/a+F ,税收机关随机地选择检查或
不检查。
26
之二
• 假设采用混合策略是税务机关的最优选择 那么给定p ,纳税人选择逃税和不逃税的期 望收益相等:
那么,政府的期望效用函数为:
vG G , L 3 11 1 01
5 1
对上述效用函数求微分,得到政府最优化的一阶条件 为:
vG
5
1 0 0.2
就是说,从政府的最优化条件找到流浪汉混合策略— —流浪汉以0.2的概率选择寻找工作,0 .8的概率选择 游闲。
• 答案是否定的。
• 事实上,局中人的选择仍然是很有讲究的, 策略选择的好坏对局中人的利益仍然有很大 的影响。
• 在这个零和博弈里,无论双方采用哪种策略 组合,结果都是一方输一方赢,而输的一方 又总是可以通过单独改变策略而反输为赢。 如果哪个局中人能找到对手方的规律或者偏 好,他就能猜测到对手的策略而采用针对性 策略从而保证赢。
政府
不救济 (-1,1) (0,0) 8
政府和流浪汉的博弈
• 思考:政府会采用纯策略吗?流浪汉呢?这 个博弈有没有纯策略的纳什均衡?
• ——跟你玩剪子石头布游戏一样,你会一直 采用纯策略吗?
• 那么政府和流浪汉最有可能采用什么策略? • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略,就可以采用针
vL 1, 1 3 vL 0,
说明
• 如果纳税人逃税的概率小于q*, • 则q<C/a+F ,税收机关的最优选择是不检
查; • 如果纳税人逃税的概率大于q*, • 则q>C/a+F ,税收机关的最优选择是检查; • 如果纳税人逃税的概率等于q*, • 则q=C/a+F ,税收机关随机地选择检查或
不检查。
26
之二
• 假设采用混合策略是税务机关的最优选择 那么给定p ,纳税人选择逃税和不逃税的期 望收益相等:
那么,政府的期望效用函数为:
vG G , L 3 11 1 01
5 1
对上述效用函数求微分,得到政府最优化的一阶条件 为:
vG
5
1 0 0.2
就是说,从政府的最优化条件找到流浪汉混合策略— —流浪汉以0.2的概率选择寻找工作,0 .8的概率选择 游闲。
• 答案是否定的。
• 事实上,局中人的选择仍然是很有讲究的, 策略选择的好坏对局中人的利益仍然有很大 的影响。
• 在这个零和博弈里,无论双方采用哪种策略 组合,结果都是一方输一方赢,而输的一方 又总是可以通过单独改变策略而反输为赢。 如果哪个局中人能找到对手方的规律或者偏 好,他就能猜测到对手的策略而采用针对性 策略从而保证赢。
政府
不救济 (-1,1) (0,0) 8
政府和流浪汉的博弈
• 思考:政府会采用纯策略吗?流浪汉呢?这 个博弈有没有纯策略的纳什均衡?
• ——跟你玩剪子石头布游戏一样,你会一直 采用纯策略吗?
• 那么政府和流浪汉最有可能采用什么策略? • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略,就可以采用针
vL 1, 1 3 vL 0,
纳什均衡理论课件

迭代逼近法
总结词
通过不断迭代和调整策略来逼近纳什均 衡。
VS
详细描述
迭代逼近法是一种通过不断迭代和调整参 与者的策略,以逐渐逼近纳什均衡的方法 。这种方法可以在不知道具体的纳什均衡 的情况下,通过迭代过程找到近似解。
04
纳什均衡的扩展与深化
非合作博弈中的纳什均衡
要点一
总结词
非合作博弈中,纳什均衡是指参与人选择策略时,没有达 成任何协议或合作,各自追求自身利益的最大化。
纳什均衡理论课件
目录 CONTENTS
• 纳什均衡理论概述 • 纳什均衡的分类与特性 • 纳什均衡的证明方法 • 纳什均衡的扩展与深化 • 纳什均衡理论的现实应用 • 纳什均衡理论的前沿研究与展望
01
纳什均衡理论概述
定义与概念
纳什均衡定义:在博弈中,如果每个参与者的策略都是针对其他参与者的最优策略 ,则该博弈状态被称为纳什均衡。
社会学
纳什均衡理论在社会学中用于研究社会行为、合作与冲突 、社会规范等领域,揭示了社会现象背后的博弈逻辑。
生物学
在生物学中,纳什均衡理论用于研究生物种群竞争、进化 策略等领域,解释了生物种群之间的生存竞争与演化现象 。
政治学
在政治学中,纳什均衡理论用于分析国际关系、政治竞争 等领域,揭示了权力与利益分配的博弈逻辑。
社会冲突管理
在处理社会冲突时,可运用纳什 均衡理论来分析各方的利益和策 略,寻求最优解决方案。
公共资源管理
在管理公共资源时,政府可运用 纳什均衡理论来分析个体和团体 的竞争策略,制定最佳资源分配 方案。
06
纳什均衡理论的前沿研究与展望
当前研究热点与难点
热点
复杂系统中的纳什均衡、多智能 体系统中的纳什均衡、网络博弈 中的纳什均衡
第三讲混合策略纳什均衡

第三讲混合策略纳什均 衡
PPT文档演模板
2020/12/8
第三讲混合策略纳什均衡
引言
◆有些博弈不存在纳什均衡,或者纳什均衡不唯
一,如猜硬币博弈,前述纳什均衡分析就无法 对博弈方的选择和博弈结果作明确的预测。 ◆这部分对不存在纳什均衡和存在多个纳什均衡 的博弈作一些讨论。
PPT文档演模板
第三讲混合策略纳什均衡
被选择的策略。 ➢ ◆混合策略 ➢ 混合策略:以一定的概率分布选择某几个行动的
策略。
PPT文档演模板
第三讲混合策略纳什均衡
混合策略
•◆混合策略定义:在n人博弈的策略式表述
中,假定参与人 有K个纯策略:
,那么,概率
分布
称为 的一个混合策略,这里
是 选择 的概率,对于所有
的
。
•◆ 显然,纯策略可以理解为混合策略的特例,比如说,
PPT文档演模板
第三讲混合策略纳什均衡
混合策略均衡
•工人
假定老板选择混合战略(0.5,
•监督 •老板
•不监督
•偷懒 1,-1 -2,3
•不偷懒
0.5) 工人选择“偷懒”期望支付
-1,2 •0. 为 (-1)×0.5+3×0.5=1
2,2
5 工人选择“不偷懒”期望支 •0. 付为2×0.5+2×0.5=2
n 博弈方2的期望得益为:
PPT文档演模板
第三讲混合策略纳什均衡
多重均衡博弈和混合策略
一、夫妻之争的混合策略纳什均衡
◆首先,该博弈有两个纳什均衡,本博弈的两个博弈方 不会害怕对方猜到自己的选择,他们主观上并不想隐 藏自己的选择。因此,该博弈中两博弈方的决策思路
和原则应该与没有纳什均衡的严格竞争博弈有所不同。
PPT文档演模板
2020/12/8
第三讲混合策略纳什均衡
引言
◆有些博弈不存在纳什均衡,或者纳什均衡不唯
一,如猜硬币博弈,前述纳什均衡分析就无法 对博弈方的选择和博弈结果作明确的预测。 ◆这部分对不存在纳什均衡和存在多个纳什均衡 的博弈作一些讨论。
PPT文档演模板
第三讲混合策略纳什均衡
被选择的策略。 ➢ ◆混合策略 ➢ 混合策略:以一定的概率分布选择某几个行动的
策略。
PPT文档演模板
第三讲混合策略纳什均衡
混合策略
•◆混合策略定义:在n人博弈的策略式表述
中,假定参与人 有K个纯策略:
,那么,概率
分布
称为 的一个混合策略,这里
是 选择 的概率,对于所有
的
。
•◆ 显然,纯策略可以理解为混合策略的特例,比如说,
PPT文档演模板
第三讲混合策略纳什均衡
混合策略均衡
•工人
假定老板选择混合战略(0.5,
•监督 •老板
•不监督
•偷懒 1,-1 -2,3
•不偷懒
0.5) 工人选择“偷懒”期望支付
-1,2 •0. 为 (-1)×0.5+3×0.5=1
2,2
5 工人选择“不偷懒”期望支 •0. 付为2×0.5+2×0.5=2
n 博弈方2的期望得益为:
PPT文档演模板
第三讲混合策略纳什均衡
多重均衡博弈和混合策略
一、夫妻之争的混合策略纳什均衡
◆首先,该博弈有两个纳什均衡,本博弈的两个博弈方 不会害怕对方猜到自己的选择,他们主观上并不想隐 藏自己的选择。因此,该博弈中两博弈方的决策思路
和原则应该与没有纳什均衡的严格竞争博弈有所不同。
《博弈论与信息经济学》纳什均衡的应用-PPT精选全文完整版

pi 2 ln Y ln N 2 ln N 1 ln n 1 ln y 1
p
N
n
2 ln Y
N
n
1 ln
N
N
n
2 ln
N
1
N n 1 ln n 1 N n 1 ln y 1
si
2 ln Y
2 ln
N
2 ln
n
2
ln
y
1
s
N
n
2 ln Y
N
n
2 ln
N
N
n
2 ln
n
2
p 2 ln y 3 ln y 6 2 ln y 3 y 6 4 ln y 4 ln 3 2 ln 2
s
4 ln y
4 4 ln y 8ln 2
s p 8ln 2 4 ln 3 2 ln 2 4 ln 3 6 ln 2 ln 81 ln 64 2 ln 9 8 0
y ,
6
2
ln
y 3
ln
y 6
每一期的消费量y1
2 3
y,y2
1 3
y
10
博弈论与信息经济学
2024/10/15
b.社会效益最大化模式 假定以整个村庄的人对公地消费的总体效用达到最大化为目标,即公地问
题的社会最优问题。
ln c1
ln c2
2 ln
y
c1 c2
2
最优条件为:
c1
pi s
p
2024/10/15
16
博弈论与信息经济学
比较的结果说明:
1 从社会整体上看,以社会利益最大化为目的的消费管理
方式优于以个人利益最大化的消费管理方式;
纳什均衡理论 优质课件

来源及定义 经典案例 重要影响
假设有n个局中人参与博弈,给定其他人策略 的条件下,每个局中人选择自己的纳什均衡。个 人最优策略可能依赖于也可能不依赖于他人的战 略,从而使自己利益最大化。所有局中人策略构 成一个策略组合。纳什均衡指的是这样一种战略 组合,这种策略组合由所有参与人最优策略组成。 即在给定别人策略的情况下,没有人有足够理由 打破这种均衡。纳什均衡,从实质上说,是一种 非合作博弈状态。纳什均衡达成时,并不意味着 博弈双方都处于不动的状态,在顺序博弈中这个 均衡是在博弈者连续的动作与反应中达成的。
关于案例,显然最好的策略是双方都抵赖,结 果是大家都只被判1年。但是由于两人处于隔离 的情况,首先应该是从心理学的角度来看,当 事双方都会怀疑对方会出卖自己以求自保,因 此都会从利己的目的出发进行选择。这两个人 都会有这样一个盘算过程:假如他坦白,如果 我抵赖,得坐10年监狱,如果我坦白最多才8年; 假如他要是抵赖,如果我也抵赖,我就会被判 一年,如果我坦白就可以被释放,而他会坐10 年牢。综合以上几种情况考虑,不管他坦白与 否,对我而言都是坦白了划算。两个人都会动 这样的脑筋,最终,两个人都选择了坦白,结 果都被判8年刑期。
当对手知道了你的 决定之后,就能做 出对自己最有利的 决定。
——纳什均衡理论
假设有两个小偷A和B联合犯事、私入民宅被 警察抓住。警方将两人分别置于不同的两个 房间内进行审讯。对每一个犯罪嫌疑人,警 方给出的政策是:如果一个犯罪嫌疑人坦白 了罪行,交出了赃物,于是证据确凿,两人 都被判有罪。如果另一个犯罪嫌疑人也作了 坦白,则两人各被判刑8年;如果另一个犯罪 嫌人没有坦白而是抵赖,则以妨碍公务罪 (因已有证据表明其有罪)再加刑2年,而坦 白者有功被减刑8年,立即释放。如果两人都 抵赖,则警方因证据不足不能判两人的偷窃 罪,但可以私入民宅的罪名将两人各判入狱1 年。
假设有n个局中人参与博弈,给定其他人策略 的条件下,每个局中人选择自己的纳什均衡。个 人最优策略可能依赖于也可能不依赖于他人的战 略,从而使自己利益最大化。所有局中人策略构 成一个策略组合。纳什均衡指的是这样一种战略 组合,这种策略组合由所有参与人最优策略组成。 即在给定别人策略的情况下,没有人有足够理由 打破这种均衡。纳什均衡,从实质上说,是一种 非合作博弈状态。纳什均衡达成时,并不意味着 博弈双方都处于不动的状态,在顺序博弈中这个 均衡是在博弈者连续的动作与反应中达成的。
关于案例,显然最好的策略是双方都抵赖,结 果是大家都只被判1年。但是由于两人处于隔离 的情况,首先应该是从心理学的角度来看,当 事双方都会怀疑对方会出卖自己以求自保,因 此都会从利己的目的出发进行选择。这两个人 都会有这样一个盘算过程:假如他坦白,如果 我抵赖,得坐10年监狱,如果我坦白最多才8年; 假如他要是抵赖,如果我也抵赖,我就会被判 一年,如果我坦白就可以被释放,而他会坐10 年牢。综合以上几种情况考虑,不管他坦白与 否,对我而言都是坦白了划算。两个人都会动 这样的脑筋,最终,两个人都选择了坦白,结 果都被判8年刑期。
当对手知道了你的 决定之后,就能做 出对自己最有利的 决定。
——纳什均衡理论
假设有两个小偷A和B联合犯事、私入民宅被 警察抓住。警方将两人分别置于不同的两个 房间内进行审讯。对每一个犯罪嫌疑人,警 方给出的政策是:如果一个犯罪嫌疑人坦白 了罪行,交出了赃物,于是证据确凿,两人 都被判有罪。如果另一个犯罪嫌疑人也作了 坦白,则两人各被判刑8年;如果另一个犯罪 嫌人没有坦白而是抵赖,则以妨碍公务罪 (因已有证据表明其有罪)再加刑2年,而坦 白者有功被减刑8年,立即释放。如果两人都 抵赖,则警方因证据不足不能判两人的偷窃 罪,但可以私入民宅的罪名将两人各判入狱1 年。
引言纳什均衡NashEquilibrium反应函数法.ppt

的利润分别为6,18和12,再作其它产量组合时亦会有不同的
结果。
最稳定的产量组合,是一个纳什均衡
表12-2 三厂商离散产量组合对应价格和利润
m1
m2
m3
p
π1
π2
π3
3
9
6
2
6
18
12
3
8
6
3
9
24
18
5
5
6
4
20
20
24
5
5
5
5
按博弈方式
非合作博弈 合作博弈
完全理性 有限理性
博弈分类
按博弈人数
二人博弈
二人零和博弈 二人非零和博弈
多人博弈
按博弈状态
静态博弈 动态博弈
完全信息静态博弈 不完全信息静态博弈 完全信息动态博弈 不完全信息动态博弈
Page 18
12.1.3 博弈的结构和分类
【例12-2】1943年2月,日本统帅山本五十六大将计划 由南太平洋新不列颠群岛的拉包尔出发,3天穿过俾 斯麦海,开往新几内亚的莱城,支援困守的日军。有 两条路线:北线和南线。
Two person finite non-zero-sum game
12.1 引 言
12.1.1 博弈论概述
博弈论(game theory)亦称对策论,是研究具有 对抗或竞争性质现象的数学理论和方法,它既是数 学、也是运筹学的一个重要分支。
博弈行为是博弈论中一个重要的概念。博弈行为 是指具有竞争或对抗性质的行为,在这类行为中, 参加斗争或竞争的各方各自具有不同的利益和目标, 各方需考虑对手的各种可能的行动方案,如何采取 行动以及与对手互动对自己最为有利 。
第二讲 纳什均衡 PPT课件

二、情侣博弈的结论:纳什均衡 (三)分类 2.普通纳什均衡 (1)均衡战略与非均衡战略无差异 (2)参与人单独改变策略后,支付可
能不变
2020年1月5日
博弈论第二章
12
第二讲纳什均衡
第三节 纳什均衡
三、寻找纳什均衡的方法
团队合作
(一)严格劣势策略反复消去法
乙
工作 偷懒
工作
6,6
+1,-1
+1,-1 +1,-1
博弈论第二章 第二讲纳什均衡
-1,+1
+1,-1 +3,-3
37
博弈论第二章
33
第二讲纳什均衡
第三节 纳什均衡
四、纳什均衡在微观经济学中的应用: 古诺模型
1.博弈三要素 (3)支付
i (q1, q2 ) (a q1 q2 ) qi ciqi
2020年1月5日
博弈论第二章
34
第二讲纳什均衡
第三节 纳什均衡
四、古诺模型
2.企业i的目标: max i
二、情侣博弈结论:纳什均衡 (一)表述 若存在一个策略组合(足球,足球),
当参与人单独改变策略后,支付下降, 此策略组合为纳什均衡。 ——博弈各方相互作用的稳定结局
2020年1月5日
博弈论第二章
9
第二讲纳什均衡
第三节 纳什均衡
二、情侣博弈的结论:纳什均衡 (二)定义
给定G={S1,…,Sn;u1,…,un}, s*=(s*1,…,sn*) 对于所有i和si∈Si,有: ui(si*,s-i*)≥ ui(si’,s-i*)
2020年1月5日
博弈论第二章
23
第二讲纳什均衡
能不变
2020年1月5日
博弈论第二章
12
第二讲纳什均衡
第三节 纳什均衡
三、寻找纳什均衡的方法
团队合作
(一)严格劣势策略反复消去法
乙
工作 偷懒
工作
6,6
+1,-1
+1,-1 +1,-1
博弈论第二章 第二讲纳什均衡
-1,+1
+1,-1 +3,-3
37
博弈论第二章
33
第二讲纳什均衡
第三节 纳什均衡
四、纳什均衡在微观经济学中的应用: 古诺模型
1.博弈三要素 (3)支付
i (q1, q2 ) (a q1 q2 ) qi ciqi
2020年1月5日
博弈论第二章
34
第二讲纳什均衡
第三节 纳什均衡
四、古诺模型
2.企业i的目标: max i
二、情侣博弈结论:纳什均衡 (一)表述 若存在一个策略组合(足球,足球),
当参与人单独改变策略后,支付下降, 此策略组合为纳什均衡。 ——博弈各方相互作用的稳定结局
2020年1月5日
博弈论第二章
9
第二讲纳什均衡
第三节 纳什均衡
二、情侣博弈的结论:纳什均衡 (二)定义
给定G={S1,…,Sn;u1,…,un}, s*=(s*1,…,sn*) 对于所有i和si∈Si,有: ui(si*,s-i*)≥ ui(si’,s-i*)
2020年1月5日
博弈论第二章
23
第二讲纳什均衡
混合策略纳什均衡概述(PPT 48张)

q 1
19
博弈论第三章 第一讲 概念与方法
作业
利用反应函数法求解“社会福利博弈” 是否需要调整数据? 可得出有关社会保障体系改革的结 论?
2019年2月26日
博弈论第三章 第一讲 概念与方法
20
友军博弈
英 国 支持巴顿 支持蒙帅 支持巴顿 4,3 2,2 美国 1,1 3,4 支持蒙帅
右
-5,-5,0 -1,-1,5
丙:B
博弈论第三章 第二讲多重纳什均衡
36
第三节多重纳什均衡的选择标准
五、抗共谋均衡 (二)共谋偏离(集体偏离)均衡的激励 1.如果集体偏离(上,左,A) (1)起因:甲、乙集体偏离,选(下,右, A) (2)结果:甲的支付0→1,乙的支付0→1 (3)结论:甲、乙有集体偏离的动机, (上,左,A)非抗共谋均衡
2019年2月26日
博弈论第三章 第一讲 概念与方法
17
二、研究方法:反应函数法
三、反应函数 2. Dela : Jim卖表的概率越小, Dela 剪发越好
UDel=2q(1-3p)+2p
1 ,ifp 1 /3 ,此时 1 3 p0 ,q 越大越好 q [ 0 , 1 ], ifp 1 /3 0 ,ifp 1 /3 ,此时 1 3 p0 ,q 越小越好
2019年2月26日
博弈论第三章 第二讲多重纳什均衡
37
第三节多重纳什均衡的选择标准
五、抗共谋均衡 (二)共谋偏离(集体偏离)均衡的激励 2.如果集体偏离(下,右,B) (1)若甲、乙集体偏离,选(上,左,B) -1→-2, -1→-2 (2)若甲、丙集体偏离,选(上,右,A) -1→-5, 5→0 (3)若乙、丙集体偏离,选(下,左,A) -1→-5, 5→0 (4)结论:缺乏集体偏离的激励, (下,右,B)为 抗共谋均衡
《博弈论与信息经济学》混合战略纳什均衡--ppt课件全篇

放荡
32
-1 3
-1 1 0 0
1
ppt课件
假定父母选择支助的概率为p1,选择不支助的概率为p2 1- p1 ; 儿子选择立志的概率为q1,选择不立志的概率为q2 1- q1 。那么
对两个参与人,各自的盈利函数为:
v1
3 p1q1
1
p1q2
1
p2q1
5
p1q1
p1
q1
v2 2 p1q1 p2q1 3 p1q2 2 p1q1 q1 3 p1
一个混合战略均衡:p*, q* 3 4,1 4。
p
甲
1
3/4 乙
O 1/4
12
1q
ppt课件
▪ 解法2:代数法
甲和乙的期望盈利:v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
v甲
p
v乙
q
4q 1 0 4p 3 0
p*
q*
3 4 1 4
13
ppt课件
▪ 例3(三人博弈)
K
pik 1,pik p sik 是i选择战略sik的概率,pi称为参与人i的混合战略。
k 1
i 代表i的混合战略空间,pi i 。
▪ (2)期望盈利
对于博弈G S1,..., Si ,..., Sn;u1,..., ui ,..., un,对应于s s1,..., si,..., sn 有p p1,..., pi ,..., pn ,pi i ,p表示局中人i的混合战略组合,那么,
2
即q 1 ,则p越小越好,而p的最小值只能取0;如果1 2q 0,
2
即q 1 ,则p能取任意值,即p 0,1。
2
对于乙来说,为使盈利达到最大,只有调整q。如果2 p 1 0,
《纳什均衡四川大学》PPT课件

找自己的策略 使得si 自 S己i 的收益
最Pi大(s1,,s2,但是, sn局) 中人
单方面不能找到自i 己的最佳策略,其结果是相互影响的,是由策
略组合
决定的。s 这(就s1,是s2,一个, s有n ) 相互影响的多人决策
问题。有人可能这样设想:是否有一个局外人,将 个局中人的
收益最大作n 为 个目标的多目标规划问n题,即求:
即
bij
bij
并在 下划线。当 不唯一时,均在下面划线。
7
猜钱币游戏
《博弈论及其应用》 (汪贤 裕)
《博弈论‹及#› 其应用》 (汪贤裕)
8
完全信息静态博弈三要素
局中人集合N {1,2,, n}
i 局中人集合即博弈参加人的集合。若给定局中人 ,则记 i N \ {i}
策略集 S i
每个局中人 i(i 有N一) 个策略集Si ,策略集Si , 可以是有限集,也可以是无限集,
b1n
b2n
bmn
《博弈论及其应用》 (汪贤 裕)
《博弈论‹及#› 其应用》 (汪贤裕)
30
双矩阵博弈称呼的由来(补充2)
(a11,b11)
(aij , bij )mn
(a21
,
b21
)
(am1 , bm1 )
(a12,b12 ) (a22,b22 )
(am2,bm2 )
(a1n,b1n )
若 s s1, s2,是重, sn复剔除占优均衡,但不是纯策略纳什均衡点。则有
t (i) 和Si t (i,) si , 使i 得N
Pi (s || si ) Pi (s || t (i) )(2.2.2)
s 那么在局中人 在i 对 t的(i)剔除过程中应有对任意的策略组合 满足
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
注意:在纳什均衡下,没有参与人有积极性单独偏离或改 变该策略或策略组合。
例1 政府 救济
不救济
流浪汉
找工作
游荡
3,2 -1 , 1
-1 , 3 0,0
假设政府救济的概率为 ;流浪汉找工作的概率为 ;
则
maxu1 [3 (1 )] (1 )( )
maxu2 [2 (1 )] 3(1 )
则 0.5, 0.2
例2
博 弈A 方B 1
博弈方2
C
D
2, 3 5, 2
3, 1 1, 5
博弈方1的混合策略
p1 3 (1 p1)1 p1 2 (1 p1)5
博弈方2的混合策略
p2 2 (1 p2 )5 p2 3 (1 p2 )1
策略
得益
博弈方1 (0.8,0.2) 2.6
博弈方2 (0.8,0.2) 2.6
p 1
0 1/2
1q
同理
UB ( p, q) 2q(2 p 1) (2 p 1)
因此A的最佳反应函数为
p
1
1, 当p 1/ 2
q [0,1],当p 1/ 2
1/2
0, 当p 1/ 2
0
1q
p 1
(P*, q*) (1/ 2,1/ 2)
1/2
纳什均衡是:A和B出红牌还
是出黑牌的概率都是1/2.
3 混合策略纳什均衡
主要内容
3.1 混合策略纳什均衡 3.2 多重纳什均衡博弈 3.3 多重纳什均衡博弈的分析
3.1 混合策略纳什均衡
猜硬币博弈
盖 正面 硬 币 反面 方
猜硬币方
正面
反面
-1, 1
1, -1
1, -1
-1, 1
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略
守卫
睡
不睡
小偷 偷
不偷
V,-D 0,S
-P,0 0,0
假设小偷选择偷的概率为 ;守卫选择睡觉的概率
为 r ;则
U1(, r) Vr P(1 r) U2(, r) D S(1 )r
分析得到纳什均衡 ( *, r*) ( S , P )
DS V P
守卫
守卫 得益((睡)
睡 不睡
S
小 偷 V,-D -P,0
例3 扑克牌对色游戏
B
红
黑
A
红 黑
-1 , 1 1 , -1
1 , -1 -1 , 1
假设A出红牌的概率为 p;B出红牌的概率为 q ;则
U A( p, q) 2 p(1 2q) (2q 1)
因此A的最佳反应函数为
0, 当q 1/ 2 p [0,1],当q 1/ 2
1, 当q 1/ 2
偷不偷 0,S 0,0
0
小偷
1 偷的概率
-D
- D’
加重对守卫的处罚:短期中的效果是使守卫尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概率
( *, r*) ( S , P )
DS V P
小偷 偷不偷
守卫 睡 不睡 V,-D -P,0 0,S 0,0
小偷 得益(偷)
0
-P
V
守卫
1 睡的概率
设 P* (P1*,, Pi*,, Pn* ) 是 n 人策略式博弈 G {S1,Sn;u1,un} 的一个混合策略组合,如果对于所有的 i 1,, n ,
i (Pi*, P*i ) i (Pi , P*i ) 对于每一个 Pi i 都成立,则称
混合策略组合 P* (P1*,, Pi*,, Pn*) 是这个博弈的一个纳什 均衡。
0
1/2 1 q
反应函数法
练习1:利用反应函数法找出政府与流浪汉博弈的纳什均衡
流浪汉
找工作
游荡
政府 救济 不救济
3,2 -1 , 1
-1 , 3 0,0
假设政府救济的概率为 ;流浪汉找工作的概率为 ;
则
u1 (5 1) ,u2 [1 2 ] 3
0, 当r 1/ 5
[0,1],当r 1/ 5
芭蕾 0,0 1,2
p 1
2/3
0 1/3
1q
例4 (激励的悖论)有一家公司为了防止盗窃聘请了一名门 卫,但是长期以来却发现仍有盗窃案件发生,公司讨论了两 种方案,一是只要有失窃案件,则加重惩罚门卫,另一方案 是,只要抓住小偷,则联合公安机关加重对小偷的惩罚。请 分析哪种方法对降低盗窃率有长效作用?
略空间为 Si {s1i ,sim} ,则博弈方 i 以概率分布
Pi
( pi , pi )
1
m
随机在其m个可选策略中选择的“策略”,称为一个“混合
策略”,其0中 pij 1 j 对1,, m
都成立,p且i pi 1
1
m
混合策略扩展博弈:博弈方在混合策略的策略空 间(概率分布空间)的选择看作一个博弈,就是原 博弈的“混合策略扩展博弈。
这类博弈很多,引出混合策略纳什均衡概念
s11
行
s
1 2
参
与
人
s
1 m
s12
a b, 11 11
a b, 21 21 Leabharlann a b, m1 m1列参与人
s
2 2
a b, 12 12
a b, 22 22
a b, m2 m2
s
2 n
a b, 1n 1n
a b, 21 21
a b, mn mn
混合策略:在博弈 G {S1,Sn;u1,un} 中,博弈方i 的策
不检查 0,0
A,-A
3.2 多重纳什均衡博弈
1)夫妻之争的混合策略纳什均衡
丽娟 足球
芭蕾
妻子的混合策略
大海 足球 2 , 1 0 , 0 芭蕾 0 , 0 1 , 2
pw(F)2 pw(B)0 pw(F)0 pw(B)1
设行参与人的策略选择概率为 P ( p1, p2,, pm ) ,列参与人的
策略选择概率为 Q (q1, q2,, qn )
mn
则参与人1的期望支付为 ( p, q) 1
piq j aij
i1 j1
mn
则参与人2的期望支付为 ( p, q) 2
piq jbij
i1 j1
混合策略纳什均衡
1, 当r 1/ 5
1, 当 1/ 2 r [0,1],当 1/ 2
0, 当 1/ 2
1
( *, r*) (1/ 2,1/ 5)
纳什均衡是:政府以1/2的概
1/2
率选择救助,流浪汉以1/5的
概率选择找工作。
0 1/5
1r
练习2:利用反应函数法找出情侣博弈的所有纳什均衡
丽娟 足球
大海 足球 2 , 1 芭蕾 0 , 0
- P’
加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会使得守卫更多的偷懒睡觉
监督博弈的纳税检查
• A 为应纳税款,C为检查成本, F是偷税罚款。 假定 C<A+F。不存在纯战略纳什均衡。请问: 如何才能降低纳税人逃税的可能性
纳税人
逃税
不逃税
税收机关 检查 A-C+F,-A-F A-C, -A
例1 政府 救济
不救济
流浪汉
找工作
游荡
3,2 -1 , 1
-1 , 3 0,0
假设政府救济的概率为 ;流浪汉找工作的概率为 ;
则
maxu1 [3 (1 )] (1 )( )
maxu2 [2 (1 )] 3(1 )
则 0.5, 0.2
例2
博 弈A 方B 1
博弈方2
C
D
2, 3 5, 2
3, 1 1, 5
博弈方1的混合策略
p1 3 (1 p1)1 p1 2 (1 p1)5
博弈方2的混合策略
p2 2 (1 p2 )5 p2 3 (1 p2 )1
策略
得益
博弈方1 (0.8,0.2) 2.6
博弈方2 (0.8,0.2) 2.6
p 1
0 1/2
1q
同理
UB ( p, q) 2q(2 p 1) (2 p 1)
因此A的最佳反应函数为
p
1
1, 当p 1/ 2
q [0,1],当p 1/ 2
1/2
0, 当p 1/ 2
0
1q
p 1
(P*, q*) (1/ 2,1/ 2)
1/2
纳什均衡是:A和B出红牌还
是出黑牌的概率都是1/2.
3 混合策略纳什均衡
主要内容
3.1 混合策略纳什均衡 3.2 多重纳什均衡博弈 3.3 多重纳什均衡博弈的分析
3.1 混合策略纳什均衡
猜硬币博弈
盖 正面 硬 币 反面 方
猜硬币方
正面
反面
-1, 1
1, -1
1, -1
-1, 1
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略
守卫
睡
不睡
小偷 偷
不偷
V,-D 0,S
-P,0 0,0
假设小偷选择偷的概率为 ;守卫选择睡觉的概率
为 r ;则
U1(, r) Vr P(1 r) U2(, r) D S(1 )r
分析得到纳什均衡 ( *, r*) ( S , P )
DS V P
守卫
守卫 得益((睡)
睡 不睡
S
小 偷 V,-D -P,0
例3 扑克牌对色游戏
B
红
黑
A
红 黑
-1 , 1 1 , -1
1 , -1 -1 , 1
假设A出红牌的概率为 p;B出红牌的概率为 q ;则
U A( p, q) 2 p(1 2q) (2q 1)
因此A的最佳反应函数为
0, 当q 1/ 2 p [0,1],当q 1/ 2
1, 当q 1/ 2
偷不偷 0,S 0,0
0
小偷
1 偷的概率
-D
- D’
加重对守卫的处罚:短期中的效果是使守卫尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概率
( *, r*) ( S , P )
DS V P
小偷 偷不偷
守卫 睡 不睡 V,-D -P,0 0,S 0,0
小偷 得益(偷)
0
-P
V
守卫
1 睡的概率
设 P* (P1*,, Pi*,, Pn* ) 是 n 人策略式博弈 G {S1,Sn;u1,un} 的一个混合策略组合,如果对于所有的 i 1,, n ,
i (Pi*, P*i ) i (Pi , P*i ) 对于每一个 Pi i 都成立,则称
混合策略组合 P* (P1*,, Pi*,, Pn*) 是这个博弈的一个纳什 均衡。
0
1/2 1 q
反应函数法
练习1:利用反应函数法找出政府与流浪汉博弈的纳什均衡
流浪汉
找工作
游荡
政府 救济 不救济
3,2 -1 , 1
-1 , 3 0,0
假设政府救济的概率为 ;流浪汉找工作的概率为 ;
则
u1 (5 1) ,u2 [1 2 ] 3
0, 当r 1/ 5
[0,1],当r 1/ 5
芭蕾 0,0 1,2
p 1
2/3
0 1/3
1q
例4 (激励的悖论)有一家公司为了防止盗窃聘请了一名门 卫,但是长期以来却发现仍有盗窃案件发生,公司讨论了两 种方案,一是只要有失窃案件,则加重惩罚门卫,另一方案 是,只要抓住小偷,则联合公安机关加重对小偷的惩罚。请 分析哪种方法对降低盗窃率有长效作用?
略空间为 Si {s1i ,sim} ,则博弈方 i 以概率分布
Pi
( pi , pi )
1
m
随机在其m个可选策略中选择的“策略”,称为一个“混合
策略”,其0中 pij 1 j 对1,, m
都成立,p且i pi 1
1
m
混合策略扩展博弈:博弈方在混合策略的策略空 间(概率分布空间)的选择看作一个博弈,就是原 博弈的“混合策略扩展博弈。
这类博弈很多,引出混合策略纳什均衡概念
s11
行
s
1 2
参
与
人
s
1 m
s12
a b, 11 11
a b, 21 21 Leabharlann a b, m1 m1列参与人
s
2 2
a b, 12 12
a b, 22 22
a b, m2 m2
s
2 n
a b, 1n 1n
a b, 21 21
a b, mn mn
混合策略:在博弈 G {S1,Sn;u1,un} 中,博弈方i 的策
不检查 0,0
A,-A
3.2 多重纳什均衡博弈
1)夫妻之争的混合策略纳什均衡
丽娟 足球
芭蕾
妻子的混合策略
大海 足球 2 , 1 0 , 0 芭蕾 0 , 0 1 , 2
pw(F)2 pw(B)0 pw(F)0 pw(B)1
设行参与人的策略选择概率为 P ( p1, p2,, pm ) ,列参与人的
策略选择概率为 Q (q1, q2,, qn )
mn
则参与人1的期望支付为 ( p, q) 1
piq j aij
i1 j1
mn
则参与人2的期望支付为 ( p, q) 2
piq jbij
i1 j1
混合策略纳什均衡
1, 当r 1/ 5
1, 当 1/ 2 r [0,1],当 1/ 2
0, 当 1/ 2
1
( *, r*) (1/ 2,1/ 5)
纳什均衡是:政府以1/2的概
1/2
率选择救助,流浪汉以1/5的
概率选择找工作。
0 1/5
1r
练习2:利用反应函数法找出情侣博弈的所有纳什均衡
丽娟 足球
大海 足球 2 , 1 芭蕾 0 , 0
- P’
加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会使得守卫更多的偷懒睡觉
监督博弈的纳税检查
• A 为应纳税款,C为检查成本, F是偷税罚款。 假定 C<A+F。不存在纯战略纳什均衡。请问: 如何才能降低纳税人逃税的可能性
纳税人
逃税
不逃税
税收机关 检查 A-C+F,-A-F A-C, -A