Game04纳什均衡 博弈论。课件。
合集下载
博弈论-混合策略纳什均衡PPT课件
![博弈论-混合策略纳什均衡PPT课件](https://img.taocdn.com/s3/m/b9b27b564b35eefdc8d333d2.png)
25
说明
• 如果纳税人逃税的概率小于q*, • 则q<C/a+F ,税收机关的最优选择是不检
查; • 如果纳税人逃税的概率大于q*, • 则q>C/a+F ,税收机关的最优选择是检查; • 如果纳税人逃税的概率等于q*, • 则q=C/a+F ,税收机关随机地选择检查或
不检查。
26
之二
• 假设采用混合策略是税务机关的最优选择 那么给定p ,纳税人选择逃税和不逃税的期 望收益相等:
那么,政府的期望效用函数为:
vG G , L 3 11 1 01
5 1
对上述效用函数求微分,得到政府最优化的一阶条件 为:
vG
5
1 0 0.2
就是说,从政府的最优化条件找到流浪汉混合策略— —流浪汉以0.2的概率选择寻找工作,0 .8的概率选择 游闲。
• 答案是否定的。
• 事实上,局中人的选择仍然是很有讲究的, 策略选择的好坏对局中人的利益仍然有很大 的影响。
• 在这个零和博弈里,无论双方采用哪种策略 组合,结果都是一方输一方赢,而输的一方 又总是可以通过单独改变策略而反输为赢。 如果哪个局中人能找到对手方的规律或者偏 好,他就能猜测到对手的策略而采用针对性 策略从而保证赢。
政府
不救济 (-1,1) (0,0) 8
政府和流浪汉的博弈
• 思考:政府会采用纯策略吗?流浪汉呢?这 个博弈有没有纯策略的纳什均衡?
• ——跟你玩剪子石头布游戏一样,你会一直 采用纯策略吗?
• 那么政府和流浪汉最有可能采用什么策略? • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略,就可以采用针
vL 1, 1 3 vL 0,
说明
• 如果纳税人逃税的概率小于q*, • 则q<C/a+F ,税收机关的最优选择是不检
查; • 如果纳税人逃税的概率大于q*, • 则q>C/a+F ,税收机关的最优选择是检查; • 如果纳税人逃税的概率等于q*, • 则q=C/a+F ,税收机关随机地选择检查或
不检查。
26
之二
• 假设采用混合策略是税务机关的最优选择 那么给定p ,纳税人选择逃税和不逃税的期 望收益相等:
那么,政府的期望效用函数为:
vG G , L 3 11 1 01
5 1
对上述效用函数求微分,得到政府最优化的一阶条件 为:
vG
5
1 0 0.2
就是说,从政府的最优化条件找到流浪汉混合策略— —流浪汉以0.2的概率选择寻找工作,0 .8的概率选择 游闲。
• 答案是否定的。
• 事实上,局中人的选择仍然是很有讲究的, 策略选择的好坏对局中人的利益仍然有很大 的影响。
• 在这个零和博弈里,无论双方采用哪种策略 组合,结果都是一方输一方赢,而输的一方 又总是可以通过单独改变策略而反输为赢。 如果哪个局中人能找到对手方的规律或者偏 好,他就能猜测到对手的策略而采用针对性 策略从而保证赢。
政府
不救济 (-1,1) (0,0) 8
政府和流浪汉的博弈
• 思考:政府会采用纯策略吗?流浪汉呢?这 个博弈有没有纯策略的纳什均衡?
• ——跟你玩剪子石头布游戏一样,你会一直 采用纯策略吗?
• 那么政府和流浪汉最有可能采用什么策略? • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略,就可以采用针
vL 1, 1 3 vL 0,
纳什均衡理论课件
![纳什均衡理论课件](https://img.taocdn.com/s3/m/72f39c17ac02de80d4d8d15abe23482fb5da0251.png)
迭代逼近法
总结词
通过不断迭代和调整策略来逼近纳什均 衡。
VS
详细描述
迭代逼近法是一种通过不断迭代和调整参 与者的策略,以逐渐逼近纳什均衡的方法 。这种方法可以在不知道具体的纳什均衡 的情况下,通过迭代过程找到近似解。
04
纳什均衡的扩展与深化
非合作博弈中的纳什均衡
要点一
总结词
非合作博弈中,纳什均衡是指参与人选择策略时,没有达 成任何协议或合作,各自追求自身利益的最大化。
纳什均衡理论课件
目录 CONTENTS
• 纳什均衡理论概述 • 纳什均衡的分类与特性 • 纳什均衡的证明方法 • 纳什均衡的扩展与深化 • 纳什均衡理论的现实应用 • 纳什均衡理论的前沿研究与展望
01
纳什均衡理论概述
定义与概念
纳什均衡定义:在博弈中,如果每个参与者的策略都是针对其他参与者的最优策略 ,则该博弈状态被称为纳什均衡。
社会学
纳什均衡理论在社会学中用于研究社会行为、合作与冲突 、社会规范等领域,揭示了社会现象背后的博弈逻辑。
生物学
在生物学中,纳什均衡理论用于研究生物种群竞争、进化 策略等领域,解释了生物种群之间的生存竞争与演化现象 。
政治学
在政治学中,纳什均衡理论用于分析国际关系、政治竞争 等领域,揭示了权力与利益分配的博弈逻辑。
社会冲突管理
在处理社会冲突时,可运用纳什 均衡理论来分析各方的利益和策 略,寻求最优解决方案。
公共资源管理
在管理公共资源时,政府可运用 纳什均衡理论来分析个体和团体 的竞争策略,制定最佳资源分配 方案。
06
纳什均衡理论的前沿研究与展望
当前研究热点与难点
热点
复杂系统中的纳什均衡、多智能 体系统中的纳什均衡、网络博弈 中的纳什均衡
博弈论课件第四章
![博弈论课件第四章](https://img.taocdn.com/s3/m/e30447bf05a1b0717fd5360cba1aa81145318f78.png)
3
合作博弈
参与者之间可以合作并制定共同策略,追求更大的利益。
纳什均衡理论
纳什均衡是博弈论中的一个重要概念,指的是当参与者根据对手的选择来选 择自己的策略时,不存在更好的选择。这种均衡状态具有稳定性和可持续性。
混合策略的应用
硬币翻转
混合策略可以应用于硬币翻转等 概率性决策中,以平衡风险。
剪刀石头布
博弈理论在法律
博弈论可在法律领域中应用于博弈模型的构建和法律决策的优化。
博弈论的应用领域
经济学
博弈论在经济学中用于研究市场竞争、拍卖和价格形成等问题。
政治学
博弈论在政治学中用于分析选举、合作和冲突等政治策略。
生物学
博弈论在生物学中用于研究进化和动物行为等领域。
博弈论中的主要模型
1
零和游戏
参与者的收益总和为零,一方的利益损失即为另一方的利益增益。
2
非合作博弈
参与者之间缺乏合作,每个参与者根据自身利益进行决策。
博弈论课件第四章
博弈论是研究决策制定和互动模型的学科,第四章将介绍博弈论的基本概念、 应用领域、主要模型以及纳什均衡理论和混合策略的应用,同时提供实际应 用案例。
博弈论的基本概念
1 参与者
博弈论研究多人决策制定过程中的参与者之间的互动。
2 策略
参与者在决策过程中可选择参与者根据他们的行动所获得的支付或效益。
混合策略可用于剪刀石头布等多 次对局中,通过随机选择策略以 增加不可预测性。
扑克筹码
混合策略可应用于扑克中的下注 决策,以提高筹码的价值和战略 性。
博弈论在实际问题中的应用案例
商业竞争
博弈论可用于分析企业在市场竞争中的策略选择和定价决策。
军事战略
F-博弈论专题--纳什均衡多重性精选PPT
![F-博弈论专题--纳什均衡多重性精选PPT](https://img.taocdn.com/s3/m/01f0fbde43323968011c92f0.png)
中国
欧 盟 求助
救助 (1500,300)
不救 (-200,-100)
等待 (2000,-200)
(0,0)
讨论分析:
1、温州民间借贷问题:政府如何出手? (1)出手600亿;(2)不管;(3)? 2、郑州市担保公司——扭曲的学习效应
温州市金融综合改革试验区,位于中国浙 江省,由国务院决定设立。 年3月28日, 国务院常务会议决定设立温州市金融综合 改革试验区,批准实施《浙江省温州市金 融综合改革试验区总体方案》,引导民间
在“性别战”博弈中,存在两个纯战略Nash均 衡——(F,F)和(B,B)以及一个混合战略Nash均 衡 ((3 , 1),(1 , 3)) 。
44 44
事实上,在对“性别战”博弈进行建模的过程 中,除了保留上图所示的要素(即参与人、战略 和支付)以外,其它与“性别战”博弈有关的所 有信息,如夫妻双方的生活习俗、他们所遵循 的文化传统等等,都被我们抛弃在模型之外。
博
弈U
方 1
D
博弈方2
L
R
9, 9 8, 0
0, 8 7, 7
风险上策均衡(D,R)
猎人2
鹿
兔子
猎 人
鹿
1 兔子
5, 5 3, 0
0, 3 3, 3
猎鹿博弈 风险上策均衡(兔子,兔子)
三、聚点(焦点)均衡
一对青年夫妻决定周末出去娱乐,可供他们娱乐的项目有或者去观看足球比赛(用表示F),或者观看芭蕾演出(用表示B)。 (2000,-200) (十)加强社会信用体系建设。
引导民间资金依法设立创业 企业、股权 企业及相关 管理机构。 (三)发展专业资产管理机构。 事实上,在对“性别战”博弈进行建模的过程中,除了保留上图所示的要素(即参与人、战略和支付)以外,其它与“性别战”博弈有关
Game_04_纳什均衡(纯策略)
![Game_04_纳什均衡(纯策略)](https://img.taocdn.com/s3/m/7f9b1b2c0722192e4536f69d.png)
– 没有单方偏离激励
3. 信念的协调
• 例:投资博弈
• 信念与行动一致
– 每个人对他人策略选择有着正确的信念 参与者 2 X L 参与者 1 F T 1, 0 0, 3 2, 1 Y 2, 2 0, 1 0, 0 Z 0, 1 2, 1 1, 2
9 10
乙 投资 甲 投资 不投资 (5, 5) 不投资 (-10, 0)
投资 不投资
(5, 5) (0, -10)
投资博弈:N=2
• 称策略组合 (投资,投资)、 (不投资,不投资) 为纳什均衡
– 没有单方偏离激励,具有自我实施性质
定义:纳什均衡
• 策略组合 s*=(s*1, s*2)是纳什均衡,如果 – 参与者的策略互为最优反应 • u1 (s*1, s*2) ≥ u1 (s1, s*2) – s*1=b1(s*2) s b (s 任意 s1 ∈S1
乙 投资 甲 投资 不投资 (5, 5) (0, -10) 不投资 (-10, 0) (0, 0)
5
• u2 (s*1, s*2) ≥ u2 (s*1, s2) – s*2=b2(s*1)
任意 s2 ∈S2
6
1
2. 纳什均衡与占优
• 占优策略组合:(坦白,坦白)
–是纳什均衡
2. 纳什均衡与占优
• 重复剔除严格劣策略得到的唯一策略组合: (X,X)
15
c
甲 c d (0, 0) (2, -1))
⎧ si if s1 +s 2 ≤ 100 ui ( s ) = ⎨ ⎩0 if s1 +s 2 >100
i = 1, 2
16
16
例:分饼博弈
• 参与者 i 的最优反应函数
例:分饼博弈
3. 信念的协调
• 例:投资博弈
• 信念与行动一致
– 每个人对他人策略选择有着正确的信念 参与者 2 X L 参与者 1 F T 1, 0 0, 3 2, 1 Y 2, 2 0, 1 0, 0 Z 0, 1 2, 1 1, 2
9 10
乙 投资 甲 投资 不投资 (5, 5) 不投资 (-10, 0)
投资 不投资
(5, 5) (0, -10)
投资博弈:N=2
• 称策略组合 (投资,投资)、 (不投资,不投资) 为纳什均衡
– 没有单方偏离激励,具有自我实施性质
定义:纳什均衡
• 策略组合 s*=(s*1, s*2)是纳什均衡,如果 – 参与者的策略互为最优反应 • u1 (s*1, s*2) ≥ u1 (s1, s*2) – s*1=b1(s*2) s b (s 任意 s1 ∈S1
乙 投资 甲 投资 不投资 (5, 5) (0, -10) 不投资 (-10, 0) (0, 0)
5
• u2 (s*1, s*2) ≥ u2 (s*1, s2) – s*2=b2(s*1)
任意 s2 ∈S2
6
1
2. 纳什均衡与占优
• 占优策略组合:(坦白,坦白)
–是纳什均衡
2. 纳什均衡与占优
• 重复剔除严格劣策略得到的唯一策略组合: (X,X)
15
c
甲 c d (0, 0) (2, -1))
⎧ si if s1 +s 2 ≤ 100 ui ( s ) = ⎨ ⎩0 if s1 +s 2 >100
i = 1, 2
16
16
例:分饼博弈
• 参与者 i 的最优反应函数
例:分饼博弈
第十章博弈论初步-PPT精品
![第十章博弈论初步-PPT精品](https://img.taocdn.com/s3/m/ce581ec3b307e87100f69605.png)
▪ 1、纳什均衡的定义:
▪ 设 s(s1, .., .sn)是n人博弈G={ ; S1, .., . Sn u1,.., . un } 的一个策略组合。如果对于每个局中人 i , ui(s1 , ., .s .i 1 , si , si 1 , ., .s .n )≥ ui(s1 , ., .s .i 1 , si, si 1 , ., .s .n )
第十章 博弈论初步 Game Theory
博弈论概述 纳什均衡 序贯博弈与重复博弈 进入威慑
第一节 博弈论概述
▪ 什么是博弈? ▪ 拍卖金钱 ▪ 海盗博弈 ▪ 田忌赛马 ▪ 围棋和象棋
齐王
田忌
上
中
下
上 赢,输 赢,输 赢,输
中 输,赢 赢,输 赢,输
下 输,赢 输,赢 赢,输
一、博弈的基本要素
ui(si,si) ≥ ui(si,si) 对于所有si Si 都成立,则我们称策略组合
s(s1, .., .sn)
是该博弈的一个纳什均衡。
▪ 纳什简介: ▪ 约翰·纳什生于1928年6月13日。父亲是电子工程师
与教师,第一次世界大战的老兵。纳什小时孤独内 向。纳什的数学天分大约在14岁开始展现。他在普 林斯顿大学读博士时刚刚二十出头,但他的一篇关 于非合作博弈的博士论文和其他相关文章,确立了 他博弈论大师的地位。在20世纪50年代末,他已是 闻名世界的科学家了。 ▪ 然而,30岁的时候,纳什和他惟一儿子都罹患精神 分裂症。半个世纪之后,在他妻子(艾利西亚—— —麻省理工学院物理系毕业生)的精心照料下,和 她的儿子一样,纳什教授渐渐康复,并在1994年获 得诺贝尔经济学奖。 ▪ 影片《美丽心灵》是一部以纳什的生平经历为基础 而创作的人物传记片。该片荣获2019年奥斯卡金像 奖。
《博弈论与信息经济学》纳什均衡的应用-PPT精选全文完整版
![《博弈论与信息经济学》纳什均衡的应用-PPT精选全文完整版](https://img.taocdn.com/s3/m/173da641a66e58fafab069dc5022aaea988f4175.png)
pi 2 ln Y ln N 2 ln N 1 ln n 1 ln y 1
p
N
n
2 ln Y
N
n
1 ln
N
N
n
2 ln
N
1
N n 1 ln n 1 N n 1 ln y 1
si
2 ln Y
2 ln
N
2 ln
n
2
ln
y
1
s
N
n
2 ln Y
N
n
2 ln
N
N
n
2 ln
n
2
p 2 ln y 3 ln y 6 2 ln y 3 y 6 4 ln y 4 ln 3 2 ln 2
s
4 ln y
4 4 ln y 8ln 2
s p 8ln 2 4 ln 3 2 ln 2 4 ln 3 6 ln 2 ln 81 ln 64 2 ln 9 8 0
y ,
6
2
ln
y 3
ln
y 6
每一期的消费量y1
2 3
y,y2
1 3
y
10
博弈论与信息经济学
2024/10/15
b.社会效益最大化模式 假定以整个村庄的人对公地消费的总体效用达到最大化为目标,即公地问
题的社会最优问题。
ln c1
ln c2
2 ln
y
c1 c2
2
最优条件为:
c1
pi s
p
2024/10/15
16
博弈论与信息经济学
比较的结果说明:
1 从社会整体上看,以社会利益最大化为目的的消费管理
方式优于以个人利益最大化的消费管理方式;
第二讲 纳什均衡 PPT课件
![第二讲 纳什均衡 PPT课件](https://img.taocdn.com/s3/m/2fc60f16cfc789eb162dc806.png)
二、情侣博弈的结论:纳什均衡 (三)分类 2.普通纳什均衡 (1)均衡战略与非均衡战略无差异 (2)参与人单独改变策略后,支付可
能不变
2020年1月5日
博弈论第二章
12
第二讲纳什均衡
第三节 纳什均衡
三、寻找纳什均衡的方法
团队合作
(一)严格劣势策略反复消去法
乙
工作 偷懒
工作
6,6
+1,-1
+1,-1 +1,-1
博弈论第二章 第二讲纳什均衡
-1,+1
+1,-1 +3,-3
37
博弈论第二章
33
第二讲纳什均衡
第三节 纳什均衡
四、纳什均衡在微观经济学中的应用: 古诺模型
1.博弈三要素 (3)支付
i (q1, q2 ) (a q1 q2 ) qi ciqi
2020年1月5日
博弈论第二章
34
第二讲纳什均衡
第三节 纳什均衡
四、古诺模型
2.企业i的目标: max i
二、情侣博弈结论:纳什均衡 (一)表述 若存在一个策略组合(足球,足球),
当参与人单独改变策略后,支付下降, 此策略组合为纳什均衡。 ——博弈各方相互作用的稳定结局
2020年1月5日
博弈论第二章
9
第二讲纳什均衡
第三节 纳什均衡
二、情侣博弈的结论:纳什均衡 (二)定义
给定G={S1,…,Sn;u1,…,un}, s*=(s*1,…,sn*) 对于所有i和si∈Si,有: ui(si*,s-i*)≥ ui(si’,s-i*)
2020年1月5日
博弈论第二章
23
第二讲纳什均衡
能不变
2020年1月5日
博弈论第二章
12
第二讲纳什均衡
第三节 纳什均衡
三、寻找纳什均衡的方法
团队合作
(一)严格劣势策略反复消去法
乙
工作 偷懒
工作
6,6
+1,-1
+1,-1 +1,-1
博弈论第二章 第二讲纳什均衡
-1,+1
+1,-1 +3,-3
37
博弈论第二章
33
第二讲纳什均衡
第三节 纳什均衡
四、纳什均衡在微观经济学中的应用: 古诺模型
1.博弈三要素 (3)支付
i (q1, q2 ) (a q1 q2 ) qi ciqi
2020年1月5日
博弈论第二章
34
第二讲纳什均衡
第三节 纳什均衡
四、古诺模型
2.企业i的目标: max i
二、情侣博弈结论:纳什均衡 (一)表述 若存在一个策略组合(足球,足球),
当参与人单独改变策略后,支付下降, 此策略组合为纳什均衡。 ——博弈各方相互作用的稳定结局
2020年1月5日
博弈论第二章
9
第二讲纳什均衡
第三节 纳什均衡
二、情侣博弈的结论:纳什均衡 (二)定义
给定G={S1,…,Sn;u1,…,un}, s*=(s*1,…,sn*) 对于所有i和si∈Si,有: ui(si*,s-i*)≥ ui(si’,s-i*)
2020年1月5日
博弈论第二章
23
第二讲纳什均衡
纳什博弈论的原理及应用PPT课件
![纳什博弈论的原理及应用PPT课件](https://img.taocdn.com/s3/m/f79dee8928ea81c758f57870.png)
3
• ,
一 型础论冯 一 忌两
九 五
0 年 纳 什 提 出 非 合 作 博 弈
博 弈 。
但 存 在 局 限 性
和 经 济 行 为
奠
诺 依 曼 和 摩 根
< >
,
主定斯
要了特
说这恩
明门的
了 合
学 科
博
作基弈
八 三 八 年 古 诺 的 双 寡
头 垄 断 博 弈
赛千 马多 获年 胜前
孙 膑 利 用 博
8
对甲,乙囚犯心理分析(2)
乙囚犯心理:
甲,乙囚犯心理分析
要么交待,要么不交待。 (2)
如果乙不交待,我交待, 我只会判1年刑。
如果我不交待,甲交待, 我会判10年刑。即使甲 也交待,我两人各判5年 刑。
这种策略是损人利己的 策略。交待还有更多好 处。如果对方交待而自 己不交待,太不划算了。 因此,即使都同时交待 最多也就各判5年刑。
11
现实社会中产生纳什均衡的原因:
1,人类的利己行为。 2,沟通的成本及沟
通上的困难。 3,人类对社会各种
现象认识的阶段局限 性。
12
现实社会中纳什均衡现象
1,厂商价格战博弈
厂商希望通过价格战,进一步扩大市场占 有率,以获取利润。厂商之间的价格博弈是纳 什均衡,博弈的结果是导致所有厂商获利的下 降,但这对消费者是有利的。也就是非合作行 为导致了社会期望的经济效率状态。但如果厂 商合作行动就会产生垄断价格,消费者的利益 就会受到伤害,不能达到社会经济效率状态。
13
写在最后
经常不断地学习,你就什么都知道。你知道得越多,你就越有力量 Study Constantly, And You Will Know Everything. The More
• ,
一 型础论冯 一 忌两
九 五
0 年 纳 什 提 出 非 合 作 博 弈
博 弈 。
但 存 在 局 限 性
和 经 济 行 为
奠
诺 依 曼 和 摩 根
< >
,
主定斯
要了特
说这恩
明门的
了 合
学 科
博
作基弈
八 三 八 年 古 诺 的 双 寡
头 垄 断 博 弈
赛千 马多 获年 胜前
孙 膑 利 用 博
8
对甲,乙囚犯心理分析(2)
乙囚犯心理:
甲,乙囚犯心理分析
要么交待,要么不交待。 (2)
如果乙不交待,我交待, 我只会判1年刑。
如果我不交待,甲交待, 我会判10年刑。即使甲 也交待,我两人各判5年 刑。
这种策略是损人利己的 策略。交待还有更多好 处。如果对方交待而自 己不交待,太不划算了。 因此,即使都同时交待 最多也就各判5年刑。
11
现实社会中产生纳什均衡的原因:
1,人类的利己行为。 2,沟通的成本及沟
通上的困难。 3,人类对社会各种
现象认识的阶段局限 性。
12
现实社会中纳什均衡现象
1,厂商价格战博弈
厂商希望通过价格战,进一步扩大市场占 有率,以获取利润。厂商之间的价格博弈是纳 什均衡,博弈的结果是导致所有厂商获利的下 降,但这对消费者是有利的。也就是非合作行 为导致了社会期望的经济效率状态。但如果厂 商合作行动就会产生垄断价格,消费者的利益 就会受到伤害,不能达到社会经济效率状态。
13
写在最后
经常不断地学习,你就什么都知道。你知道得越多,你就越有力量 Study Constantly, And You Will Know Everything. The More
博弈论及其应用纯战略纳什均衡的应用课件
![博弈论及其应用纯战略纳什均衡的应用课件](https://img.taocdn.com/s3/m/e93d61880408763231126edb6f1aff00bed57081.png)
争等。
纯战略纳什均衡的求解方法
迭代法
通过不断迭代计算每个参与者的 最优策略,逐步逼近纯战略纳什
均衡。
代数法
利用代数方法求解纯战略纳什均衡 ,适用于某些特定类型的博弈。
线性规划法
通过线性规划方法求解纯战略纳什 均衡,适用于具有线性特征的博弈 。
纯战略纳什均衡的应用场景
商业竞争
纯战略纳什均衡可用于分析商业 竞争中的策略选择和竞争格局。
06
纯战略纳什均衡在其他领域的应用
军事战略中的纯战略纳什均衡
总结词
军事战略中,纯战略纳什均衡可以应用于分析敌我双方的策略互动,制定最优的军事行 动计划。
详细描述
在军事战略中,纯战略纳什均衡可以用来分析敌对双方在战争中的策略互动。通过理解 对手可能的反应和最优行动,可以制定出最优的军事行动计划,以最大化己方的利益。 例如,在战争中,了解敌人的兵力部署和行动模式,可以预测其可能的反击或进攻,从
通过反复迭代计算来逼近纳什均衡。
03
纯战略纳什均衡
纯战略纳什均衡的定义
纯战略纳什均衡是一种博弈策略 组合,其中每个参与者在给定其 他参与者策略的情况下,选择自
己的最优策略。
在纯战略纳什均衡中,每个参与 者的最优策略都是基于其他参与 者的策略选择的,从而形成一种
稳定的策略组合。
纯战略纳什均衡是一种非合作博 弈的解概念,适用于各种不同类 型的博弈,如囚徒困境、寡头竞
政治博弈
在政治博弈中,纯战略纳什均衡 可用于分析政治家、利益集团等 参与者的策略选择和利益分配。
经济合作
在经济合作博弈中,纯战略纳什 均衡可用于分析国家之间的贸易 合作、关税战等策略选择和利益
分配。
04
纯战略纳什均衡在经济学中的应用
纯战略纳什均衡的求解方法
迭代法
通过不断迭代计算每个参与者的 最优策略,逐步逼近纯战略纳什
均衡。
代数法
利用代数方法求解纯战略纳什均衡 ,适用于某些特定类型的博弈。
线性规划法
通过线性规划方法求解纯战略纳什 均衡,适用于具有线性特征的博弈 。
纯战略纳什均衡的应用场景
商业竞争
纯战略纳什均衡可用于分析商业 竞争中的策略选择和竞争格局。
06
纯战略纳什均衡在其他领域的应用
军事战略中的纯战略纳什均衡
总结词
军事战略中,纯战略纳什均衡可以应用于分析敌我双方的策略互动,制定最优的军事行 动计划。
详细描述
在军事战略中,纯战略纳什均衡可以用来分析敌对双方在战争中的策略互动。通过理解 对手可能的反应和最优行动,可以制定出最优的军事行动计划,以最大化己方的利益。 例如,在战争中,了解敌人的兵力部署和行动模式,可以预测其可能的反击或进攻,从
通过反复迭代计算来逼近纳什均衡。
03
纯战略纳什均衡
纯战略纳什均衡的定义
纯战略纳什均衡是一种博弈策略 组合,其中每个参与者在给定其 他参与者策略的情况下,选择自
己的最优策略。
在纯战略纳什均衡中,每个参与 者的最优策略都是基于其他参与 者的策略选择的,从而形成一种
稳定的策略组合。
纯战略纳什均衡是一种非合作博 弈的解概念,适用于各种不同类 型的博弈,如囚徒困境、寡头竞
政治博弈
在政治博弈中,纯战略纳什均衡 可用于分析政治家、利益集团等 参与者的策略选择和利益分配。
经济合作
在经济合作博弈中,纯战略纳什 均衡可用于分析国家之间的贸易 合作、关税战等策略选择和利益
分配。
04
纯战略纳什均衡在经济学中的应用
《博弈论与信息经济学》混合战略纳什均衡--ppt课件全篇
![《博弈论与信息经济学》混合战略纳什均衡--ppt课件全篇](https://img.taocdn.com/s3/m/bb4f1072ec630b1c59eef8c75fbfc77da3699752.png)
放荡
32
-1 3
-1 1 0 0
1
ppt课件
假定父母选择支助的概率为p1,选择不支助的概率为p2 1- p1 ; 儿子选择立志的概率为q1,选择不立志的概率为q2 1- q1 。那么
对两个参与人,各自的盈利函数为:
v1
3 p1q1
1
p1q2
1
p2q1
5
p1q1
p1
q1
v2 2 p1q1 p2q1 3 p1q2 2 p1q1 q1 3 p1
一个混合战略均衡:p*, q* 3 4,1 4。
p
甲
1
3/4 乙
O 1/4
12
1q
ppt课件
▪ 解法2:代数法
甲和乙的期望盈利:v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
v甲
p
v乙
q
4q 1 0 4p 3 0
p*
q*
3 4 1 4
13
ppt课件
▪ 例3(三人博弈)
K
pik 1,pik p sik 是i选择战略sik的概率,pi称为参与人i的混合战略。
k 1
i 代表i的混合战略空间,pi i 。
▪ (2)期望盈利
对于博弈G S1,..., Si ,..., Sn;u1,..., ui ,..., un,对应于s s1,..., si,..., sn 有p p1,..., pi ,..., pn ,pi i ,p表示局中人i的混合战略组合,那么,
2
即q 1 ,则p越小越好,而p的最小值只能取0;如果1 2q 0,
2
即q 1 ,则p能取任意值,即p 0,1。
2
对于乙来说,为使盈利达到最大,只有调整q。如果2 p 1 0,
引言纳什均衡NashEquilibrium反应函数法PPT课件
![引言纳什均衡NashEquilibrium反应函数法PPT课件](https://img.taocdn.com/s3/m/1ee23c2a8bd63186bdebbc13.png)
hi
( s1* ,,
s* i1
,
si* ,
s* i1
,
,
sn*
)
hi
( s1* ,,
s* i1
,
sij
,
s* i1
,,
sn*
)
对 任 意 sij∈Si 都 成 立 , 则 称 ( s1*,…,sn* ) 为 G 的 一 个 纯 策 略
“纳什均衡”(Nash Equilibrium)。
各选取一个策略组成的某个策略组合构成一个局势,其最 优局势称为纯策略意义下的最优局势(纳什均衡)。
Page 5
第5页/共111页
12.1.1 博弈论概述
博弈论研究的问题: 参与博弈的各方是否存在最合理的策略以及如何
找到合理的策略。 博弈论是研究决策主体的行为发生直接相互作用时的决策及这种决策的均
衡问题。即它是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。 它将成为当代经济管理学科的前沿领城。
按博弈方式
非合作博弈 合作博弈
完全理性 有限理性
博弈分类
按博弈人数
二人博弈
二人零和博弈 二人非零和博弈
多人博弈
按博弈状态
静态博弈 动态博弈
完全信息静态博弈 不完全信息静态博弈 完全信息动态博弈 不完全信息动态博弈
第17页/共111页
12.1.3 博弈的结构和分类
【例12-2】1943年2月,日本统帅山本五十六大将计划由南太平洋新不列颠群 岛的拉包尔出发,3天穿过俾斯麦海,开往新几内亚的莱城,支援困守的日军。 有两条路线:北线和南线。
20 0,
(m1
m2
m3
),
Q 20 Q 20
4 纳什均衡
![4 纳什均衡](https://img.taocdn.com/s3/m/cd301eebde80d4d8d05a4f4c.png)
在竞选的时候,两党互相攻击越来越厉害, 而实际政治纲领却越来越靠近。等到一个政党 因为攻击另一个政党获胜取代对对手上台以后, 选民发现,新政府较老政府并没有多少实质的 改变。
精选可编辑ppt
14
假设:选民的政治态度从 0到 1排列,越往左代 表越支持劳工阶层,越往右代表越支持企业主 的利益。如下图所示:
三家都在中点是否是一个稳定的纳什均衡? 若三家都不在一起,各据一点,能否存在一种
情况为纳什均衡?
精选可编辑ppt
17
结论: 当三家杂货铺为选址而竞争,他们会转来
转去跳个不停:只要三家不在一块儿,单独在 最旁边的一家就要往中间挤;而一旦挤到一块 儿,马上又有动机要偏离,就这样转个不停。
实际生活中存在着往中间挤和转个不停的行为, 如:
精选可编辑ppt
26
生活中具有后动优势的例子 帆船比赛:
1983年,美洲杯帆船赛决赛前4轮后, “自由女神号”在这项以7比4胜的比赛 中暂时以3胜1负的成绩领先,也就是只 要再赢一局,他们就可彻底打败对手 “澳大利亚二号”。
第5轮比赛开始了,“澳大利亚二号” 起步违规,不得不撤回,重新起步,故 “自由女神号”在比赛一开始又获得了 37秒的优势。
若甲认为乙选左与右的可能性是一半对一 半,则甲选“上”支付为:9×1/2+0× 1/2=4.5;选“下”支付为8×1/2 +7×1/2=7.5,所以,甲会选“下”。
实例:猎人捉兔还是捉鹿的博弈
用考试作弊编故事
精选可编辑ppt
32
关于风险厌恶的统计
究竟应取具有支付优势的NE还是取具有风险优
势的NE呢?
精选可编辑ppt
12
(2)商业中心区的形成
在城市街道上,我们常见到一些地
精选可编辑ppt
14
假设:选民的政治态度从 0到 1排列,越往左代 表越支持劳工阶层,越往右代表越支持企业主 的利益。如下图所示:
三家都在中点是否是一个稳定的纳什均衡? 若三家都不在一起,各据一点,能否存在一种
情况为纳什均衡?
精选可编辑ppt
17
结论: 当三家杂货铺为选址而竞争,他们会转来
转去跳个不停:只要三家不在一块儿,单独在 最旁边的一家就要往中间挤;而一旦挤到一块 儿,马上又有动机要偏离,就这样转个不停。
实际生活中存在着往中间挤和转个不停的行为, 如:
精选可编辑ppt
26
生活中具有后动优势的例子 帆船比赛:
1983年,美洲杯帆船赛决赛前4轮后, “自由女神号”在这项以7比4胜的比赛 中暂时以3胜1负的成绩领先,也就是只 要再赢一局,他们就可彻底打败对手 “澳大利亚二号”。
第5轮比赛开始了,“澳大利亚二号” 起步违规,不得不撤回,重新起步,故 “自由女神号”在比赛一开始又获得了 37秒的优势。
若甲认为乙选左与右的可能性是一半对一 半,则甲选“上”支付为:9×1/2+0× 1/2=4.5;选“下”支付为8×1/2 +7×1/2=7.5,所以,甲会选“下”。
实例:猎人捉兔还是捉鹿的博弈
用考试作弊编故事
精选可编辑ppt
32
关于风险厌恶的统计
究竟应取具有支付优势的NE还是取具有风险优
势的NE呢?
精选可编辑ppt
12
(2)商业中心区的形成
在城市街道上,我们常见到一些地
纳什均衡理论 优质课件
![纳什均衡理论 优质课件](https://img.taocdn.com/s3/m/940a541925c52cc58bd6beed.png)
来源及定义 经典案例 重要影响
假设有n个局中人参与博弈,给定其他人策略 的条件下,每个局中人选择自己的纳什均衡。个 人最优策略可能依赖于也可能不依赖于他人的战 略,从而使自己利益最大化。所有局中人策略构 成一个策略组合。纳什均衡指的是这样一种战略 组合,这种策略组合由所有参与人最优策略组成。 即在给定别人策略的情况下,没有人有足够理由 打破这种均衡。纳什均衡,从实质上说,是一种 非合作博弈状态。纳什均衡达成时,并不意味着 博弈双方都处于不动的状态,在顺序博弈中这个 均衡是在博弈者连续的动作与反应中达成的。
关于案例,显然最好的策略是双方都抵赖,结 果是大家都只被判1年。但是由于两人处于隔离 的情况,首先应该是从心理学的角度来看,当 事双方都会怀疑对方会出卖自己以求自保,因 此都会从利己的目的出发进行选择。这两个人 都会有这样一个盘算过程:假如他坦白,如果 我抵赖,得坐10年监狱,如果我坦白最多才8年; 假如他要是抵赖,如果我也抵赖,我就会被判 一年,如果我坦白就可以被释放,而他会坐10 年牢。综合以上几种情况考虑,不管他坦白与 否,对我而言都是坦白了划算。两个人都会动 这样的脑筋,最终,两个人都选择了坦白,结 果都被判8年刑期。
当对手知道了你的 决定之后,就能做 出对自己最有利的 决定。
——纳什均衡理论
假设有两个小偷A和B联合犯事、私入民宅被 警察抓住。警方将两人分别置于不同的两个 房间内进行审讯。对每一个犯罪嫌疑人,警 方给出的政策是:如果一个犯罪嫌疑人坦白 了罪行,交出了赃物,于是证据确凿,两人 都被判有罪。如果另一个犯罪嫌疑人也作了 坦白,则两人各被判刑8年;如果另一个犯罪 嫌人没有坦白而是抵赖,则以妨碍公务罪 (因已有证据表明其有罪)再加刑2年,而坦 白者有功被减刑8年,立即释放。如果两人都 抵赖,则警方因证据不足不能判两人的偷窃 罪,但可以私入民宅的罪名将两人各判入狱1 年。
假设有n个局中人参与博弈,给定其他人策略 的条件下,每个局中人选择自己的纳什均衡。个 人最优策略可能依赖于也可能不依赖于他人的战 略,从而使自己利益最大化。所有局中人策略构 成一个策略组合。纳什均衡指的是这样一种战略 组合,这种策略组合由所有参与人最优策略组成。 即在给定别人策略的情况下,没有人有足够理由 打破这种均衡。纳什均衡,从实质上说,是一种 非合作博弈状态。纳什均衡达成时,并不意味着 博弈双方都处于不动的状态,在顺序博弈中这个 均衡是在博弈者连续的动作与反应中达成的。
关于案例,显然最好的策略是双方都抵赖,结 果是大家都只被判1年。但是由于两人处于隔离 的情况,首先应该是从心理学的角度来看,当 事双方都会怀疑对方会出卖自己以求自保,因 此都会从利己的目的出发进行选择。这两个人 都会有这样一个盘算过程:假如他坦白,如果 我抵赖,得坐10年监狱,如果我坦白最多才8年; 假如他要是抵赖,如果我也抵赖,我就会被判 一年,如果我坦白就可以被释放,而他会坐10 年牢。综合以上几种情况考虑,不管他坦白与 否,对我而言都是坦白了划算。两个人都会动 这样的脑筋,最终,两个人都选择了坦白,结 果都被判8年刑期。
当对手知道了你的 决定之后,就能做 出对自己最有利的 决定。
——纳什均衡理论
假设有两个小偷A和B联合犯事、私入民宅被 警察抓住。警方将两人分别置于不同的两个 房间内进行审讯。对每一个犯罪嫌疑人,警 方给出的政策是:如果一个犯罪嫌疑人坦白 了罪行,交出了赃物,于是证据确凿,两人 都被判有罪。如果另一个犯罪嫌疑人也作了 坦白,则两人各被判刑8年;如果另一个犯罪 嫌人没有坦白而是抵赖,则以妨碍公务罪 (因已有证据表明其有罪)再加刑2年,而坦 白者有功被减刑8年,立即释放。如果两人都 抵赖,则警方因证据不足不能判两人的偷窃 罪,但可以私入民宅的罪名将两人各判入狱1 年。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 两个均衡无差异:没有明 确的好与坏
24
一般博弈
l
r
• 如左图博弈,存在弱
劣策略时易出现多重
U
1,1
0,0
NE。
D
0,0
0,0
25
聚点( focal point)均衡
• 如何在多重NE中选择一个确 定的结果呢?
• 谢林(Schelling) (1961)提 出——“聚点”
– 根据博弈规则以外的某些特定 信息(如共同的社会规范、知 识或某些特征)从多个NE中确 定出一个
– 彼此最优反应:在对方的最优反应下的反应最优 • 没有一个局中人会轻易改变策略而使自己蒙受损失; – 即任何改变NE状态的策略将不会严格增加自身 的效用。
17
NE的特点:
• 不后悔: – 即其他人不改变行为的前提下,自己改变行为 没有好处; – 只有在NE时才不后悔; • 如对方如果选择非NE策略,你先NE策略会 后悔;
若策略组合 (s1 ,s2 , si, ,sn ) 满足:
u i(s 1 ,s 2 , ,s i 1 ,s i ,s i 1 , s n ) u i(s 1 , ,s i 1 ,s i,s i 1 , s n )
则称 (s1,s2,sn) 是博弈G的一个NE。 等价定义:
在博弈 G S 1 ,S 2 , S n ;u 1 ,u 2 , u n 中,若策略组合 (s1,s2,sn)
– 强NE比弱NE更容易取舍(因为弱均衡有无差异的 策略存在);
• 强NE对博弈支付矩阵的微小改变不敏感。
16
NE的含义:
博弈G的NE指这样一个策略组合:
• 为了极大化自己的收益(效用),每个局中人所采 取的策略必定是其它局中人所采取策略的最优反应;
– 给定你的策略,我的策略是最优的;(同时)给定我 的策略,你的策略是最优的;
➢ 显然,只有遵守协议带来的效用大于不遵守协议的效 用时,每个参与人才会遵守协议。
➢ 如果没有参与人有积极性不遵守协议,则该协议就是 自动实施的,则该协议就构成一个NE.
19
三、NE解的特征
(一)单一NE的博弈
– 有唯一的NE解。
20
囚徒困境
• 唯一的NE: (D,D)
2
• 如(C,C)就不是NE, 因为:
• 可从哪方面对上述模型进行扩展?(射门力度和 精确度)
9
最佳策略的正式定义
• 定义一:如果满足以下条件,则参与人i的策略 s i是
对手策略s-i的最佳对策BR:
u i(si,s i)u i(si',s i) si' Si
• 定义二:s i 最大化了对手选 S-i时我的收益: si au m gu a i(s x i',s i)
– 聚点就成为博弈的最终结果, 是多个NE解中的一个
• 如在一双行道上的两个相对 开车的人,各自既可选择左 行(L),也可右行(R); 共同的交通规则下,结果 (R,R)。
26
性别战
• 两NE: (F,F)和(O,O)
– 对两博弈人(夫妇), 这两均衡解不是无差异 的。
27
实验:性别战之一
• 假设你和你的女(男)朋友正在进行“性别战” 博弈。实验人群分为男、女生两组,男、女两类 实验者均做为博弈人1(丈夫)在看踢足球、看歌 剧这两个行动中进行选择。
• 如果降低b(即降低了协同性)会如何? – 会出现剪刀效应(BR1更陡、更平缓BR2): • 参与人1会减少努力; • 2知道1会降低努力水平,2也会降低自己的努力水 平; • ····
14
二、纳什均衡的定义
在博弈 G S 1 ,S 2 , S n ;u 1 ,u 2 , u n 中,对 si Si (in)
36
实验五——合作与风险偏好
• 对称的合作博弈:有 两个NE: (A, A)和(B, B) 问:你认为博弈结果 应该是哪一个呢?
• 实验结果:
– 人数: – (A, A): – (B, B):
37
• 说明:
– (A, A)帕累托占优于(B,B); – 但博弈人选择A的风险高于B; – 实验结果是(B,B)更有可能。
满足:
m si Si u ai(sx i,s i)ui(si,s i)
则称 (s1,s2 , sn )是G的一个NE策略组合。
15
• 定义:策略组合 s*是博弈G的一个纯策略纳什均
衡(a pure strategy Nash equilibrium),当且仅
当对所有博弈人i和所有策略
– 定义:纯策略NE是严格的,当且仅当
完全信息静态博弈
LEC04 纳什均衡
内容概览
一、最优反应(best response) 二、纳什均衡的定义
– 有关NE的几点说明
三、NE解的特征 (一)单一NE的博弈 (二)有多个NE的博弈 – 聚点( focal point)均衡 – 聚点实验 » 性别战实验一——四 »实验六五——合作与风险偏好 – 对NE信念的说明
• 博弈规则: – 只能选择一次;不能讨论,窥视
28
实验结果:
– Men are simply more aggressive creatures...
29
实验:性别战之二
• 博弈规则: – 你作为博弈人1先进行选择;你选完后对方再 选择;对方选择时无法观察到你的选择;
• 问你如何进行选择?
30
2
回顾
• 重复剔除严格劣战略法 – 严格的前提假设:所有参与人是理性的;理性是共 同知识 – 解完全信息静态博弈问题的一种方法。
• 因有严格假设前提,不是所有博弈都能用该方法。 • 纳什均衡(Nash Equilibrium,NE)的提出:对所有
有限次博弈来说,从纳什均衡角度是可解的,且至少 有一个纳什均衡解。
l
r
• U1(L,l)=4。
队 员L
4,-4 9,-9
• 你作为A队队员该如何选择? – 有无劣策略?
M
6,-6 6,-6
R
9,-9 4,-4
8
• M是你无论如何都不会选的,为什么? – 因为不论对方门将的可能选择是什么,M都不 是最优策略;(试做图分析)
• 结论: – 不要选择一个在任何信念下都不是最佳策略的 策略。
– 博弈人2选C时,博弈 1 人1会偏离C而选D;
– 博弈人1选D时,博弈 人2也会偏离C而选D;
– 2选D时,1只会选D;说明:
反之亦然。
1. 严格劣势策略永远不会形成NE;
2. 重复剔除劣策略均衡属于NE.21
一般博弈
• 唯一的NE: (U,L) • 求解方法:划线法
• NE与重复剔除的占优均衡 之间的关系:
BR2(s1) =1+bs1=s2*
参与人1的哪些策略是非最佳策略? (作图 分析)
12
• 参与人1(or 2)的非最佳策略: – [0,1)和(2,4];
• 因参与人永远不会选其非最佳策略,因此可剔除 ,缩小策略选择范围到[1,2]; – 再找非最佳策略:[1,5/4) 和 (7/4,2]; – 剔除
– 这种信息示意可以是有作为的、也可以是无作为的; – 但博弈的标准型分析无法捕捉到这种信念形成过程。
• 新信息的来源,即推动参与人信念更新的因素有 哪些呢?
39
信念的来源
1. 博弈规则 2. 事先的交流 3. 聚点
– 社会规范、或某些显著的特征(如对风险的厌恶)会促使参与 人选择某个特定策略
• 反映了信念的自我实施(self-fulfilling)(分析 见下页) ;
18
信念自我实施的含义:
• 假设n个参与人在博弈前协商达成一个协议:
(s1 ,s2 , si , ,sn )
– 其中si* 是协议规定的参与人i的策略;
– 在给定其他参与人都遵守协议、且没有外在强制情况 下,是否有任何参与人有积极性不遵守这个协议?
– “cheap talk”:这种事先的口头宣告的交流方式 • 发出的信号(message)是没有成本的; • 博弈的分析不应该考虑这种信号的作用,为什 么?(见下页)
33
• 博弈人2的策略集变为:
– {Ff, Fo, Of, Oo}
(第1个数字:实际选择的策 略;第2个数字代表:宣布 的策略)
• 博弈支付没有变,实质博 弈、博弈结果不变
合伙人博弈 (Partnership Game)
两个人要共同完成一个合作项目(如律师事务所),各 自都需要对项目做出努力,最后平分利润;
• 博弈人:各持50%股份的两个股东; • 策略:每个股东要选择为项目投入的精力,即努力水
平(小时数),如Si=[0,4];(连续策略)
• 收益:
– 项目收益4(s1+s2+bs1s2)(b=[0,1/4],表示协同性); – u1(s1,s2)= 2(s1+s2+bs1s2)- s12
F
• 然而,2的宣告对1是一个
成功的误导信号,使1认
为2会选她喜欢的策略
“O”。
O
F
O
Ff
Fo
Of Oo
2,1
0,0
2, 1
0,0
0,0
1,2
0, 0
1,2
34
实验:性别战之四
• 博弈规则: – 在开始博弈前,博弈人2(妻子)有机会事先 宣布,但2却选择了沉默;
• 问你如何进行选择?
35
• 实验结果:说明: – ”沉默”会被看作博弈人2软弱的表现,会导 致1选择“O”的人数减少。
• ·····(重复剔除非最佳策略的过程) • 结果:两参与人最优反应函数的交点,即
– s1*= s2*= 1/(1-b)。
合伙人会努力工作达到最优解吗?最优效率解在实 际中是否总能达到呢?最优效率解收效如何?
24
一般博弈
l
r
• 如左图博弈,存在弱
劣策略时易出现多重
U
1,1
0,0
NE。
D
0,0
0,0
25
聚点( focal point)均衡
• 如何在多重NE中选择一个确 定的结果呢?
• 谢林(Schelling) (1961)提 出——“聚点”
– 根据博弈规则以外的某些特定 信息(如共同的社会规范、知 识或某些特征)从多个NE中确 定出一个
– 彼此最优反应:在对方的最优反应下的反应最优 • 没有一个局中人会轻易改变策略而使自己蒙受损失; – 即任何改变NE状态的策略将不会严格增加自身 的效用。
17
NE的特点:
• 不后悔: – 即其他人不改变行为的前提下,自己改变行为 没有好处; – 只有在NE时才不后悔; • 如对方如果选择非NE策略,你先NE策略会 后悔;
若策略组合 (s1 ,s2 , si, ,sn ) 满足:
u i(s 1 ,s 2 , ,s i 1 ,s i ,s i 1 , s n ) u i(s 1 , ,s i 1 ,s i,s i 1 , s n )
则称 (s1,s2,sn) 是博弈G的一个NE。 等价定义:
在博弈 G S 1 ,S 2 , S n ;u 1 ,u 2 , u n 中,若策略组合 (s1,s2,sn)
– 强NE比弱NE更容易取舍(因为弱均衡有无差异的 策略存在);
• 强NE对博弈支付矩阵的微小改变不敏感。
16
NE的含义:
博弈G的NE指这样一个策略组合:
• 为了极大化自己的收益(效用),每个局中人所采 取的策略必定是其它局中人所采取策略的最优反应;
– 给定你的策略,我的策略是最优的;(同时)给定我 的策略,你的策略是最优的;
➢ 显然,只有遵守协议带来的效用大于不遵守协议的效 用时,每个参与人才会遵守协议。
➢ 如果没有参与人有积极性不遵守协议,则该协议就是 自动实施的,则该协议就构成一个NE.
19
三、NE解的特征
(一)单一NE的博弈
– 有唯一的NE解。
20
囚徒困境
• 唯一的NE: (D,D)
2
• 如(C,C)就不是NE, 因为:
• 可从哪方面对上述模型进行扩展?(射门力度和 精确度)
9
最佳策略的正式定义
• 定义一:如果满足以下条件,则参与人i的策略 s i是
对手策略s-i的最佳对策BR:
u i(si,s i)u i(si',s i) si' Si
• 定义二:s i 最大化了对手选 S-i时我的收益: si au m gu a i(s x i',s i)
– 聚点就成为博弈的最终结果, 是多个NE解中的一个
• 如在一双行道上的两个相对 开车的人,各自既可选择左 行(L),也可右行(R); 共同的交通规则下,结果 (R,R)。
26
性别战
• 两NE: (F,F)和(O,O)
– 对两博弈人(夫妇), 这两均衡解不是无差异 的。
27
实验:性别战之一
• 假设你和你的女(男)朋友正在进行“性别战” 博弈。实验人群分为男、女生两组,男、女两类 实验者均做为博弈人1(丈夫)在看踢足球、看歌 剧这两个行动中进行选择。
• 如果降低b(即降低了协同性)会如何? – 会出现剪刀效应(BR1更陡、更平缓BR2): • 参与人1会减少努力; • 2知道1会降低努力水平,2也会降低自己的努力水 平; • ····
14
二、纳什均衡的定义
在博弈 G S 1 ,S 2 , S n ;u 1 ,u 2 , u n 中,对 si Si (in)
36
实验五——合作与风险偏好
• 对称的合作博弈:有 两个NE: (A, A)和(B, B) 问:你认为博弈结果 应该是哪一个呢?
• 实验结果:
– 人数: – (A, A): – (B, B):
37
• 说明:
– (A, A)帕累托占优于(B,B); – 但博弈人选择A的风险高于B; – 实验结果是(B,B)更有可能。
满足:
m si Si u ai(sx i,s i)ui(si,s i)
则称 (s1,s2 , sn )是G的一个NE策略组合。
15
• 定义:策略组合 s*是博弈G的一个纯策略纳什均
衡(a pure strategy Nash equilibrium),当且仅
当对所有博弈人i和所有策略
– 定义:纯策略NE是严格的,当且仅当
完全信息静态博弈
LEC04 纳什均衡
内容概览
一、最优反应(best response) 二、纳什均衡的定义
– 有关NE的几点说明
三、NE解的特征 (一)单一NE的博弈 (二)有多个NE的博弈 – 聚点( focal point)均衡 – 聚点实验 » 性别战实验一——四 »实验六五——合作与风险偏好 – 对NE信念的说明
• 博弈规则: – 只能选择一次;不能讨论,窥视
28
实验结果:
– Men are simply more aggressive creatures...
29
实验:性别战之二
• 博弈规则: – 你作为博弈人1先进行选择;你选完后对方再 选择;对方选择时无法观察到你的选择;
• 问你如何进行选择?
30
2
回顾
• 重复剔除严格劣战略法 – 严格的前提假设:所有参与人是理性的;理性是共 同知识 – 解完全信息静态博弈问题的一种方法。
• 因有严格假设前提,不是所有博弈都能用该方法。 • 纳什均衡(Nash Equilibrium,NE)的提出:对所有
有限次博弈来说,从纳什均衡角度是可解的,且至少 有一个纳什均衡解。
l
r
• U1(L,l)=4。
队 员L
4,-4 9,-9
• 你作为A队队员该如何选择? – 有无劣策略?
M
6,-6 6,-6
R
9,-9 4,-4
8
• M是你无论如何都不会选的,为什么? – 因为不论对方门将的可能选择是什么,M都不 是最优策略;(试做图分析)
• 结论: – 不要选择一个在任何信念下都不是最佳策略的 策略。
– 博弈人2选C时,博弈 1 人1会偏离C而选D;
– 博弈人1选D时,博弈 人2也会偏离C而选D;
– 2选D时,1只会选D;说明:
反之亦然。
1. 严格劣势策略永远不会形成NE;
2. 重复剔除劣策略均衡属于NE.21
一般博弈
• 唯一的NE: (U,L) • 求解方法:划线法
• NE与重复剔除的占优均衡 之间的关系:
BR2(s1) =1+bs1=s2*
参与人1的哪些策略是非最佳策略? (作图 分析)
12
• 参与人1(or 2)的非最佳策略: – [0,1)和(2,4];
• 因参与人永远不会选其非最佳策略,因此可剔除 ,缩小策略选择范围到[1,2]; – 再找非最佳策略:[1,5/4) 和 (7/4,2]; – 剔除
– 这种信息示意可以是有作为的、也可以是无作为的; – 但博弈的标准型分析无法捕捉到这种信念形成过程。
• 新信息的来源,即推动参与人信念更新的因素有 哪些呢?
39
信念的来源
1. 博弈规则 2. 事先的交流 3. 聚点
– 社会规范、或某些显著的特征(如对风险的厌恶)会促使参与 人选择某个特定策略
• 反映了信念的自我实施(self-fulfilling)(分析 见下页) ;
18
信念自我实施的含义:
• 假设n个参与人在博弈前协商达成一个协议:
(s1 ,s2 , si , ,sn )
– 其中si* 是协议规定的参与人i的策略;
– 在给定其他参与人都遵守协议、且没有外在强制情况 下,是否有任何参与人有积极性不遵守这个协议?
– “cheap talk”:这种事先的口头宣告的交流方式 • 发出的信号(message)是没有成本的; • 博弈的分析不应该考虑这种信号的作用,为什 么?(见下页)
33
• 博弈人2的策略集变为:
– {Ff, Fo, Of, Oo}
(第1个数字:实际选择的策 略;第2个数字代表:宣布 的策略)
• 博弈支付没有变,实质博 弈、博弈结果不变
合伙人博弈 (Partnership Game)
两个人要共同完成一个合作项目(如律师事务所),各 自都需要对项目做出努力,最后平分利润;
• 博弈人:各持50%股份的两个股东; • 策略:每个股东要选择为项目投入的精力,即努力水
平(小时数),如Si=[0,4];(连续策略)
• 收益:
– 项目收益4(s1+s2+bs1s2)(b=[0,1/4],表示协同性); – u1(s1,s2)= 2(s1+s2+bs1s2)- s12
F
• 然而,2的宣告对1是一个
成功的误导信号,使1认
为2会选她喜欢的策略
“O”。
O
F
O
Ff
Fo
Of Oo
2,1
0,0
2, 1
0,0
0,0
1,2
0, 0
1,2
34
实验:性别战之四
• 博弈规则: – 在开始博弈前,博弈人2(妻子)有机会事先 宣布,但2却选择了沉默;
• 问你如何进行选择?
35
• 实验结果:说明: – ”沉默”会被看作博弈人2软弱的表现,会导 致1选择“O”的人数减少。
• ·····(重复剔除非最佳策略的过程) • 结果:两参与人最优反应函数的交点,即
– s1*= s2*= 1/(1-b)。
合伙人会努力工作达到最优解吗?最优效率解在实 际中是否总能达到呢?最优效率解收效如何?