03纳什均衡
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 赢者奖励:10元减去所选数字与全班平均 数2/3的差值的百分之一。
18
方法1:剔除劣策略:
• 即使每人选100,其2/3为67,所以68-100的剔除,选择1-67;
• 67的2/3为45,46-67剔除,选择1-45
• 同理,30-45剔除,选择1-29
• 21-29剔除,选择1-20
• 15-20剔除 1-14 • 10-14剔除 1-9 • 7-9剔除 1-6
•选择大于68的,不理性,劣势,因为即使随机选平 均数也是50,何况大家不是随机数生成器,想赢比 赛。
• 5-6剔除 1-4 • 4剔除 1-3 • 3剔除 1、2
•有选择45左右的,是因为他们认为别人不够理性 •有人选择了1,但是办的平均数13,所以未赢。
•1
•自己理性,还要求别人也是理性(共同知识)
• “劣”战略:无论对方选择什么,如果自己选择A得到的 收益总是小于选择B得到的收益,A总是相对于B的劣战略。
11
“智猪博弈”(boxed pigs)
小猪
按
等待
大猪
按 等待
3,1 7,-1
2,4 0,0
均衡(按,等待)
Hale Waihona Puke 12重复剔除与理性共识
• 重复剔除不仅要求每个人是理性的,而且要求每个人知道 其他人是理性的,每个人知道每个人知道每个人是理性的, 如此等等,即理性是“共同知识”(共识)。
假定一个人群由A、B两个人构成,A、B均知道一件事实f,f是 A、B各自的知识,而不是他们的共同知识。当A、B双方均知道 对方知道f,并且他们各自都知道对方知道自己知道f 。。。,我 们就说f成了A、B间的共同知识。
14
(1)零阶理性 Zero-order CKR:每个人都是理性的,但不知道其他人 是否是理性的;囚徒困境
6
个人理性与集体理性的冲突
• “囚徒困境”表明个人理性与集体理性的冲突。 • 这样的例子很多:寡头竞争、军备竞赛、团队生产中的劳
动供给、公共产品的供给等; • 许多制度就是为了解决“囚徒困境”而存在的。
人民公社为啥生存 不下去?
7
公共产品与税收制度
• 比较私人产品与公共产品的不同:使用上排他性; • 私人产品是自愿购买的,但公共产品可能需要强
19
• 方法2 • 1-100平均数 50 • 50、51的2/3为33 • 33的2/3为22 • 22的2/3为15 • 15的2/3为10 • 10的2/3为7 • 7的2/3为5 • 5的2/3为3 •2 •1
Chapter 3
纳什均衡与一致预期
经管学院企业管理系 陈秀平
主要内容
• 占优均衡 • 重复剔除占优均衡(理性共识) • 纳什均衡与一致预期 • 混合战略纳什均衡 • 纳什均衡的存在性问题 • 颤抖手均衡
2
囚徒困境 (prisoners’ dilemma)
囚徒2
坦白
不坦白
囚徒 坦白 1 不坦白
-8,-8 -10,0
• 占优均衡:由所有参与人的占优战略构成的战略组合 • 占优战略均衡的出现只要求所有人都是理性的,但不要
求每个参与人知道其他参与人是否理性。 • 囚徒困境博弈有占优均衡,所以其结果很容易预测。
4
5
• 一条街道两边均匀地分布着居民,有两家 日用品店,出售的商品及价格完全一样, 问两家店开在哪个位置?
C(b)R(b)C(b)R(b)C • (6)5th-order CKR:R not choose R3 for
R(b)C(b)R(b)C(b)R(b)C so, (R2,C2)is an equilibrium.
17
数字实验
• 从1-100中选择一个数字,与全班同学平均 数字的2/3最接近者赢。
• (2)1st-order CKR:R not choose R4 for R(b)C • (3)2nd-order CKR:C not choose C1 for C(b)R(b)C • (4)3rd-order CKR: R not choose R1 for R(b)C(b)R(b)C • (5)4th-order CKR:C not choose C3 for
博弈论很大部分研 究的是共同知识
13
共同知识 (common knowledge of rationality)
共同知识的概念最初是由逻辑学家李维斯提出的。对一 个事件来说,如果所有博奔当事人对该事件都有了解, 并且所有当事人都知道其他当事人也知道这一事件,并 且所有当事人都知道所有当事人都知道这一事件,那么 该事件就是共同知识
不合作 S,R-X
P,P
合同法
社会越稳定, 法律越不重要
满足:X>R-T
10
2.重复剔除占优均衡
• 有些博弈没有占优战略,但通过剔除“坏”战略,我们 可以预测博弈的结果。如“智猪博弈”。
• 在这个博弈中,大猪的最优选择依赖于小猪的选择。但 小猪的最优选择与大猪的选择无关。如果大猪知道小猪 是理性的,大猪将选择“按”。均衡是“大猪按,小猪 等待”。
重复剔除
R1
R2
R3
R4 2
C1
C2
3
5,10
0,11
4
4,0
1,1
3,2
0,4
6
2,93
0,92
C3
C4
1
1,20 10,10
2,0 5 20,0
4,3
50,1
0,91 100,90
16
选择越多,对理性共识的要求越高
• (1) Zero-order CKR:C not choose C4 for C is rational
0,-10 -1,-1
无论对方如何选择,每个人的最优选择:坦白。 所以,我们可以预测,结果将是(坦白,坦白)
3
1.占优均衡 (dominant-strategy equilibrium)
• 占优战略(dominant strategy):不管你的对手怎么做, 这项策略带给你的好处都比其他所有的策略来得大。
制购买; • 税收制度就是为了保证公共产品的生产,解决公
共产品生产上的“囚徒困境”。
8
“囚徒困境”的一般表示
甲 合作 不合作
乙 合作 T,T R,S
不合作 S,R P,P
帕累托效率 (合作、合作)
满足:R>T > P > S;(R+S)<(T+T)
9
用法律解决“囚徒困境”
甲 合作 不合作
乙 合作 T,T R-X,S
(2)一阶理性 First-order CKR:每个人都是理性的,并且知道其他每个 人也都是理性的,但不知道其他人是否知道自己是理性的;智猪 博弈
(3)二阶理性 Second-order CKR:(1)+(2)+每个人知道(2); (4)无穷阶理性 Nth-order CKR
15
选择越多,对理性共识的要求越高
18
方法1:剔除劣策略:
• 即使每人选100,其2/3为67,所以68-100的剔除,选择1-67;
• 67的2/3为45,46-67剔除,选择1-45
• 同理,30-45剔除,选择1-29
• 21-29剔除,选择1-20
• 15-20剔除 1-14 • 10-14剔除 1-9 • 7-9剔除 1-6
•选择大于68的,不理性,劣势,因为即使随机选平 均数也是50,何况大家不是随机数生成器,想赢比 赛。
• 5-6剔除 1-4 • 4剔除 1-3 • 3剔除 1、2
•有选择45左右的,是因为他们认为别人不够理性 •有人选择了1,但是办的平均数13,所以未赢。
•1
•自己理性,还要求别人也是理性(共同知识)
• “劣”战略:无论对方选择什么,如果自己选择A得到的 收益总是小于选择B得到的收益,A总是相对于B的劣战略。
11
“智猪博弈”(boxed pigs)
小猪
按
等待
大猪
按 等待
3,1 7,-1
2,4 0,0
均衡(按,等待)
Hale Waihona Puke 12重复剔除与理性共识
• 重复剔除不仅要求每个人是理性的,而且要求每个人知道 其他人是理性的,每个人知道每个人知道每个人是理性的, 如此等等,即理性是“共同知识”(共识)。
假定一个人群由A、B两个人构成,A、B均知道一件事实f,f是 A、B各自的知识,而不是他们的共同知识。当A、B双方均知道 对方知道f,并且他们各自都知道对方知道自己知道f 。。。,我 们就说f成了A、B间的共同知识。
14
(1)零阶理性 Zero-order CKR:每个人都是理性的,但不知道其他人 是否是理性的;囚徒困境
6
个人理性与集体理性的冲突
• “囚徒困境”表明个人理性与集体理性的冲突。 • 这样的例子很多:寡头竞争、军备竞赛、团队生产中的劳
动供给、公共产品的供给等; • 许多制度就是为了解决“囚徒困境”而存在的。
人民公社为啥生存 不下去?
7
公共产品与税收制度
• 比较私人产品与公共产品的不同:使用上排他性; • 私人产品是自愿购买的,但公共产品可能需要强
19
• 方法2 • 1-100平均数 50 • 50、51的2/3为33 • 33的2/3为22 • 22的2/3为15 • 15的2/3为10 • 10的2/3为7 • 7的2/3为5 • 5的2/3为3 •2 •1
Chapter 3
纳什均衡与一致预期
经管学院企业管理系 陈秀平
主要内容
• 占优均衡 • 重复剔除占优均衡(理性共识) • 纳什均衡与一致预期 • 混合战略纳什均衡 • 纳什均衡的存在性问题 • 颤抖手均衡
2
囚徒困境 (prisoners’ dilemma)
囚徒2
坦白
不坦白
囚徒 坦白 1 不坦白
-8,-8 -10,0
• 占优均衡:由所有参与人的占优战略构成的战略组合 • 占优战略均衡的出现只要求所有人都是理性的,但不要
求每个参与人知道其他参与人是否理性。 • 囚徒困境博弈有占优均衡,所以其结果很容易预测。
4
5
• 一条街道两边均匀地分布着居民,有两家 日用品店,出售的商品及价格完全一样, 问两家店开在哪个位置?
C(b)R(b)C(b)R(b)C • (6)5th-order CKR:R not choose R3 for
R(b)C(b)R(b)C(b)R(b)C so, (R2,C2)is an equilibrium.
17
数字实验
• 从1-100中选择一个数字,与全班同学平均 数字的2/3最接近者赢。
• (2)1st-order CKR:R not choose R4 for R(b)C • (3)2nd-order CKR:C not choose C1 for C(b)R(b)C • (4)3rd-order CKR: R not choose R1 for R(b)C(b)R(b)C • (5)4th-order CKR:C not choose C3 for
博弈论很大部分研 究的是共同知识
13
共同知识 (common knowledge of rationality)
共同知识的概念最初是由逻辑学家李维斯提出的。对一 个事件来说,如果所有博奔当事人对该事件都有了解, 并且所有当事人都知道其他当事人也知道这一事件,并 且所有当事人都知道所有当事人都知道这一事件,那么 该事件就是共同知识
不合作 S,R-X
P,P
合同法
社会越稳定, 法律越不重要
满足:X>R-T
10
2.重复剔除占优均衡
• 有些博弈没有占优战略,但通过剔除“坏”战略,我们 可以预测博弈的结果。如“智猪博弈”。
• 在这个博弈中,大猪的最优选择依赖于小猪的选择。但 小猪的最优选择与大猪的选择无关。如果大猪知道小猪 是理性的,大猪将选择“按”。均衡是“大猪按,小猪 等待”。
重复剔除
R1
R2
R3
R4 2
C1
C2
3
5,10
0,11
4
4,0
1,1
3,2
0,4
6
2,93
0,92
C3
C4
1
1,20 10,10
2,0 5 20,0
4,3
50,1
0,91 100,90
16
选择越多,对理性共识的要求越高
• (1) Zero-order CKR:C not choose C4 for C is rational
0,-10 -1,-1
无论对方如何选择,每个人的最优选择:坦白。 所以,我们可以预测,结果将是(坦白,坦白)
3
1.占优均衡 (dominant-strategy equilibrium)
• 占优战略(dominant strategy):不管你的对手怎么做, 这项策略带给你的好处都比其他所有的策略来得大。
制购买; • 税收制度就是为了保证公共产品的生产,解决公
共产品生产上的“囚徒困境”。
8
“囚徒困境”的一般表示
甲 合作 不合作
乙 合作 T,T R,S
不合作 S,R P,P
帕累托效率 (合作、合作)
满足:R>T > P > S;(R+S)<(T+T)
9
用法律解决“囚徒困境”
甲 合作 不合作
乙 合作 T,T R-X,S
(2)一阶理性 First-order CKR:每个人都是理性的,并且知道其他每个 人也都是理性的,但不知道其他人是否知道自己是理性的;智猪 博弈
(3)二阶理性 Second-order CKR:(1)+(2)+每个人知道(2); (4)无穷阶理性 Nth-order CKR
15
选择越多,对理性共识的要求越高