03纳什均衡

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

• 赢者奖励：10元减去所选数字与全班平均数2/3的差值的百分之一。
18
方法1：剔除劣策略：
• 即使每人选100，其2/3为67，所以68-100的剔除，选择1-67；
• 67的2/3为45，46-67剔除，选择1-45
• 同理，30-45剔除，选择1-29
• 21-29剔除，选择1-20
• 15-20剔除 1-14 • 10-14剔除 1-9 • 7-9剔除 1-6
•选择大于68的，不理性，劣势，因为即使随机选平均数也是50，何况大家不是随机数生成器，想赢比赛。
• 5-6剔除 1-4 • 4剔除 1-3 • 3剔除 1、2
•有选择45左右的，是因为他们认为别人不够理性 •有人选择了1，但是办的平均数13，所以未赢。
•1
•自己理性，还要求别人也是理性（共同知识）
• “劣”战略：无论对方选择什么，如果自己选择A得到的收益总是小于选择B得到的收益，A总是相对于B的劣战略。
11
“智猪博弈”（boxed pigs)
小猪
按
等待
大猪
按等待
3，1 7，-1
2，4 0，0
均衡（按，等待）
Hale Waihona Puke 12重复剔除与理性共识
• 重复剔除不仅要求每个人是理性的，而且要求每个人知道其他人是理性的，每个人知道每个人知道每个人是理性的，如此等等，即理性是“共同知识”（共识）。
假定一个人群由A、B两个人构成，A、B均知道一件事实f，f是 A、B各自的知识，而不是他们的共同知识。当A、B双方均知道对方知道f，并且他们各自都知道对方知道自己知道f 。。。，我们就说f成了A、B间的共同知识。
14
(1)零阶理性 Zero-order CKR：每个人都是理性的，但不知道其他人是否是理性的；囚徒困境
6
个人理性与集体理性的冲突
• “囚徒困境”表明个人理性与集体理性的冲突。 • 这样的例子很多：寡头竞争、军备竞赛、团队生产中的劳
动供给、公共产品的供给等； • 许多制度就是为了解决“囚徒困境”而存在的。
人民公社为啥生存不下去？
7
公共产品与税收制度
• 比较私人产品与公共产品的不同：使用上排他性； • 私人产品是自愿购买的，但公共产品可能需要强
19
• 方法2 • 1-100平均数 50 • 50、51的2/3为33 • 33的2/3为22 • 22的2/3为15 • 15的2/3为10 • 10的2/3为7 • 7的2/3为5 • 5的2/3为3 •2 •1
Chapter 3
纳什均衡与一致预期
经管学院企业管理系陈秀平
主要内容
• 占优均衡 • 重复剔除占优均衡（理性共识） • 纳什均衡与一致预期 • 混合战略纳什均衡 • 纳什均衡的存在性问题 • 颤抖手均衡
2
囚徒困境 (prisoners’ dilemma)
囚徒2
坦白
不坦白
囚徒坦白 1 不坦白
-8，-8 -10，0
• 占优均衡：由所有参与人的占优战略构成的战略组合 • 占优战略均衡的出现只要求所有人都是理性的，但不要
求每个参与人知道其他参与人是否理性。 • 囚徒困境博弈有占优均衡，所以其结果很容易预测。
4
5
• 一条街道两边均匀地分布着居民，有两家日用品店，出售的商品及价格完全一样，问两家店开在哪个位置？
C(b)R(b)C(b)R(b)C • (6)5th-order CKR:R not choose R3 for
R(b)C(b)R(b)C(b)R(b)C so, （R2，C2）is an equilibrium.
17
数字实验
• 从1-100中选择一个数字，与全班同学平均数字的2/3最接近者赢。
• (2)1st-order CKR:R not choose R4 for R(b)C • (3)2nd-order CKR:C not choose C1 for C(b)R(b)C • (4)3rd-order CKR: R not choose R1 for R(b)C(b)R(b)C • (5)4th-order CKR:C not choose C3 for
博弈论很大部分研究的是共同知识
13
共同知识 (common knowledge of rationality)
共同知识的概念最初是由逻辑学家李维斯提出的。对一个事件来说，如果所有博奔当事人对该事件都有了解，并且所有当事人都知道其他当事人也知道这一事件，并且所有当事人都知道所有当事人都知道这一事件，那么该事件就是共同知识
不合作 S，R-X
P，P
合同法
社会越稳定，法律越不重要
满足：X>R-T
10
2.重复剔除占优均衡
• 有些博弈没有占优战略，但通过剔除“坏”战略，我们可以预测博弈的结果。如“智猪博弈”。
• 在这个博弈中，大猪的最优选择依赖于小猪的选择。但小猪的最优选择与大猪的选择无关。如果大猪知道小猪是理性的，大猪将选择“按”。均衡是“大猪按，小猪等待”。
重复剔除
R1
R2
R3
R4 2
C1
C2
3
5,10
0,11
4
4,0
1,1
3,2
0,4
6
2,93
0,92
C3
C4
1
1,20 10,10
2,0 5 20,0
4,3
50,1
0,91 100,90
16
选择越多，对理性共识的要求越高
• (1) Zero-order CKR：C not choose C4 for C is rational
0，-10 -1，-1
无论对方如何选择，每个人的最优选择：坦白。所以，我们可以预测，结果将是（坦白，坦白）
3
1.占优均衡（dominant-strategy equilibrium)
• 占优战略（dominant strategy)：不管你的对手怎么做，这项策略带给你的好处都比其他所有的策略来得大。
制购买； • 税收制度就是为了保证公共产品的生产，解决公
共产品生产上的“囚徒困境”。
8
“囚徒困境”的一般表示
甲合作不合作
乙合作 T，T R，S
不合作 S，R P，P
帕累托效率（合作、合作）
满足：R>T > P > S；（R+S）<（T+T）
9
用法律解决“囚徒困境”
甲合作不合作
乙合作 T，T R-X，S
(2)一阶理性 First-order CKR:每个人都是理性的，并且知道其他每个人也都是理性的，但不知道其他人是否知道自己是理性的；智猪博弈
(3)二阶理性 Second-order CKR:(1)+(2)+每个人知道（2）； (4)无穷阶理性 Nth-order CKR
15
选择越多，对理性共识的要求越高