第二讲(占优均衡、纳什均衡)

合集下载

纳什均衡理论课件

纳什均衡理论课件

迭代逼近法
总结词
通过不断迭代和调整策略来逼近纳什均 衡。
VS
详细描述
迭代逼近法是一种通过不断迭代和调整参 与者的策略,以逐渐逼近纳什均衡的方法 。这种方法可以在不知道具体的纳什均衡 的情况下,通过迭代过程找到近似解。
04
纳什均衡的扩展与深化
非合作博弈中的纳什均衡
要点一
总结词
非合作博弈中,纳什均衡是指参与人选择策略时,没有达 成任何协议或合作,各自追求自身利益的最大化。
纳什均衡理论课件
目录 CONTENTS
• 纳什均衡理论概述 • 纳什均衡的分类与特性 • 纳什均衡的证明方法 • 纳什均衡的扩展与深化 • 纳什均衡理论的现实应用 • 纳什均衡理论的前沿研究与展望
01
纳什均衡理论概述
定义与概念
纳什均衡定义:在博弈中,如果每个参与者的策略都是针对其他参与者的最优策略 ,则该博弈状态被称为纳什均衡。
社会学
纳什均衡理论在社会学中用于研究社会行为、合作与冲突 、社会规范等领域,揭示了社会现象背后的博弈逻辑。
生物学
在生物学中,纳什均衡理论用于研究生物种群竞争、进化 策略等领域,解释了生物种群之间的生存竞争与演化现象 。
政治学
在政治学中,纳什均衡理论用于分析国际关系、政治竞争 等领域,揭示了权力与利益分配的博弈逻辑。
社会冲突管理
在处理社会冲突时,可运用纳什 均衡理论来分析各方的利益和策 略,寻求最优解决方案。
公共资源管理
在管理公共资源时,政府可运用 纳什均衡理论来分析个体和团体 的竞争策略,制定最佳资源分配 方案。
06
纳什均衡理论的前沿研究与展望
当前研究热点与难点
热点
复杂系统中的纳什均衡、多智能 体系统中的纳什均衡、网络博弈 中的纳什均衡

占优战略均衡和纳什均衡的联系与区别

占优战略均衡和纳什均衡的联系与区别
5)没有占优战略均衡的博弈,不能用重复剔除严格劣战略方法求解 的博弈,可以有纳什均衡
1、占优战略均衡和纳什均
: 衡的联系与区别:
1)每一个占优战略均衡都是纳什均衡,而每一个纳什均衡却未必是 占优战略均衡;
2)用重复剔除严格劣战略方法,保留下的唯一的重复剔除的占优均 衡,就是纳什均衡.
3)纳什均衡,不会被重复剔除严格劣战略方法剔除掉(但弱劣战略 剔除,可能会剔除纳什衡):
4)经重复剔除严格劣战略之后,有不唯一的多个哉略组合保留,其 中有的战略组合不一定纳什均衡.即重复剔除严格劣战略方法, 无法确保将所有非纳什均衡战略剔除,没有被剔的Байду номын сангаас略组合不一 定是纳什均衡.

第二讲多重纳什均衡.ppt

第二讲多重纳什均衡.ppt
16
香精包子的思考

香精包子——其他包子企业如何做?
参与人根据其共同观测到的信号选择行动。

博弈论第三章
4,4 -8,-2 -2,-8 -2,-2
17
第三节多重纳什均衡的选择标准

五、抗共谋均衡 (一)案例:是否采用新技术
厂商1
厂商2 新技术 旧技术 新技术 2,2,2 5,0,5 旧技术 0,5,5 1,1,10 厂商3:新技术 厂商2 新技术 旧技术 新技术 5,5,3 10,1,1 旧技术 1,10,1 2,2,2 厂商3:旧技术
(一)案例:计算机产品的兼容性
企业C
3.5



5.25英寸盘

3.5英寸盘
企业A
8,8 2,3
3,2 6,6
5.25英寸盘

博弈论第三章
4
第三节 多重纳什均衡的选择标准

一、帕累托优势标准:得益最大
(二)帕累托优势标准
按照支付大小筛选纳什均衡
(3.5英寸盘,3.5英寸盘)
8,8 2,3
二、风险优势标准:风险更小
(三)纳什均衡的选择标准:风险优势标准
比较不同纳什均衡之间的风险状况,风险小的纳什均衡 优先
帕累托标准还是风险标准? 1.人会犯错误; 2.大多数人是风险厌恶者。 帕累托标准:理论 风险优势标准:实践
• 博弈论第三章
9,9 8,0
0,8 7,7
12
第三节多重纳什均衡的选择标准
(二)分析:偏离损失比较法
2.乙:单独偏离均衡的损失 (1)偏离“作弊”:9-8=1
甲坚守

(2)偏离“不作弊”:7-0=7
9,9 8,0

第二讲纳什均衡

第二讲纳什均衡
旅游区商户
诚实 游客 游客收益10 商户收益5 不购买 游客收益0 商户收益-5 购买
欺诈 游客收益5 商户受收益10 游客收益0 商户收益0
案例讨论
2008年的美国总统大选让我们看到一 幕大戏。这场大戏的精彩部分并不是 迷住当与共和党的总统选举对决,而 是民主党总统候选人的提名选举。 民主党的提名竞选,最终只在希拉里 和奥巴马之间进行。在2008年之前, 奥巴马只是一个默默无闻的小角色, 他那年才46岁,只有3年的国会参议员 和伊利诺伊州参议员的工作经历,但 他是当时国会中唯一一位黑人参议员, 也是
2、纳什均衡一定是在重复剔除严格劣战略过 程中没有被剔除掉的战略组合,但没有被剔除 的战略组合不一定是纳什均衡,除非它是唯一 的。(这句话并不适用于弱劣战略剔除的情况)
第二节
纳什均衡
三、寻找纳什均衡的方法 (一)劣势策略反复消去法 民主党 主动增税 被动增税 2,2 1,4 主动增税 共和党 4,1 3,3 被动增税
纳什均衡
纳什均衡:(被动增税,被动增税) 巨额赤字
试一试:劣势策略反复消去法
上 参与人1 下 参与人2 左 中 右
1,0
0,4
1,3
0,2
0,1
2,0
第二节
纳什均衡
三、寻找纳什均衡的方法 2000:军费支出 (二)相对优势策略划线法 -∞:丧失主权 8000:掠夺者赢利 0:军费支出为零,和平 原苏联 共处 扩军 裁军 -2000,-2000 8000,-∞ 扩军 美国 -∞,8000 0, 0 裁军
2 TR TC p2 (a p2 bp1 ) (a p2 bp1 )c
伯川德模型
通过令一阶导数为零,得到:

第二讲纳什均衡

第二讲纳什均衡

猎人博弈得益矩阵

猎鹿 打兔
10
4 0

猎鹿
10 0
4 4
打兔
4
博弈论故事之五--高薪养廉
• “高薪养廉”是公务员制度方面的一种理论,我们分 高薪养廉”是公务员制度方面的一种理论, 析一下“高薪”为什么能养廉? 析一下“高薪”为什么能养廉? • 假设甲乙为一家单位的主任和书记关系密切的国家公 务员, 代表现在政府给他们的高薪 如果两人受贿, 代表现在政府给他们的高薪。 务员,7代表现在政府给他们的高薪。如果两人受贿, 因为串谋而一时不被人发现,他们可以达到9的位置 的位置; 因为串谋而一时不被人发现,他们可以达到 的位置; 而一旦“东窗事发” 他就要被撤职查办, 而一旦“东窗事发”,他就要被撤职查办, 不受贿一 方得8 方得 • 画出得益矩阵
美苏争霸的囚徒困境
• 军备竞赛的博弈:从军事上看,二三十年前美国和前苏联是世界 军备竞赛的博弈:从军事上看, 上的两个超级大国,他们相互对垒。 上的两个超级大国,他们相互对垒。假定每一方都有两种策略选 一个是扩军,发展核武器,实施“星球大战”计划等; 择:一个是扩军,发展核武器,实施“星球大战”计划等;另一 个是彻底裁军,直至不设军备。 个是彻底裁军,直至不设军备。 • 如果双方都扩军,则各花费2000亿美元用于军费。彻底裁军,则 如果双方都扩军,则各花费 亿美元用于军费。 亿美元用于军费 彻底裁军, 军费为0。 军费为 。 • 如果美军不设防,但前苏联扩军,前苏联就可以任意欺负和损害 如果美军不设防,但前苏联扩军, 美国,这样,美国会受到很大损失,直至丧失主权。我们记得益 美国,这样,美国会受到很大损失,直至丧失主权。 ?,假定为 亿美元。 为-∞;而苏联又会是多少呢 ?为+∞?,假定为 ; ?,假定为10000亿美元。 亿美元 反之也成立。 反之也成立。

第二节 纳什均衡

第二节 纳什均衡

通俗的讲,就是给定你的最优选择,我会选择能 够使我最优的选择,或者说,我选择在给定你的选择 的情况下我的最优选择,你选择了给定我选择情况下 你的最优选择。这种均衡最后到底均衡在哪一点,由 具体情况决定。在存在帕累托改善的情况下,可能会 达到帕累托最优。
在本例中,B企业选择了生产高度白酒,A企业选 择生产低度白酒是一种均衡;B企业选择了生产低度白 酒,A企业选择生产高度白酒也是一种均衡。由于在B 企业选择生产高度白酒,A企业选择生产低度白酒的时 候,A、B两企业的收益都比B企业选择生产低度白酒, A企业选择生产高度白酒时的收益要高,存在着帕累托 改善,因此最后可能会达到帕累托最优,即B企业选择 生产高度白酒,A企业选择生产低度白酒。
二、无纳什均衡的例子 实际上,纳什均衡也是一种特殊情况,并不是所 有的博弈都会产生纳什均衡。例如:在足球比赛中, 罚点球的时候,守门员和罚球者也构成一个博弈,双 方的收益矩阵如下图所示:
守门员
左中右
左 -1,1 1,-1 1,-1


中 1,-1 -1,1 1,-1

右 1,-1 1,-1 -1,1
由于在b企业选择生产高度白酒a企业选择生产低度白酒的时候ab两企业的收益都比b企业选择生产低度白酒a企业选择生产高度白酒时的收益要高存在着帕累托改善因此最后可能会达到帕累托最优即b企业选择生产高度白酒a企业选择生产低度白酒
第二节 纳什均衡
一、举例 假定A、B两个企业都生产白酒,白酒分为高度和低 度两种。报酬矩阵如图所示:
同样,当罚球者判断守门员将向右扑球时,罚 球者将向左或中发球;当罚球者判断守门员将向右 扑球时,罚球者将向右或中发球;当罚球者判断守 门员将向中扑球时,罚球者将向左或右发球。此时 果守门员也选择 了右,罚球者将得 -1,守门员将得 +1;如果守门员 选择了左或者中,罚球者将得 +1,守门员将得 -1。

1什么是占优策略均衡

1什么是占优策略均衡

1 什么是占优策略均衡,什么是纳什均衡,什么是帕累托最优,占优策略均衡和纳什均衡是帕累托最优吗?占有策论,无论其它参与者采取什么策略,该参与者的唯一最优策略就是他的占优策略。

占优策略均衡,有博弈者中所有参与者的占优策略所组成的均衡就是占优策略均衡。

纳什均衡,给定其他参与者策略条件下,每个参与者所选择的最优策略所构成的策略组合则是纳什均衡。

帕累托最优,如果对于某种既定的资源配置状态,所有的帕累托改进均不存在,即在该状态上,任意改变都不可能使至少一个人的状况变好,而不是其它任何人的状况变坏,则称这种资源配置状态为帕累托最优状态。

占优策略均衡,纳什均衡是帕累托最优。

2 寻租理论①非生产性的寻利活动即所谓的寻租活动,为获得和维持垄断地位,从而得到垄断利润的活动。

②社会寻租分析,现在一般对政府的行贿受贿行为或过程,所以为寻租是因为政府手中的权利不可能永远得到,只能是一时的,钱权交易就好比政府手中的权利出租一样。

寻租是导致政府腐败的重要原因,而且也不仅是经济领域,凡是政府掌握的行政审批事项都有可能引起寻租活动。

经济学家把寻租活动成为人类社会的负荷游戏,就是一场就社会总体而言损失大于利得的竞赛。

从理论上讲,在均衡状态或从长远看,寻租这本身不会有什么好处,然而既然有寻租者,就有避租者与之抗衡,到头来就是社会经济的内耗,资源的浪费。

③恶性循环的趋势,因为寻租的存在,市场竟真的公平性就破坏了,使人们对市场机制的合理性和有效性发生了根本性怀疑,于是人们更多的要求政府干预来弥补收入分配的不均现象这样就提供了更多的寻租机会,产生了更多的社会不公品。

在面临寻租所造成的巨大社会经济浪费时,政府即使明知的意识到问题的严重性,也会处于两难的境地,束手无策。

3 什么是经济经济,节约高效规范①节约,有效以较少的人力物力时间等消耗获得较大成果。

②用来统称人类社会生产交换分配和消费等经济活动,以及组织这些经济活动的制度系统。

经济学,在一定经济制度下,研究稀缺资源在各种可供选择的用途之间进行配置和利用,以及生产出各种商品并合理分配给不同的社会成员,以供消费的科学。

第二讲纳什均衡

第二讲纳什均衡

习题:齐威王田忌赛马矩阵

上中下 上中下
田忌
上下中 中上下 中下上 下中上 下上中
+3,-3 +1,-1 +1,-1 -1,+1 +1,-1
+1,-1 +3,-3 -1,+1 +1,-1 +1,-1
+1,-1 +1,-1 +3,-3 +1,-1 -1,+1
+1,-1 +1,-1 +1,-1 +3,-3 +1,-1
在第二行1 下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
20
第三节 纳什均衡
三、寻找纳什均衡的方法 (二)相对优势策略划线法 3.设定甲靠左行(第一行) 乙: 1>-1 乙相对优势策略:靠左行
在第一列 1下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
21
第三节 纳什均衡
四、古诺模型 max i 2.企业i的目标: π1=?,π2=? 3.企业利润最大化的一阶、二阶条件
1 0 q1 2 0 q2
2015年12月6日
2 1 2 0 2 q1 2 2 2 0 2 q 2
博弈论第二章 第二讲纳什均衡
35
第三节 纳什均衡
27
第三节
纳什均衡
要点:(1)箭 头指向的支付 大;(2)只有 一方单独改变 策略
三、寻找纳什均衡的方法 (三)箭头指向法 2.分析:(适度放牧,过度放牧) (1)给定乙不变,甲改变:0→10 (箭头向上) (2)给定甲不变,乙也不变
2015年12月6日
博弈论第二章 第二讲纳什均衡

第2章_纳什均衡

第2章_纳什均衡
– – – – 如果R(b)C 选择C2, 如果R(b)C(b)R会选择R2; 如果R(b)C(b)R(b)C会选择C1; 如果R(b)C(b)R(b)C(b)R会选择R1
Consistently aligned beliefs (CAB)
考虑(R3,C3):对方不会犯预期错误:R选 择R3,如果他认为C会选择C3;C会选择C3, 如果他认为R会选择R3。 CAB:每个人对别人行为的预期(信念)是正 确的; Harsanyi doctrine: 如果两个理性的人具有相同 的信息,他们一定会得出相同的推断和相同的 结论; Robert Aumann: rational agents cannot agree to disagree.
左 1, 3 0, 2
右 4, 1 3, 4
选择越多,对理性共识的要求越高
C1 C2 C3 1,20 2,0 4,3 C4 10,10 20,0 50,1
R1
R2 R3 R4
5,10 0,11
4,0 3,2 2,93 1,1 0,4 0,92
0,91 100,90
(1)Zero-order CKR: C not choose C4 for C is rational (2)1st-order CKR: R not choose R4 for R (b) C (3)2nd-order CKR: C not choose C1 for C(b)R(b)C (4)3rd-order CKR: R not choose R1 for R(b)C(b)R(b)C (5)4th-order CKR: C not choose C3 for C(b) R(b)C(b)R(b)C (6)5th-order CKR: R not choose R3 for R(b) C(b) R(b)C(b)R(b)C so, (R2,C2) is an equilibrium

第二讲 纳什均衡 PPT课件

第二讲 纳什均衡 PPT课件
二、情侣博弈的结论:纳什均衡 (三)分类 2.普通纳什均衡 (1)均衡战略与非均衡战略无差异 (2)参与人单独改变策略后,支付可
能不变
2020年1月5日
博弈论第二章
12
第二讲纳什均衡
第三节 纳什均衡
三、寻找纳什均衡的方法
团队合作
(一)严格劣势策略反复消去法


工作 偷懒
工作
6,6
+1,-1
+1,-1 +1,-1
博弈论第二章 第二讲纳什均衡
-1,+1
+1,-1 +3,-3
37
博弈论第二章
33
第二讲纳什均衡
第三节 纳什均衡
四、纳什均衡在微观经济学中的应用: 古诺模型
1.博弈三要素 (3)支付
i (q1, q2 ) (a q1 q2 ) qi ciqi
2020年1月5日
博弈论第二章
34
第二讲纳什均衡
第三节 纳什均衡
四、古诺模型
2.企业i的目标: max i
二、情侣博弈结论:纳什均衡 (一)表述 若存在一个策略组合(足球,足球),
当参与人单独改变策略后,支付下降, 此策略组合为纳什均衡。 ——博弈各方相互作用的稳定结局
2020年1月5日
博弈论第二章
9
第二讲纳什均衡
第三节 纳什均衡
二、情侣博弈的结论:纳什均衡 (二)定义
给定G={S1,…,Sn;u1,…,un}, s*=(s*1,…,sn*) 对于所有i和si∈Si,有: ui(si*,s-i*)≥ ui(si’,s-i*)
2020年1月5日
博弈论第二章
23
第二讲纳什均衡

纳什均衡中的几个概念的整理 占优策略(dominant strategy):在囚徒

纳什均衡中的几个概念的整理 占优策略(dominant strategy):在囚徒

纳什均衡中的几个概念的整理占优策略(dominantstrategy):在囚徒纳什均衡中的几个概念的整理占优策略(dominant strategy):在囚徒困境中,我们发现,一个局中人的最优策略选择不依赖另一个局中人的策略选择,即无论其他局中人选择什么策略,他,的最优策略是唯一的(在囚徒困境中,如果双变量矩阵中的得益的具体数字0-1,-6,-9换成任意的、、、,只要满足>>>,上述结论依然成立),TRPST R P S我们把这样的最优策略称为“占优策略”(dominant strategy). 严格劣策略(strictly dominated strategy):在标准型博弈G,{S1,…,Sn;u1,…,un}中,令si,和si,代表局中人i的两个可行策略(即是Si中的元素)。

如果对其他局中人每一个可能的策略组合,i选择si,的收益都小于其选择si,的收益,则称策略si,相对于策略si,是严格劣策略:,, usssusssss(,,,,)(,,,,,,),iiniiiin11111,,,对其他局中人在其策略空间S1,…,S i,1,…,Sn中每一组可能的策略(s1,…,si,1,…,sn)都成立。

也就是说严格劣策略就是不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略。

占优策略均衡:在标准型博弈G,{S1,…,Sn;u1,…,un}中,如果对于所有, si,是局中人i的占优策略,那么,策略组合s〞=(s〞1, …,s〞n)称为的i 占优均衡(dominant,strategy equilibrium)。

一个博弈的某个策略组合中的所有策略都是各个博弈方各自的占优策略,必然是该博弈比较稳定的结果。

terated Elimination of Strictly Dominated 重复剔除的占优均衡(IStrategies):如果s〞=(s〞1, …,s〞n)它是重复剔除严格劣策略后剩下的策略组合,策略组合s〞=(s〞1, …,s〞n) 称为重复剔除的占优均衡。

第2章 纳什均衡

第2章  纳什均衡
PA UA = PB δ A类消费者购买商品A A类消费者购买商品 B
PA δ UB = PB
B类消费者购买商品A B类消费者购买商品B
q 用 q A 表示消费者对于产品A的需求量; B 表 示消费者对于产品B的需求量.则 0 PA > PB +δ qA = nA PB δ ≤ PA ≤ PB +δ n +n PA < P δ A B B
为纳什均
衡的充要条件是对任何局中人,支付差为
* * u i ( s i* , s i ) u i ( s i , s i ) ≥ 0
,而与这个差
值是多少无关,由此可导出纳什均衡的一个性质: 纳什均衡的不变性
命题2.1 设 命题
G = N, S1 , , Sn , u1 , , u n
为已知策略型博弈.下不变. 正仿射变换 对 ,令 i∈N
ui' ( s) = δ iui ( s) + Ci ,其中
δ i > 0 ,则G与
' G' = N,S1,,Sn , u1,, u'n 有相同的纳什均衡.
(2)纳什均衡在支付函数的局部变换 局部变换下不变. 局部变换 给定
si ∈S i
定义2.2表明,局中人i的最优化反应映射 ri (s) 仅与 s i 有关. 反应函数 当 ri (s) 为单点集时,称 ri (s ) 为局中人i的最优反应函数 最优反应函数,简称 最优反应函数 反应函数.这时将 ri (s ) 记为 BRi (s i ) . 反应函数
定义2.3 最优反应映射 定义
G的纳什均衡可由以下划线法 划线法求得. 划线法 例2.4在囚徒困境问题中,其支付矩阵为
C C ( 5, 5 ) D ( 8, 0 )

纳什均衡中的几个概念的整理占优策略dominantstrategy在囚徒

纳什均衡中的几个概念的整理占优策略dominantstrategy在囚徒

纳什均衡中的几个概念的整理占优策略(dominantstrategy ): 在囚徒纳什均衡中的几个概念的整理占优策略(dominant strategy): 在囚徒困境中,我们发现,一个局中人的最优策略选择不依赖另一个局中人的策略选择,即无论其他局中人选择什么策略,他,的最优策略是唯一的(在囚徒困境中,如果双变量矩阵中的得益的具体数字0-1,-6,-9换成任意的、、、,只要满足>>>,上述结论依然成立),TRPST R P S 我们把这样的最优策略称为“占优策略”(dominant strategy).严格劣策略(strictly dominated strategy): 在标准型博弈G,{S1,,,Sn;u1,,,un}中,令si,和si,代表局中人i的两个可行策略(即是Si中的元素)。

如果对其他局中人每一个可能的策略组合,i选择si,的收益都小于其选择si,的收益,贝U称策略si,相对于策略si,是严格劣策略:|a I F l! -i I ■ I- ■I K 4,,usssusssss(,,,,)(,,,,,,),ii niiii n11111,, ,对其他局中人在其策略空间S1,,,S i,1,, ,Sn中每一组可能的策略(s1,,,si,1,, ,sn)都成立。

也就是说严格劣策略就是不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略。

占优策略均衡:在标准型博弈G,{S1,,,Sn;u1,,,un}中,如果对于所有,si,是局中人i的占优策略,那么,策略组合s〃=(s 〃1, ,,s 〃n)称为的i占优均衡(dominant,strategy equilibrium) 。

一个博弈的某个策略组合中的所有策略都是各个博弈方各自的占优策略,必然是该博弈比较稳定的结果。

terated Elim in ati on of Strictly Domin ated重复剔除的占优均衡(IStrategies):如果s" =(s " 1,,,s " n)它是重复剔除严格劣策略后剩下的策略组合,策略组合s〃=(s 〃1,,,s 〃n)称为重复剔除的占优均衡。

第二讲(占优均衡、纳什均衡)

第二讲(占优均衡、纳什均衡)

纳什均衡 – 收益占优均衡
• 案例:推与不推博弈
– 吉姆和卡尔开车驶在同一条路上,有棵大树挡住了道路。 两人可以选择都去推树,树会被成功的挪走(每人收益 5)。如果一人推,一人不推,则推的人会受伤(收益 是-10),另一个人要需要将伤者送到医院(收益是0)。 如果两人都不推,就必须掉头驶回(两人收益都为1)。
垃圾处理博弈收益矩阵
甲先生
倾倒
雇卡车
乙先生 倾倒 4000, 4000 5000, 3500 雇卡车 3500,5000 4500,4500
• 在该博弈中,对于甲先生和乙先生,他们最优的战略就是“倾倒垃 圾”,因此即为他们的占优战略。
• 劣战略:如果第二个战略被第一个战略占优,那么第二个战略被 称为劣战略。显然,雇卡车是该博弈的劣战略。
A 40 B 10 A 15 B 15
存在两个以上战略的博弈
• 教科书博弈:
– H和K两位教授都在编写经济教科书。两本书质量相同,但篇 幅长短不同。一般情况下,如果质量一样,教师会选择篇幅 长一点的教科书。当然,每个人都想获得更多的读者,但增 加篇幅需要付出更多的努力。两位作者不想写得太长,只要 能战胜对方就可以了。
协调博弈 (Coordination game)
• 在协调博弈中,只有协调 彼此的战略选择,参与者 才能得到最优的收益。
– 推与不推博弈就是一个协调 博弈。
• 案例:赶集日博弈
– 如果买方和卖方同一天去集 市,交易成功,他们双方都 可获利。但如果不在同一天 去,则交易没法进行,且还 要支付交通费用。
– 请问这两家寡头企业有没有占优战略和占优均衡? – 该博弈的合作解是什么? – 两家企业达成了协议进行联合。 – 这对社会效率会有怎样的影响? – 寡头联合形成垄断(托拉斯),并降低社会效率。在

第二讲多重纳什均衡

第二讲多重纳什均衡

➢(一)案例:串通作弊博弈

逆天的帕 累托优势
学生乙

标准 作弊 不作弊

作弊
➢学生甲

不作弊
9,9 8,0
0,8 7,7
第三节多重纳什均衡的选择标准
➢二、风险优势标准:风险更小 ➢(二)分析:偏离损失比较法 ➢1.甲:单独偏离均衡的损失 ➢(1)偏离“作弊”:9-8=1 ➢(2)偏离“不作弊”:7-0=7
的均衡。 ➢ 2.标准
➢根据社会文化习惯、博弈历史等信息达到均衡 ➢ 3.实质
➢规律性 ➢强调文化与环境的作用
新婚夫妻的家务分担博弈 ; 教室中的座位分配博弈。
第三节多重纳什均衡的选择标准
➢四、相关均衡
➢(一)案例:“地域连坐”下的产品 质量博弈

企业乙

好产品 差产品

好产品 4,4
➢企业甲 ➢
2019年7月17日博弈论第三章第二讲多重纳什均衡第三节多重纳什均衡的选择标准2019年7月17日博弈论第三章第二讲多重纳什均衡35英寸盘525英寸盘525英寸盘883223662019年7月17日博弈论第三章第二讲多重纳什均衡3535883223662019年7月17日博弈论第三章第二讲多重纳什均衡2019年7月17日博弈论第三章第二讲多重纳什均衡99088077累托优势标准2019年7月17日博弈论第三章第二讲多重纳什均衡70799088077乙坚守2019年7月17日博弈论第三章第二讲多重纳什均衡70799088077甲坚守2019年7月17日博弈论第三章第二讲多重纳什均衡10990880772019年7月17日博弈论第三章第二讲多重纳什均衡11990880772019年7月17日博弈论第三章第二讲多重纳什均衡1299088077帕累托标准还是风险标准
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

买方
周周周周周周 一二三四五六
卖 周 3, -1, -1, -1, -1, -1, 方 一 3 -1 -1 -1 -1 -1
周 -1, 3, -1, -1, -1, -1, 二 -1 3 -1 -1 -1 -1
周 -1, -1, 3, -1, -1, -1, 三 -1 -1 3 -1 -1 -1
周 -1, -1, -1, 3, -1, -1. 四 -1 -1 -1 3 -1 -1
– 假设赢得收益是1,而输的收益是-1,平局的收益是各 为0。
A 石头 剪刀 布 B 石头 0, 0 1, -1 -1, 1 剪刀 -1, 1 0, 0 1,-1 布 1,-1 -1, 1 0, 0
零和博弈和非零和博弈
• 零和博弈 (zero-sum game):
– 是一种完全对抗,强烈竞争 的对局。
– 参与者的收益总和是零(或 是某个常数-常数和博弈 constant-sum game),也 就意味着一个参与者的所得 既是另一个参与者所失去的。
– 案例:狐狸和狼
狼 相信 狐狸
不相 信狐 狸
• 画出该博弈的收益矩阵。
狐狸 欺骗 不欺 狼 骗狼 -100, 0, 100 -100
0, 0, -100 -100
第二讲 占优均衡、纳什均衡
占优战略
• 占优战略 (dominant strategy):
– 无论其他博弈者采用何种战略,该博弈者的战略总是 最好。
案例:垃圾处理博弈 甲先生和乙先生是邻居,他们 的房子格局如右图。他们可以 选择把垃圾倾倒在离自己房子 较远的一块属于自己的空地 上,但如此倾倒垃圾会影响到 邻居。他们也可以共同雇佣一 辆卡车处理垃圾,但每人需支 付¥500。 他们会如何做出决策呢?
• 纳什均衡 (Nash equilibrium):
– 是全部参与者所选战略的一个组合,在这个战略组合 中,每个人的战略都是针对其他人战略的最优反映。
– 纳什战略也是非合作均衡。 – 占优均衡属于纳什均衡,而纳什均衡不属于占优均衡。 – 请寻找一下教科书博弈中的纳什均衡。
• 案例:选择电台节目
纳什均衡
协调博弈 (Coordination game)
• 在协调博弈中,只有协调 彼此的战略选择,参与者 才能得到最优的收益。
– 推与不推博弈就是一个协调 博弈。
• 案例:赶集日博弈
– 如果买方和卖方同一天去集 市,交易成功,他们双方都 可获利。但如果不在同一天 去,则交易没法进行,且还 要支付交通费用。
可能出现负和或正和的结果?
非零和博弈
• 在市场经济下,要想获得利益就要跟别人合作,才能使双 方都获得好处。
• 只要是双方同意的任何一个买卖,买方和卖方都会获得利 益。
• 事实上,那些看似零和或者负和的问题如果转换一下视 角,也可能转变为正和博弈。
3 PDF 文件使用 "pdfFactory Pro" 试用版本创建
• 因此纳什均衡具有“非唯一性”。
– 事实上,一方只有在明确知道另一方选择的情况下才能做出自己 的选择,因此当面临同时选择时,就可能产生了问题。结果到底 是哪个纳什均衡呢?
– 假设库克多年来成功的播放了摇滚乐节目,那么维德就有理由相 信库克会继续选择摇滚乐而采用乡村音乐的节目形式。
• 从历史中得到线索,进而判断出各个均衡发生的概率。把 这种以线索为基础选择的均衡称为“谢林点”(Schelling point)或“焦点”。
– 该博弈有无占优战略和占优均衡?
K教授
教科书博弈收益矩阵 H教授
400页 600页 800页 400页 45,45 15,50 10,40 600页 50,15 40,40 15,45 800页 40,10 45,15 35,35
纳什均衡
• 在教科书博弈中,没有占优战略,而只有针对对 方战略的最优反映。当对方改变战略后,另一方 的战略也需要相应的改变,否则就会处于劣势。
垃圾处理博弈收益矩阵
甲先生
倾倒
雇卡车
乙先生 倾倒 4000, 4000 5000, 3500 雇卡车 3500,5000 4500,4500
• 在该博弈中,对于甲先生和乙先生,他们最优的战略就是“倾倒垃 圾”,因此即为他们的占优战略。
• 劣战略:如果第二个战略被第一个战略占优,那么第二个战略被 称为劣战略。显然,雇卡车是该博弈的劣战略。
– 在特定情况下,管理和传统能够提供多纳什均 衡博弈的解。
– 协调博弈中的纳什均衡可以解释为什么习俗和 惯例看似很随意, 实际却很稳定,因为他们都 是纳什均衡,能够自我强化。
不存在纳什均衡的博弈
• “石头,剪刀,布”是一个猜拳游戏。 • 假定该博弈为非合作均衡,参与者都想获胜,那
么其存在占优均衡吗?纳什均衡? • 画出该博弈的收益矩阵。
乡村 40,50 20,20 40,10
目,只有10%。如果两个
音乐
电台同时选择一种节目形
谈话 10,80 10,40 5,5
式,它们将平分听众。
节目
• 该博弈中,有无占优战略 和占优均衡?纳什均衡?
纳什均衡 – 谢林点
• 在选择电台节目博弈中存在两个纳什均衡。 – 维德-摇滚乐和库克-乡村音乐,或者维德-乡村音乐和 库克-摇滚乐。
非合作和合作均衡
• 然而对于契约,往往 每个参与者都有强大 的动机去欺骗协议转 向非合作性均衡。
– 这是为什么呢?
– 在双寡头博弈中,无 论是A寡头还是B寡头 都可以通过违约获取 更多的收益“40”。
B 寡 联合并 头 限制生

竞争
A寡头 联合并 限制生
产 A 30 B 30
A 10 B 40
竞争
非合作和合作均衡
• 对抗博弈 (rivalry game):
– 又称“非合作性均衡” (non-cooperative equilibrium) 。 – 每一方选择战略时都没有共谋,他们只是选择对自身
最有利的战略。(虽然合谋的共同利益将达到最大。) – 占优均衡是一种非合作解。 – 如果两者进行合作,则会出现“合作性均衡”
• 该博弈的纳什均衡是什么? (推推,与推不)推和博(弈不收推益,矩不阵推)
吉姆
• 该博弈的谢林点是哪个?你
推 不推
是如何判断的? 收风益险最占大优这个特卡尔征似乎推能够使5使(,5(不推-,10推不,0 )
均推衡)称为该谢博林弈点的,谢因林为不点这推个。0均,衡-1规0 避1了,1
最大的损失。
2 PDF 文件使用 "pdfFactory Pro" 试用版本创建
非零和博弈
• 非零和博弈:
– 既有对抗,又有合作。参与者的目标不完全对立。
• 非常数和博弈 (non-constant-sum game):
– 总收益取决于参与者所选择的战略。 – 其结局的收益总和是可变的。 – 负和博弈 – 两败俱伤的结果。 – 正和博弈 – 双赢的结果。 – 请你思考一下在狐狸和狼的博弈中,采用怎样的战略
(cooperative equilibrium)。
• 合约为解决社会两难问题提供了一个出路。
– E.g.垃圾处理博弈中共同雇佣卡车就是一个合作解,双 方可以通过签订合约规定必须履行雇卡车的义务。
– 在很多非合作的场合,法规也能达到同样的目的。
非合作和合作均衡
• 案例:双寡头市场。
– 市场上有两个寡头企业。他们可以组成企业联合并限 制生产以抬高产品市场价格。或者他们可以竞争。右 表显示了这两个企业的各种可能的收益。
周 -1, -1, -1, -1. 3, 1, 五 -1 -1 -1 -1 3 -1
周 -1, -1, -1, -1, -1, 3, 六 -1 -1 -1 -1 -1 3
协调博弈
• 赶集日博弈的逻辑推理并没有给出谢林点。 • 提供谢林点的可能是城镇的习俗。该城镇
可能总是周二举行集市。 • 由此可见:
A 40 B 10 A 15 B 15
存在两个以上战略的博弈
• 教科书博弈:
– H和K两位教授都在编写经济教科书。两本书质量相同,但篇 幅长短不同。一般情况下,如果质量一样,教师会选择篇幅 长一点的教科书。当然,每个人都想获得更多的读者,但增 加篇幅需要付出更多的努力。两位作者不想写得太长,只要 能战胜对方就可以了。
• 请问这两家渔民有没有占 优战略和占优均衡?
• 该博弈可以给我们什么启 示?
渔民B
限制捕 尽全力 鱼量 捕鱼
渔 限制捕 民 鱼量
A 尽全力 捕鱼
A 20 B 20 A 30 B2
A2 B 30 A4 B4
社会两难:是一种存在占优均衡的博弈,但是参与者采用这 种均衡战略的收益比采用非均衡战略的收益要差。
• 有两家电台 – 维德和库克。 选择电台节目博弈收益矩阵
它们可以在三种节目形式 中选择:摇滚乐,乡村音 乐和谈话节目。收益用它
们所获得听众的百分比表 示。听众中有70%喜欢的 是摇滚乐;其次是乡村音
维德
摇滚乐 乡村 谈话 音乐 节目
库 摇滚 35,35 50,40 80,10 克乐
乐,有40%;然后谈话节
纳什均衡 – 收益占优均衡
• 案例:推与不推博弈
– 吉姆和卡尔开车驶在同一条路上,有棵大树挡住了道路。 两人可以选择都去推树,树会被成功的挪走(每人收益 5)。如果一人推,一人不推,则推的人会受伤(收益 是-10),另一个人要需要将伤者送到医院(收益是0)。 如果两人都不推,就必须掉头驶回(两人收益都为1)。
– 请问这两家寡头企业有没有占优战略和占优均衡? – 该博弈的合作解是什么? – 两家企业达成了协议进行联合。 – 这对社会效率会有怎样的影响? – 寡头联合形成垄断(托拉斯),并降低社会效率。在
完全竞争的状态下,非合作性均衡造成了社会的最大 效率。
相关文档
最新文档