12纳什均衡
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
反应函数
q2
(0,6) (0,3)
R1(q2 )
理性局 限和古 诺调整
R2 (q1)
(3,0) (6,0)
q1
古诺模型的反应函数图示
伯特兰德寡头模型
销售竞争的反映函数
假设企业A和企业B都向市场出售某一产品,可选择的竞争策 略是价格,目的是赚取最多的利润。已知两个企业面临的需 求函数是
Q1=12-2P1+P2
a
b
c
B -,+ -,+ +,-
C +,-,+ -,+
严格下策反复消去
守方 攻方
a
c
B -,+ +,-
C +,-,+
静态博弈与纳什均衡
静态博弈的描述 严格下策反复消去法 纳什均衡 反应函数 混合策略纳什均衡 多重纳什均衡的分析
划线法
乙方 甲方
上
下
左 1,1 2,3
中 4,2 1,2
右 1,3 2,1
守方战略 A=三个师集中守甲方向 B=两个师守甲方向,一个师守乙方向 C=一个师守甲方向,两个师守乙方向 D=三个师集中守乙方向
严格下策反复消去
守方 攻方
a
A -,+
b
+,-
c
+,-
用+,-表示胜利和失败
B -,+ -,+ +,-
C +,-,+ -,+
D +,+,-,+
严格下策反复消去
守方 攻方
纳什均衡
上策均衡肯定是纳什均衡,但纳什均衡不一定 是上策均衡 在n个博弈方的博弈中,如果严格下策反复消 去法排除了除 (si*, sn* ) 之外的所有策略组合, 那么 (si*, sn* )一定是该博弈的唯一的纳什均衡 在n个博弈方的博弈中,如果(si*, sn* )是一个纳 什均衡,那么严格下策反复消去法一定不会将 它消去
囚徒困境的内在根源是个体理性和集体理性之间的矛 盾引起的以个体理性和个体选择为基础的分散决策方 式并不一定实现整体利益最优
为什么不合作? 合作的前提和要件是什么? 合作机制的设计?
智猪博弈
在美国大湖地区可以看到许多灯塔,这些灯塔都是大 航运公司花钱建造的,但这并不妨碍小的航运公司使 用。这种行为称为搭便车,可以用智猪博弈来解释
市场竞争
寡头市场上有两家企业。由于市场需求有限, 如果两家合作都限制生产,则产品价格上升, 利润为4.5。在对手产量不变的情况下,增加 产量可以提高利润至5。如果两家企业都扩大 生产,则产品价格下降,利润为4。
低产 企业1
高产
企业2
低产
高产
4.5,4.5
3.75,5
5,3.75
4,4
古诺模型
博弈方是两个企业,i =1,2 第 i 个博弈方的策略空间是产量qi qi >=0 第 i 个博弈方的支付函数是利润
竞争与合作
囚徒困境的支付矩阵
甲招 甲不招
乙招
-8,-8 -10,0
乙不招
0,-10 -1,-1
竞争与合作
田忌 齐威王
上中下
上中下
3
上下中
1
中上下
1
中下上
1
下上中
-1
下中上
1
上下中
1
3
1
1
1
-1
中上下
1
-1
3
1
ቤተ መጻሕፍቲ ባይዱ
1
1
中下上
-1
1
1
3
1
1
下上中
1
1
1
-1
3
1
下中上
1
1
-1
1
1
3
对策问题的分类
信息
行动
竞争与合作
合作的前提
事前是否允许沟通和信息交流不是关键因素 只要存在利益的分配就存在竞争 只要存在共同的利益就存在合作
合作的条件
外在的强制机构对契约的保护 自实施契约保证可信威胁或信息传递
自实施契约
有两家销售音像商品的商店,疯狂爱迪Crazy Eddie和纽马克路易斯Newmark-Lewis
疯狂艾迪作出了承诺,不可能有人卖得比我们更低,我们保 证价格最低,而且是超级疯狂的低 纽马克露易斯打出广告,只要买我们的东西,将得到终生低 价保证
上策均衡
上策均衡是各博弈方绝对最优策略的组合
上策均衡
甲招供 甲不招
乙招供
-8,-8 -10,0
乙不招
0,-10 -1,-1
严格下策反复消去
严格下策
与占优策略相反,博弈方的某个策略给他带来的收益始终低 于另一种策略,这一策略称为下策。
严格下策消去
消去博弈方的严格下策不会消去纳什均衡 存在弱下策的情况下,消去下策的顺序对最后的结果有影响
公共地悲剧
帕累托最优的公共物品供给大于纳什均衡下的 公共物品供给 收入分配差距的扩大可能会缓解公共物品的供 给不足,因为斗鸡博弈变成了智猪博弈
静态博弈与纳什均衡
静态博弈的描述 严格下策反复消去法 纳什均衡 反应函数 混合策略纳什均衡 多重纳什均衡的分析
混合策略纳什均衡
二人零和对策
猜硬币 盖硬币
乙方 甲方
上
下
左 1,0 0,4
中 1,3 0,2
右 0,1 2,0
严格下策反复消去
两支军队,一攻一守
攻方军力2个师 守方军力3个师 进攻道路有甲和乙两条
假定军队只能整师调动,两军相遇时
人数居多的一方取胜 当两方人数相等时,守方获胜
严格下策反复消去
攻方战略 a=两个师集中沿甲方向进攻 b=一个师沿甲方向进攻,另一个师沿乙方向进攻 c=两个师集中沿乙方向进攻
离散的古诺模型
低产 企业1
高产
企业2
低产
高产
4.5,4.5
3.75,5
5,3.75
4,4
连续的古诺模型
有两家厂商,qi为厂商i的产量,Q=q1+q2为市 场总产量 p为市场出清价格且p=8-Q 假设厂商没有固定成本且各厂商的边际成本都 为常数c 假设各厂商同时选择产量 求解该模型的纳什均衡
连续的古诺模型
第十二章 纳什均衡
静态博弈与纳什均衡
静态博弈的描述 严格下策反复消去法 纳什均衡 反应函数 混合策略纳什均衡 多重纳什均衡的分析
竞争与合作
对策论是研究具有对抗或竞争性质现象的理论 和方法 对策论与博弈论
利益竞争:价格竞争 合作双赢:价格联盟 竞争合作:费用分摊
竞争与合作
费用分摊问题
假设某一条河流有相邻的三个城市A、B、C,各城市可以单 独建立水厂,也可以合作兴建一个大厂。经估算,合建一个 大水厂加上铺设管道的费用要比单独建三个小水厂的总费用 少。但合建大厂的方案能否实施,显然要看总的建设费用分 摊的是否合理。 如果某个城市分摊到的费用比它单独建设水厂的费用还多的 话,他显然不会接受合作的方案。问题是如何合理的分摊费 用,才能使兴建大水厂的方案得以实现。 企业收益的分配与高管薪酬
V
Pg 守卫
1 睡的概略
混合策略纳什均衡
甲有两张牌(红1和黑2),乙有两张牌(红2和黑3) 游戏时两人分别出一张牌,如颜色相同,乙付给甲钱; 如颜色不相同,甲付给乙钱 如果甲出红色,按照两人牌点之差付钱,如果甲出黑 色,按照两人牌点之和付钱
①试列出此游戏的支付矩阵 ②该博弈有纯策略纳什均衡还是有混合策略纳什均衡 ③分别求出甲和乙的策略 ④甲和乙的期望收益是多少 ⑤该游戏是否公平
博弈方1的混合策略
pA 3 pB 1 pA 2 pB 5
博弈方2的混合策略
pC 2 pD 5 pC 3 pD 1
策略
得益
博弈方1 (0.8,0.2) 2.6
博弈方2 (0.8,0.2) 2.6
小偷和守卫的博弈
小偷 偷不偷
守卫 睡 不睡 V,-D -P,0 0,S 0,0
守卫 得益((睡)
寡头的合作是不稳定的,因为不能保证对方不 降价
自实施契约
自实施契约要求能够查出对方的背叛行为并给 予惩罚,慑于降价不仅不能带来收益,反而会 带来惩罚的后果,每一方就不会降价。当然这 种惩罚必须是可信的。
他们都做出如下承诺:假如你能在别处买到更低的价格,我 们将加倍退还差价 这一契约就是自实施的,它能迅速发现对方的背叛并且通过 自己更大的背叛来惩罚对方,因为顾客的存在所以惩罚是可 信的
S
0
Pt 小偷
1 偷的概率 -D
- D’
加重对守卫的处罚在短期中的效果是使守卫真正尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概略
小偷和守卫的博弈
小偷 偷不偷
守卫 睡 不睡 V,-D -P,0 0,S 0,0
小偷 得益(偷)
0 -P
- P’
加重对小偷的处罚短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会是的守卫更多的偷懒
完全信息
静态
完全信息静态博弈 纳什均衡
Nash(1950、1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
Harsanyi(1967、1968)
动态
完全信息动态博弈 子博弈精炼纳什均衡
Selton(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡
Selton(1975) Kreps&Wilson(1978)
参与者为一头大猪,一头小猪。食槽在一端,开关在另一端 每按一次开关有10单位猪食落入食槽,但按开关者有2单位成本 行动(策略)集:按或者不按 支付函数:
大猪先到,大猪吃9单位,小猪1单位 小猪先到,大猪吃6单位,小猪4单位 两猪同时,大猪吃7单位,小猪3单位
智猪博弈
大猪按钮 大猪等待
小猪按钮
5,1 9,-1
小猪等待
4,4 0,0
静态博弈与纳什均衡
静态博弈的描述 严格下策反复消去法 纳什均衡 反应函数 混合策略纳什均衡 多重纳什均衡的分析
反应函数法
反映函数是每个博弈方针对其他博弈方所有策略的最 佳对策。 如果其他博弈方的策略有无限多种,各个博弈方的最 佳对策也有无限种,他们之间往往构成一种连续函数 关系 联立博弈方的反应函数可以求得无限策略博弈的纳什 均衡
静态博弈与纳什均衡
静态博弈的描述 严格下策反复消去法 纳什均衡 反应函数 混合策略纳什均衡 多重纳什均衡的分析
完全信息静态博弈
各博弈方Player有关于得益Payoff的充分信息,各博弈 方同时Order选择策略Strategy
博弈的参与人集合N,i =1,2,…,n 博弈方 i 的策略空间 Si 博弈方 i 的支付函数 ui=ui (s1,s2,…,sn) 博弈可以表示为G={S1,…,Sn ; u1,…,un} 同时?充分信息?
设两企业同时决定价格,则纳什均衡是?
公共地悲剧
某村庄有三个农户,还有一片自由放牧的公共 草地。qi为各户养羊数,Q=q1+ q2 + q3。每只羊 的收益V =100- Q 。假设每只羊的成本对每个农 户都是4。试评价公共资源的利用效率? 如果只有一个农户,则养羊数=?收益=? 如果有三个农户,每户养羊数=?每户收益=? 如果有三个农户,总养羊数=?总的收益=?
囚徒困境
甲招 甲不招
乙招
-8,-8 -10,0
乙不招
0,-10 -1,-1
囚徒困境
2000年我国几家生产彩电的大厂商合谋决定将彩电价 格维持在高位,他们在深圳举行了由多家彩电厂商首 脑参加的彩电厂商自律联盟高峰会议
在高峰会议之后不到二周,国内彩电价格不是上涨而是一路下跌 原因是无论其他厂商是否降价,自己降价是优势策略
正面
正面 -1,1
反面 1,-1
反面
1,-1
-1,1
最好的策略是不让对方知道自己的策略,而且 策略选择不能有规律性,而应该随机
随机的概率应使对方无机可乘,混合策略,游 戏者以0.5概率正面,0.5概率选择反面
混合策略纳什均衡
求解纳什均衡
博 弈A 方B 1
博弈方2
C
D
2, 3 5, 2
3, 1 1, 5
(2,3)对应的策略是(下,左),这一策略组合是 对对方策略的最佳对策
只有一条线的策略组合得益是不稳定的,其中一方将 会背叛
如果猜测甲方选择(下),乙方就会选择(左)
如果乙方选择(左),甲方就真的会选择(下)
纳什均衡
博弈G={S1,…,Sn ; u1,…,un},如果策略组合(s1*,…,sn*) 满足如下不等式对任意sij都称成立 (s1*,…, si-1*, si*, si+1*,…,sn*) >= (s1*,…, si-1*, sij*, si+1*,…,sn*) 称(s1*,…,sn*)为G的一个纳什均衡 纳什均衡的一致预测性质。如果所有博弈方都预测一 个特定的博弈结果会出现,那么没有哪个博弈方有偏 离这个预测结果的愿望。因此这个结果最终真会成为 博弈的结果--稳定性和自我强制性 一致预测意味着对对方的猜测是准确的,并不着一定 能意味着对结果的准确预测
ui=ui (q1,q2) 古诺模型G={q1,q2 ;u1(q1,q2),u2(q1,q2)}
静态博弈与纳什均衡
静态博弈的描述 严格下策反复消去法 纳什均衡 反应函数 混合策略纳什均衡 多重纳什均衡的分析
占优策略和上策均衡
上策或者占优策略
一般地,每个参与人的最优策略依赖于所有其他人的最优策 略。但是在一些特殊的博弈中,无论其他人选择什么策略, 某个参与人的最优策略是唯一的,这一策略给他带来的收益 始终高于其他策略
Q2=12-2P2+P1
其中P1和P2分别为两个企业的产品价格,Q1和Q2分别为市场 对两个企业产品的需求量。又知道两个企业的产品固定成本
均为20元。问企业如何定价。
伯特兰德寡头模型
价格竞争的寡头模型,产品有替代性。企业产 品成本为0,两企业面临的市场需求分别是
q1 a bP1 dP2 q2 a bP2 dP1