博弈论讲义

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
L(A)=2rc+1(1-r)(1-c) dL(A)/dr =3c-1=0 L(B)=rc+2(1-r)(1-c) dL(B)/dc =3r-2=0 r=2/3 c=1/3
A:(2/3,1/3),B:(1/3,2/3)是本博弈的 混合策略纳什均衡
完全信息动态博弈
参与人先后行动 每个参与人对每个参与人的得益具有完全信 息 博弈树 参与人的行动顺序(when to move,谁在 什么时候行动) 参与人的信息集(what known,每次行动 时参与人知道些什么)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
如果A 选U,其期望收益为
1 L 0 (1 L ) L .
策略组合
策略组合:(s1,…,si,…,sn) ui=ui(s1,…,si,…sn) 一个参与人的支付不仅取决于自己的策略选择, 而且取决于其他参与人的策略选择 Max ui=ui(s1,…,si,…sn)
囚徒困境博弈的标准式表述
B
抵赖 坦白
抵赖
-1,-1 0,-10
-10,0 -8,-8
ui ( s ,...,s ) 0 si
* 1 * n
囚徒困境的纳什均衡
(坦白,坦白)构成本博弈的纳什均衡
抵赖
B
坦白
抵赖
-1,-1 0,-10
-10,0 -8 -8
A
坦白
囚徒困境反映了个人理性和集体理性的矛盾
古诺模型
寡头垄断企业1和2生产的同质产品:q1,q2 市场总产量:Q=q1+q2 市场价格决定:反需求函数p=a-Q 企业1和2生产单位产品的边际Байду номын сангаас本同为c 企业1(或2)的总成本:cq1(或cq2),其 中假设c<a 两厂商同时决策产量
A
坦白
uA(抵赖,坦白)=-10
uA(抵赖,抵赖)=-1
占优策略均衡
理性的参与者不会选择劣战略,会剔除劣策 略,选择占优策略 如果某个策略组合由所有参与人的占优策略 组成,那么这策略组合是占优策略均衡 占优策略均衡只要求每个参与人是理性的。
占优策略均衡
B:做广告 A:做广告
10, 5
U r
A
(2,1)
D 1-r (0,0)
(1,2)
计算各种策略组合的概率
(U,L) 概率为:rc (D,L) 概率为:(1-r)c (U,R)概率为:r(1-c) (D,R)概率为(1-r)(1-c) 参与人A的期望收益LA=2rc+1(1-r)(1-c)
LB=rc+2(1-r)(1-c)
求解最优化
如何计算混合策略纳什均衡
Player B L,L U, U Player A (1,2) (0,5) R,1-L (0,4) (3,2)
D,1-U
期望支付相等
Player B
L,L U,U
Player A D,1-U (0,5) (1,2)
R,1-L
(0,4) (3,2)
B选择L时,其期望收益为 2 U 5(1 U )
博弈论
西南财经大学经济学院 袁正副教授
博弈是资源配置的一种方式
博弈:策略对抗 策略对抗决定资源的配置 石头、剪刀、布 抓阄 拍卖
经济人假设
人是自利的 人是理性计算的,即追求利益最大化 博弈论也建立在经济人假设之上
理性共识
每个博弈方是理性的 我是理性的,你是理性的,我知道你是理性的, 你知道我是理性的。我知道你知道我是理性的, 你知道我知道你是理性的„„ 所有参与者知道所有参与者知道所有参与者是 理性的 在理性共识的假设下,每个参与人的决策目标 是使自己的利益最大化 这是博弈分析的逻辑基础
1 MAX q1 a q1 a c cq1 q1 4 3 1 # * q1 a c q1 a c 8 4
最优产量高于卡特尔协议规定产量,因此,理性的厂 商会有违约的动机而多生产
一项制度或者协议要起作用,必须是纳什均衡
伯特兰寡头模型
斗鸡博弈
B鸡
前进 前进
A鸡
后退 1,-1 0,0
-2,-2 -1,1
后退
斗鸡博弈的纳什均衡: (A鸡前进,B鸡后退) (A鸡后退,B鸡前进)
纳什均衡
(s , s )
* i * i
* i
* i
当且仅当对任意参与人i
* i , i
ui (s , s ) ui (s s )
连续决策变量情形:
智猪博弈
小猪
按钮 等待 4,4 按钮 5, 1
大 猪
等待
9, -1
0, 0
智猪博弈
小猪
按钮 等待 4,4 按钮 5, 1
大 猪
等待
9, -1
0, 0
小猪
等待
按钮 大猪 等待
4,4 0, 0
(大猪按钮,小猪等待)是重复 剔除劣策略均衡
纳什均衡
相对优势策略:相对于其它局中人的策略,选择 一个优势策略 划线法寻找相对优势策略 所有局中人的相对优势策略组合,就是纳什均 衡 是一种均衡状态,没有任何一方有单独改变的 动机
q2 R1(q2) R2(q1) q1
古诺均衡时的行业产量与利润
企业1(或2)的利润(均衡结果): Π1(q1*,q2*)=1/9(a-c)2 寡头垄断的市场结构下均衡时总的产出:
* * q1 q 2
均衡时总利润为:
2 3
a
c

* 1
* 2
2 2 a c 9
* 2
古诺纳什均衡
当企业1和2的反应函数同时成立
q1 q2
* q1
1 a q 2 c 2 1 a q1 c 2 1 * a c q2 3
古诺纳什均衡
(1/3(a-c), 1/3(a-c) )构成 Cournot博弈的NE 企业1和2的反应曲线的交点
A 开发 不开发
B
开发 不开发 开发
B
不开发
(-3,-3)
(1,0)
(0,1)
(0,0)
写出B的策略集
房地产开发博弈的标准式表述
开发商B
(开,开) (开,不开) (不开,开) (不开,不开)
反应函数
q1=R(q2,q3)=48-0.5q2-0.5q3 q2=R(q1,q3)=48-0.5q1-0.5q3 q3=R(q1,q2)=48-0.5q2-0.5q1 q1=q2=q3=24 U1=U2=U3=576 U总=1728
总体利益最大化时的养羊数
U=Q(100-Q)-4Q Q=48 U=2304
聚点
解决纳什均衡的多重性 聚点(focal point):在众多的NE中实 际更可能发生的NE 博弈双方的一致性预测 基于共同的信念,即共识 你认为应该这样,我也是这么想的
情侣博弈
两个纯战略NE :(拳击,拳击),(芭蕾,芭蕾)
女生
拳击 拳击
男生
芭蕾 0,0 1,2
2,1 0,0
不做广告
15, 0
不做广告
6, 8
10, 2
B:做广告 A:做广告
10, 5
不做广告
15, 0
不做广告
6, 8
10, 2
重复剔除劣策略均衡
人是理性的 找出并剔除劣策略 重新构造一个不包含已剔除策略的新博弈
理性共识
在新博弈中重复剔除劣策略 若余下唯一策略组合,则称重复剔除劣策略可 解。 “重复剔除劣策略均衡”
厂商1的反应函数
给定企业2的产量q2
Max q1 a q1 q 2 cq1
q1
1 q a q 2 c R1 q 2 2
* 1
企业2的反应函数
给定企业1的产量q1
Max q 2 a q1 q 2 cq2
q2
1 q a q1 c R2 q1 2
2 ( p1 , p2 ) q2 ( p2 c) (a p2 bp1 )( p2 c)
2 0 p 2
1 p 2 (a bp1 c) 2 ac p1 p 2 2b
公地的悲剧一个实例
假设3个农户,假设养羊q1,q2,q3 V=V(Q)=100-(q1+q2+q3) 边际成本c=4 求解纳什均衡
Player B
L,L
U,U Player A D,1-U
R,1-L (0,4) (3,2)
(1,2) (0,5)
当B选择R时,其期望收益为:4 U 2(1 U ).
2U 5(1 U ) 4 U 2(1 U )
U 3 / 5.
B选L还是R无差异
同时决策价格 两个厂商生产同类产品,定价p1,p2 边际成本同为c,若: q1=a-p1+bp2 q2=a-p2+bp1
1 ( p1 , p2 ) q1 ( p1 c) (a p1 bp2 )( p1 c)
1 0 p1
1 p1 (a bp 2 c) 2
完美信息动态博弈
A 开发 B 开发 (-3,-3) 不开发 (1,0) 开发 (0,1) 不开发 B 不开发 (0,0)
均为单结点信息集,这样的博弈是完美信息博弈
A
开发 N 大 B 开发 不开发 B 小 不开发 N

B 不开发 B

开发 不开发 开发
开发
不开发
(8,0) (-3,-3)(1,0) (0,8) (0,0) (0,1) (0,0)
合谋垄断时的情形
卡特尔联盟
Max Qa Q cQ
Q *
1 Q a c 2 1 2 a c 4
卡特尔协议(1/4(a-c), 1/4(a-c) )是否构成NE?
卡特尔协议容易瓦解
给定企业2遵守卡特尔协议规定的产出水平1/4 (a-c) 现在考虑企业1最优的产出水平
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
如果 A 选D,其期望收益为:
0 L 3 (1 L ) 3(1 L ).
L 3(1 L )
L 3 / 4.
A选U还是D无差异
B有两个信息集,每个信息集包含两个决策结 是为不完美信息动态博弈
A 开发 N 大 B 小 大 不开发
N

B
B
不开发
B
开发 不开发
开发 不开发
开发 不开发 开发
(8,0) (-3,-3)(1,0) (0,8) (0,0) (0,1) (0,0)
子博弈精炼纳什均衡SPNE:
一个战略组合 它是整个博弈的NE 其行动规则在每一子博弈上也都是NE
战争与和平
风险上策均衡
帕累托上策均衡并不一定是最优选择,需要考虑风险。
博弈方2 L 博 弈 方 1 R 0, 8 7, 7
U
D
9, 9 8, 0
风险上策均衡(D,R)
猎人博弈
猎人2 鹿 兔子
猎 人 1
鹿 兔子
5, 5 3, 0
0, 3 3, 3
风险上策均衡(兔子,兔子)
不存在纯策略纳什均衡
Player B L R U Player A D (0,5) (3,2) (1,2) (0,4)
混合策略纳什均衡
Player B
3 L, 4
Player A
1 R, 4
(0,4)
3 U, 5 2 D, 5
(1,2)
(0,5)
(3,2)
A选择混合策略(3/5, 2/5),B选择混合策略 (3/4, 1/4). 这一混合策略组合就是本博弈的混合策略纳什均衡
最优化方法
L c B R 1-c (0,0)
芭蕾
如果今天是男生的生日
如果男生在追求女生
帕累托上策均衡
(鹰鸽博弈) 这个博弈中有两个纯策略 国 纳什均衡,(战争,战争) 家 战争 1 和平 和(和平,和平),显然 后者帕累托优于前者,所 以,(和平,和平)是本 博弈的一个帕累托上策均衡。
国家2 战争 -5, -5 -10, 8 和平 8, -10 10, 10
策略互动产生结果
行动组合(a1,…,ai,…,an) 共同行动的结果:Ui(a1,…,ai,…,an) 在完全信息静态博弈中,策略与行动不区分。 在动态博弈中,策略是关于行动的“相机行动 规划”
人不犯我,我不犯人
乙 不犯 甲
犯 甲 犯
不犯

不犯
请写出甲的各种策略 {犯,犯},{犯,不犯},{不犯,犯},{不犯,不犯}
相关文档
最新文档