经济博弈论3

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

不借
最大利益为重,甲有一个 不可信承诺,正因为此所 以使得甲乙合作最成为了

甲 不分
(1,0)
不可能
(2,2)
(0,4)
开金矿博弈
在本博弈中,如果已打官

司是可信的,则甲在第二

阶段一定会选择分,则乙
在第一阶段一定会选择借, 分
所以最终(借,分)。此
例也说明晚上的法律制度 (2,2)
制度,不仅哪呢过保障社
乙 借
初始信息集和进行博弈所

需要的全部信息,能够自 成一个博弈的原博弈的一 分
不分
部分,称为原动态博弈的 (2,2)

一个“子博弈”。
不借 (1,0)
子博弈:即动态博弈中满足 一定要求的局部所构成的 次级博弈
(-1,0) (0,4)
二级子博弈
三级子博弈
仿冒
A 不仿冒
B
不制止 (0,10)
制止
(-2,5) 制止
(-1,0) (0,4)
衡路上的节点。
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格模型 3.4.2 劳资博弈 3.4.3 讨价还价博弈 3.4.4 委托人—代理人理论
3.4.1 寡占的斯塔克博格模型
斯塔克博格模型是动态的寡头产量博弈模型。 先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而
不委托 委托人的利益,R(E)是指较 高的产出, R(S)较低的产出,
2
接受
[R(0),0] 拒绝
w(E)是较高的报酬,代理人 要得到较高的报酬但有较高 的负效用-S, w(S)是较低的
2
[R(0),0]
报酬
代理人的选择
努力
偷懒
努力激励相容约束:
[R(E)-w(E), w(E)-E]
[R(S)-w(S), w(S)-S]
非同时选择即可。 Q q1 q2, P P(Q) 8 Q c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2)] 2q1 6q1 q1q2 q12 u2 q2P(Q) c2q2 q2[8 (q1 q2)] 2q2 6q2 q1q2 q22
厂商1 厂商2
根源:纳什均衡本身不能排除博弈方策略中包含 的不可信的行为设定,不能解决动态博弈的相机 选择引起的可信性问题
3.2.3 逆推归纳法
定义:从动态博弈的最后一个 阶段博弈方的行为开始分析,


不借
逐步倒推回前一个阶段相应
博弈方的行为选择,一直到

(1,0)
第一个阶段的分析方法,称 分
不分
为“逆推归纳法”。
委托人——代理人关系的关键特征:不能直接 控制,监督不完全,信息不完全,利益的相关 性
委托人——代理人涉及问题:激励机制设计、 机制设计理论,委托合同设计问题等
二、无不确定性的委托人—代理人模型
假设代理人的工作无不确定性,也就是代理人的 产出是努力程度飞确定性因素。
1
委托
R(0)表示没有委托人委托时
[10-w(S), w(S)-S] 不委托:
0.1*[20-w(S)] +0.9*[10-w(S)]<0
[20-w(E), w(E)-E] [20-w(S), w(S)-S]
四、有不确定性且不可监督的委托人—代理人博弈
代理人工作具有不确定性,且委托人无法监督代理人的工作, 故委托人要根据工作成果来支付报酬。w是成果函数,而非努 力程度函数。不确定性对代理人利益、选择都有影响。
相机行为存在“可信性”问题,即各博弈方是 否一定按照自己设定的方案执行,还是会临时 改变方案?
不同版本的开金矿博弈——分钱和打官司的可信性
甲在开采一价值4万元的金矿时缺1万元,而乙正好有一万元进
行投资。假设甲说服乙进行投资,并承诺在采到金子后与乙对
半分,那么乙是否应该借?

在本博弈中,各方以自身

由于此博弈的三阶段只考虑了不等式的情况,回避了等式情 况,这正是博弈分析的困难之一
数值例子
R(E) 10E E2
E=2, S=1, W(E)=4, w(S)=2
1
委托
不委托
接受
2 努力
2 拒绝
[0,0]
偷懒[0,0]
[12, 2]
[7,1]
三、有不确定性但可监督的委托人—代理人博弈
因为可监督,因此代理人报酬与成果无关,只与努力情况有关。 不确定性风险由委托人承担。代理人选择同无不确定性情况。为 了简化问题,假设有20和10两种产出,代理人付出努力时产出20 的可能性是0.9,不付出努力时,产出20的可能性是0.1
w(E)-E> w(S)-S
w(E)> w(S)+E-S
若w(E)-E< w(S)-S,称代理人偷懒“激励相容约束”
2
接受
拒绝
2
接受
拒绝
[R(E)-w(E), w(E)-E]
[R(0),0]
接受:w(E)-E>0
[R(S)-w(S), w(S)-S]
[R(0),0]
接受:w(S)-S>0
参与约束
参与约束:即代理人愿意接受委托的基本条件
阶段:动态博弈各个博弈方的选择行为有先后次 序,每个博弈方的选择行为会形成依次相连的时 间阶段,因此动态博弈中一个博弈方的一次选择 行为称为一个阶段。
动态博弈中也存在同时选择的情况,这事这些博 弈方的同时选择构成了一个阶段。
一个动态博弈至少有两个阶段,因此也叫做多阶 段博弈或序列博弈。
动态博弈一般用扩展形(博弈树)表示。
1
委托
不委托
2
接受
[0,0]
拒绝
高产 (0.9)
2
努力
偷懒
0
低产 高产 (0.1) (0.1)
[10-w(10), w(10)-E]
[0,0]
低产 (0.9)
[10-w(S), w(10)-S]
20-w(20), w(20)-E] [20-w(20), w(20)-S]
促使代理人努力的激励相容约束、参与约束,以及委托人选择委 托的条件
主要内容
3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5有同时选择的动态博弈模型 3.6动态博弈分析的问题和扩展讨论
3.1 动态博弈的表示法和特点
3.1.1 阶段和扩展性表示 3.1.2 动态博弈的基本特点
3.1.1 阶段和扩展性表示
夏洛克提出一种解决方法:此讨价还价模型从第 三回合开始还是从第一回合开始,结果应该是一 样的。
S1 1000010000 2S
S S1 1000010000 2S
S * 10000
1
10000 S * 10000 1
3.4.4 委托人—代理人理论
一、委托人——代理人关系
经济活动和社会活动中有很多委托人——代理 人关系,有明显的,也有隐蔽的。工厂和工人、 店主和店员、客户和律师、市民和政府、基金 购买者和基金管理人等都是。
委托
1 不委托
(E)-w(E), w(E)-E]
[R(0),0]
委托: R(E)-w(E) > R(0) 不委托: R(E)-w(E) < R(0)
委托
1 不委托
[R(S)-w(S), w(S)-S]
[R(0),0]
委托: R(S)-w(S) > R(0) 不委托: R(S)-w(S) < R(0)
努力: 0.9*[w(20)-E]+0.1*[w(10)-E] >0.1*[w(20)-S]+0.9*[w(10-S)]
努力激励相容约束
接受: 0.9*[w(20)-E]+0.1*[w(10)-E]>0
润 max (W , L) max[R(L) WL] 。一般先有工会决定
L0
L0
雇佣率再厂商决定雇佣人数,先分析第二阶段
max (W , L) max[R(L) WL]
L0
L0
即满足(R(L) WL)' =R(L)' W 0
表示边际收益,即雇佣的最后一单位劳动所增
加的收益。等于边际成本,在本模型中也就是
产量 3单位 1.5单位
得益 4.5 2.25
先行优势,同时也说明信 息较多的博弈方不一定得 到较多的收益
3.4.2 劳资博弈
本模型先由工会决定工资率,再由厂商决定雇用多少劳动力
由于工会既希望工资高,同时希望有较多的工人雇
佣,因此工会代表的劳方效用应该是工资率(W)和

雇佣数的函数(L),即u=u(W,L)而厂商只关心
逆推归纳法是求完美信息动态博弈子博弈完美纳什均 衡的基本方法。
在本博弈中,(不借,不
打,不分)是真正的纳什 均衡。 注意:按照这种算法,本 博弈的第二三阶段根本不

不借

(1,0)

会发生,我们称第二三阶 分
不分
段的节点“不在均衡路径
上”
(2,2)

一个子博弈完美纳什均衡
必须对每个节点的处的选 择做出规定,包括不在均

不打
择不借
(-1,0)
(0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
3.2.2 纳什均衡的问题
第三种开金矿博弈中, (不借-不打,不 分)和(借-打,分)都是纳什均衡。但后者不 可信,不可能实现或稳定。 结论:纳什均衡在动态博弈可能缺乏稳定性,也 就是说,在完全信息静态博弈中稳定的纳什均衡, 在动态博弈中可能是不稳定的,不能作为预测的 基础。
1
委托
不委托
2
接受
[0,0]
拒绝
2
努力
偷懒 [0,0]
努力
委托:
0.9*[20-w(E)]+0.1*[10-w(E)]>0
不委托:
0.9*[20-w(E)]+0.1*[10-w(E)]<0
0 低产
高产
(0.1)
(0.9)
高产 (0.1)
[10-w(E), w(E)-E]
0
低产
偷懒:
(0.9)
委托:
0.1*[20-w(S)] +0.9*[10-w(S)]>0

会公平,还可以提高社会 的效率。
(1,0)
乙 不借
(1,0) 不分 乙
不打
(0,4)
有法律保障的开金矿博弈 ——分钱打官司都可信
如果打官司没说明威慑力,


不借
还劳民损财的话,则乙在
第三阶段打官司只会让自

(1,0)
己损失更大,所以甲在第 分
不分
二阶段一定会选择不分, (2,2)

则乙在第一阶段一定会选
W 0
L*(W ) L* (W * )
u3 u2 u1 u0
L
工会的误差异曲线
3.4.3 讨价还价博弈
三回合讨价还价
S1 1000010000 2S
1
出S1
S2 S 2
不接受,出S2
接受
S1
(S1,10000 S1) 接受
不接受,出S
[S2, (10000 S2)] [ 2S, 2(10000 S)]
动态博弈的非对称性——先后次序决定动态博弈 必然是非对称的。
先选择、行为的博弈方常常更有利,有“先行优 势”。
3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
相机选择:动态博弈中的博弈方的策略是他们 预先设定的,在各个博弈阶段针对各种情况的 相应行为选择的计划。这些行为实施起来需要 一个过程,因此只要符合自身的利益,他们完 全可以在博弈过程中改变计划。我们称这种问 题为“相机选择”问题

(2,2) 打
不打
逆推归纳法是动态博弈分析 最重要、基本的方法。
(-1,0)
(0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
3.3 子博弈和子博弈完美纳什均衡
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
3.3.1 子博弈
定义:由一个动态博弈第一 阶段以外的某阶段开始的 后续博弈阶段构成的,有
工资率。
厂商要获得最大利润,
R
斜率为W
则边际收益曲线一定
R(L)
平行于成本,此时R和
WL的差距就是最大利
WL

0
L*(W )
L
厂商的反应函数
W
对于工会通过选择W来使
得u=u(W,L(W))最大, 可通过厂商的反应函数 L*(W*) W *
得出 W * 的一个图解。
0
max u[W , L*(W )]
例如:仿冒与反仿冒例子
仿冒
A 不仿冒
制止 (-2,5)
制止
B
不制止 (0,10)
仿冒
A 不仿冒
B 不制止 (5,5)
(2,2)
(10,4)
动态博弈的基本特点
策略是在整个博弈中所有选择、行为的计划。 例:仿冒与反仿冒
结果是上述“计划型”策略的策略组合,构成一 条路径
得益对应每条路径,而不是对应每步选择、行为
仿冒
A 不仿冒
B 不制止 (5,5)
(2,2)
(10,4)
3.3.2 子博弈完美纳什均衡
定义:如果一个完美信息的动态博弈中,各博弈方的 策略构成的一个策略组合满足,在整个动态博弈及它 的所有子博弈中都构成纳什均衡,那么这个策略组合 称为该动态博弈的一个“子博弈完美纳什均衡”。
子博弈完美纳什均衡能够排除均衡策略中不可信的威 胁和承诺,因此是真正稳定的。
三回合讨价还价博弈结果的讨论
当0.5 1时,越大,
甲的得益越大,乙的得益越小
当0 0.5时,越大,
甲的得益越小,乙的得益越大
这种结果反应了,乙仗讨价还价的筹码,可以和 甲拖延时间,虽然最终甲可以获得全部收益,但 是拖延对甲的损失越大,甲愿意分给乙以求早日 结束讨价还价的利益就越大。
无限回合讨价还价
相关文档
最新文档