博弈论(第三章)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
拒绝 接受 拒绝
[R(0),0]
[R(S)-w(S), w(S)-S]
[R(0),0]
接受:w(E)-E>0
接受:w(S)-S>0
参与约束
委托人的选择
1
委托 不委托 委托
1
不委托
[R(E)-w(E), w(E)-E]
[R(0),0]
[R(S)-w(S), w(S)-S]
[R(0),0]
委托: R(E)-w(E) > R(0) ) 不委托: R(E)-w(E) < R(0 R(0)
97 0 1 2 0 1
98 0 1 2 0 1 0
第二节 可信性和纳什均衡问题
先动优势和后动优势
博弈中任何一局中人首先采取行动所得到的好处,比 他(她)后行动所获的收益大,这种局中人先行得益大于 后行得益的情况,叫做先动优势(first-move advantage)。 如情侣博弈 博弈中任何一局中人首先采取行动所得到的好处,比 他(她)后行动所获的收益小,这种局中人先行得益小于 后行得益的情况,叫做后动优势(second-move advantage)。如“石头、剪刀、布”博弈
第二节 可信性和纳什均衡问题
逆推归纳法
P1 P2 P3 P4 P5 P6 P7 P8 99 0 1 0 1 0 1 0 P9 100 0 1 0 1 0 1 0 1 P10 0 1 0 1 0 1 0 1 0
96
96 0
97 0 1
97 0 1 0
98 0 1 0 1
98 0 1 0 1 0
99 0 1 0 1 0 1
第三章 完全且完美信息动态博弈
�动态博弈的表示法和特点 �可信性和纳什均衡的问题 �子博弈和子博弈精炼纳什均衡 �动态博弈分析的问题和扩展讨论
第一节 动态博弈的表示法和特点
阶段和扩展形表示
动态博弈中每个博弈方的选择行为会形成依次相连 的时间阶段,动态博弈中一个博弈方的一次选择行为常 称为一个“阶段”(stage)。一个动态博弈至少有两个阶段, 因此动态博弈有时也称为“多阶段博弈”(Multistage Games),或“序贯博弈、序列博弈”(Sequential Games)。
第二节 可信性和纳什均衡问题
逆推归纳法
法语
乙
(3,2)
法语
甲
德语 (1,1)
德语 法语
乙
(0,0)
德语
(2,3)
(法语,{法语,德语})
第二节 可信性和纳什均衡问题
逆推归纳法
100个金币10个强盗分: 先由最凶猛的海盗来提出分配方案,然后大家一人 一票表决,如果有50%或以上的海盗同意这个方案,那 么就以此方案分配,如果少于50%的海盗同意,那么这 个提出方案的海盗就将被丢到海里去喂鱼,然后由剩下 的海盗中最凶猛的那个海盗提出方案,依此类推。
A
借
B
不借 (1,0)
还 (2,2)
不还 起诉 (1,0)
A
不起诉
(0,4)
A的威胁对于A是有利的,切实可行的。
第二节 可信性和纳什均衡问题
纳什均衡的问题
法语
乙
(3,2)
法语
甲
德语 (1,1)
德语 法语
乙
(0,0)
德语
(2,3)
({法语/德语},{法语/德语,法语/德语})8
第二节 可信性和纳什均衡问题
劳资博弈---里昂惕夫(leontief)1946
假设1:工资完全由工会决定,厂商根据工会要求的工资高 低决定雇佣员工的数量。 假设2:工会不只为员工追求高工资,还要希望雇佣跟多的 员工,因此工会代表的员工效用函数为: u=u(w,L),w其中 代表工资率, L代表员工个数。 假设3:企业只关心利润,收益 R(L)是员工的函数 ,于是,利 润表示为:R(L)-WL. 博弈顺序:(1)先工会决定工资率,( 2)企业根据工会提 出的工资率决定雇佣员工的多少。
第二节 可信性和纳什均衡问题
逆推归纳法
从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒 推回前一阶段相应博弈方的行为选择,一直到第一阶段的分析方 法。 动态博弈行为是顺序发生的,先行动的局中人在进行行动选 择时必然考虑后行动局中人的行为选择问题,只有在博弈的最后 一个阶段选择的,不再有任何后续阶段影响的局中人才能直接做 出明确选择。
第一节 动态博弈的表示法和特点
阶段和扩展形表示
A
不仿冒
仿冒
B
制止
不制止
A
(0,10)
(-2,5)
仿冒
B
不仿冒 (5,5) 不制止
制止
(2,2)
(10,4)
根和分支点是决策点 (decision nodes),树梢即各枝梢 是末端节点(terminal nodes)。决 策点说明谁做决策,做出何种决 策;末端节点表示博弈结束,说明 每个局中人的得益。末端节点得益 用括号包含各局中人得益,顺序按 约定或默认决策顺序。每个博弈树 都有一个初始节点(the initial decision node),一个末端节点表 示一个可能结果(outcome)。
L
工会的无差异曲线
w
工会的无差异曲线
• (w*,L*(w*)),非帕累 托最优点。
合同曲线 w* w' B u' u° 企业的等利润曲线 *) L*(w (w* L*(w) L U° U' A
委托人—代理人理论
一、委托人——代理人关系
经济活动和社会活动中有很多委托人 ——代理人关系 ,有明显的,也有隐蔽的。工厂和工人、店主和店 员、客户和律师、市民和政府、基金购买者和基金 管理人等都是。 委托人——代理人关系的关键特征:不能直接控制, 监督不完全,信息不完全,利益的相关性 委托人——代理人涉及问题:激励机制设计、机制设 计理论,委托合同设计问题等
第三节 子博弈和子博弈完美(精炼)纳什均衡 子博弈
由一个动态博弈第一阶段以外的某阶段开始的后续博 弈阶段构成的,有初始信息集和进行博弈所需要的全部信 息,能够自成一个博弈的原博弈的一部分,称为原动态博 弈的一个“子博弈”。 子博弈必须有一个明确的初始信息集,以及必须包含 初始阶段之后的所以博弈阶段,这意味着子博弈不能分割 任何信息集。
第三节 子博弈和子博弈完美(精炼)纳什均衡 子博弈精炼纳什均衡
法语
乙
(3,2)
法语
甲
德语 (1,1)
德语 法语
乙
(0,0)
德语
(2,3)
纳什均衡(法语,{法语,法语/德语})2, (德语,{德语,德语}) 子博弈精炼纳什均衡(法语,{法语,德语})
第三节 子博弈和子博弈完美(精炼)纳什均衡 均衡路径和非均衡路径
第二节 可信性和纳什均衡问题
逆推归纳法
必须超过半数以上人同意时的方案?
P1 P2 P3 P4 P5 P6 P7 P8 100 0 1 2 0 1 0 1 P9 × 0 1 2 0 1 0 1 0 P10 100 0 1 0 1 0 1 0 1
94
95 0
95 0 1
96 0 1 2
96 0 1 2 0
第一节 动态博弈的表示法和特点
动态博弈的基本特点
� 局中人先后决策 � 行动顺序连贯性 � 信息不对称性
第一节 动态博弈的表示法和特点
策略(strategy)和行动(action)
在静态博弈中,策略和行动含义相同。在动态博弈 中,局中人策略由各阶段不同行动组成,行动是策略的 组成部分。
第二节 可信性和纳什均衡问题
第四节 经典动态博弈模型
斯塔克博格模型( Stackelberg)
采用逆推归纳法分析,因为第一家厂商已经确定的产 量,所以考虑厂商2的产量, 求偏导得: 6-q1-2q2=0 得 q2=(6-q1)/2 厂商1知道厂商2的这种决策思路,因此在选择q1时知道 厂商2会选择q2=(6-q1)/2的产量,所以直接将q2代 入自己的得益函数。 有u1=6q1-q1(6-q1)/2-q12 =3q1- q12/2 求导得q1=3,即厂商1的最佳产量是3个单位,则厂商 2的产量是(6-3)/2=1.5单位。 此时市场价格为3.5,双方的得益分别为4.5和2.25单 位。
第四节 经典动态博弈模型
斯塔克博格模型( Stackelberg)
一市场有两厂家生产同样的产品。 厂商1产量为q1;厂商2的产量为q2。 则市场总产量为Q=q1+q2 市场出清价格P=P(Q)=8-Q 两厂商无固定成本,边际成本c1=c2=2 u1=q1(8-q1-q2) -c1q1=6q1-q1q2-q12 u2=6q2-q1q2-q22
第四节 经典动态博弈模型
斯塔克博格模型( Stackelberg)
和古诺模型双方产量均为2的产量,总量为4相比 较,斯塔克博格模型中两厂商的产量较高。厂商1的得 益4.5大于古诺模型中厂商1的得益4,但厂商2的得益 2.25小于国内模型中厂商2的得益4。 *在动态博弈中,有先动优势,也有后动优势。信 息多了,可能结果好,但也可能结果更糟。
无不确定性的委托人—代理人模型
1
委托 不委托
代理人的选择
激励相容约束:
w(E)-E> w(S)-S w(E)> w(S)+E-S
2
接受
拒绝
[R(0),0]
2
努力 偷懒
[R(0),0]
[R(E)-w(E), w(E)-E]
[R(S)-w(S), w(S)-S]
参与约束:
2
接受 [R(E)-w(E), w(E)-E]
委托: R(S)-w(S) > R(0) 不委托: R(S)-w(S) < R(0)
数值例子
R ( E ) = 10 E − E 2
E=2, S=1, w(E)=4, w(S)=2 R(0)=0 R(E)=16 R(S)=9
相机选择和策略中的可信性问题
动态博弈中的策略是由各局中人设定的,没有强制 力,各局中人可以根据情况,在博弈过程中进行“相机选择” (Contingent play )。这就产生了“可信性”(Credibility)问 题,即各博弈方是否会真正的实施所设定的方案呢?
第二节 可信性和纳什均衡问题
相机选择和策略中的可信性问题
A
借
B
不借
还 (2,2)
不还 (0,4)
(
1,0)
有不可信的许诺,使得A和B的合作变为不可能。
第二节 可信性和纳什均衡问题
相机选择和策略中的可信性问题
A
借
B
不借
(1,0)
还பைடு நூலகம்
(2,2)
不还 报复 (-∞, -∞)
A
不报复 (0,4)
A的威胁对于A是不利的,不可行。
第二节 可信性和纳什均衡问题
相机选择和策略中的可信性问题
劳资博弈
先由工会决定工资率,再由厂商决定雇用多少劳动力
max π (W , L ) = max [ R ( L ) − WL ]
L≥0 L≥0
max u[W , L* (W )]
W ≥0
R
斜率为W R(L) WL
W
W*
0
L (W )
厂商的反应函数
*
L
0
L* (W * )
L* (W )
u3 u2 u1 u0
第三节 子博弈和子博弈完美(精炼)纳什均衡 子博弈
A
借
B
不借 (1,0)
还 (2,2)
不还 起诉
A 不起诉
(1,0)
(0,4)
第三节 子博弈和子博弈完美(精炼)纳什均衡 子博弈精炼纳什均衡
如果在一个完美信息的动态博弈中,各博弈方 的策略构成的一个策略组合满足,在整个动态博弈 及它的所有子博弈中都构成纳什均衡,那么这个策 略组合称为该动态博弈的一个“子博弈精炼纳什均 衡”。
子博弈精炼纳什均衡下所经过的决策点和最优选择构成的路径, 称为均衡路径(equilibrium path); 其他的路径是非均衡路径(off-equilibrium path)。
第四节 经典动态博弈模型
斯塔克博格模型( Stackelberg)
与古诺模型相似,这两个厂商决策的也是产量, 但一方较强,一方较弱。较强的一方先选择产量,较 弱的一方再选择产量。策略空间、得益函数和信息结 构等,与两寡头连续产量的古诺模型是一样的。
第一节 动态博弈的表示法和特点
阶段和扩展形表示
有一企业B产品销路很好,每年有10万元的收入。看到这 种情况,另一企业A仿冒该产品,如果企业B进行打假,A企业 被取缔罚款2万元,B企业付出5万元的打假成本。如果B不制 止A的假冒行为,听之任之。A企业可以继续选择假冒B企业产 品,或停止其侵权行为,B企业发现A的假冒行为,如果制 止,A企业被取缔罚款2万元,但A企业已经获利4万元,A企 业等价获得2万元利益,B企业扣除打假成本,获得2万元收益。 如果B企业不制止A的侵权行为,则A企业获利10万元,B企业 获得4万元收益。
纳什均衡的问题
法语
乙
(3,2)
法语
甲
德语 (1,1)
德语 法语
乙
(0,0)
德语
(2,3)
纳什均衡(法语,{法语,法语})、(法语,{法语,德语})、 (德语,{德语,德语})
第二节 可信性和纳什均衡问题
纳什均衡的问题
A
借
B
不借 (1,0)
还
(2,2)
不还
A
起诉 (1,0)
不起诉 (0,4)
纳什均衡({借,起诉},还)、({不借,不起诉},不还) ({不借,起诉},不还)