博弈论(第三章)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2
拒绝 接受 拒绝
[R(0),0]
[R(S)-w(S), w(S)-S]
[R(0),0]
接受:w(E)-E>0
接受:w(S)-S>0
参与约束
委托人的选择
1
委托 不委托 委托
1
不委托
[R(E)-w(E), w(E)-E]
[R(0),0]
[R(S)-w(S), w(S)-S]
[R(0),0]
委托: R(E)-w(E) > R(0) ) 不委托: R(E)-w(E) < R(0 R(0)
97 0 1 2 0 1
98 0 1 2 0 1 0
第二节 可信性和纳什均衡问题
先动优势和后动优势
博弈中任何一局中人首先采取行动所得到的好处,比 他(她)后行动所获的收益大,这种局中人先行得益大于 后行得益的情况,叫做先动优势(first-move advantage)。 如情侣博弈 博弈中任何一局中人首先采取行动所得到的好处,比 他(她)后行动所获的收益小,这种局中人先行得益小于 后行得益的情况,叫做后动优势(second-move advantage)。如“石头、剪刀、布”博弈
第二节 可信性和纳什均衡问题
逆推归纳法
P1 P2 P3 P4 P5 P6 P7 P8 99 0 1 0 1 0 1 0 P9 100 0 1 0 1 0 1 0 1 P10 0 1 0 1 0 1 0 1 0
96
96 0
97 0 1
97 0 1 0
98 0 1 0 1
98 0 1 0 1 0
99 0 1 0 1 0 1
第三章 完全且完美信息动态博弈
�动态博弈的表示法和特点 �可信性和纳什均衡的问题 �子博弈和子博弈精炼纳什均衡 �动态博弈分析的问题和扩展讨论
第一节 动态博弈的表示法和特点
阶段和扩展形表示
动态博弈中每个博弈方的选择行为会形成依次相连 的时间阶段,动态博弈中一个博弈方的一次选择行为常 称为一个“阶段”(stage)。一个动态博弈至少有两个阶段, 因此动态博弈有时也称为“多阶段博弈”(Multistage Games),或“序贯博弈、序列博弈”(Sequential Games)。
第二节 可信性和纳什均衡问题
逆推归纳法
法语

(3,2)
法语

德语 (1,1)
德语 法语

(0,0)
德语
(2,3)
(法语,{法语,德语})
第二节 可信性和纳什均衡问题
逆推归纳法
100个金币10个强盗分: 先由最凶猛的海盗来提出分配方案,然后大家一人 一票表决,如果有50%或以上的海盗同意这个方案,那 么就以此方案分配,如果少于50%的海盗同意,那么这 个提出方案的海盗就将被丢到海里去喂鱼,然后由剩下 的海盗中最凶猛的那个海盗提出方案,依此类推。
A

B
不借 (1,0)
还 (2,2)
不还 起诉 (1,0)
A
不起诉
(0,4)
A的威胁对于A是有利的,切实可行的。
第二节 可信性和纳什均衡问题
纳什均衡的问题
法语

(3,2)
法语

德语 (1,1)
德语 法语

(0,0)
德语
(2,3)
({法语/德语},{法语/德语,法语/德语})8
第二节 可信性和纳什均衡问题
劳资博弈---里昂惕夫(leontief)1946
假设1:工资完全由工会决定,厂商根据工会要求的工资高 低决定雇佣员工的数量。 假设2:工会不只为员工追求高工资,还要希望雇佣跟多的 员工,因此工会代表的员工效用函数为: u=u(w,L),w其中 代表工资率, L代表员工个数。 假设3:企业只关心利润,收益 R(L)是员工的函数 ,于是,利 润表示为:R(L)-WL. 博弈顺序:(1)先工会决定工资率,( 2)企业根据工会提 出的工资率决定雇佣员工的多少。
第二节 可信性和纳什均衡问题
逆推归纳法
从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒 推回前一阶段相应博弈方的行为选择,一直到第一阶段的分析方 法。 动态博弈行为是顺序发生的,先行动的局中人在进行行动选 择时必然考虑后行动局中人的行为选择问题,只有在博弈的最后 一个阶段选择的,不再有任何后续阶段影响的局中人才能直接做 出明确选择。
第一节 动态博弈的表示法和特点
阶段和扩展形表示
A
不仿冒
仿冒
B
制止
不制止
A
(0,10)
(-2,5)
仿冒
B
不仿冒 (5,5) 不制止
制止
(2,2)
(10,4)
根和分支点是决策点 (decision nodes),树梢即各枝梢 是末端节点(terminal nodes)。决 策点说明谁做决策,做出何种决 策;末端节点表示博弈结束,说明 每个局中人的得益。末端节点得益 用括号包含各局中人得益,顺序按 约定或默认决策顺序。每个博弈树 都有一个初始节点(the initial decision node),一个末端节点表 示一个可能结果(outcome)。
L
工会的无差异曲线
w
工会的无差异曲线
• (w*,L*(w*)),非帕累 托最优点。
合同曲线 w* w' B u' u° 企业的等利润曲线 *) L*(w (w* L*(w) L U° U' A
委托人—代理人理论
一、委托人——代理人关系
经济活动和社会活动中有很多委托人 ——代理人关系 ,有明显的,也有隐蔽的。工厂和工人、店主和店 员、客户和律师、市民和政府、基金购买者和基金 管理人等都是。 委托人——代理人关系的关键特征:不能直接控制, 监督不完全,信息不完全,利益的相关性 委托人——代理人涉及问题:激励机制设计、机制设 计理论,委托合同设计问题等
第三节 子博弈和子博弈完美(精炼)纳什均衡 子博弈
由一个动态博弈第一阶段以外的某阶段开始的后续博 弈阶段构成的,有初始信息集和进行博弈所需要的全部信 息,能够自成一个博弈的原博弈的一部分,称为原动态博 弈的一个“子博弈”。 子博弈必须有一个明确的初始信息集,以及必须包含 初始阶段之后的所以博弈阶段,这意味着子博弈不能分割 任何信息集。
第三节 子博弈和子博弈完美(精炼)纳什均衡 子博弈精炼纳什均衡
法语

(3,2)
法语

德语 (1,1)
德语 法语

(0,0)
德语
(2,3)
纳什均衡(法语,{法语,法语/德语})2, (德语,{德语,德语}) 子博弈精炼纳什均衡(法语,{法语,德语})
第三节 子博弈和子博弈完美(精炼)纳什均衡 均衡路径和非均衡路径
第二节 可信性和纳什均衡问题
逆推归纳法
必须超过半数以上人同意时的方案?
P1 P2 P3 P4 P5 P6 P7 P8 100 0 1 2 0 1 0 1 P9 × 0 1 2 0 1 0 1 0 P10 100 0 1 0 1 0 1 0 1
94
95 0
95 0 1
96 0 1 2
96 0 1 2 0
第一节 动态博弈的表示法和特点
动态博弈的基本特点
� 局中人先后决策 � 行动顺序连贯性 � 信息不对称性
第一节 动态博弈的表示法和特点
策略(strategy)和行动(action)
在静态博弈中,策略和行动含义相同。在动态博弈 中,局中人策略由各阶段不同行动组成,行动是策略的 组成部分。
第二节 可信性和纳什均衡问题
第四节 经典动态博弈模型
斯塔克博格模型( Stackelberg)
采用逆推归纳法分析,因为第一家厂商已经确定的产 量,所以考虑厂商2的产量, 求偏导得: 6-q1-2q2=0 得 q2=(6-q1)/2 厂商1知道厂商2的这种决策思路,因此在选择q1时知道 厂商2会选择q2=(6-q1)/2的产量,所以直接将q2代 入自己的得益函数。 有u1=6q1-q1(6-q1)/2-q12 =3q1- q12/2 求导得q1=3,即厂商1的最佳产量是3个单位,则厂商 2的产量是(6-3)/2=1.5单位。 此时市场价格为3.5,双方的得益分别为4.5和2.25单 位。
第四节 经典动态博弈模型
斯塔克博格模型( Stackelberg)
一市场有两厂家生产同样的产品。 厂商1产量为q1;厂商2的产量为q2。 则市场总产量为Q=q1+q2 市场出清价格P=P(Q)=8-Q 两厂商无固定成本,边际成本c1=c2=2 u1=q1(8-q1-q2) -c1q1=6q1-q1q2-q12 u2=6q2-q1q2-q22
第四节 经典动态博弈模型
斯塔克博格模型( Stackelberg)
和古诺模型双方产量均为2的产量,总量为4相比 较,斯塔克博格模型中两厂商的产量较高。厂商1的得 益4.5大于古诺模型中厂商1的得益4,但厂商2的得益 2.25小于国内模型中厂商2的得益4。 *在动态博弈中,有先动优势,也有后动优势。信 息多了,可能结果好,但也可能结果更糟。
无不确定性的委托人—代理人模型
1
委托 不委托
代理人的选择
激励相容约束:
w(E)-E> w(S)-S w(E)> w(S)+E-S
2
接受
拒绝
[R(0),0]
2
努力 偷懒
[R(0),0]
[R(E)-w(E), w(E)-E]
[R(S)-w(S), w(S)-S]
参与约束:
2
接受 [R(E)-w(E), w(E)-E]
委托: R(S)-w(S) > R(0) 不委托: R(S)-w(S) < R(0)
数值例子
R ( E ) = 10 E − E 2
E=2, S=1, w(E)=4, w(S)=2 R(0)=0 R(E)=16 R(S)=9
相机选择和策略中的可信性问题
动态博弈中的策略是由各局中人设定的,没有强制 力,各局中人可以根据情况,在博弈过程中进行“相机选择” (Contingent play )。这就产生了“可信性”(Credibility)问 题,即各博弈方是否会真正的实施所设定的方案呢?
第二节 可信性和纳什均衡问题
相机选择和策略中的可信性问题
A

B
不借
还 (2,2)
不还 (0,4)
(
1,0)
有不可信的许诺,使得A和B的合作变为不可能。
第二节 可信性和纳什均衡问题
相机选择和策略中的可信性问题
A

B
不借
(1,0)
还பைடு நூலகம்
(2,2)
不还 报复 (-∞, -∞)
A
不报复 (0,4)
A的威胁对于A是不利的,不可行。
第二节 可信性和纳什均衡问题
相机选择和策略中的可信性问题
劳资博弈
先由工会决定工资率,再由厂商决定雇用多少劳动力
max π (W , L ) = max [ R ( L ) − WL ]
L≥0 L≥0
max u[W , L* (W )]
W ≥0
R
斜率为W R(L) WL
W
W*
0
L (W )
厂商的反应函数
*
L
0
L* (W * )
L* (W )
u3 u2 u1 u0
第三节 子博弈和子博弈完美(精炼)纳什均衡 子博弈
A

B
不借 (1,0)
还 (2,2)
不还 起诉
A 不起诉
(1,0)
(0,4)
第三节 子博弈和子博弈完美(精炼)纳什均衡 子博弈精炼纳什均衡
如果在一个完美信息的动态博弈中,各博弈方 的策略构成的一个策略组合满足,在整个动态博弈 及它的所有子博弈中都构成纳什均衡,那么这个策 略组合称为该动态博弈的一个“子博弈精炼纳什均 衡”。
子博弈精炼纳什均衡下所经过的决策点和最优选择构成的路径, 称为均衡路径(equilibrium path); 其他的路径是非均衡路径(off-equilibrium path)。
第四节 经典动态博弈模型
斯塔克博格模型( Stackelberg)
与古诺模型相似,这两个厂商决策的也是产量, 但一方较强,一方较弱。较强的一方先选择产量,较 弱的一方再选择产量。策略空间、得益函数和信息结 构等,与两寡头连续产量的古诺模型是一样的。
第一节 动态博弈的表示法和特点
阶段和扩展形表示
有一企业B产品销路很好,每年有10万元的收入。看到这 种情况,另一企业A仿冒该产品,如果企业B进行打假,A企业 被取缔罚款2万元,B企业付出5万元的打假成本。如果B不制 止A的假冒行为,听之任之。A企业可以继续选择假冒B企业产 品,或停止其侵权行为,B企业发现A的假冒行为,如果制 止,A企业被取缔罚款2万元,但A企业已经获利4万元,A企 业等价获得2万元利益,B企业扣除打假成本,获得2万元收益。 如果B企业不制止A的侵权行为,则A企业获利10万元,B企业 获得4万元收益。
纳什均衡的问题
法语

(3,2)
法语

德语 (1,1)
德语 法语

(0,0)
德语
(2,3)
纳什均衡(法语,{法语,法语})、(法语,{法语,德语})、 (德语,{德语,德语})
第二节 可信性和纳什均衡问题
纳什均衡的问题
A

B
不借 (1,0)

(2,2)
不还
A
起诉 (1,0)
不起诉 (0,4)
纳什均衡({借,起诉},还)、({不借,不起诉},不还) ({不借,起诉},不还)
相关文档
最新文档