动态博弈

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三个厂商的利润函数为:
U1=(100-q1-q2-q3)q1-2q1 U2=(100-q1-q2-q3)q2-2q2 U3=(100-q1-q2-q3)q3-2q3 根据逆推归纳法,先分析第二阶段厂商3的选择 厂商3 的反应函数为:
100-q1-q2--2q3-2=0 q3=(98-q1-q2)/2
u2=q2P(Q)-c2q2 =q2[8-(q1+q2)]-2q2 =6q2- q1q2-q22
根据逆推归纳法的思路,先分析第二个厂商的决 策实厂最际大商。上值2在来已的第说经q二2,。决个相定阶当了段于,厂在并商给且2定决厂q策商1的时2 情知,况道厂下q商1,求1因选使此择u2实对的于现q1
3-q1* = 0 q1* = 3 q2* = 3-1.5 = 1.5
P=3.5 u1=4.5 u2 = 2.25
练习:
三寡头市场有倒转的需求函数P = 100-Q, 其中Q是三厂商的产量之和,并且一至三各 厂商都有常数边际成本2而无固定成本。如 果厂商1和厂商2先同时决定产量,厂商3 根 据厂商1 和2 的产量决策。它们各自的产量 和利润是多少?
10000-S1 = 10000δ-δ2S
此时乙的得益于进行到第二回合的利益相同, 甲的得益10000-10000δ+δ2S则比进行到第二、 第三回合的得益δ2S大。因此甲在一第回合出价 S1 = 10000-10000δ+δ2S,乙方接受,甲、乙 双方得益各为10000-10000δ+δ2S和10000δ- δ2S,是这个博弈的子博弈精炼纳什均衡。
乙讨价还价的筹码就是可以跟甲托时间
(当然拖延对乙的收益也有影响),拖延
时间对甲造成的损失越大,甲愿意分给乙
以求早日结束讨价还价的利益越大,只有 当甲完全不怕旷日持久的谈判(δ=1),或 乙的争夺是毁灭性的(δ=0)时,居于有利 地位的甲方才不需要花钱买太平,可以保 证自己的全部利益。
练习:
考虑以下双寡头策略投资模型:企业1 和企业2 当前的平均成本都是2。企业1可以装备一种新 的技术,从而使其平均成本降低到1。装备这一 技术需要花费f。企业2可以观察到企业1是否投 资于这一新技术。一旦企业1对新技术的投资行 为被观察后,两个企业如同在古诺竞争模型中 一样,同时选择自己的产量水平q1和q2。因此, 这是一个两阶段的博弈。假设市场需求函数为 P(Q)=14-Q,其中P是市场价格,Q是市场总产量, Q1会=q选1+择q2。引问进上新述技投术资?额f处于什么水平时,企业
练习1:设一四阶段两博弈方之间的动态 博弈如下图所示,求子博弈精炼纳什均 衡策略组合和博弈的结果。
1
a
b
e
[4,3]
2
c
1
f
d [2,4]
2
g
h
[5,3]
(8,5)
(3,6)
练习2: 试写出下列动态博弈,并分析。
设想一个姑娘爱上一个小伙子,她父亲坚决不同 意,威胁说,如果女儿不与小伙子断绝关系,他 就与女儿断绝父女关系。女儿应当如何决策?
一般方法:从动态博弈的最后一个阶段开始分 析,每一次确定出所分析阶段博弈方的选择和 路径,然后再确定前一个阶段的博弈方的选择 和路径。
借 乙 不借
分 甲 不分
(1,0)
(2,2)


不打
(-1,0) (0,4)
借 乙 不借
分 甲 不分
(1,0)
(2,2)
(0,4)
借 乙 不借 (0,4) (1,0)
例如下象棋是动态博弈,但它不仅博弈阶段很多, 而且每各阶段的可能选择也很多,因此很难用扩展 形表示。
无法用扩展形表示的动态博弈,通常可以直接 用文字描述和数学函数式表示。
动态博弈的策略和结果
动态博弈的结果首先是指各博弈方上述类 型的策略构成的策略组合;
其次,动态博弈的结果是各博弈方的策略 组合形成的一条连接各个阶段的“路径” (PATH);
乙 不接受,出 S2
接受

[δS2 ,δ(10000-S2)]
不接受,出 S
[δ2S,δ2(10000-S)]
第一回合甲的考虑,甲一开始就知道第三回合自己的得 益是δ2S,也知道进行到第二回合自己的得益也是δ2S,因 此,如果甲在第一回合就给乙10000δ-δ2S,而自己又 能得到比δ2S更多的利益,那当然是最理想的。实现这 一理想需令S1满足:
定义:如果一个完美信息的动态博弈中,各博弈方的 策略构成的一个策略组合满足,在整个动态博弈及 它的所有子博弈中都构成纳什均衡,那么这个策略 组合称为该动态博弈的一个“子博弈完美纳什均 衡”。
子博弈完美纳什均衡能够排除均衡策略中不可信的 威胁和承诺,因此是真正稳定的。
逆推归纳法是求完美信息动态博弈子博弈完美纳什 均衡的基本方法。
完全且完美信息动态博弈
动态博弈的扩展形表示
动态博弈一般用“扩展形” (或称“博弈树”)表示。 扩展形表述要给出每个参与人的动态描述,即参与人 在什么时点、什么情况下选择什么样的行动。
(1)参与人集合; (2)行动顺序(order of move),即谁在何时采取行动; (3)行动空间(action set),每次轮到某一参与人行动时,可
所以,承诺行为就意味着当事人要为自己的诺言付 出成本,尽管这种成本不一定真的发生。
承诺行动会给当事人带来很大的好处,因为它会改 变均衡结果。
借 乙 不借
分 甲 不分
(1,0)
(2,2)


不打
(1,0)
(0,4)
有法律保障的开金矿博弈
乙的完整策略是,第一阶段选择“借”,若第 二阶段甲选择“不分”,第三阶段选择“打”。 甲的完整策略是:第二阶段选择“分”。最后 得益是双方各得2。
完善的法律制度不但能保障社会的公平, 而且还能提高社会经济活动的效率,是实 现最有效率社会分工的重要保障。
当然,要充分保障社会公平和经济活动的 效率,法律制度必须对人们正当权益的保 护力度足够大,对侵害他人利益者有足够 的震慑作用。
借 乙 不借
分 甲 不分
(1,0)
(2,2)


不打
(-1,0)
再分析第一阶段厂商1和厂商2的选择,将厂商3的反应函 数带入1和2利润函数中,求出反应函数,解方程组
q1=q2=98/3 q3=98/6
讨价还价博弈
讨价还价(bargaining)是市场经济中最常 见、普通的事情。讨价还价在博弈论中是 典型的动态博弈问题。
甲 1 出 S1
接受 (S1 ,10000-S1)
甲 1 出 S1
接受 (S1 ,10000-S1)
乙 不接受,出 S2
接受

不接受,出 S
[δS2 ,δ(10000-S2)]
[δ2S,δ2(10000-S)]
第二回合乙的选择:乙知道一旦博弈进行到第三回合,甲将 出S,自己得到δ2(10000-S),甲得到δ2S。如果乙已经拒绝 了第一回合甲的方案,此时他该如何出价才能使自己的得益 最大化呢?如果他出的S2使甲选择接受的得益小于第三回合 的得益,那么方案肯定会被拒绝,进行到第三回合,自己得 δ2(10000-S)。如果自己出的S2既能让甲接受(意味着甲的 得益不小于第三回合的得益),又能使自己的得益比第三回 合的得益大,那么这样的S2符合乙的利益。
供选择的行动; (4息);信息集(information set),参与人进行选择时所知道的信 (5)收益函数,每个参与人可能选择的每一种行动所构成的行
动组合相对应的各个参与人的收益; (6)外生事件的概率分布,即虚拟参与人(自然)的可能选择,
它在博弈中的作用只是在相应的地方在若干外生事件中根据 一定的概率分布随即选取,而没有自己的利益目标和收益函 数。
(0,4)
子博弈
定义:由一个动态博弈 第一阶段以外的某阶段 开始的后续博弈阶段构 成的,有初始信息集和 进行博弈所需要的全部 信息,能够自成一个博 弈的原博弈的一部分, 称为原动态博弈的一个 “子博弈”。
乙 借
甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
子博弈完美纳什均衡
利,如果必须让对方得的数额不如早点让其得到, 这对自己是有利的。
甲 1 出 S1
接受 (S1 ,10000-S1)
乙 不接受,出 S2
接受

[δS2 ,δ(10000-S2)]
不接受,出 S
[δ2S,δ2(10000-S)]
第三回合:甲的出价S乙必须接受,因此甲的出 价会选择S=10000。为了容纳更多的可能性,仍 然保留S作为甲在该回合的出价。因此,如果博 弈进行到第三回合,双方的得益分别为δ2S和 δ2(10000-S)。
最后,实施上述策略组合的最终结果,即 路径终端处得益数组中的数字。
可信性和纳什均衡问题
相机选择和策略中的可信性问题 动态博弈中博弈方的策略并没有强制力,
而且实施起来有一个过程,只要符合博弈 方自己的利益,他们完全可以在博弈过程 中改变计划。我们称这种问题为动态博弈 中的“相机选择”(Contingent Play)。
乙 不接受,出 S2 接受 甲
不接受,出 S
[δS2 ,δ(10000-S2)]
[δ2S,δ2(10000-S)]
本博弈的关键有两点:1、第三回合甲的方案有强 制力,即进行到该回合甲提出的分割比例S/10000 -S,乙必须接受,并且这一点两博弈方都是清楚 的。2、该博弈每多进行一个回合总得益就会下降 一个比例,因此让谈判拖得越长对双方可能越不
S=10000
S1 10000 (1 2 )
[10000 (1 2 ), 10000( 2 )]
双方获得利益的比例取决于δ-δ2的大小。δδ2越大,甲的比例越小,乙的比例越大。当 δ=0.5时,δ-δ2有最大值0.25,当0.5<δ<1时, δ越大,δ-δ2越小,甲的得益越大,乙的得 益越小;当0<δ<0.5时,δ越大,δ-δ2越大, 甲的得益越小,乙的得益越大。
由于逆推归纳法确定的各个博弈方在各阶 段的选择,都是建立在后续阶段各个博弈 方理性选择的基础上,因此自然排除了包 含有不可置信的威胁或承诺的可能性,因 此其结论是比较可靠的,确定的各个博弈 方的策略组合是有稳定性的。
动态博弈完善了纳什均衡的观点
所谓“精炼纳什均衡”就是将纳什均衡中包含 的不可置信的威胁战略剔除出去,就是说,使 均衡战略不再包含不可置信的威胁,它要求参 与人的决策在任何时点上都是最优的,决策者 要随机应变,而不是固守旧略。
逆推归纳法(backwards induction)
逻辑基础:动态博弈中先行动的理性的博弈方, 在前面ຫໍສະໝຸດ Baidu段选择行为时必然会考虑后行为博弈 方在后面阶段中将会怎样选择行动,只有在博 弈的最后一个阶段不再有后续阶段牵制的博弈 方,才能做出明确的选择。而当后面阶段博弈 方的选择确定以后,前一阶段博弈方的行为也 就容易确定了。
q2应满足: 6-q1-2 q2 = 0 q2 =3-q1/2
厂商1 知道厂商2的这种决策思路,因此在选择产量水平 q直1时接就将知上道式厂代商入2自的己产的量得q2益*会函根数据,上这式样确厂定商,1的所得以益他函可数以 实际上转化成了他自己产量的一元函数:
u1(q1,q2*) = 6q1-q1q2*-q12 = 6q1-q1(3-q1/2)-q12 = 3q1-0.5q12
假设任一博弈方只要得益不小于下一回合自己出价 时的得益,就愿意接受对方的出价,那么乙在第二 回合能让甲接受的,也可能使自己的最大利益的S2 应满足:
S2 = δs 此时乙的收益得益为:
δ(10000-δS)=10000δ-δ2S> δ2(10000-S)
甲 1 出 S1
接受 (S1 ,10000-S1)
仿冒 A 不仿冒
制止 B 不制止
(0,10)
(-2,5) 制止
仿冒 A
B
不制止
不仿冒
(2,2)
(10,4)
仿冒和反仿冒博弈扩展形
并不是所有的动态博弈都可以用扩展形表示, 因为有些动态博弈的阶段很多,或者博弈方在 一个阶段有许多可以选择的行为,这时用扩展 形表示动态博弈就很困难,或者根本不可能。
“战术勾结”
寡头之间的“不回避竞争法则”,是指至 少有几个寡头厂商保证(通常以做广告的 方式)自己的索价不高于其他任何竞争者。 这样的许诺对于消费者来说似乎是件很好 的事,但事实上这样的做法会提高价格。
寡占的斯塔克博格(stackberg)模型—— 动态的寡头市场产量博弈模型
u1=q1P(Q)-c1q1 =q1[8-(q1+q2)]-2q1 =6q1- q1q2-q12
借乙 分 甲 不分
不借 (1,0)
(2,2)
(0,4)
开金矿博弈
不可置信威胁引出信息经济学中一个很重要的 概念“承诺行动”(commitment)。
承诺行动是当事人使自己的威胁战略变得可置信的 行动。
一种威胁在什么时候才是可置信的?只有当事人在 不实施这种威胁时,就会遭受更大的损失时,威胁 才是可置信的。
相关文档
最新文档