(完整版)完全信息静态博弈及其纳什均衡解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1

第四章 完全信息动态博弈及其均衡解

1.完全且完美信息动态博弈

完全信息博弈指的是参与者的收益是共同知识。

完全且完美信息动态博弈指的是:博弈中的每一步中参与人都知道这一步之前博弈进行的整个过程。因此,我完全且完美信息动态博弈的特点:(1)行动是顺序发生的;(2)下一步行动选择之前所有以前的行动都可以被观察到;(3)每一可能的行动组合下的参与人的收益都是公共知识。

而不完美信息博弈指的是,在某一步参与人不知道以往博弈所进行的历史或者没有观察到以往的所有行动。

例4.1.我们来考虑这样一个动态博弈: 假定甲在开采一个价值4万元的金矿时需要1万元资金,乙有1万元资金。甲向乙借钱来开金矿。在这个博弈的第一阶段,甲向乙承诺: 如果乙借钱给他的话,那么他就会将采到的金子与乙对半分成,即(2,3)——乙得到2万元的金子,同时收回自己的1万元投资。对于甲的承诺,乙如果不借钱给甲的话,那么博弈到此为止,双方收益为(0,1)。如果乙借钱给甲的话,那么博弈进入第二个阶段。在第二阶段中,若甲遵守他的承诺,分给乙一半的金子,这样两人的收益为(2,3),其中1万元为投资成本。〖JP3〗然而,若甲违背自己的承诺,博弈就会进入到第三个阶段: 如果乙同甲打官司,那么由于打官司费时费力, 两个人的收益为(0,1);若乙不打官司,那么两个人的收益就为(5,0)。参见图1。

借 不借

分 不分 (0,1)

乙 乙 (2,3) 打官司 不打官司

(1,2) (5,0)

图1. 借钱博弈的博弈树

2.逆向归纳法与子博弈纳什均衡解

逆向归纳法(Backward induction )又称逆推法,是指这样一种动态博弈求解方法:从博弈的最后一步开始,计算最后一步的参与人的最优行动,逐步逆推到博弈开始时进行第一步的参与人的最优行动,从而确定每个参与人的最优行动。

在动态博弈中逆向归纳法能够进行的前提:参与人是理性的——任何一步参与人都选择

甲乙

2

最优策略;理性是公共知识——参与人选择最优策略是其他人所能够预测的。

在完全且完美信息动态博弈中逆向归纳法能够求得子博弈精炼纳什解。

借 ╳ 不借

分 ╳ 不分 (0,1)

乙 乙 (2,3) 打官司 ╳ 不打官司

(1,2) (5,0)

图2. 借钱博弈的逆向归纳法的求解过程

在例4.1中这样一个动态博弈,用逆向归纳法,我们就可以推知,如果甲做出“不分”的选择,那么乙一定会选择“打”官司。因为对于乙而言,打官司的收益为1,不打官司的收益是0,所以,作为一个理性人,乙一定会选择打官司。而如果甲知道在“不分”的情况下乙必定选择“打官司”,那么甲就一定会选择“分”一半的金子给乙,因为对甲而言,“分”的收益是2,“不分”的收益是0。所以,甲的承诺是可置信的。而对于乙来说,他会选择“借”,因为“借”的收益是3,“不借”的收益是1。因此,该博弈最终的子博弈精炼纳什均衡点就是(2,3)。

例4.2.斯坦克尔伯模型。

两个厂商垄断某个市场,其中厂商1处于支配地位,它先行动,然后从属企业2后行动。假定市场需求函数为p=a-Q 。厂商的单位产品的成本c 。这些是企业1和2的公共知识。问:厂商1和2是如何决定的它们的生产产量的。

假定厂商1和2所决定的产量分别为q 1,q 2。

我们用逆向归纳法来求解。企业2后行动,对于企业1的任何行动,即任意给定的产量,企业2确定产量以使利润最大,即使L 2=p ×q 2-c ×q 2最大。假定企业1决定的产量为q 1,因为:L 2=p ×q 2-c ×q 2=(a-q 1-q 2)×q 2-c ×q 2

由dL 2/dq 2=0:

q 1-2q 2=a-c (1)

甲乙

即:q2=(q1-a+c)/2

企业1先行动,它能够预知企业2的最优化行为,即在它的最优产量q1给定的情况下,

企业将按照q2=(q1-a+c)/2进行决策。这样,企业的利润函数为:L1=p×q1-c×q1=(a-q1-q2)×q1-c×q1=(a-q1-q2)×q1-c×q1而q2是q1如下的函数:

q2=(q1-a+c)/2

由dL1/dq1=0:

q1*=(a-c)/2

于是,

q2*=(a-c)/4

因此,((a-c)/2,(a-c)/4)为逆向归纳法解。该解被称为子博弈精炼纳什均衡解。

此时总产量为q2=3(a-c)/4,价格为(a+3c)/4

企业1的利润L1=(a-c)2/8

企业2的利润为L2=(a-c)2/16

请读者与古诺均衡解进行比较。

3.动态博弈中的威胁与承诺

为了实现最大利益,使博弈在博弈参与人所希望的策略组合上实现,在他人作出行动之前的每一步参与人都会向对方可能做出某种威胁或承诺,希望对方做出或者不做出某个行动。而通过逆向归纳法我们能够区别动态博弈中威胁或承诺是否可信。

例4.1:甲向乙承诺:借钱给我,我赚钱后将分给你。甲的承诺是可信的。

乙威胁甲:若你不分给我,我将起诉你。乙的威胁也是可信的。

之所以发生威胁与承诺的言语现象,是因为轮到他人行动的时候,参与人只能通过言语而影响他人的行动从而实现自己希望的结果。甲之所以承诺,是因为他希望乙能够“借钱”给他。同样,而乙之所以进行威胁,是因为他借钱之后,希望甲能够连本带利将钱给乙。

当然,在博弈论中因为参与人是理性人,威胁与承诺是否可置信能够被确认。这样任何威胁与承诺都是没有意义的:若是不可置信,它是公共知识,又何必做这样的威胁或承诺;若是可置信的,因为该博弈是完全且完美信息博弈,做出这样的威胁与承诺也是无益的。

但是在实际生活中,做出这样的威胁与承诺是有意义的,因为,人们不一定认为对方是完全理性人,而认为会发生某种“偏离”:或者会受言语的影响,而“忘记”应该按照计算的行动进行,或者相信了对方的承诺或威胁而改变了原来的行动选择;等等。

4.理性的困境:蜈蚣博弈与最后通牒博弈

3

相关文档
最新文档