高级微观经济学8博弈论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高级微观经济学8博弈论
前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互阻碍的问题。

本章讨论那个问题,建立复杂环境下的决策理论。

开展这种研究的的理论叫做博弈论,也称为计策论(Game Theory)。

最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。

大部分经济行为都可视作博弈的专门情形,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。

博弈论的思想精髓与方法,已成为经济分析基础的必要组成部分。

第一节 博弈事例
博弈是一种日常现象,例如棋手下棋,双方都要依照对方的行动来决定自己的行动,双方的目的差不多上要战胜对方,互不相容,互相阻碍,互相制约。

一样来讲,博弈现象的特点表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。

当所有当事人都拿定主意作出决策时,博弈的局势就临时确定下来。

博弈论确实是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。

博弈论推广了标准的一人决策理论。

在每个局中人的收益都依靠于其他局中人的选择的情形下,追求收益最大化的局中人应该如何采取行动?明显,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。

下面来举例说明。

例1.便士匹配(Matching Pennies)(二人零和博弈)
设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,同时各自独立安排硬币是否正面朝上。

局中人的收益情形是如此的:假如两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;假如一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。

关于那个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合差不多上{正面,反面}。

当甲和乙都作出选择时,
明显,该博弈的局势集合是{(正面,正面),(正面,反面),(反
面,正面),(反面,反面)},即各种可能的局势的全体,也称
为局势表,即表1。

每个局中人的收益都取决于所有局中人的决策,也确实是说,局中人的收益是博弈局势的函数。

本例中,甲的收益函数f 为:1)(,=正正f ,1)(,-=反正f ,1)(,-=正反f ,1)(,=反反f ;乙的收益函数g 为:1)(,-=正正g
,1)(,=反正g ,1)(,=正反g ,1)(,-=反反g 。

局中人的收益函数也可用表格或矩阵加以表示,并称其为收益表或收益矩阵。

表2中,甲的收益列
在左边,乙的收益列在右边。

表2: 甲和乙的收益表
该博弈的特点在于每个局中人的收益差不多上另一个局中人的付出,即甲和乙的收益之和为零,收支发生在局内,不涉及任何局外人。

这种博弈确实是所谓的二人零和博弈。

适应上,人们喜爱把二人博弈的第一个局中人甲叫做〝列〞,第二个局中人乙叫做〝行〞,而且总是把列的收益写在前面(即左边),行的收益写在后面(即右边)。

例2.囚徒难题(Prisoner's Delimma)(二人变和博弈)
有两个狂徒甲和乙因共同参与了一起犯罪活动而被囚禁收审。

他们能够选择合作,拒绝供出任何犯罪事实;也能够选择背叛,供出对方的犯罪行径。

这确实是所谓的囚徒博弈,也叫做囚徒难题。

博弈的局中人甲和乙都有两种可选择的策略:合作与背叛。

囚徒博弈的意义在于它能够说明寡头垄断厂商的行为,关键是给予合作与背叛具体的经济含义。

比如在双头垄断的情形下,合作能够说明为〝保持索要一个高价〞,背叛可说明为〝降价以争夺对手的市场〞。

右表给出了囚徒博弈的局势表。

局中人能够事先讨论这局博弈,但实际决策必须
独立地做出。

假如甲采取合作策略,不供出乙的犯罪事实,那么乙就能得到3000元的收益。

同样,假如乙采取合作策略,那么甲就能得到3000元的收益。

可见,假如甲乙双方都采取合作策略,双方各得3000元收益。

然而,审讯者用1000元奖赏来鼓舞局中人采取背叛策略。

如此,只要局中人选择背叛,他就会得到1000元鼓舞,而不管另一个局中人会采取什么策略。

需要注意的是,囚徒博弈中的货币支付来自第三方——局外人,这正是囚徒博弈同便士匹配博弈的不同之处。

奥曼(Aumann)1987年对囚徒博弈给出了一个专门简单的描述:每个局中人都能够对仲裁人简单地宣告〝给我1000元〞或〝给对方3000元〞。

简单分析一下就会发觉,假如一个局中人采取合作策略,而另一个局中人采取背叛策略,那么采取合作策略的局中人的收益为零,而采取背叛策略的局中人的收益为4000元(3000元收益再加上1000元的背叛鼓舞)。

假如双方都采取背叛策略,那么双方的收益各为1000元。

表4列出了甲乙双方的收益情形。

从收益表能够看出,甲乙双方的收益之和不为零,而且收益和是变化的。

因此,囚徒博弈是一种变和博弈。

直觉上看,甲和乙都应采取合作策略(互不供出对方的犯罪事实),各得3000元收益。

但从收益表能够得出如此的结论:假如一个局中人认为另一个局中人将合作,从而他将得到3000元收益,那么他假设采取背叛策略,就将总共能获得4000元的收益;假如他认为另一个局中人为了得到1000元鼓舞而将背叛,那么他也就只好为了自己也取得1000元鼓舞而采取背叛策略(否那么,他将一无所获)。

总之,在收益最大化动机的促使下,局中人的最优选择是背叛。

如此一来,甲乙双方都采取背叛策略,各得1000元收益;而不是都采取合作策略,各得3000元。

这是一个典型的博弈悖论,问题的关键在于每个局中人都有背叛的鼓舞,而不管其他局中人将做什么。

例3.古诺博弈(双头垄断:产量较量)
法国经济学家古诺(Cournot)于1838年以天然矿泉井为例,首次建立了简单的双头垄断博弈模型,其特点是,垄断厂商双方都天真地以为对方可不能改变原有产量水平,双方都追求各自利润最大化。

古诺假定:①有两个天然矿泉在一起,分别为厂商甲和乙占有;②两个矿泉都为自流井,生产成本为零,边际成本也为零;③甲和乙面对相同的需求曲线,采纳相同的价格;④双方都以为对方的产量水平可不能改变。

在这些假设前提下,甲和乙各自独立决定自己表3: 囚徒博弈局势表
表4: 甲和乙的收益表
的产量水平,以求利润最大化。

设)(Q P ϕ=是甲乙双方共同面临的反需求函数。

当甲的矿泉水产量为1Q ,乙的产量为2Q 时,矿泉水的市场价格为)(21Q Q P +=ϕ,甲的利润11PQ =π, 乙的利润为22PQ =π。

在那个博弈中,甲乙双方的策略都表现为选择产量水平,局中人的收益即为厂商的利润。

当甲的产量为1Q 时,乙以为甲可不能改变这一产量,而选择一个合适的产量水平2Q 以使自己的利润2π达到最大。

同样,当乙的产量水平为2Q 时,甲以为乙可不能改变这一产量,而选择一个合适的产量水平1Q 以使自己的利润1π达到最大。

为了说明那个博弈的结果,假设甲乙双方面临的反需求函数kQ P Q P -==0)(ϕ。

用1Q 表示这局博弈中甲选择的最优产量,2Q 表示乙选择的最优产量水平,那么甲乙各自的收益分别为12101))((Q Q Q k P ++=π和22102))((Q Q Q k P ++=π。

由于实现了利润最大化,因此
0,02
211=∂∂=∂∂Q Q ππ 解之得:当乙的产量水平为2Q 时,甲决定的产量水平为2)(201Q Q Q -=(这是甲对乙的反应函数);当甲的产量水平为1Q 时,乙决定的产量水平为2)(102Q Q Q -=(这是乙对甲的反应函数)。

其中,k P Q 00=表示矿泉水市场容量(即价格为零时的矿泉水需求量)。

进一步求解可得:3021Q Q Q ==, 即博弈的结果是双方最终各占据矿泉市场的三分之一。

反应函数说明,古诺博弈中每个局中人的决策(选定的产量水平)不但依靠于其他局中人的决策,而且与市场的容量有关。

例4.贝特兰博弈(双头垄断:价格较量)
古诺博弈模型描述了双头垄断厂商之间展开的产量较量。

实际上厂商之间的产量较量并不如价格较量那么普遍,寡头之间应该有猛烈的价格竞争。

不论市场价格如何,只要某一厂商降低价格,而其他竞争对手保持原价格不变,那么降价厂商就能占有全部市场。

这确实是说,我们假定消费者只从最低价格厂商那儿购买产品。

为此,法国经济学家贝特兰(Bertrand)于1883年提出了以价格为选择策略的贝特兰博弈模型,反对古诺关于产量的博弈模型。

还以矿泉水为例,在贝特兰博弈模型中各厂商都预期对手可不能改变价格,从而将自己的价格确定在利润最大化的水平之上。

这确实是说,贝特兰博弈的构建同古诺博弈相似,所不同的是贝特兰博弈中局中人的策略是选择价格,而古诺博弈局中人的策略是选择产量水平。

贝特兰博弈中两个局中人甲和乙也是面临相同的市场需求函数,只是现在价格是自变量,产量为因变量(古诺模型正好相反)。

设市场需求函数为)(P D Q =, 为了分析上简单起见,进一步设bP Q Q -=0(那个地点,k P Q 00=,k b 1=,即与古诺模型中的市场需求相同)。

局中人的收益仍是他所获得的利润。

假如甲和乙不相互勾结串通,当乙采取了价格水平常2P ,甲认为乙可不能改变这一价格水平,从而为了占据市场而要采取低于乙的价格水平2P 的价格1P ,因此甲的利润为)(111P D P =π,乙的利润为零;同样,当甲采取了价格水平常1P ,乙认为甲可不能改变这一价格水平,从而为了占据市场而要采取低于甲的价格水平1P 的价格2P ,因此乙的利润为)(222P D P =π, 甲的利润为零。

假如甲和乙相互勾结串通起来,采取相同的价格策略,即21P P =,那么甲和乙就能索要一个垄断价格,同时每人可收取一半的垄断利润。

由此可见,甲和乙的利润函数分别为:
⎪⎩⎪⎨⎧==>=<时当时当时当212121,0,2)(),(),(11112111P P P P P P P D P P D P P P ππ , ⎪⎩
⎪⎨⎧==<=>时当时当时当212121,0,2)(),(),(22222122P P P P P P P D P P D P P P ππ
假如甲和乙勾结串通,合作起来,那么双方就能按照最大利润价格)2(0b Q P =获得垄断价格,同时各得最大利润的一半。

那个地点,利润最大化价格是按照
()02)(00=-=-∂∂=∂∂bP Q bP Q P P
P π 确定的。

然而,占据市场的诱惑对每个局中人都存在,只要他略微降价,他就能获得全部市场。

假如甲先进入该矿泉市场,那么甲就按照利润最大化价格$P_1=Q_o/(2b)$猎取最大利润。

继而乙进入那个市场,且乙认为甲可不能改变他的价格$P_1$,因此乙为了夺取市场而采取低于甲的价格水平1P 的一个价格2P ()12P P <。

由于乙夺走了市场,甲同样又会采取低于乙的价格水平2P 的价格3P ,以夺回市场。

如此不断往复下去,直至最后甲乙双方都把价格水平定为零时才可达到均衡,现在双方的收益为零,市场各占一半(即甲的销售量1Q 和乙的销售量2Q 相等,且2021Q Q Q ==)。

这确实是甲乙双方不合作的结果,双方都变得更差。

以上分析说明:把贝特兰博弈与古诺博弈作比较,对同一市场来说,由于选择了不同的策略集合(一个以产量作为策略,另一个以定价作为策略),得出了不同的博弈结果,贝特兰博弈的均衡价格、均衡产量和均衡利润都呈完全竞争状态(超额利润为零),而古诺博弈的结果不是如此;再把贝特兰博弈同囚徒难题博弈作比较,二者具有相似的结构,即局中人合作会取得最好的结果,但利益的诱惑促使他们采取不合作的行动,致使双方博弈的结局都变得更差。

贝特兰博弈也可用囚徒博以来说明:合作是指两个厂商的勾结,背叛是指两个厂商独立行动,没有勾结。

合作,能够索要一个高的垄断价格;背叛,那么导致市场价格为零,双方利润为零。

可见,双方合作起来,对两个厂商都有利,看起来应该合作。

但博弈的最终结果是双方都采取背叛策略,导致谁也得不到利润。

本节所举的这些事例说明,寡头垄断厂商之间展开的竞争与较量完全能够用博弈加以描述和研究。

实际上,经济学中大部分经济现象都能够作为博弈的专门情形进行研究,比如历史上解决竞争均衡的存在性这一经济学差不多问题时,就把经济系统看成为一局博弈。

为了研究博弈,必须抓住博弈现象的差不多要素,这些要素是:局中人、策略、收益。

也确实是说,博弈能够用局中人集合、策略集合和收益函数加以描述。

局中人从策略集合中选择一种策略后所获得的效用或利益,确实是局中人的收益(payoffs),也叫做得失。

我们假定每一个局中人都明白他自己和别人的策略集合与收益函数,这确实是说,每个局中人的策略集合与收益函数为所有局中人所共知。

因此,每个局中人都明白其他局中人把握着这些信息和知识。

局中人的收益不但依靠于他自己的策略选择,而且依靠于其他局中人的策略选择。

我们再假定每个局中人在给定的主观信念下会选择收益最大化的行动,同时当新的信息依照贝叶斯规那么到来时,这些信息会得到修正(即依照贝叶斯全概率公式从先验概率运算后验概率)。

第二节 策略博弈
为了能够正确地应用博弈论研究经济问题,需要对博弈加以准确地描述和定义。

要定义一个博弈,需要确定三件情况:一是局中人集合(set of players),一是局中人的策略集合(set of strategies),一是局中人的收益函数(payoff function)。

这三件情况中,确定策略集合是至关重要的。

局中人以策略决定胜负,目标是使他的收益最大化。

这种以策略定胜负的博弈,称为策略博弈(game of strategy)。

正象比较古诺博弈和贝特兰博弈时说明的问题一样,用博弈论研究经济问题时,关于同一经济现象,由于选择了不同的策略集合,得到的博弈结果截然
不同。

用A 表示博弈的局中人集合,a S 表示局中人A a ∈的策略集合,a f 表示a 的收益函数,那么A a a a f S G ∈=),(就表示了一个博弈。

依照局中人的多少,博弈可分为二人博弈和多人博弈。

依照博弈的策略集合是否有限,博弈还又可分为有限博弈和无限博弈。

例如,便士匹配和囚徒难题差不多上有限博弈,而古诺博弈和贝特兰博弈差不多上无限博弈。

还可依照所有局中人的收益总和是否固定,把博弈分为常和博弈和变和博弈。

常和博弈分为零和博弈(即收益总和为零的博弈)和非零和博弈。

二人零和有限博弈是所有博弈中最简单、最重要的一类,通常称为矩阵博弈。

本节以二人博弈为重点,介绍有关策略博弈的概念与理论。

一.策略表与收益矩阵
设二人博弈的局中人是甲和乙。

甲有m 种可选策略,策略表为{}m x x x X ,,,21 =;乙有n 种可选策略,策略表为{}n y y y Y ,,,21 =。

当甲采取策略i x ,乙采取策略j y 时,),(j i y x 称为博弈的局势,集合Y X S ⨯=确实是局势集合(局势表、局势矩阵),即
{}()n m j i n m m m n n j i y x y x y x y x y x y x y x y x y x y x n j m i y x S ⨯=⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛====),(),(),(),(),(),(),(),(),(),(,,2,1;,,2,1:),(212221212111 每个局中人选择自己的策略时,都要考虑对手的行动。

如此每个局中人的收益不但与自己的选择有关,而且与对手的选择有关,收益函数是定义在局势集合S 上的函数,那个地点假定了局中人的收益是能够用实数来都来计量的。

用f 表示局中人甲的收益函数,用g 表示局中人乙的收益函数。

由于局势集合S 是有限集合,收益函数f 和g 都可用矩阵加以表示,这些矩阵就称为收益矩阵。

记),(j i j i y x f f =,),(j i j i y x g g =,那么甲和乙的收益矩阵分别为:
()n m j i f f ⨯=,()n m j i g g ⨯=
当C g f j i j i ≡+(常数)),,2,1;,,2,1(n j m i ==时,该博弈确实是常和博弈。

否那么,确实是变和博弈。

局中人的策略与收益也可用收益表加以表达:
一样情形下,二人博弈可表示成),;,(2g Y f X G G ==。

但关于二人常和博弈,那么可简单地表示成),,,()(2C f Y X C G G ==,其中C 为收益的常数和。

而矩阵博弈那么可更简单地表示成),,(2f Y X G G ==,或者直截了当用甲的收益矩阵f 来表示矩阵博弈。

二.最小最大原理
局中人的目标是选择使自己收益最大化的策略,我们来分析局中人如何决策。

假定甲乙双方彼此了解对方的收益表。

假如甲通过间谍获悉乙采取某种策略j y 时,甲必定会采取相应的某种策略i x ,以求自己的收益最大,即选择i x 使下式成立:
{}j m j j j i f f f f ,,,max 21 =
然而,当甲不明白乙会采取什么策略时,假如甲是一个避险者,那么他必将作最坏的打算,以求取得较好的成效。

第一,甲要从收益表中找出自己的每一种策略i x 下至少可获得的收益(即所能获得的最小收益),即先求解{}),,2,1(,,,min 21m i f f f in i i =,然后从这些最小收益策略中选择出收益最大的策略,即〝从最小收益中选择最大收益〞。

从收益矩阵来看那个决策过程,即甲第一选出自己的收益矩阵f 的各行的最小值,然后从这些最小值中再选出最大值:
j i n
j m i j i j i f f ≤≤≤≤=11min max min max 这确实是求解策略博弈的最小最大原理,其合理性表现为:假如甲采取按照最小最大原理确定的策略,那么不论乙采取什么策略,甲都可至少得到那个最小最大收益。

由此可见,最小最大原理是能够确保局中人收益的一种原理。

今后,我们把局中人甲按照最小最大原理所确定的策略,叫做甲的稳妥策略。

关于局中人乙来说,他的决策行为和决策过程同甲是一样的,只只是乙要依靠于收益矩阵g 。

乙决策的最小最大原理是:乙先选出收益矩阵g 的各列的最小值,然后从这些最小值中选出最大值:
j i m
i n j j i i j g g ≤≤≤≤=11min max min max 局中人乙按照最小最大原理确定的策略,称为乙的稳妥策略。

读者可能会问:甲先找出他的收益矩阵各列的最大值,然后再从这些最大值中选出最小值,不也是一种专门好的决策方法吗?事实上,这种决策方法叫做最大最小法,照此方法做出的决策,在甲不明白乙会采取什么策略的情形下不能保证甲的最大最小收益能够达到。

缘故在于最大最小法需要确定出乙的每种策略下甲的最大可能的收益。

假如甲按照最大最小法选出了策略),(j i y x , 那么当乙采纳策略j y 时,甲可得到最大最小收益j i f 。

然而,假设乙采纳的不是策略j y , 而是策略)(j k y k ≠,那么甲如不重新选择他的收益矩阵第k 列的最大值的话,他的最大最小收益j i f 就不一定能够达到,这正是最大最小法同最小最大原理的区别。

实际中,在甲不明白乙会采取什么策略的情形下选定了自己的策略以后,乙的策略才出台,为甲也获悉了乙的这一行动时,甲专门有可能来不及调整自己原定的策略,从而给甲带来一定的缺失。

因此,最大最小法在保证局中人收益方面不如最小最大原理那么保险。

当甲和乙的稳妥策略都已选定时,二者结合起来能否成为博弈的结果呢?答案是未必。

请看下面二人零和博弈的事例。

例1. 高度不确定的博弈
考虑二人博弈),;,(2g Y f X G =,甲的策略集合{}21,x x X =,乙的策略集合{}21,y y Y =,甲和乙的收益矩阵f 和g 通过博弈的收益表给出(见表2)。

关于甲来说,2min max =j i j i f ;关于乙来说,3min max -=j i i j g 。

这说明甲的稳妥策
略是2x ,乙的稳妥策略是2y 。

然而,当甲采取2x 时,乙采取2y 的收益322-=g 小于采取1y 的收益121-=g ,因而乙要改用策略1y 。

在乙改用1y 后,甲采取策略2x 的收益221=f 小于采取1x 的收益411=f ,因而甲也要改用策略1x 。

而当甲改用1x 后,乙采纳1y 的收益
411-=g 小于采纳2y 的收益12g ,因此乙又要改回到2y ;在乙改回到2y 后,甲也要改回到收益最大的策略2x 。

这就让我们看到:当甲采取2x 时,乙要采纳1y ;然后甲改用1x ,乙随之改用2y ;甲再改用2x ,乙又改用1y ,如此不断往复下去,博弈的结局是高度不确定的。

表2: 甲和乙的收益表
一样来讲,要想一个二人博弈),;,(2g Y f X G =具有确定的结局,必须存在如此的局势Y X S y x ⨯=∈*)*,(:
⎪⎩
⎪⎨⎧==∈∈)*,(max *)*,(*),(max *)*,(y x g y x g y x f y x f Y y X x 满足那个条件的的局势*)*,(y x ,叫做博弈2G 的均衡或最优解或最优局势,其中的*x 和*y 分别叫做局中人甲和乙的最优策略或均衡策略。

那个条件也就叫做博弈的均衡条件。

关于二人常和博弈),,(2f Y X G =来说,*)*,(y x 是博弈的最优解当且仅当
)*,(min *),(max *)*,(y x f y x f y x f Y
y X x ∈∈== 数学中,满足那个条件的点*)*,(y x 叫做函数f 的鞍点。

因此,*)*,(y x 是博弈的最优解当且仅当*)*,(y x 是收益函数f 的鞍点。

下面的定理给出了鞍点的判别条件。

鞍点定理.*)*,(y x 是收益函数R Y X f →⨯:的鞍点的充要条件是:
),(max min ),(min max *)*,(y x f y x f y x f X
x Y y Y y X x ∈∈∈∈== 证明:必要性)(⇒. 设*)*,(y x 是f 的鞍点,即)*,(min *),(max *)*,(y x f y x f y x f Y
y X x ∈∈==。

从),(),(min y x f y x f Y y ≤'∈'可知,),(max ),(min y x f y x f X
x Y y '≤'∈'∈'对一切Y X y x ⨯∈),(成立,这就包蕴着),(max min ),(min max y x f y x f X x Y y Y y X x '≤'∈'∈∈'∈,即),(max min ),(min max y x f y x f X
x Y y Y y X x ∈∈∈∈≤。

注意,),(max min *),(max *)*,()*,(min ),(min max y x f y x f y x f y x f y x f X
x Y y X x Y y Y y X x ∈∈∈∈∈∈≥==≥。

这就证明了),(max min ),(min max *)*,(y x f y x f y x f X
x Y y Y y X x ∈∈∈∈==。

充分性)(⇐.设Y X y x ⨯∈*)*,(满足),(max min ),(min max *)*,(y x f y x f y x f X
x Y y Y y X x ∈∈∈∈==。

从),(min max *)*,(y x f y x f Y y X x ∈∈=可知),*(min *)*,(y x f y x f Y y ∈=;从),(max min *)*,(y x f y x f X
x Y y ∈∈=可知*),(max *)*,(y x f y x f X x ∈=。

因此,)*,(min *),(max *)*,(y x f y x f y x f Y
y X x ∈∈==,即*)*,(y x 是函数f 的鞍点。


既然二人常和博弈的最优解恰好确实是收益函数的鞍点,鞍点定理告诉我们,当收益函数的鞍点存在时,利用最小最大原理确定的博弈局势确实是二人常和博弈的最优解。

然而,当收益矩阵不存在鞍点时,常和博弈就没有最优解,博弈的结局确实是高度不确定的。

鉴于此,我们将有鞍点的常和博弈称为严格确定的博弈。

三.反应函数
博弈),;,(g Y f X G =的局中人总是要考虑对手的行动,然后确定自己的计策。

当乙采取了某种策略Y y ∈,而且被甲所觉察时,甲必定有所反应,要确定出相应的计策X x ∈以使自己的收益f 在乙选择y 的情形下达到最大,即要使{}X x y x f y x f ∈''=:),(max ),(。

甲对乙的行动的这种反应,确定了一个从乙的策略集合Y 到甲的策略集合X 的映射ϕ,即对任何Y y ∈,
甲的反应策略)(y x ϕ=是按照{}X x y x f y y f y x f ∈''==:),(max )),((),(ϕ来确定的。

那个映射X Y →:ϕ就叫做甲对乙的反应函数。

同样的道理,能够确定出乙对甲的反应函数Y X →:ψ,即对任何X x ∈,)(x y ψ=是按照{}Y y y x g x x g y x g ∈''==:),(max ))(,(),(ψ来确定的。

利用反应函数,我们也能够说明博弈的结局。

就象古诺博弈一样,假如甲先采取某种策略X x ∈1,乙通过某种途径获悉了甲的这一行动,并认为甲可不能改变他的策略,因此作出反应,决定采取策略)(11x y ψ=,以使自己的收益最大化。

当乙采取策略1y 时,甲把握了这一信息,并认为乙可不能改变他的策略,因此作出反应,改变原先的策略,决定采纳)(12y x ϕ=,以求收益最大化。

这时,乙再次对甲的行为作出反应,采取新策略)(22x y ψ=。

甲也再次对乙的行动作出反应,采取新策略)(23y x ϕ=。

如此的反应不断下去,直到最后达到)(x y ψ=且)(y x ϕ=时博弈实现了均衡,现在的局势),(y x 确实是博弈的最优解(均衡、最优局势)。

综上所述,博弈的结局是实现均衡,同时均衡由甲乙双方的反应函数确定,即由方程组
⎩⎨⎧==)()(x y y x ψϕ决定。

事实上,*)*,(y x 是该方程组的解当且仅当⎪⎩
⎪⎨⎧==∈∈)*,(max *)*,(*),(max *)*,(y x g y x g y x f y x f Y y X x ,而这正是博弈G 实现均衡的含义。

注意,以上关于反应函数的讨论,没有要求策略集合的有限性,即集合X 和Y 能够是任何集合。

下面考虑二人无限博弈的一种专门情形:策略集合X 和Y 差不多上实数区间。

比如,本章第一节例3中古诺博弈的局中人策略集合确实是区间),0[+∞(半直线),例4中贝特兰博弈的局中人策略集合也是半直线。

假设局中人甲和乙的收益函数R X f →:和R Y g →:可微,那么甲对乙的反应函数)(y x ϕ=由方程(一阶条件)0),(=∂∂x y x f 决定,乙对甲的反应函数)(x y ψ=由方程(一阶条件)0),(=∂∂y y x g 决定,从而博弈的最优解确实是如下方程组的解:
⎪⎪⎩⎪⎪⎨⎧==∂∂==∂∂)
)((0),())((0),(x y y y x g y x x y x f ψϕ乙对甲的反应函数甲对乙的反应函数 例2.二人博弈的反应函数及最优解
设二人博弈中,甲和乙的策略集合X 和Y 为),0[+∞==Y X ,收益函数f 和g 分别如下:
654322216
5432221),(),(b y b x b y x b y b x b y x g a y a x a y x a y a x a y x f +++++=+++++= 求偏导数得方程组⎩
⎨⎧++=∂∂++=∂∂5324312),(2),(b x b y b y y x g a y a x a x y x f 。

由此可知局中人甲和乙的反应函数分别为⎩⎨⎧+==+==)2()()()2()()(253143b b x bb x y a a y a y x ψϕ,博弈的最优解为⎩
⎨⎧--=--=)4()2(*)4()2(*3321513433212453b a b a b a b a y b a b a b a b a x 。

四.策略选择的经济模拟
第一节中曾经指出,描述一个博弈时策略集合的选择至关重要。

比较古诺博弈和贝特兰博弈,尽管二者的目的差不多上要模拟同一经济现象——双头垄断,但二者的结构却专门不同。

古诺博弈中厂商的策略是选择产量,厂商的收益是策略变量的连续函数;而贝特兰博弈中厂商。

相关文档
最新文档