(完整word版)经济博弈论期末复习资料(word文档良心出品)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
经济博弈论复习资料
一、名词解释
1、零和博弈:是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作可能的博弈。
2、常和博弈:是指各博弈方的得益之和是一个非零常数的博弈。
常和博弈中各博弈方之间利益关系也是对立的,博弈方之间的基本关系也是竞争关系。
3、纳什均衡:在博弈G={}n n u u S S ,,;,,11 中,如果由各个博弈方的各一个策略组成的某个策略组合()*
*1,,n s s 中,任一博弈方i 的策略*i s ,都是对其余博弈方策略的组合()**1*1*1,,,,,n
i i s s s s +- 的最佳对策,也即()()
**1**1*1**1**1*1,,,,,,,,,,,,n i ij i i n i i i i s s s s s u s s s s s u +-+-≥ 对任意i ij S s ∈都成立,则称 ()**1,,n s s 为G 的一个纳什均衡。
4、混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。
5、纳什定理:在一个有n 个博弈方的博弈G={}n n u u S S ,,;,,11 中,如果n 是有限的,且i S 都是有限集(对i=1, ,n ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。
(这个定理就是说,每一个有限博弈都至少有一个混合策略纳什均衡)
6、帕累托上策均衡:是指帕累托效率意义上的优劣关系,因此用这种方法选择出来的纳什均衡,也称为“帕累托上策均衡”。
7、风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏爱其中某一个纳什均衡,则该纳什均衡就是一个风险上策均衡。
8、子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息和进行博弈所需要的全部信息。
9、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略构成一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,
那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。
10、重复博弈:是原博弈的简单重复,重复博弈的子博弈完美纳什均衡是每次重复采用原博弈的纳什均衡。
11、有限次重复博弈:给定一个基本博弈G (可以是静态博弈,也可以是动态博弈),重复进行T 次G ,并且在每次重复G 之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G 的T 次重复博弈”,记为G(T)。
12、无限次重复博弈:如果一个基本博弈G 一直重复博弈下去,这样的重复博弈就叫“无限次重复博弈”,记为G(∞)。
13、有限理性:意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策略,他们会在博弈过程中学习、博弈通过试错寻找较好的策略;有限理性意味着均衡是不断调整和改进而不是一次性选择的结果,而且即使到达了均衡也可能再次偏离。
14、有限理性博弈:存在有限理性博弈方的博弈。
15、最优反应动态:有快速学习能力的小群体成员的反复博弈,相应的动态机制称为“最优反应动态”。
16、复制动态:学习速度很慢的成员组成的大群体随机配对的反复博弈,策略调整用生物进化的“复制动态”机制模拟。
17、完全但不完美信息动态博弈:在不完美信息动态博弈中,各博弈方对博弈结束时每个博弈方的得益是完全清楚的,因此博弈方是有“完全信息”的,这类博弈我们称之为“完全但不完美信息动态博弈”。
18、不完全信息静态博弈(静态贝叶斯博弈):可表示为
G={}n n n n u u p p T T A A ,;,,;,,;,,1111。
其中i A 为行为空间,i T 是类型空间(i i T t ∈);得益()i n i t a a u ,,,1 是策略组合()n a a ,,1 和类型i t 的多元函数;{}i t |i i i t p p -=是条件概率函数,即博弈方i 在自己的类型为i t 时,对其他博弈方类型的组合i t -的判断。
19、不完全信息动态博弈(动态贝叶斯博弈):在动态博弈中,行动有先后次序;在不完全信息条件下,博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率,即知道“自然”参与人的不同类型与相应选择之间的关系,但是,参与人并不知道其他的参与人具体属于哪一种类型。
由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。
20、进化博弈论:有限理性博弈的有效分析框架是借鉴生物进化博弈理论发展起来的进化博弈论,也称为“经济学中的进化博弈论”。
二、简答题
1、设定一个博弈模型必须确定哪几个方面?
答:设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。
如果设定博弈模型时不专门设定后两个方面,就是隐含假定是完全、完美信息和完全理性的非合作博弈。
2、“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。
答:“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。
简单地说,“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。
现实中“囚徒的困境”类型的问题是很多的。
例如厂商之问的价格战、恶性的广告竞争,初等、中等教育中的应试教育等,其实都是“囚徒的困境”博弈的表现形式。
3、纳什均衡的一致预测性质
答:如果所有博弈方都预测特定的博弈结果会出现,那么所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离预测结果的愿望,因此预测结果最终真会成为博弈的结果。
正是由于纳什均衡是一致预测,因此各博弈方可以预测它,可以预测他们的对手会预测它,还可以预测他们的对手会预测自己会预测它……预测博弈结果是非纳什均衡,意味着要么各博弈方的预测不同,要么预期至少一个博弈方会“犯错误”,会选择错误的策略或者在实施策略时会出现差错。
因为只有纳什均衡才具有一致预测的性质,因此一致预测性是纳什均衡的本质属性。
一致预测性是保证纳什均衡价值的两个重要性质之一。
4、相机选择和策略中的可信性问题
答:由于动态博弈中博弈方的策略是多阶段的行动计划,实施起来有一个过程,而且又没有强制力,因此博弈方完全可以在博奔过程中改变计划。
我们称这
种问题为“相机选择”问题。
相机选择的存在使得动态博弈中各博弈方策略设定的行为选择的“可信性”有了疑问。
各个博弈方是否会真正、始终按照自己的策略所设定的方案行为,还是可能临时改变自己的行动方案?纳什均衡不能解决这种可信性问题,无法排除博弈方策略中不可信的行为设定,因此在动态博弈中不是真正稳定的。
动态博弈分析中具有真正稳定性的均衡概念是子博弈完美纳什均衡。
5、动态博弈分析中为什么要引进子博弈完美纳什均衡,它与纳什均衡是什么关系?
答:子博弈完美纳什均衡即动态博弈中具有这样特征的策略组合:它们不仅在整个博弈中构成纳什均衡,而且在所有的子博弈中也都构成纳什均衡。
在动态博弈分析中引进子博弈完美纳什均衡概念的原因在于,动态博弈中各个博弈方的行为有先后次序,因此往往会存在相机抉择问题,也就是博弈方可能在博弈过程中改变均衡策略设定的行为,从而使得均衡策略存在可信性问题,而且纳什均衡无法消除这种问题,只有子博弈完美纳什均衡能够解决它。
子博弈完美纳什均衡一定是纳什均衡,但纳什均衡不一定是子博弈完美纳什均衡。
因此一个动态博弈的所有子博弈完美纳什均衡是该博弈所有纳什均衡的一个子集。
6、民间定理
答:(1)有限次重复博弈民间定理:设原博弈的一次性博弈有均衡得益数组优于各博弈方在一次性博弈中最差均衡得益构成的得益数组,那么在多次重复博弈中,所有不小于个体理性得益(1ndividual rationality Payoff,即博弈方保证能获得的得益)的可实现得益(feasible payoff,博弈中所有纯策略组合得益的加权平均数组).都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。
这个定理在有人正式证明并发表之前就是博弈理论界众所周知和认为当然成立的,因此称“民间定理”。
(2)无限次重复博弈民间定理:设G是一个完全信息的静态博弈。
用(e
1
,…,
e n )记G的纳什均衡的得益。
用(x
l
,…,x
n
)表示G的任意可实现得益。
如果x
i
>e
i
对任意博弈方i都成立,而足够接近1,那么无限次重复博弈
中一定存在一个子博弈完美纳什均衡。
各博弈方平均得益是(x
l ,…,x
n
)。
这个
无限次重复博弈的民间定理是弗里德曼(Fried-man)于1971年提出的,也称为民间定理是因为它与有限次重复博弈民间定理的相似性。
7、根据最优反应动态和复制动态进行的进化博弈分析的结论,有什么理论和现
实意义,对预测当前的经济均衡有没有作用?
答:以最优反应动态和复制动态为核心的进化博弈分析,对于加深我们对社会经济问题本质特征的认识,对博弈论和一般决策、经济理论作用和局限性的认识,对于指导我们的社会经济实践,都有重要的理论和实践意义。
因为进化博弈分析是以有限理性而不是完美理性为基础的,因此比较符合实际,对解释现实中事物的内在规律,指导人们的实践活动价值更大,而且对揭示建立在理想化行为主体基础上的经济、决策理论的内在缺陷有重要作用;进化博弈分析也有筛选、检验完全理性博弈分析均衡、结论的作用。
此外,由于最优反应动态和复制动态与经济主体的理性层次密切相关,因此进化博弈分析对加深我们对自身理性特征和局限性的认识也有重要的作用。
一般来说进化博弈分析研究的主要是社会经济现象和问题的长期动态趋向和稳定性,不一定能准确预测当前经济问题的均衡结果。
只有对已有较长期发展过程的问题,才能对当前的经济均衡做较有效地预测。
8、完美贝叶斯均衡需满足的要求:
答:(1)在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中各节点的概率的“判断”。
(非单节点上,相当于一个概率分布,单节点概率为1);
(2)给定各博弈方的“判断”,他们的策略必须是“序列理性”的。
(即以得益或期望得益最大为目标);
(3)在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方的均衡策略决定;
(4)在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。
9、用柠檬原理和逆向选择的思想解释老年人投保困难的原因?
答:“柠檬原理”是在信息不完美且消费者缺乏识别能力的市场中,劣质品赶走优质品,最后搞垮整个市场的机制。
“逆向选择”是在同样不完美信息和消费者缺乏识别能力的市场中,当价格可变时,价格和商品质量循环下降,市场不断向低端发展的机制。
高龄人群的保险市场是一个典型的柠檬原理和逆向选择会起作用,从而会导致发展困难的市场。
老年人的健康情况差别很大,比年轻人之间的差别要大得多,而保险公司了解老年人投保人的实际健康状况又很困难或成本很高,这就造成了保险公司对老年投保人健康状况的信息不完美。
缺乏准确的信息,保险公司就无法根据每个老年投保人的实际健康情况确定
不同的保费率,只能根据平均健康情况确定保费率。
这种平均保费率对健康情况很差的老年人是合算的,但对健康状况较好的老年人则不合算。
因此前者倾向于投保,后者则不愿意投保,投保老年人的平均健康情况会很差。
这使得保险公司的赔付风险大大提高,不仅不能赢利而且要亏损,从而失去经营老年保险的积极性,最终导致老年人的投保难问题。
这就是柠檬原理作用的结果。
如果允许调整保费率,那么保险公司为了避免亏损会上调保费率。
而这又会使得原来投保或者准备投保者中相对较健康的老人退出,从而投保老人的平均健康状况会变得更差。
如此循环,最终保费会升得很高而投保老人的平均健康情况则会越来越差,对市场的发展当然是很不利。
这就是逆向选择机制在老年保险市场作用的结果。
10、用完全但不完美信息动态博弈的思想,讨论我国治理假冒伪劣现象很困难的原因?
答:商品交易中的质量问题可以用完全但不完美信息动态博弈描述,商品交易中的假冒伪劣现象正是这种市场博弈低效率均衡的表现形式。
根据对不完美信息市场博弈完美贝叶斯均衡的讨论,不难知道我国市场经济中假冒伪劣现象难以治理的原因主要包括:
(1)信息不完美程度比较严重。
我国发展市场经济的时间不长,因此在企业和个人商誉、信誉的建立,资讯的获得和传递等方面,与发达市场经济国家相比有很大差距。
这使得我国市场经济活动中的信息不完全和不对称情况更加严重,这是我国市场交易博弈容易出现低效率均衡,假冒伪劣现象严重的主要根源之一。
(2)消费者识别能力低下而且麻木。
长期的经济落后和物质贫困使得我国消费者的消费知识缺乏,判断商品质量的能力较差。
根据不完美信息市场博弈分析可知,消费者识别能力低等于不法厂商制假成本低,而这正是导致不利市场均衡,假冒伪劣盛行的关键条件。
事实上,我国消费者不仅识别能力低,还经常对假冒伪劣容忍麻木,甚至知假买假,我国的假冒伪劣很难治理就更不奇怪了。
(3)暴利空间的存在。
我国许多市场的结构和价格水平不是很合理,许多商品定价过高,存在明显的垄断暴利。
这给制假者提供了很大的获利空间。
根据不完美信息市场博弈分析的结论,暴利的存在也是假冒伪劣问题严重的重要原因。
(4)对假冒伪劣的打击不力。
由于地方、部门利益,以及管理体制等方面的原因,政府管理、执法部门对假冒伪劣管理和打击的力度往往是不够的,甚至还有反过来保护制假的情况。
这当然会使造假者和打假者之间的博弈向不利的均衡方向发展,使假冒伪劣现象越来越严重。
(5)我国社会经济环境的变动太大,稳定性比较差也是重要原因。
在不稳定
的市场中,管理者和经营者都不可能对长远利益有足够的重视,不可能对培育和维护商誉有很大的积极性。
这对市场博弈的均衡也有很大的影响,会对假冒伪劣现象起推波助澜的作用。
当前我国市场经济中严重的假冒伪劣现象正是这些因素综合作用的结果,根治假冒伪劣必须先解决好上述问题。
三、计算题(课后习题2、3、4、5章)18道题(自己整理)
四、理论推导题(13道题)
1、古诺的寡头模型(P59)
解:寡头产量竞争——以两厂商产量竞争为例
设一市场有两家厂商生产同样的产品。
如果厂商1的产量为 1q ,厂商2的产量为2q ,则市场总产量为 21q q Q += 。
设市场出清价格 P (可以将产品全部卖出去的价格)是市场总产量的函数:()Q Q P P -==8 。
再设两厂商的生产都无固定成本,且每增加一单位产量的边际成本相等,221==c c 。
最后强调两厂商同时决定各自的产量,即他们在决策之前都不知道另一方的产量。
两博弈方的策略空间:产量(假设产量是连续可分的,两厂商都有无限多种可选策略,生产能力限制产量上限)
得益:各自利润,销售收益减去各自成本。
博弈得益即:
222126q q q q --=
不难看出,两博弈方的得益(利润)都取决于双方的策略(产量)。
怎样才能找出这个博弈的纳什均衡策略组合呢?
假设策略组合(*1q ,*2q )是本博弈的纳什均衡,那么(*1q , *2q )必须是
最大化问题,即: 121111112)](8[)(q q q q q c Q P q u -+-=-=21
2116q q q q --=221222222)](8[)(q q q q q c Q P q u -+-=-
=)
*6(max 212111
q q q q q --)
*6(max 222122
q q q q q --
分别对 *
1q ,,*2q 求导,就一定能实现两式的最大值,得出: 对方程组求解,得出*1q =*2q =2。
因此,策略组合(2,2)是本博弈唯一的纳
什均衡,也是本博弈的结果。
根据上述分析,模型中独立同时作产量决策,以自身最大化利益为目标的两厂商,都会选择生产2单位产量,最终市场总产量为2+2=4,市场价格为8-4=4,双方各自得益(利润)2×(8-4)-2 ×2=4,两厂商利润总和为4+4=8。
从两厂商的总体来看,根据总体利益最大化确定产量效率更高,换句话说,如果两厂商更多考虑合作,联合起来决定产量,先定出总利益最大化的产量后各自生产一般(1.5单位),则各自可分享到的利益为4.5,比只考虑自身利益的独立决策行为得到的利益更高。
但是,在缺乏强制作用的协议等保障手段的情况下,这种情况是不可能出现的,因为两厂商早晚都会增产,只有达到纳什均衡的产量水平(2,2)时才会稳定下来,因为只有这时候任一厂商单独改变产量不利于自己。
2、伯特兰德寡头模型(P63)
解:1883年,伯特兰德提出把反映函数应用到伯特兰德模型分析这种模型与产量的古诺模型的差别在于,各厂商选择的是价格而不是产量。
因此,它是价格竞争寡头的博弈模型。
产品:两厂商生产同类产品,在品牌、质量、包装等方面有一定差别产品之间有很强替代性,但又不是完全可替代的,价格较高的不会完全销不出去。
假设:厂商1产品价格为:P1
厂商2产品价格为:P2
各自需求函数为:()211112111,P d P b a P P q q +-==
()122222122,P d P b a P P q q +-==
其中d1,d2>0,即两厂商产品的替代系数。
再假设两厂商无固定成本,边际生产成本分别为c1,c2。
两厂商同时决策。
博弈方:厂商1,厂商2;
博弈策略:价格p ;
博弈策略空间:厂商1为s1=[0,max 1P ],厂商2为s2=[0,max 2P ]。
max 1P 和max 2P 表示厂商1与厂商2能卖出产品的最高价格;
博弈得益:各自利润u ,即销售收益减去成本。
0*2*612=--q q 0
*2*621=--q q
则双方价格的函数,即得益函数:
运用反应函数法分析这个博弈,利用上述函数在偏导数为0时有最大值,很容易求出两厂商对对方策略(价格)的反应函数。
即:
如果要得到一个纳什均衡,则必须有( , )是两反应函数的交点。
即必须满足:
解方程组:
将 , 代入两得益函数就可得出两厂商的均衡得益。
上述是伯特兰德模型简单的情况。
若对于n 个寡头的价格决策,并且产品也可以是无差别的。
3、公共资源问题(P65)
解:随着社会经济的不断发展,我们越来越无法回避公共资源利用、公共设施提供和公共环境保护等方面的问题。
而在这些问题中,也包含了众多博弈关系。
公共资源的特征:(1)没有哪个人、哪个企业或组织拥有所有权;
(2)大家都可以自由利用;
(3)即具有非排他性和非竞争性。
由于公共资源有上述两个特征,因而利用这些资源时不支付任何代价,除非政府将这些资源收归国有,并对使用者征收资源税或收取类似的费用。
但一旦政11111112111
)(),(q c P q c q P P P u u -=-==22222222122)(),(q c P q c q P P P u u -=-==))((2111111P d P b a c P +--=)
)((1222222P d P b a c P +--=)(21)(21122222
22111111P d c b a b P P d c b a b P ++=++
=
*1P *2P
)(21)(21*122222*2*211111*1P d c b a b P P d c b a b P ++=
++
=()()1112121222221211*1424c b a d d b b b c b a d d b b d P +-++-=()()2222121111121212*2
424c b a d d b b b c b a d d b b d P +-++-=*1P *2P
府采取了上述措施,这些资源也就不再是公共资源,而更是国有资源了。
公共草地放牧问题:
博弈方:n 个农户
博弈策略:羊的数量
博弈策略空间: 博弈得益: 假设:各户养羊数为q1,q2,q3,……qn 。
得出:在公共草地上放牧羊只得总数,以及每只羊的产出(应是羊只总数Q 的减函数)为:
再假设:购买和照料每只羊的成本为:c
最后得出:农户i 养qi 只羊的得益函数为: 为了更直观的观察,我们假设:有三家农户,即n=3,每只羊的产出函数V=100-Q=100-(q1+q2+q3);养每只羊的成本为:c=4。
得出:三家农户的得益函数分别为:
由于羊的数量不是连续可分的,因此上述函数不是一个连续函数。
但在技术上可以进行处理,把它当作连续函数。
求出三个农户各自对其他两个农户的反应函数。
即求q1,q2,q3最大化问题。
得出:3232112
12148),(q q q q R q --== 313122212148),(q q q q R q --
== ()212133212148,q q q q R q --
== 三个反映函数的交点(*1q ,*2q ,*3q )就是博弈的纳什均衡。
将这个纳什均衡代入三个反
应函数。
就得到:
4、夫妻之争的混合策略纳什均衡(P81) ()
n i q i ,......,3,2,1=i
u )(1Q V V q q Q n =++= c
q Q V q u i i i -=)(()[]1321114100q q q q q u -++-=()[]2321224100q q q q q u -++-=()[]3
321334100q q q q q u -++-=1728
7257624***3*2*1*3*2*1========u Q u u u q q q
解:一对夫妻得到了两张时装表演票和同一时间的两张足球比赛票。
妻子更想
去看时装表演而丈夫更想去看足球,但又不愿或不能分头行动,争执不下就决定投票决定。
若同时选择时装则去看时装表演,同选足球则去看足球比赛,如选择不一致则哪儿都不去。
假设:丈夫与妻子同时去看时装表演,妻子得益2,丈夫得益1; 丈夫与妻子都去看足球比赛,则丈夫得益3,妻子得益1; 双方选择不同而没有出门,则双方得益都为0.
这个博弈与没有纯策略纳什均衡的严格竞争博弈时明显不同的,如果一方知道另一方已选择了某种策略,则前者唯一明智的选择就是与对方保持一致,以免得最差得益0。
3
)(0)(0)(1)(⨯+⨯=⨯+⨯F p C p F p C p w w w w 1
)(0)(0)(2)(⨯+⨯=⨯+⨯F p C p F p C p h h h h 妻子的混合策略
丈夫的混合策略
2, 1 0, 0
0, 0
1, 3
时 装
足 球
时装
足球
丈 夫
妻
子
夫妻之争博弈的混合策略纳什均衡
策略 得益 博弈方1 (0.75,0.25) 0.67 博弈方2 (1/3,2/3) 0.75
我们不难发现,这个结果明显不如夫妻双方能交流协商时,任何一方迁就另一方时双方的得益好,因为那时任何一方都至少得 1.这是因为双方缺乏沟通时很可能出现最差结果而造成的。
5、寡占的斯塔博格模型(P121)
解:两个厂商(一方较强,一方较弱),先后选择产量的产量竞争博弈较强一方
先行选择,较弱一方根据较强一方的产量选择自己的产量。
由于此博弈决策的是产量,因此这是一个两博弈方都有无限多种可选策略的无限策略动态博弈,无法用扩展形表示,只能用描述得益函数的方法表示。
博弈方:厂商1,厂商2 策略:产量q
策略空间:[0, ] , 可看作不至于使价格降到亏本的最大限度产量
价格函数 ,其中 两厂商的边际成本为 ,没有固定成本。
两厂商的得益函数为:
运用逆推归纳法分析这个博弈。
先分析第二阶段厂商2的决策。
在第二阶段厂商2决策时,厂商1选择1q 实际上已经决定了,并且厂商2知道 1q ,
因此对厂商2来说,相当于在给定 1q 的情况下求使 2u 实现最大值的 2q 。
即对 求导的问题。
即 求得
再分析第一阶段厂商1的决策。
厂商1知道厂商2的这种决策思路,因此在选择1q 时就知道厂商2的产量
2q ,会根据公式进行确定,所以厂商1可以直接将该公式代入自己的得益函数,
这样厂商1的得益函数实际上转化成了他自己的产量的一元函数。
即: 因此,厂商1可以直接利用该公式求出使自己的得益最大的 max Q max Q Q Q P P -==8)(2
1q q Q +=221=+c c 2
12111211111211162)](8[)(),(q q q q q q q q q c Q p q q q u u --=-+-=-==2
2
2122212222212262)](8[)(),(q q q q q q q q q c Q p q q q u u --=-+-=-==2
22126q q q q --02612=--q q 2
3)6(21112q
q q -=-=
)(2
1
3)23(66),(112112111121*
211*2111q u q q q q q q q q q q q q u u =-=--
-=--==*
1
q。