第八章 2 完全信息静态博弈：应用

合集下载

微观经济学-第八章：博弈论

二、纳什（Nash）均衡
问题4：性别之战（恋爱艺术）（分析图表见黑板） △纳什均衡：在对手的策略既定下，各对手选择的策略都是最好的
第一节：简单博弈与博弈均衡
结论： ①两个人分开都得不到任何满足， ②在一起都可以得到一定的满足， ③每人的最优策略都依赖对手的选择， ④对方决策后，自己选择最好的策略，达到纳什均衡。指导意义：
结论：下一次博弈开始时，采用“以牙还牙”的策略或模仿对手的策略，风险最小。
意义：避免恶性竞争，采取合作态度，防止双输局面出现。即由竞争走向合作。（“竞争合作”理论的基础）
第二节：重复博弈与序列博弈
二、序列博弈
△对局者选择出台策略有时间先后顺序，称为序列博弈。例1：有A、B两个房地产开发商在同一地区开发。（对局见黑板） 1、若B已行动，分析A的策略（分析图示见黑板）结论：B不开，A进；B开，A不进。 2、A若已行动，分析B的策略（分析图示见黑板）结论：A不开，B进；A开，B不进。小节：优先行动是关键，应先发制人，取得成功。
二、研究与开发策略（略）
第五节：不完全信息博弈
一、静态博弈
博弈的原则：预测（估计）对手选择某个策略的可能性（概率）大小，
用概率论的方法进行分析决策。例1：（对局、分析及图示见黑板）
二、动态博弈
博弈的原则： ①采用“黔驴技穷”的原则， ②不断试探，信息足够时再决定是否行动（选择策略）。 Firefly950整理改编，如有不宜发表内容请来信告知！
• 博弈论在20世记50年代由美国著名数Oscar Morgenstern）引入经济学。
• 目前已成为经济分析的主要工具之一。对产业组织理论、委托代理理论、信息经济学等经济理论的发展做出了非常重要的贡献。

西经第八讲.完全信息静态博弈.ppt

重复剔除劣策略
• 在海战博弈中，将军K认为将军I会选择北，因为这是弱占优策略，因此，将军K在考虑中就放弃了I会选择南这个想法。从而博弈成为：
将军I
北
K将军
北
2，-2
南
1，-1
重复剔除劣策略
• 此时，将军K就有了一个强占优策略-北。 • 因此，策略组合（北，北）就是重复占优
均衡。
重复剔除劣策略
• 剔除严格劣策略与剔除弱被占优策略之间存在两个区别。
– 其次，剔除弱被占优策略存在多均衡问题。如果存在占优策略均衡，那么就一定是唯一的。如果是重复剔除严格劣策略，均衡存在的时候也一定是唯一的。剔除弱被占优策略就可能存在多均衡，因为剔除的顺序就很重要。考虑下面的博弈：
重复剔除劣策略
列
c1
博弈规则
• 参与人 • 行动 • 支付 • 信息
– 知道对手的支付，但是不知道对手的行动
博弈的标准型表示
• 例如双变量矩阵
囚徒2
沉默招认
囚徒1 沉默 -1，-1 -9，0
招认 0，-9 -6，-6
求解博弈
• 策略
– 策略与行动不可区分
• 均衡概念
– 占优策略 – 重复剔除严格劣策略 – 纳什均衡
纳什均衡
建模者困境
列
抵赖
坦白
抵赖 0，0
－10，0
行
坦白 0，－10
－8，－8
纳什均衡
• （坦白、坦白）是弱占优均衡，也是重复剔除均衡，也是强纳什均衡。
• 不过，（抵赖、抵赖）是另一个纳什均衡。这个结果没有上面的均衡强，但是是帕累托最优。
• 均衡精炼：向基本的均衡概念增加限制，直到仅仅剩下一个均衡为止。Fra bibliotek纳什均衡

博弈论以及应用之2完全信息静态博弈共49页文档

要知道对好事的称颂过于夸大，也会招来人们的反感轻蔑和嫉妒。——培根 22、业精于勤，荒于嬉；行成于思，毁于随。——韩愈
23、一切节省，归根到底都归结为时间的节省。——马克思 24、意志命运往往背道而驰，决心到最后会全部推倒。——莎士比亚
博弈论以及应用之2完全信息静态博弈
11、获得的成功越大，就越令人高兴。野心是使人勤奋的原因，节制使人枯萎。 12、不问收获，只问耕耘。如同种树，先有根茎，再有枝叶，尔后花实，好好劳动，不要想太多，那样只会使人胆孝懒惰，因为不实践，甚至不接触社会，难道你是野人。(名言网) 13、不怕，不悔(虽然只有四个字，但常看常新。 14、我在心里默默地为每一个人祝福。我爱自己，我用清洁与节制来珍惜我的身体，我用智慧和知识充实我的头脑。 15、这世上的一切都借希望而完成。农夫不会播下一粒玉米，如果他不曾希望它长成种籽；单身汉不会娶妻，如果他不曾希望有小孩；商人或手艺人不会工作，如果他不曾希望因此而有收益。-- 马钉路德。
25、学习是劳动，是充满思想的劳动。——乌申斯基
谢谢！

第2讲完全信息静态博弈【博弈论经典】

第2讲完全信息静态博弈
•
囚徒困境在经济学上有着广泛的应用。例1：两个寡头企业选择产量的博弈。如果两个企业联合起来形成卡特尔，选择垄断利润最大化的产量，每个企业都可以得到更多的利润。但卡特尔不是一个稳定的均衡，因为给定对方遵守协议的情况下，每个企业都想增加生产，结果是，每个企业都只得到小于最大利润的产量，利润严格小于卡特尔产量下的利润。在有些情况下，个人理性和集体理性的冲突对社会来说也许是一件好事，尽管对集体而言是一件坏事。
第2讲完全信息静态博弈
下继续生活下去。从囚徒困境中，我们可以引出一个很重要的结论：一种制度（体制）安排，要发生效力，必须是一种均衡。否则，这种制度安排不能成立。
第2讲完全信息静态博弈
•
3.重复剔除的占优均衡在每个参与人都有占优战略的情况下，占优战略均衡是一个非常合理的预测，但在绝大数博弈中，占优战略均衡是不存在的。
第2讲完全信息静态博弈
•
在“智猪博弈”中，我们先剔除掉小猪的劣战略“按”，在剔除掉这个战略后的新的博弈中，小猪只有一个战略“等待”，大猪仍有两个战略，但此时，“等待” 已成为大猪的劣战略，提出这个战略，剩下的唯一战略组合是（按，等待）。
第2讲完全信息静态博弈
•
我们需要对“占优战略”和“劣战略”的概念进行重新定义。

都是（相对于si*的）劣战略。在应用重复剔除方法寻找均衡时，一个战略是占优战略或劣战略可能是相对于另一个特定的战略而言的。
第2讲完全信息静态博弈
' ' ' 定义：令si 和s? 是参与人 i 可选择的两个战略（即 s i i Si， ' s’ i Si）。如果对于任意的其他参与人的战略组合s -i，参与人 ' ' i的选择si 得到的支付严格小于从选择s? i 得到的支付，即：

2 完全信息静态博弈--博弈论

Then 1 should choose “a”.
– Player 1’s best response to “B” is “a”.
Strategy a b c
A
12,11 11,10 10,15
Player 2
B
11,12 10,11 10,13
C
14,13 12,12 13,14
Player 1
2.1.3 上策均衡
上策
– 在某个博弈中，不管其他博弈方选择什么策略，一博弈方的某个策略给他带来的得益始终高于其它策略，至少不低于其它策略。
上策均衡
– 一个博弈的某个组和策略中的所有策略都是各个博弈方各自的上策。这样的策略组合为该博弈的一个“上策均衡”。
智猪博弈（boxed pig game）
Exercise: 田忌赛马
每次双方各出三匹马，一对一比赛三场，每一场的输方要赔一千斤铜给赢方。
齐王的上、中、下三匹马分别比田忌的上、中、下马略胜一筹。但田忌的上马比齐王的中马和下马好，中马比齐王的下马好。
扩展成一个博弈问题，写出支付矩阵。
田忌
上中下上下中中上下中下上下上中下中上上中下 3，-3 1，-1 1，-1 1，-1 -1，1 1，-1
Scenario Analysis
Similarly, if 1 thinks 2 will choose C…
– Player 1’s best response to “C” is “a”.
Player 2
Player 1
Strategy a b c
A
12,11 11,10 10,15
B
11,12 10,11 10,13

完全信息静态博弈教学课件

完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下，没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中，每个参与者都做出了最优策略，并且没有其他可行的更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法，并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。我们将探讨完全信息博弈的特点，并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策，没有机会进行反复决策。我们将学习静态博弈的概念和分类，为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例，讲解完全信息静态博弈的应用和分析过程。
谈判中的博弈
探讨在谈判中的决策制定者之间如何利用博弈论分析对方策略，并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞拍者如何制定最佳出价策略。
完全信息静态博弈教学课件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息静态博弈的定义、特点以及解决方法，并通过案例讲解和应用帮助理解。
什么是博弈论？
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。我们将深入探讨博弈论的应用和它在现实生活中的重要性。

完全信息静态多目标博弈优化模型及应用

砸各。
３实例分析
假设某城市有企业１和企业２两个企业生产相同的某种产品，并且这两个企业垄断了这种产品的市场．每个企业的产品需求量不仅与双方的产品价格有关系，而且还受到
＝
叩ｌ，，７，，Ｐｐ，，叩；，，Ｐ２ ≥ ０
对模型求解，得其最优解为Ｐ・一２．６，４，则采取（２．６，４）作为该博弈的最优策略．即企业１和企业２分别选择价格２．６和４，此时博弈达到均衡。经验证任何一方改动自己的价格都不会得到比最优策略解更好的期望利润和利润风险。
完全信息指每一个局中人对其他局中人的特征、策略、支付函数等有准确的信息；静态博弈指局中人的博弈行为同时进行。如石头、剪刀、布的游戏。但同时进行也并不是绝对意义上的 “ 同时 ” ，只要决策的时间先后顺序差别跟博弈的结果没有关系，即可看成是 “ 同时进行的博弈 ” 。如不同竞标单位作出的工程投标决策。完全信息静态博弈的一个核心概念是 “ 纳什均衡 ” 。 “ 纳什均衡 ” 是指所有局中人的均衡策略都是为了达到自己期望利润的最大值，即最优策略组成的策略组合。多目标博弈也称多指标博弈，主要研究博弈参与人如何根据给定的多个相互矛盾、相互制约的指标来选择策

博弈论完全信息静态博弈

max u1 max(6q1 q1q2 q12 )
q1
1 q1 R1 (q2 ) (6 q2 ) 2
同样有： 2 max u1 max(6q2 q1q2 q2 )
q2
1 q2 R2 (q1 ) (6 q1 ) 2
2.3.2 反应函数
古诺模型的反应函数
个博弈方的各一个策略组成的某个策略组合 (s1*,…,sn*)中，任
一博弈方 i的策略si*，都是对其余博弈方策略的组合 (s1*,…, si1 *,
si+1* ,…,sn*) 的最佳对策，也即
* * ui ( si* , si*1 , si* , si*1 ,...sn ) ui ( si* , si*1 , sij , si*1 ,...sn )
q2
(0,6)
R1 (q2 )
q1 R1 (q2 ) 1 (6 q2 ) 2 q2 R2 (q1 ) (6 q1 )
1 2
(0,3)
R2 (q1 )
(3,0) (6,0)
q1
古诺模型的反应函数图示

对一个一般的博弈，只要得益是策略的多元连续函数，我们都可以求每个博弈方针对其他博弈方策略的最佳反应构成的函数，也即反应函数，而解出的各个博弈方反应函数的交点就是纳什均衡。这种利用反应函数求博弈的纳什均衡的方法称为“反应函数法”。
本部分主要内容
2.1 基本分析思路和方法
2.2 纳什均衡
2.3 无限策略博弈分析和反应函数 2.4 混合策略和混合策略纳什均衡
2.5 纳什均衡的存在性
2.6 纳什均衡的选择和分析方法扩展
2.1 基本分析思路和方法
2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法

完全信息静态博弈论模型

完全信息静态博弈论模型引言：博弈论是研究决策制定者在不同利益冲突场景下的行为和策略选择的数学模型。

在博弈论中，静态博弈是指参与者在同一时间点做出决策的情况。

完全信息表示每个参与者对于其他参与者的行为和策略选择都有完全的了解。

本文将介绍完全信息静态博弈论模型的基本概念、解决方法以及应用领域。

一、基本概念1.1 参与者完全信息静态博弈中，有两个或多个参与者，每个参与者可以是个体、团体或国家等。

参与者通过制定决策来追求自身的利益。

1.2 策略每个参与者在博弈中可以选择的行动方案称为策略。

策略可以是纯策略，即只选择一个确定的行动；也可以是混合策略，即以一定概率选择不同的行动。

1.3 支付函数支付函数是衡量参与者在不同策略组合下所获得效用或利益的函数。

支付函数可以表示为参与者的收益、成本或效用。

1.4 纳什均衡纳什均衡是指在博弈中，每个参与者选择的策略组合使得没有参与者有动机改变自己的策略。

换言之，每个参与者都在给定其他参与者的策略下做出最优的决策。

二、解决方法2.1 支付矩阵为了描述参与者之间的策略选择和支付函数之间的关系，可以使用支付矩阵。

支付矩阵是一个二维矩阵，行表示一个参与者的策略选择，列表示其他参与者的策略选择，每个元素表示对应策略组合下的支付函数。

2.2 最优响应最优响应是指在其他参与者的策略下，参与者能够选择的最优策略。

通过计算每个参与者的最优响应，可以找到纳什均衡。

2.3 前瞻性在完全信息静态博弈中，参与者可以通过推断其他参与者的策略和支付函数来做出决策。

前瞻性是指参与者能够预测其他参与者的行为并做出相应的反应。

三、应用领域完全信息静态博弈论模型广泛应用于经济学、政治学、生物学等领域。

3.1 经济学博弈论在经济学中有广泛应用，如市场竞争、定价策略、拍卖等。

完全信息静态博弈模型可以帮助分析参与者的决策行为，预测市场的走势和结果。

3.2 政治学在政治学中，博弈论可以用于分析选举、政策制定和国际关系等问题。

2 完全信息静态博弈

2 政府
救济 3，
3
-1，
1 0 0，
1 ）（（））（ 01
不救济 -1，
求微分，得到政府最优化的一阶条件：
同样，可以根据流浪汉的期望效用函数找到政府的最优混合策略。？？
即：流浪汉以0.2的概率选择寻找工作，0.8的概率选择游荡
四. 混合策略纳什均衡

社会福利博弈
四. 混合策略纳什均衡

社会福利博弈
救济政府
流浪汉
寻找工作 2 3， 1 不救济 -1， 0， -1， 0 流浪 3
设：政府救济的概率：1/2 ；不救济的概率：1/2。流浪汉：寻找工作的概率：0. 2；流浪的概率：0.8 每个参与人的策略都是给定对方混合策略时的最优策略
四. 混合策略纳什均衡
四. 混合策略纳什均衡

策略：参与人在给定信息集的情况下选择行动的规则，它规定参与人在什么情况下选择什么行动，是参与人的“相机行动方案”。
纯策略：如果一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动，该策略为纯策略。混合策略：如果一个策略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动，则该策略为混合策略。

由于混合策略伴随的是支付的不确定性，因此参与人关心的是其期望效用。
最优混合策略：是指使期望效用函数最大的混合策略（给定对方的混合策略）在两人博弈里，混合策略纳什均衡是两个参与人的最优混合策略的组合。

支付最大化法
四. 混合策略纳什均衡
流浪汉
寻找工作流浪
假定政府的混合战略是 G ，）；（ 1 流浪汉的混合战略是 L ，）。（ 1 政府的期望效用函数为： v（ G， L）（3 1 （）（）） 1 （5 1 ） vG 5 1 0 故 * 0.2

完全信息静态博弈实验

己的收益
在实验中，通常会设定每个策略都有一个相应的收益值，这些收益值可以是正面的，也可以是负面的。参与人的目标是在给定其他参与人策略选择的情况下，选择一个最佳
的策略，以最大化自己的收益
2
实验步骤
设定参与人数和策略数量
确定每个参与人的策略选择
分析博弈结果：包括最佳策略选择、博弈均衡以及影响因素等
的策略来增加自己的收益
除了得出最优策略组合外，实验结果还可以分析不同因素对博弈结果的影响。例如，参与人的风险偏好、信息不完全程度、时间限制等因素都可能对博弈结
果产生影响
4
完全信息静态博弈实验是一种经典的博弈模型，常用于分析策略选择和决策行为。通过实验可以得出最优策略组合以及不同因素对博弈结果的影响。在实际应用中，完全信息静态博弈也可以用于研究各种不同领域的问题，例如经济学、政治学、社会学等。通过分析不同因素对博弈结果的影响，可以更好地理解各种问题的本质和规律，为决策提供参考
完全信息静态博弈实验还可以用于研究人类的决策行为和心理。例如，通过实验可以观察到人们在面对风险和不确定性时的决策偏好和行为特点。此外，完全信息静态博弈实验还可以用于研究人类的合作和竞争行为，以及如何通过合作和竞争来实现共赢
结论
-
XXXX
感谢观看
汇报人：xxxx
时间：20XX.XX.XX
-
完全信息静态博弈实验
完全信息静态博弈实验
67 LOREM
完全信息静态博弈是一种经典的博弈模型，其特点是参与人在进行决策时，对于其他参与人的策略选择和收益情况都有完全的了解。这种博弈模型常用于分析策略选择和决策行为，以及
研究不同因素对博弈结果的影响

第八章博弈论

做广告
可口可乐的决策做广告不做广告
百事可乐的决策
做每家亿美元的利润可口可乐得到亿美元利润每家30亿美元的利润可口可乐得到20亿美元利润广百事可乐得到50亿美元利润百事可乐得到亿美元利润告
可口可乐得到50亿美可口可乐得到亿美不元利润每家都得到40亿美元利润做百事可乐得到亿美每家都得到亿美元利润百事可乐得到20亿美广元利润
告
（二）动态博弈
博弈方的决策有先后顺序，博弈方的决策有先后顺序，后行动的博弈方在看到其他博弈方的决策选择后采取相应的、在看到其他博弈方的决策选择后采取相应的、有针对性的行动。有针对性的行动。动态博弈存在一定的不对称性，动态博弈存在一定的不对称性，先行动者需深思熟虑
动态博弈扩展形
B 打进 A 打击（-2，3）不进（0，10）和平相处（5，5）
一个著名的例子：囚徒困境一个著名的例子：
张三和李四两人偷车时被捕，张三和李四两人偷车时被捕，警察怀疑他俩是本市一系列偷车案的惯犯，但没有充分证据，本市一系列偷车案的惯犯，但没有充分证据，为防止两人串供，关在两间牢房分别审问：防止两人串供，关在两间牢房分别审问：如某人坦白，另一人抵赖，并把主要罪名推给对如某人坦白，另一人抵赖，轻判2 对方判15 15年方，轻判2年，对方判15年如两人均坦白，各判10年如两人均坦白，各判10年 10 如两人拒不坦白，证据不足，罪名较轻，各判5 如两人拒不坦白，证据不足，罪名较轻，各判5年
重复博弈：
o
动态博弈是一种反复进行的博弈。动态博弈是一种反复进行的博弈。重复博弈是动态博弈的一种特殊情况，重复博弈是动态博弈的一种特殊情况，在重是动态博弈的一种特殊情况复博弈中，同一个博弈被重复多次。复博弈中，同一个博弈被重复多次。

完全信息静态博弈例子(作业)

例1：完全信息静态博弈在银行监管中的应用一、完全信息静态博弈模型的建立(一)博弈的参与人商业银行(监管对象)作为理性经济人,其行为动机是部门、个人利益最大化。

但由于在管理体制、经营方式、技术手段、人员素质、资产质量与外资银行之间存在差距,其经营难度和盈利能力都会受到不利的冲击。

在遵循一定条件下的预期效用最大化的原则下,商业银行有足够的动力进行违规操作,例如私自变动利率或进行不符合政策的违规金融创新,借以获得竞争优势,实现最大化效用。

银监会作为监管者,通过行使行政管理、现场检查、非现场检查以及违规处罚等监管权力,对商业银行的市场准入和退出,日常业务营运等进行指导、监督、管理。

而在目前市场经济没有完善的条件下,无论是现场检查还是非现场检查,都存在监管工作量大,连续性强的特点。

因此,实行严格监管策略有着较高的成本:监管费用增加,监管机构“暗箱”操作增长,创造经济租金使商业银行寻租行为增多,商业银行内部创新能力削弱等等。

监管成本的增加可能会超过市场交易成本。

(二)博弈的假设前提(1)银监会的策略空间为严格监管和宽松监管;(2)银监会在进行严格监管工作时,有成本支出。

当商业银行违规经营时,可采用罚款、取消高级人员资格等措施。

但在商业银行合规经营时,银监会宽松监管会带来收益;(3)商业银行的策略空间是违规经营和合规经营;(4)商业银行合规经营时,无论监管者监管与否,商业银行都将得到自己的正常收益;(5)商业银行违规经营的期望收益是违规所得,其在违规经营中将获得超额利润,但在银监会严格监管的条件下也将付出成本。

注:R1、R2分别是银监会宽松监管,商业银行合规经营的正常收益。

A为银监会采取监管措施所花费的成本;B为银监会在商业银行违规经营情况下,采取宽松监管所遭受的损失;C 为商业银行在违规经营条件下受到严格监管所造成的损失;M为银监会采取宽松监管,商业银行违规经营所获得的超额收益。

其中A,B,C都与M成正相关。

经济博弈论02完全信息静态博弈(Park)

合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略，并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时，这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题，可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中，参与者是决策的主体，他们可以是个人、组织或国家等。每个参与者都有各自的目标和利益诉求，通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中，每个参与者的策略空间是已知的，包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈场景，确保实验结果具有普遍意义。
实验方法
采用随机分组、角色扮演、问卷调查等方法收集数据。
可控性原则
对实验条件进行严格控制，确保实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行，以便验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融合趋势
行为博弈论将心理学、经济学等学科的成果引入博弈论分析框架中，探讨参与者在现实决策中的有限理性、学习过程和情绪等因素对博弈结果的方法来研究博弈问题，关注策略在群体中的演化过程和稳定性分析。近年来，演化博弈论在多个领域取得了重要进展，如社会网络中的信息传播、生态系统中的物种竞争等。

02 完全信息静态博弈

p p 1 a b 1 D2 ( p1 , p2) 1 x b 2 2t (1 a 2b)
假设C为单位成本，则两商店的利润分别为
( p , p ) ( p c) D ( p , p ) ( p , p ) ( p c) D ( p , p )
当a=1-b时，即两商店位于同一位置，完全无差异，则
p
*
1

p
* 2
c
如果企业的竞争战略是价格，则Bertrand证明，即使只有两个企业，在均衡情况下，价格等于边际成本，企业的利润为零，与完全竞争市场均衡一样。这就是“伯川德悖论（Bertrand Paradox）”。解开这个悖论的办法之一就是引入产品的差异性。
* * ,sn ) 的各一个策略组成的某个策略组合 (s1 中，任一参与人
* * 的策略，都是对其余参与人策略的组合 (s1 ,si*1 , si*1 ,...sn )
* * * * ,si*1, si* , si*1,...sn ) ui (s1 ,si*1, si , si*1,...s，的最佳对策，即 ui (s1 n)
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1
6q1 q1q2 q12
u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2
6q2 q1q2 q22
古诺模型的反应函数
maxu1 max(6q1 q1q2 q12 )
* * （ ui (si* , s ）对任意 s S i 都成立，则称 ) u ( s , s i i i i )
i
s
*
* * ( s1 , sn ) 为 G 的一个纳什均衡

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

完全信息静态博弈：应用
古诺的双寡头垄断模型古诺（1838）早在一个多世纪之前就已提
出了纳什所定义的均衡（但只是在特定的双寡头垄断模型中）。古诺的研究现在已理所当然的成为博弈论的经典文献之一，同时也是产业组织理论的重要里程碑。本例将说明：（1）如何把对一个问题的非正式描述转化为一个博弈的标准式表述；（2）如何通过计算解出博弈的纳什均衡；（3）重复剔除严格劣战略的步骤。
其产品的产量，我们假定产品是连续可分割的。由于
产出不可能为负，每一个企业的战略空间就可表示为 Ssii就=[是0,企∞]业，选即择包的含产所量有q非i≥负0。实也数许，有其的中读一者个提代出表特性别战大略的产量也是不可能的，因而不应包括在战略空间中，不出过。，由于Q≥a时，P=0，任一企业都不会有qi≥a的产
为求出古诺博弈中的纳什均衡，我们首先要将其
转化为标准式的博弈。前面已经讲过，博弈的标准式表述包含下列要素：（1）博弈的参与人；（2）每一个参与人可以选择的战略；（3）针对每一个可能出现的参与人的战略组合，每一个参与人的收益。双头垄
断模型当然只有两个参与人，即模型中的两个垄断企
业。在古诺的模型中，每一个企业可以选择的战略是
如果认为代数方式解纳什均衡过于抽象，
难以理解，我们还可以通过图形求解，
方法如下。等式1.2.1给出的是针对企业 j
的均衡战略
s
* j
时企业 i
的最优反应，同
样的方法我们可以推导出针对对企
业2的任意一个战略企业1的最优反应。
假定企业1的战略 q1满足 q1 a ，c企业2的最优反
max
0qi

i
(qi
,
q*j
)

max
0qi
qi
[a
(qi

q*j )

c]
设q*j a c（下面将证明该假设成立），
企业最优化问题的一阶条件既是必要条件，又是充分条件：
i
qi
a c 2qi
q*j
0
即
qi

1 (a 2

c

q
* j
)
（1.2.1）
（1）参与人：寡头1、寡头2
（2）战略：寡头1选择产量q1≥0；寡头2选择产量q2≥0
（
3）收益：寡头1的 cq1=q1[a-(q1+q2)-c] ；
收寡
益头
为 2
π的1=收q1p益-cq为1=qπ12[=aq-Q2p]--
cq2=q2[a-Q]-cq2=q2[a-(q1+q2)-c]
按照参定与义人，i，一si*对应战该略满(足s1*,s2*)如是纳什均衡，则对每一个
1 (a c) 2
2 (a c)2 9 2 (a c) 3
卡特尔
若干经济主体人结成产业内“卡特尔” （cartel），是当代经济生活中利益共谋的一种形式。卡特尔的宗旨，是协调每个成员的生产决策，主要是限制产量，并从中分享所有可能获得的好处。
欧佩克：现实中的卡特尔
一个实际的例子是欧佩克，他们通过压低成员国的产量来维持石油的高价格，从而使所有的成员国获利。但是维持一个卡特尔是困难的。
贝特兰德的双头垄断模型
下面我们讨论双头垄断种两个企业相互竞争的另一模型。贝特兰德（1883）提出企业在竞争时选择的是产品价格，而不像古诺模型中选择产量。首先应该明确贝特兰德模型和古诺模型是两个不同的博弈，这一点十分重要：参与人的战略空间不同，收益函数不同，并且（随后就可清楚的看到）在两个模型的纳什均衡中，企业行为也不同。一些学者分别用古诺均衡和贝特兰德均衡来概括所有这些不同点，但这种提法有时可能会导致误解：它只表示古诺和贝特兰德博弈的差别，以及两个博弈中均衡行为的差别，而不是博弈中使用的均衡概念的不同。在两个博弈中，所用的都是上节我们定义的纳什均衡。
一条件。
但这种安排存在一个问题，就是每一家企业都有动机偏离它：因为垄断产量较低，相应的市场价格 p(qm ) 就比较高，在这一
价格下每家企业都会倾向于提高产量，而不顾这种产量的增加会降低市场出清价格。于是古诺的解才是一个大家都不会偏离的均衡，在古诺的均衡解中，两企业的总产量要更高一些，相应的价格有所降低。
那么，如果产量组合(q1*, q2* )要成为纳什均衡，企业的产量必须选择满足：
q1*

1 2
(a

c

q2* )
且
q2*

1 2
(a

c

q1* )
解这一对方程得：q1*

q2*

a
3
c
均衡解的确小于 a c ，满足上面的假设。
对这一均衡的直观理解非常简单。每一家企业当然都希望成为市场的垄断者，这时它会选择
要全面表述这一博弈并求出其均衡解，还需把企业i的收益表示为他自己和另一企业所选择战略的函数。我们假定企业的收益就是其利润额，这样，在一般的两个参与人标准式博弈中，参与人i的收益 ui(si,sj)就可写为：
πi=qip-cqi=qi[a-Q]-cqi=qi[a-(qi+qj)-c]
我们照此进行转化：
qi使自己的利润 i (qi ,0)最大化，结果其产量将为
垄断产量qm (a c) / 2
并可赚取垄断利润 i (qi ,0) (a c)2 / 4 。在市
场上有两家企业的情况下，要使两家企业总的
利润最大化，两企业的产量之和 q1 q2 应
等于垄断产量 qm ，比如 qi qm / 2 就可满足这
假设市场中只有两个寡头企业1与2，他们生产同样的产品，市场上该产品的价格由需求决定：p=a-Q（更为精确一些的表述为：Q<a 时，P=a-Q；Q>a时，P=0）。Q=q1+q2是总供给，q1、q2分别表示企业1、2生产同质产品的产量。设企业i生产qi的总成本Ci(qi)=cqi，即企业不存在固定成本，且生产每单位产品的边际成本为常数c，这里，我们假定c<a。根据古诺的假定，两个企业同时进行产量决策。
ui(si*,sj*)≥ui(si,sj*)
上式对对每S个i中参每与一人个i，可si选*必战须略是s下i都面成最立优，化这问一题条的件解等：价于：
max
siSi
ui
(
si
,
s
* j
)
在古诺的双头垄断模型中，上面的条件可具体表述为：一对产出组合若是纳什均衡，对每一个企业，应为下面最大化问题的解：
应为：R2 (q1)

1 2
(a

c

q1 )
类似的，如果 q2 a c ，则企业1的最优反应
为：R1(q2 )

1 2
(a

c

q。2 )
如图1.2.1所示，这两个最优反应函数只有一个交
点，其交点就是最优产量组合(q1*, q2* )。
垄断利润与纳什均衡利润
垄断
纳什均衡
利润产量
1 (a c)2 4