第八章 2 完全信息静态博弈:应用
博弈论以及应用之2完全信息静态博弈49页PPT
5、教导儿童服从真理、服从集体,养 成儿童 自觉的 纪律性 ,这是 儿童道 德教育 最重要 的部分 。—— 陈鹤琴
31、只有永远躺在泥坑里的人,才不会再掉进坑里。——黑格尔 32、希望的灯一旦熄灭,生活刹那间变成了一片黑暗。——普列姆昌德 33、希望是人生的乳母。——科策布 34、形成天才的决定因素应该是勤奋。——郭沫若 35、学到很多东西的诀窍,就是一下子不要学很多。——洛克
博弈论以及应用之2完全信息静态博 弈
1、纪律是管理关系的形式。——阿法 纳西耶 夫 2、改革如果不讲纪律,就难以成功。
3、道德行为训练,不是通过语言影响 ,而是 让儿童 练习良 好道德 行为, 克服懒 惰、轻 率、不 守纪律 、颓废 等不良 行为。 4、学校没有纪律便如磨房里没有水。 ——夸 美纽斯
第八章 2 完全信息静态博弈:应用
类似的,如果 q2 < a − c ,则企业1的最优反应 为:R 1 ( q 2 ) = 1 ( a − c − q 2 ) 。
2
如图1.2.1所示,这两个最优反应函数只有一个交 * * 点,其交点就是最优产量组合 ( q1 , q2 )。
垄断利润与纳什均衡利润
垄断 纳什均衡
利润
1 (a − c) 2 4
如果认为代数方式解纳什均衡过于抽象, 难以理解,我们还可以通过图形求解, 方法如下。等式1.2.1给出的是针对企业 j 的均衡战略 s * 时企业 i 的最优反应,同 j 样的方法我们可以推导出针对企业1的任 意一个战略企业2的最优反应,和针对企 业2的任意一个战略企业1的最优反应。
假定企业1的战略 q1满足 q1 < a − c ,企业2的最优反 应为:R2 ( q1 ) = 1 ( a − c − q1 )
2 2 (a − c) 9
2 (a − c) 3
产量
1 (a − c) 2
卡特尔
若干经济主体人结成产业内“卡特尔” (cartel),是当代经济生活中利益共谋 的一种形式。 卡特尔的宗旨,是协调每个成员的生产 决策,主要是限制产量,并从中分享所 有可能获得的好处。
欧佩克:现实中的卡特尔
一个实际的例子是欧佩克,他们通过压低 成员国的产量来维持Baidu Nhomakorabea油的高价格,从 而使所有的成员国获利。但是维持一个 卡特尔是困难的。
第2讲:完全信息静态博弈
• 博弈论的基本概念共有7个:参与人、信 息、策略、行动、效用、均衡、结果。
1、参与人(player)
• 参与人(player):一个博弈中的决策主体。每个参与人必 须有可供选择的行动和一个很好定义的效用函数(离散的或 连续的)。参与人的目的是通过选择行动(或策略)来最大 化自己的效用。 • 问:囚徒困境中的警察是参与人吗? • 特别指出,在不完全信息博弈中,存在一个参与人“自然”, “自然”是指决定外生的随机变量的概率分布的机制。“自 然”是一个“虚拟参与人”,它没有效用函数。例如,在房 地产博弈中,对办公楼的市场需求是一个随机变量,我们可 以假定,在博弈的开始,“自然”以一定的概率决定需求的 大小。 • 问:如果高需求的概率为0.5,在静态博弈中,A、B如何选 择?
地段只有一幢楼出售,需求大时,每幢售价为1.8亿元,
需求小时,每幢为1.1亿元。(以千万为单位)
• 如果是静态博弈,即两个开发商同时选择行动,在自己
的策略确定前不知道其他参与人的策略选择。
高需求情况 B A 开发 不开发 开发 4,4 0,8 不开发 8,0 0,0
低需求情况
B A 开发 不开发 开发 -3,-3 0,1 不开发 1,0 0,0
1、古诺(Cournot)模型
• 两个寡头企业,分别称为企业1和企业2,每个 企业的策略是选择产量;效用是利润,利润是
企业产量的函数。
完全信息静态信息博弈-纳什均衡
一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡 五 纳什均衡应用举例
一 博弈的基本概念及战略表述
案例- 房地产开发项目-假设有A、B两家开发商
市场需求:可能大,也可能小
投入:1亿
假定市场上有两栋楼出售: 需求大时,每栋售价1.4亿,
不开发
1000,0 0,0
开发商A
博弈的战略式表述
一 、博弈的基本概念及战略表述
结果:博弈分析感兴趣的所有东西 如均衡战略组合、均衡行动组合、均衡支付组合等。
一 、博弈的基本概念及战略表述
均衡:所有参与人的最优战略的组合 一般记为:
* * s * ( s1 , , si* , , sn )
不开发
1000,0 0,0
开发商A
博弈的战略式表述
一 、博弈的基本概念及战略表述
博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动:参与人的决策变量 战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和 行动的知识 支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合 均衡:所有参与人的最优战略的组合 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈 规则决定均衡。
经济博弈论 02 完全信息静态博弈(Park)
YBU
Economics department
Cont
三、纳什均衡与严格下策反复消去法 上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡 命题1:在n个博弈方的博弈 G={S1, ...Sn; u1, ...un}中,如 果严格下策反复消去法排除了除 {S1*, ...Sn*}之外的所有策 略组合,那么 {S1*, ...Sn*}一定是该博弈的唯一的纳什均衡 命题2:在n个博弈方的博弈中 G={S1, ...Sn; u1, ...un}中, 如果 {S1*, ...Sn*}是G的一个纳什均衡,那么严格下策反复消 去法一定不会将它消去
u 1= 2.6, u 2= 2.6
YBU
Economics department
Cont.
Player 2 C (q) D (1-q)
博弈方2选C的收益(p混) 3p+1(1-p)=1+2p 博弈方2选D的收益(p混) 2p+5(1-p)=5-3p
A (p) Player 1
B (1-p)
2.4 混合策略和混合策略纳什均衡
一、猜硬币博弈
猜硬币方
正面
反面
盖硬币方
正面 反面
-1, 1 1, -1
1, -1 -1, 1
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略
这类博弈很多,引出混合策略纳什均衡概念
博弈论ch2 完全信息静态博弈
从左图可以看出,当一方的 选择为0时,另一方的最佳反应 为3,这正是我们前面所说过的 实现总体最大利益的产量,因为 一家产量为零,意味着另一家垄 断市场。当一方的产量达到6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
2.3.3 伯特兰德寡头模型
现在我们把反应函数法应用到伯特兰德模 型的分析。伯持兰德1883年提出了另一种形式 的寡占模型。这种模型与选择产量的古诺模型 的区别在于,伯特兰德模型中各厂商所选择的 是价格而不是产量。我们用简单的两寡头且产 品有一定差别的伯特兰德价格博弈模型进行分 析。
消去。
小结
–
纳什均衡点是一种局部均衡点,可以有很多个,也可以不 存在。
–
来源于策略组合的策略可能有n!个(离散),也可能无穷 多个(连续),那么求解将会十分烦琐。
得益 对于任一策略(s1,…,sn),其总得益为各博弈方得 ui (s1,..., sn ) 益之和 u(s1,..., sn ) 那么对于具有多个纳什均衡点的博弈,则对应的应有最优 纳什均衡的概念,而对应于最优纳什均衡的点为全局最优 点。此处最优的含义为稳定性而不是得益之和最大。
只有策略组合(上,中)的双方策略对于对方策略的最佳策略
2.1.3 划线法
策略之间的相对优劣关系,而不是绝对优 劣关系——划线法。
1, 0 0, 4
1, 3 0, 2
2. 完全信息静态博弈
前述的“两人有限博弈”可用支付矩阵来表示,不过矩阵的每个元素均是个二 元组(aij, bij),分别描述两个局中人的支付值。 而对于“两人有限零和博弈”来说,总有aij=-bij,因此只需用常规的矩阵形 式即可描述博弈
A = (aij ) m ×n
矩阵博弈:完全信息、静态的两人有限零和博弈
零和博弈是冲突最尖锐的博弈,一方所得即为对方所失 理性局中人追求己方支付最大化 想方设法使对手收益降低。损人即利己!
学 术 型 硕 士 研 究 生 课 程
博
弈
论
杜 少 甫 dsoft@ustc.edu.cn
第 I篇
非合作博弈(Non-cooperative
非合作博弈理论
Game)
每个局中人都是独立地从个人理性出发,选择那些使自己利益最大化的行动或对策的博 弈类型。 非合作博弈强调个人理性和个人最优决策,其结果可能是有效率的,也可能是无效率的。 各局中人间不存在任何有约束力的协议 不“串通”、“共谋”
行内最小且wk.baidu.com列内最大
若矩阵博弈的支付矩阵存在鞍点,那么鞍点所 对应的策略组合就是矩阵博弈的Maximin解,音译 为“马锡民解”
中国科学技术大学管理学院 @ 2013
17
矩阵博弈与Maximin解(续)
= z x2 − y2
二元连续函数鞍点示意
中国科学技术大学管理学院 @ 2013
完全信息静态博弈论模型
完全信息静态博弈论模型
引言:
博弈论是研究决策制定者在不同利益冲突场景下的行为和策略选择的数学模型。在博弈论中,静态博弈是指参与者在同一时间点做出决策的情况。完全信息表示每个参与者对于其他参与者的行为和策略选择都有完全的了解。本文将介绍完全信息静态博弈论模型的基本概念、解决方法以及应用领域。
一、基本概念
1.1 参与者
完全信息静态博弈中,有两个或多个参与者,每个参与者可以是个体、团体或国家等。参与者通过制定决策来追求自身的利益。
1.2 策略
每个参与者在博弈中可以选择的行动方案称为策略。策略可以是纯策略,即只选择一个确定的行动;也可以是混合策略,即以一定概率选择不同的行动。
1.3 支付函数
支付函数是衡量参与者在不同策略组合下所获得效用或利益的函数。支付函数可以表示为参与者的收益、成本或效用。
1.4 纳什均衡
纳什均衡是指在博弈中,每个参与者选择的策略组合使得没有参与者有动机改变自己的策略。换言之,每个参与者都在给定其他参与者的策略下做出最优的决策。
二、解决方法
2.1 支付矩阵
为了描述参与者之间的策略选择和支付函数之间的关系,可以使用支付矩阵。支付矩阵是一个二维矩阵,行表示一个参与者的策略选择,列表示其他参与者的策略选择,每个元素表示对应策略组合下的支付函数。
2.2 最优响应
最优响应是指在其他参与者的策略下,参与者能够选择的最优策略。通过计算每个参与者的最优响应,可以找到纳什均衡。
2.3 前瞻性
在完全信息静态博弈中,参与者可以通过推断其他参与者的策略和支付函数来做出决策。前瞻性是指参与者能够预测其他参与者的行为并做出相应的反应。
博弈论_完全信息静态博弈
豪泰林价格竞争模型
如果住在x的消费者在两个商店之间是无差 异的,那么,所有住在x左边的将都在商店 1购买,而住在x右边的将在商店2购买,需 求比例分别是 D1=x, D2=1-x。 这里的x满足: p1+tx=p2+t(1-x) 解上面两个式子,可得出需求函数为
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
豪泰林价格竞争模型
p 2 − p1 + t D1 ( p1 , p 2 ) = x = 2t p1 − p 2 + t D2 ( p1 , p 2 ) = 1 − x = 2t
利润函数分别为
1 π 1 ( p1 , p2 ) = ( p1 − c) D1 ( p1 , p2 ) = ( p1 − c)( p2 − p1 + t ) 2t 1 π 2 ( p1 , p2 ) = ( p2 − c) D2 ( p1 , p2 ) = ( p2 − c)( p1 − p2 + t ) 2t
纳什均衡应用举例: 纳什均衡应用举例:古诺模型
垄断条件下的最优产量,可通过计算 Q*∈argmaxπ=Q*(a-Q*-c) 求出最优的产量值
1 2 * * Q* = (a − c) < q1 + q2 = (a − c) 2 3
垄断条件下的最优利润为
最优纳什 均衡总产 量 最优纳什 均衡利润 总和
第2讲 完全信息静态博弈【博弈论经典】
第2讲 完全信息静态博弈
• 2.占优战略均衡 一个著名的例子:“囚徒困境”。 “囚徒困境”的故事讲的是:两个嫌疑犯作案后被警察抓住,被分别关在不同的房 间里受审讯警察知道两个人有罪,但缺乏足够的证明定罪,除非两人当中至少有 一个人坦白。警察告诉每个人:如果两人都不承认,每人都以轻微的犯罪判刑1年; 如果两人都坦白,各判刑8年;如果两人中一个人坦白而另一个人抵赖,坦白的释 放出去,抵赖的判刑10年。
第2讲 完全信息静态博弈
• 囚徒困境反映了一个深刻的问题,即个人理性和集体理性的冲突。 • 如果每个人都选择抵赖,各判刑1年,显然比都判刑8年好。但这个帕累托改进做
不到,因为它不满足个人理性要求,(抵赖,抵赖)不是一个均衡。 • 换个角度看,即使两个囚徒在作案之前建立攻守同盟(绝不坦白),这个攻守同
盟也没有用,因为没有人有积极性遵守协定。这就是合作博弈和非合作博弈的区 别。
第2讲 完全信息静态博弈
• 囚徒困境在经济学上有着广泛的应用。 例1:两个寡头企业选择产量的博弈。如果两个企业联合起来形成卡特尔,选择垄 断利润最大化的产量,每个企业都可以得到更多的利润。但卡特尔不是一个稳定 的均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果是,每 个企业都只得到小于最大利润的产量,利润严格小于卡特尔产量下的利润。 在有些情况下,个人理性和集体理性的冲突对社会来说也许是一件好事,尽管对 集体而言是一件坏事。
博弈论四种类型之完全信息静态博弈
博弈论四种类型之完全信息静态博弈
决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。
在完全信息静态博弈中的均衡是纳什均衡。最典型的例⼦是囚徒困境与智猪博弈。下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。
【囚徒困境】中基于收益矩阵的模型描述如下:
【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。
对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。
【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。
但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。个⼈的最优选择从社会⾓度看并不是最优的。社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。
02+完全信息静态博弈
上策均衡不是普遍存在的
例如:囚徒困境
优势策略均衡
囚徒困境博弈
乙
招
不招
招 甲
不招
-3,-3 -5,0
0,-5 -1,-1
它的纳什均衡是(招,招)。
注意概念:严格优势策略 弱优势策略
严格劣势策略 弱劣势策略
按 大猪
等待
小猪
按
等待
5,1
4,4
9, -1
0,0
它的纳什均衡是(大猪按,小猪等)。 食
按
槽
钮
三、纳什均衡及其分析思路
纳什均衡:在博弈G {S1,Sn;u1,un}中,如果由各个参与人 的各一个策略组成的某个策略组合 (s1*,sn* )中,任一参与人
的策略,都是对其余参与人策略的组合
诺曼底战役模拟
策略集合连续的情况
例:三个参与人参加的博弈,他们策略集合均为[0,1]区 间上的实数,策略组合以(x,y,z)表示,则其支付函数分 别为
U 1(x, y, z) x y z; U 2 (x, y, z) x yz; U 3 (x, y, z) xy z.
则策略组合(1/2,1,1/4)下的支付分别是
二、博弈模型的构建
完全信息静态博弈的战略式表述 (又称标准式表述)
完全信息静态博弈
一、博弈论的基本概念及战略式表述 二、纳什均衡 三、纳什均衡应用举例 四、混合战略纳什均衡 五、纳什均衡的存在性和多重性讨论
第一章 博弈论的基本概念及战 略式表述
1.1 基本概念 1.2 博弈的战略式表述 1.3 基本分析思路与方法
1.1 基本概念
➢ 博弈论(game theory)的基本概念包括参与人、行 动、信息、战略、支付、结果和均衡,其中,参与人、战 略和支付是描述一个博弈所需要的最少的要素,参与人、 行动和结果统称为博弈规则(the rule of the game ), 博弈分析的目的是使用博弈规则预测均衡。
二列(8000,0)是从战略组合(开发,不开发)得到的支付:A的利润为
8000万,B的利润为0。
(a)高需求情况
开发商B
开发
不开发
开发商A
开发 不开发
4000,4000 0,8000
8000,0 0,0
(b)低需求情况 开发商A
开发 不开发
开发商B
开发
不开发
-3000,-3000
1000,0
0,1000
我们说战略si’严格劣于战略si’’ 。通常,si’称为相对于si’’的劣
战略;对应地, si’’称为相对于si’的占优战略。
➢ 如果对于所有的s-i , ui (si' , si ) ui (si'', si )si ,且对于某些s-i,
第一课应用博弈论第二讲 完全信息静态博弈
19
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖, 即所谓“散户跟大户”的现象。
20
例2
为什么中小企业不会花钱去开发新产品? 在技术创新市场上,大企业是大猪,它
7
修路博弈
修 甲
不修
乙 修
1, 1
3, -1
不修
-1, 3 0, 0
8
我们看到,对甲和乙两家居民来说, “修路”都是劣战略,因而他们都不会 出资修路。
这里,为了解决这条新路的建设 问题,需要政府强制性地分别向每家征 税2单位,然后投入4单位资金修好这条 对大家都有好处的路,并使两家居民的 生活水平都得到改善。
9
这就是我们看到的为什么大多数 路、桥等公共设施都是由政府出资修建 的原因。
同样的道理,国防、教育、社会 保障,环境卫生等都由政府承担资金投 入,私人一般没有积极性承担这方面服 务的积极性和能力。
10
类似的例子还有:
渤海中的鱼愈来愈少了,工业化中的大 气及河流污染,森林植被的破坏等。解决公共 资源过度利用的出路是政府制订相应的规制政 策加强管理,如我国政府规定海洋捕鱼中,每 年有一段时间的“休渔期”,此时禁止捕鱼, 让小鱼苗安安静静地生长,大鱼好好地产卵, 并对鱼网的网眼大小作出规定,禁用过小网眼 的捕网打鱼,保护幼鱼的生存。又如在三峡库 区,为了保护库区水体环境,关闭了前些年泛 滥成灾的许多小造纸厂等。
完全信息静态信息博弈-纳什均衡(PPT 48页)
假设A出红牌的概率为 p;B出红牌的概率为 q;则
U A ( p ,q ) 2 p ( 1 2 q ) ( 2 q 1 )
因此A的最佳反应函数为
0, 当q 1/ 2 p [0,1],当q 1/ 2
1, 当q 1/ 2
p 1
0 1/2
1q
同理
U B (p ,q ) 2 q ( 2 p 1 ) ( 2 p 1 )
解一:支付最大化
政府 救济 不救济
流浪汉
找工作
游荡
3,2 -1 , 1
-1 , 3 0,0
假设政府救济的概率为;流浪汉找工作的概率为 ;
则流浪汉的期望效用函数为:
u L 2 1 1 1 3 0 1 (2 1 ) 3
解一:支付最大化
• 流浪汉的期望效用函数为:
u L 2 1 1 1 3 0 1 (2 1 ) 3
讨论
• 尽管混合策略不像纯策略那样直观,但它确实是 一些博弈中参与人的合理行为方式。扑克比赛、 垒球比赛、划拳就是这样的例子,在这一类博弈 中,参与比赛的总是随机行动以使自己的行为不 被对方所预测。
• 经济学上的监督博弈也是这样一个例子。如税收 检查、质量检查、惩治犯罪、雇主监督雇员等都 可以看成猜谜博弈。
§扑克牌对色游戏
• AB玩扑克牌对色游戏,每人都有红黑两张 扑克牌,约定如果出牌颜色一样,A输B赢, 如果出牌颜色不一样,则A赢B输。
经济博弈论02完全信息静态博弈(Park)
博弈论定义及发展历程
博弈论定义
博弈论是研究决策过程中理性参与者之间相互作用和影响的数学理论。它分析在给定条 件下,参与者如何根据各自掌握的信息和对其他参与者行为的预期,做出最优决策。
发展历程
博弈论起源于20世纪初,最初应用于数学领域中的零和博弈研究。随着理论不断完善和 扩展,博弈论逐渐应用于经济学、政治学、社会学等多个领域,成为现代社会科学研究
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的影 响。
演化博弈论借鉴生物进化论的思想和 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。
行为与演化博弈论在研究方法和应用 领域上具有互补性,未来两者之间的 融合将成为研究的重要趋势。例如, 可以运用行为博弈论的实验方法来检 验演化博弈论的理论预测,同时借助 演化博弈论的分析工具来揭示行为博 弈论中策略演化的内在机制。
THANKS
感谢您的观看
公共品供给问题
公共品定义
公共品是指那些具有非排他性和非竞争性的物品或服务,例如国防、公共安全等。在公共品供给中,由于存在“ 搭便车”现象,即人们不愿意为公共品的提供做出贡献,而希望享受别人提供的公共品带来的好处。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
那么,如果产量组合(q1*, q2* )要成为纳什均衡, 企业的产量必须选择满足:
q1*
1 2
(a
c
ห้องสมุดไป่ตู้
q2* )
且
q2*
1 2
(a
c
q1* )
解这一对方程得:q1*
q2*
a
3
c
均衡解的确小于 a c ,满足上面的假设。
对这一均衡的直观理解非常简单。每一家企业当 然都希望成为市场的垄断者,这时它会选择
(1)参与人:寡头1、寡头2
(2)战略:寡头1选择产量q1≥0;寡头2选择产量q2≥0
(
3)收益:寡头1的 cq1=q1[a-(q1+q2)-c] ;
收 寡
益 头
为 2
π的1=收q1p益-cq为1=qπ12[=aq-Q2p]--
cq2=q2[a-Q]-cq2=q2[a-(q1+q2)-c]
按照参定与义人,i,一si*对应战该略满(足s1*,s2*)如是纳什均衡,则对每一个
为求出古诺博弈中的纳什均衡,我们首先要将其
转化为标准式的博弈。前面已经讲过,博弈的标准式 表述包含下列要素:(1)博弈的参与人;(2)每一 个参与人可以选择的战略;(3)针对每一个可能出现 的参与人的战略组合,每一个参与人的收益。双头垄
断模型当然只有两个参与人,即模型中的两个垄断企
业。在古诺的模型中,每一个企业可以选择的战略是
贝特兰德的双头垄断模型
下面我们讨论双头垄断种两个企业相互竞争的另一模 型。贝特兰德(1883)提出企业在竞争时选择的是产 品价格,而不像古诺模型中选择产量。首先应该明确 贝特兰德模型和古诺模型是两个不同的博弈,这一点 十分重要:参与人的战略空间不同,收益函数不同, 并且(随后就可清楚的看到)在两个模型的纳什均衡 中,企业行为也不同。一些学者分别用古诺均衡和贝 特兰德均衡来概括所有这些不同点,但这种提法有时 可能会导致误解:它只表示古诺和贝特兰德博弈的差 别,以及两个博弈中均衡行为的差别,而不是博弈中 使用的均衡概念的不同。在两个博弈中,所用的都是 上节我们定义的纳什均衡。
qi使自己的利润 i (qi ,0)最大化,结果其产量将为
垄断产量qm (a c) / 2
并可赚取垄断利润 i (qi ,0) (a c)2 / 4 。在市
场上有两家企业的情况下,要使两家企业总的
利润最大化,两企业的产量之和 q1 q2 应
等于垄断产量 qm ,比如 qi qm / 2 就可满足这
ui(si*,sj*)≥ui(si,sj*)
上式对对每S个i中参每与一人个i,可si选*必战须略是s下i都面成最立优,化这问一题条的件解等:价于:
max
siSi
ui
(
si
,
s
* j
)
在古诺的双头垄断模型中,上面的条件可 具体表述为:一对产出组合若是纳什均 衡,对每一个企业,应为下面最大化问 题的解:
如果认为代数方式解纳什均衡过于抽象,
难以理解,我们还可以通过图形求解,
方法如下。等式1.2.1给出的是针对企业 j
的均衡战略
s
* j
时企业 i
的最优反应,同
样的方法我们可以推导出针对企业1的任
意一个战略企业2的最优反应,和针对企
业2的任意一个战略企业1的最优反应。
假定企业1的战略 q1满足 q1 a ,c企业2的最优反
假设市场中只有两个寡头企业1与2,他们 生产同样的产品,市场上该产品的价格由需求 决定:p=a-Q(更为精确一些的表述为:Q<a 时,P=a-Q;Q>a时,P=0)。Q=q1+q2是总 供给,q1、q2分别表示企业1、2生产同质产品 的产量。设企业i生产qi的总成本Ci(qi)=cqi,即 企业不存在固定成本,且生产每单位产品的边 际成本为常数c,这里,我们假定c<a。根据古 诺的假定,两个企业同时进行产量决策。
其产品的产量,我们假定产品是连续可分割的。由于
产出不可能为负,每一个企业的战略空间就可表示为 Ssii就=[是0,企∞]业,选即择包的含产所量有q非i≥负0。实也数许,有其的中读一者个提代出表特性别战大略 的产量也是不可能的,因而不应包括在战略空间中, 不出过。,由于Q≥a时,P=0,任一企业都不会有qi≥a的产
max
0qi
i
(qi
,
q*j
)
max
0qi
qi
[a
(qi
q*j )
c]
设q*j a c(下面将证明该假设成立),
企业最优化问题的一阶条件既是必要条 件,又是充分条件:
i
qi
a c 2qi
q*j
0
即
qi
1 (a 2
c
q
* j
)
(1.2.1)
完全信息静态博弈:应用
古诺的双寡头垄断模型 古诺(1838)早在一个多世纪之前就已提
出了纳什所定义的均衡(但只是在特定的双寡 头垄断模型中)。古诺的研究现在已理所当然 的成为博弈论的经典文献之一,同时也是产业 组织理论的重要里程碑。本例将说明:(1) 如何把对一个问题的非正式描述转化为一个博 弈的标准式表述;(2)如何通过计算解出博 弈的纳什均衡;(3)重复剔除严格劣战略的 步骤。
要全面表述这一博弈并求出其均衡解,还 需把企业i的收益表示为他自己和另一企 业所选择战略的函数。我们假定企业的 收益就是其利润额,这样,在一般的两 个参与人标准式博弈中,参与人i的收益 ui(si,sj)就可写为:
πi=qip-cqi=qi[a-Q]-cqi=qi[a-(qi+qj)-c]
我们照此进行转化:
应为:R2 (q1)
1 2
(a
c
q1 )
类似的,如果 q2 a c ,则企业1的最优反应
为:R1(q2 )
1 2
(a
c
q。2 )
如图1.2.1所示,这两个最优反应函数只有一个交
点,其交点就是最优产量组合(q1*, q2* )。
垄断利润与纳什均衡利润
垄断
纳什均衡
利润 产量
1 (a c)2 4
一条件。
但这种安排存在一个问题,就是每一家企 业都有动机偏离它:因为垄断产量较低, 相应的市场价格 p(qm ) 就比较高,在这一
价格下每家企业都会倾向于提高产量, 而不顾这种产量的增加会降低市场出清 价格。于是古诺的解才是一个大家都不 会偏离的均衡,在古诺的均衡解中,两 企业的总产量要更高一些,相应的价格 有所降低。
1 (a c) 2
2 (a c)2 9 2 (a c) 3
卡特尔
若干经济主体人结成产业内“卡特尔” (cartel),是当代经济生活中利益共谋 的一种形式。 卡特尔的宗旨,是协调每个成员的生产 决策,主要是限制产量,并从中分享所 有可能获得的好处。
欧佩克:现实中的卡特尔
一个实际的例子是欧佩克,他们通过压低 成员国的产量来维持石油的高价格,从 而使所有的成员国获利。但是维持一个 卡特尔是困难的。