第七章 博弈的三个模型2
第七章 博奕论(Game Theory教材课程
max
是
u1
即该博奕的纳什均衡解
max u 2
maxu1 maxu2
U1 Uq12
q2
6q2 6q1
2q1 2q2
0 0
的解,
求解上述方程组:
q 1 * q 2 * 2 , Q 4 u 1 1 , u 2 4 , u 1 u 2 8
标志着博奕论的初步形成。 50年代,合作博奕发展到鼎盛阶段,非合作博奕开始出现 纳什和夏普里的讨价还价模型, 塔克的“囚徒困境” 60年代以后,selten,Haysany,Krops,Wilseen
“信誉问题模型” (动态不完全信息博弈) 最近十多年,博弈论几乎贯穿了整个微观经济学,产业组
织理论和企业制度理论,并扩展到宏观经济学,环境、劳动、 福利经济学等领域。
新厂商的市场进入问题
B
打入
A
打击
(0,10)
和平共处
(-2,3)
(5,5)
6.博奕进程的信息
完美信息博奕:在动态博奕中,博弈方对博弈的进程, 即次此行为前各博奕方的行为完全了解
非完美信息博弈:
完全信息博弈:博奕各方完全了解所有博奕方各种策 略组合下得益情况 非完全信息博弈:
7.2.2博弈的主要分类
1 3、赢得(利益):参加博奕各方从博奕中所获得的 利
益 支付矩阵,博弈树
零和博奕:各博奕方赢得的代数和为零 非零和博奕:各博奕方赢得的代数和不为零
4.均衡:所有博奕方的最优策略的组合
博奕分析的目的是使用博奕规则决定均衡
5.得益的信息
完全信息博奕:博奕各方完全了解所有博奕方各种策略 组合下得益情况的博奕,如囚徒困境和田忌赛马。
7。3 完全信息静态博奕——纳什均衡
《西方经济学》第七章 博弈论
21
第五节
不完全信息动态博弈
对应于不完全信息动态博弈的均衡概念是精炼 精炼 贝叶斯均衡(perfect Bayesian equilibrium). 贝叶斯均衡 这个概念是完全信息动态博弈的子博弈精炼纳 什均衡与不完全信息静态均衡的贝叶斯纳什均 衡的结合.具体来说,精炼贝叶斯均衡是所有 参与人战略和信念的一种结合.它满足如下条 件:第一,在给定每个参与人有关其他参与人 类型的信念的条件下,该参与人的战略选择是 最优的.第二,每个参与人关于其他参与人所 属类型的信念,都是使用贝叶斯法则从所观察 到的行为中获得的.
22
贝叶斯法则 贝叶斯法则是概率统计中的应用所观察 到的现象对有关概率分布的主观判断 (即先验概率)进行修正的标准方法.
23
习
题
1. 什么是占优策略均衡?什么是重复剔除的占优策 略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性 博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为 0.两寡头所进行的是产量竞争.对于寡头产品 的市场需求曲线为P=30-Q,其中Q=Q1+ Q2.Q1是寡头1的产量,Q2是寡头2的产量. (1)假定两个寡头所进行的是一次性博弈. 如果两寡头同时进行产量决策,两个寡头各生产 多少产量?各获得多少利润?
25
�
第七章
第一节 第三节 第四节 第五节
博弈论
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
第一节 博弈问题概述
一,博弈的基本概念 二,博弈的分类
2
一,博弈的基本概念
博弈论 博弈论(game theory)是研究决策主体的 行为发生直接相互作用时候的决策以及这 种决策的均衡问题的. 博弈论的基本概念包括:参与人 行动 参与人,行动 参与人 行动, 战略,信息 支付函数,结果 均衡. 信息,支付函数 结果,均衡 战略 信息 支付函数 结果 均衡
博弈模型汇总
博弈模型汇总如下:
1.合作博弈与非合作博弈:这是根据参与者之间是否可以达成具
有约束力的协议来划分的。
合作博弈强调团队合作和协作,目标是达成共赢;而非合作博弈则强调个人利益最大化,不考虑其他参与者的利益。
2.静态博弈与动态博弈:这是根据参与者做出决策的时间顺序来
划分的。
静态博弈是指所有参与者同时做出决策,或者决策顺序没有影响;动态博弈是指参与者的决策有先后顺序,后行动者可以观察到先行动者的决策。
3.完全信息博弈与不完全信息博弈:这是根据参与者对其他参与
者的偏好、策略和支付函数了解的程度来划分的。
完全信息博弈是指所有参与者都拥有完全的信息,能够准确判断其他参与者的策略和支付函数;不完全信息博弈则是指参与者只拥有部分信息,无法准确判断其他参与者的策略和支付函数。
4.零和博弈与非零和博弈:这是根据所有参与者的总收益是否为
零来划分的。
零和博弈是指所有参与者的总收益为零,一方的收益等于另一方的损失;非零和博弈则是指所有参与者的总收益不为零,各方的收益和损失不一定相关。
5.竞争博弈与合作博弈:这是根据参与者之间是否存在竞争或合
作关系来划分的。
竞争博弈是指参与者之间存在竞争关系,目标是追求个人利益最大化;合作博弈则是指参与者之间存在合作关系,目标是追求共同利益最大化。
6.微分博弈与离散博弈:这是根据决策变量的连续性来划分的。
微分博弈是指决策变量是连续变化的,需要考虑时间、速度等因素;离散博弈则是指决策变量只有有限个可能的取值,通常只考虑状态的变化而不考虑时间、速度等因素。
博弈均衡模型及其举例
博弈联均衡模型博弈论模型图示博弈可划分为合作博弈和非合作博弈,1人们一般讲到的都是指非合作博弈,它有四种不同类型的博弈,即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,与上述相对应的是纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。
这四种均衡中最为基本的是纳什均衡。
2完全信息静态博弈——纳什均衡、完全信息动态博弈——子博弈精炼纳什均衡不完全信息静态博弈——贝叶斯纳什均衡、、不完全信息动态博弈——精炼贝叶斯纳什均衡,与上述相对应的是、、、。
这四种均衡中最为基本的是纳什均衡。
完全信息静态博弈(纳什均衡)债务人强硬妥协1这两者的区别主要在于人们的行为相互作用时,当事人能否达成一个有约束力的协议:如能达成就是合作博弈;反之就是非合作博弈。
合作博弈强调团体理性,强调效率和公平,非合作博弈强调理性个人的最优决策,其结果是否有效率则是不确定的。
2所谓纳什均衡,指的是所有参与人最优选择的一种组合,在这种组合下,给定其他人的选择,没有任何人有积极性做出新的选择。
纳什均衡的哲学思想是:给定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。
换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。
当博弈中的所有参与人事先达成一项协议,给出每个人的行为规则。
在没有外在强制力约束时,当事人是否会自觉地遵守这个协议?或者说这个协议是否可以自动实施?如果当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡。
参见张维迎:“经济学家看法律、文化与历史”,载张维迎《产权、政府与信誉》,三联书店2001年版。
囚徒困境□ 文/柯华庆“囚徒困境”最早是由美国普林斯顿大学数学家曾克1950年提出来的。
他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论。
这个故事后来成为博弈论最经典的案例。
故事的内容如下:两个犯罪嫌疑人被捕并受到指控,但除非至少其中至少有一个人供认犯罪,警方缺乏足够的证据指证他们所犯的罪行,从而将他们按罪判刑。
博弈论与经济模型第7章
第七章 重复博弈7.1 启发性例子博弈论中最为著名的模型大概是第二章中介绍的“囚徒困境”模型,它告诉我们一个局中人之间非合作的故事。
按照博弈论中关于局中人为理性人的假定:“囚徒困境”中局中人之间的不合作似乎是必然的结果。
但是,从另一方面看,现实生活中存在着诸多的合作现象,并且,对于经济学家来说,制度的形成及演化必定需要合作行为作为其基础。
因此,研究在一个长期环境中合作是否和怎样得以维持是非常重要的。
更为一般地,如果博弈是重复进行的,其结果是不是有所不同呢?当“囚徒困境”中的小偷在出狱后还会再次联合作案时,他们就不得不考虑今次出卖同伙会在今后受到同伙惩罚的可能,因而其选择“坦白”的战略就增加了一个额外的成本。
我们要探求的是在什么样的条件下,在他们两个人之间的长期关系会有助于他们之间的合作。
表7.1 囚徒困境21 抵赖坦白在性别战博弈中(见表7.2,其中F 表示“足球”,B 表示“芭蕾”),(F ,F )和(,)B B 都是纳什均衡,并且分别给出收入或者支付向量(2,1)和(1,2)(还有第三个纳什均衡,但它给出一个较低的总期望收入)。
如果这个博弈重复进行许多次,可不可达到((F ,F )和(C ,C )在各个时期交替出现,得到期望收入(1.5,1.5)?或者,我们是否能达到对于任意a ∈(0,1)的支付向量(2(1-),2(1-)a a a a ++)?这些就是我们需要回答的问题。
表7.2 性别战(其中F 表示“足球”,C 表示“芭蕾”)21 F B我们将只讨论无限次重复博弈的情形。
有两个理由使得我们这样做:首先,关于有限次重复博弈,如果阶段博弈只有一个纳什均衡,假定局中人极大化每个时期获得收入的贴现和,则重复博弈也只有一个平凡的完美纳什均衡,即阶段博弈纳什均衡的重复。
这意味着在有限次合伙作案中,囚徒们每次被逮住都会如实招供的。
所以,此时重复博弈并不能带来合作。
其次,我们认为一个长久且有着确定性结束时刻的关系是相当不现实的。
博弈模型汇总
博弈模型汇总博弈模型是博弈论的重要工具,用于描述博弈参与者之间的策略和利益关系。
在博弈论中,通过建立合适的博弈模型,可以帮助我们分析和理解各种不同类型的博弈情境,并预测博弈参与者的行为和可能的结果。
下面将对几种常见的博弈模型进行汇总和介绍。
1. 零和博弈模型:零和博弈模型是博弈论中最简单和最基本的模型之一。
在零和博弈中,博弈参与者的利益完全相反,一方的利益的增加必然导致另一方的利益的减少。
这种博弈模型常常用于描述双方的冲突和竞争情境。
常见的零和博弈模型有二人零和博弈和多人零和博弈。
2. 非合作博弈模型:非合作博弈模型是博弈论中较为常见的模型之一。
在非合作博弈中,博弈参与者之间的行动和决策是相互独立的,每个博弈参与者都追求自身的最大利益。
在非合作博弈模型中,博弈参与者可以选择不同的策略,根据对手的行动做出最优的响应。
常见的非合作博弈模型有纳什均衡模型和博弈树模型。
3. 合作博弈模型:合作博弈模型是博弈论中另一个重要的模型。
在合作博弈中,博弈参与者之间可以进行协作和合作,共同追求最大化整体利益。
合作博弈模型通常用于描述多个博弈参与者之间的联盟和合作情境。
常见的合作博弈模型有核心模型和合作博弈解。
4. 演化博弈模型:演化博弈模型是博弈论中较为新颖和有趣的模型之一。
在演化博弈中,博弈参与者的行动和策略可以随时间变化和演化。
演化博弈模型通常用于描述博弈参与者之间的适应性和进化过程。
常见的演化博弈模型有进化博弈动力学模型和演化博弈解。
博弈模型的应用广泛,不仅在经济学中有重要的地位,也在其他学科领域得到广泛运用。
博弈模型可以帮助我们分析和解决各种决策和策略问题,对于理解社会、经济和生物系统中的行为和演化具有重要意义。
总结起来,博弈模型是博弈论的核心工具之一,用于描述和分析博弈参与者之间的策略和利益关系。
常见的博弈模型包括零和博弈模型、非合作博弈模型、合作博弈模型和演化博弈模型。
这些模型在各个领域中都有广泛的应用,对于理解和解决各种决策和策略问题具有重要意义。
第七章 博弈论实验讲解
Cooper等调查了允许无约束事前交流来解决 协助问题的可能性。在允许交流的情况下, 选择策略2的百分比变为80%,而被试者中 申明未协调选择的比重只有71%。
7.2.2.4 n人博弈的实验
n人博弈实验的目的是为了观察同一批参与人反复进 行同一博弈的结果。这样可以使得谈判博弈具有 合作性。
G.Kalisch等做了一组n人博弈实验。在3人博弈中, 被试者被蒙住了眼睛,只能通过手势向仲裁人示 意他们的行动。在4人博弈中,每个被试人都坐在 其他人看不到的地方,他将自己的行动写在纸上。 3人博弈规则如下:
二种情况下,3个参与人都得0.
实验结果表明,被试者选择等待策略的比 重只占了33%,而由一个被试者叫价另一 个接受而形成联盟的策略出现的比例较高。 实验结果说明同一批人反复进行同一个博 弈有利于形成合作博弈。
7.3完全信息动态博弈实验
7.3.1基础知识 逆向归纳法:该方法适用于有限次博弈, 并且参与人都是理性的,都清楚的知道博 弈树结构,参与人首先从博弈树的末端开 始,求解末端的子博弈均衡,然后继续向 前求解,直至起点。
假设有两个被试者PP和ZZ,他们已掌握零和博弈论, 同时知道冯.诺依曼-摩根斯坦非零和博弈论,但他 们不清楚纳什均衡理论。
支付矩阵如表所示:
纳什均衡策略为(2,1)
如果允许单边支付,冯.诺依 曼-摩根斯坦的非零和博弈 解是策略(1,2)。
Merrill报告了100次实验的结 果,pp得到0.4美元,zz得 到0.65美元。如此看来, 在现实的讨价还价中并没 有达到纳什均衡。
混合策略纳什均衡:参与人根据一组选定的 概率,在两种或两种以上可能的行动中随 机选择中得到纳什均衡。
7.2.2实验研究
7.2.2.1纳什均衡与冯.诺依曼-摩根斯坦博弈解
管理经济学讲义(新)管理经济学第七章博弈论与竞争策略
四.博弈的分类
• (1)合作博弈与非合作博弈根据参与者之间能否通过谈判达成
具有约束力的协议或合同来划分。
• 可以达成协议的为合作博弈cooperative game,合作博弈强调集 体理性和整体最优。如买卖双方讨价还价后成交。
• 不能达成协议的为非合作博弈non-cooperative game,非合作博 弈强调个体理性和局部最优。如寡头之间的竞争博弈,双方的 利益和目标有冲突,难以达成可以实施的协议,双方都有欺骗 和违约的冲动。博弈论在经济学中的应用主要在非合作博弈领 域。
• 在有些情况下,为了避免陷入被动,采取最大最小策略十分 必要。在下图的博弈中,乙方采取“右”是一个支配性策略。
因为不管甲方选什么,乙方采取右的策略都比左的策略好,
可以得到1的收益。在期望乙方采取右的情况下,甲方应该采
取“下”,并得到2的收益。这样,支配性策略均衡为(下,
右)。
• 如果甲方比较慎重,考虑到乙方可能不一定理性,或者可能 故意捉弄甲方,则应该采取最大最小策略,形成(上,右) 的博弈结果。
甜 20,10 -8,-8
2.对社会有害的合作,设法制止
• 在囚徒的困境博弈中,如果两个囚徒可以互相协商, 并形成攻守同盟,则罪犯得到好处,对社会不利。 例如在寡头厂商的定价博弈中,勾结定高价对双方 都有好处,但对社会不利,因此受到反垄断法的严 密监控。
• 寡头厂商的价格博弈收益矩阵如下:
厂商2
高价
二.支配性策略dominant strategy均衡
• 支配性策略均衡也称上策均衡或优势策略均衡。在博弈中,对 有些参与者来说,不管对手采取什么策略,他的策略都保持不 变。这种不取决于对手选择的最优策略称为支配性策略(上策 或优势策略)。
公共政策学第七章知识点
第七章公共政策执行第一节公共政策执行的意义、特点与模型一、公共政策执行的含义、特点和作用(一)公共政策执行:政策执行主体为了实现公共政策目标,通过各种措施和手段作用于公共政策对象,使公共政策内容变为现实的行动过程。
(二)公共政策执行的特点1、目标的导向性;2、内容的务实性;3、行为的能动性(公共政策执行是构筑公共政策与现实生活的桥梁和纽带);4、手段的权威性。
(三)公共政策执行的作用1、公共政策执行是实现政策目标的重要途径。
2、公共政策执行是检验政策质量的唯一环节。
3、公共政策执行是制定后继政策的基本依据。
二、政策执行研究的发展路径政策执行研究经历了三代发展路径。
第一代政策执行研究路径被称为“向前推进策略”,即所谓的“自上而下”政策执行研究路径,又被称为“以政策为中心的途径”或“政策制定者透视”。
自上而下研究途径的最早主要代表人物是艾伦·维尔达夫斯基和杰弗里·普瑞斯曼。
第二代政策执行研究途径被称为“向后推进策略”,即所谓的“自下而上”政策执行研究路径。
是在对第一代政策执行研究进行批评和发展的基础上建立起来的,强调政策制定者与执行者之间的互动,认为政策制定者的核心任务不是设定政策执行的架构,而是提供一个充分自主的空间,给予基层官僚或地方执行机关更多的自由裁量权,使其能够采取适当的措施,建立起一个适应政策执行环境的政策执行过程。
我国台湾学者林永波(代表人物)将其称为“草根路径”。
第三代政策执行研究的整合路径,试图建立能够结合自上而下与自下而上模式的整合性概念架构。
其目的是界定解释政策执行为何会随着时空、政策、执行机关之不同而有所差异,因而可预测未来出现的政策执行类型。
三、基于中国经验的政策执行“上下来去”模型政策执行研究路径认为,在当代中国的政策实践中,政策主体在政策执行的过程中坚持实事求是、一切从实际出发的原则,并采用先做政策试点,即将政策进行局部实验,然后再全面推广的政策实验方式。
博弈论中的三个经济学模型
q2≥0
q2≥0
= maxq2[a-q1- q2 -c],
q2≥0
which yields
R2(q1) =
a- q1 -c 2
,
Provided q1< a – c. The same equation for
R2(q1) appeared in our analysis of the simultaneous -move Cournot game in Chapter 1. The difference
“重复剔除严格劣策略(iterated elimination of strictly dominated strategies)”的思路:
首先,找出某个参与人的严格劣策略,并 把它从他的策略空间中剔除,重新构造一个已 不包含该严格劣策略的博弈;
其次,剔除新博弈中某个参与人的严格劣 策略;
重复上述过程,直到只剩下唯一的策略组 合。 ——我们认为这个唯一所剩的策略组合是稳定 的。
b﹤2
思考:在Bertrand的模型中,如果两厂商的 产品是同质的,那么NE会是什么?
将是: P1*= p2*= c
Bertrand paradox
子博弈完美NE应用举例
(一)Stackelberg Mondel of Duopoly
Stackelberg(1934)proposed a dynamic model of duopoly in which a dominant(leader) firm moves first and a subordinate(or follower) firm moves second(比如在美国汽车产业发展史中的 某些阶段,通用汽车就扮演过这种领导者的角色, 只不过跟随者不只一个,如福特、克莱斯勒等). Following Stackelberg,we will develop the model under the assumption that the firms’ choose quantities, as in the Cournot model(where the fires’ choices are simultaneous,father than sequential as here ). P86
数学建模-博弈模型-2
的战略组合 s = ( s1 , L , si , L , sn ) ,收益函数 ui ( s1 ,L , si ,L , sn ) 均可取一个确定的值。 均可取一个确定的值。
由于混合战略是纯战略空间的一个概率分布, 由于混合战略是纯战略空间的一个概率分布, 合战略是纯战略空间的一个概率分布 这 就使得与参与者对战略选择的不确定性(随机性) 就使得与参与者对战略选择的不确定性(随机性)相 伴的是收益的不确定性。 概率论提供的平均意义上的 伴的是收益的不确定性。 期望值的概念可以用来衡量混合战略的效果, 构造期 期望值的概念可以用来衡量混合战略的效果, 望收益函数就可以比较两个不同混合战略的优劣。 望收益函数就可以比较两个不同混合战略的优劣。 设 p = ( p1 ,L , pn ) 是 一 个 混 合 战 略 组 合 , 其 中
为了区分,s 就称为纯战略。 为了区分 i 就称为纯战略。对完全信息静态博弈 来说, 来说, 一个参与者的纯战略就是他可以选择的一种特定 的行动。例如在猜硬币博弈中,每个人的战略空间 Si 的行动。例如在猜硬币博弈中, 中含有两个纯战略, 分别是“正面 正面”和 背面 一个参与 背面”。 中含有两个纯战略, 分别是 正面 和“背面 。 者的混合战略就是规定他以某种概率分布随机去选择 不同的行动。 例如在猜硬币博弈中, 不同的行动。 例如在猜硬币博弈中, 参与人 1 的一个混 为出正面的概率, 合战略是概率分布 ( p,1 − p) ,其中 p 为出正面的概率, 战略是概率分布 而且可以看到, 战略是概率分布 (q ,1 − q ) , 且 0 ≤ q ≤ 1 。而且可以看到, 混合战略( )表示参与人的一个纯战略,即选择“正 混合战略(1,0)表示参与人的一个纯战略,即选择 正 背面”的纯战 面”。类似地,混合战略(0,1)表示选择 背面 的纯战 。类似地,混合战略( )表示选择“背面 略。
博弈论的几个经典模型PPT课件
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
N
高成本
低成本
A
默许
阻挠
A
默许
阻挠
B
B
B
B
进入 不进入 进入 不进入 进入 不进入 进入 不进入
(50,40)(300,0)(0,-10)(300,0)(100,30)(400,0)(140,-10)(400,0)
*贝叶斯纳什均衡
模型二、囚徒困境/非合作博弈
有两个小偷A和B联合犯事、私入民宅被 警察抓住。警方将两人分别置于不同的两个 房间内进行审讯,对每一个犯罪嫌疑人,警 方给出的政策是:如果一个犯罪嫌疑人坦白 了罪行,交出了赃物,于是证据确凿,两人 都被判有罪。如果另一个犯罪嫌疑人也作了 坦白,则两人各被判刑8年;如果另一个犯罪 嫌人没有坦白而是抵赖,则以妨碍公务罪(因 已有证据表明其有罪)再加刑2年,而坦白者 有功被减刑8年,立即释放。如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪,但 可以私入民宅的罪名将两人各判入狱1年。
为个人)他自己的最好策略,还是采用(作为集 体的一员)他们共同的最好策略?前者导致均衡 策略(坦白,坦白),支付为(-8,-8);后者的最 好策略是(抵赖,抵赖),支付为(-1,-1)。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
四,杀鸡给猴看。其实猴子是没有思维的,它们 有一定的群体意识,但没有社会意识,人们关 于它们的故事其实是说人自己的。我们这里也 讲一个猴子的故事……。
寡头垄断企业的静态竞争及其博弈模型
R2 (q1 )
1 2
(a
q1
c)
类似地,如果q2<a-c,则企业1的最优反应为:
R1(q2 )
1 2
(a
q2
c)
以上两式分别是企业2对企业1产量q1的反应函数和企业1对企业2产量q2的 反应函数。在这里,反应函数表示的是每个企业的最优战略(产量)是另
一个企业产量的函数。
7
§ 7-1 寡头垄断企业的静态竞争及其博弈模型
2
§ 7-1 寡头垄断企业的静态竞争及其博弈模型
一、寡头垄断企业的静态竞争及其博弈原理
• 静态的或单时期的竞争模型:适用于仅持续一个较短 期限的市场,作为竞争对手的厂商是同时做出决策并只 竞争一次。 • 静态博弈,是指在博弈中,参与人同时选择行动,或 虽非同时但后行动者并不知道前行动者采取了什么具体 行动。 • 完全信息,是指每一个参与人对所有其他参与人的特 征、战略空间及其支付函数都具有准确的信息。
2. 伯特兰德悖论及其解释
伯特兰德均衡说明,只要市场上有两个或两个以上生产同样产品的企业, 则没有一个企业可以控制市场价格,获取垄断利润;超过边际成本的价 格不是均衡价格。而在现实市场上,企业间的价格竞争往往没有使均衡 价格降低到等于边际成本的水平上,而是高于边际成本。对于大多数产 业而言,即使只有两个竞争者,它们也能获得超额利润。这与伯特兰德 模型得出的结论是不一致的,被称为“伯特兰德悖论”。
各厂商对其他厂商产量的 反应函数:
1
n
qi
(a 2
qj
j i
c)
根据n个企业之间的对称性,可知q1*=q2*=…… =qn*成立,代入上式,得
q1* q2*
qn*
ac n 1
博弈论的几个经典模型课件
02
在这个模型中,如果双方都抵赖,则各自获得2年的监禁;如果双方都坦白,则 各自获得3年的监禁;如果一方坦白而另一方抵赖,则坦白的一方获得1年的监 禁,抵赖的一方获得10年的监禁。
03
囚徒困境反映了人类在有限理性和不完全信息下的决策问题。
囚徒困境的策略和最优解
01
02
03
在囚徒困境中,每个参 与者都有两种策略:坦
博弈论的发展趋势和应用前景
发展趋势
随着计算机科学的发展,博弈论在人工智能、机器学 习等领域的应用逐渐增多。同时,博弈论也在生物学 、环境科学、社会学等多个学科中得到广泛应用和发 展。未来,博弈论将继续探索更为复杂和现实的模型 ,以解释和预测更为复杂的行为和现象。
应用前景
博弈论在经济学、政治学、军事等领域有着广泛的应 用前景。例如,博弈论可以帮助理解国际贸易中的策 略行为、国际政治中的权力均衡以及军事战略中的最 优攻击策略等。此外,博弈论也在社交网络分析、市 场机制设计等领域展现出强大的应用潜力。
政治学中的应用
投票悖论
投票悖论是指在某些情况下,多数投票的结 果可能导致无法达成一致意见或产生不合理 的结果。在政治学中,投票悖论被用于探讨 民主制度的缺陷和改进方法。
权力均衡
权力均衡是一种政治博弈模型,它描述了政 治权力在多个参与者之间的分配和转移。在 政治学中,权力均衡被用于分析权力斗争、
政治制度稳定性和政策制定等问题。
纳什均衡模型被广泛应用于市场均衡、产业组织、公共经济学
等领域。
生物学
02
纳什均衡模型也被用于解释生物种群竞争、生态系统平衡等问
题。
社会学
03
纳什均衡模型可以用来分析社会现象,如犯罪、婚姻、教育等
第七章 博弈的三个模型2
博弈的多时期
• 伯特兰德模型假定两企业只竞争一次,当期的 决策不影响下期,也不受上一期的影响。因此, 厂商都希望自己的价格比对方低,从而获取当 期的最大利润。他们不会存在合作。但更普遍 的情况是,企业一般将在较长时期内存续。因 此,企业之间的博弈应该是多时期的。因为企 业是多时期博弈,既然p=c,他们都不能获取 经济利润。那么它们可能会采取合作行为,甚 至形成公开的卡特尔勾结,以获取一个正的经 济利润。因此,从长期来看,伯特兰德均衡将 有可能被合谋均衡所代替。
我们首先来看古诺模型的结果。在上述例子中,社会的 总产量Q=4;此时两家厂商的利润u1=u2=4,两厂商利润总和 为8;市场出清价格P=4。 我们再从另外一个角度来考察这个问题。如果两家厂商 联合起来像一个垄断者一样在市场上行动,以总体利益最大 化为目标来考虑市场的最佳产量,容易求出使得总得益最大 的总产量Q*=3,最大总得益u*=9。将此结果与两厂商独立决 策、只追求自身利益时的博弈结果相比,总产量较少,而总 利润较高。
斯坦克尔伯格模型
在动态竞争中,产业市场上的两个寡头往往一强一弱, 无论是决定产量还是制定价格,弱者往往跟在强者后面,观 察强者的实际行动,随后决定自己的策略。我们称先行动者 为领导者,而后行动者为跟随者。由于整个产业市场的大小 在一定时间内总是一定的,跟随者的加入,要改变整个产业 市场的供应,故对领导者的收益也是有影响的。所以领导者 在决定自己的策略时要充分考虑到跟随者可能有的策略,将 之包括到自己的最优化策略中,否则会造成两败俱伤。对产 业市场上这种行为的分析最早是由斯坦克尔伯格作出的,以 后就称此类市场竞争的模型为斯坦克尔伯格模型。
Байду номын сангаас 伯特兰德模型
古诺模型有力的解释了厂商间的数量均衡,但是市场价 格究竟是由谁来决定这个问题却没有得到说明。下面介 绍的模型解释假定厂商现在选取的决策变量不再是产量 而是价格时的博弈均衡。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我们首先来看古诺模型的结果。在上述例子中,社会的 总产量Q=4;此时两家厂商的利润u1=u2=4,两厂商利润总和 为8;市场出清价格P=4。 我们再从另外一个角度来考察这个问题。如果两家厂商 联合起来像一个垄断者一样在市场上行动,以总体利益最大 化为目标来考虑市场的最佳产量,容易求出使得总得益最大 的总产量Q*=3,最大总得益u*=9。将此结果与两厂商独立决 策、只追求自身利益时的博弈结果相比,总产量较少,而总 利润较高。
• • • • • • •
那么,企业1和企业2的利润π1和π2分别为: π1=(P-C)q1=(a-b(q1+q2)-c)q1 π2=(P-C)q2=(a-b(q1+q2)-c)q2 为实现利润最大化,一阶条件为: q1=(a-c)/2b-q2/2 (1) q2=(a-c)/2b-q1/2 (2) 从式(1)、(2)可以看到,企业1和企业2选择自己的利润最大的行动 必须依赖于对方的行为。我们把这种反映厂商间相互关系的方程 式成为最佳反应函数,更一般地表示为:qi=R(qj)。从(1)和(2)我 们可以求解得: • q*1=(a-c)/3b • 因为q*是实现两企业利润最大的产量。因此,他们都将生产q*, 而不会选择其他。因而,q*成为市场的均衡产量,一般称之为古 诺均衡。此时的均衡价格P*=(a+2c)/3。
结果分析:
这是两厂商根据自身利益最大化原则同时独立作出产量决策 的古诺模型均衡结果。这个结果有没有使两厂商真正实现自 身利益的最大化?从社会总体的角度来看效率又如何?
• 下面可以分析古诺均衡下的社会福利情况。因为市场的需求曲线是 P=a-bQ,因此,a是消费者愿意支付的最高价格。那么,我们有理由 相信a>c,否则,企业将不会选择生产,因为生产就意味着亏损。 我们从而得到:(a+2c)/3>c。这意味着,古诺模型中的均衡价格 P要高于完全竞争均衡中价格等于边际成本的水平。 • 但是,如果市场是完全垄断的话,从需求曲线得到边际收益MR为: • MR=a-2bQ • 那么,按照MC=MR得: • Q*=(a-c)/2b • 那么,P*=(a+c)/2 • 因为a>c,那么,(a+c)/2-(a+2c)/3=(a-c)/6>0 • 这意味着古诺均衡的价格要比垄断市场的价格低,但是比完全竞争 时的均衡价格要高。因此,古诺均衡的社会福利水平比垄断市场有 所改善,但不如完全竞争市场实现的福利,处于两者之间。
伯特兰德模型
古诺模型有力的解释了厂商间的数量均衡,但面介 绍的模型解释假定厂商现在选取的决策变量不再是产量 而是价格时的博弈均衡。
伯特兰德模型
• 伯川德模型假定: • (1)市场上只有两个厂商,企业A和企业B; • (2)产品同质,即两家厂商的产品完全相同。 那么,市场的总产量Q=qA+qB;
古诺模型
• 古诺模型是法国数学家奥古斯汀· 古 诺于1838年首先建立的。这是有关博弈 论思想的第一个较为成熟的模型。虽然 模型提出较早,但至今仍被广泛应用。 该模型最早用于分析双寡头垄断市 场,后来被应用于分析任意数量厂商的 市场均衡。我们先分析双寡头垄断市场 的古诺均衡。
• 古诺模型假定厂商独立行动,并首先选择产量作为决 策变量,以实现利润最大化。 • 为便于分析,古诺模型里还假定: • (1)市场上只有两个厂商,企业1和企业2,不会有别 的企业进入; • (2)产品同质,即两家厂商的产品完全相同。那么, 市场的总产量Q=q1+q2; • (3)厂商的成本只表现为变动成本,并且边际成本都 等于固定数量的C,即MC1=MC2=C; • (4)市场只存在一个时期,那么厂商之间的博弈也将 是单期的; • (5)市场的需求为P=a-bQ。
尽管双方都了解这种合作的好处,但如没有足够强制力, 这种合作是不可能实现的,即这个合作是不能自动实施的。
这里再次呈现集体非理性。但这个不合作的结果对 整个社会来说是有效率的,因为其增加了产量,降低了 价格。这也就是为什么传统的西方国家的产业规制政策 要严格限制垄断的原因。 古诺模型在现实中有很多例子。如在一个偏远的农 产品市场上的两大西瓜垄断种植商之间的产量竞争。另 一个很好的例子就是石油输出国组织(OPEC)的限额被突 破。
• 1、古诺均衡下的社会总产量,市场出清 价格是多少?利润总和是多少? • 2、若是二者联合垄断则收益最大时候的 产量是多少,最大收益是多少? • 3、若一个合作(产量为1.5),另一个则不 合作把自己的产量定在3--1.5/2的水平上 (1.5,1.5不是个纳什均衡 )会是什么结果。
• 1、 (Q=4), (P=4) • 2、 (Q=3) (R=9) • 3、U1=3.375;U2=5.06
古诺模型 问题 举例: 设在市场上有代号为1、2的两个寡头垄断厂商,他们
生产相同的产品,消费者从中察觉不出任何差异。市场出 清价格由两家厂商的总产量决定。设厂商1的产量为q1, 厂商2的产量为q2,则市场的总产量Q=q1+q2。设P为市场出 清价格,则P是市场总产量Q的函数,即反需求函数。在本 例中,我们假定反需求函数为:P=P(Q)=8-Q 。 再假设两厂商的生产都无固定成本,且每增加一单位 产量的边际生产成本相等,C1=C2=2,即他们分别生产q1和 q2产量的成本为2q1和2q2。最后,这两个厂商是同时决定各 自的产量以达到各自的利润最大化,即在决策前是不知道 另一方的产量的。