第九章 博弈论与寡头市场分析(微观经济学-南开大学,耿作石)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
乙
正 反 -1,1 正 1,-1
甲
反 乙
正
-1,1
1,-1
7
反
第二节 零和(常数和)博奕
A可能的收益表
A B B1 A1 3 B2 B3
2 4 一、收益矩阵 设有厂商A、B为双头垄断, A2 1 1.5 3 各自的收益是彼此价格的 函数,市场需求为单一弹 性,因此不管对手采取何 B可能的收益表 种价格策略,其收益总是 B B1 B2 B3 A 恒等于一个常数。即
10
厂商Ⅰ的收益矩 阵
厂商Ⅱ可能选择的策略 厂商Ⅰ可 能选择 1 2 3 的策略 A 3百万元 2百万元 4百万元 B 1百万元 1.5百万元 3百万元 列的 最大值 行的 最小值 2百万元 1百万元
3百万元
2百万元
4百万元
11
A:“从最小收益中选取最大收益”(行)
Mina1 j a12 2 Mina2 j a21 1
20
甲
L
甲
R
L'
甲 1
扩展式的三阶段博弈: 从第三阶段开始倒推,局中人 甲选择L″,获得收益为3;倒推 到第二阶段,局中人乙选择L’,
乙
2 0
乙
R'
甲
获得效益为1,因为他 预计甲会选择L″,他 若选R′收益将为0;
乙 1
甲
L"
3 0
乙
R"
பைடு நூலகம்
倒推到第一阶 段,局中人甲 选择L,收益为 2,他若选R收 益只能为1。 博弈的最终 0 结果:2和0
2
21
13
纳什均衡:博弈中双方都没有绝对的上策,一方 的最优策略取决于对方的选择。定义:P279 典型例子:如接头博弈。若马大哈去甲地,太马 虎的上策就是也去甲地,反之亦反。 博弈中甲和乙的选择必须相同。 不存在纳什均衡的博弈:如例1的硬币博弈。此 类博弈中也都没有绝对的上策,其上策的选择也 取决于对方的选择,但这一博弈中不存在以上定 义的纳什均衡。因为若甲选择正面,乙的上策就 是选择反面(异面乙赢);但给定乙选择反面, 甲的上策选择就是反面(同面甲赢)。 博弈中甲和乙的选择相同,但乙和甲的选择并不 相同。 纳什均衡与上策均衡的概念比较,定义:P280。
5
4.博弈的描述方法 1)策略式描述:表述规定和定义,P276; 完全信息下的静态博弈的策略表述:用支付矩 阵形式直观表描述。
邦德
坦白 抵赖 坦白
詹 尼
-8,-8 -10,0
0,-10 -1,-1
6
抵赖
2)扩展式表述。表述规定,P277。 如例1,甲乙两个小孩往地上抛硬币,甲先乙后, 若硬币同面,则甲赢得乙一个硬币,若硬币异面 则甲输给乙一个硬币。由此可给出该博弈的博弈 树:
第三节 纳什均衡与寡头竞争 一、上策均衡与纳什均衡 上策均衡:上策均衡就是指由于每一个局中人 都有上策可用而仅仅使用这一策略的状况。 如在疑犯博弈中,上策和下策区分明显,无论 对方选择坦白还是抵赖,另一方的上策都是选 择坦白。因为对方坦白时,自己坦白虽然会判 8年徒刑,但选择抵赖将意味着10年的铁窗, 所以,两害相权取其轻,抵赖绝对是下策,两 人都不会选择这一策略。因材施教,不管对方 选择什么策略,己方都能以不变应万变,自己 的上策都是选择坦白。P276
14
二、寡头市场的纳什均衡。
寡头垄断市场的定价和定产的情形与那什均衡类似。对所 有生产者来说,最佳情况是在串谋或联合时实现利润最大 化。但这种情况是不稳定的,因为双方都想以降低价格和 增加产量来增加利润。当参加博弈的双方都这样做时,实 际上也就实现了那什均衡。 在寡头市场中,一个厂商的定价和定产要考虑其竞争对手 的策略性行为,因此,各个厂商需要在假定其竞争者的行 为以后才能作出其最佳选择。由于厂商会很自然地假定其 竞争对手也会在给定该厂商的行为后采取最好的行动,因 而我们假定各厂商考虑其竞争者,而其竞争者也将会这么 做。联系前面那什均衡的概念,不难看出寡头市场的均衡 实际上是一个那什均衡。 寡头市场可以有价格假定和产量假定两种那什均衡的情况。
15
例如:有甲和乙两个生产者,他们在产 品价格竞争过程中面临以下选择: 甲和乙都不降价:每家赢利800万。 甲和乙都降价10%:每家赢利600万。 甲降价乙不降价:甲赢利1000万,乙赢 利500万。 乙降价甲不降价:乙赢利1000万,甲赢 利500万。 由此可得甲乙两厂商彼此同时行动的静 态博弈的收益矩阵图示:
本例中是把结果所带来的效用作为报酬,但没有 直接用数值表示。在这类结果不含数值的博弈中, 一般可通过指定效用值来规定报酬。
3
例3:疑犯博弈。 局中人:犯罪人邦德和詹尼; 行动策略:警局需要两人的口供作为证据,对 其隔离录供。每人面对两种选择,坦白或抵赖; 结果:一方坦白,另一方抵赖,则坦白方可获 释放,抵赖方则判刑10年;都坦白则各判8年; 都抵赖则各判1年。 报酬:以各自刑期的负数作为报酬。 本例中的博弈是一个非零和博弈,同时又是不 合作博弈,即两人为获释和不被判刑10年,都 将会出卖对方。
2
例2:接头博弈。
参与人:马大哈和太马虎 行动策略:两人分处两地不能沟通。两人被告知到某地 见面,但都忘记了接头地点。现各自作出决定去哪儿见 面,假设有两地供选择,但只能做一次决定和去一个地 方。 结果:如他们相遇,则两人可共进午餐,否则只好怏怏 而归。 报酬:见面共进午餐,每人得到的效用为100,扫兴而归 的效用是-20。
=
6 6 6 6 6 6
=6
1 1
1 1
1 1
9
即常数和矩阵。
上述常数和矩阵可变成零和矩阵,方法是从 任一收益矩阵中减去常数和加上另一矩阵:
3-6 2-6 4-6 3 4 2 -3 4 -2 + + 3 4 2 = 0 0 0 = 1-6 1.5-6 3-6 5 4.5 4 -5 -4.5 -4 5 4.5 4 0 0 0
R A f A ( PA , PB ) RB f B ( PB , PA ) R A RB K(常数)
A1
A2
3
5
4
4.5
2
3
8
上述两表改为矩阵形式即称收益矩阵:
a11a12 a13 3 2 4 A a a a 1 1.5 3 21 22 23 b11b12b13 3 4 2 B 5 4.5 3 b b b 21 22 23 a11 b11a12 b12 a13 b13 A B a b a b a b 21 22 22 23 23 21
当两人收益总和为零和矩阵时,叫两人零和对策.如果把A、B两 个厂商的收益看成是收益增量,则常数和对策就变成了零和对 策。因为既然市场需求为单一弹性,那么任一厂商收益的增加 就意味着竞争对方收益的减少,或A的收益矩阵即B的损失矩阵。 二、“最大—最小值定理”(“Min-Max定理”) 假定有A和B两个厂商,当他们互相不了解对方将采取何种策略 时,为避免风险,必须谨慎行事,作最坏的打算,A先找出自己 收益矩阵中各种策略所能获得的最小收益,然后选择其中最大 的收益作为自己的最优策略;B也如此行事,但A的所得即B的所 失,因此B将从最大损失中选出最小的一个作为其最优的策略。
17
三、寡头市场中的古诺模型 1)两厂商在竞争时的均衡产量与利润;
总产量为:
均衡价格为:
2 Q q1 q2 a 3 1 P a Q a 3
2)两厂商在串通时的均衡产量与利润;
TR PQ (a Q)Q aQ Q MR R / Q a 2Q
1
2.构成完整博弈过程 需要规定的四件事:
1)参与人或局中人。即 有哪些人参与博弈。 2)行动或策略。什么人 在什么时候行动;当他行 动时,他具有什么样的信 息;他能做什么,不能做 什么。 3)结果。对参与人的不 同行动,这场博弈的结果 或结局是什么。 4)报酬。博弈的结果给 参与人带来的好处。
例1:硬币博弈。
1)参与人:两个小孩甲 和乙; 2)行动或策略:甲乙两 人各往地上抛一个硬币, 甲先抛,乙后抛,要么反 面朝上,要么正面朝上; 3)结果:若硬币同为正 面或反面,甲赢得乙一个 硬币,若硬币一正一反, 则甲输给乙一个硬币; 4)报酬:一个一元硬币。 本例中每个参与人的输赢 可用货币值表示。但也并 非都是如此。
令
2
MR 0
可得到
1 Q a 时利润最大。 2
18
产 量
古诺双头垄断的均衡
厂商Ⅱ的反应函数
1 a 竞争: q1 q2 3 1 a 串通: q1 q2 4
古诺均衡
串通的契约曲线
厂商Ⅰ的反应函数
O
1 1 1 2 a a a a 4 3 2 3
a
产量
19
第四节
动态博弈与先行者优势
一、逆向归纳法求解纳什均衡。例:P286。 逆向归纳法求解的方法是求解动态博弈的基本方 法。具体地说,它是从最后行动的局中人的选择 入手考察其最优的选择是什么,然后,给定这一 选择,比他先行一步的局中人考虑到他的这一最 优选择后,再作出自己的最优选择,如此类推, 直到第一个行动的局中人作出选择。 下例为只考察两阶段的动态博弈,即局中人甲先 行动,局中人乙后行动且行动后博弈就结束。
第九章 博弈论与寡头市场分析
第一节 博弈论基本概念 1.定义 博弈论或称对策论(Game Theory),直译为 游戏理论。现实生活中的游戏有两个基本特征: 一是至少有两人参加;二是参与人的决策相互 影响。如打扑克、下象棋顾客与商人的讨价还 价、寡头厂商之间的产量决策和价格决策等。 因此我们把具备上述两个特征的活动统称为博 弈。博弈论就是用数学方法研究决策相互影响 的理性人是如何进行决策以获取最大收益的。
16
生产者甲
降价10% 价格不变
生 降价10% 产 甲赢利1000万 者 乙 价格不变 乙赢利500万
每家赢利 为600万
甲赢利500万 乙赢利1000万 每家赢利 为800万
对于甲和乙来说,最优情况是价格都不变,但都为 单独降价后1000万的预期利润所吸引,于是都降价 10%,结果是都获得600万的利润。实现那什均衡。 厂商甲和乙价格博弈的支付矩阵
4
3.博弈的类型
零和博弈:博弈双方一人所得即另一人所失,博弈之和为0, 如例1; 非零和博弈:博弈双方一人所得与另一人所失之和不为0, 如例2和例3 ;是否为零和博弈要从结果看; 合作博弈:局中人都希望行动或策略保持一致; 不合作博弈:局中人至少有一方希望行动或策略不一致。 一般说来,零和博弈一定是不合作博弈,但非零和博弈不 一定是合作博弈(如例3);是否为合作博弈要从愿望看。 静态博弈:局中人决策时彼此不知对方的决策的博弈,如 例2 ; 动态博弈:在信息交流畅通的情况下,决策时先后行动的 博弈,如例1; 序贯博弈:即动态博弈。
可知
MaxMina ij a12 2
为A 的最佳策略
B:“从最大损失中选取最小损失”(列)
Maxai1 a11 3 Maxai 2 a12 2 Maxai 3 a13 4
可选
Maxai 2 a12 2
为B的最佳策略
A的最优策略所获得的收益恰好等于B的最优策略所 遭受的损失,博奕结果为2,被称为对策解或均衡解。 12
正 反 -1,1 正 1,-1
甲
反 乙
正
-1,1
1,-1
7
反
第二节 零和(常数和)博奕
A可能的收益表
A B B1 A1 3 B2 B3
2 4 一、收益矩阵 设有厂商A、B为双头垄断, A2 1 1.5 3 各自的收益是彼此价格的 函数,市场需求为单一弹 性,因此不管对手采取何 B可能的收益表 种价格策略,其收益总是 B B1 B2 B3 A 恒等于一个常数。即
10
厂商Ⅰ的收益矩 阵
厂商Ⅱ可能选择的策略 厂商Ⅰ可 能选择 1 2 3 的策略 A 3百万元 2百万元 4百万元 B 1百万元 1.5百万元 3百万元 列的 最大值 行的 最小值 2百万元 1百万元
3百万元
2百万元
4百万元
11
A:“从最小收益中选取最大收益”(行)
Mina1 j a12 2 Mina2 j a21 1
20
甲
L
甲
R
L'
甲 1
扩展式的三阶段博弈: 从第三阶段开始倒推,局中人 甲选择L″,获得收益为3;倒推 到第二阶段,局中人乙选择L’,
乙
2 0
乙
R'
甲
获得效益为1,因为他 预计甲会选择L″,他 若选R′收益将为0;
乙 1
甲
L"
3 0
乙
R"
பைடு நூலகம்
倒推到第一阶 段,局中人甲 选择L,收益为 2,他若选R收 益只能为1。 博弈的最终 0 结果:2和0
2
21
13
纳什均衡:博弈中双方都没有绝对的上策,一方 的最优策略取决于对方的选择。定义:P279 典型例子:如接头博弈。若马大哈去甲地,太马 虎的上策就是也去甲地,反之亦反。 博弈中甲和乙的选择必须相同。 不存在纳什均衡的博弈:如例1的硬币博弈。此 类博弈中也都没有绝对的上策,其上策的选择也 取决于对方的选择,但这一博弈中不存在以上定 义的纳什均衡。因为若甲选择正面,乙的上策就 是选择反面(异面乙赢);但给定乙选择反面, 甲的上策选择就是反面(同面甲赢)。 博弈中甲和乙的选择相同,但乙和甲的选择并不 相同。 纳什均衡与上策均衡的概念比较,定义:P280。
5
4.博弈的描述方法 1)策略式描述:表述规定和定义,P276; 完全信息下的静态博弈的策略表述:用支付矩 阵形式直观表描述。
邦德
坦白 抵赖 坦白
詹 尼
-8,-8 -10,0
0,-10 -1,-1
6
抵赖
2)扩展式表述。表述规定,P277。 如例1,甲乙两个小孩往地上抛硬币,甲先乙后, 若硬币同面,则甲赢得乙一个硬币,若硬币异面 则甲输给乙一个硬币。由此可给出该博弈的博弈 树:
第三节 纳什均衡与寡头竞争 一、上策均衡与纳什均衡 上策均衡:上策均衡就是指由于每一个局中人 都有上策可用而仅仅使用这一策略的状况。 如在疑犯博弈中,上策和下策区分明显,无论 对方选择坦白还是抵赖,另一方的上策都是选 择坦白。因为对方坦白时,自己坦白虽然会判 8年徒刑,但选择抵赖将意味着10年的铁窗, 所以,两害相权取其轻,抵赖绝对是下策,两 人都不会选择这一策略。因材施教,不管对方 选择什么策略,己方都能以不变应万变,自己 的上策都是选择坦白。P276
14
二、寡头市场的纳什均衡。
寡头垄断市场的定价和定产的情形与那什均衡类似。对所 有生产者来说,最佳情况是在串谋或联合时实现利润最大 化。但这种情况是不稳定的,因为双方都想以降低价格和 增加产量来增加利润。当参加博弈的双方都这样做时,实 际上也就实现了那什均衡。 在寡头市场中,一个厂商的定价和定产要考虑其竞争对手 的策略性行为,因此,各个厂商需要在假定其竞争者的行 为以后才能作出其最佳选择。由于厂商会很自然地假定其 竞争对手也会在给定该厂商的行为后采取最好的行动,因 而我们假定各厂商考虑其竞争者,而其竞争者也将会这么 做。联系前面那什均衡的概念,不难看出寡头市场的均衡 实际上是一个那什均衡。 寡头市场可以有价格假定和产量假定两种那什均衡的情况。
15
例如:有甲和乙两个生产者,他们在产 品价格竞争过程中面临以下选择: 甲和乙都不降价:每家赢利800万。 甲和乙都降价10%:每家赢利600万。 甲降价乙不降价:甲赢利1000万,乙赢 利500万。 乙降价甲不降价:乙赢利1000万,甲赢 利500万。 由此可得甲乙两厂商彼此同时行动的静 态博弈的收益矩阵图示:
本例中是把结果所带来的效用作为报酬,但没有 直接用数值表示。在这类结果不含数值的博弈中, 一般可通过指定效用值来规定报酬。
3
例3:疑犯博弈。 局中人:犯罪人邦德和詹尼; 行动策略:警局需要两人的口供作为证据,对 其隔离录供。每人面对两种选择,坦白或抵赖; 结果:一方坦白,另一方抵赖,则坦白方可获 释放,抵赖方则判刑10年;都坦白则各判8年; 都抵赖则各判1年。 报酬:以各自刑期的负数作为报酬。 本例中的博弈是一个非零和博弈,同时又是不 合作博弈,即两人为获释和不被判刑10年,都 将会出卖对方。
2
例2:接头博弈。
参与人:马大哈和太马虎 行动策略:两人分处两地不能沟通。两人被告知到某地 见面,但都忘记了接头地点。现各自作出决定去哪儿见 面,假设有两地供选择,但只能做一次决定和去一个地 方。 结果:如他们相遇,则两人可共进午餐,否则只好怏怏 而归。 报酬:见面共进午餐,每人得到的效用为100,扫兴而归 的效用是-20。
=
6 6 6 6 6 6
=6
1 1
1 1
1 1
9
即常数和矩阵。
上述常数和矩阵可变成零和矩阵,方法是从 任一收益矩阵中减去常数和加上另一矩阵:
3-6 2-6 4-6 3 4 2 -3 4 -2 + + 3 4 2 = 0 0 0 = 1-6 1.5-6 3-6 5 4.5 4 -5 -4.5 -4 5 4.5 4 0 0 0
R A f A ( PA , PB ) RB f B ( PB , PA ) R A RB K(常数)
A1
A2
3
5
4
4.5
2
3
8
上述两表改为矩阵形式即称收益矩阵:
a11a12 a13 3 2 4 A a a a 1 1.5 3 21 22 23 b11b12b13 3 4 2 B 5 4.5 3 b b b 21 22 23 a11 b11a12 b12 a13 b13 A B a b a b a b 21 22 22 23 23 21
当两人收益总和为零和矩阵时,叫两人零和对策.如果把A、B两 个厂商的收益看成是收益增量,则常数和对策就变成了零和对 策。因为既然市场需求为单一弹性,那么任一厂商收益的增加 就意味着竞争对方收益的减少,或A的收益矩阵即B的损失矩阵。 二、“最大—最小值定理”(“Min-Max定理”) 假定有A和B两个厂商,当他们互相不了解对方将采取何种策略 时,为避免风险,必须谨慎行事,作最坏的打算,A先找出自己 收益矩阵中各种策略所能获得的最小收益,然后选择其中最大 的收益作为自己的最优策略;B也如此行事,但A的所得即B的所 失,因此B将从最大损失中选出最小的一个作为其最优的策略。
17
三、寡头市场中的古诺模型 1)两厂商在竞争时的均衡产量与利润;
总产量为:
均衡价格为:
2 Q q1 q2 a 3 1 P a Q a 3
2)两厂商在串通时的均衡产量与利润;
TR PQ (a Q)Q aQ Q MR R / Q a 2Q
1
2.构成完整博弈过程 需要规定的四件事:
1)参与人或局中人。即 有哪些人参与博弈。 2)行动或策略。什么人 在什么时候行动;当他行 动时,他具有什么样的信 息;他能做什么,不能做 什么。 3)结果。对参与人的不 同行动,这场博弈的结果 或结局是什么。 4)报酬。博弈的结果给 参与人带来的好处。
例1:硬币博弈。
1)参与人:两个小孩甲 和乙; 2)行动或策略:甲乙两 人各往地上抛一个硬币, 甲先抛,乙后抛,要么反 面朝上,要么正面朝上; 3)结果:若硬币同为正 面或反面,甲赢得乙一个 硬币,若硬币一正一反, 则甲输给乙一个硬币; 4)报酬:一个一元硬币。 本例中每个参与人的输赢 可用货币值表示。但也并 非都是如此。
令
2
MR 0
可得到
1 Q a 时利润最大。 2
18
产 量
古诺双头垄断的均衡
厂商Ⅱ的反应函数
1 a 竞争: q1 q2 3 1 a 串通: q1 q2 4
古诺均衡
串通的契约曲线
厂商Ⅰ的反应函数
O
1 1 1 2 a a a a 4 3 2 3
a
产量
19
第四节
动态博弈与先行者优势
一、逆向归纳法求解纳什均衡。例:P286。 逆向归纳法求解的方法是求解动态博弈的基本方 法。具体地说,它是从最后行动的局中人的选择 入手考察其最优的选择是什么,然后,给定这一 选择,比他先行一步的局中人考虑到他的这一最 优选择后,再作出自己的最优选择,如此类推, 直到第一个行动的局中人作出选择。 下例为只考察两阶段的动态博弈,即局中人甲先 行动,局中人乙后行动且行动后博弈就结束。
第九章 博弈论与寡头市场分析
第一节 博弈论基本概念 1.定义 博弈论或称对策论(Game Theory),直译为 游戏理论。现实生活中的游戏有两个基本特征: 一是至少有两人参加;二是参与人的决策相互 影响。如打扑克、下象棋顾客与商人的讨价还 价、寡头厂商之间的产量决策和价格决策等。 因此我们把具备上述两个特征的活动统称为博 弈。博弈论就是用数学方法研究决策相互影响 的理性人是如何进行决策以获取最大收益的。
16
生产者甲
降价10% 价格不变
生 降价10% 产 甲赢利1000万 者 乙 价格不变 乙赢利500万
每家赢利 为600万
甲赢利500万 乙赢利1000万 每家赢利 为800万
对于甲和乙来说,最优情况是价格都不变,但都为 单独降价后1000万的预期利润所吸引,于是都降价 10%,结果是都获得600万的利润。实现那什均衡。 厂商甲和乙价格博弈的支付矩阵
4
3.博弈的类型
零和博弈:博弈双方一人所得即另一人所失,博弈之和为0, 如例1; 非零和博弈:博弈双方一人所得与另一人所失之和不为0, 如例2和例3 ;是否为零和博弈要从结果看; 合作博弈:局中人都希望行动或策略保持一致; 不合作博弈:局中人至少有一方希望行动或策略不一致。 一般说来,零和博弈一定是不合作博弈,但非零和博弈不 一定是合作博弈(如例3);是否为合作博弈要从愿望看。 静态博弈:局中人决策时彼此不知对方的决策的博弈,如 例2 ; 动态博弈:在信息交流畅通的情况下,决策时先后行动的 博弈,如例1; 序贯博弈:即动态博弈。
可知
MaxMina ij a12 2
为A 的最佳策略
B:“从最大损失中选取最小损失”(列)
Maxai1 a11 3 Maxai 2 a12 2 Maxai 3 a13 4
可选
Maxai 2 a12 2
为B的最佳策略
A的最优策略所获得的收益恰好等于B的最优策略所 遭受的损失,博奕结果为2,被称为对策解或均衡解。 12