博弈论与寡头市场分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 例2:接头博弈。
• 参与人:马大哈和太马虎
• 行动策略:两人分处两地不能沟通。两人被告知到某地 见面,但都忘记了接头地点。现各自作出决定去哪儿见 面,假设有两地供选择,但只能做一次决定和去一个地 方。
• 结果:如他们相遇,则两人可共进午餐,否则只好怏怏 而归。
• 报酬:见面共进午餐,每人得到的效用为100,扫兴而归 的效用是-20。
二、“最大—最小值定理”(“Min-Max定理”)
假定有A和B两个厂商,当他们互相不了解对方将采取何种策略 时,为避免风险,必须谨慎行事,作最坏的打算,A先找出自己 收益矩阵中各种策略所能获得的最小收益,然后选择其中最大 的收益作为自己的最优策略;B也如此行事,但A的所得即B的所 失,因此B将从最大损失中选出最小的一个作为其最优的策略。
博弈论与寡头市场分析
• 第一节 博弈论基本概念 • 1.定义 • 博弈论或称对策论(Game Theory),直译为
游戏理论。现实生活中的游戏有两个基本特征: 一是至少有两人参加;二是参与人的决策相互 影响。如打扑克、下象棋顾客与商人的讨价还 价、寡头厂商之间的产量决策和价格决策等。 因此我们把具备上述两个特征的活动统称为博 弈。博弈论就是用数学方法研究决策相互影响 的理性人是如何进行决策以获取最大收益的。
• 本例中是把结果所带来的效用作为报酬,但没有 直接用数值表示。在这类结果不含数值的博弈中, 一般可通过指定效用值来规定报酬。
• 例3:疑犯博弈。
• 局中人:犯罪人邦德和詹尼;
• 行动策略:警局需要两人的口供作为证据,对 其隔离录供。每人面对两种选择,坦白或抵赖;
• 结果:一方坦白,另一方抵赖,则坦白方可获 释放,抵赖方则判刑10年;都坦白则各判8年; 都抵赖则各判1年。
• 合作博弈:局中人都希望行动或策略保持一致;
• 不合作博弈:局中人至少有一方希望行动或策略不一致。 一般说来,零和博弈一定是不合作博弈,但非零和博弈不 一定是合作博弈(如例3);是否为合作博弈要从愿望看。
• 静态博弈:局中人决策时彼此不知对方的决策的博弈,如 例2 ;
• 动态博弈:在信息交流畅通的情况下,决策时先后行动的 博弈,如例1;
• 例1:硬币博弈。
• 1)参与人:两个小孩甲 和乙;
• 2)行动或策略:甲乙两 人各往地上抛一个硬币, 甲先抛,乙后抛,要么反 面朝上,要么正面朝上;
• 3)结果:若硬币同为正 面或反面,甲赢得乙一个 硬币,若硬币一正一反, 则甲输给乙一个硬币;
• 4)报酬:一个一元硬币。
• 本例中每个参与人的输赢 可用货币值表示。但也并 非都是如此。
• 2.构成完整博弈过程 需要规定的四件事:
• 1)参与人或局中人。即 有哪些人参与博弈。
• 2)行动或策略。什么人 在什么时候行动;当他行 动时,他具有什么样的信 息;他能做什么,不能做 什么。
• 3)结果。对参与人的不 同行动,这场博弈的结果 或结局是什么。
• 4)报酬。博弈的结果给 参与人带来的好处。
• 报酬:以各自刑期的负数作为报酬。
• 本例中的博弈是一个非零和博弈,同时又是不 合作博弈,即两人为获释和不被判刑10年,都 将会出卖对方。
• 3.博弈的类型
• 零和博弈:博弈双方一人所得即另一人所失,博弈之和为0, 如例1;
• 非零和博弈:博弈双方一人所得与另一人所失之和不为0, 如例2和例3 ;是否为零和博弈要从结果看;
• 序贯博弈:即动态博弈。
• 4.博弈的描述方法
• 1)策略式描述:表述规定和定义
• 完全信息下的静态博弈的策略表述:用 支付矩阵形式直观表描述。
詹 坦白 尼
抵赖
邦德
坦白
抵赖
-8,-8
0,-10
-10,0
-1,-1
• 2)扩展式表述。表述规定:
• 如例1,甲乙两个小孩往地上抛硬币,甲先乙后, 若硬币同面,则甲赢得乙一个硬币,若硬币异面 则甲输给乙一个硬币。由此可给出该博弈的博弈 树:
1.5 3
B可能的收益表
A B B1
B2 B3
R A f A ( PA , PB )
A1 3
4
2
R B f B ( PB , PA )
A2 5 4.5 3
R A R B K (常数)
上述两表改为矩阵形式即称收益矩阵:
A
a11a12 a13 a 21a 22 a 23
பைடு நூலகம்B:“从最大损失中选取最小损失”(列)
Maxa i1 a 11 3 Maxa i 2 a 12 2 Maxa i 3 a 13 4 可选 Maxa i 2 a 12 2 为B的最佳策略
正 乙
正
反
甲
正
反
乙
反
1,-1
-1,1 -1,1 1,-1
第二节 零和(常数和)博奕
A可能的收益表
一、收益矩阵 设有厂商A、B为双头垄断, 各自的收益是彼此价格的 函数,市场需求为单一弹 性,因此不管对手采取何 种价格策略,其收益总是 恒等于一个常数。即
A B B1 A1 3
A2 1
B2 B3 24
3 1
2 1.5
4 3
B
b11b12 b13 b21b22 b23
342 5 4.5 3
A
B
a11 a 21
b11 a12 b21a 22
b12 a13 b13 b22 a23 b23
=
6 6
6 6
6 6
=6
1 1
1 1
1 1
即常数和矩阵。
上述常数和矩阵可变成零和矩阵,方法是从 任一收益矩阵中减去常数和加上另一矩阵:
3-6 2-6 4-6 3 4 2 1-6 1.5-6 3-6 + 5 4.5 4
=
-3 - 4 -2 -5 -4.5 -4
+342 5 4.5 4
=
0 0
0 0
0 0
当两人收益总和为零和矩阵时,叫两人零和对策.如果把A、B两 个厂商的收益看成是收益增量,则常数和对策就变成了零和对 策。因为既然市场需求为单一弹性,那么任一厂商收益的增加 就意味着竞争对方收益的减少,或A的收益矩阵即B的损失矩阵。
厂商Ⅰ的收益矩 阵
厂商Ⅰ可 能选择
的策略
厂商Ⅱ可能选择的策略
1
2
3
A
3百万元 2百万元 4百万元
B
1百万元 1.5百万元 3百万元
行的 最小值
2百万元 1百万元
列的 最大值 3百万元 2百万元 4百万元
A:“从最小收益中选取最大收益”(行)
Mina1 j a12 2
Mina2 j a21 1 可知 MaxMinaij a12 2 为A 的最佳策略