第十章 博弈论的理论与方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2005年,奥曼(R· Aumann)和谢林 J· (T· Schelling)获诺奖。 C·
5
3、博弈的不同类型
博弈分类及对应的均衡概念
行动顺
序 信息 完全信息 静态 动态
完全信息静态博弈 完全信息动态博弈 纳什均衡(NE) 子博弈精炼(NE)
不完全信息静态博 不完全信息动态博 弈贝叶斯(NE) 弈精炼贝叶斯(NE)
12
因为:
a11 b11 a12 b12 100 100 1 1 A B a b a b 100 100 1001 1 21 21 22 22
所以:
100 50 100 100 50 0 B A B A 100 80 100 120 20 20
8
由于两家寡头垄断厂商共同面临着一个 需求的价格弹性为一( Ed 1)的市场需求 曲线,因此,无论它们各自采取何种价格策 略,两家寡头垄断厂商的总收益均等于一个 常数,即: TR f ( P , P )
A A A B
TRB f B ( PB , PA ) TR TRA TRB K
23
§3 最优混合策略模型
(OPTIMUN MIXED STRATEGY)
在最优混合策略的博弈模型 中,单纯策略的选择结果,支付 矩阵中不存在着“鞍点”,这时, 博弈双方需要采用最优混合策略, 才能得到最大收益的数学期望值。
24
现在设在一个由两家寡头垄断厂商 构成的常数和博弈模型中,厂商A和厂 商B各自的支付矩阵如下:
主讲教师 史晋川 2008.4
教授
1
第十章 博弈论的理论与方法
§1 博弈论的理论与发展 1.定义与问题 博弈论(Game Theory),亦译“对策 论”、“赛局理论”,从英文字面直译也 可做“游戏”(Game)的理论理解。 从简明的定义看: 博弈论是关于策略相互作用的理论, 研究对象是人与人之间“斗智”的方式和 结果。
27
在这种情形下,厂商A若知道厂商B将 采用B2,则厂商A将会采用A2,这样厂商A将 得到a22=30>a21=20的收益。但是,一旦厂 商B发现厂商A采用A2,它就会改变策略采用 B1 ,使厂商A的收益降至a21=20。同样,厂 商A一旦发现厂商B采用B1,也会改变策略采 用A1,使自己的收益增至为a11=40。当厂商 B一旦发现厂商A采用A1,它又会改变策略采 用B2 ,使厂商A的收益降至a12=10,…两家 寡头垄断厂的这种价格策略选择过程中的 “斗智”将会一直不断地持续下去,因此, 博弈的解是极其不确定的。
min a1j=a12=10 j min a2j=a21=20 j max min aij=a21=20 i j
26
同样,如果厂商B也根据“极小—极大 定理”来确定其所选择的价格策略,则有: max ai1=a11=40 i max ai2=a22=30 i min max aij=a22=30 j i 由此可见,在上述博弈模型中,并 不存在任何“鞍点”,即: max min aij≠min max aij j i
min bi1=b21=20 i min bi2=b22=-20 i max min bij=b21=20 j i
19
由于在常数和博弈模型中,厂商A的得 益即为厂商B的损失,所以,也可以直接利 用厂商A的支付矩阵来分析厂商B的选择行为。 因此,如果厂商B采用价格策略B1,厂商B的 最大损失为80(也即厂商A的最大收益为 80);若厂商B采用B2 这种价格策略,此时 厂商B的最大损失将为120(即厂商A的最大 收益为120)。为了从可以选择的策略所可 能产生的最大损失中选择最小的损失,厂商 B将会选择价格策略B1。
a11 a12 40 A a 20 21 a 22 b11 b12 10 B b 30 21 b22
10 30 40 20
25
如果厂商A根据“极小—极大定理” 来确定其所选择的价格策略,则有:
30
(当厂商B同时采用策略B2 时)
最优混合策略的博弈模型中,无论支付 矩阵中的列数(即厂商B可以选择的策略数 目)是多少,只要支付矩阵的行数(即厂商 A可以选择的策略数目)是两行,就可以利 用图解法来找到厂商收益的极大—极小值及 其最优混合策略。在上述例子中,设厂商A 的最优混合策略为:以概率ρa采用策略A1, 以概率(1-ρa )采用策略A2 ,则在厂商B同 时相应采用策略B1,或者策略B2时,厂商A的 预期收益为:
3
2、博弈论的发展
(1)博弈论产生于30-50年代 A、1944年,冯· 诺依曼、摩根斯坦恩合作发 表《博弈论与经济行为》,将博弈论引入 关于经济不确定性分析(预期效用概念), 是博弈论正式诞生的标志; B、1950年代初,普林斯顿大学数学系在塔 克教授指导下,形成了一个博弈论研究的 博士生小组,从“囚徒困境”分析中创立 了“纳什均衡”,奠定了现代博弈论基础。
50 0 50 0 0 0 20 20 20 20 0 0
15
两人零和博弈中的零和矩阵表明,
在市场的需求的价格弹性为一,两家厂
商的总收益之和为常数时,无论寡头垄 断厂商采用何种价格策略,一家寡头垄 断厂商的得益,相应地也就是另一家寡 头垄断厂商的损失。
2
从经济活动角度看: 博弈论研究的是经济主体行为方式之 间的相互依存,相互影响,相互作用及其 所产生的各种相应的结果。 例:传统Micro研究效用(函数)最 大化,生产(函数)最大化,主要涉及人 与物(商品、生产要素)的关系,与博弈 论无关。 但是,当经济研究涉及人与人(企业 与企业)的关系时,例如厂商的价格战, 博弈论就成了一个有用的分析工具。
31
TR1 a
40 1 a 20a 20 ( 1 ) 20 10 1 a 30 20a 30
(Two-person Constant-sum Game)
利用博弈论来分析寡头垄断厂商行为的 基本方法是先构造出一个支付表或者支付矩 阵,以表明寡头垄断厂商可能采用的各种不 同的策略以及这些策略的组合和相应的结果。 假设A和B为两家寡头垄断的厂商,它们各自 的总收益不仅是自己所制定的产品价格的函 数,同样也是对方所制定的产品价格的函数。
20
这种“从最大损失中选择最小损失”的 厂商博弈行为,用数学形式表达为:
max ai1=a21=80 i max ai2=a22=120 i min max aij=a21=80 j i
21
将上述厂商A的“从最小收益中选择 最大收益”的行为和厂商B“从最大损失 中选择最小损失”的行为结合起来加以 分析,则有:
6
不完全信息
4、博弈模型的基本要素
① 故事 ② 模型
Y
Y 甲:5 乙:5 乙 甲:0.5 N 乙:10
甲
N
甲:10 乙:0.5 甲:2 乙:2
Leabharlann Baidu
Ⅰ :局中人---博弈的参与者; Ⅱ :策略---行动方案 Ⅲ :支付---收益或效用; Ⅳ :信息结构---参与 者对Ⅰ、Ⅱ、Ⅲ的了解
7
§2 两人常数和博弈模型
a22=120
10
a11=50
a21=80
厂商B的支付表
B B1 B2
A
A1 A2
b11=50
b21=20
b12=0
b22=-20
11
上述支付表也可以改写为下列支付 矩阵的形式:
a11 a12 50 100 A a 80 120 21 a 22 b11 b12 50 0 B b b 20 20 21 22
4
(2)博弈论在60-80年代迅速发展,90年代形成 一个大的高潮。 博弈论本身迅速发展,大规模进入经济分 析领域,又进入社会、政治、军事、国际关系 研究领域,显示出极强的解释力,应用领域急 剧扩张。 1994 年 , 博 弈 论 主 要 代 表 人 物 纳 什 (Nash)、豪尔绍尼(Harsanyi)、泽尔滕(Selten) 获诺奖。
28
厂商为了避免采用单纯策略(即或者
是A1或者是A2)而造成的博弈过程中的不利
局面,可以放弃单纯策略的选择方法,改
为采用混合策略来更好地获取收益。以厂
2 商A为例,如果厂商A现在转而以 的概率 3 1 采用策略A1,以 的概率采用策略A2,那 3
么,根据上述厂商A采用A1 和A2的两种概率
分布,厂商A在博弈中的预期收益为:
13
以上的矩阵运算表明,只要我们知
道其中一个厂商的支付矩阵和常数和,
就可以通过运算得知另一个厂商的支付 矩阵。同时,只要从任一支付矩阵或厂 商的总收益之和中减去常数和,就可以
将常数和支付矩阵转变为零和矩阵,即:
14
50 100 100 100 50 0 A A B B 80 100 120 100 20 20
29
2 1 TR1 40 20 100 / 3 3 3
(当厂商B同时采用策略B1时)
2 1 TR2 10 30 50 / 3 3 3
当然,厂商B在此种情形下也可能采用 混合策略来减少自身的损失,如果这样的话, 厂商A在每次博弈中的预期收益将在100/3与 50/3之间。
16
面临上述支付矩阵的情形下,如果寡头垄断厂 商A是一个在决策时非常谨慎的风险回避者,就会注 意到对于自己的两种可能选择的价格策略中的任一 种策略的采用,都将可能出现的最糟糕的结局(即 收益最小的结局)。也就是说,如果寡头垄断厂商A 采用A1 ,当B采用B1 价格策略时,此时A所能获得的 最小收益是TRA=a11=50;如果A采用A2,B仍采用B1价 格 策 略 时 , A 所 能 获 得 的 最 小 收 益 为 80 (TRA=a21=80)。因而,厂商A在采用A1 和A2 这两种 价格策略所产生的最糟糕的结果中,相比较而言, 最好的结果还是TRA=a21=80,厂商A将会把价格策略 A2作为自己的最优选择。
max min aij= min max aij=a21=80 i j j i 这一博弈论模型的分析结论表明, 厂商A和厂商B都一致地选择了它们各自 的价格策略的组合a21(或者b21),结果 产生了一个稳定的博弈解或者均衡解。
22
因为,此时a21=80,既不是厂商A的最大收 益(或者厂商B的最大损失),也不是厂商A的 最小收益(或者厂商B的最小损失)。在博弈论 中,这一博弈的均衡解被称为 “纳什均衡” ( Nash Eguilibrium ) 或 被 称 为 “ 鞍 点 ” (Saddle Point)。所谓“鞍点”,就是博弈所 具有的确定的解。存在“鞍点”的博弈,也被 称 为 严 格 确 定 的 博 弈 ( Strictly Determined Game)。相应地,求解“鞍点”的方法在博弈 论模型中被称为“极小—极大定理”(Min— Max Theorem)。
17
这种厂商的策略选择行为,在博弈论 中称为“从最小收益中选择最大收益 (Maximize the Minimun Payoffs)”,其数 学表达式形式为:
min a1j=a11=50 j min a2j=a21=80 j max min aij=a21=80 i j
18
同样,对于寡头垄断厂商B来说,如果 它也是一个在决策中非常谨慎的风险回避 者,也会在自己所选择的价格策略可能产 生的最糟糕的结果中,选择相对而言能产 生较好结果的价格策略,即:
根据上述假定的条件建立起来的寡头 垄断厂商的博弈论模型,称之为“两人常 数和博弈模型”。
9
现假定厂商A和厂商B都有两个可供选择的价格策略,分别 作A1、A2和B1、B2。据此,厂商A和厂商B所选择的各种价格策略 合及其各自的总收益如以下支付表所示。
厂商A的支付表
B
B1
A A1 A2
B2 a12=100