十章博弈论课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
无新品
无新品 4 ,
厂商1
4
有新品 厂商2的最小收益 63,3
有新品 3, 6
2 2
, 2
25
威胁信号?
➢公司之间经常相互发出信号以表明他们的意图、动机 和目标。有些信号是威胁性的。
➢例如, A公司宣布,如果谁挑起价格战,它将坚决奉陪 到底,并宣称其规模在本行业中名列前茅,最有降价 的实力。
➢是否所有的威胁都是可信的?
33
重复博奕
在下图的价格博弈中,如果是静态博弈,厂商很容易陷 入囚徒的困境(低价,低价)。但如果博弈可以无限 重复下去,则厂商的最佳策略是“以牙还牙”。这样, 考虑到对手会以牙还牙,从长远和整体来看,降低价 格不会有什么好处,博弈可能达到合作的结果。
厂商2
低价
高价
低价 10, 10
100 ,-50
第十章 博奕论
通过前面分析可知,寡头想达到垄断 的结果,需要进行合作,而合作往往 难以维持。其均衡是博弈的结果。 博弈论:研究人们在各种战略情况下 如何行事。
1
囚犯的两难处境
李四
坦白
抵赖
张三 坦白 -8 ,-8
抵赖 -20 ,0
0 ,-20 -1 ,-1
2
红与黑的游戏
MAX:profit
红,红 -3, -3 黑,黑 +3,+3 红,黑 +5,-5
• 全部相互了解即为完全信息博弈; • 否则是不完全信息博弈
13
五、博弈的均衡概念
• 博弈方的不同策略将导致各种不同的均衡,而均 衡的特征又与博弈方的行为假设有密切关系。
• 首先分析静态的非合作的博弈,并且对博弈双方 的行为作出以下假设: ①假定博弈双方是理性的 ②假定博弈双方具有完全的信息 ③假定博弈双方独立地进行决策
过谈判达成具有约束力的协议或合同来划分) 可以达成协议的为合作博弈 cooperative game , 合作博弈强调
集体理性和整体最优。如买卖双方讨价还价后成交。 不能达成协议的为非合作博弈 non-cooperative game , 非合作
博弈强调个体理性和局部最优。 如寡头之间的竞争博弈, 双方的利益和目标有冲突,难以达成可以实施的协议,双 方都有欺骗和违约的冲动。
0 ,-20
抵赖 -20 ,0
-集体理性(最优) 可能不一致。
如寡头之间的广告投入、产量控制等。
17
广告博弈的优势策略均衡?
广告博弈的得益矩阵
厂商2 厂商1
做广告
做 广 告 不做广告
10, 5
15, 0
不做广告 6 , 8
10, 2
18
博弈一方无优势策略
30
合作的诱惑
对社会无害的合作,往往通过某些规则实现。交通规则 下图列出了斗鸡博弈的收益矩阵。设两辆汽车同时到达
一个十字路口,每个驾驶员都有开和等两种选择,博 弈结果如下, 需要通过交通规则引导博弈。
驾驶员2
开
等
开 驾驶员1
等
-8 ,-8 0 ,4
4 ,0 0 ,0
31
合作的诱惑
对社会有害的合作,设法制止。 在囚徒困境博弈中,如 果两个囚徒可以形成攻守同盟,则罪犯得到好处,对 社会不利。例如在寡头厂商的定价博弈中,勾结定高 价对双方都有好处,但对社会不利,因此受到反垄断 法的严密监控。寡头厂商的价格博弈收益矩阵如下:
4
二、特 点
➢参与者具有各自的目标: ➢参与者都是理性行为者; ➢参与者之间具有相关性; ➢事态发展的结果取决于全部参与者的共
同行为; ➢参与者要根据对其他参与者的判断决定
自己的行动,因而是对策。
5
博奕论与优化论的不同
优化论是一种单方决策理论 博弈论所揭示的是一种多方决策理论
6
三、博奕的基本要素
厂商 2 厂商1
做广告
不做广告
做 广 告 不做广告 10, 5 15, 0
6, 8
20, 2
19
不存在优势策略的夫妻之争
王先生W 张女士Z
看 球 赛 ( T)
看球赛( T) 1 ,2
看电影( F) 0 ,0
看 电 影 ( F)
0 ,0
3 ,1
20
2、纳什均衡
• 纳什均衡是在博弈一方既定的策略下,博弈的另一方 所能选择的最佳策略,并且没有改变策略的冲动。
下图列出了一个进入博弈的收益矩阵。显然,默许是在 位者的支配性策略(上策),商战是一个空头威胁, 潜在的进入者将会选择进入。
潜在的进入者
高价 (默许) 在位者
低价 (商战)
进入 50, 10 30, -10
不进入 100, 0
40, 0
27
限制进入
为了使商战的威胁具有可信性和效果,在位者可以用策 略性行动作出承诺,一旦进入发生,它将以低价回击。 比如,它可以建造并维持一定的剩余生产能力,这将 使它的垄断利润减少30,博弈的收益矩阵变为:
14
海滩定位问题
A 海 滩
400米
15
1、支配性策略均衡
• 支配性策略也称上策或优势策略 在博弈中,对有些参与者来说,不管对手采 取什么策略,他的策略都保持不变。这种不 取决于对手选择的最优策略称为支配性策略 (上策或优势策略)。
16
支配性策略均衡
囚徒困境
囚徒2
坦白
抵赖
囚徒1
坦白 -8 ,-8
厂商2
高价
低价
厂商1
高价 低价
50 ,50 70 ,10
10 ,70
30 ,30
32
重复博奕和序列博奕
在现实经济社会,完全信息静态博弈的条件并 不经常可以得到满足。特别是在市场竞争中, 厂商之间的竞争不是一次性的,而是长期和反 复的。同时,厂商之间的行为往往是有先后次 序的,决策者可以先了解对手的行动,在充分 掌握信息的基础上,然后再决定自己的对策。 这种情况称为完全信息动态博弈。
7
结局 outcome (结果):指博弈的结果,指既定 策略组合条件下全部参与者所得收益的集合。
均衡 Equilibrium (均势):指达到稳定的策略
组合或结局。 博弈规则 : 指参与者、策略、结局之间的联系。
它是由博弈的环境和参与者之间的相互影响决
定的。
8
博奕的例子
➢可口可乐与百事可乐(参与者)的价格决策: ➢双方都可以保持价格不变或提高价格(策略) ➢博弈目标和得失情况体现为利润多少(收益) ➢利润的大小取决于双方策略组合(收益函数) ➢博弈有四种策略组合,其(结局)表示为以下
参与者 Players (玩家): 即参加博弈过程的行为和决策 主体,也是利益主体。在一个博弈中,最少要有两个参 与者。
策略 Strategies (战略或策略行为):即参与者在某个博 弈时点,根据其掌握的有关博弈信息而选择的决策变量 和行动计划,一个参与者的全部可行策略称为他的策略 空间。
收益 Payoff (支付、得益)和收益函数: 收益是指在既定 策略组合条件下参与者的得失情况。每个参与者的收益 取决于全部参与者所采取的策略,称为收益函数。
高价 (默许)
在位者 低价 (商战)
潜在的进入者
进入
不进入
20, 10
70, 0
30, -10
40, 0
高价不再是一个上策,均衡可能是(高价,不进入)。 28
贸易政策与国际竞争
一个国家的政府对本国战略性产业进行扶持,可 以影响国际竞争格局。
政府不干预
空中客车
生产
不生产
生产 -10 ,-10
100 ,0
11
博奕的分类
(二)静态博弈与动态博弈
(根据参与者选择策略的关系划分) • 参与者同时或独立选择策略的博弈是静态博弈。 • 参与者按照一定的次序选择策略,后选择者了解
先选择者的行动,这种博弈是动态博弈。
12
博弈的分类
(三)完全信息博弈与不完全信息博
(根据参与者对其他参与者的特征、策略空间、 收益函数等信息的了解程度划分)
B公司
降价
A
公
降价
司 不降价
100 ,200 600 ,1000
不降价 200 ,-100
1000 ,700
A公司降价的威胁 可信吗?不可信。 如果A公司要让B 公司相信其威胁是 可信的,只有一个 途径:建立一种不 按牌理出牌的形象
26
限制进入
在许多行业中在位者可以采取一定的策略性行动形成对 进入的威慑。
共6轮决策,第3轮分数x2,第6轮分数x4 总分最高者获胜
3
一、博弈论的基本概念
博弈是指具有不同利益和目标的多个行为主体共同参加 并相互影响的事态发展过程中的策略决策。
博弈论 ( Game Theory )也称对策论,它是一种分析 弈过程和结果的数学方法,研究具有理性的多个行为 主体的决策和行动直接相互作用和影响时,事态发展 过程的决策和均衡问题。广泛应用于政治、军事、经 济、外交和日常生活的许多领域。
➢厂商之间的成本差别较大,需求和成本变化很快,难以 达成默契。
35
序列博奕
在现实中,较常见的是序列博弈,即一方先行动,另一 方后行动。
先行者优势 在序列博弈中,先行者处于有利地位。如果 是静态博弈,两厂商必须同时宣布决策。根据最大最 小原则,可能大家都无新产品。但如果其中某一厂商 率先推出新产品,则另一厂商只好放弃进入该市场。
37
厂商2
无新产品
有新产品
无新产品
厂商1 有新产品
2, 2 10, 0
0,10 -5, -5
36
序列博奕
在重复博弈的情况下,厂商可能不仅考虑短期收 益,而且更重视长期利益。因此,为了维持长 期的垄断利润,厂商可能以牺牲短期利益为代 价把进入者驱逐出去。这种在博弈中采取一定 非理性行为的方法,形成进入威慑的另一种途 径,即建立不惜一切代价粗暴对待进入者的名 声,而不需要有具体的承诺。(实际上是把牺 牲短期利益作为承诺)
厂商1
高价 -50 ,100
50, 50
34
重复博奕
在现实经济运行中,寡头之间的价格默契并 不容易,主要原因有:
➢如果博弈重复是有限的,则最后一次博弈会采取低价策 略,理性的结果是抢先低价,一直到第一次博弈;但是, 只要以牙还牙的理性行为有一定折扣或(怀疑),合作 以避免价格战的结果仍然会出现。
➢厂商较多,使以牙还牙(对欺骗者进行报复和惩罚)难 以实现,合作就十分困难。
23
3、最大最小策略
博弈方2 博弈方1
守
进
1, 0
退 1, 2
攻
-600 ,0 4, 2
24
3、最大最小策略
下图是一个产品开发博弈的收益矩阵。其中,按照理性 行为会有两种纳什均衡,(无新产品,有新产品)以 及(有新产品,无新产品)。但如果采取最大最小策 略,两个企业都不推出新产品。
厂商2
厂商1 的最小收益 32
收益矩阵
9
博奕的例子
参与者2 百事可乐
不涨价
涨价
参与者1
可口可乐
不涨价 涨价
10 ,10 -20 ,30
100 ,-30 140 ,35
博弈的标准模型 包括三个要素:参与者、每个参与者可以选择 的策略以及收益函数。
在两个参与者的有限博弈中,标准模型可以用收益矩阵表示。
10
四、博奕的分类
(一)合作博弈与非合作博弈 (根据参与者之间能否通
不生产 0 ,100
0 ,0
欧洲有关国家政府补贴后
空中客车
生产 生产 -10 ,10
不生产 100 ,0
不生产 0 ,120
0 ,0
波音 波音
29
合作的诱惑
在类似囚徒的困境这样的博弈中, 个体理性往往导 致集体的非理性。在有多个纳什均衡的博弈中, 参与者判断失误,或者某个参与者非理性行为, 都会导致双方的严重损失。因此,存在着通过合 作改善博弈结果的诱惑,这样可以使大家的收益 都得到改善。 例如,在上述广告博弈中,如果双方都不做广告, 比都做广告收益高。但这种合作难以自动实现。
• 优势策略(上策)均衡是不管博弈一方选择什么策略, 博弈的另一方所选择的策略都是最好的。
• 优势策略均衡是纳什均衡的特例,但是反过来纳什均 衡未必是优势策略均衡。
21
产品选择问题的纳什均衡
厂商 2 厂商1
咸
咸
-4, -4
甜
9, 9
甜
10, 10 -4, -4
22
3、最大最小策略
纳什均衡是建立在参与者理性行为基础上的,这 就使参与者在决策时面临可能出现某些非理性 行为的风险。为了降低风险,决策者可以采取 最大最小策略以便降低风险,即在各种策略的 最小收益中,选择具有最大收益的策略。 其代 价是放弃最优策略。