博弈论第二章 1
博弈论(第二章)讲义
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2
左
中
右
上 博弈方1
下
1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0
博弈论第2章
• 托玛斯 谢林(Thomas C. Schelling )84岁,美国公民。他1951年 托玛斯-谢林( 谢林 岁 美国公民。 年 获得哈佛大学经济学博士学位。 获得哈佛大学经济学博士学位。后曾在美国哈佛大学的肯尼迪学 院教学长达20 20年 担任政治经济学教授, 院教学长达20年,担任政治经济学教授,并获得退休名誉教授 的称号。之后他还在美国马里兰大学公共政策学院和经济系担任 的称号。 教授,并获得退休名誉教授称号。 教授,并获得退休名誉教授称号。他教授的课程除包括经济学理 论外,还涉及外交、国家安全、核战略以及军控等多方面。 论外,还涉及外交、国家安全、核战略以及军控等多方面。
贡献:《冲突战略》、《武器与影响》等,其中前者是相关领域中最具 开创性的理论著作之一。他的理论和思想不仅运用在经济学分析中,在外 交、军事领域也深有影响。
Robert J. Aumann
Thomas C. Schelling
罗伯特·奥曼的博弈论
• • • • • 弈论:交互式条件下“最优理性决策” 完全竞争经济:参与者连续统模型 重复博弈论:理论系统性的发展 合作与非合作博弈论:非转移效用与理性的假设 其他贡献 “奥曼可衡量选择定理”、值集函数积分结 果等 评论:
博弈论的形成
博弈论的真正起点 博弈论的真正起点—— 真正起点—— 诺伊曼、 1944年 冯 诺伊曼、摩根斯坦 1944年《博弈论和经济行 Behavior) 为》 (Theory of Games and Economic Behavior) 在这本著作中引进了扩展形(Extensive Form)表 在这本著作中引进了扩展形( 扩展形 ) 示和正规形(Normal Form)或称策略形(Strategy 示和正规形( )或称策略形( 正规形 Form)、矩阵形(Matrix Form)表示,定义了极小化 )、矩阵形 )、矩阵形( )表示,定义了极小化 ),提出了稳定集( 极大解( ),提出了稳定集 极大解(Minmax Solution),提出了稳定集(Stable Sets)解概念等,正式提出了创造一种博弈论的一般理 )解概念等, 论的主意
博弈论-博弈分类
各博弈方的选择和行动有先后次序且后选择、后行动的博弈 方在自己选择行动之前可以看到其他博弈方选择的行动
如弈棋、市场进入、领导——追随型市场结构等 重复博弈
➢ 同一个博弈反复进行所构成的博弈,提供了实现更有效率博弈 结果的新可能
➢ 长期客户、长期合同、信誉问题 ➢ 有限次重复博弈、无限次重复博弈
2023/1/4
覃燕红——重庆理工大学
20
4、博弈分类区分 III :课程涉及的4种博弈类型
4种基本的博弈类型
完全信息
静态 完全信息静态博弈
纳什均衡
动态 完全信息动态博弈 子博弈精炼纳什均衡
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
不完全信息动态博弈 精炼贝叶斯纳什均衡
➢ 完全信息:每个参与人都拥有所有其他参与人的特征、策略及支付 函数等方面准确信息的博弈。
• 人们在决策时遵循最大化原则 • 选择最优方案,谋求最大效益 • 作为决策的主体,始终坚持理性化活动,不存在任何非理性成分。
✓ 不完全理性:
• 有限理性 • 有限理性决策的前提是现实生活过于复杂,人们只能遵循满意原则 • 受到情感、偏好(如公平、互惠、利他)的影响 • 中国人:不患寡,患不均;滴水之恩,涌泉相报;以牙还牙等
的掠夺式使用、森林砍伐、实际和网络上的牛皮广告等
坦白 囚徒 A
抵赖
囚徒 B
坦白
抵赖
-8,-8 0,-10
-10,0 -1,-1
2023/1/4
覃燕红——重庆理工大学
6
2、博弈模型示例II
剪刀-石头-布
博 石头
弈 剪子
方
布
1
石头
0, 0 -1, 1 1, -1
博弈论 第2章
2.3.5 反应函数的问题和局限性
• 在许多博弈中,博弈方的策略是有限且非连 续时,其得益函数不是连续可导函数,无法 求得反应函数,从而不能通过解方程组的方 法求得纳什均衡。
• 即使得益函数可以求导,也可能各博弈方的 得益函数比较复杂,因此各自的反应函数也 比较复杂,并不总能保证各博弈方的反应函 数有交点,特别不能保证有唯一的交点。
左 上 下 1,0 0,4 中 1,3 0,2 右 0,1 2,0 左 1,0 0,4 中 1,3 0,2 左 1,0 中 1,3
5
Game Theory Game Theory Game Theory Game Theory
例:智猪问题博弈
小猪
按 等待
按
大猪 等待
3,1
2,4
7,-1
0,0
若每次剔除的是严格劣战略,均衡结果与剔除顺序无 关;若剔除的是弱劣战略,均衡结果可能与剔除顺序 有关。因此,每次剔除的都应该是严格劣战略。
12
Game Theory Game Theory Game Theory Game Theory
2.2.2 纳什均衡的一致预测性质
一致预测:如果所有博弈方都预测一个特定博弈 结果会出现,所有博弈方都不会利用该预测或者 这种预测能力选择与预测结果不一致的策略,即 没有哪个博弈方有偏离这个预测结果的愿望,因 此预测结果会成为博弈的最终结果 •只有纳什均衡才具有一致预测的性质 •一致预测性是纳什均衡的本质属性 •一致预测并不意味着一定能准确预测,因为有 多重均衡,预测不一致的可能
混合策略扩展博弈:博弈方在混合策略的策略空间 (概率分布空间)的选择看作一个博弈,就是原博弈的 “混合策略扩展博弈)。
混合策略纳什均衡:包含混合策略的策略组合,构成 纳什均衡。
博弈论-第二章
由此,可以看出严格优策略和严格劣策略的 差异。严格优策略是全局性的,而严格劣策 略只是相对于另一个策略而言。
因而严格劣策略的要求要比严格优策略要松, 运用重复剔出严格劣策略(如果存在的话) 通常都能够确定博弈的均衡。
但是,对于更一般的博弈,利用可理性化 导致的结果可能是所有博弈组合都无法剔除, 从而导致所有组合都可能是均衡这样的状态。
严格优策略通俗地说就是在任何情况下,该 策略带给参与者的收益都要严格大于其它任 意策略。
理解严格优策略的关键在于两个任意:给定 对手任意的策略和自己任意的策略。
如果严格优策略存在,那么它必然是唯一的。 这体现在命题2.1中。
我们现在就举例说明。
[例] 双边背离与纳什均衡
1.
2
2. 左 右 右
上 1,1,2 _ ,0, _ 1
下 0, _, _ 2, 2,1
2 左
_, _, 1 ……. …… …….
ห้องสมุดไป่ตู้
3
高
低
为了加深理解,我们来看一些经典例子。
见书43页—50页。
通过这些例子,要求:1、掌握如果概括 博弈的方法——基本式,2、如何找纳什 均衡。
混合策略通俗地说就是随机选择纯策略。在 混合策略条件下,偏好实质上变成了v-N-M偏 好,除了满足非对称性和负传递性外,还需 满足替代公理和阿基米德公理。
伯努利收益函数满足线性变换。
我们知道,一个严格劣策略肯定是一个从来 都不会选择的策略,在混合策略下,从来都 不选择的策略同样是严格劣策略。但限制在 纯策略下,这个逆命题却不成立。
博弈论(第二章)
假设这些农户在夏天才到公共草地放羊,而每年 的春天就要决定养羊的数量。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
经济博弈论 02 完全信息静态博弈(Park)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
博弈论第二章——博弈规则
0,0 1,2
选修课--另一版本
王菲
李 亚 博弈论 鹏
舞蹈
博弈论
舞蹈
4,3 1,1
2,2 3,4
石头·剪子·布
博弈方2
石头 剪子 布
博 弈 石头
0,0 1,-1 -1,1
方 剪子 -1,1 0,0 1,-1
1
布 1,-1 -1,1 0,0
双人博弈小结
注意二点: 1. 博弈方之间并非总是对抗的。 2. 个人理性决策常不能实现自己的
2.关于博弈过程的信息 完美信息和不完美信息
完美信息(perfect information):对 已经发生的的事情有清楚的了解,称具 有完美信息。否则,称为不完美信息 (imperfect information)
寡头定价 联通b
高价g 低价d
移 动
高价 g
50,50
10,80
a
低价 d
80, 10
30,30
Ug= Uag+ Ubg=50+10+50+10=120 Ud= Uad+ Ubd=30+80+30+80=220
2.2.5 博弈的信息结构
1.关于得益的信息 完全信息和不完全信息
(1) 完全信息(complete information)是 指在博弈过程中,每一位博弈方对其他博弈 方的特征、策略空间及收益函数有准确的信 息。
静态博弈 动态博弈
行动与策略的区别?
▪ 行动是指参与者可能有的具体行动 ▪ 战略是行动的规则而不是行动本身
毛泽东:
人不犯我我不犯人 人若犯我我必犯人
敌进我退 敌退我追 敌驻我扰 敌疲我打
I(information)
博弈论课件 第二章
2.3 无限策略博弈分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性
2.3.1 古诺的寡头模型
假设条件:
市场总产量Q q1 q2 市场出清价格 P P(Q) 8Q 边际成本c1 c2 2,无固定成本 两厂商同时决定各自产的量
2.2.1 纳什均衡的定义
博弈、博弈方的策略空间和得益的一般表示法 G 表示一个博弈; n个博弈方;
S1,S2, ,Sn表示每个博 策弈 略方 集的 合可 , 空 选 称 间为 ”“ ; sijSi表示博 i的 弈第 j个 方策略; 博弈i的 方得益 ui表 用示ui, 是各博弈方策 函略 数的 ;多元
★★★学习博弈论,大家一定要记忆一些基本的模型。因为很多
时候,我们总是基于已有的模型,对其做出修订来考察一些新的 问题。完全创新的模型是很少见的,当我们记忆的模型多了,就 很容易在分析问题时套用模型,并修订模型的条件来考察自己研 究的问题。
其实大家学习西方经济学理论的时候,会发现它与大家曾接触 的马克思主义经济学理论,以及国内一些逻辑思辩型的经济学研 究范式一个很大不同就在于,它采取的是一种模型化的思维。我 们学习西方经济学的时候,会发现始终在学习一些模型,因为模 型是帮助我们简单地理解现实世界的有用工具。经济学中的数学 模型,其实与生物课教学的塑料人体模型等在本质上并无不同。
左
中
右
博弈的解:(上,中)
博上 弈 方 一
下
1,0 0,4
1,3 0,2
0,1 2,0
2.1.3 划线法
囚徒困境
囚 坦白 徒 1 不坦白
囚徒 2 坦白
博弈论2_01-03
纳什均衡
纳什均衡:如果有两个战略 或者更一般 纳什均衡:如果有两个战略(或者更一般 有多个战略), 地,有多个战略 ,并且每个战略都是另 一战略的最优反应, 一战略的最优反应,这一战略组合就称 为纳什均衡战略。 为纳什均衡战略。 与占优战略均衡一样, 与占优战略均衡一样,纳什均衡反应了 两个作者的理性行为。 两个作者的理性行为。 纳什均衡与占优战略均衡, 纳什均衡与占优战略均衡,都是非合作 均衡。 均衡。
Jones’ garbage
Smith’s house
Smith
倾倒 倾倒 4000,4000
雇卡车 5000,3500 4500,4500
Jones Jones
雇卡车 3500,5000
Smith
倾倒 倾倒 4000,4000
雇卡车 5000,3500 4500,4500
Smith先生的最优战略 先生的最优战略
约翰·福布斯 纳什 约翰 福布斯·纳什 福布斯 纳什(John Forbes Nash, 1928--) 约翰·福布斯 纳什 数学家, 约翰 福布斯·纳什 数学家,1928年6月13日生于西弗吉尼亚州的 福布斯 纳什,数学家 年 月 日生于西弗吉尼亚州的 布鲁菲尔德(Bluefield)市,现生活在普林斯顿。 布鲁菲尔德 市 现生活在普林斯顿。 在普林斯顿大学求学期间,他证明了非合作均衡 也 在普林斯顿大学求学期间,他证明了非合作均衡(也 就是现在所说的纳什均衡), 就是现在所说的纳什均衡 ,可以用来解决静态总和博 并因此获得了1994年的诺贝尔奖。 年的诺贝尔奖。 弈,并因此获得了 年的诺贝尔奖 他还提出了一种适合于合作博弈的数学讨价还价理论, 他还提出了一种适合于合作博弈的数学讨价还价理论,并在数学 领域做出了很多其他贡献。 领域做出了很多其他贡献。 纳什患脑疾多年,它的故事在 年被改变成电影《 纳什患脑疾多年,它的故事在2001年被改变成电影《美丽心 年被改变成电影 灵》。
博弈论第二章答案
nc + a a − c a−c a−c ⋅ −c⋅ = n +1 n +1 n +1 n +1
企业违背垄断产量时的各期利润:
n −1 (a − c ) − qi πi = a − qi − cqi 2n ∂π i (n − 1)(a − c) =a− − qi − q j − c = 0 ∂qi 2n n +1 (n + 1)a + (3n − 1)c (a − c), p = 4n 4n 2 (n + 1) 利润为 (a − c) 2 16n 2 ⇒ qi =
仅供参考! !
-4-
E-mail:beckham.23@
2
出) ,只要任何一方违背时,以后就转向阶段博弈的价格 pi = c 。 如一直使用垄断价格,则每个企业收益每期都一样为, π i = (a − c) / 8 如在t期某企业违背了战略, t+1期开始双方的收益相同都为0, 在t期它的最大收益为 ( a − c) / 4 (考虑此企业只是把价格边际上减少一点点,所有的利润都归它) ,如不违背则把以后无限期
一阶条件:
V ' ( I p − B) = kU 2' ( S + B) ,
反应函数满足:
−1 < dB* / dS = kU 2" /(−kU 2" − V " ) < 0 即,孩子储蓄减少,家
*
长给予更高的赠与。 接着最大化孩子的收益:给定反应函数 B ,来选 S:
MaxU1 ( I c − S ) + U 2 ( S + B* )
∂π i = a − ∑ qi − qi − c = 0 ∂qi a−c (i = 1,2,3 n) n +1
第二章同时决策博弈静态博弈(博弈论教程石家庄经济
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
第二节 优势策略与优势策略均衡
➢二、寻找优势策略:定义法
➢(一)案例:超市中的可乐价格大战
➢
PESPI
➢
低价
高价
➢ ➢COCO ➢
低价 高价
3,3 1,6
6,1 5,5
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
都是各参与人各自的上策 Ø(低价,低价) Ø特征:博弈中的稳定结果
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
第二节 优势策略与优势策略均衡
➢三、优势策略均衡
➢(二)寻找优势策略均衡
➢艺术家公明要求看装修商的设计方案
➢
装修商
➢
给看 不给看
➢
要求看 800,600 0,0
➢公明 ➢
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
第二节 优势策略与优势策略均衡
Ø二、寻找优势策略:定义法
Ø(四)结论 Ø严格优势策略组合(低价,低价)
Ø囚徒困境:对个人而言最优的策略 (低价),对集体而言非最优。个人 理性与集体理性冲突
Ø原因:只关心己方利益,双输
2020/12/10
第二章同时决策博弈静 态博弈(博弈论教程石家
庄经济
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
夫妻吵架——斗鸡博弈
Ø特征
Ø1.双方了解各种情况下的得益:完全
信息
Ø进——胜利
•亲爱的,你先 吵,你吵完了
Ø退——丢面子
我再吵?
《博弈入门》第二章:纳什均衡:理论
努⼒⼯作游⼿好闲努⼒⼯作2,23,0游⼿好闲0,31,1《博弈⼊门》第⼆章:纳什均衡:理论1 策略型博弈策略型博弈是决策者之间相互作⽤的模型。
正是因为相互作⽤,我们称决策者为局中⼈。
每个局中⼈有⼀个可选⾏动的集合。
模型中的每个局中⼈受到所有局中⼈⾏动的影响,⽽不仅是受到她⾃⼰⾏动的影响,从⽽获得局中⼈之间的相互作⽤。
尤其是,每个局中⼈对于⾏动剖⾯⼀-所有局中⼈⾏动的列表(参见17.4节中关于剖⾯的讨论)---都有⾃⼰的偏好。
定义2.1(具有序数偏好的策略型博弈)(具有序数偏好的)策略型博弈由如下要素组成:局中⼈集合对于每个局中⼈,有⼀个⾏动集合对于每⼀个局中⼈,有关于⾏动剖⾯集合的偏好2.2 囚徒困境2.2.1 合作项⽬你和朋友合作-⼀个项⽬。
你们每个⼈可以要么努⼒⼯作要么游⼿好闲。
如果你的朋友努⼒⼯作,⽽你乐意游⼿好闲(如果你也努⼒⼯作的话,项⽬的结局将会好--些,可是其价值的增量对你来讲不值得付出额外的努⼒)。
你喜欢你们俩都努⼒⼯作的结局甚于你们俩都游⼿好闲(在这种情况下,什么都没有完成),对于你,最差的结局是你⼯作很努⼒⽽你的朋友却游⼿好闲(你痛恨被“剥削")。
如果你的朋友有相同的偏好,那么模拟你所⾯对情形的博弈将在图2.2中给出,如你所看到,这个博弈与“囚徒困境”的不同仅在于⾏动的名称。
我们并没有断⾔,两个⼈从事⼀个合作项⽬的情况必定具有“囚徒困境”的结构,只有当局中⼈的偏好与“囚徒困境”中⼀样时才是!例如,如果在其他⼈努⼒⼯作时每个⼈都喜欢努⼒⼯作甚于游⼿好闲,那么“囚徒困境”就不模拟这种情况:局中⼈的偏好与图2.2中给出的偏好不同。
2.2.2 双寡头垄断左图的博弈与“囚徒困境”的不同之处不仅在于局中⼈⾏动的名称,还在于其中两个局中⼈的偏好上有所不同。
右图的博弈与“囚徒困境”的不同之处仅在于局中⼈⾏动的名称。
随机坚持随机1/2(H+L),1/2(H+L)L,H坚持H,L S,SS>L2.4例证:匹配硬币(⽆冲突博弈)我们研究的求解理论有两个部分。
博弈论 第二章
进一步,如果一个博弈的某个策略组合中的所 有策略都是各个博弈方各自的上策,那么这个 策略组合肯定是所有博弈方都愿意选择的,必 然是该博弈比较稳定的结果。——占优策略均 衡” 或 “上策均衡”“优势策略均衡”。
囚徒的困境博弈中的(坦白,坦白)实际上就 是一个上策均衡,因为“坦白”对该博弈的两 个博弈方来说都是上策。
囚犯B
认罪
不认罪
囚 认罪 -10,-10
-1,-20
犯 不认 A罪
-20,-1
-3,-3
二、重复剔除严格劣战略
所 谓 “ 严 格 劣 策 略 ” ( Strictly Dominated strategies)是指:在博弈中,不论其他参与人 采取什么策略,某一参与人可能采取的策略中, 对自己严格不利的策略。
为国王画像
从前,有个国王,瘸了一条腿,瞎了一 只眼睛。他想得到一张称心如意的画像,便 召来三位著名的画家为他作画。一位画家把 国王画得仪表堂堂,气概非凡,特别是把两 只眼睛画得炯炯有神,把两条腿画得健壮有 力。国王一看,很不满意,气愤地说:“睁 着眼睛胡画,肯定是个拍马逢迎的骗子。” 第二位画家把国王画得维妙维肖,简直像国 王本人一样,瞎眼瘸腿一目了然。国王看过 大发雷霆,把画像踩在脚下吼叫起来。 第三位画家十分从容地画好了,发怒的国王 一见到这张画像,顿时转怒为喜,连声称赞 画得好。 第三位画家是怎样画的呢?
1,4
方B 1
0,5
0,3
图 2.2
博弈方 2
博
甲
乙
弈 A 1,0
1,4
方
1
图 2.3
例 “智猪博弈”(Boxed Pigs)
假设猪圈里有两头猪,大猪和小猪,猪圈的一端有一个猪食
槽,另一端安装了一个按钮,控制猪食的供应。按一下按钮,将 有8个单位的猪食进入猪食槽,供两头猪食用。如果某一头猪作 出自己去按按钮的选择,它必须付出如下代价:第一,它需要付 出相当于2个单位的成本;第二,由于猪食槽远离猪食,它将比另 一头猪后到猪食槽,从而减少吃食的数量。
博弈论第二章习题
问题1:博弈方2就如何分10000元钱进行讨价还价。
假设确定了以下原则:双方提出自己要求得数额与,。
如果设博弈方1与,,则两博弈方得要求都得到满足,即分得与;但如果,则该笔钱就被没收。
问该博弈得纯策略纳什均衡就是什么?如果您就是其中一个博弈方,您会选择什么数额,为什么?解:,那么, 那么,它们就是同一条直线,上得任意点,都就是本博弈得纯策略得Nash 均衡。
假如我就是其中一个博弈方,我将选择元,因为就是比较公平与容易接受得。
它又就是一个聚点均衡。
问题2:设古诺模型中有家厂商。
为厂商得产量,为市场总产量。
为市场出清价格,且已知(当时,否则)。
假设厂商生产产量得总成本为,也就就是说没有固定成本且各厂得边际成本都相同,为常数。
假设各厂同时选择产量,该模型得纳什均衡就是什么?当趋向于无穷大时博弈分析就是否仍然有效?解:, 令, 解得:,当趋向于无穷大时,这就是一个完全竞争市场,上述博弈分析方法其实已经失效。
问题3:两寡头古诺模型,,但两个厂商得边际成本不同,分别为与。
如果,问纳什均衡产量各为多少?如果,但,则纳什均衡产量又为多少?解:双方得反应函数联立求解 ,解得:当,就就是这个博弈得Nash 均衡。
如果,但,当然可以推得。
那么厂商1就变成垄断商它得最佳产量当然就是,它得利润就是:。
问题4:如果双寡头垄断得市场需求函数就是,两个厂商都无固定成本边际成本为相同得常数。
如果两个厂商都只能要么生产垄断产量得一半,要么生产古诺产量。
证明:这就是一个囚徒困境型得博弈。
解:古诺产量,垄断产量得一半,那么 分别有四种情况问题5:两个厂商生产一种完全同质得商品,该商品得市场需求函数为,设厂商1与厂商2都没有固定成本。
若她们在相互知道对方边际成本得情况下,同时作出产量决策就是分别生产20单位与30单位。
问这两个厂商得边际成本各就是多少?各自得利润就是多少?解:, 令,代入,所以:。
问题6:两个企业1、2各有一个工作空缺,企业得工资为,并且。
博弈论第二章 (1)
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3
3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略
二、重复剔除严格劣战略
(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5
大学课程《博弈论及其应用》PPT课件:第二章(1234节)
如果在一个博弈中,不管其他的博弈方的策略如何变化,一 个博弈方的某个策略给其带来的得益,总是相对于其他某些 策略(不必是全部)给他带来的得益要小,该策略称为相对 于其他某些策略的严格劣势策略(严格下策)。
我们在分析一个博弈方的决策行为时,首先找出某个博弈方 严格下策(假定存在),把这个策略消去,重新构造新的博 弈;然后,再消去这个新的博弈中的某个博弈方的严格下策; 继续这个过程,一直到只剩下唯一的策略组合为止。这个唯 一剩下的策略组合就是这个博弈的均衡解。这种分析方法称 之为“累次严优”,也称作“严格下策反复消去法”。
问题是,每个博弈方都要觉得偏好上策的情况很少,一般情 况是所以博弈方都没有上策,上策均衡不是普遍存在的。
在不存在严格优势策略的情况下,相对较好的选择是,不论 其他博弈方选择什么策略,该博弈方选择的某个策略给其带 来的得益不低于其可以选择的任何其他策略。通常把具有这 种性质的策略称为这个博弈方的弱优势策略。
优势策略有整体的严格优势策略(strictly dominant strategy)和 弱优势策略(weakly dominant strategy)区别。所谓的严格优势 策略,是指无论其他博弈方选择什么策略,这个博弈方的某
个策略给他带来的得益始终高于其他的策略,至少不低于其 他策略的策略。例如,囚徒的困境中的“坦白”,就是上策。
累次严优
博弈方2
左
中
上 博弈方1
下
1,0 0,4
1,3 0,2
图 2-5
右
0,1 2,0
对于图2-5描述的一个抽象博弈,不存在上策均衡。分析博弈 方1的策略,“上”策略和“下”策略都不是严格占优的优 势策略。再来分析博弈方2的三个策略,横着比较后面的得 益,“左”和“中”比较,“左”和“右”比较,没有严格
博弈论第二章
支付 大猪
小猪
按
等待
按 5,1 9,-1
等待 4,4 0,0
智猪博弈的扩展
• 股份公司承担监督经理职能的大股东与小股东 • 股票市场上炒股票的大户与小户 • 市场中大企业与小企业在研发、广告上的博弈 • 公共产品的提供(富户与穷户) • 改革中不同利益分配对改革的推动
第三节 重复剔除的占 优策略均衡
电 影
2
球
女赛 0
男
电影
球赛
1
0
0
0
2
1
在这样的博弈中,双方都没有上策。
该博弈中有两个均衡状态(电影,电影)、 (球赛,球赛)。
实际上,他们的最优策略均依赖对方的选择, 一旦对方选择了某一项活动,另一个人选择 同样的活动就是最好的策略。
在一个均衡里,如果其他参与 者不改变策略,任何一个参与 者都不会改变自己的策略,则 为纳什均衡。
人却默默无闻。大部分曾经运用过他的理 论的年轻数学家和经济学家都根据他的论 文发表日期,想当然地以为他已经去世。 即使一些人知道纳什还活着,但由于他特 殊的病症和状态,他们也把纳什当成了一 个行将就木的废人。
•
传奇仍在继续
• 有人说,站在金字塔尖上的科学家都有一
个异常孤独的大脑,纳什发疯是因为他太
博弈论第二章
第一节 博弈论的基本概念 与战略式表述
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行
为
发生直接相互作用时候的决策以及
这种决策的均衡问题。
博弈的战略式表述:G={N,(Si)iN,(Ui)iN} 有三个基本要素:
(1)参与人(players)iN={1,2,…,n} ;
博弈论与信息经济学答案
博弈论与信息经济学答案第⼀章5.n 个企业,其中的⼀个⽅程:π1=q 1(a -(q 1+q 2+q 3……q n )-c ),其他的类似就可以了,然后求导数,结果为每个值都相等,q 1= q 2=……q n=(a-c)/(n+1)。
或者先求出2个企业的然后3个企业的推⼀下就好了。
6.假定消费者从价格低的⼚商购买产品,如果两企业价格相同,就平分市场,如果企业i 的价格⾼于另⼀企业,则企业i 的需求量为0,反之,其它企业的需求量为0。
因此,企业i 的需求函数由下式给出:i ii i i i i i p pi p p p p 0)/2Q(p )Q(p q --->==从上述需求函数的可以看出,企业i 绝不会将其价格定得⾼于其它企业;由于对称性,其它企业也不会将价格定的⾼于企业i ,因此,博弈的均衡结果只可能是每家企业的价格都相同,即p i =p j 。
但是如果p i =p j >c 那么每家企业的利润02i ij i p cq ππ-==>,因此,企业i 只要将其价格略微低于其它企业就将获得整个市场的需求,⽽且利润也会上升⾄()()22i i i i p c p cQ p Q p εε---->,()0ε→。
同样,其它企业也会采取相同的策略,如果此下去,直到每家⼚商都不会选择降价策略,此时的均衡结果只可能是p i =p j =c 。
此时,企业i 的需求函数为2ia cq -=。
在静态的情况下,没有⼀个企业愿意冒险将定价⾼于⾃⼰的单位成本C ,最终P=C ,利润为0。
因为每个参与⼈都能预测到万⼀⾃⼰的定价⾼于C ,其他⼈定价为C 那么⾃⼰的利益就是负的(考虑到⽣产的成本⽆法回收)。
就算两个企业之间有交流也是不可信的,最终将趋于P=C 。
现实情况下⼀般寡头不会进⼊价格竞争,⼀定会取得⼀个P 1=P 2=P 均衡。
此时利润不为零,双⽅将不在进⾏价格竞争。
7.设企业的成本相同为C ,企业1的价格为P 1,企业2的价格为P 2。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章完全信息静态博弈完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方收益都了解的博弈。
囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。
完全信息静态博弈属于非合作博弈最基本的类型。
本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。
第二章完全信息静态博弈§1、博弈的标准式和纳什均衡§2、应用举例§3、混合策略和纳什均衡的存在性§4、二人零和博弈§1、博弈的标准式和纳什均衡一、博弈的标准式表述二、重复剔除严格劣战略三、纳什均衡1、标准式的三要素(1)参与人(或称为博弈方)(2)每个参与人可选择的战略集(3)收益:针对所有参与人可选择的战略组合,每一个参与人获得的收益一、博弈的标准式表述10:39:535假设一个博弈有n 个博弈方,博弈方i 的策略集(又称策略空间)为S i (i=1,2,…,n),用s ij ∈S i 表示博弈方i 的第j 个策略;若s i ∈S i (i=1,2,…,n),称s=(s 1,s 2,…,s n )为一个策略组合;若用s -i =(s 1,s 2,…,s i-1,s i+1,…,s n ),则s =(s i ,s -i )。
2、博弈的数学表述一、博弈的标准式表述10:39:5362、博弈的数学表述⇔用u i (s)=u i (s 1,s 2, …,s n ) (i=1,2,…,n)表示博弈方i在策略组合s=(s 1,s 2, …,s n )的得益, u i 是策略集S 1×S 2×…×S n 上的多元函数。
⇔定义:若一个N 人博弈的策略空间为S i ,得益函数为:u i (s)=u i (s 1,s 2, …,s n )(i=1,2,…,n),则该博弈表示为:G={N,S 1,S 2, …,S n ;u 1,u 2,…,u n }。
一、博弈的标准式表述←3、举例:囚徒困境(用双变量矩阵来描述)双变量矩阵可由任意多的行和列组成,“双变量”指的是在两个博弈方的博弈中,每一个单元格有两个数字,分别表示两个参与者的收益。
-5,-50,-8-8,0-1,-1坦白不坦白坦白不坦白囚徒2囚徒1一、博弈的标准式表述←3、举例(2):斗鸡博弈一、博弈的标准式表述退BA进退进独木桥-3,-32,00,20,0横行代表囚徒1的收益,在两个数字中放在前面;列行代表囚徒2的收益,在两个数字中放在后面。
3,-31,-11,-11,-1-1, 11,-11,-13,-31,-11,-11,-1-1, 11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3一、博弈的标准式表述3、举例(3):齐王田忌赛马齐王上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田忌4、注:①同时选择战略,不意味着行动必须是同时的;②标准式不仅可用来描述静态博弈,也可以用来描述序贯行动的动态博弈,只不过在分析问题时,扩展式博弈更常用。
一、博弈的标准式表述1、占优均衡如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈比较稳定的结果。
我们称这样的策略组合为该博弈的一个“占优均衡”(Dominant-strategy Equilibrium)。
←占优均衡是博弈分析中最基本的均衡概念之一,占优均衡分析是最基本的博弈分析方法。
←囚徒的困境博弈中的(坦白,坦白)实际上就是一个占优均衡。
二、重复剔除严格劣战略2、占优均衡分析的局限性←并非每个博弈方都有这种绝对偏好的上策,而且常常是所有博弈方都没有上策,因为博弈方的最优策略随其他博弈方的策略而变化正是博弈问题的根本特征,是博弈关系相互依存性的主要表现形式。
←因此占优均衡不是普遍存在的。
←例如斗鸡博弈,赛马博弈就没有占优均衡,因为各个博弈方的任何策略都不是绝对最优的,每个博弈方都没有绝对偏好的上策。
所以,占优均衡并不能解决所有的博弈问题,最多只是在分析少数博弈时有效。
二、重复剔除严格劣战略3、重复剔除严格劣战略←(1)、思路和原理←反思占优均衡分析的思路,不难发现占优均衡分析釆用的决策思路是一种选择法的思路,是在所有可选择策略中选出最好一种。
←剔除法与选择法在思路上正好相反,它是通过对可选策略的相互比较,把不可能采用的较差策略排除掉,从而筛选出较好的策略,或者至少缩小候选策略的范围。
这种剔除法的思路导出了博弈分析中的重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
二、重复剔除严格劣战略←(2)定义一般地,如果在一个博弈中,不管其他博弈方的策略如何变化,一个博弈方的某种策略给他带来的得益,总是比另一种策略给他带来的得益要小,那么我们称前一种策略为相对于后一种策略的一个“严格劣策略”。
二、重复剔除严格劣战略←(3)、举例为了说明重复剔除严格劣策略法与占优均衡分析的区别,我们用一个例子来说明。
首先看下图中这个抽象掉现实问题内容的,两个博弈方分别有三种和两种策略的不对称博弈问题。
博弈方1博弈方21, 01, 30, 10, 40, 22, 0上下左中右博弈方1博弈方21, 01, 30, 40, 2上下左中博弈方1博弈方21, 01, 3上左中博弈方21, 3上中二、重复剔除严格劣战略(4)重复剔除严格劣策略法的缺陷←重复剔除严格劣策略也不能解决所有博弈的分析问题。
因为在许多博弈问题中,上述相对意义上的严格劣策略往往不存在。
如猜硬币、齐威王田忌赛马、石头,剪子,布等赌胜博弈,没有任何博弈方的任何策略是相对其他策略的严格劣策略。
←此外,在策略数较多的博弈中,重复剔除严格劣策略法只能消去其中的部分策略,不能消去的策略组合并不惟一,因此仍然不能完全解决这些博弈问题。
二、重复剔除严格劣战略如果消去的弱劣战略,不是严格劣战略,则消去顺序会影响结果⇔例:博弈G如下图:1 , 81 , 62 ,8 80 ,80 ,8 0 , 91 , 50 , 80 , 6博弈方ⅡL M RU博弈方ⅠSD二、重复剔除严格劣战略10:39:53181 , 81 , 62 ,8 80 ,8 0 ,8 0 , 91 , 50 ,8 0 ,6 ⇔解:1)博弈方Ⅱ的策略“L”和“M”都是策略“R”的弱劣策略(不是严格劣策略),消去策略“L”和“M”后为:US D0 , 90 , 81 , 8R博弈方Ⅰ的策略“S”和“D”都是策略“U”的严格劣策略,消去策略“S”和“D” 后剩下唯一策略组合(U,R )。
L M R U S D10:39:53191 , 81 , 62 ,8 80 ,8 0 ,8 0 , 91 , 50 ,8 0 ,6 2)博弈方Ⅰ的策略“S”和“D”都是策略“U”的弱劣策略(不是严格劣策略),消去策略“S”和“D” 后为:博弈方Ⅱ的策略“M”和“R”都是策略“L”的弱劣策略(不是严格劣策略) ,消去策略“M”和“L”后剩下唯一策略组合(U,L )。
L M RU S D1 , 81 , 62 ,8L M R U(重复提出弱劣策略会把纳什均衡剔除掉,保留下来的也未必是纳什均衡)4、划线法(1)思想在具有策略和利益相互依存性的博弈问题中,各个博弈方的收益既取决于自己选择的策略,还与其他博弈方选择的策略有关,因此博弈方在决策时必须考虑其他博弈方的存在和策略选择。
根据这种思想,科学的决策思路应该是:先找出自己针对其他博弈方每种策略的最佳对策,即自己的可选策略中与其他博弈方的策略配合,给自己带来最大收益的策略(这种相对最佳对策总是存在的,不过不一定惟一),然后在此基础上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自已策略判断的判断等,预测博弈的可能结果和确定自己趵最优策略。
二、重复剔除严格劣战略(2)举例博弈方1博弈方21, 01, 30, 10, 40, 22, 0上下左中右二、重复剔除严格劣战略例1-5,-50,-8-8,0-1,-1坦白不坦白坦白不坦白囚徒2囚徒1划线法分析囚徒困境二、重复剔除严格劣战略例2←划线法是一种非常简便的博弈分析方法,由于它以策略之间的相对优劣关系为基础,因此在分析用收益矩阵表示的博弈问题时具有普遍适用性。
←当然,这并不意味着每个用收益矩阵表示的博弈都可以用划线法求出确定性的博弈结果。
←事实上,许多博弈根本不存在确定性的结果,当然也就无法用划线法找出这种结果。
我们通过一些例子来说明。
二、重复剔除严格劣战略-1,11,-11,-1-1,1正面反面正面反面猜硬币方盖硬币方例3、猜硬币博弈二、重复剔除严格劣战略2,10,00,01,3时装足球时装足球丈夫妻子划线法分析夫妻之争二、重复剔除严格劣战略例4、夫妻博弈二、重复剔除严格劣战略此外,划线法还可以解决三人博弈问题,只是随着决策者人数和策略的增多,用策略式表述越来越复杂例 5 投票博弈假定三个参与人1,2,3要在三个项目A,B,C中投票选择一个。
规则是同时投票且不允许弃权,得票数最多的项目当选。
如果得票数相同,即每个项目一票,则项目A当选。
再假设不同项目当选时,三个博弈方的收益表示如下:123123123()()()2()()()1()()()0u A u B u C u B u C u A u C u A u B ===⎧⎪===⎨⎪===⎩二、重复剔除严格劣战略解:该博弈共有27种可能的策略组合,需要用三个标准式来描述:2,0,11,2,02,0,12,0,1AB A B参与人2参与人1参与人3选A2,0,10,1,22,0,12,0,12,0,1C C二、重复剔除严格劣战略1,2,01,2,02,0,11,2,0A B A B参与人2参与人1参与人3选B1,2,00,1,22,0,11,2,02,0,1C C二、重复剔除严格劣战略2,0,11,2,00,1,20,1,2AB A B参与人2参与人1参与人3选C0,1,20,1,22,0,12,0,10,1,2C C←通过划线法找出的具有稳定性的策略组合,不管是否惟一,都有一个共同的特性,即其中每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策。
←在两人博弈的情况下,就是“给定你的策略,我的策略是我最好的策略;给定我的策略,你的策略也是你最好的策略”。
事实上,具有这种性质的策略组合,正是非合作博弈理论中最重要的一个解概念,即博弈中的“纳什均衡”(Nash Equilibrium )。