02第二章完全信息静态博弈习题讲解
第二章完全信息静态博弈
第二章完全信息静态博弈2在完全信息静态博弈中,各博弈方同时决策,且所有博弈方对各方得益都完全了解。
完全信息静态博弈属于非合作博弈最基本类型。
本章介绍该类博弈的一般分析方法、纳什均衡概念及分析方法的扩展。
2.1 基本分析方法3上策均衡严格下策反复消去法划线法箭头法上策均衡4 (Dominant-strategy Equilibrium)上策(Dominant-strategy) :不管其它博弈方选择什么策略,一个博弈方的某个策略给他带来的得益至少不低于其他策略。
例:囚徒困境Idea..?5上策均衡与均衡结果:上策均衡(坦白,坦白)均衡得益(-5,-5)“坦白”相对于“抵赖”是每个囚徒的上策(优势策略)-5,-50,-8-8,0-1,-1坦白抵赖坦白抵赖囚徒B囚徒A上策均衡6 (Dominant-strategy Equilibrium)上策均衡:由每个博弈方的上策所组成的策略组合。
一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果。
博弈方2博弈方1A B C a3,22,35,4 b2,11,23,3 c1,61,44,5例寻找上策(优势策略)检查一下你是否存在上策,如果有,就选择它。
站在其他方的位置上思考问题如果你没有上策,那么从其他博弈方角度考虑。
如果其他博弈方有上策,预期他将选择自己的上策。
严格下策:不管其它博弈方的策略如何变化,某种策略给一个博弈方带来的得益总比另一种策略小,称前一种策略为相对于后一种策略的“严格下策”。
1,01,30,40,2左中1,01,3左中1,01,30,10,40,22,0左中右上下211,3中上例:巡逻6,24,48,00,0巡逻不巡逻穷人不巡逻富人WELCOME富人与穷人1112处于强势的博弈方为维护自己利益采取某种决策时,为其他弱势博弈方提供了搭便车的机会公司里的大股东与小股东每一个博弈方针对其他方的每一种策略,在自己的最大可能得益下划线2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争划线法13划线法:通过在最佳对策得益下划线分析博弈的方法。
[数学]第二章完全且完美信息静态博弈
ui (si/,s-i) > ui (si*,s-i)
s-i=(s1,…,si-1,si+1,…,sn)都成立。
…(1)
对任意由其他博弈方此时尚未消去的所有策略构成的策略组合
由于假设si*是纳什均衡(s1*,s2*,…,sn*)的各方策略中第一 个被消去的,因此其他博弈方的策略s1*,…,si-1*,
相对最佳对策总是存在的,不过不一定唯一)。若存在一个
策略组合,使得所有博弈方的得益值下都划了线,则该策略
14:49:49
组合就是一个纳什均衡。
12
例3:博弈G如右图: 上
博弈方Ⅰ
下
博弈方Ⅱ 左 中 右 1,0 1,3 0,1 0,4 0,2 0,0
解:该博弈的纳什均衡为(上,中)。
14:49:49
U
2,8 S 0,8 D 0,8
1,6 0,6 1,5 R
1,8 0,8 0,9
博弈方Ⅰ的策略“S”和“D” 都是策略“U”的严格下策,消去 策略“S”和“D” 后剩下唯一策略 组合(U,R)。
14:49:49
U S D
1,8 0,8 0,9
10
L
2)博弈方Ⅰ的策略“S” 和“D”都是策略“U”的下策
该博弈反复消去严格下策均衡。
14:49:49
严格下策反复消去法中每次消去的必须是严格下策,否
则会出现一些意想不到的结果。
例2:博弈G如下图:
博弈方Ⅱ
U
L 2,8
M 1,6
0,6
R 1,8
0,8
博弈方Ⅰ S 0 , 8 D 0,8
14:49:49
1,5
0,9
9
L
M
应用博弈论第二讲完全信息静态博弈
•
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。
•
例2
为什么中小企业不会花钱去开发新产品 ?
•
完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。
•
生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。
•
例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。
第二章 完全信息静态博弈(博弈论-中南财经政法大学 罗捍东)
进一步推定在某阶段存在si//是相对于si/ 的严格上策,用si//和si/分别代替si/和si时, (2)式和(3)式仍然必须成立,如果si//就是si* , 则与上相同也证明了命题。
否则用si//代替si/重复上述过程。这样, 总会找到某个si(k)就是si*,从而证明在前述假 设下必然导致(1)式和(3)式的矛盾,否定前述 假设成立的可能性,由此证实命题2。
20:46:18
24
如果si/就是si*,即si*是相对于si的严格 上策,则(3)式和(1)式相矛盾,从而s*不是纳 什均衡的假设不能成立。这就证明了命题。
如果si/与si*不同,则si/在严格下策反复消 去的过程中也必须被消去(要不然s*就不会是留 下的惟一的策略组合) 。
20:46:18
25
20:46:18
10
二、纳什均衡的求解方法
1、划线法 对其他博弈方的任一策略组合,找出博 弈方i的最佳策略,并在其得益值下划线。若 存在一个策略组合,使得所有博弈方的得益 值下都划了线,则该策略组合就是一个纳什 均衡。
20:46:18
11
例1:博弈G如右图:
博弈方 Ⅰ
上 下
博弈方Ⅱ 左 中 右 1,0 1,3 0,1 0,4 0,2 0,0
3652假设这些农户在夏天才到公共草地放羊而每年春天就要决定养羊的数量因此可看作各农户在决定自己的养羊数量时是不知道其他农户养羊数的即各农户决定养羊数的决策是同时作出再假设所有农户都清楚这片公共草地最多能养多少只羊和在羊只总数的不同水平下每只羊的产出
第二章 完全信息静态博弈
§1 基本分析思路和方法
一、上策均衡
20:46:18
27
一、古诺(Cournot)模型 古诺模型是研究寡头垄断市场的经典模 型,在古诺模型中,假设一个市场有两家生产 同一种产品厂商。如果厂商1的产量为q1,厂 商2的产量为q2,则市场总产量为Q=q1十q2。 设市场出清价格P(即可以将产品全部卖出去的 价格)是市场总产量的函数(即逆需求函 数)P=P(Q)= Q=(q1 q2)。再设两厂商有相同的 单位生产成本c1=c2=c,且都没有固定成本,则 该博弈中两博弈方的得益(即两厂商各目的利 润)分别为:
完全信息静态博弈
三 纳什均衡
n 纳什均衡与占优战略均衡及重复剔除的占优均 衡:
n (1)每一个占优战略均衡及重复剔除的占优均衡一定 是纳什均衡,但并非每一个纳什均衡都是占优战略均 衡或重复剔除的占优均衡;
n (2)纳什均衡一定是在重复剔除严格劣战略过程中没 有被剔除掉的战略组合,但没有被剔除掉的组合不一 定是纳什均衡,除非它是唯一的(不适用于严格弱劣 战略的情况)
第二章 完全信息静态信息博弈-纳什均衡
n 一 占优战略均衡 n 二 重复剔除的占优均衡 n 三 纳什均衡 n 四 混合战略纳什均衡 n 五 纳什均衡存在性及相关讨论 n 六 纳什均衡应用举例
一 占优战略均衡
n 完全信息静态博弈 ü 完全信息:每个参与人对所有其他参与人的特
征(包括战略空间、支付函数等)完全了解 ü 静态:所有参与人同时选择行动且只选择一次。 ü 同时:只要每个参与人在选择自己的行动时不
四 混合战略纳什均衡
n 社会福利博弈
政府
流浪汉
寻找工作 流浪
2 救济 3,
1 不救济 -1,
3 -1,
0 0,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
猜谜游戏
v两个儿童各 拿一枚硬币,
v若同时正面 朝上或朝下, A给B 1分钱,
v若只有一面 朝上,B给A 1分钱。
零和博弈
博弈参与者有 输有赢,但结 果永远是0。
正面 反面
正面
反面
1 -1,
-1 1,
-1 1,
1 -1,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
n 警察与小偷
1万元
酒馆 东边
小偷
警察
警察与小偷的最优策略各是什么?
第二讲 完全信息静态博弈
得每个参与人的策略是对其他
参与人策略的最优反应。
在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法
箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法
博弈论(第二章)
假设这些农户在夏天才到公共草地放羊,而每年 的春天就要决定养羊的数量。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
博弈论各章节课后习题答案 (2)
π2
= (10 − 4 − 2q2 )q2
−
1 2
− 4q2 ,
∂π2 ∂q 2
= 6 − 4q2
−
4
=
0
,则有
q2=
1 2
,p=5,
π1=
3 2
,π2=0.
若进入者选择不进入:q2=0,p=6,
π1=
7 2
。
由以上计算分析可以看出,垄断在位者的威慑是可信的。垄断在位者的产量为 2,进入
者进入后无利可图,所以选择不进入。市场价格为 6。
(1)
( q1*, q*2,⋯, q*n )组成该博弈的纯策略纳什均衡点。
2
∑ 式(1)两边同时求和,可得:
n
q*i
=
Q*
=
n(a
−
c
−
Q* )
,于是
Q*
=
n (a n +1
−
c)
,
i =1
q*
=
a
−c
−
Q*
=
a−c n +1
,此时
p*=a-Q*=
a + nc n +1
,当
n
趋于无群大时,有
Q*=a-c,
所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。
该博弈还有一个混合的纳什均衡(( 10 , 1 ),( 10 , 1 ))。 11 11 11 11
如果乙企业所在国政府对企业开发新产品补贴 a 个单位,则收益矩阵变为:
⎡−10,−10 + a ⎢⎣ 0,100 + a
100,0⎤ 0,0 ⎥⎦
4. 用图解法求矩阵博弈的解。
经济博弈论 02 完全信息静态博弈(Park)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
第二章 完全信息静态博弈的基本理论解析
1.占优策略与劣策略。
严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。
案例1:霍布斯博弈
假设鲁滨逊与星期五生活在一个自然状态之中。为了生存,他们各自有两个选择:自己生产财富或掠夺对方的财富。博弈情形如下:
乙
生产
掠夺
甲生产
8
8
10
-2
掠夺
-2
10
-1
-1
思考:面对囚徒困境、广告博弈、霍布斯博弈,请思考如何解决社会困境?(答案略;最低价格承诺实际上就是为解决寡头之间的串谋困境提供了有效的解决机制)
第二章完全信息静态博弈的基本理论
0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈
完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。
特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。
占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。
特别提ห้องสมุดไป่ตู้:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。类似地,可以定义局部劣策略与全局劣策略。
第2章完全信息静态博弈
存在问题
▪ 伯特兰德模型之所以会得出这样的结论,与它的前提假 定有关。从模型的假定看至少在以下两方面的问题:
▪ ①假定企业没有生产能力的限制。如果企业的生产能力 是有限的,它就无法供应整个市场,价格也不会降到边 际成本的水平上。
▪ ②假定企业生产的产品是完全替代品。如果企业生产的 产品不完全相同,就可以避免直接的价格竞争。
演唱会
李 亚
足球
2,1
鹏
演唱会 -1,-1
0,0 1,2
某策略组合只有指向的箭头,没有 指离的箭头,则为稳定性的策略组合
猜硬币方
盖
硬 币
正面
方 反面
正面
方面
-1,1 1,-1
1,-1 -1,1
博
弈上 方
1
下
博弈方2
左
中
右
1,0 1,3 0,1
0,4 0,2 2,0
1.3 画线法
由于决策的原则是使自己的得益尽可能的 大。同时由于一方的得益取决于其他方的策 略。
s
令p 为商店i的价格,D (p ,p ) 为需求函数, i=1,2。
i
i 12
如果住在x左边的将都在商店1购买,而住在xs右边的将在商店 s 2购买,需求分别为:
D =x,D =1-x,
1
2
这里x满足 p1+tx=p2+t(1-x)
解上式,得需求函数分别为: D1(p1,p2)=x=(p2-p1+t)/2t D2(p1,p2)=1-x=(p1-p2+t)/2t
第二章
博弈论——完全信息静态博弈
static games of complete formation
完全信息静态博弈
2 完全信息静态博弈
2 政府
救济 3,
3
-1,
1 0 0,
1 )( ( )) ( 01
不救济 -1,
求微分,得到政府最优化的一阶条件:
同样,可以根据流浪汉 的期望效用函数找到政 府的最优混合策略。??
即:流浪汉以0.2的概率选择寻 找工作,0.8的概率选择游荡
四. 混合策略纳什均衡
社会福利博弈
四. 混合策略纳什均衡
社会福利博弈
救济 政府
流浪汉
寻找工作 2 3, 1 不救济 -1, 0, -1, 0 流浪 3
设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的策略都是给定对方混合策略时的最优策略
四. 混合策略纳什均衡
四. 混合策略纳什均衡
策略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
纯策略:如果一个策略规定参与人在每一个给定的信 息情况下只选择一种特定的行动,该策略为 纯策略。 混合策略:如果一个策略规定参与人在给定信息情况 下以某种概率分布随机地选择不同的行动, 则该策略为混合策略。
由于混合策略伴随的是支付的不确定性,因此参与 人关心的是其期望效用。
最优混合策略:是指使期望效用函数最大的混合策 略(给定对方的混合策略) 在两人博弈里,混合策略纳什均衡是两个参与人的 最优混合策略的组合。
支付最大 化法
四. 混合策略纳什均衡
流浪汉
寻找工作 流浪
假定政府的混合战略是 G , ); ( 1 流浪汉的混合战略是 L , )。 ( 1 政府的期望效用函数为: v( G, L) (3 1 ( )( )) 1 (5 1 ) vG 5 1 0 故 * 0.2
02+完全信息静态博弈
i 都成立,则称
s* (s1*,sn* ) 为 G 的一个纳什均衡
通俗的讲:参与人(局中人)单独改变策略不会得到好处的 对局(策略组合),就叫做纳什均衡。
3.1 离散策略空间的博弈纳什均衡分析
1)上策均衡(优势策略均衡) dominant strategy
上策:不管其它参与人选择什么策略,一参与人 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
你的方案: 集中两个师进攻甲 一个师进攻甲,一个师进攻乙 集中两个师进攻乙
敌人的方案: 三个师驻守甲 两个师驻守甲,一个师驻守乙 一个师驻守甲,两个师驻守乙 三个师驻守乙
敌人
a 我军
b
c
A -,+ +,- +,-
B -,+ -,+ +,-
C +,- -,+ -,+
D +,- +,- -,+
Q q1 q2
c1 c2 2
P P(Q) 8 Q
求两厂商的均衡产量?
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12
u2 q2P(Q) c2q2 q2[8 (q1 q2)] 2q2 6q2 q1q2 q22
+,- -,+
诺曼底战役模拟
3) 相对优势策略划线法
情侣博弈:大海喜欢看足球,丽娟喜欢看芭蕾舞。
他们都宁愿在一起,也不愿分开行动。
丽娟
足球
芭蕾
足球 大海 芭蕾
ห้องสมุดไป่ตู้
2,1 0,0
0,0 1,2
本例有两种纳什均衡结果会出现,要么一 起去看足球,要么一起去看芭蕾舞,但在一次博 弈中究竟会出现哪一种???
第2章 完全信息静态博弈
小猪 大 猪 按 按 等待 5,1 9,9,-1 等待 4,4 0,0
丽娟 足球 大 海 足球 演唱会 2,1 -1,-1 ,-1 演唱会 0,0 1,2
某策略组合只有指向的箭头, 某策略组合只有指向的箭头, 没有指离的箭头, 没有指离的箭头,则为稳定性的策 略组合
猜硬币方 正面 正面 反面 -1,1 1,-1 ,-1 方面 1,-1 ,-1 -1,1
盖 硬 币 方
博弈方2 博弈方2 左 博 弈 方 1 上 下 1,0 0, 4 中 1,3 0,2 右 0,1 2, 0
2.1.3 画线法
由于决策的原则是使自己的 得益尽可能的大。 得益尽可能的大。同时由于一方 的得益取决于其他方的策略。 的得益取决于其他方的策略。 因此, 因此,一博弈方首先做的就 是根据其他博弈方的每种策略找 出自己的最佳应对策略。 出自己的最佳应对策略。 画线法就是在上述最佳应对 策略下画线。 策略下画线。
(2)针对a1 = a1* ,有 (2)针对 针对a u2(a1*, a2)=-a2,当a2>= a2* =-a =-a (a u2(a1*, a2)=-a2- L (a1*, a2) , 当a2< a2* 同理 a2*使得-a1*- a2-L (a1*, a2)达到最大, 使得(a 达到最大, 从而使得(a 从而使得-a2-L (a1*, a2)达到最大
2.1.2 箭头法
思路是: 思路是:判断各博弈方能否通过 单独改变自己的策略而改善自己的得益, 单独改变自己的策略而改善自己的得益, 如能,则引一箭头。 如能,则引一箭头。对可能的策略组合都 考察过后, 考察过后,根据箭头反映的情况来判断博 弈的结果。 弈的结果。
柴可夫斯基 乐 队 指 挥
坦白 坦白 不坦白 -10,-10 , -25,0 , 不坦白 0,- ,-25 ,- -1,- ,-1 ,-
经济博弈论完全信息静态博弈
19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
第二章 完全信息静态博弈2016 (2)
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
2.2.1 相对优势策略均衡与纳什均衡
相对优势策略均衡:与严格优势策略均衡和弱优势策
略均衡不同,参与人的相对优势策略,是在他的对手选 定某个策略的条件下他的优势策略。相对优势策略的组 合称为相对优势策略均衡。 S1 ,Sn si j Si 策略空间: 博弈方 i 的第 j个策略: 博弈方 i 的得益: u i 博弈: G {S ,S ; u ,u } 1 n 1 n
2.1.4 箭头法
1, 0
1, 3
0, 1
0, 4
囚 徒 困 境 猜 硬 币
0, 2
2, 0 夫 妻 之 争
-5, -5 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
-1, 1 1, -1
1, -1 -1, 1
箭头法注意事项
1、应用箭头法,要注意箭尾的数字一定比肩
头的小。 2、只有在单独该策略选择给当事人带来更高 的支付的时候,才画相应的箭头。
第二章 完全信息静态博弈
本章介绍完全信息静态博弈。 完全信息静态博弈即各博弈方同时决策, 且所有博弈方对各方得益都了解的博弈。 囚徒的困境、齐威王田忌赛马、猜硬币、 石头剪子布、古诺产量决策都属于这种博弈。 完全信息静态博弈属于非合作博弈最基本 的类型。 本章介绍完全信息静态博弈的一般分析方 法、纳什均衡概念、各种经典模型及其应用等。
2.3.4 公共资源问题
核心的内容:论证公共资源使用的低效
公共草地养羊问题
Q q1 qn V V (Q) 100 Q
以三农户为例 n=3,c=4
完全信息静态博弈习题讲解
1.上策均衡、严格下策反复消去法和纳什均衡相互之间的关系 是什么?
上策均衡是各博弈方绝对最优策略的组合,而纳什均衡则是 各博弈方相对最优策略的组台。因此上策均衡是比纳什均衡 要求更高,更严格的均衡概念。上策均衡一定是纳什均衡, 但纳什均衡不一定是上策均衡。对于同一个博弈来说,上策 均衡的集合是纳什均衡集合的子集,但不一定是真子集。
(2)正确。这是纳什均衡的是本性质之一——奇数性所保证的o (3)不正确。虽然纯策略纳什均衡不一定存在,但在我们所 分析的博弈中混合策略纳什均衡总是存在的。这正是纳什定理的根 本结论。也许在有些博弈中只有惟一的纯策略纳什均衡,没有 严格意义上的混合策略纳什均衡,这时把纯策略理解成特殊的混 合策略,混合策略纳什均衡就存在了。 (4)不正确。囚徒的困境博弈中的(坦白,坦白)就是上策均 衡(同时也是纳什均衡),但该均衡显然不是帕累托最优的,否则该 博弈也不会称囚徒的困境了。
5.下面的得益矩阵表示两搏弈方之间的一个静态博弈。该博弈 有没有纯策略纳什均衡?博弈的结果是什么?
首先,运用严格下策反复消去法的思想,不难发现在博弈方1 的策略中,B是相对于T的严格下策,因此可以把该策略从博弈 方l的策略空间中消去。把博弈方1的B策略消去后又可以发现, 博弈方2的策略中c是相对于R的严格下策,从而也可以消 去。在下面的得益矩阵中相应策略和得益处划水平线和垂直线 表示消去了这些策略。
严格下策反复消左法与上策均衡分别对应两种有一定相 对性的决策分析思路:严格下策反复消去法对应排除法,即 排除绝对最差策略的分析方法;上策均衡对应选择法,即选 择绝对最优策略的均衡概念。严格下策反复消去法和上策均 衡之间并不矛盾,甚至可以相互补充,因为严格下策反复消 去法不会消去任何上策均衡,但却可以简化博弈。
第二章 完全信息静态博弈(三及四)
举例四——小偷与守卫
解释: 解释:
现实中没有哪个小偷或守卫有能力或意识来 寻找上述最佳概率选择,多次反复也不现实; 寻找上述最佳概率选择,多次反复也不现实; 纳什均衡的理性主义解释和群体解释; 纳什均衡的理性主义解释和群体解释; 上述策略选择可以解释为: 上述策略选择可以解释为:某个地区偷窃发 生的的频率和该地区所有守卫中偷懒与勤勉者 的比例, 的比例,混合策略纳什均衡就是上述频率和比 例之间的平衡关系。 例之间的平衡关系。
举例(二)——田忌赛马
得益矩阵
混合策略纳什均衡?均衡时的双方得益?
反应函数法
反应函数是一博弈方对其他博弈方每种可能的 策略组合的最佳对策组成的函数。 策略组合的最佳对策组成的函数。在纯策略意义 下,反应函数是各博弈方选择的纯策略对其他博 弈方纯策略的最佳反应。在混合策略意义下, 弈方纯策略的最佳反应。在混合策略意义下,博 弈方的决策内容为选择概率分布, 弈方的决策内容为选择概率分布,反应函数就是 一方对其他各方的概率分布的最佳反应, 一方对其他各方的概率分布的最佳反应,同样也 是某个概率分布。 是某个概率分布。
2 , 3 3 , 1
5 , 2 1 , 5
混合策略纳什均衡?均衡时的双方得益?
期望得益等值法
令各个博弈方随机选择纯策略的概率分 满足使其他博弈方采用不同纯策略的期望 采用不同纯策略 布,满足使其他博弈方采用不同纯策略的期望 得益相同,即无可乘之机, 得益相同,即无可乘之机,从而计算出各个博 弈方随机选择各纯策略的概率。 弈方随机选择各纯策略的概率。
多重均衡博弈与混合策略
性别之战(夫妻之争 例1性别之战 夫妻之争 性别之战 夫妻之争) 丈夫 芭蕾 妻子 芭蕾 足球 2,1 0,0 足球 0,0 1,3
02 完全信息静态博弈
假设C为单位成本,则两商店的利润分别为
( p , p ) ( p c) D ( p , p ) ( p , p ) ( p c) D ( p , p )
当a=1-b时,即两商店位于同一位置,完全无差异,则
p
*
1
p
* 2
c
如果企业的竞争战略是价格,则Bertrand证明,即使只 有两个企业,在均衡情况下,价格等于边际成本,企业的 利润为零,与完全竞争市场均衡一样。这就是“伯川德悖 论(Bertrand Paradox)”。 解开这个悖论的办法之一就是引入产品的差异性。
* * ,sn ) 的各一个策略组成的某个策略组合 (s1 中,任一参与人
* * 的策略,都是对其余参与人策略的组合 (s1 ,si*1 , si*1 ,...sn )
* * * * ,si*1, si* , si*1,...sn ) ui (s1 ,si*1, si , si*1,...s, 的最佳对策,即 ui (s1 n)
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1
6q1 q1q2 q12
u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2
6q2 q1q2 q22
古诺模型的反应函数
maxu1 max(6q1 q1q2 q12 )
* * ( ui (si* , s )对任意 s S i 都成立,则称 ) u ( s , s i i i i )
i
s
*
* * ( s1 , sn ) 为 G 的一个纳什均衡
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
习题讲解
1.上策均衡、严格下策反复消去法和纳什均衡相互之间的关系 是什么? 上策均衡是各博弈方绝对最优策略的组合,而纳什均衡则是 各博弈方相对最优策略的组台。因此上策均衡是比纳什均衡 要求更高,更严格的均衡概念。上策均衡一定是纳什均衡, 但纳什均衡不一定是上策均衡。对于同一个博弈来说,上策 均衡的集合是纳什均衡集合的子集,但不一定是真子集。 严格下策反复消左法与上策均衡分别对应两种有一定相 对性的决策分析思路:严格下策反复消去法对应排除法,即 排除绝对最差策略的分析方法;上策均衡对应选择法,即选 择绝对最优策略的均衡概念。严格下策反复消去法和上策均 衡之间并不矛盾,甚至可以相互补充,因为严格下策反复消 去法不会消去任何上策均衡,但却可以简化博弈。 严格下策反复消去法与纳什均衡也是相容和补充的,因 为严格下策反复消去法把严格下策消去时不会消去纳什均衡, 但却能简化博弈,使纳什均衡分析更加容易。
2.为什么说纳什均衡是博弈分析中最重要的概念?
之所以说纳什均衡是博弈分析(非合作博弈分析)最重要的概念, 主要原因是纳什均衡与其他博弈分析概念和分析方法相比,具 有两方面的优秀性质。第一是一致预测性质。一致预测性是保 证纳什均衡具有内在稳定性,能作出可靠的预测的根本基础。 而且只有纳什均衡才有这种性质,其他均衡概念要么不具有— · 致预测性,要么本身也是纳什均衡,是纳什均衡的组成部分, 因此一致预测性是纳什均衡的本质属性。 第二是普遍存在性。纳什定理及其他相关定理保证在允许 采用混合策略的情况下,在我们关心的所有类型博弈中都存在 纳什均衡。这意味着纳什均衡分析方法具有普遍适用性。相比 之下,其他各种均衡概念和分析方法,如上策均衡、严格下策 反复消去法、严格上策均衡等,则可能在许多博弈中不存在, 从而限制了它们的作用和价值。 纳什均衡是惟一同时具有上述两大性质的博弈分析概念, 而且它也是其他各种博弈分析方法和均衡概念的基础,因此纳 什均衡是博弈分析中最重要、作用最大的概念。
(1)错误。只要任一博弈方单独改变策略不会增加得益,策略组合 就是纳什均衡了。单独改变策略只能得到更小得益的策略组合是严 格纳什均衡,是比纳什均衡更强的均衡概念。 (2)正确。这是纳什均衡的是本性质之一——奇数性所保证的o (3)不正确。虽然纯策略纳什均衡不一定存在,但在我们所 分析的博弈中混合策略纳什均衡总是存在的。这正是纳什定理的根 本结论。也许在有些博弈中只有惟一的纯策略纳什均衡,没有 严格意义上的混合策略纳什均衡,这时把纯策略理解成特殊的混 合策略,混合策略纳什均衡就存在了。 (4)不正确。囚徒的困境博弈中的(坦白,坦白)就是上策均 衡(同时也是纳什均衡),但该均衡显然不是帕累托最优的,否则该 博弈也不会称囚徒的困境了。
两个博弈方各消去一个策略后的博弈是如下的两人2×2博弈, 已经不存在任何严格下策。再运用划线法或箭头法,很容易发 现这个2×2博弈有两个纯策略纳什均衡(M,L)和(T,R)o
6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。
根据计算混合策略纳什均衡的一般方法,设博弈方1采用
1、判断下列表述是否正确,并作简单分析: (1)纳什均衡即任一博弈方单独改变策略都只能得到更小利 益的策略组合。 (2)如果一博弈有两个纯策略纳什均衡,则一定还存在一个混 合策略均衡。 (3)纯策略纳什均衡利混合策略纳什均衡都不一定存在。 (4)上策均衡一定是帕累托最优的均衡。
5.下面的得益矩阵表示两搏弈方之间的一个静态博弈。该博弈 有没有纯Байду номын сангаас略纳什均衡?博弈的结果是什么?
首先,运用严格下策反复消去法的思想,不难发现在博弈方1 的策略中,B是相对于T的严格下策,因此可以把该策略从博弈 方l的策略空间中消去。把博弈方1的B策略消去后又可以发现, 博弈方2的策略中c是相对于R的严格下策,从而也可以消 去。在下面的得益矩阵中相应策略和得益处划水平线和垂直线 表示消去了这些策略。
3.找出现实经济或生活中可以用帕累托上策均衡、风险上 策均衡 分析的例子。 帕累托上策均衡通常在分析存在多重纳什均衡,不同纳什均衡 之间有优劣关系的博弈问题时有用,因此适合采用讨论现实中 我们常说的共赢、多赢可能性或者条件等。例如两个企业之间 的技术、投资合作,劳资关系,或者两个国家之间政治、军事 和外交冲突等往往都可以用帕累托上策均衡概念进行分析。风 险上策均衡通常是在有一定不确定性,而且不确定性主要来源 于客观因素、环境因素的博弈问题。例如人们对就业行业和职 业的选择,人们在银行存款和股市投资之间的选择,以及投资 和产品、技术开发方面的决策等问题都可以用风险上策均衡概 念进行分析。
多重纳什均衡是否会影响纳什均衡的一致预测性质, 对博弈分析有什么不利影响?
多重纳什均衡不会影响纳什均衡的一致预测性质。这 是因为一致预测性不是指各个博弈方有一致的预测, 而是指每个博弈方自己的策略选择与自己的预测一致。 对博弈分析主要的不利影响是,当博弈存在多重 纳什均衡,而且相互之间没有明确的优劣之分时,会 造成预测分析的困难,影响以纳什均衡为核心的博弈 分析的预测能力。存在帕累托上策均衡、风险上策均 衡、聚点均衡或相关均衡的可能性,并且博弈方相互 之间有足够的默契和理解时,多重纳什均衡造成的不 利影响会较小。