应用博弈论第二讲完全信息静态博弈

合集下载

博弈论2 完全信息静态博弈

博弈论2 完全信息静态博弈

上策(Dominant-strategy):
如果不管其它博弈方选择什么策略,一博 弈方的某个策略给他带来的得益始终高于 其他策略,至少不低于其他策略。
进一步,如果一个博弈的某个策略组合中 的所有策略都是各个博弈方各自的上策, 那么这个策略组合肯定是所有博弈方都愿 意选择的,必然是该博弈比较稳定的结果。 称这样的策略组合为该博弈的一个“上策 均衡”( Dominant-strategy Equilibrium)。
0,0
1,1 0,0
R2
R3
纳什均衡:举例

广告博弈
战略 做广告
企业2
做广告 不做广告 4,4 15,1 10,10
企业1
不做广告 1,15

纳什均衡:(做广告,做广告)

考虑团队生产:
工作 工作 偷懒 偷懒
6,6
8,0
0,8
2,2
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
2.1.1 上策均衡——应用
上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来 的得益始终高于其它的策略,至少不低于其他策略的策略。 囚徒的困境 中的“坦白”;双寡头削价中“低价”。
囚徒 2 坦 白 囚 徒 1 坦 白 不坦白 -5, -5 -8, 0 不坦白 0, -8 -1, -1
两个罪犯的得益矩阵
纳什均衡de具体表述
寡头2 高 价 低 价 寡 头 1 高 价 低 价 100,100 20,105
150,20
70,70
双寡头的得益矩阵

(低价,低价)是纳什均衡
* * u1 (低价1 , 低价* ) u ( 高价 , 低价 2 1 1 2) * * u2 (低价1 , 低价* 2 ) u2 (低价 1 , 高价2 )

第二章完全信息静态博弈2

第二章完全信息静态博弈2
第二章完全信息静态博弈2
1
2021/2/22
本章重点讨论
一、博弈论的若干基本概念
占优战略均衡(Dominant strategy equilibrium,DSE) 重复剔除占优均衡(Iterated dominance equilibrium,IEDE) 纳什均衡(Pure Nash equilibrium,PNE) 混合战略纳什均衡(Mixed strategy Nash equilibrium,MNE)
2021/2/22
博弈:参与人
选择行动 战略
寻找最优目标(Max)支付
静态时:策略与行动一致,因为没有任何可能影响参与人行动选择的
信息被披露出来。
2
二、纳什均衡应用举例
1、Cournot寡头竞争模型(1838) 纳什均衡(1950)
2、豪泰林(Hotelling)价格竞争模型
3、公共地的悲剧(Tragedy of the commons)
② 旅行成本为td2,这里d是消费者到商店的距离
这里仍有 D1=x,D2=1-x,但这里 x应满足:
p 1 t( x a ) 2 p 2 t [ x ( 1 b ) ] 2 ( 3 )
解方程(3):p1t(x22axa2)p2t[x22(b1)x(b1)2]
p1p2 2t(1ab)x(1ab2a)(1ab)(1)t
若上例,若市场由(两企业构成的统一垄断企业控制)
其模型为:Max(q1q2)p(q1q2)[c1(q1)c2(q2)]
(q1q2[a(q1q2)])c(q1q2)
(q1q2[a(q1q2)])c(q1q2) Q(aQ)cQ (这里q1q2Q) 垄断企业利润最大化条件MR=MC
又 已 知 p a (q1 q2 ) AR M R a 2(q1 q2 ) a 2Q M C d (q1 q2 ) c c dQ

应用博弈论第二讲完全信息静态博弈

应用博弈论第二讲完全信息静态博弈
生活中其实有很多相关的例子。

生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。

例2
为什么中小企业不会花钱去开发新产品 ?

完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。

生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。

例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。

博弈论全套上课课件ch2 完全信息静态博弈

博弈论全套上课课件ch2 完全信息静态博弈


上 下
南京农业大学经济管理学院 王艳
22
重复剔除严格劣战略的缺陷

1、假定“参与者是理性的”是共同知识。 2、预测结果不精确。
女 足球 男 足球 2,1 0,0 芭蕾 0,0 1,2
芭蕾
南京农业大学经济管理学院 王艳
23
应用部分

古诺模型 伯川德模型 豪泰林模型 公共地的悲剧
南京农业大学经济管理学院 王艳
对上式求导,令其等于零。得到企业1的最 优反应函数:
ac 1 N R(q2 , q3 ,..., qN ) qi 2b 2 i 2
南京农业大学经济管理学院 王艳
15
教科书博弈: 重复剔除的占优均衡
张教授
李教授
400页 600页 800页
400页 45,45 50,15 40,10
600页 15,50 40,40 45,15
800页 10,40 15,45 35,35
南京农业大学经济管理学院 王艳
16
3、纳什均衡
纳什均衡:在博弈 G {S1,Sn ; u1,un } 中,如果由各 si* , sn* 个博弈方的各一个策略组成的某个策略组合 中,任一博弈方i 的策略,都是对其余博弈方策略 * 的组合 si* , si*1 , si*1 ,...sn 的最优反应战略,也即 * * * * * * * * * ui (s1 ,si1, si , si1,...sn ) ui (s1 ,si1, si , si1,...sn ) * * 对任意 si Si 都成立,则称 si , sn 为G 的一个纳 什均衡。
人的最优战略是唯一的,这样的最优战略称为 “占优战略”(dominant strategy)。

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈

囚徒困境在经济学上有着广泛的应用。 例1:两个寡头企业选择产量的博弈。如果两个企业联合起来形成卡特尔,选择垄 断利润最大化的产量,每个企业都可以得到更多的利润。但卡特尔不是一个稳定 的均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果是,每 个企业都只得到小于最大利润的产量,利润严格小于卡特尔产量下的利润。 在有些情况下,个人理性和集体理性的冲突对社会来说也许是一件好事,尽管对 集体而言是一件坏事。
第2讲 完全信息静态博弈
下继续生活下去。 从囚徒困境中,我们可以引出一个很重要的结论:一种制度(体制)安排,要发 生效力,必须是一种均衡。否则,这种制度安排不能成立。
第2讲 完全信息静态博弈

3.重复剔除的占优均衡 在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在 绝大数博弈中,占优战略均衡是不存在的。
第2讲 完全信息静态博弈

在“智猪博弈”中,我们先剔除掉小猪的劣战略“按”,在剔除掉这个战略后的 新的博弈中,小猪只有一个战略“等待”,大猪仍有两个战略,但此时,“等待” 已成为大猪的劣战略,提出这个战略,剩下的唯一战略组合是(按,等待)。
第2讲 完全信息静态博弈

我们需要对“占优战略”和“劣战略”的概念进行重新定义。


都是(相对于si*的)劣战略。 在应用重复剔除方法寻找均衡时,一个战略是占优战略或劣 战略可能是相对于另一个特定的战略而言的。
第2讲 完全信息静态博弈
' ' ' 定义:令si 和s? 是参与人 i 可选择的两个战略(即 s i i Si, ' s’ i Si)。如果对于任意的其他参与人的战略组合s -i,参与人 ' ' i的选择si 得到的支付严格小于从选择s? i 得到的支付,即:

第二讲 完全信息静态博弈

第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。


在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法

博弈2:完全信息静态博弈

博弈2:完全信息静态博弈

纳什均衡的精髓就在于“单独偏离 没有好处”!
二、纳什均衡应用实例



构建博弈模型的分析方法 Cournot寡头垄断模型 Bertrand寡头垄断模型 Hotelling价格竞争模型 公共地悲剧 公共物品的私人自愿供给 最后要价仲裁
构建博弈模型的分析方法
(1)把问题的非正式描述转化为博弈的标准式 表述;
一阶条件
对每个企业的利润函数求一阶导数,得: 1/q1=P(q1+q2)+q1P’(q1+q2)-C1’(q1)= 0

2/q2=P(q1+q2)+q2P’(q1+q2)-C2’(q2)= 0

上述一阶条件分别定义了两个反应函数,意味 着每个企业的最优战略(产量)是另一个企业 产量的函数。
(2)求解该博弈的纳什均衡; (3)解释问题。
纳什均衡及其求法


称策略组合s*=(s1*, s2*, …, sn*)为纳什均衡,若 ui(si*, s-i*)≥ui(si, s-i*), si∈Si 或者si*是以下最优化问题的解: si*∈argmax ui (s1*, s2*, …si-1*, si, si+1*,…, sn*) , si∈Si,i=1, 2, …, n.。 对最优化问题的求解,是用一阶条件方法: 对每一个式子求一阶导数,令其等于0,得到n个反 应函数 再求解这个n元方程组,其解即为纳什均衡。
如果住在x的消费者在两个商店之间是无差异的,那么,所有住在x左边的 将都在商店1处购买,而住在x右边的将在商店2处购买,需求分别为: D1=x D2=1-x 这里X满足: P1+tx=P2+t(1-x) 可以解得: X=(P2-P1+t)/2t D1(P1,P2)=x =(P2-P1+t)/2t D2(P1,P2)=1-x = =(P1-P2+t)/2t 利润函数分别为: π1(P1,P2)=(P1-c)D1(P1,P2) π2(P1,P2)=(P2-c)D2(P1,P2) 可以求得: P1*=P2*=c+t 每个商店的均衡利润为: π1= π2=t/2 从中可以看出,无论是利润还是产品价格均取决于旅行成本。随着旅行成 本的上升,价格越来越高。原因在于,随着旅行成本的上升,不同商店出售 的产品之间的替代性下降,商店的垄断力上升,商店之间的竞争也就越来越 弱。

第二章(完全信息静态博弈)PPT课件

第二章(完全信息静态博弈)PPT课件

q2 R2(q1)
(3,0) (6,0)
q1
图2.9 古诺模型的反应函数几何描述
2021
27
三、伯特兰德寡头模型——价格博弈
当厂商1和厂商2价格分别是 P1 和 P2 时,它们各 自的需求函数为 :
q 1 q 1 ( P 1 ,P 2 ) a 1 b 1 P 1 d 1 P 2 q 2 q 2 ( P 1 ,P 2 ) a 2 b 2 P 2 d 2 P 1
一、纳什均衡的定义
n个参与人的策略式表达博弈:G {S1, ,Sn;u1, un},
策略组合 S*{S1 *, ,Si*, Sn *}是一个纳什均衡,如果
对于每一个
i,s
* i
是给定其他所有参与人选择
S * 1 { S 1 * , ,S i* 1 ,S i* 1 S n * }的情况下第 i个参与人的
2021
17
三、纳什均衡与上述分析方法的关系
(一)纳什均衡与上策均衡的关系 上策均衡是比纳什均衡更强、稳定性更高的均衡 概念
纳什 均衡
上策均衡
图2.8 纳什均衡与上策均衡的关系
2021
18
G { S 1, ,S n;u 1, u n}
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G {S1, ,Sn;u1, un}中,
2021
16
正是由于纳什均衡是一致性预测,因此才进一 步有下列性质:首先,各博弈方可以预测它,可以 预测他们的对手会预测它,还可以预测他们的对手 会预测自己会预测它,……;其次,预测任何非纳 什均衡策略组合将是博弈的最终结果,意味着要么 各博弈方的预测其实并不相同(预测不同的纳什均 衡会出现等),要么预期至少一个博弈方要“犯错 误”,包括对博弈结构理解的错误,对其他博弈方 的策略预测错误,其理性和计算能力有问题,或者 是实施策略时会出现差错等。

02+完全信息静态博弈

02+完全信息静态博弈

i 都成立,则称
s* (s1*,sn* ) 为 G 的一个纳什均衡
通俗的讲:参与人(局中人)单独改变策略不会得到好处的 对局(策略组合),就叫做纳什均衡。
3.1 离散策略空间的博弈纳什均衡分析
1)上策均衡(优势策略均衡) dominant strategy
上策:不管其它参与人选择什么策略,一参与人 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
你的方案: 集中两个师进攻甲 一个师进攻甲,一个师进攻乙 集中两个师进攻乙
敌人的方案: 三个师驻守甲 两个师驻守甲,一个师驻守乙 一个师驻守甲,两个师驻守乙 三个师驻守乙
敌人
a 我军
b
c
A -,+ +,- +,-
B -,+ -,+ +,-
C +,- -,+ -,+
D +,- +,- -,+
Q q1 q2
c1 c2 2
P P(Q) 8 Q
求两厂商的均衡产量?
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12
u2 q2P(Q) c2q2 q2[8 (q1 q2)] 2q2 6q2 q1q2 q22
+,- -,+
诺曼底战役模拟
3) 相对优势策略划线法
情侣博弈:大海喜欢看足球,丽娟喜欢看芭蕾舞。
他们都宁愿在一起,也不愿分开行动。
丽娟
足球
芭蕾
足球 大海 芭蕾
ห้องสมุดไป่ตู้
2,1 0,0
0,0 1,2
本例有两种纳什均衡结果会出现,要么一 起去看足球,要么一起去看芭蕾舞,但在一次博 弈中究竟会出现哪一种???

经济博弈论完全信息静态博弈

经济博弈论完全信息静态博弈

19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。

经济博弈论02完全信息静态博弈(Park)

经济博弈论02完全信息静态博弈(Park)

合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。

博弈论以及应用之2完全信息静态博弈

博弈论以及应用之2完全信息静态博弈

注册会计师 B 隐瞒 实报 注册会计师 A 隐瞒 实报 5,5 6,-1 -1,6 0,0
2010-10-29
8
1、囚徒困境与占优均衡VIII
委托-代理(principal-agent)关系中被设计的囚徒困境
压低供应商价格
假设:两供应商成本都为6元/件,报价都为10元/件。 策略:如果二者报价都为10元/件或8.5元/件,则从每家订购 50件;若一家报价10元/件而另一家报价8.5元/件,则从价低 者订购100件。 100
很多博弈具有多个纳什均衡,比如以上讲到的麦琪的礼物、 性别战、斗鸡博弈与协调博弈等,称为多重均衡。 在某些具有多重均衡的博弈中,各个博弈方偏好于不同的 均衡结果,如麦琪的礼物、性别战和斗鸡博弈;而在另一 些具有多重均衡的博弈中,各个博弈方偏好于同一个均衡 结果,如协调博弈。 那么,博弈方如何使自己偏好的均衡称为实际的均衡结果 呢?这就是多重均衡的协调问题。
2010-10-29
5
1、囚徒困境与占优均衡V
如何走出囚徒困境?
可信的(由第三方实施的、据说黑社会中存在的)报复 历史上的 “人质”或“通婚”方案 军队中的(有些企业试图培养的)“忠诚”文化 长期重复关系
2010-10-29
6
1、囚徒困境与占优均衡VI
委托-代理(principal-agent)关系中被设计的囚徒困境
2010-10-29
不剪 2,1 0,0
17
卖表 不卖
0,0 1,2
3、最优反应与画线法III
练习:用画线法求解下列博弈的纳什均衡
性别战博弈 韩剧 妻子 斗鸡博弈 韩剧 足球 2,1 0,0 丈夫 足球 0,0 1,2
公鸡1 进攻 后退 后退 进攻 1,1 2,-2 -2,2பைடு நூலகம்-4,-4

第2章_完全信息静态博弈

第2章_完全信息静态博弈
* q2 R2 ( q1 )
2.3.1 古诺的寡头模型
反应函数:是指每个博弈方针对其他博弈方所有战略的最佳反应构成 的函数。 纳什均衡就是各个博弈方的一组互为最佳反应对策的战略。
2.1.1 占优战略均衡(上策均衡)
开发商B 需求大的情况 开发商A 不开发 开发 开发 4000,4000 0,8000 不开发 8000,0 0,0 开发商B B严格劣 战略
A严格劣 战略
需求小的情况
开发
开发 开发商A 不开发 0,1000 -3000,-3000
不开发
1000,0 0,0
2.1.1 占优战略均衡(上策均衡)
-8, -8 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
-1, 1 1, -1
1, -1 -1, 1
2.1.4 箭头法
基本思路
对博弈中每个策略组合进行分析,考察在每个策略组合
处各个博弈方能否通过单独改变自己的策略而增加得益。
如能,则从所分析的策略组合对应的得益数组引一箭头, 到改变策略后策略组合对应的得益数组。最后综合分析 对每个策略组合的分析情况,形成对博弈结构的判断。
有任何人有积极性破坏这个协议,则这个协议是自动
实施的。这个协议就构成了一个纳什均衡。
2.2 纳什均衡
通俗地说,纳什均衡的含义就是:
给定你的策略,我的策略是最好的策略;给定我的策略,
你的策略也是你的最好的策略。即双方在给定的策略下
不愿意调整自己的策略。
2.2 纳什均衡
寻找纳什均衡
参与人B
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)

Lecture 2 完全信息静态博弈

Lecture 2 完全信息静态博弈

* * q1* arg max 1 (q1, q2 ) arg max q1P(q1 q2 ) C1 (q1 )
* q2 arg max 2 (q1* , q2 ) arg max q2 P(q1* q2 ) C2 (q2 )
纳什均衡是完全信息博弈解的一般概念,构成纳什均衡的策
每一个占优策略均衡、重复剔除的占优均衡一定是纳什均衡
,但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优 均衡。
略一定是重复剔除严格劣过程 中不能被剔除的策略。也就是说 ,没有任何一个策略严格优于纳什均衡策略。
纳什均衡一定是在重复剔除严格劣策略过程中没有被剔除掉
如果这样的解存在,我们说该博弈是“重复剔除占优可解的
2.3 可理性化策略
L
参与人A U D 0,3 参与人B M
R
1,0
1,2 0,1
参与人B
0,1 2,0
M
L
参与人A U D
1, 0 0, 3
1, 2 0, 1
参与人B L M
1, 0
1, 2
2.3 可理性化策略
参ቤተ መጻሕፍቲ ባይዱ人关于彼此理性和博弈结构的共同知识,可以使我们剔
我们同样可以通过重复剔除决不是最优反应的方式来减少策 可理性化策略的集合不会比通过了重复剔除严格劣策略的策
略集合更大。
略的范围。通过了这样重复剔除的策略,被称为参与人������ 的“可 理性化”策略。
2.3 可理性化策略
“可理性化策略”
策略������������ 是参与人������对竞争对手策略������−������ 的一个最优反应,如果
10000之间的整数。定义所有参与人所写数字最大值的9/10作 为目标数字(如果不是整数则向下取整)。所写数字正好为该 目标数字的参与人平分5000元。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8
修路博弈
修 甲
不修
乙 修
1, 1
3, -1
不修
-1, 3 0, 0
9
我们看到,对甲和乙两家居民来说, “修路”都是劣战略,因而他们都不会 出资修路。
这里,为了解决这条新路的建设 问题,需要政府强制性地分别向每家征 税2单位,然后投入4单位资金修好这条 对大家都有好处的路,并使两家居民的 生活水平都得到改善。
14
适合用严格下策反复消去法分析的例子
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去:
左中

上 1,0 1,3 0,1
下 0,4 0,2 2,0
左 1,0 0,4
中 1ห้องสมุดไป่ตู้3 0,2
左 1,0
中 1,3
15
智猪博弈
仍然是一个修路博弈,但是这个博 弈与我们前面介绍的修路博弈有点不同。 村里住两户人家,一户福,一户穷,有 一条路年久失修。博弈的情形如下图所 示(修路给富人带来的效用要大)。这 个博弈又称为智猪博弈(富人是大猪, 穷人是小猪)。
10
这就是我们看到的为什么大多数 路、桥等公共设施都是由政府出资修建 的原因。
同样的道理,国防、教育、社会 保障,环境卫生等都由政府承担资金投 入,私人一般没有积极性承担这方面服 务的积极性和能力。
11
类似的例子还有:
渤海中的鱼愈来愈少了,工业化中的大 气及河流污染,森林植被的破坏等。解决公共 资源过度利用的出路是政府制订相应的规制政 策加强管理,如我国政府规定海洋捕鱼中,每 年有一段时间的“休渔期”,此时禁止捕鱼, 让小鱼苗安安静静地生长,大鱼好好地产卵, 并对鱼网的网眼大小作出规定,禁用过小网眼 的捕网打鱼,保护幼鱼的生存。又如在三峡库 区,为了保护库区水体环境,关闭了前些年泛 滥成灾的许多小造纸厂等。
们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。
6
生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。
7
例子 为什么政府要负责修建公共设施,因 为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付) 为3-4/2=1;当只有一户人家单独出资修路时, 修 路 的 居 民 获 得 的 支 付 为 3-4=-1 ( 亏 损 ) , “搭便车”不出资但仍然可以使用修好的路的 另一户人家获得支付3-0=3,见表2。
12
上策均衡分析存在的问题
这里的问题是并非每个博弈方都有这种绝 对偏好的上策,而且常常是所有博弈方都没有 上策,因为博弈方的最优策略随其他博弈方的 策略而变化正是博弈问题的根本特征,是博弈 关系相互依存性的主要表现形式。因此上策均 衡不是普遍存在的。
13
2.1.2 严格下策反复消去法
如同寻找每个博弈方最优的策略思路一样, 如果找到每一个博弈方的最差策略,则可以将 其消去。一般地,如果在一个博弈中,不管其 他博弈方的策略如何变化,一个博弈方的某种 策略给他带来的得益,总是比另一种策略给他 带来的得益要小,那么我们称前一种策略为相 对于后一种策略的一个“严格下策”。很显然, 任何理性的博弈方都不可能采用严格下策,因 此可以将其消去。
第二章 完全信息静态博弈
1
博弈的通俗理解
博弈论(学术味浓厚一些),译自英文Game theory,直译应该是游戏理论。一般来讲,日常 生活中,下棋打牌、赌胜博彩,以及田径、球类 等各种体育比赛,都是游戏。
2
博弈的通俗理解
游戏有以下特征(打牌为例):(1)都 有一定的规则,几副牌,几个打,可以做什 么,不可以做什么,按什么次序出牌,犯规 了怎样处置等等。(2)都有一个结果。是输 还是赢,升几级等。(3)策略至关重要,先 出什么再出什么都蕴涵着策略,不同的策略 选择带来不同的结果。(4)策略和利益有相 互依存性,即每一个游戏者所得结果的好坏, 不仅取决于自身的策略选择,也取决于其他 参加者的策略选择。
生活中其实有很多相关的例子。
20
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖, 即所谓“散户跟大户”的现象。
21
例2
为什么中小企业不会花钱去开发新产品? 在技术创新市场上,大企业是大猪,它
4
剪刀、石头、布

石头

剪子

1

石头
0, 0 -1, 1 1, -1
博弈方2
剪子 1, -1 0, 0 -1, 1

-1, 1 1, -1 0, 0
5
第二节 寻找博弈均衡
2.1 上策均衡 在某个博弈中,如果不管其他博弈方
选择什么策略,一博弈方的某个策略给 他带来的得益始终高于其他策略,我们 称这种策略为该博弈方的一个“上策”。 进一步,如果一个博弈的某个策略组合 中的所有策略都是各个博弈方各自的上 策,我们称这样的策略组合为该博弈的 一个“上策均衡”。
3
完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1) 各博弈方一次性的、同时决策(如剪刀、 石头、布的游戏,以及囚徒困境),(2) 所有博弈方对各方得益都了解的博弈, 即各博弈方都完全了解所有博弈方在各 种情况下的得益。
见下页具体实例(石头、剪子、布游戏) 来理解什么是完全信息静态博弈。
博弈模型见下图。
16
习题2 智猪博弈
穷人

不修
富人 修 5,1 4,4
不修 9,-1 0,0
17
求解(第一步)
富修 人 不修
穷人

不修
5,1 4,4 9,-1 0,0
18
求解(第二步)
穷人
修 富 人 不修
不修
4,4 0,0
19
富户与穷户修路博弈的启示
这时候,富户一般会承担起修路的责 任,穷户则很少这样干,因为富户家常 常是高朋满座,坐车坐轿的都来,而穷 户家只是穿着破鞋走路,路修好了他走 起来舒服,路不修他也无所谓。
相关文档
最新文档