应用博弈论第二讲完全信息静态博弈

合集下载

博弈论2 完全信息静态博弈

博弈论2 完全信息静态博弈

上策(Dominant-strategy):
如果不管其它博弈方选择什么策略,一博 弈方的某个策略给他带来的得益始终高于 其他策略,至少不低于其他策略。
进一步,如果一个博弈的某个策略组合中 的所有策略都是各个博弈方各自的上策, 那么这个策略组合肯定是所有博弈方都愿 意选择的,必然是该博弈比较稳定的结果。 称这样的策略组合为该博弈的一个“上策 均衡”( Dominant-strategy Equilibrium)。
0,0
1,1 0,0
R2
R3
纳什均衡:举例

广告博弈
战略 做广告
企业2
做广告 不做广告 4,4 15,1 10,10
企业1
不做广告 1,15

纳什均衡:(做广告,做广告)

考虑团队生产:
工作 工作 偷懒 偷懒
6,6
8,0
0,8
2,2
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
2.1.1 上策均衡——应用
上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来 的得益始终高于其它的策略,至少不低于其他策略的策略。 囚徒的困境 中的“坦白”;双寡头削价中“低价”。
囚徒 2 坦 白 囚 徒 1 坦 白 不坦白 -5, -5 -8, 0 不坦白 0, -8 -1, -1
两个罪犯的得益矩阵
纳什均衡de具体表述
寡头2 高 价 低 价 寡 头 1 高 价 低 价 100,100 20,105
150,20
70,70
双寡头的得益矩阵

(低价,低价)是纳什均衡
* * u1 (低价1 , 低价* ) u ( 高价 , 低价 2 1 1 2) * * u2 (低价1 , 低价* 2 ) u2 (低价 1 , 高价2 )

博弈论全套上课课件ch2 完全信息静态博弈

博弈论全套上课课件ch2 完全信息静态博弈


上 下
南京农业大学经济管理学院 王艳
22
重复剔除严格劣战略的缺陷

1、假定“参与者是理性的”是共同知识。 2、预测结果不精确。
女 足球 男 足球 2,1 0,0 芭蕾 0,0 1,2
芭蕾
南京农业大学经济管理学院 王艳
23
应用部分

古诺模型 伯川德模型 豪泰林模型 公共地的悲剧
南京农业大学经济管理学院 王艳
对上式求导,令其等于零。得到企业1的最 优反应函数:
ac 1 N R(q2 , q3 ,..., qN ) qi 2b 2 i 2
南京农业大学经济管理学院 王艳
15
教科书博弈: 重复剔除的占优均衡
张教授
李教授
400页 600页 800页
400页 45,45 50,15 40,10
600页 15,50 40,40 45,15
800页 10,40 15,45 35,35
南京农业大学经济管理学院 王艳
16
3、纳什均衡
纳什均衡:在博弈 G {S1,Sn ; u1,un } 中,如果由各 si* , sn* 个博弈方的各一个策略组成的某个策略组合 中,任一博弈方i 的策略,都是对其余博弈方策略 * 的组合 si* , si*1 , si*1 ,...sn 的最优反应战略,也即 * * * * * * * * * ui (s1 ,si1, si , si1,...sn ) ui (s1 ,si1, si , si1,...sn ) * * 对任意 si Si 都成立,则称 si , sn 为G 的一个纳 什均衡。
人的最优战略是唯一的,这样的最优战略称为 “占优战略”(dominant strategy)。

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈

囚徒困境在经济学上有着广泛的应用。 例1:两个寡头企业选择产量的博弈。如果两个企业联合起来形成卡特尔,选择垄 断利润最大化的产量,每个企业都可以得到更多的利润。但卡特尔不是一个稳定 的均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果是,每 个企业都只得到小于最大利润的产量,利润严格小于卡特尔产量下的利润。 在有些情况下,个人理性和集体理性的冲突对社会来说也许是一件好事,尽管对 集体而言是一件坏事。
第2讲 完全信息静态博弈
下继续生活下去。 从囚徒困境中,我们可以引出一个很重要的结论:一种制度(体制)安排,要发 生效力,必须是一种均衡。否则,这种制度安排不能成立。
第2讲 完全信息静态博弈

3.重复剔除的占优均衡 在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在 绝大数博弈中,占优战略均衡是不存在的。
第2讲 完全信息静态博弈

在“智猪博弈”中,我们先剔除掉小猪的劣战略“按”,在剔除掉这个战略后的 新的博弈中,小猪只有一个战略“等待”,大猪仍有两个战略,但此时,“等待” 已成为大猪的劣战略,提出这个战略,剩下的唯一战略组合是(按,等待)。
第2讲 完全信息静态博弈

我们需要对“占优战略”和“劣战略”的概念进行重新定义。


都是(相对于si*的)劣战略。 在应用重复剔除方法寻找均衡时,一个战略是占优战略或劣 战略可能是相对于另一个特定的战略而言的。
第2讲 完全信息静态博弈
' ' ' 定义:令si 和s? 是参与人 i 可选择的两个战略(即 s i i Si, ' s’ i Si)。如果对于任意的其他参与人的战略组合s -i,参与人 ' ' i的选择si 得到的支付严格小于从选择s? i 得到的支付,即:

第二讲 完全信息静态博弈

第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。


在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法

完全信息静态博弈

完全信息静态博弈

• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。

R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)

F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。

博弈论与信息经济学课件3—完全信息静态博弈2

博弈论与信息经济学课件3—完全信息静态博弈2

2

聚点和相关均衡
抛硬币解决
博弈方2 博 弈 U 方 D 1 L 5, 1 4, 4 R 0, 0 1, 5 存在三个纳什均衡,其中: 两个是纯策略均衡: (U,L); (D,R) 一个是混合策略均衡: [(1/2,1/2),(1/2,1/2)]
相关均衡例子
由于避免(U,R)的出现符合双方的利益,可以使用抛硬币的解 决方法: 正面—1U,2L;反面—1D,2R.
国家2 战争 国 家 战争 1 和平 -5, -5 -10, 8 和平 8, -10 10, 10
两个纯策略纳什均衡: (战争,战争), (和平,和平) 在帕累托效率意义上,(和平,和平) 明显较好,构成一个帕累托上策 均衡。
战争与和平
如果两国的决策者都是理性的,那么两个国家之间就不应 该会发生战争。
3

共谋和防共谋均衡 这里提到的防共谋均衡中讨论的博弈方之间的串 通和联合行为均出于自愿自觉,是没有强制力的, 与协议式的合作行为不同。 因此,防共谋均衡是非合作博弈的均衡概念,而 不是合作博弈的概念。

博弈论与信息经济学
完全信息静态博弈2
——纳什均衡的选择和分析方法扩展
纳什均衡的选择和分析方法扩展

1
帕累托和风险上策均衡 ——帕累托上策均衡 ——风险上策均衡 聚点和相关均衡 ——聚点均衡 ——相关均衡 共谋和防共谋均衡

2

3
1

帕累托和风险上策均衡
帕累托上策均衡:依据帕累托效率意义上的优劣关系, 某一个纳什均衡给所有博弈方带来的利益都大于其他所 有纳什均衡会带来的利益,博弈方选择的倾向性是一致 的。

3
共谋和防共谋均衡
博弈方2 博 弈 方 1 博弈方2

2 完全信息静态博弈

2  完全信息静态博弈

2 政府
救济 3,
3
-1,
1 0 0,
1 )( ( )) ( 01
不救济 -1,
求微分,得到政府最优化的一阶条件:
同样,可以根据流浪汉 的期望效用函数找到政 府的最优混合策略。??
即:流浪汉以0.2的概率选择寻 找工作,0.8的概率选择游荡
四. 混合策略纳什均衡

社会福利博弈
四. 混合策略纳什均衡

社会福利博弈
救济 政府
流浪汉
寻找工作 2 3, 1 不救济 -1, 0, -1, 0 流浪 3
设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的策略都是给定对方混合策略时的最优策略
四. 混合策略纳什均衡
四. 混合策略纳什均衡

策略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
纯策略:如果一个策略规定参与人在每一个给定的信 息情况下只选择一种特定的行动,该策略为 纯策略。 混合策略:如果一个策略规定参与人在给定信息情况 下以某种概率分布随机地选择不同的行动, 则该策略为混合策略。

由于混合策略伴随的是支付的不确定性,因此参与 人关心的是其期望效用。
最优混合策略:是指使期望效用函数最大的混合策 略(给定对方的混合策略) 在两人博弈里,混合策略纳什均衡是两个参与人的 最优混合策略的组合。


支付最大 化法
四. 混合策略纳什均衡
流浪汉
寻找工作 流浪
假定政府的混合战略是 G , ); ( 1 流浪汉的混合战略是 L , )。 ( 1 政府的期望效用函数为: v( G, L) (3 1 ( )( )) 1 (5 1 ) vG 5 1 0 故 * 0.2

第二章(完全信息静态博弈)PPT课件

第二章(完全信息静态博弈)PPT课件

q2 R2(q1)
(3,0) (6,0)
q1
图2.9 古诺模型的反应函数几何描述
2021
27
三、伯特兰德寡头模型——价格博弈
当厂商1和厂商2价格分别是 P1 和 P2 时,它们各 自的需求函数为 :
q 1 q 1 ( P 1 ,P 2 ) a 1 b 1 P 1 d 1 P 2 q 2 q 2 ( P 1 ,P 2 ) a 2 b 2 P 2 d 2 P 1
一、纳什均衡的定义
n个参与人的策略式表达博弈:G {S1, ,Sn;u1, un},
策略组合 S*{S1 *, ,Si*, Sn *}是一个纳什均衡,如果
对于每一个
i,s
* i
是给定其他所有参与人选择
S * 1 { S 1 * , ,S i* 1 ,S i* 1 S n * }的情况下第 i个参与人的
2021
17
三、纳什均衡与上述分析方法的关系
(一)纳什均衡与上策均衡的关系 上策均衡是比纳什均衡更强、稳定性更高的均衡 概念
纳什 均衡
上策均衡
图2.8 纳什均衡与上策均衡的关系
2021
18
G { S 1, ,S n;u 1, u n}
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G {S1, ,Sn;u1, un}中,
2021
16
正是由于纳什均衡是一致性预测,因此才进一 步有下列性质:首先,各博弈方可以预测它,可以 预测他们的对手会预测它,还可以预测他们的对手 会预测自己会预测它,……;其次,预测任何非纳 什均衡策略组合将是博弈的最终结果,意味着要么 各博弈方的预测其实并不相同(预测不同的纳什均 衡会出现等),要么预期至少一个博弈方要“犯错 误”,包括对博弈结构理解的错误,对其他博弈方 的策略预测错误,其理性和计算能力有问题,或者 是实施策略时会出现差错等。

02+完全信息静态博弈

02+完全信息静态博弈

i 都成立,则称
s* (s1*,sn* ) 为 G 的一个纳什均衡
通俗的讲:参与人(局中人)单独改变策略不会得到好处的 对局(策略组合),就叫做纳什均衡。
3.1 离散策略空间的博弈纳什均衡分析
1)上策均衡(优势策略均衡) dominant strategy
上策:不管其它参与人选择什么策略,一参与人 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
你的方案: 集中两个师进攻甲 一个师进攻甲,一个师进攻乙 集中两个师进攻乙
敌人的方案: 三个师驻守甲 两个师驻守甲,一个师驻守乙 一个师驻守甲,两个师驻守乙 三个师驻守乙
敌人
a 我军
b
c
A -,+ +,- +,-
B -,+ -,+ +,-
C +,- -,+ -,+
D +,- +,- -,+
Q q1 q2
c1 c2 2
P P(Q) 8 Q
求两厂商的均衡产量?
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12
u2 q2P(Q) c2q2 q2[8 (q1 q2)] 2q2 6q2 q1q2 q22
+,- -,+
诺曼底战役模拟
3) 相对优势策略划线法
情侣博弈:大海喜欢看足球,丽娟喜欢看芭蕾舞。
他们都宁愿在一起,也不愿分开行动。
丽娟
足球
芭蕾
足球 大海 芭蕾
ห้องสมุดไป่ตู้
2,1 0,0
0,0 1,2
本例有两种纳什均衡结果会出现,要么一 起去看足球,要么一起去看芭蕾舞,但在一次博 弈中究竟会出现哪一种???

经济博弈论完全信息静态博弈

经济博弈论完全信息静态博弈

19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。

经济博弈论02完全信息静态博弈(Park)

经济博弈论02完全信息静态博弈(Park)

合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。

博弈论以及应用之2完全信息静态博弈

博弈论以及应用之2完全信息静态博弈

注册会计师 B 隐瞒 实报 注册会计师 A 隐瞒 实报 5,5 6,-1 -1,6 0,0
2010-10-29
8
1、囚徒困境与占优均衡VIII
委托-代理(principal-agent)关系中被设计的囚徒困境
压低供应商价格
假设:两供应商成本都为6元/件,报价都为10元/件。 策略:如果二者报价都为10元/件或8.5元/件,则从每家订购 50件;若一家报价10元/件而另一家报价8.5元/件,则从价低 者订购100件。 100
很多博弈具有多个纳什均衡,比如以上讲到的麦琪的礼物、 性别战、斗鸡博弈与协调博弈等,称为多重均衡。 在某些具有多重均衡的博弈中,各个博弈方偏好于不同的 均衡结果,如麦琪的礼物、性别战和斗鸡博弈;而在另一 些具有多重均衡的博弈中,各个博弈方偏好于同一个均衡 结果,如协调博弈。 那么,博弈方如何使自己偏好的均衡称为实际的均衡结果 呢?这就是多重均衡的协调问题。
2010-10-29
5
1、囚徒困境与占优均衡V
如何走出囚徒困境?
可信的(由第三方实施的、据说黑社会中存在的)报复 历史上的 “人质”或“通婚”方案 军队中的(有些企业试图培养的)“忠诚”文化 长期重复关系
2010-10-29
6
1、囚徒困境与占优均衡VI
委托-代理(principal-agent)关系中被设计的囚徒困境
2010-10-29
不剪 2,1 0,0
17
卖表 不卖
0,0 1,2
3、最优反应与画线法III
练习:用画线法求解下列博弈的纳什均衡
性别战博弈 韩剧 妻子 斗鸡博弈 韩剧 足球 2,1 0,0 丈夫 足球 0,0 1,2
公鸡1 进攻 后退 后退 进攻 1,1 2,-2 -2,2பைடு நூலகம்-4,-4

2.完全信息静态博弈

2.完全信息静态博弈
1 1 2 n
第2章 完全信息静态博弈 章
电影《美丽心灵》中,有人向纳什提出了这样一个 问题,问题的背景如下:在一个舞会上,有两个以 上的男士,有比男士更多的魅力十足的女士,但只 有一个金发女郎,男人开始邀请舞伴,但只能邀请 一次请一个女郎作为舞伴,所有男士更喜欢金发女 郎,但有女伴比无女伴要好,如果两个男士同时邀 请一个女士,两人都会被拒绝。假设你作为一个男 士,你会如何邀请舞伴?
构造博弈模型所需要的要素
1.局中人集合 局中人集合 N = {0,1,2,⋯, n},称 N 为局中人或参与人集合。N 中元素称为参与人或局
中人。参与人不专指人,它泛指参与博弈活动的政府、企业、地区、国家、 个人……等决策主体。通常用“0”表示虚拟局中人,它的行为是以确定的 概率分布进行随机选择, i = 1,2, ⋯ , 表示实际参与人。 n
T ② T ① I12 T ② I 22 T H T H ② HT T ② H H ① ①
I11
H ② T H ① I15 T ② H T ② I 25 H T H ② H
I 21
I13
H T ② T H ② T
① I14 H
I 23
I 24
H T
图2-2
信息集可以告诉我们以下4点 信息集可以告诉我们以下 点 1.在一个信息集上应由哪个参与人选择行动。 2.从一个信息集出发,局中人可能选择哪些行动。 3.局中人在一个信息集上选择行动时已知道了哪些信息。 4.单点信息集表明相应的局中人完全了解博弈从开始到该信息 集的博弈历程。 完美信息博弈 如果G的每个信息集都是单点信息集。表明博弈的每个参与人 在选择行动时对博弈到现在为止的历程都完全了解,这时称G 为完美信息博弈 完美信息博弈。 完美信息博弈 扩展型博弈不仅能刻画动态博弈, 扩展型博弈不仅能刻画动态博弈,也能刻画静态博弈

Lecture 2 完全信息静态博弈

Lecture 2 完全信息静态博弈

* * q1* arg max 1 (q1, q2 ) arg max q1P(q1 q2 ) C1 (q1 )
* q2 arg max 2 (q1* , q2 ) arg max q2 P(q1* q2 ) C2 (q2 )
纳什均衡是完全信息博弈解的一般概念,构成纳什均衡的策
每一个占优策略均衡、重复剔除的占优均衡一定是纳什均衡
,但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优 均衡。
略一定是重复剔除严格劣过程 中不能被剔除的策略。也就是说 ,没有任何一个策略严格优于纳什均衡策略。
纳什均衡一定是在重复剔除严格劣策略过程中没有被剔除掉
如果这样的解存在,我们说该博弈是“重复剔除占优可解的
2.3 可理性化策略
L
参与人A U D 0,3 参与人B M
R
1,0
1,2 0,1
参与人B
0,1 2,0
M
L
参与人A U D
1, 0 0, 3
1, 2 0, 1
参与人B L M
1, 0
1, 2
2.3 可理性化策略
参ቤተ መጻሕፍቲ ባይዱ人关于彼此理性和博弈结构的共同知识,可以使我们剔
我们同样可以通过重复剔除决不是最优反应的方式来减少策 可理性化策略的集合不会比通过了重复剔除严格劣策略的策
略集合更大。
略的范围。通过了这样重复剔除的策略,被称为参与人������ 的“可 理性化”策略。
2.3 可理性化策略
“可理性化策略”
策略������������ 是参与人������对竞争对手策略������−������ 的一个最优反应,如果
10000之间的整数。定义所有参与人所写数字最大值的9/10作 为目标数字(如果不是整数则向下取整)。所写数字正好为该 目标数字的参与人平分5000元。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生活中其实有很多相关的例子。

生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。

例2
为什么中小企业不会花钱去开发新产品 ?

完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。

生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。

例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。

例3
为什么只有大企业才会花巨额金钱打广 告?
大企业是大猪,中小企业是小猪。大企 业投入大量资金为产品打广告,中小企 业等大企业的广告为产品打开销路形成 市场后才生产类似产品进行销售。
应用博弈论第二讲完全信息 静态博弈

博弈的通俗理解
游戏有以下特征(打牌为例):(1)都 有一定的规则,几副牌,几个打,可以做什 么,不可以做什么,按什么次序出牌,犯规 了怎样处置等等。(2)都有一个结果。是输 还是赢,升几级等。(3)策略至关重要,先 出什么再出什么都蕴涵着策略,不同的策略 选择带来不同的结果。(4)策略和利益有相 互依存性,即每一个游戏者所得结果的好坏 ,不仅取决于自身的策略选择,也取决于其 他参加者的策略选择。
同样的道理,国防、教育、社会 保障,环境卫生等都由政府承担资金投 入,私人一般没有积极性承担这方面服 务的积极性和能力。

类似的例子还有:
渤海中的鱼愈来愈少了,工业化中的大 气及河流污染,森林植被的破坏等。解决公共 资源过度利用的出路是政府制订相应的规制政 策加强管理,如我国政府规定海洋捕鱼中,每 年有一段时间的“休渔期”,此时禁止捕鱼,让 小鱼苗安安静静地生长,大鱼好好地产卵,并 对鱼网的网眼大小作出规定,禁用过小网眼的 捕网打鱼,保护幼鱼的生存。又如在三峡库区 ,为了保护库区水体环境,关闭了前些年泛滥 成灾的许多小造纸厂等。
•不 修
不修

求解(第一步)
• 富人
• 穷人
•修 •修
不修
•不 修

求解(第二步)
• 穷人 • 不修 •修 •不 修
• 富人

富户与穷户修路博弈的启示
这时候,富户一般会承担起修路的责 任,穷户则很少这样干,因为富户家常 常是高朋满座,坐车坐轿的都来,而穷 户家只是穿着破鞋走路,路修好了他走 起来舒服,路不修他也无所谓。

修路博弈
修 甲
不修
乙 修
不修

我们看到,对甲和乙两家居民来说 ,“修路”都是劣战略,因而他们都不会出 资修路。
这里,为了解决这条新路的建设 问题,需要政府强制性地分别向每家征 税2单位,然后投入4单位资金修好这条 对大家都有好处的路,并使两家居民的 生活水平都得到改善。

这就是我们看到的为什么大多数 路、桥等公共设施都是由政府出资修建 的原因。

适合用严格下策反复消去法分析的例子
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去:
•左 •中 •右 •上 •1,0 •1,3 •0,1 •下 •0,4 •0,2 •2,0
•左 •1,0 •0,4
•中 •1,3 •0,2
•左 •中 •1,0 •1,3

上策均衡分析存在的问题
这里的问题是并非每个博弈方都有这种绝 对偏好的上策,而且常常是所有博弈方都没有 上策,因为博弈方的最优策略随其他博弈方的 策略而变化正是博弈问题的根本特征,是博弈 关系相互依存性的主要表现形式。因此上策均 衡不是普遍存在的。

2.1.2 严格下策反复消去法
如同寻找每个博弈方最优的策略思路一样 ,如果找到每一个博弈方的最差策略,则可以 将其消去。一般地,如果在一个博弈中,不管 其他博弈方的策略如何变化,一个博弈方的某 种策略给他带来的得益,总是比另一种策略给 他带来的得益要小,那么我们称前一种策略为 相对于后一种策略的一个“严格下策”。很显 然,任何理性的博弈方都不可能采用严格下策 ,因此可以将其消去。

剪刀、石头、布
•博
•石 头
•弈
•剪 子
•方
•1
•布
•石 头 •0, 0 •-1, 1 •1, -1
•博弈方2
•剪 子 •1, -1 •0, 0 •-1, 1
•布 •-1, 1 •1, -1 •0, 0

第二节 寻找博弈均衡
2.1 上策均衡 在某个博弈中,如果不管其他博弈方
选择什么策略,一博弈方的某个策略给 他带来的得益始终高于其他策略,我们 称这种策略为该博弈方的一个“上策” 。进一步,如果一个博弈的某个策组 合中的所有策略都是各个博弈方各自的 上策,我们称这样的策略组合为该博弈 的一个“上策均衡”。

智猪博弈
仍然是一个修路博弈,但是这个博 弈与我们前面介绍的修路博弈有点不同 。村里住两户人家,一户福,一户穷, 有一条路年久失修。博弈的情形如下图 所示(修路给富人带来的效用要大)。 这个博弈又称为智猪博弈(富人是大猪 ,穷人是小猪)。
博弈模型见下图。

习题2 智猪博弈
• 穷人
•修
• 富人 • 修
相关文档
最新文档