北大精品课件:博弈论及公共政策之完全信息静态博弈

合集下载

第四章 完全信息静态博弈的应用 《博弈论与经济》 PPT课件

第四章  完全信息静态博弈的应用  《博弈论与经济》 PPT课件
最大化利润函数 2 (q1, q2 ) ,即对于固定的 q1 求解最大化 问题:
max2 (q1, q2 ) P(q1 q2 )q2 C2 (q2 )
q2
▪ 由于 2 (q1, q2 ) 关于 q2 是凹函数,故 1阶条件对于最大
化 2 而言是充要条件。由 2 (q1, q2 ) 0
q 2
▪ 有限、完美信息的扩展型博弈必存在纯策略意义下的子博 弈精炼纳什均衡。
▪ 逆序归纳法如下
▪ 假设已知的扩展型博弈共分k步完成。
▪ 1.对于第k步上的信息集,选择行动,使相应的参与人支 付值最大,并将由此信息集出发达到的终点的支付向量赋 值给该信息集对应的决策的节点。
▪ 2.利用第k步上节点的赋值,对属于k-1步的信息集所对应 的节点同样赋值。由于博弈是有限的,必可在有限步内使 博弈树所有节点都赋与了支付值。
倾斜,每个企业都偏好价格跟随。
▪ 例4.4 设在价格领先博弈模型中,两个企业的需求函数分别为
▪ q1 1 p1 p2, q2 1 p2 p1 ,具有相同的成本函数 C(q) Cq 。
▪ t 2,企业观察到了 p1,求 p2 ,最大化自己的利润函数
2( p1, p2) ( p2 C)(1 p2 p1)

由1阶条件
2
p2
0
,可得向上倾斜的反应函数
p2
1 2
(1
C
p1)
▪ t 1 ,企业1预期到
p2
1 2
(1
C
p1)
,选择 p1 ,最大化
1( p1) ( p1 C)(1 p1 p2( p1))
▪ ▪
由1阶条件
1 p1
0
,解得 p1*
代入参与人2的价格反应函数得

北大精品课件:《博弈论与公共政策》之完全信息静态博弈

北大精品课件:《博弈论与公共政策》之完全信息静态博弈
• (3)不断重复前两步,直到完成对各参与 者所有子集组合的分析为止。
h
53
例18:求混合策略均衡

BSX
B
4, 0, 20
0, 1

S
0, 2, 1, 043
h
54
• 5、对混合策略的理解
• 参与者 i 的混合策略可以解释为其对手对于 i 将会选择哪一个纯策略的不确定性,实际 上,在 i 的心中,可能依据自己掌握的一点 儿私人信息已经选择了某一纯策略。不过, 由于其他参与者不能观察到 i 的私人信息, 他们无法确定 i 的选择,我们就用 i 的混合 策略表示其他参与者的这种不确定性。
h
34
• 命题二:
• 如果重复剔除严格劣策略过程最终只剩下 唯一的策略组合,那么这一策略组合为该 博弈唯一的纳什均衡。
h
35
• 命题三:
• 不能被重复剔除严格劣策略过程所剔除的 策略组合,不一定是纳什均衡。
h
36
例11:约会博弈
男生
歌拳 剧击
歌 2, 0, 剧1 0 女生 拳 0, 1, 击0 2
木村
北南 线线
北 2, 2, 线 -2 -2 肯尼 南 1, 3, 线 -1 -3
h
17
• 在单人决策中,当所有情况下的收益都增 加(至少不减少)时,当事者的境况不会 变得更坏,但在博弈中则未必。比较下面 的两个博弈:
h
18
例5


左右
左右
上 -1,3 2,1
上 1,3 4,1
甲 下 0,2 3,4 甲 下 0,2 3,4
h
51
• 3、混合策略纳什均衡的充要条件
• 对任一参与者,凡是以正的概率被选择的 纯策略应带来相等的期望收益,且不低于 以零概率被选择的纯策略带来的期望收益。

博弈论课件 完全信息静态博弈

博弈论课件 完全信息静态博弈
囚徒困境中的(坦白,坦白) 囚徒困境中的(坦白,坦白) 夫妻之争中的(时装,时装) 足球, 夫妻之争中的(时装,时装)和(足球,足球 ) 猜硬币博弈不存在纳什均衡
2.2.2 纳什均衡的一致预测性质
一致预测: 一致预测:如果所有博弈方都预测一个特 定博弈结果会出现, 定博弈结果会出现,所有博弈方都不会利 用该预测或者这种预测能力, 用该预测或者这种预测能力,选择与预测 结果不一致的策略, 结果不一致的策略,即没有哪个博弈方有 偏离这个预测结果的愿望, 偏离这个预测结果的愿望,因此预测结果 会成为博弈的最终结果。 会成为博弈的最终结果。
2.2.1 纳什均衡的定义
纳什均衡: 纳什均衡:在博弈 G={S1,S2,…,Sn;u1,u2,…,un} 中,如果由各 个博弈方的各一个策略组成的某个策略组合 (s1*,…,sn*)中,任 中 一博弈方 i的策略 i*,都是对其余博弈方策略的组合 (s1*,…, si的策略s 的策略
1 *,
si+1* ,…,sn*) 的最佳对策,也即 的最佳对策,
* * ui ( si* , ⋯ si*−1 , si* , si*+1 ,...sn ) ≥ ui ( si* , ⋯ si*−1 , sij , si*+1 ,...sn )
对任意s 都成立, 对任意 ij∈Si 都成立,则称 (s1*,…,sn*) 为 G 的一个纳什均衡
根据上述纳什均衡的定义,可以判断, 根据上述纳什均衡的定义,可以判断,前 面所述各博弈方都不愿单独改变策略的策 略组合。 略组合。
左 上 下 1,0 , 0,4 , 中 1,3 , 0,2 , 右 0,1 , 2,0 , 左 1,0 , 0,4 , 中 1,3 , 0,2 , 左 1,0 , 中 1,3 ,

一完全静态博弈 ppt课件

一完全静态博弈 ppt课件

2020/12/27
33
公共牧场的比喻
• 哈丁所讲的公共牧场则是研究具有同一行为动机结构 的一种特殊的多人情况。
• 那些在会议上高谈阔论却又言之无物的人们,可能看 上去就像牧场上的牛一样,他们一边吃一边践踏,而 另一头牛正在眼巴巴地看着草。
• 现在这个词已经被广泛地应用于研究在公共水域倾倒 污水的行为,在公共石油层开采石油行为,在公海猎 捕鲸鱼的行为,甚至于将地球和地球上的资源比喻成 一个公共养殖场,人类在其中过度繁衍后代。还有中 国的小煤窑的开发以及高校科研经费的申请等。
31
解释
• 寡头竞争的总产量大于垄断产量的原因 在于每个企业在选择自己的最优产量时, 只考虑对本企业利润的影响,而忽视对 另一个企业的外部负效应。这是典型的 囚徒困境问题。
• 这个模型使用重复剔除严格劣战略的方 法找出均衡解。
2020/12/27
32
(2)公共地的悲剧
• 公共地的悲剧(tragedy of the commons)是制度经济 学家非常熟悉的例子。
需求函数取如下线性形式
paq1q2
那么,最优化的一阶条件分别是:
1
q1
a q1 q2 q1
c 0
2020/12/27
2
q2
a q1 q2 q2 c 0
29
反应函数为
q1
R1q2
1 2
a
q2
c
q2
R2 q1
1 2
a
q1
c
解两个反应函数,我们得纳什均衡为
q1
q2
1ac
3
每个企业的纳什利润分别是
2020/12/27
12
关于行动顺序
• 同样的参与人,同样的行动集合,行动 顺序不同,每个参与人的最优选择就不 同,博弈的结果就不同。

完全信息静态博弈教学课件

完全信息静态博弈教学课件

完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。

博弈论与信息经济学课件2—完全信息静态博弈1

博弈论与信息经济学课件2—完全信息静态博弈1

定义一:
完全信息静态博弈(策略型博弈)是指在博弈
中局中人的信息是完全的,并且局中人同时采取行 动或局中人的行动有先有后,但后行动者不知道先 行动者的行动选择的一种博弈。
§1 完全信息静态博弈的表示—支付矩阵
1.2 策略型博弈的表示
1、局中人(Players):i , 1, 2,..., n ; 2、策略空间(Strategies): Si si , i 1, 2,..., n; 3、支付函数(Payoff Functions): ui ui (s1 , , si , , sn );
现实中的囚徒困境——公共资源过度使用
哈丁,1968年,《科学》杂志, 《公共地悲剧》
牧民乙
1只
牧 民 甲
2只
60, 120 80, 80
1只 2只
100, 100 120, 60
现实中的囚徒困境
应试教育与素质教育的两难选择
为什么路越来堵?
为什么成绩越来越高?
团队生产中的偷懒
„„„
现实中的囚徒困境
齐 威 王
上中下 上下中 中上下 中下上 下上中 下中上
性别大战博弈
女生 足球 足球 男生 歌剧 3,2 -1,-1 歌剧 1, 1 2, 3
§2 占优策略(上策)及占优策略(上策)均衡
例:囚徒困境
坦白 坦白 甲 不坦白
乙 不坦白
-5,-5
-8,0
0,-8
-1,-1
“坦白”是甲的优势策略 (坦白,坦白) “坦白”也是乙的优势策略 囚徒困境模型反应了个体理性与集体理性的冲突
完全信息静态博弈
四种博弈类型
完全信息动态博弈
不完全信息静态博弈 不完全信息动态博弈

第二章(完全信息静态博弈)PPT课件

第二章(完全信息静态博弈)PPT课件

q2 R2(q1)
(3,0) (6,0)
q1
图2.9 古诺模型的反应函数几何描述
2021
27
三、伯特兰德寡头模型——价格博弈
当厂商1和厂商2价格分别是 P1 和 P2 时,它们各 自的需求函数为 :
q 1 q 1 ( P 1 ,P 2 ) a 1 b 1 P 1 d 1 P 2 q 2 q 2 ( P 1 ,P 2 ) a 2 b 2 P 2 d 2 P 1
一、纳什均衡的定义
n个参与人的策略式表达博弈:G {S1, ,Sn;u1, un},
策略组合 S*{S1 *, ,Si*, Sn *}是一个纳什均衡,如果
对于每一个
i,s
* i
是给定其他所有参与人选择
S * 1 { S 1 * , ,S i* 1 ,S i* 1 S n * }的情况下第 i个参与人的
2021
17
三、纳什均衡与上述分析方法的关系
(一)纳什均衡与上策均衡的关系 上策均衡是比纳什均衡更强、稳定性更高的均衡 概念
纳什 均衡
上策均衡
图2.8 纳什均衡与上策均衡的关系
2021
18
G { S 1, ,S n;u 1, u n}
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G {S1, ,Sn;u1, un}中,
2021
16
正是由于纳什均衡是一致性预测,因此才进一 步有下列性质:首先,各博弈方可以预测它,可以 预测他们的对手会预测它,还可以预测他们的对手 会预测自己会预测它,……;其次,预测任何非纳 什均衡策略组合将是博弈的最终结果,意味着要么 各博弈方的预测其实并不相同(预测不同的纳什均 衡会出现等),要么预期至少一个博弈方要“犯错 误”,包括对博弈结构理解的错误,对其他博弈方 的策略预测错误,其理性和计算能力有问题,或者 是实施策略时会出现差错等。

经济博弈论之完全信息静态博弈培训讲义(PPT 57页)

经济博弈论之完全信息静态博弈培训讲义(PPT 57页)

2.2.3 纳什均衡与严格下策反复消去法
❖ 上策均衡肯定是纳什均衡,但纳什均衡不一定是上 策均衡
❖ 命题2.1:在n个博弈方的博弈G={S1, …,Sn,u1, …,un}中,如果严格下策反复消去法排除了除 (s1*,…,sn*) 之外的所有策略组合,那么 (s1*, …,sn*) 一定是该博弈的唯一的纳什均衡.
“斗鸡博弈”
❖ 两个所谓的勇士举着长枪,准备从独木桥的两端上桥中央进
行决斗。每位勇士都有两种选择:冲上去(用U表示)或退下
来(用D)表示。若两人都冲上去,则两败俱伤;若一方上去
而另一方退下来,冲上去者获得胜利,退下来的丢了面子;
若两人都退下来,两人都丢面子。 两个Nash(U,D)和(D,U)
参与人2
解方程得:策略组合(2,2)是本博弈唯一的纳什均衡。
最终市场总产量为:2+2=4
市场价格为:8-4=4
反应函数即一博弈方对另
双方各自得利润为:2×(8-4)-2×2=4 一博弈方每种可能的决策
两厂商的利润总和为4+4=8
内容的最佳反应决策构成
的函数。
q2 6
R1(q2)
3 NE
2 1.5
1.5
3 2
❖ 命题2.2:在n个博弈方的博弈中 G={S1,…Sn;u1, …,un)}中,如果 (s1*, …,sn*) 是G 的一个纳 什均衡,那么严格下策反复消去法一定不会将它消 去.
举例
❖ 有两个候选人,在10个立场中进行选择,选 民立场均匀分布,每个立场都得到10%的选 票,选民会投给离自己最近的候选人,出现 平局票数平分。
从两厂商总体利益最大化的角度作一次产量选择。首先根据 市场条件求总体利益最大化的产量。设总产量为Q,则总得 益为 U=P(Q)-cQ=Q(8-Q)-2Q=6Q-Q2 使总得益最大的总产量Q=3 总得益u=9

北大课件:《博弈论与公共政策》之完全信息静态博弈

北大课件:《博弈论与公共政策》之完全信息静态博弈
2 纳什均衡的求解方法
介绍求解纳什均衡的方法,例如迭代删除支配策略和解析求解。
3 纳什均衡的应用案例
通过真实案例,展示纳什均衡在经济学、政治学和战略分析中的应用。
章节四:完全信息静态博弈的案例分 析
投票策略博弈
垄断博弈
使用具体的案例,阐述投票 策略博弈中候选人和选民的 策略选择和采用的分析方法。
以垄断市场为例,探讨垄断 博弈中的价格策略、市场竞 争和反垄断政策。
拍卖博弈
介绍拍卖博弈的基本概念和 常见拍卖模型,讨论竞买者 和拍卖者的策略选择。
章节五:博弈论与公共论在公共政策制定中的重要性,以及如何利用博弈论的工具和分析方法 来制定更有效的政策。
2
博弈论的局限性和未来发展趋势
探讨博弈论的局限性,例如信息不完全和不确定性,并展望未来博弈论在全球化 和技术进步中的应用。
北大精品课件:《博弈论 与公共政策》之完全信息 静态博弈
本精品课件将带你深入探索博弈论与公共政策的关系,学习完全信息静态博 弈的基本概念、模型和纳什均衡的求解方法。
章节一:博弈论基础知识回顾
1 博弈理论的基本概念
介绍博弈论的起源、定义和基本概念,例如博弈、玩家、策略等。
2 Nash均衡的定义和特点
解释Nash均衡的概念、定义和特点,以及为什么Nash均衡是博弈论重要的解决概念。
3 博弈论的应用场景
展示博弈论在经济学、政治学和生物学等领域的应用场景,增加理论的实用性。
章节二:完全信息静态博弈的概念与 模型
1
完全信息与不完全信息的区别
解释完全信息和不完全信息静态博弈的区别,包括信息的对称性和对策的制定。
2
静态博弈的基本概念和模型
介绍静态博弈的基本概念和模型,包括玩家、策略、支付矩阵和纳什均衡的定义。

完全信息静态博弈PPT课件

完全信息静态博弈PPT课件
二、完全信息静态博弈
—纳什均衡与多重纳什均衡的再精炼
1、什么是完全信息静态博弈? 2、完全信息静态博弈的几个经典实例。 3、完全信息静态博弈的分析思路和方法。 4、纳什均衡分析案例。 5、多重纳什均衡再精炼分析
1、什么是完全信息静态博弈?
完全信息静态博弈即各博弈方同时决策,且所有博弈方 对各方得益都了解的博弈。
>


(3,0)
1 兔子
(3,3)
1 *3 1 *3 6 22 2
博弈方1的风险策略:兔子
博弈方2的风险策略:兔子
该博弈的风险上策均衡为:(兔子,兔子)
3)聚点均衡法
丈夫
时装 足球
妻 时装 (2,1) (0,0)
子 足球 (0,0) (1,2)
夫妻之争博弈
博弈方往往会利用博弈规则以外的特定信息, 如博弈方共同的文化背景中的习惯,规范,共同的 知识或者其他具有特定意义事物的特征作为聚点, 比较容易选择其中的一个纳什均衡,该均衡便是一 个“聚点均衡” 。如,上述博弈中,妻子的生日 可能会作为双方的一个聚点,丈夫则会顺从妻子的 偏好,则(时装,时装)在该博弈中是比较容易选 择的一个纳什均衡,因此, (时装,时装)则是 该博弈的一个“聚点均衡”。
1)决策者考虑短期利益、个人或者小集团利益更多,决策者确实 缺乏理智和理性; 2)局部地区或特定时期战争的利益比上述博弈中所假设的要大; 3)其他国家选择战争时还击比不还击损失小,先发制人则更能使 自己相对有利;
以上因素都是导致发生战争机会增大的重要原因。
2)风险上策均衡法
风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概 率相同时,都偏爱其中某一个纳什均衡,则该纳什均衡就是一个“风险上策均衡”。

博弈论全套上课课件ch2 完全信息静态博弈

博弈论全套上课课件ch2 完全信息静态博弈


上 下
南京农业大学经济管理学院 王艳
22
重复剔除严格劣战略的缺陷

1、假定“参与者是理性的”是共同知识。 2、预测结果不精确。
女 足球 男 足球 2,1 0,0 芭蕾 0,0 1,2
芭蕾
南京农业大学经济管理学院 王艳
23
应用部分

古诺模型 伯川德模型 豪泰林模型 公共地的悲剧
南京农业大学经济管理学院 王艳
对上式求导,令其等于零。得到企业1的最 优反应函数:
ac 1 N R(q2 , q3 ,..., qN ) qi 2b 2 i 2
南京农业大学经济管理学院 王艳
15
教科书博弈: 重复剔除的占优均衡
张教授
李教授
400页 600页 800页
400页 45,45 50,15 40,10
600页 15,50 40,40 45,15
800页 10,40 15,45 35,35
南京农业大学经济管理学院 王艳
16
3、纳什均衡
纳什均衡:在博弈 G {S1,Sn ; u1,un } 中,如果由各 si* , sn* 个博弈方的各一个策略组成的某个策略组合 中,任一博弈方i 的策略,都是对其余博弈方策略 * 的组合 si* , si*1 , si*1 ,...sn 的最优反应战略,也即 * * * * * * * * * ui (s1 ,si1, si , si1,...sn ) ui (s1 ,si1, si , si1,...sn ) * * 对任意 si Si 都成立,则称 si , sn 为G 的一个纳 什均衡。
人的最优战略是唯一的,这样的最优战略称为 “占优战略”(dominant strategy)。
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论与公共政策
北大精品课件
完全信息静态博弈
主要内容
一、博弈的标准式表述
二、占优策略均衡
三、重复剔除的占优均衡
四、纳什均衡
五、多重纳什均衡的比较
六、混合策略
七、应用举例
何谓静态博弈?
开始时由参与者同时选择行动,然后根据所有参与者的选择,每个参与者得到各自的结果。

何谓完全信息静态博弈?
每一参与者的收益函数在所有参与者之间是共同知识。

一、博弈的标准式表述
博弈的标准式表述包括三个方面的内容:
(1)博弈的参与者
(2)每个参与者可供选择的策略集
(3)针对所有参与者可能选择的策略组合,每个参与者获得的收益
对于一个 n 人博弈,设各参与者的策略空间依次为 S1,S2, …,Sn ,收益函数分别为u1,u2, …,un ,其中 ui (s1,s2, …,sn) 为参与者选择策略组合(s1,s2, …,sn) 时参与者 i 的收益,则可用标准式将该博弈表示如下:
G = {S1,S2, …,Sn ; u1,u2, …,un }
在双人有限策略的情况下,可以用双变量矩阵更直观地表述博弈。

例1:囚徒困境
但是,如果参与者超过2人,则用双变量矩阵形式来表示博弈就不那么方便了,甚至根本无法采用这种形式。

例2:三人有限策略博弈
二、占优策略均衡
1、占优策略
在博弈中,如果不管其他参与者选择什么策略,某个参与者的特定策略都优于或至少不劣于其他所有策略,那么,我们就说这个特定策略是该参与者的占优策略。

在前面的囚徒困境博弈中,“招认”就是每个囚徒的占优策略。

2、占优策略均衡
如果每个参与者都存在占优策略,那么由这些占优策略构成的组合就称为占优策略均衡。

在前面的囚徒困境中,(招认,招认)就构成一个占优策略均衡。

注意:
占优策略均衡只要求每个参与者是理性的,而并不要求每个参与者知道其他参与者是理性的,也就是说,不要求“理性”是共同知识。

例3:公共产品的供应问题
A、B两人同住一室,现在,他们考虑是否购买一台电视机。

电视机的价格为4000元,每个人从看电视中获得的效用各为3000元。

假定他们根据下列程序决定是否购买电视机:
每人把是否购买电视机的想法写在一张纸条上,如果两人都认为应该购买,则平均分担购买电视机的费用。

如果两人都认为不应该购买,则不购买电视机。

如果只有一人提出购买而另一人不想购买,则由提出购买的人独自购买电视机。

每个人会如何决策?
三、重复剔除的占优均衡
1、重复剔除的占优均衡
首先从某一参与者的策略集里剔除掉一个劣策略,再重新考察各个参与者剩下的策略中哪些是劣策略并剔除其中之一,不断继续这一过程直到每个参与者都仅剩一个策略为止,最后得到的策略组合就称为重复剔除的占优均衡。

例4:俾斯麦海之战
在单人决策中,当所有情况下的收益都增加(至少不减少)时,当事者的境
况不会变得更坏,但在博弈中则未必。

比较下面的两个博弈:
例 5
2、理性共识
重复剔除的占优均衡不仅要求每个参与者是理性的,而且要求“理性”是参与者的共同知识,即参与者具有“理性共识”(Common Knowledge of Rationality,简记为CKR)。

理性共识可划分为不同的层次:
零阶理性共识:每个人都是理性的,但不知道其他人是否理性。

一阶理性共识:每个人是理性的,并且知道其他人也都是理性的,但并不知道其他人是否知道自己是理性的。

二阶理性共识:每个人是理性的,也知道其他人都是理性的,而且知道其他人知道自己是理性的,但不知道其他人是否知道自己知道他们知道自己是理性的。

依此类推。

例 6
选择越多(行动空间越大),对理性共识的要求越高。

请看下例:
例 7
四、纳什均衡
许多博弈既不存在占优策略均衡,也不存在重复剔除的占优均衡。

例 8
1、纳什均衡的定义
如果存在这样一个策略组合――给定该策略组合中其他参与者的选择,没有人有积极性改变自己的选择,我们就说该策略组合是一个纳什均衡。

交通规则问题就是一个很好的例子:
例9:交通规则问题
纳什均衡是一种一致预期:基于信念的选择是合理的;支持选择的信念是正确的。

这种一致预期能够自我实现,不会出错:如何所有人认为这个结果会出现,
这个结果就会出现。

以交通规则问题为例,如果甲认为乙预期甲将靠右走,甲就确实会选择靠右走。

2、纳什均衡的意义
如果某个策略组合为纳什均衡,那么任何一个参与者都没有激励独自背离他所选定的策略。

这就是说,该策略组合是“策略稳定”或“自动实施”的。

换一种说法,如果参与者事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。

3、严格纳什均衡与弱纳什均衡
4、用划线法求纳什均衡
例 10
5、纳什均衡与重复剔除的占优均衡之间的关系
命题一:
纳什均衡不会被重复剔除严格劣策略过程所剔除。

命题二:
如果重复剔除严格劣策略过程最终只剩下唯一的策略组合,那么这一策略组合为该博弈唯一的纳什均衡。

命题三:
不能被重复剔除严格劣策略过程所剔除的策略组合,不一定是纳什均衡。

例11:约会博弈
命题四:
重复剔除弱劣策略过程有可能剔除弱纳什均衡,但不会剔除严格纳什均衡。

例 12
五、多重纳什均衡的比较
1. 聚点均衡
2. 帕累托效率标准
3. 强均衡
4. 抗联盟(抗共谋)纳什均衡
博弈实验1
分钱财博弈
例2:三人有限策略博弈
六、混合策略
1、混合策略
所谓混合策略,就是参与者以一定的概率从几种纯策略中随机选择。

有些博弈不存在纯策略纳什均衡,但存在混合策略纳什均衡。

例13:监督博弈
监督
不监督
偷懒
不偷懒
1,-1
-1,2
-2,3
2,2
例14:单<a name=baidusnap0></a>相思</B>
例15:划拳博弈
2、说明
(1)一个给定的纯策略可能会严格劣于一个混合策略,即使这个纯策略并不严格劣于其他任何一个纯策略。

例16
(2)一个给定的纯策略可以是针对对手的一个混合策略的最优反应,即使这一纯策略并不是针对对手的任何一个纯策略的最优反应。

例17
(3)给定其他参与者的策略,参与者的一个混合策略要成为其最优反应,混合策略中每一个概率大于0的纯策略本身也必须是其最优反应。

3、混合策略纳什均衡的充要条件
对任一参与者,凡是以正的概率被选择的纯策略应带来相等的期望收益,且不低于以零概率被选择的纯策略带来的期望收益。

4、混合策略纳什均衡的求法
(1)对于每个参与者,选择其纯策略空间的一个子集。

构造一个一般化的混合策略组合。

(2)检查是否存在参数(概率)使得该混合策略组合满足混合策略纳什均衡的充要条件。

若存在,则为混合策略纳什均衡。

(3)不断重复前两步,直到完成对各参与者所有子集组合的分析为止。

例18:求混合策略均衡
5、对混合策略的理解
参与者 i 的混合策略可以解释为其对手对于 i 将会选择哪一个纯策略的不确定性,实际上,在 i 的心中,可能依据自己掌握的一点儿私人信息已经选择了某一纯策略。

不过,由于其他参与者不能观察到 i 的私人信息,他们无法确定 i 的选择,我们就用 i 的混合策略表示其他参与者的这种不确定性。

博弈实验2
公共汽车让座博弈
6、纳什定理(纳什均衡的存在性)
在博弈中,如果 n 是有限的,并且对每个 i ,Si 是有限的,则博弈至少存在一个纳什均衡,均衡可能包含混合策略。

七、应用举例
例19:古诺的双头垄断模型
例20:伯川德的双头垄断模型
例21:最后要价仲裁
例22:公共地的悲剧
三个选民(1、2、3)要就三个备选方案(A、B、C)进行投票。

采用多数票制,但为了避免出现僵局,现在选民1担任主席,主席的权力体现在:如果三个人的投票结果没有哪个方案胜出,那么作为主席的1就拥有最终决定权。

各人的偏好顺序如下表所示。

以上信息为共同知识。

你认为每个人会如何投票,最终哪个方案被选中呢?
博弈实验3。

相关文档
最新文档