北大精品课件:博弈论及公共政策之完全信息静态博弈
第四章 完全信息静态博弈的应用 《博弈论与经济》 PPT课件
max2 (q1, q2 ) P(q1 q2 )q2 C2 (q2 )
q2
▪ 由于 2 (q1, q2 ) 关于 q2 是凹函数,故 1阶条件对于最大
化 2 而言是充要条件。由 2 (q1, q2 ) 0
q 2
▪ 有限、完美信息的扩展型博弈必存在纯策略意义下的子博 弈精炼纳什均衡。
▪ 逆序归纳法如下
▪ 假设已知的扩展型博弈共分k步完成。
▪ 1.对于第k步上的信息集,选择行动,使相应的参与人支 付值最大,并将由此信息集出发达到的终点的支付向量赋 值给该信息集对应的决策的节点。
▪ 2.利用第k步上节点的赋值,对属于k-1步的信息集所对应 的节点同样赋值。由于博弈是有限的,必可在有限步内使 博弈树所有节点都赋与了支付值。
倾斜,每个企业都偏好价格跟随。
▪ 例4.4 设在价格领先博弈模型中,两个企业的需求函数分别为
▪ q1 1 p1 p2, q2 1 p2 p1 ,具有相同的成本函数 C(q) Cq 。
▪ t 2,企业观察到了 p1,求 p2 ,最大化自己的利润函数
2( p1, p2) ( p2 C)(1 p2 p1)
▪
由1阶条件
2
p2
0
,可得向上倾斜的反应函数
p2
1 2
(1
C
p1)
▪ t 1 ,企业1预期到
p2
1 2
(1
C
p1)
,选择 p1 ,最大化
1( p1) ( p1 C)(1 p1 p2( p1))
▪ ▪
由1阶条件
1 p1
0
,解得 p1*
代入参与人2的价格反应函数得
北大精品课件:《博弈论与公共政策》之完全信息静态博弈
h
53
例18:求混合策略均衡
乙
BSX
B
4, 0, 20
0, 1
甲
S
0, 2, 1, 043
h
54
• 5、对混合策略的理解
• 参与者 i 的混合策略可以解释为其对手对于 i 将会选择哪一个纯策略的不确定性,实际 上,在 i 的心中,可能依据自己掌握的一点 儿私人信息已经选择了某一纯策略。不过, 由于其他参与者不能观察到 i 的私人信息, 他们无法确定 i 的选择,我们就用 i 的混合 策略表示其他参与者的这种不确定性。
h
34
• 命题二:
• 如果重复剔除严格劣策略过程最终只剩下 唯一的策略组合,那么这一策略组合为该 博弈唯一的纳什均衡。
h
35
• 命题三:
• 不能被重复剔除严格劣策略过程所剔除的 策略组合,不一定是纳什均衡。
h
36
例11:约会博弈
男生
歌拳 剧击
歌 2, 0, 剧1 0 女生 拳 0, 1, 击0 2
木村
北南 线线
北 2, 2, 线 -2 -2 肯尼 南 1, 3, 线 -1 -3
h
17
• 在单人决策中,当所有情况下的收益都增 加(至少不减少)时,当事者的境况不会 变得更坏,但在博弈中则未必。比较下面 的两个博弈:
h
18
例5
乙
乙
左右
左右
上 -1,3 2,1
上 1,3 4,1
甲 下 0,2 3,4 甲 下 0,2 3,4
h
51
• 3、混合策略纳什均衡的充要条件
• 对任一参与者,凡是以正的概率被选择的 纯策略应带来相等的期望收益,且不低于 以零概率被选择的纯策略带来的期望收益。
博弈论课件 完全信息静态博弈
2.2.2 纳什均衡的一致预测性质
一致预测: 一致预测:如果所有博弈方都预测一个特 定博弈结果会出现, 定博弈结果会出现,所有博弈方都不会利 用该预测或者这种预测能力, 用该预测或者这种预测能力,选择与预测 结果不一致的策略, 结果不一致的策略,即没有哪个博弈方有 偏离这个预测结果的愿望, 偏离这个预测结果的愿望,因此预测结果 会成为博弈的最终结果。 会成为博弈的最终结果。
2.2.1 纳什均衡的定义
纳什均衡: 纳什均衡:在博弈 G={S1,S2,…,Sn;u1,u2,…,un} 中,如果由各 个博弈方的各一个策略组成的某个策略组合 (s1*,…,sn*)中,任 中 一博弈方 i的策略 i*,都是对其余博弈方策略的组合 (s1*,…, si的策略s 的策略
1 *,
si+1* ,…,sn*) 的最佳对策,也即 的最佳对策,
* * ui ( si* , ⋯ si*−1 , si* , si*+1 ,...sn ) ≥ ui ( si* , ⋯ si*−1 , sij , si*+1 ,...sn )
对任意s 都成立, 对任意 ij∈Si 都成立,则称 (s1*,…,sn*) 为 G 的一个纳什均衡
根据上述纳什均衡的定义,可以判断, 根据上述纳什均衡的定义,可以判断,前 面所述各博弈方都不愿单独改变策略的策 略组合。 略组合。
左 上 下 1,0 , 0,4 , 中 1,3 , 0,2 , 右 0,1 , 2,0 , 左 1,0 , 0,4 , 中 1,3 , 0,2 , 左 1,0 , 中 1,3 ,
一完全静态博弈 ppt课件
2020/12/27
33
公共牧场的比喻
• 哈丁所讲的公共牧场则是研究具有同一行为动机结构 的一种特殊的多人情况。
• 那些在会议上高谈阔论却又言之无物的人们,可能看 上去就像牧场上的牛一样,他们一边吃一边践踏,而 另一头牛正在眼巴巴地看着草。
• 现在这个词已经被广泛地应用于研究在公共水域倾倒 污水的行为,在公共石油层开采石油行为,在公海猎 捕鲸鱼的行为,甚至于将地球和地球上的资源比喻成 一个公共养殖场,人类在其中过度繁衍后代。还有中 国的小煤窑的开发以及高校科研经费的申请等。
31
解释
• 寡头竞争的总产量大于垄断产量的原因 在于每个企业在选择自己的最优产量时, 只考虑对本企业利润的影响,而忽视对 另一个企业的外部负效应。这是典型的 囚徒困境问题。
• 这个模型使用重复剔除严格劣战略的方 法找出均衡解。
2020/12/27
32
(2)公共地的悲剧
• 公共地的悲剧(tragedy of the commons)是制度经济 学家非常熟悉的例子。
需求函数取如下线性形式
paq1q2
那么,最优化的一阶条件分别是:
1
q1
a q1 q2 q1
c 0
2020/12/27
2
q2
a q1 q2 q2 c 0
29
反应函数为
q1
R1q2
1 2
a
q2
c
q2
R2 q1
1 2
a
q1
c
解两个反应函数,我们得纳什均衡为
q1
q2
1ac
3
每个企业的纳什利润分别是
2020/12/27
12
关于行动顺序
• 同样的参与人,同样的行动集合,行动 顺序不同,每个参与人的最优选择就不 同,博弈的结果就不同。
完全信息静态博弈教学课件
完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。
博弈论与信息经济学课件2—完全信息静态博弈1
定义一:
完全信息静态博弈(策略型博弈)是指在博弈
中局中人的信息是完全的,并且局中人同时采取行 动或局中人的行动有先有后,但后行动者不知道先 行动者的行动选择的一种博弈。
§1 完全信息静态博弈的表示—支付矩阵
1.2 策略型博弈的表示
1、局中人(Players):i , 1, 2,..., n ; 2、策略空间(Strategies): Si si , i 1, 2,..., n; 3、支付函数(Payoff Functions): ui ui (s1 , , si , , sn );
现实中的囚徒困境——公共资源过度使用
哈丁,1968年,《科学》杂志, 《公共地悲剧》
牧民乙
1只
牧 民 甲
2只
60, 120 80, 80
1只 2只
100, 100 120, 60
现实中的囚徒困境
应试教育与素质教育的两难选择
为什么路越来堵?
为什么成绩越来越高?
团队生产中的偷懒
„„„
现实中的囚徒困境
齐 威 王
上中下 上下中 中上下 中下上 下上中 下中上
性别大战博弈
女生 足球 足球 男生 歌剧 3,2 -1,-1 歌剧 1, 1 2, 3
§2 占优策略(上策)及占优策略(上策)均衡
例:囚徒困境
坦白 坦白 甲 不坦白
乙 不坦白
-5,-5
-8,0
0,-8
-1,-1
“坦白”是甲的优势策略 (坦白,坦白) “坦白”也是乙的优势策略 囚徒困境模型反应了个体理性与集体理性的冲突
完全信息静态博弈
四种博弈类型
完全信息动态博弈
不完全信息静态博弈 不完全信息动态博弈
第二章(完全信息静态博弈)PPT课件
q2 R2(q1)
(3,0) (6,0)
q1
图2.9 古诺模型的反应函数几何描述
2021
27
三、伯特兰德寡头模型——价格博弈
当厂商1和厂商2价格分别是 P1 和 P2 时,它们各 自的需求函数为 :
q 1 q 1 ( P 1 ,P 2 ) a 1 b 1 P 1 d 1 P 2 q 2 q 2 ( P 1 ,P 2 ) a 2 b 2 P 2 d 2 P 1
一、纳什均衡的定义
n个参与人的策略式表达博弈:G {S1, ,Sn;u1, un},
策略组合 S*{S1 *, ,Si*, Sn *}是一个纳什均衡,如果
对于每一个
i,s
* i
是给定其他所有参与人选择
S * 1 { S 1 * , ,S i* 1 ,S i* 1 S n * }的情况下第 i个参与人的
2021
17
三、纳什均衡与上述分析方法的关系
(一)纳什均衡与上策均衡的关系 上策均衡是比纳什均衡更强、稳定性更高的均衡 概念
纳什 均衡
上策均衡
图2.8 纳什均衡与上策均衡的关系
2021
18
G { S 1, ,S n;u 1, u n}
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G {S1, ,Sn;u1, un}中,
2021
16
正是由于纳什均衡是一致性预测,因此才进一 步有下列性质:首先,各博弈方可以预测它,可以 预测他们的对手会预测它,还可以预测他们的对手 会预测自己会预测它,……;其次,预测任何非纳 什均衡策略组合将是博弈的最终结果,意味着要么 各博弈方的预测其实并不相同(预测不同的纳什均 衡会出现等),要么预期至少一个博弈方要“犯错 误”,包括对博弈结构理解的错误,对其他博弈方 的策略预测错误,其理性和计算能力有问题,或者 是实施策略时会出现差错等。
经济博弈论之完全信息静态博弈培训讲义(PPT 57页)
2.2.3 纳什均衡与严格下策反复消去法
❖ 上策均衡肯定是纳什均衡,但纳什均衡不一定是上 策均衡
❖ 命题2.1:在n个博弈方的博弈G={S1, …,Sn,u1, …,un}中,如果严格下策反复消去法排除了除 (s1*,…,sn*) 之外的所有策略组合,那么 (s1*, …,sn*) 一定是该博弈的唯一的纳什均衡.
“斗鸡博弈”
❖ 两个所谓的勇士举着长枪,准备从独木桥的两端上桥中央进
行决斗。每位勇士都有两种选择:冲上去(用U表示)或退下
来(用D)表示。若两人都冲上去,则两败俱伤;若一方上去
而另一方退下来,冲上去者获得胜利,退下来的丢了面子;
若两人都退下来,两人都丢面子。 两个Nash(U,D)和(D,U)
参与人2
解方程得:策略组合(2,2)是本博弈唯一的纳什均衡。
最终市场总产量为:2+2=4
市场价格为:8-4=4
反应函数即一博弈方对另
双方各自得利润为:2×(8-4)-2×2=4 一博弈方每种可能的决策
两厂商的利润总和为4+4=8
内容的最佳反应决策构成
的函数。
q2 6
R1(q2)
3 NE
2 1.5
1.5
3 2
❖ 命题2.2:在n个博弈方的博弈中 G={S1,…Sn;u1, …,un)}中,如果 (s1*, …,sn*) 是G 的一个纳 什均衡,那么严格下策反复消去法一定不会将它消 去.
举例
❖ 有两个候选人,在10个立场中进行选择,选 民立场均匀分布,每个立场都得到10%的选 票,选民会投给离自己最近的候选人,出现 平局票数平分。
从两厂商总体利益最大化的角度作一次产量选择。首先根据 市场条件求总体利益最大化的产量。设总产量为Q,则总得 益为 U=P(Q)-cQ=Q(8-Q)-2Q=6Q-Q2 使总得益最大的总产量Q=3 总得益u=9
北大课件:《博弈论与公共政策》之完全信息静态博弈
介绍求解纳什均衡的方法,例如迭代删除支配策略和解析求解。
3 纳什均衡的应用案例
通过真实案例,展示纳什均衡在经济学、政治学和战略分析中的应用。
章节四:完全信息静态博弈的案例分 析
投票策略博弈
垄断博弈
使用具体的案例,阐述投票 策略博弈中候选人和选民的 策略选择和采用的分析方法。
以垄断市场为例,探讨垄断 博弈中的价格策略、市场竞 争和反垄断政策。
拍卖博弈
介绍拍卖博弈的基本概念和 常见拍卖模型,讨论竞买者 和拍卖者的策略选择。
章节五:博弈论与公共论在公共政策制定中的重要性,以及如何利用博弈论的工具和分析方法 来制定更有效的政策。
2
博弈论的局限性和未来发展趋势
探讨博弈论的局限性,例如信息不完全和不确定性,并展望未来博弈论在全球化 和技术进步中的应用。
北大精品课件:《博弈论 与公共政策》之完全信息 静态博弈
本精品课件将带你深入探索博弈论与公共政策的关系,学习完全信息静态博 弈的基本概念、模型和纳什均衡的求解方法。
章节一:博弈论基础知识回顾
1 博弈理论的基本概念
介绍博弈论的起源、定义和基本概念,例如博弈、玩家、策略等。
2 Nash均衡的定义和特点
解释Nash均衡的概念、定义和特点,以及为什么Nash均衡是博弈论重要的解决概念。
3 博弈论的应用场景
展示博弈论在经济学、政治学和生物学等领域的应用场景,增加理论的实用性。
章节二:完全信息静态博弈的概念与 模型
1
完全信息与不完全信息的区别
解释完全信息和不完全信息静态博弈的区别,包括信息的对称性和对策的制定。
2
静态博弈的基本概念和模型
介绍静态博弈的基本概念和模型,包括玩家、策略、支付矩阵和纳什均衡的定义。
完全信息静态博弈PPT课件
—纳什均衡与多重纳什均衡的再精炼
1、什么是完全信息静态博弈? 2、完全信息静态博弈的几个经典实例。 3、完全信息静态博弈的分析思路和方法。 4、纳什均衡分析案例。 5、多重纳什均衡再精炼分析
1、什么是完全信息静态博弈?
完全信息静态博弈即各博弈方同时决策,且所有博弈方 对各方得益都了解的博弈。
>
弈
方
(3,0)
1 兔子
(3,3)
1 *3 1 *3 6 22 2
博弈方1的风险策略:兔子
博弈方2的风险策略:兔子
该博弈的风险上策均衡为:(兔子,兔子)
3)聚点均衡法
丈夫
时装 足球
妻 时装 (2,1) (0,0)
子 足球 (0,0) (1,2)
夫妻之争博弈
博弈方往往会利用博弈规则以外的特定信息, 如博弈方共同的文化背景中的习惯,规范,共同的 知识或者其他具有特定意义事物的特征作为聚点, 比较容易选择其中的一个纳什均衡,该均衡便是一 个“聚点均衡” 。如,上述博弈中,妻子的生日 可能会作为双方的一个聚点,丈夫则会顺从妻子的 偏好,则(时装,时装)在该博弈中是比较容易选 择的一个纳什均衡,因此, (时装,时装)则是 该博弈的一个“聚点均衡”。
1)决策者考虑短期利益、个人或者小集团利益更多,决策者确实 缺乏理智和理性; 2)局部地区或特定时期战争的利益比上述博弈中所假设的要大; 3)其他国家选择战争时还击比不还击损失小,先发制人则更能使 自己相对有利;
以上因素都是导致发生战争机会增大的重要原因。
2)风险上策均衡法
风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概 率相同时,都偏爱其中某一个纳什均衡,则该纳什均衡就是一个“风险上策均衡”。
博弈论全套上课课件ch2 完全信息静态博弈
1
上 下
南京农业大学经济管理学院 王艳
22
重复剔除严格劣战略的缺陷
1、假定“参与者是理性的”是共同知识。 2、预测结果不精确。
女 足球 男 足球 2,1 0,0 芭蕾 0,0 1,2
芭蕾
南京农业大学经济管理学院 王艳
23
应用部分
古诺模型 伯川德模型 豪泰林模型 公共地的悲剧
南京农业大学经济管理学院 王艳
对上式求导,令其等于零。得到企业1的最 优反应函数:
ac 1 N R(q2 , q3 ,..., qN ) qi 2b 2 i 2
南京农业大学经济管理学院 王艳
15
教科书博弈: 重复剔除的占优均衡
张教授
李教授
400页 600页 800页
400页 45,45 50,15 40,10
600页 15,50 40,40 45,15
800页 10,40 15,45 35,35
南京农业大学经济管理学院 王艳
16
3、纳什均衡
纳什均衡:在博弈 G {S1,Sn ; u1,un } 中,如果由各 si* , sn* 个博弈方的各一个策略组成的某个策略组合 中,任一博弈方i 的策略,都是对其余博弈方策略 * 的组合 si* , si*1 , si*1 ,...sn 的最优反应战略,也即 * * * * * * * * * ui (s1 ,si1, si , si1,...sn ) ui (s1 ,si1, si , si1,...sn ) * * 对任意 si Si 都成立,则称 si , sn 为G 的一个纳 什均衡。
人的最优战略是唯一的,这样的最优战略称为 “占优战略”(dominant strategy)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论与公共政策
北大精品课件
完全信息静态博弈
主要内容
一、博弈的标准式表述
二、占优策略均衡
三、重复剔除的占优均衡
四、纳什均衡
五、多重纳什均衡的比较
六、混合策略
七、应用举例
何谓静态博弈?
开始时由参与者同时选择行动,然后根据所有参与者的选择,每个参与者得到各自的结果。
何谓完全信息静态博弈?
每一参与者的收益函数在所有参与者之间是共同知识。
一、博弈的标准式表述
博弈的标准式表述包括三个方面的内容:
(1)博弈的参与者
(2)每个参与者可供选择的策略集
(3)针对所有参与者可能选择的策略组合,每个参与者获得的收益
对于一个 n 人博弈,设各参与者的策略空间依次为 S1,S2, …,Sn ,收益函数分别为u1,u2, …,un ,其中 ui (s1,s2, …,sn) 为参与者选择策略组合(s1,s2, …,sn) 时参与者 i 的收益,则可用标准式将该博弈表示如下:
G = {S1,S2, …,Sn ; u1,u2, …,un }
在双人有限策略的情况下,可以用双变量矩阵更直观地表述博弈。
例1:囚徒困境
但是,如果参与者超过2人,则用双变量矩阵形式来表示博弈就不那么方便了,甚至根本无法采用这种形式。
例2:三人有限策略博弈
二、占优策略均衡
1、占优策略
在博弈中,如果不管其他参与者选择什么策略,某个参与者的特定策略都优于或至少不劣于其他所有策略,那么,我们就说这个特定策略是该参与者的占优策略。
在前面的囚徒困境博弈中,“招认”就是每个囚徒的占优策略。
2、占优策略均衡
如果每个参与者都存在占优策略,那么由这些占优策略构成的组合就称为占优策略均衡。
在前面的囚徒困境中,(招认,招认)就构成一个占优策略均衡。
注意:
占优策略均衡只要求每个参与者是理性的,而并不要求每个参与者知道其他参与者是理性的,也就是说,不要求“理性”是共同知识。
例3:公共产品的供应问题
A、B两人同住一室,现在,他们考虑是否购买一台电视机。
电视机的价格为4000元,每个人从看电视中获得的效用各为3000元。
假定他们根据下列程序决定是否购买电视机:
每人把是否购买电视机的想法写在一张纸条上,如果两人都认为应该购买,则平均分担购买电视机的费用。
如果两人都认为不应该购买,则不购买电视机。
如果只有一人提出购买而另一人不想购买,则由提出购买的人独自购买电视机。
每个人会如何决策?
三、重复剔除的占优均衡
1、重复剔除的占优均衡
首先从某一参与者的策略集里剔除掉一个劣策略,再重新考察各个参与者剩下的策略中哪些是劣策略并剔除其中之一,不断继续这一过程直到每个参与者都仅剩一个策略为止,最后得到的策略组合就称为重复剔除的占优均衡。
例4:俾斯麦海之战
在单人决策中,当所有情况下的收益都增加(至少不减少)时,当事者的境
况不会变得更坏,但在博弈中则未必。
比较下面的两个博弈:
例 5
2、理性共识
重复剔除的占优均衡不仅要求每个参与者是理性的,而且要求“理性”是参与者的共同知识,即参与者具有“理性共识”(Common Knowledge of Rationality,简记为CKR)。
理性共识可划分为不同的层次:
零阶理性共识:每个人都是理性的,但不知道其他人是否理性。
一阶理性共识:每个人是理性的,并且知道其他人也都是理性的,但并不知道其他人是否知道自己是理性的。
二阶理性共识:每个人是理性的,也知道其他人都是理性的,而且知道其他人知道自己是理性的,但不知道其他人是否知道自己知道他们知道自己是理性的。
依此类推。
例 6
选择越多(行动空间越大),对理性共识的要求越高。
请看下例:
例 7
四、纳什均衡
许多博弈既不存在占优策略均衡,也不存在重复剔除的占优均衡。
例 8
1、纳什均衡的定义
如果存在这样一个策略组合――给定该策略组合中其他参与者的选择,没有人有积极性改变自己的选择,我们就说该策略组合是一个纳什均衡。
交通规则问题就是一个很好的例子:
例9:交通规则问题
纳什均衡是一种一致预期:基于信念的选择是合理的;支持选择的信念是正确的。
这种一致预期能够自我实现,不会出错:如何所有人认为这个结果会出现,
这个结果就会出现。
以交通规则问题为例,如果甲认为乙预期甲将靠右走,甲就确实会选择靠右走。
2、纳什均衡的意义
如果某个策略组合为纳什均衡,那么任何一个参与者都没有激励独自背离他所选定的策略。
这就是说,该策略组合是“策略稳定”或“自动实施”的。
换一种说法,如果参与者事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。
3、严格纳什均衡与弱纳什均衡
4、用划线法求纳什均衡
例 10
5、纳什均衡与重复剔除的占优均衡之间的关系
命题一:
纳什均衡不会被重复剔除严格劣策略过程所剔除。
命题二:
如果重复剔除严格劣策略过程最终只剩下唯一的策略组合,那么这一策略组合为该博弈唯一的纳什均衡。
命题三:
不能被重复剔除严格劣策略过程所剔除的策略组合,不一定是纳什均衡。
例11:约会博弈
命题四:
重复剔除弱劣策略过程有可能剔除弱纳什均衡,但不会剔除严格纳什均衡。
例 12
五、多重纳什均衡的比较
1. 聚点均衡
2. 帕累托效率标准
3. 强均衡
4. 抗联盟(抗共谋)纳什均衡
博弈实验1
分钱财博弈
例2:三人有限策略博弈
六、混合策略
1、混合策略
所谓混合策略,就是参与者以一定的概率从几种纯策略中随机选择。
有些博弈不存在纯策略纳什均衡,但存在混合策略纳什均衡。
例13:监督博弈
监督
不监督
偷懒
不偷懒
1,-1
-1,2
-2,3
2,2
例14:单<a name=baidusnap0></a>相思</B>
例15:划拳博弈
2、说明
(1)一个给定的纯策略可能会严格劣于一个混合策略,即使这个纯策略并不严格劣于其他任何一个纯策略。
例16
(2)一个给定的纯策略可以是针对对手的一个混合策略的最优反应,即使这一纯策略并不是针对对手的任何一个纯策略的最优反应。
例17
(3)给定其他参与者的策略,参与者的一个混合策略要成为其最优反应,混合策略中每一个概率大于0的纯策略本身也必须是其最优反应。
3、混合策略纳什均衡的充要条件
对任一参与者,凡是以正的概率被选择的纯策略应带来相等的期望收益,且不低于以零概率被选择的纯策略带来的期望收益。
4、混合策略纳什均衡的求法
(1)对于每个参与者,选择其纯策略空间的一个子集。
构造一个一般化的混合策略组合。
(2)检查是否存在参数(概率)使得该混合策略组合满足混合策略纳什均衡的充要条件。
若存在,则为混合策略纳什均衡。
(3)不断重复前两步,直到完成对各参与者所有子集组合的分析为止。
例18:求混合策略均衡
5、对混合策略的理解
参与者 i 的混合策略可以解释为其对手对于 i 将会选择哪一个纯策略的不确定性,实际上,在 i 的心中,可能依据自己掌握的一点儿私人信息已经选择了某一纯策略。
不过,由于其他参与者不能观察到 i 的私人信息,他们无法确定 i 的选择,我们就用 i 的混合策略表示其他参与者的这种不确定性。
博弈实验2
公共汽车让座博弈
6、纳什定理(纳什均衡的存在性)
在博弈中,如果 n 是有限的,并且对每个 i ,Si 是有限的,则博弈至少存在一个纳什均衡,均衡可能包含混合策略。
七、应用举例
例19:古诺的双头垄断模型
例20:伯川德的双头垄断模型
例21:最后要价仲裁
例22:公共地的悲剧
三个选民(1、2、3)要就三个备选方案(A、B、C)进行投票。
采用多数票制,但为了避免出现僵局,现在选民1担任主席,主席的权力体现在:如果三个人的投票结果没有哪个方案胜出,那么作为主席的1就拥有最终决定权。
各人的偏好顺序如下表所示。
以上信息为共同知识。
你认为每个人会如何投票,最终哪个方案被选中呢?
博弈实验3。