博弈论(第二章)讲义

合集下载

博弈论导论 2

博弈论导论 2

图 2-5 军备竞赛
思考:现实生活中还有哪些情况属于囚徒困境? 练习:将团队生产问题模型化成囚徒困境;如何理解囚徒困境与“看不见的手”之间 的矛盾?
2.1.5 走出囚徒困境
从社会福利的角度讲,囚徒困境不是帕累托最优的,但这与理性人的假设并不矛盾。
① ②
这实际上是 Betrand 价格竞争模型。 这是 Hardin(1968)发表在 Science 上但是被经济学引用最多的例子。但是,最近有学者提出了“反公地 悲剧”理论。董志强(2007)启发我使用这个简单的收益矩阵而非复杂的数学模型。 白鲨在线 2
2.3.2 性别战
如图 2-12。两个博弈相同的地方在于:(1)存在多重均衡,而且双方各自偏向一个 均衡;(2)任何一个均衡结果都是帕累托最优的。信念扮演了重要的作用。在这个博弈中, 假设男方是一个有名的拳击手,而女方也知道这点,那么(拳击,拳击)应该是一个均衡结 果,而(芭蕾,拳击)不应该出现。
白鲨在线 5
2.3.4 协调博弈
如图 2-14,史密斯公司和琼斯公司独立地决定选择何种智能手机操作系统。若两家公 司选择同样的操作系统,销售会更好。 特征:存在多重均衡,但是一些均衡帕累托优于另一些均衡,这与性别战和斗鸡博弈 都不同。 提示:一定要注意不同博弈模型的结构性特征,而不是过于关注具体数字。 思考:现实生活中有哪些博弈是性别战、斗鸡博弈和协调博弈?
图 2-1 双边优势
图 2-2 单边优势
2.1.2 定义优势策略均衡
并且,我们有 命题:如果一个博弈 N ,{Si }i 1 ,{vi ()}i 1 存在优势策略均衡 s ,那么 s 就是惟一的 优势策略均衡,并且也是惟一的纳什均衡。 证明过程略(可做思考题或作业)。
白鲨在线 1

博弈论讲义2

博弈论讲义2
13
尽管许多博弈中重复剔除的占优均衡是一个合理 的预测,但并不总是如此,尤其是大概支付是某 些极端值的时候。
参与人B
L
参与人A
R -1000,9
U
8,10
D
7, 6
6, 5
U是A的最优选择,但是,只要有1/1000的概率B选R, A就会选D
14
斗鸡博弈
进 A 独木桥 纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
1、Cournot Model of Duopoly
按竞争程度划分的市场类型(就卖方来说):
A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场
29
市场类型不同,厂商之间行为特征不同,A与C 类型中,厂商的决策都是个体优化决策,而B类 型中寡头垄断竞争的本质就构成博弈,他们都 是理性的决策者,他们的行为既影响自身,又 影响对方。尽管两寡头由于垄断能给他们带来 一些共同的利益,但是他们的根本利益并不是 完全一致的。如果两寡头之间可以签定有约束 力的协议,彼此之间达成合作,形成完全垄断, 此时的博弈是一种合作博弈。然而在大多数情 况下,彼此之间很难达成有约束力的协议,这 样就是非合作博弈。
7
注意:
与占优战略均衡中的占优战略和劣战略不同,
这里的占优战略或劣战略可能只是相对于另一个
特定战略而言。
8
案例1-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 4大于1
0,0
0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
9
案例2
U 行先生
s * 是一个纳什均衡: 或者用另一种表达方式: 当且仅当 si* 是下述最大化问题的解时,

经济博弈论第二讲

经济博弈论第二讲
▪ 每个人的得益来自于各自对房间的干净程度的效用减去 他打扫花费的时间。
▪ 请画出策略组合及得益矩阵,并分析博弈结果。
课后作业2(分析智猪博弈)
▪ 在博弈论经济学中,“智猪博弈”是一个著名例子 ▪ 假设猪圈里有一头大猪,一头小猪。猪圈的一头有猪
食槽,另一头安装着控制猪食供应的按钮,按一下按 钮会有10个单位的猪食进槽,但是谁按按钮就会首先 付出2个单位成本,若大猪先到槽边,大小猪吃到食 物的收益比是9:1;同时到槽边,收益比是7:3;小 猪先到槽边,收益比是6:4。 ▪ 在两头猪都有是有智慧的前提下,请分析猪的选择策 略。
▪ 上策均衡是反映了所有博弈方的绝对偏好,因此 非常稳定。根据上策均衡,就可以对博弈结果作 出最肯定的预测。
▪ 因此,进行博弈分析时,应首先判断各个博弈方是 否都有上策,博弈中是否存在上策均衡。
▪ 上策均衡分析采用的决策思路是一种选择法的思路, 是在所有可选择策略中选出最好的一种的思路。
▪ 因为博弈方的最优策略随其他博弈方的策略而变化 是博弈的根本特征,是博弈关系相互依存性的主要 表现形式,所以上策均衡不是普遍存在的。
1, 0 0, 4
1, 3 0, 2

0, 1


2, 0

-5, -5 -8, 0
0, -8 -1, -1
▪许多博弈不存在确定性的结果

-1, 1


1, -1
1, -1 -1, 1
夫 妻
2, 1

0, 0

0, 0 1, 3
2.1.4 箭头法
▪ 对博弈中每个策略组合进行分析,考察每个策略组合处各个博弈方 能否通过单独改变自己的策略而增加得益。

博弈论(第二章)

博弈论(第二章)
设某个村庄有三个农户,该村有一片大家都可以 自由放牧羊群的公共草地。由于这片草地的面积 有限,因此只能让不超过某一数量的羊吃饱,如 果在这片草地上的放牧的羊只的数量超过这个数 量,则每只羊都无法吃饱,从而每只羊的产出 (毛,皮和肉的总价值)就会减少,甚至有些羊 就会饿死。
假设这些农户在夏天才到公共草地放羊,而每年 的春天就要决定养羊的数量。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,

第二讲纳什均衡

第二讲纳什均衡

习题:齐威王田忌赛马矩阵

上中下 上中下
田忌
上下中 中上下 中下上 下中上 下上中
+3,-3 +1,-1 +1,-1 -1,+1 +1,-1
+1,-1 +3,-3 -1,+1 +1,-1 +1,-1
+1,-1 +1,-1 +3,-3 +1,-1 -1,+1
+1,-1 +1,-1 +1,-1 +3,-3 +1,-1
在第二行1 下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
20
第三节 纳什均衡
三、寻找纳什均衡的方法 (二)相对优势策略划线法 3.设定甲靠左行(第一行) 乙: 1>-1 乙相对优势策略:靠左行
在第一列 1下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
21
第三节 纳什均衡
四、古诺模型 max i 2.企业i的目标: π1=?,π2=? 3.企业利润最大化的一阶、二阶条件
1 0 q1 2 0 q2
2015年12月6日
2 1 2 0 2 q1 2 2 2 0 2 q 2
博弈论第二章 第二讲纳什均衡
35
第三节 纳什均衡
27
第三节
纳什均衡
要点:(1)箭 头指向的支付 大;(2)只有 一方单独改变 策略
三、寻找纳什均衡的方法 (三)箭头指向法 2.分析:(适度放牧,过度放牧) (1)给定乙不变,甲改变:0→10 (箭头向上) (2)给定甲不变,乙也不变
2015年12月6日
博弈论第二章 第二讲纳什均衡

经济博弈论 02 完全信息静态博弈(Park)

经济博弈论 02 完全信息静态博弈(Park)
ui(S1*, ... Si-1*, Si*, Si+1*, ... Sn*) ≥ui(S1, ... Si-1*, Sij, Si+1*,… Sn*)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?

经济博弈论第2章(23) ppt课件

经济博弈论第2章(23)  ppt课件

4 1

如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
uG 1, 4 1 uG 0,
0.2
PPT课件
18
• 解二: 支付等值法
如果一个混合策略是政府的最优选择,那一定意
味着流浪汉在寻找工作与游闲之间是无差异的,
即:
流浪汉
找工作
游荡
政府 救济 不救济
3,2 -1 , 1
-1 , 3 0,0
uL 1, 1 3 uL 0,
0.5
PPT课件
19
五、混合战略纳什均衡
• 对 * 0.2 的解释: • 如果流浪汉找工作的概率小于0.2, 则政府选择不
救济,如果大于0.2,政府选择救济 ,只有当概率等 于0.2时,政府才会选择混合战略或任何纯战略. • 对 * 0.5 的解释 • 如果政府救济的概率大于0.5,流浪汉的最优选择 是流浪,如果政府救济的概率小于0.5,流浪汉的最 优选择是寻找工作.
1 , -1 -1 , 1
假设A出红牌的概率为 p;B出红牌的概率为 q ;则
U A( p, q) 2 p(1 2q) (2q 1)
因此A的最佳反应函数为
p 1
0, 当q 1/ 2
p [0,1],当q 1/ 2
1, 当q 1/ 2
PPT课件
0
1/2
1 q 27
第二章 完全信息静态信息博弈-纳什均衡
一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡 五 混合战略纳什均衡 六 纳什均衡存在性及相关讨论
PPT课件

博弈论课件 第二章

博弈论课件 第二章

2.3 无限策略博弈分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性
2.3.1 古诺的寡头模型
假设条件:
市场总产量Q q1 q2 市场出清价格 P P(Q) 8Q 边际成本c1 c2 2,无固定成本 两厂商同时决定各自产的量
2.2.1 纳什均衡的定义
博弈、博弈方的策略空间和得益的一般表示法 G 表示一个博弈; n个博弈方;
S1,S2, ,Sn表示每个博 策弈 略方 集的 合可 , 空 选 称 间为 ”“ ; sijSi表示博 i的 弈第 j个 方策略; 博弈i的 方得益 ui表 用示ui, 是各博弈方策 函略 数的 ;多元
★★★学习博弈论,大家一定要记忆一些基本的模型。因为很多
时候,我们总是基于已有的模型,对其做出修订来考察一些新的 问题。完全创新的模型是很少见的,当我们记忆的模型多了,就 很容易在分析问题时套用模型,并修订模型的条件来考察自己研 究的问题。
其实大家学习西方经济学理论的时候,会发现它与大家曾接触 的马克思主义经济学理论,以及国内一些逻辑思辩型的经济学研 究范式一个很大不同就在于,它采取的是一种模型化的思维。我 们学习西方经济学的时候,会发现始终在学习一些模型,因为模 型是帮助我们简单地理解现实世界的有用工具。经济学中的数学 模型,其实与生物课教学的塑料人体模型等在本质上并无不同。



博弈的解:(上,中)
博上 弈 方 一

1,0 0,4
1,3 0,2
0,1 2,0
2.1.3 划线法
囚徒困境
囚 坦白 徒 1 不坦白
囚徒 2 坦白

博弈论讲义2

博弈论讲义2

三 重复剔除的占优均衡
重复剔除严格劣策略:
思路:首先找到某个参与人的劣策略(假定存 在),把这个劣策略剔除掉,重新构造一个不包 含已剔除策略的新的博弈,然后再剔除这个新的 博弈中的某个参与人的劣策略,一直重复这个过 程,直到只剩下唯一的策略组合为止。 这个唯一剩下的策略组合就是这个博弈的均衡 解,称为“重复剔除的占优均衡”。
独木桥

A
退
B
进退 -3,-3 2,0
0,2 0,0
纳什均衡:A进,B退;A退,B进
斗鸡博弈
村子里有两户富户,有两种可能:一家修,另 一家就不修;一家不修,另一家就得修。
冷战期间美苏抢占地盘:一方抢占一块地盘, 另一方就占另一块。
夫妻吵架,一方厉害,另一方就出去躲躲。
注意:在混合策略纳什均衡条件下,也可能两 败俱伤。
注意: 如果所有人都有(严格)占优策略存在,
那么占优策略均衡就是可以预测的唯一 均衡。 占优策略只要求每个参与人是理性的, 而不要求每个参与人知道其他参与人是 理性的(也就是说,不要求理性是共同 知识)。为什么?
二 占优策略均衡
案例-囚徒困境
囚徒A
囚徒 B
坦白
坦白 -8,-8
抵赖
0,-10 -8大于-10
相安无事;第二天,相安无事……;直到第100天 ,突然,每个妻子都把丈夫杀了。为什么会这样?
这是一个推理和行动的过程。如果她的丈夫不忠的话,她就杀 死他;如果没有证据证明她的丈夫不忠的话,她便相信他,不 杀死他。

如果村里只有一个男人是不忠的话,在老太太作了宣布之
后的第一天,这个男人的妻子在老太太宣布之后马上就能知道
两只猪一起去按,然后一起回槽边进食, 由于大猪吃得快可吃下8个单位的食物, 小猪只能吃到2个单位食物。

博弈论第二章(4)

博弈论第二章(4)
这时,若3方选择B,显然对于1、2来说都是不利的,但 是,若3方选择A,1、2方选择(U,L)对三方都有好处,但是,
这时1、2方有合谋的动机,可能选择(D,R)使自己更好。
二、共谋和防共谋博弈均衡
2、防共谋均衡:如果一个博弈的策略组合满足(1)没有任何 单个博弈方的串通会改变博弈结果;(2)给定博弈方有再次偏 离的自由时,没有任何两个博弈方的忠勇串通会改变要;(3) 依此类推,直到所有博弈方的串通也不会改变博弈结果。满 足上述条件的博弈均衡为防共谋均衡。 上例博弈的防共谋均衡为(D,R,B)。这也是一个囚徒困境。 事实上,在排除了共谋的影响后,多人博弈与两人博弈就 没有实质上的区别了。所以我们的举例一般都 以二人博弈为 例。所得出的纳什均衡、风险上策、pareto上策等都适用于多 人博弈。
但是, 既然(和平,和平)是帕累托上策均衡,那为 什么历史上还会有那么多的战争呢?可能的原因是:
决策者缺乏理智或理性。
局部战争的收益比博弈分析中假设大的多。 战争的一方认为自己有绝对获胜的把握。
2、风险上策均衡 例三国鼎立的吴蜀联盟博弈。即两家联合进攻魏国,若获 胜则可瓜分魏国的国土,若一方背叛,则有亡国的危险;若
猎鹿博弈 猎鹿博弈也是一个风险上策均衡的例子。两个 猎人同时发现了一只鹿和两只兔子,若两人合作就 有可能得到一只鹿,否则各人可能获得一只兔子。
猎人B 鹿 猎人A 鹿 兔子 5, 5 3, 0 兔子 0,3 3,3
该博弈说明的问题是,若合作为10人,或更多 的人时,相信其它更多的人的合作意愿比相信另外 一人合作的意愿更难。此时,更多的博弈方选择风 险上策均衡策略组合。
1、帕累托上策均衡 帕累托(pareto)均衡:即所有纳什均衡中最优的一个均衡 策略组合。

张维迎《博弈论与信息经济学》讲义-第02章-纳什均衡与一致预期

张维迎《博弈论与信息经济学》讲义-第02章-纳什均衡与一致预期

最优选择
这个博弈只要求一阶理性共识就可以预测均衡 结果: 如果R相信C是理性的,R就知道C不会选择C3, 所以R的最优选择是R1; R R1 如果C相信R是理性的,C就知道R不会选择R2, 所以C的最优选择是C2. 但要C预期R不会选择R3,需要二阶理性共识; 要R不预期C会选择C1,需要三阶理性共识.
– – – – 如果R(b)C 选择C2, 如果R(b)C(b)R会选择R2; 如果R(b)C(b)R(b)C会选择C1; 如果R(b)C(b)R(b)C(b)R会选择R1
Consistently aligned beliefs (CAB)
考虑(R3,C3):对方不会犯预期错误:R选 择R3,如果他认为C会选择C3;C会选择C3, 如果他认为R会选择R3. CAB CAB:每个人对别人行为的预期(信念)是正 确的; Harsanyi doctrine: 如果两个理性的人具有相同 的信息,他们一定会得出相同的推断和相同的 结论; Robert Aumann: rational agents cannot agree to disagree.
重复剔除与理性共识
重复剔除不仅要求每个人是理性的,而且要求每个人 知道其他人是理性的,每个人知道每个人知道每个人 是理性的,如此等等,即理性是"共同知识"(共识) C1 R1 R2 R3 10,4 9, 9 1,98 C2 1, 5 0, 3 0,100 C3 98,4 99,8 100,98 这个博弈只要求 一阶理性共识就 可以预测均衡结 果. 如果把(下-左) 的第一个数字改为 11呢?
纳什均衡与一致预期
张维迎 教授 北京大学光华管理学院
博弈的基本概念(1)
参与人(players):博弈中决策主体的集合:什 么人参与博弈?每个人是什么角色? 行动(actions): 每个人有些什么样行动可以选 择?在什么时候行动? 信息(information):在博弈中的知识;每个人 知道些什么(包括特征,行动等)? 战略(strategies):行动计划;每个人有什么战 略可供选择?战略的完备性;

大学课程《博弈论及其应用》PPT课件:第二章(1234节)

大学课程《博弈论及其应用》PPT课件:第二章(1234节)

如果在一个博弈中,不管其他的博弈方的策略如何变化,一 个博弈方的某个策略给其带来的得益,总是相对于其他某些 策略(不必是全部)给他带来的得益要小,该策略称为相对 于其他某些策略的严格劣势策略(严格下策)。
我们在分析一个博弈方的决策行为时,首先找出某个博弈方 严格下策(假定存在),把这个策略消去,重新构造新的博 弈;然后,再消去这个新的博弈中的某个博弈方的严格下策; 继续这个过程,一直到只剩下唯一的策略组合为止。这个唯 一剩下的策略组合就是这个博弈的均衡解。这种分析方法称 之为“累次严优”,也称作“严格下策反复消去法”。
问题是,每个博弈方都要觉得偏好上策的情况很少,一般情 况是所以博弈方都没有上策,上策均衡不是普遍存在的。
在不存在严格优势策略的情况下,相对较好的选择是,不论 其他博弈方选择什么策略,该博弈方选择的某个策略给其带 来的得益不低于其可以选择的任何其他策略。通常把具有这 种性质的策略称为这个博弈方的弱优势策略。
优势策略有整体的严格优势策略(strictly dominant strategy)和 弱优势策略(weakly dominant strategy)区别。所谓的严格优势 策略,是指无论其他博弈方选择什么策略,这个博弈方的某
个策略给他带来的得益始终高于其他的策略,至少不低于其 他策略的策略。例如,囚徒的困境中的“坦白”,就是上策。
累次严优
博弈方2


上 博弈方1

1,0 0,4
1,3 0,2
图 2-5

0,1 2,0
对于图2-5描述的一个抽象博弈,不存在上策均衡。分析博弈 方1的策略,“上”策略和“下”策略都不是严格占优的优 势策略。再来分析博弈方2的三个策略,横着比较后面的得 益,“左”和“中”比较,“左”和“右”比较,没有严格

第二章_博弈思维:向前展望_从后倒推2010

第二章_博弈思维:向前展望_从后倒推2010

跳槽时和会考虑给你加薪
不辞职
老板不用多付薪金
加薪谈判博弈树
绑架和诚实
如果你的孩子被绑架,你是否按绑匪的要求给付赎金?
如果你是绑匪,刚拿到赎金,你该不该释放人质?
撕票 不支付赎金 父母
支付赎金
若被警方抓住,判绑架杀人罪
绑匪 释放人质 撕票 绑匪 释放人质 易被警方抓住,判绑架罪 易被警方抓住,判绑架罪 若被警方抓住,判绑架杀人罪
甚至要求将药免费送给贫穷国家。这后果是什么呢?
制药厂的博弈
制药厂往往担心进入与政府和社会的博弈中。它作出投资 与否的决定取决于它对政府限价决定的预测。当它认为政 府会限价时,它就不会投资开发新药。
不开发新药
药厂与政府、社会均无所得
药厂
花9900万元 研制新药
限价 政府 不限价
药厂亏20000万元, 政府与消费者获益2000万
企业为什么诚实守信?
不光顾B公司 A公司 (顾客)
光顾B公司
两公司没有得益
占A公司便宜 B公司
B公司赚1000元, A公司损失2000元
公平对待A公司 B公司赚100元, A公司赚100元
企业为什么诚实守信?
如果B公司只打算进行一次博弈,那它一定会选择多占A公
司便宜。
在一次性博弈中,即使B公司承诺会公平对待A公司,A公 司也不会相信它,所以B公司一分钱也赚不到。 或者你会说,“只要B公司公平对待A公司,不就可以赚到 100元吗?
制药厂的博弈
假设:
9900万元=研制第一剂药的成本
1元=生产第二剂及后续药品的成本 100万人=想买这种药的总人数 如果制药厂生产100万剂,则每剂的成本为: (9900万+100万)÷100万= 100元。 政府及社会人士便会指责药厂,既然只要花1元钱就可以 制造出一剂新药,卖110元并不合理,因而要求限价50元,

博弈论讲义4

博弈论讲义4
16
γ * = 0 .2
六 混合战略纳什均衡
混合战略纳什均衡的含义:
纳什均衡要求每个参与人的混合战略是给定对方的混 合战略下的最优选择。因此在社会福利博弈 γ θ 中, * = 0.2 , *=0.5是唯一的混合战略纳什均衡。 从反面来说,如果政府认为流浪汉选择寻找工作的概 率严格小于0.2,那么政府的唯一最优选择是纯战略: 不救济; 如果政府以1的概率选择不救济,流浪汉的最优选择是 寻找工作,这又将导致政府选择救济的战略,流浪汉 则选择游荡。如此等等。
8
六 混合战略纳什均衡
混合战略:如果一个战略规定参与人在给定信息情况 混合战略: 下以某种概率分布随机地选择不同的行动, 以某种概率分布随机地选择不同的行动, 则该战略为混合战略。 则该战略为混合战略。
G = {S1, S 2, , S n; u1 , u 2 , L , u n } L 中, 在 n 个参与人博弈的战略式 表述:
男 足球 芭蕾 女 足球 2,1 0,0 芭蕾 0,0 1,2
26
七 纳什均衡存在性及相关讨论
如何保证均衡出现: 1、“聚点”均衡:参与人可以使用某些被 抽象掉的信息达到一个“聚点均衡”。 两个人分蛋糕; 性别战中的博弈; 两人同时给对方打电话 ……
27
七 纳什均衡存在性及相关讨论
2、廉价磋商-“协调博弈”
2
六、混合战略纳什均衡
社会福利博弈
流浪汉 寻找工作 政府 2 救济 3, 1 不救济 -1, 0, -游戏
三毛、一休 各拿一枚硬币 若同时正面 或反面出现, 三毛给一休 1 元钱, 若一正面和 一反面,一休 给三毛 1元钱。
零和博弈
博弈参与者有 输有赢,但结 果永远是0。 正面 1 正面 反面 -1, -1 1, -1,

博弈论第二章——博弈规则

博弈论第二章——博弈规则

U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈

博弈论第二章 (1)

博弈论第二章 (1)
囚徒2 坦 白 囚 坦 白 徒 1 不坦白 -5, -5 -8, 0 不坦白 0, -8 -1, -1
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3

3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略

二、重复剔除严格劣战略


(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2



上 博弈方1

1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0
0, -8 -1, -1
划线法的联系(2)
例3:下图中的得益矩阵表示两博弈方的一个静态博
弈,试使用划线法进行分析;另可否用严格反复
消去法分析。
博弈方2
L
C
R
U 0, 4 4, 0 5, 3
例2:斗鸡博弈
B

退
进 A
退
-1, -1 1, 2
2, 1 0, 0
三、有关纳什均衡的应用举例
(1)古诺(Cournot,1838)的寡头模型
设一市场有厂商1和厂商2生产同样的产品(产品是 同质的)。如果厂商1的产量为q1,厂商2的产量为 q2,则市场上的总产量为Q= q1+ q2。设上述总产量 全部售出的价格为P=P(Q)=8 - Q。
严格下策反复消去法的分析(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
严格下策反复消去法的分析(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
严格下策反复消去法的分析(3)
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
上策均衡的分析(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
上策均衡的分析(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
结论:由于不是所有的博弈都存在着这种上策均衡 ,因 此,上策均衡的分析方法存在一定的局限性。
第二章 完全信息的静态博弈
第一节 博弈模型的分析方法
一、上策均衡 (1)上策:在一个博弈中,不论其他博弈方选择什么策 略,某一博弈方的最优策略是唯一的,称这种策 略为该博弈方的一个上策。 (2)上策均衡:如果在一个博弈中的某个策略组合中的 所有策略都是各个博弈方的各自的上策,称这个 策略组合为该博弈的一个“上策均衡”。
博弈方2



上 博弈方1

1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
严格下策反复消去法的总结
(1)先找出某一个博弈方的严格下策(假定存在), 然后把这个严格下策去掉,继续这个过程,一直 到只剩下一个唯一的策略组合为止。这个唯一剩 下的策略组合就是这个博弈的均衡解。如果剩下 的策略组合不唯一,那么就不能用严格下策反复 消去法去解。
1, -1 -1, 1
二、有关纳什均衡的几个结论
(1)纳什均衡的一致预测性:如果所有的博弈方 都预测某一个特定的纳什均衡所组成的策略 组合会出现,那么,所有的博弈方都不会选 择与预测结果不一致的策略。
(2)每一个上策均衡都是纳什均衡,但反过来纳 什均衡不一定是上策均衡。
二、有关纳什均衡的几个结论
(3)在一个博弈中,如果使用严格下策反复消去 法消去了除某一策略组合以外的所有策略组 合,那么该策略组合一定是该博弈的唯一的 纳什均衡。
(4)通过划线法所求出的最佳策略组合一定是纳 什均衡。
有关纳什均衡的例子(1)
例1:夫妻之争
丈夫
时装
足球
妻子ห้องสมุดไป่ตู้
时装 足球
2, 1 0, 0
0, 0 1, 2
有关纳什均衡的例子(2)
博弈方1 M 4, 0 0, 4 5, 3
D 3, 5 3, 5 6, 6
三种分析方法的总结
在一个博弈中,对于一个稳定性的策略组合,不管是 否唯一,都有一个共同的特性,就是每一个博弈方的 策略都是针对其他博弈方策略的最佳对策,各博弈方 都不愿意改变策略的策略组合。
第二节 纳什均衡
一、纳什均衡
在博弈G=(S1,S2,…,Sn;u1,u2,…,un)中, 如果某个策略组合(s1*,s2*,…,sn*)中的任一博 弈方i的策略si*,都是对其余博弈方策略的最佳对策, 也即:Vi,有下面式子成立: ui(s1*,s2*,…,si*,…,sn*)≥ui(s1*,s2*,…, si,…,sn*) 其中,V si∈Si。
再设两厂商的生产都无固定成本,且每增加一单位 产量的边际成本相等,c1=c2=2,最后强调的是两厂 商同时决定他们各自的产量,也就是他们在决策时 都不知道对方的产量。试确定上述博弈模型达到纳 什均衡时两个厂商的各自的产量。
反应函数的概念
称R1(q2) :q1= R1(q2)=1/2(6- q2)为厂商1对厂商 2产量的“反应函数”,它意味着对厂商2的每一个产量 q2,有厂商1的最佳对策的q1,q1是厂商2产量的一个连 续函数。
相关文档
最新文档