博弈论第二章 (1)
博弈论(第二章)讲义
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2
左
中
右
上 博弈方1
下
1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0
博弈论第2章
• 托玛斯 谢林(Thomas C. Schelling )84岁,美国公民。他1951年 托玛斯-谢林( 谢林 岁 美国公民。 年 获得哈佛大学经济学博士学位。 获得哈佛大学经济学博士学位。后曾在美国哈佛大学的肯尼迪学 院教学长达20 20年 担任政治经济学教授, 院教学长达20年,担任政治经济学教授,并获得退休名誉教授 的称号。之后他还在美国马里兰大学公共政策学院和经济系担任 的称号。 教授,并获得退休名誉教授称号。 教授,并获得退休名誉教授称号。他教授的课程除包括经济学理 论外,还涉及外交、国家安全、核战略以及军控等多方面。 论外,还涉及外交、国家安全、核战略以及军控等多方面。
贡献:《冲突战略》、《武器与影响》等,其中前者是相关领域中最具 开创性的理论著作之一。他的理论和思想不仅运用在经济学分析中,在外 交、军事领域也深有影响。
Robert J. Aumann
Thomas C. Schelling
罗伯特·奥曼的博弈论
• • • • • 弈论:交互式条件下“最优理性决策” 完全竞争经济:参与者连续统模型 重复博弈论:理论系统性的发展 合作与非合作博弈论:非转移效用与理性的假设 其他贡献 “奥曼可衡量选择定理”、值集函数积分结 果等 评论:
博弈论的形成
博弈论的真正起点 博弈论的真正起点—— 真正起点—— 诺伊曼、 1944年 冯 诺伊曼、摩根斯坦 1944年《博弈论和经济行 Behavior) 为》 (Theory of Games and Economic Behavior) 在这本著作中引进了扩展形(Extensive Form)表 在这本著作中引进了扩展形( 扩展形 ) 示和正规形(Normal Form)或称策略形(Strategy 示和正规形( )或称策略形( 正规形 Form)、矩阵形(Matrix Form)表示,定义了极小化 )、矩阵形 )、矩阵形( )表示,定义了极小化 ),提出了稳定集( 极大解( ),提出了稳定集 极大解(Minmax Solution),提出了稳定集(Stable Sets)解概念等,正式提出了创造一种博弈论的一般理 )解概念等, 论的主意
博弈论-博弈分类
各博弈方的选择和行动有先后次序且后选择、后行动的博弈 方在自己选择行动之前可以看到其他博弈方选择的行动
如弈棋、市场进入、领导——追随型市场结构等 重复博弈
➢ 同一个博弈反复进行所构成的博弈,提供了实现更有效率博弈 结果的新可能
➢ 长期客户、长期合同、信誉问题 ➢ 有限次重复博弈、无限次重复博弈
2023/1/4
覃燕红——重庆理工大学
20
4、博弈分类区分 III :课程涉及的4种博弈类型
4种基本的博弈类型
完全信息
静态 完全信息静态博弈
纳什均衡
动态 完全信息动态博弈 子博弈精炼纳什均衡
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
不完全信息动态博弈 精炼贝叶斯纳什均衡
➢ 完全信息:每个参与人都拥有所有其他参与人的特征、策略及支付 函数等方面准确信息的博弈。
• 人们在决策时遵循最大化原则 • 选择最优方案,谋求最大效益 • 作为决策的主体,始终坚持理性化活动,不存在任何非理性成分。
✓ 不完全理性:
• 有限理性 • 有限理性决策的前提是现实生活过于复杂,人们只能遵循满意原则 • 受到情感、偏好(如公平、互惠、利他)的影响 • 中国人:不患寡,患不均;滴水之恩,涌泉相报;以牙还牙等
的掠夺式使用、森林砍伐、实际和网络上的牛皮广告等
坦白 囚徒 A
抵赖
囚徒 B
坦白
抵赖
-8,-8 0,-10
-10,0 -1,-1
2023/1/4
覃燕红——重庆理工大学
6
2、博弈模型示例II
剪刀-石头-布
博 石头
弈 剪子
方
布
1
石头
0, 0 -1, 1 1, -1
博弈论(第二章)
假设这些农户在夏天才到公共草地放羊,而每年 的春天就要决定养羊的数量。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
博弈论Game Theory2
划线法
在具有策略和利益相互依存的博弈问题中,各个 博弈方的得益既取决于自己选择的策略,还与其 他策略方选择的策略有关。因此,博弈方在决策 时必须考虑其他博弈方的存在和策略选择。 依据这种思想,科学的决策思路应该是:找出自 己针对其他博弈方每种策略和策略组合的最佳对 策,即自己的可选策略与其他博弈方每种策略配 合,给自己带来最大得益的策略,然后通过对其 他博弈方策略选择的判断,预测博弈的可能结果 和确定自己的最优策略。
举例
古诺的寡头模型 设一市场有两家厂商生产同样的产品。如果厂商1 的产量为q1,厂商2的产量为q2,则市场总产量为 Q = q1 + q2 。设市场出清价格P(可以将产品全 部卖出去的价格)是市场总产量的函数P = P(Q) = 8 -Q。再设两厂商的生产都无固定成本,且每 增加一单位产量的边际成本相等,C1 = C2 = 2, 即它们分别生产q1和q2单位产量的总成本分别为2 q1和2 q2 。最后强调两厂商同时决定各自的产量, 即他们在决策之前都不知道另一方的产量。
求解纳什均衡
博弈方就是n个农户,他们各自的策略空间就是他 们可能选择的羊群数目qi(i=1,2, …,n),取值范围, 当各户羊群数为q1, …qn时,在公共草地上放牧羊群 的总数为Q= q1+ q2+…+ qn,,每只羊的产出应是羊 群总数Q的函数V=v(Q)=v(q1+ q2+…+ qn).假设每 只羊的成本是不变的常数c,则农户i养qi只羊的得益 函数为:
u i q i V ( Q ) q i c q iV ( q 1 q 2 q n ) q i c
续
假设 n 3 , 即只有三个农户,每只 羊的产出函 数为 V 100 Q 100 ( q 1 q 2 q 3 ), 而成本 c 4 .这时,三个农户的得益 函数分别为 u 1 q 1 [100 ( q 1 q 2 q 3 )] 4 q 1 u 2 q 2 [100 ( q 1 q 2 q 3 )] 4 q 2 u 3 q 3 [100 ( q 1 q 2 q 3 )] 4 q 3 把上述得益函数看作连 续函数。
博弈论讲义2
三 重复剔除的占优均衡
重复剔除严格劣策略:
思路:首先找到某个参与人的劣策略(假定存 在),把这个劣策略剔除掉,重新构造一个不包 含已剔除策略的新的博弈,然后再剔除这个新的 博弈中的某个参与人的劣策略,一直重复这个过 程,直到只剩下唯一的策略组合为止。 这个唯一剩下的策略组合就是这个博弈的均衡 解,称为“重复剔除的占优均衡”。
独木桥
进
A
退
B
进退 -3,-3 2,0
0,2 0,0
纳什均衡:A进,B退;A退,B进
斗鸡博弈
村子里有两户富户,有两种可能:一家修,另 一家就不修;一家不修,另一家就得修。
冷战期间美苏抢占地盘:一方抢占一块地盘, 另一方就占另一块。
夫妻吵架,一方厉害,另一方就出去躲躲。
注意:在混合策略纳什均衡条件下,也可能两 败俱伤。
注意: 如果所有人都有(严格)占优策略存在,
那么占优策略均衡就是可以预测的唯一 均衡。 占优策略只要求每个参与人是理性的, 而不要求每个参与人知道其他参与人是 理性的(也就是说,不要求理性是共同 知识)。为什么?
二 占优策略均衡
案例-囚徒困境
囚徒A
囚徒 B
坦白
坦白 -8,-8
抵赖
0,-10 -8大于-10
相安无事;第二天,相安无事……;直到第100天 ,突然,每个妻子都把丈夫杀了。为什么会这样?
这是一个推理和行动的过程。如果她的丈夫不忠的话,她就杀 死他;如果没有证据证明她的丈夫不忠的话,她便相信他,不 杀死他。
如果村里只有一个男人是不忠的话,在老太太作了宣布之
后的第一天,这个男人的妻子在老太太宣布之后马上就能知道
两只猪一起去按,然后一起回槽边进食, 由于大猪吃得快可吃下8个单位的食物, 小猪只能吃到2个单位食物。
博弈论第二章答案
nc + a a − c a−c a−c ⋅ −c⋅ = n +1 n +1 n +1 n +1
企业违背垄断产量时的各期利润:
n −1 (a − c ) − qi πi = a − qi − cqi 2n ∂π i (n − 1)(a − c) =a− − qi − q j − c = 0 ∂qi 2n n +1 (n + 1)a + (3n − 1)c (a − c), p = 4n 4n 2 (n + 1) 利润为 (a − c) 2 16n 2 ⇒ qi =
仅供参考! !
-4-
E-mail:beckham.23@
2
出) ,只要任何一方违背时,以后就转向阶段博弈的价格 pi = c 。 如一直使用垄断价格,则每个企业收益每期都一样为, π i = (a − c) / 8 如在t期某企业违背了战略, t+1期开始双方的收益相同都为0, 在t期它的最大收益为 ( a − c) / 4 (考虑此企业只是把价格边际上减少一点点,所有的利润都归它) ,如不违背则把以后无限期
一阶条件:
V ' ( I p − B) = kU 2' ( S + B) ,
反应函数满足:
−1 < dB* / dS = kU 2" /(−kU 2" − V " ) < 0 即,孩子储蓄减少,家
*
长给予更高的赠与。 接着最大化孩子的收益:给定反应函数 B ,来选 S:
MaxU1 ( I c − S ) + U 2 ( S + B* )
∂π i = a − ∑ qi − qi − c = 0 ∂qi a−c (i = 1,2,3 n) n +1
2经济博弈论-完全信息静态博弈
第二章 完全信息静态博弈完全信息:每一个参与者对其他所有参与者的策略空间及得益有准确的知识。
静态:所有参与者同时选择策略,每一个参与者事先并不知道其他参与者的具体策略选择第二章 完全信息静态博弈2.1严格优势策略均衡 2.2严格劣势策略消去法 2.3相对优势策略划线法 2.4多重纳什均衡的选择 2.5无限策略博弈反应函数法 2.6混合策略纳什均衡2.1 严格优势策略均衡引子:囚徒困境(Prisoner ’s Dilemma)参与者:囚徒1、囚徒2 策略空间:坦白、抵赖 得益:1、一个坦白并作证,另一个抵赖,抵赖者入狱五年,坦白者将得到宽大释放; 2、都坦白,每人入狱三年;3、都不坦白,每人以妨碍公务罪入狱一年。
得益矩阵 得益矩阵 得益矩阵 囚徒 2 坦白抵赖囚徒1 抵赖11 055 033坦白 坦白策略被称为囚徒1的全面的严格的优势策略。
简称严格优势策略全面的:不论对方采用何种策略,此策略总显示优势 严格的:此策略严格好于其他策略由严格优势策略组成的博弈均衡,称为 “严格优势策略均衡”囚徒困境的严格优势策略均衡为(坦白,坦白) 双方的得益为(-3,-3)启示:“个人理性”与“集体理性”的冲突例1:公共品供给的囚徒困境李四 修不修张 修 三不修不修 00 133111修路的成本为4,各自获得的好处为3例2:价格战百事可乐低价 高价可 低价口口可 高价 乐乐 55 611 633注:囚徒困境得益+6第二章 完全信息静态博弈2.1严格优势策略均衡 2.2严格劣势策略消去法 2.3相对优势策略划线法 2.4多重纳什均衡的选择 2.5无限策略博弈反应函数法 2.6混合策略纳什均衡2.2 严格劣势策略消去法引子:智猪博弈按钮食槽小猪大猪 按一下按钮会有10单位的猪食进槽,但按按钮然后 再跑到猪食槽需要付出2单位成本参与者:大猪、小猪策略空间:按按钮、坐等其食 得益:1、同时按按钮并跑过来,大猪吃到7个单位,小猪 吃到3个单位。
大学课程《博弈论及其应用》PPT课件:第二章(1234节)
如果在一个博弈中,不管其他的博弈方的策略如何变化,一 个博弈方的某个策略给其带来的得益,总是相对于其他某些 策略(不必是全部)给他带来的得益要小,该策略称为相对 于其他某些策略的严格劣势策略(严格下策)。
我们在分析一个博弈方的决策行为时,首先找出某个博弈方 严格下策(假定存在),把这个策略消去,重新构造新的博 弈;然后,再消去这个新的博弈中的某个博弈方的严格下策; 继续这个过程,一直到只剩下唯一的策略组合为止。这个唯 一剩下的策略组合就是这个博弈的均衡解。这种分析方法称 之为“累次严优”,也称作“严格下策反复消去法”。
问题是,每个博弈方都要觉得偏好上策的情况很少,一般情 况是所以博弈方都没有上策,上策均衡不是普遍存在的。
在不存在严格优势策略的情况下,相对较好的选择是,不论 其他博弈方选择什么策略,该博弈方选择的某个策略给其带 来的得益不低于其可以选择的任何其他策略。通常把具有这 种性质的策略称为这个博弈方的弱优势策略。
优势策略有整体的严格优势策略(strictly dominant strategy)和 弱优势策略(weakly dominant strategy)区别。所谓的严格优势 策略,是指无论其他博弈方选择什么策略,这个博弈方的某
个策略给他带来的得益始终高于其他的策略,至少不低于其 他策略的策略。例如,囚徒的困境中的“坦白”,就是上策。
累次严优
博弈方2
左
中
上 博弈方1
下
1,0 0,4
1,3 0,2
图 2-5
右
0,1 2,0
对于图2-5描述的一个抽象博弈,不存在上策均衡。分析博弈 方1的策略,“上”策略和“下”策略都不是严格占优的优 势策略。再来分析博弈方2的三个策略,横着比较后面的得 益,“左”和“中”比较,“左”和“右”比较,没有严格
博弈理论
二、求解:
d1
d2
s1 - 1 3 A s2 4 3 s3 6 1
2 2 -8
* i j j i
三、优超原理
• 降低矩阵维数,简化计算。 • 若akj ≤aij(j=1~n),在S中取消Sk,记为
Si S k
• 若aik ≥aij(i=1~m),在D中取消dk,记为 d j d k • 即行中去小的,列中去大的
第三节 经典模型
博弈论的目的在于巧妙的策略,而不是解法。我 们学习博弈论的目的,不是为了享受博弈分析的 过程,而在于赢得更好的结局。 博弈的思想既然来自现实生活,它就既可以高度 抽象化地用数学工具来表述,也可以用日常事例 来说明,并运用到生活中去。 没有高深的数学知识,我们同样通过博弈论的学 习成为生活中的策略高手,学习到最适合的为人 处世的方法。
应用1:军备竞赛
20多年前,美、苏两国是两个超级大国,他们相互对垒 都竞相增加各自的军费预算。假设他们有两种策略选择:扩 军或裁军。双方选择的支付如下: 苏 联 扩 军 扩 军 美 国 -2000,-2000 裁 军 8000,-∞
裁 军
-∞ ,8000
0,0
应用2:公共事业
两个企业(u1 ,u2 )被问:是否同意建造一个新的下水 管道以使地下水不被污染。假设建造下水管道需要投资120万。 如同意各承担50%,下水管道对企业的价值分别是80万。
囚徒困境的结论:
1)个体理性与集体理性的不一致性;
2)表明制度安排的重要性;
博弈论第二章习题
问题1:博弈方2就如何分10000元钱进行讨价还价。
假设确定了以下原则:双方提出自己要求的数额1s 和2s ,10000021≤≤s s ,。
如果设博弈方1和,1000021≤+s s ,则两博弈方的要求都得到满足,即分得1s 和2s ;但如果1000021>+s s ,则该笔钱就被没收。
问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会选择什么数额,为什么?解:112111210000()010000s s s u s s s ≤-⎧=⎨>-⎩,那么,1210000s s =-221222110000()010000s ss u s s s ≤-⎧=⎨>-⎩那么,2110000s s =-它们是同一条直线,1210000s s +=上的任意点12(,)s s ,都是本博弈的纯策略的Nash 均衡。
假如我是其中一个博弈方,我将选择15000s =元,因为(5000,5000)是比较公平和容易接受的。
它又是一个聚点均衡。
问题2:设古诺模型中有n 家厂商。
i q 为厂商i 的产量,n q q q Q +++= 21为市场总产量。
P 为市场出清价格,且已知Q a Q P P -==)((当a Q <时,否则0=P )。
假设厂商i 生产产量i q 的总成本为ii i i cq q C C ==)(,也就是说没有固定成本且各厂的边际成本都相同,为常数)(a c c <。
假设各厂同时选择产量,该模型的纳什均衡是什么?当趋向于无穷大时博弈分析是否仍然有效?解:1()ni i i j i j pq cq a c q q π==-=--∑,1,2,,i n =令20ii j j ii a c q q q π≠∂=---=∂∑,1,2,,i n =解得:***121na c q q q n -====+,2***121na c n πππ-⎛⎫==== ⎪+⎝⎭当n 趋向于无穷大时,这是一个完全竞争市场,上述博弈分析方法其实已经失效。
第二章 纳什均衡 《博弈论与经济》 PPT课件
▪ G的纳什均衡可由以下划线法求得。
▪ 1.对局中人1的每个策略i (i 1,2,, m) ,寻找局中人2的最
优反应。若最优反应为
j
,即 bij
max
k 1,2,,n
bik
,则在支付矩
阵元素 bij 下划一短线。
▪ 2.对局中人2的每个策略 j ( j 1,2,, n) ,寻找局中人1的
最优反应,若最优反应为 i
▪ 考虑由商店A, B构成的市场,A与B分别销售不同品牌的商 品,进行价格竞争。假设生产的单位成本为零。消费者 分为两类, n A ( 0)个消费者偏好于产品A,nB ( 0)个消费者 偏好于产品B。A,B两种品牌价格分别为 PA , PB 。设消费 者可从A或B处购买单位商品。
▪ 用 0表示由于购买不喜欢的产品所付出的厌恶成本,假 设消费者具有如下的效用函数
按 等待
等按待
(5,1) (9,1)
4,4
(0, 0)
▪ 严格纳什均衡为大猪“按”,小猪“等待”。
▪ 例2.7 在例1.8中的大堤维护博弈中,支付矩阵为
维护
不维护
不维维护护 ((1
4,4) 0,1 4)
((1140,,1100))
▪ 利用划线法可得纳什均衡(维护,维护),(不维护, 不维护)。
▪ 为了保护生命财产的安全,政府可以立法,如果参与人
第2章 纳什均衡
2.1 纳什均衡的定义
▪ 纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概念都是建 立在纳什均衡基础之上的。
▪ 纳什均衡是个策略组合 s* (si*, s*i ) ,它满足两个要求。
▪
1.对每个局中人 i N
,能够预期到对手采用策略组合s
博弈论的假定与博弈分类
吉本斯《博弈论基础》课后习题答案
对 于 2 来 说 , 4(1− p*) = 2 p* + 3(1− p*) , 得 p* = 1/ 3 。
则 原 博 弈 的 混 合 战 略 纳 什 均 衡 为 : { (1/3, 2/3, 0), (2/3, 0, 1/3) }。 1.12 按 照 1.11 的 解 法 , 可 得 混 合 战 略 纳 什 均 衡 为 : { (2/3, 1/3), (3/4, 1/4) }。 过 程 略 。 1.13 此博弈有两个纯战略纳什均衡、一个混合战略纳什均衡。 纯 战 略 纳 什 均 衡 为 :( 向 企 业 1 申 请 , 向 企 业 2 申 请 );( 向 企 业 2 申 请 , 向 企 业 1 申 请 )。 混合战略纳什均衡为:
为:
qm/2
qc
qm/2
π1 , π1
π2 ,π3
qc
π3 ,π2
π4 ,π4
因 为 π1 < π3 , π 2 < π 4 , 所 以 每 一 方 都 有 一 个 严 格 劣 战 略 , 即 qm/2, 从 而 最 后 的 均 衡 为
博弈论第二章——博弈规则
U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
博弈论第二章 (1)
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3
3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略
二、重复剔除严格劣战略
(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
上
1, 3
博弈方2
4
2014/9/22
二、重复剔除严格劣战略
如果消去的弱劣战略,不是严格劣战略,则消去顺序会影响 结果
解:1)博弈方Ⅱ的策略
“L”和“M”都是策略“R” 的弱劣策略(不是严格劣策 略),消去策略“L”和“M” 后为:
L U S D
M
R
例:博弈G如下图:
博弈方Ⅱ L 2 ,8 08 ,8 0 ,8 M 1,6 0,6 1,5 R 1,8 0,8 0,9
10:39:53
5
10:39:53
6
一、博弈的标准式表述
一、博弈的标准式表述
横行代表囚徒1的收益,在两面。
3、举例:囚徒困境(用双变量矩阵来描述) 双变量矩阵可由任意多的行和列组成,“双变量” 指的是在两个博弈方的博弈中,每一个单元格有两 个数字,分别表示两个参与者的收益。
子
足球
划线法分析夫妻之争
二、重复剔除严格劣战略
解:该博弈共有27种可能的策略组合,需要用三个标 准式来描述: 参与人2
A A B 参与人1 C 2, 0,1 2,0, 1 2, 0,1 B 2,0, 1 1,2,0 2, 0,1 C 2,0, 1 2,0, 1 0,1, 2 参与人1 C A B
二、重复剔除严格劣战略
参与人2 A 2 , 0 ,1 1,2, 0 2 , 0 ,1 B 1,2, 0 1,2,0 1 , 2 ,0 C 2,0, 1 1 ,2 , 0 0 ,1 , 2
参与人3选A
参与人3选B
7
2014/9/22
二、重复剔除严格劣战略
三、纳什均衡
通过划线法找出的具有稳定性的策略组合,不管是否惟 一,都有一个共同的特性,即其中每个博弈方的策略都 是针对其他博弈方策略或策略组合的最佳对策。 在两人博弈的情况下,就是“给定你的策略,我的策略 是我最好的策略;给定我的策略,你的策略也是你最好 的策略”。事实上,具有这种性质的策略组合,正是非 合作博弈理论中最重要的一个解概念,即博弈中的“纳 什均衡”(Nash Equilibrium)。
二、重复剔除严格劣战略
2、占优均衡分析的局限性
并非每个博弈方都有这种绝对偏好的上策,而且 常常是所有博弈方都没有上策,因为博弈方的最 优策略随其他博弈方的策略而变化正是博弈问题 的根本特征,是博弈关系相互依存性的主要表现 形式。 因此占优均衡不是普遍存在的。 例如斗鸡博弈,赛马博弈就没有占优均衡,因为 各个博弈方的任何策略都不是绝对最优的,每个 博弈方都没有绝对偏好的上策。所以,占优均衡 并不能解决所有的博弈问题,最多只是在分析少 数博弈时有效。
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
下
划线法分析囚徒困境
二、重复剔除严格劣战略
二、重复剔除严格劣战略
例3、猜硬币博弈
正面 盖 硬 币 方 正面 -1, 1 1, -1 猜硬币方 反面 1, -1 -1, 1
划线法是一种非常简便的博弈分析方法,由于它 以策略之间的相对优劣关系为基础,因此在分析 用收益矩阵表示的博弈问题时具有普遍适用性。 当然,这并不意味着每个用收益矩阵表示的博弈 都可以用划线法求出确定性的博弈结果。 事实上,许多博弈根本不存在确定性的结果,当 然也就无法用划线法找出这种结果。我们通过一 些例子来说明。
博弈方2 中 博弈方2 右 左
博 上 弈 方下 1
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
博 弈 上 方 下 1
左
中
博弈方2 博 左 中 弈 方 上 1, 0 1, 3 1 中
1, 0 0, 4
1, 3 0, 2
重复剔除严格劣策略也不能解决所有博弈的分析 问题。因为在许多博弈问题中,上述相对意义上 的严格劣策略往往不存在。如猜硬币、齐威王田 忌赛马、石头,剪子,布等赌胜博弈,没有任何 博弈方的任何策略是相对其他策略的严格劣策略。 此外,在策略数较多的博弈中,重复剔除严格劣 策略法只能消去其中的部分策略,不能消去的策 略组合并不惟一,因此仍然不能完全解决这些博 弈问题。
一、博弈的标准式表述
2、博弈的数学表述
用ui(s)=ui(s1,s2,
… ,sn) (i=1,2,…,n)表示博弈方i
在策略组合s=(s1,s2, … ,sn)的得益, ui是策略集 S1×S2×…×Sn上的多元函数。
定义:若一个N人博弈的策略空间为Si,得益函数为:
ui(s)=ui(s1,s2, … ,sn)(i=1,2,…,n),则该博弈表示为: G={N,S1,S2, … ,Sn;u1,u2,…,un} 。
(2)定义 一般地,如果在一个博弈中,不管其他博 弈方的策略如何变化,一个博弈方的某种 策略给他带来的得益,总是比另一种策略 给他带来的得益要小,那么我们称前一种 策略为相对于后一种策略的一个“严格劣 策略”。
二、重复剔除严格劣战略
二、重复剔除严格劣战略
(4)重复剔除严格劣策略法的缺陷
(3)、举例 为了说明重复剔除严格劣策略法与占优均衡 分析的区别,我们用一个例子来说明。首先 看下图中这个抽象掉现实问题内容的,两个 博弈方分别有三种和两种策略的不对称博弈 问题。
2014/9/22
第二章
完全信息静态博弈
§ § § §
第二章
完全信息静态博弈
完全信息静态博弈即各博弈方同时决策,且所 有博弈方对各方收益都了解的博弈。 囚徒的困境、齐威王田忌赛马、猜硬币、石头 剪子布、古诺产量决策都属于这种博弈。 完全信息静态博弈属于非合作博弈最基本的类 型。本章介绍完全信息静态博弈的一般分析方法、 纳什均衡概念、各种经典模型及其应用等。
反面
6
2014/9/22
二、重复剔除严格劣战略
例4、夫妻博弈
时装 妻 时装 2, 1 0, 0 丈 夫 足球 0,0 1, 3
二、重复剔除严格劣战略
此外,划线法还可以解决三人博弈问题,只是随着决 策者人数和策略的增多,用策略式表述越来越复杂 例 5 投票博弈 假定三个参与人1,2,3要在三个项目A,B,C中投票选 择一个。规则是同时投票且不允许弃权,得票数最多 的项目当选。如果得票数相同,即每个项目一票,则 项目A当选。再假设不同项目当选时,三个博弈方的 收益表示如下: u1 ( A ) u 2 ( B ) u 3 (C ) 2 u1 ( B ) u 2 (C ) u 3 ( A ) 1 u (C ) u ( A ) u ( B ) 0 2 3 1
L U 2 ,8
M 1,6
R 1,8
(重复提出弱劣策略会把纳什均衡剔除掉, 保留下来的也未必是纳什均衡)
19
5
2014/9/22
二、重复剔除严格劣战略
(2)举例
例1
左 博 弈 方 1 上 博弈方2 中 右
二、重复剔除严格劣战略
例2
坦 白 囚 坦 白 徒 1 不坦白 -5, -5 -8, 0 囚徒2 不坦白 0, -8 -1, -1
参与人2 A A B 参与人1 C 0, 1,2 0, 1,2 0,1, 2 2, 0,1 2,0, 1 B 2,0, 1 1,2,0 C 0,1, 2 0,1, 2
参与人3选C
纳什——一个孤独的天才
三、纳什均衡
1、 纳什均衡的定义
纳什1928年出生在美国西弗吉尼亚州 ,他21 岁就获得普林斯顿大学博士学位,不到30岁 已经闻名遐迩。 1950年,纳什发表了他的“非合作博弈”博 士论文,引入了著名的“纳什均衡”理论, 不但奠定了博弈论的数学基础,而且在后来 得到了商业策略家的广泛应用。 纳什30岁时得了妄想型精神分裂症,被精神 分裂症困扰了30多年 。 1994年获得诺贝尔经济学奖。 2001年获得奥斯卡金像奖的电影《美丽心灵》 讲述的就是纳什的故事。
1、博弈的标准式和纳什均衡 2、应用举例 3、混合策略和纳什均衡的存在性 4、二人零和博弈
§ 1、博弈的标准式和纳什均衡
一、博弈的标准式表述
一、博弈的标准式表述
1、标准式的三要素 (1) 参与人(或称为博弈方) (2) 每个参与人可选择的战略集 (3) 收益:针对所有参与人可选择的战略组合,每一 个参与人获得的收益
二、重复剔除严格劣战略
三、纳什均衡
1
2014/9/22
一、博弈的标准式表述
2、博弈的数学表述
假设一个博弈有n个博弈方,博弈方i的策略集(又称策略空间) 为 Si(i=1,2,…,n) ,用 sij∈ Si 表示博弈方 i 的第 j 个策略; 若si∈Si(i=1,2,…,n),称s=(s1,s2, … ,sn)为一个策略组合; 若用 s-i = (s1,s2, … ,si-1, si+1, … ,sn),则 s = (si,s-i)。
囚徒2 坦 白 囚 坦 白 徒 1 不坦白 -5, -5 -8, 0 不坦白 0, -8 -1, -1
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标准式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3