第二章 同时决策博弈

合集下载

第二章 同时决策博弈

第二章 同时决策博弈
① 在二人博弈中,局中人双方的利益并不总是相 互完全冲突的,有时候也会出现双方利益方向 一致的情形。 ② 在两人博弈中,掌握信息多的一方并不能保证 利益一定较多。 ③ 在二人博弈中,个人追求自身利益最大化的行 为,往往并不能导致社会的最大利益,常常也 不能真正实现个人自身的最大利益。经济学常 常将这种现象称为“个人理性”与“集体理性” 的冲突。
2013-8-2 11
弱优势策略 (weakly dominant strategy)
并不是每一个博弈都存在严格优势策略,有 这样的情形,不存在不管其他局中人选择什 么策略,某个局中人选择他的某个策略给他 带来的支付始终高于他选择其它策略。 不管其他局中人选择什么策略,一个局中人 选择他的某个策略给他带来的支付仅仅只是 不低于他选择其它策略,我们通常把满足这 一性质的策略称为弱优势策略。
2013-8-2 12
严格劣势策略
不管其它博弈方的策略如何变化,给一个博 弈方带来的收益总是比另一种策略给他带来 的收益小的策略。 注意:界定一个策略是否是劣势策略,只需 要证明它比另一种策略,而不是其它所有的 策略给他带来的收益小。也就是说,对整体 而言一个博弈中只可能存在一个优势策略, 其它都是严格劣势策略。
2013-8-2 6
支付:每个局中人从博弈中获得的利益,它 体现每个参与博弈的局中人的追求,也是他 们行为和决策的主要依据。支付可以是利润、 收入、量化的效用、社会收益、福利等。可 以取正值,也可以取负值。 用ui表示局中人i的支付,它是策略组合s 的 函数。例如在囚徒困境博弈中,对于s=(沉 默,招供),u1(s)= -9,u2(s)=0。如果用向 量表示,支付向量为(u1(s),u2(s))=(-9,0)。 如果有n个参与人,支付向量为 (u1(s),u2(s),…, un(s) )。

博弈论(第二章)讲义

博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2



上 博弈方1

1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0

博弈论第3节

博弈论第3节

情侣博弈和纳什均衡
情侣博弈
丽娟 足球 足球 大 海 电影 2,1 0,0 电影 0,0 1,2
足球显然不是大海的劣势策略。 电影也不是大海的劣势策略,因为如果丽娟坚持选电 影,大海选足球只得0,选电影还可以得1。 所以,大海没有全面的劣势策略。同样,丽娟也没有 全面的劣势策略。
情侣博弈的纳什均衡
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 这类博弈很多, 这类博弈很多,引出混合策略纳什均衡概念
二、混合策略、混合策略博弈 和混合策略纳什均衡
} 混合策略:在博弈G = {S1,LSn ; u1,Lun中,博弈方 i 的策略 混合策略 空间为 S i = {si1 , L sik },则博弈方 i以概率分布 pi = ( pi1 ,L p ik ) 随机在其 k 个可选策略中选择的“策略”,称为一个“混合策 j = 1,L, k 0 ≤ p ij ≤ p i1 + L 略”,其中 1 对 都成立,且+ p ik = 1
占优策略均衡
占优策略:不管其它博弈方选择什么策略,一博 占优策略 弈方的某个策略给他带来的得益始终高于其它 的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;双寡头削价中“低 价”。 占优策略均衡:一个博弈的某个策略组合中的所 占优策略均衡 有策略都是各个博弈方各自的占优策略,必然 是该博弈比较稳定的结果 占优策略均衡不是普遍存在的
囚徒困境
囚徒 2 坦 白 囚 坦 白 徒 1 不坦白 囚徒1:坦白 囚徒2:坦白 -5, -5 不坦白 0, -8
-8, 0
-1, -1
两个罪犯的得益矩阵
在一个博弈里,如果所有参与人都有占优策略 存在,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。所以在囚徒 困境博弈里,{坦白,坦白}是占优策略均衡。 囚徒困境反映了一个深刻的问题,即个人理性与 团体理性的冲突。这给我们一个启示,我们学习博弈论, 也许更应该研究的是怎样设计一种制度,在满足个人理性 的同时,去争取达到“集体理性”。

第二章_博弈思维:向前展望,从后倒推

第二章_博弈思维:向前展望,从后倒推

结果是什么呢?
声称的策略与实际的策略:言语博弈问题
A向B发出威胁:如果你进入,我将阻挠。而对B来说,如
果进入,A真的阻挠的话,它将受损失-1亿,当然此时A 也有损失。对于B来说,问题是:A的威胁可臵信吗?
B 不进入 (0,10) (-1,2) 阻挠 (0,10)
进入
(4,4)
不阻挠
A
B通过分析得出:A的威胁是不可臵信的。
老板不用多付薪金
加薪谈判博弈树
加薪谈判
让老板相信你的威胁,最好的办法就是向他证明另一家 公司愿意每年多花12000元聘用你。(当然,如果真有 其事,你就不必运用博弈论来要求加薪了。) 争取加薪的另一办法是自断后路,告诉公司里的每个人, 如果你得不到加薪,你肯定会跳槽。你的目标是,把加
薪不成而留任的局面搞得越尴尬越好。
声称的策略与实际的策略:言语博弈问题
博弈论中,经常用“可臵信”和“不可臵信”的“威胁” 或“承诺”来区分行动者说出来的策略。而分析“威胁” 或“承诺”是可臵信的还是不可臵信的方法是倒推法。 倒推法(backward induction)也叫逆向归纳法。那么什 么是倒推法?
声称的策略与实际的策略:言语博弈问题
加薪谈判
如果你只是经理,不是老板。向你要求加薪的员工对你非
常重要,很不幸的是,你的员工也知道自己很重要,而且 你不想失去他们,但你又想压制一下下属的加薪要求。
这使你的谈判处于下风,因为假如员工能让你相信,只要 你不为他加薪,他就会跳槽,那你只好答应给他加薪。 你最好的办法是交出调薪的控制权,表明你对加薪无能为
加薪谈判
在博弈论的世界里没有仁慈或怜悯,只有一己之利。
在劳资博弈中,劳方是为了争取加薪,资方是为了确保 员工能在工作上全力以赴。老板绝不会无条件为员工加 薪,只有让老板相信对他有好处,员工才能得到加薪。 假如你对公司有所贡献,公司也依赖你。你希望加薪

大学课程《博弈论及其应用》PPT课件:第二章(1234节)

大学课程《博弈论及其应用》PPT课件:第二章(1234节)

博弈方2



上 博弈方1

1,0 0,4
1,3 0,2
0,1 2,0
图 2-7 划线法
博弈的相对优势策略位置在图2-7标出,策略组合{上,中}格 子中的两个数字下面都划了短线,这个格子对应的策略组合 就是由划线法得到的纳什均衡。
第四节 箭头方法
还有一种寻找纳什均衡的方法,和划线法的分析理念的出发 点不同,这种方法的思路是对博弈中的每个策略组合进行分 析,判断各博弈方是否能够通过单独改变自己的策略而改善 自己的得益,如果可以,则从所考察的策略组合的得益引一 个箭头到改变策略后的策略组合对应的得益。这样对每个可 能的策略组合都分析考察过以后,根据箭头反映的情况来判 断博弈的结果。
博弈方2
Hale Waihona Puke 左中上 博弈方1

1,0 0,4
1,3 0,2

0,1 2,0
图 2-8 箭头法
观察图2-8,在策略组合{上,中}中只有指向的箭头,没有指 出的格子所代表的就是纳什均衡。
略“上”改变的倾向,用一个竖着的箭头表示这个倾向;横 着比较后面的得益,4比2大,4比0大,博弈方2没有改变的 动力。在策略组合{上,左}中,横着比较后面,分析博弈方2 的得益,3比0大,1比0大,所以博弈方2有从策略“左”向
策略“中”和策略“右”改变的倾向,用两个横向的箭头表 示这两个改变的倾向。
在策略组合{上,中}中,竖着比较前面的得益,还是横着比较后 面的得益,博弈方1和博弈方2都没有改变的倾向。在策略组合 {上,右}中,竖着比较前面,2比0大,博弈方1有从策略“上”
向策略“下”改变的倾向,用一个竖向的箭头表示这个倾向; 横着比较后面,3比1大,博弈方2有从策略“右”向策略“中” 改变的倾向,用一个横向的箭头表示这个倾向。

第二讲纳什均衡

第二讲纳什均衡
旅游区商户
诚实 游客 游客收益10 商户收益5 不购买 游客收益0 商户收益-5 购买
欺诈 游客收益5 商户受收益10 游客收益0 商户收益0
案例讨论
2008年的美国总统大选让我们看到一 幕大戏。这场大戏的精彩部分并不是 迷住当与共和党的总统选举对决,而 是民主党总统候选人的提名选举。 民主党的提名竞选,最终只在希拉里 和奥巴马之间进行。在2008年之前, 奥巴马只是一个默默无闻的小角色, 他那年才46岁,只有3年的国会参议员 和伊利诺伊州参议员的工作经历,但 他是当时国会中唯一一位黑人参议员, 也是
2、纳什均衡一定是在重复剔除严格劣战略过 程中没有被剔除掉的战略组合,但没有被剔除 的战略组合不一定是纳什均衡,除非它是唯一 的。(这句话并不适用于弱劣战略剔除的情况)
第二节
纳什均衡
三、寻找纳什均衡的方法 (一)劣势策略反复消去法 民主党 主动增税 被动增税 2,2 1,4 主动增税 共和党 4,1 3,3 被动增税
纳什均衡
纳什均衡:(被动增税,被动增税) 巨额赤字
试一试:劣势策略反复消去法
上 参与人1 下 参与人2 左 中 右
1,0
0,4
1,3
0,2
0,1
2,0
第二节
纳什均衡
三、寻找纳什均衡的方法 2000:军费支出 (二)相对优势策略划线法 -∞:丧失主权 8000:掠夺者赢利 0:军费支出为零,和平 原苏联 共处 扩军 裁军 -2000,-2000 8000,-∞ 扩军 美国 -∞,8000 0, 0 裁军
2 TR TC p2 (a p2 bp1 ) (a p2 bp1 )c
伯川德模型
通过令一阶导数为零,得到:

090302同时决策博弈已看

090302同时决策博弈已看

2同时决策博弈共同知识假定•通常还假设,所有的参与人都知道博弈的结构,知道他们的对手知道这一结构,知道他们的对手了解他们知道······如此直至无穷,也即博弈的结构是共同知识。

•博弈分析的目的:预测博弈的均衡结果,•即给定“每个参与人都是理性的”是共同知识,什么是每个参与人的最优策略?什么是所有参与人的最优策略组合?同时决策博弈•完全信息静态博弈中的行为假定理性参与人----追求支付最大化完全信息----对策略、策略组合及相关支付完全了解独立决策----无勾结(不管是明的还是暗的)•同步决策(静态博弈)在寡头市场,当经理们必须在无法知道竞争对手的决策的情况下做出自己的决策时,同步决策博弈发生。

同步不必同时•问题:如何预测对手的行动?乙坦白抵赖-3-5甲坦白-300-1抵赖-5-1Prisoners ’ Dilemma占优策略均衡Dominant-strategy Equilibrium严格劣策略strictly dominated strategy 深圳大学章平占优策略均衡Dominant-strategy Equilibrium 如果在某个博弈中,无论其他参与人选择什么策略,一个参与人的某个策略给他带来的支付始终不低于其他策略,则称该策略为这个参与人的一个占优策略Dominant strategy。

如果一个博弈的某个策略组合中所有策略都是各个博弈方自己的占优策略,则称这样的策略组合为该博弈的一个“占优策略均衡”。

•首先对亚当·斯密的“看不见的手”的原理提出挑战。

按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。

•《国富论》:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。

”•引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。

博弈论(第二章)

博弈论(第二章)
设某个村庄有三个农户,该村有一片大家都可以 自由放牧羊群的公共草地。由于这片草地的面积 有限,因此只能让不超过某一数量的羊吃饱,如 果在这片草地上的放牧的羊只的数量超过这个数 量,则每只羊都无法吃饱,从而每只羊的产出 (毛,皮和肉的总价值)就会减少,甚至有些羊 就会饿死。
假设这些农户在夏天才到公共草地放羊,而每年 的春天就要决定养羊的数量。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,

经济博弈论 02 完全信息静态博弈(Park)

经济博弈论 02 完全信息静态博弈(Park)
ui(S1*, ... Si-1*, Si*, Si+1*, ... Sn*) ≥ui(S1, ... Si-1*, Sij, Si+1*,… Sn*)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?

第二章同时决策博弈静态博弈(博弈论教程石家庄经济

第二章同时决策博弈静态博弈(博弈论教程石家庄经济

2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
第二节 优势策略与优势策略均衡
➢二、寻找优势策略:定义法
➢(一)案例:超市中的可乐价格大战

PESPI

低价
高价
➢ ➢COCO ➢
低价 高价
3,3 1,6
6,1 5,5
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
都是各参与人各自的上策 Ø(低价,低价) Ø特征:博弈中的稳定结果
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
第二节 优势策略与优势策略均衡
➢三、优势策略均衡
➢(二)寻找优势策略均衡
➢艺术家公明要求看装修商的设计方案

装修商

给看 不给看

要求看 800,600 0,0
➢公明 ➢
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
第二节 优势策略与优势策略均衡
Ø二、寻找优势策略:定义法
Ø(四)结论 Ø严格优势策略组合(低价,低价)
Ø囚徒困境:对个人而言最优的策略 (低价),对集体而言非最优。个人 理性与集体理性冲突
Ø原因:只关心己方利益,双输
2020/12/10
第二章同时决策博弈静 态博弈(博弈论教程石家
庄经济
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
夫妻吵架——斗鸡博弈
Ø特征
Ø1.双方了解各种情况下的得益:完全
信息
Ø进——胜利
•亲爱的,你先 吵,你吵完了
Ø退——丢面子
我再吵?

博弈论讲义_05_同时博弈与序贯博弈

博弈论讲义_05_同时博弈与序贯博弈

第三节
子博弈精炼纳什均衡
三、纳什均衡的存在性:库恩定理 完全信息的有限序贯博弈都存在纳 什均衡
2013年9月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
29
第六节 连续支付情形的序贯博弈
复习:完全信息静态博弈
古诺模型:同质产品、产量竞争、合作博弈 两家企业 市场总需求:q=a-p,a>0 企业i的成本:cqi,c>0 企业i的利润:i(q1, q2)=pqi-cqi=(a-q1-q2-c)qi 行为原则:勾结起来象一个垄断企业一样决定市场总产量 max (q)=pq-cq=(a-q-c)q f.o.c. / q 0 纳什均衡产量 均衡利润
高价 高投入 低投入 低价 高价 低价
3,4 1,2 4,3 2,1
第二节
混和博弈
案例:研发投入与定价博弈 (三)第二阶段:根据对方研发投入定价 4.(低投入,低投入)
高价 低投入 低投入 低价 高价 低价
6,6 3,7 7,3 5,5
第二节
混和博弈
案例:研发投入与定价博弈 (四)简化形式与纳什均衡 联想 1. 简化表述
子博弈:指向(2,1) 子博弈精炼纳什均衡 的策略组合——女方 无单独偏离激励
是子博弈精炼 纳什均衡
( 2, 1)
( 0, 0)
(-1, -1) ( 1, 2)
芭蕾
子博弈:指向(1,2) 的策略组合——女方 无单独偏离激励
第三节
例:情侣博弈 三个纳什均衡 (芭蕾,{芭蕾,芭蕾})
女 男 进入 芭蕾 女 进入 芭蕾 进入
(a c) ac * q* 4 2 双方在上述总产量的条件下通过讨价还价来决定各自生产多少, 这是一个零和博弈的问题

同时博弈论

同时博弈论
子; 若两人都退下来,
两人都丢面子
B

退
-3
0
进 -3
2
2
0
退0
0
Case4.石头剪子布
1. 博弈方1,2;
2. 可选策略: 石头、剪子 和布;
3. 几乎同时决 策;
4. 所得利益: 0表示没有输 赢;1表示赢; -1表示输。
博弈方2 石头 剪子 布
石 0,0 1,-1 -1,1 博头 弈 方 剪 -1,1 0,0 1,-1
1.2.6 完全信息博弈和不完全信息博弈
• 完全信息博弈:是指每一参与者都拥有所有其他参 与者的特征、策略集及得益函数等方面的准确信息的博弈。 • 不完全信息博弈:是指参与者只了解上述信息中的 一部分的博弈。
将博弈的信息特征和行为时间特征结合起来,可以进一 步把博弈细分为下面四种类型的非合作博弈,得到四种均衡:




0
3
1
甲上 1
1
0
4
2
0
下0
0
2
划线法——情侣博弈battle of sexes
一对情侣面临周末晚上安排什么节目的决策,Jim 是铁杆球迷,怎肯放过一场世界杯的生死之战?Eva 崇尚高雅艺术,正好有一场《胡桃夹子》的芭蕾舞剧。 分开各自做喜欢的事,对于热恋中的他们也是一种折 磨,怎么办?
Eva
同时决策/行动博弈
• 完全信息静态博弈中的行为假定
理性参与人 ----追求支付最大化
完全信息
----对策略、策略组合及相关支付完全了解
独立决策
----无勾结(不管是明的还是暗的)
• 同步决策(静态博弈)
在寡头市场,当经理们必须在无法知道竞争对手的决策的情况下做出自己的 决策时,同步决策博弈发生。

博弈论第二章——博弈规则

博弈论第二章——博弈规则

U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈

决策管理-第二章同时决策博弈静态博弈博弈论教程石家庄经济 精品

决策管理-第二章同时决策博弈静态博弈博弈论教程石家庄经济 精品

第二章 同时决策博弈
第二节 优势策略与优势策略 均衡
2021年2月28日
博弈论第二章
10
第一讲优势策略
第二节 优势策略与优势策略均衡
➢一、优势策略:占优策略
➢(一)定义
➢无论其他参与人选择什么策略,某参 与人的某策略产生的支付高于(至少 不低于)自己的其他策略产生的支 付——此策略为优势策略
si* si '和si , 有ui (si*, si ) ui (si ', si )
➢(四)结论 ➢严格优势策略组合(低价,低价)
➢囚徒困境:对个人而言最优的策略 (低价),对集体而言非最优。个人 理性与集体理性冲突
➢原因:只关心己方利益,双输
2021年2月28日
博弈论第二章
17
第一讲优势策略
继续小试牛刀:智猪博弈
➢ ➢ ➢ ➢大猪 ➢
要食 等待
小猪
要食
等待
5,1
4,4
9,-1
0,0
➢s=(s1,…,si,…,sn),所有人的某一策略
2021年2月28日
博弈论第二章
4
第一讲优势策略
第一节 二人同时博弈
➢一、复习:要素 ➢(三)支付(得益) ➢1.某人支付:取决于所有人的策略
➢ui=(S1,…,Si,…,Sn) ➢2.支付组合:所有人的支付
➢u=(u1,…,ui,…un)
2021年2月28日
13
第一讲优势策略
第二节 优势策略与优势策略均衡
➢二、寻找优势策略:定义法
➢(一)案例:超市中的可乐价格大战

PESPI

低价
高价
➢ ➢COCO ➢
低价 高价

2 同时决策博弈(2)

2 同时决策博弈(2)
极值的必要条件,是函数的所有偏导数都等于0。
连续情形纳什均衡的必要条件
连续情形纳什均衡的检验方法
• 例:设一个3人的策略型博弈,每个局中人的策 略集都是正实数开区间(0,∞ ),他们的策略变 量分别是x,y,z,他们的支付函数分别是:
( = u1 x, y, z) 2 xz − x y
2
= u(x, y, z) 12( x + y + z ) − y 2 = u(x, y, z) 2 z − xyz 3
– 优势策略,整体的严格优势策略,弱优势策略 – 劣势策略,整体的严格劣势策略,弱劣势策略 – 严格劣势策略逐次消去法(IESDS)
• 2-4优势策略均衡
– 优势策略均衡,严格优势策略均衡,公明博弈 – 普通劣势策略消去法,寻找优势策略均衡求解 的局限
• 2-5 相对优势策略和纳什均衡
– 相对优势策略,纳什均衡,检验纳什均衡
求纳什均衡解。
2
• “纳什均衡检验方法” 只是确定纳什均衡的一 种方法。还有一些纳什均衡,不能由它确 定。纳什均衡检验方法的最大缺陷是要求 满足一阶条件的“必要解”唯一。 • 但是,必要解不唯一,并不等于博弈不存 在纳什均衡。
• 例:设一个3人的博弈 G = {S1, S 2, S3 ; u1, u 2, u 3} 中,每 个局中人的策略集都是正实数开区间(0,∞ ), 他们的策略变量分别是x,y,z,他们的支付函 数分别是:
• 任何满足 x1 + x2 = 100 的分配数对( x1 , x2 )都 构成这个二人博弈的纳什均衡,因此,这个博弈 存在无数个纳什均衡。
• 一个有N个人参加的游戏:每个人可任意放 最多100块钱到一部可以生钱的机器里,机 器把所有人放进去的钱的总和增加到原来 的3倍,然后再平分给这N个人。你能猜出 这个N人博弈的一个纳什均衡并给出相应的 证明吗?
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013-8-4 13
严格劣势策略逐次消去法P45-48
理性的局中人是不会采用对自己不利的严 格劣势策略的,所以在分析博弈的可能结 局时,我们可以把局中人的严格劣势策略 都删去,只留下严格优势策略,由此得到 由双方的严格优势策略组成的博弈均衡, 叫做严格优势策略均衡。
2013-8-4
14
用严格劣势策略逐次消去法求 严格优势策略均衡P45-48
二人同时博弈
博弈中局中人的个数是博弈结构的关键 因素之一,根据局中人的个数,将博弈 分为“二人博弈”和“多人博弈”。 两人博弈就是两个各自独立决策,但策略 和利益相互依存关系的博弈方的决策问 题.例如,囚徒困境,田忌赛马,猜硬币,打 球等;经济活动中这样例子也常见两个 厂商之间的竞争、谈判、兼并收购和劳 资纠纷等。
矩阵中没有箭头从中指出来的格子, 表征的是每个局中人都没有单独改变 策略选择的倾向的策略组合,这样的 组合就是博弈的纳什均衡。
2013-8-4 26
箭头指向法P61
通过箭头指向法寻找博弈结果
丽娟
足球 足球
大 海 芭蕾 2,1 0,0
芭蕾
0,0 1,2
情侣博弈支付矩阵
2013-8-4 27
箭头指向法P61
在某个博弈中,如果不管其他局中人选择什么 策略,一个局中人的某种策略选择给他带来的 支付始终高于其他策略选择,或者至少不低于 其他策略选择,这个策略就称为优势策略。只 要这个局中人是一个理性的局中人,那么他必 定愿意选择这个策略。 优势策略可分为 ——严格优势策略(strictly dominant strategy) ——弱优势策略(weakly dominant strategy)
2013-8-4 6
得益:每个局中人从博弈中获得的利益,它 体现每个参与博弈的局中人的追求,也是他 们行为和决策的主要依据。支付可以是利润、 收入、量化的效用、社会收益、福利等。可 以取正值,也可以取负值。 用ui表示局中人i的支付,它是策略组合s 的 函数。例如在囚徒困境博弈中,对于s=(沉 默,招供),u1(s)= -9,u2(s)=0。如果用向 量表示,支付向量为(u1(s),u2(s))=(-9,0)。 如果有n个参与人,支付向量为 (u1(s),u2(s),…, un(s) )。
2013-8-4 7
举例
• 例如,在囚徒困境中,u1((沉默,沉默))= -1, u1((沉默,招供))= -9, u1=((招供,沉默))= 0, u1=((招供,招供))= -6。
• 同学们也可以选择支付矩阵来表示。
2013-8-4
8
博弈的策略型表述P43
设在一个n人博弈中,诸局中人的策略 集为S1,…Sn,每个局中人的支付 u1,…,un都是定义在S1×S2×…×Sn上的 函数,我们将这个博弈记作 G={S1,…Sn; u1,…,un}。这种表述方 法称为博弈的策略型表述或者正规型 表述。
条件下局中人 i
的最优选择,即
si Si
* * ui ( si* , si ) maxui ( si , si )

* * ui (si* , si ) ui (si , si )
2013-8-4 16
补充:严格优势策略和严格劣势策略的正式定义 设一个二人同时决策的博弈,si,sj∈S1,即si,sj 都是局中人1可以选择的策略,那么 (1)如果对于局中人2的每一个策略s ∈ S2, 都有u1(si,s) >u1(sj,s),则称局中人1的策略si 严格优于局中人1的策略 sj ; (2)如果对于局中人2的每一个策略s ∈ S2 , 都有u1(si,s) <u1(sj,s) ,则称局中人1的策略 si严格劣于局中人1的策略 sj 。
2013-8-4 3
二人同时博弈
一般来说,局中人的个数越多,这种策 略的依存性就越复杂,分析就越困难; 但是有时候参与博弈的人数很多,博弈 的分析反而变得简单,这是因为他们的 决策会想到抵消。全体对手的决策呈现 可预见的规律。完全竞争市场的博弈就 是例证。
2013-8-4
4
二人同时博弈 研究中需要注意的问题
ui(s1,…, si-1, si*, si+1,…, sn) ≥ ui(s1,…, si-1, si, si+1,…, sn) ,
对于所有的策略组合都成立。
2013-8-4 18
进一步严格优势策略均衡的正式定义
如果进一步对于任何一个局中人i∈{1,2,…,n},严格 不等式
ui(s1,…, si-1, si*, si+1,…, sn) > ui(s1,…, si-1, si, si+1,…, sn) , 对于所有si≠ si*的策略组合
2013-8-4 20
相对优势策略
相对优势策略就是当局中人在他的对手 选定某个具体策略条件下具有他的优势 策略。 优劣的相对性,是相对对手的具体策略 选择而言的,在多人博弈的情况下,局 中人的相对优势策略,是在他的每个对 手都选定各自的具体策略的条件下他的 优势策略。
2013-8-4 21
相对优势策略划线法
如果能够在对手或者对手们保持策略选择不变 的情况下,通过单独改变自己的策略选择,到 达或者形成新的策略组合而增加自己的支付, 那么原来的策略组合就不是博弈的具有稳定性 的结果,我们将它排除在均衡之外,这样做完 以后,剩下没有被排除的,就是博弈的纳什均 衡。
2013-8-4 25
箭头指向法
箭头指向法——用一个箭头形象地表 示从原来的策略选择到新的会增加自 己的支付的策略选择的偏离倾向。
1, -1 -1, 1
29
2013-8-4
箭头指向法P61
-5, -5 0, -8 2, 1 0, 0
囚 徒 困 境
-8, 0
-1, -1
夫 妻 之 争
0, 0
1, 3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
2013-8-4
30
什么是纳什均衡?
均衡(equilibrium):所有参与人的最优策略的 组合。在博弈达到均衡时,局中每一个博弈者 都不可能因为单方面改变自己的策略而增加收 益,于是各方为了自己利益的最大化而选择了 某种最优策略,并与其他对手达成了某种暂时 的平衡。纳什均衡:局中人单独改变策略不会 得到好处的对局策略组合。 John Nash,Jr.1950年建立纳什均衡这一概念, 1994年荣获诺贝尔经济学奖。
乙 a 甲 A B
1, 0
b
1, 3
c
0, 1
0, 4
0, 2
2, 0
通过相对优势策略划线,我们得到博弈的纳什均衡
2013-8-4
22
相对优势策略划线法
试一试对相对优势策略划线,找到以下 博弈的结果
囚 徒 困 境 -5, -5 0, -8
-8, 0-1, -1夫 妻 争2, 1 0, 0
0, 0 1, 3
① 在二人博弈中,局中人双方的利益并不总是相 互完全冲突的,有时候也会出现双方利益方向 一致的情形。 ② 在两人博弈中,掌握信息多的一方并不能保证 利益一定较多。 ③ 在二人博弈中,个人追求自身利益最大化的行 为,往往并不能导致社会的最大利益,常常也 不能真正实现个人自身的最大利益。经济学常 常将这种现象称为“个人理性”与“集体理性” 的冲突。
通过箭头指向法寻找博弈结果
1, 0 1, 3 0, 1
0, 4
0, 2
2, 0
2013-8-4
28
箭头指向法P61
通过箭头指向法找到下面博弈的结果:
囚 徒 困 境 -5, -5 -8, 0 0, -8 -1, -1 夫 妻 之 争 2, 1 0, 0 0, 0 1, 3
猜 硬 币
-1, 1 1, -1
第二章 同时决策博弈
2013-8-4
1
主要知识点的安排
博弈的三要素和支付矩阵(第1节) *优势策略(第2节)和优势策略均衡(第3节) *相对优势策略( 第4节)和纳什均衡(第5节) 相对优势策略划线法(第6节)和箭头指向法 (第7节) 以上内容为完全信息静态博弈的分析方法 *纳什均衡的正式定义(第8节) 纳什均衡的性质——―最后归宿”(第9节) *纳什均衡的应用(第10节) 以上内容为完全信息静态博弈经典模型的应用 2 2013-8-4
2013-8-4 11
弱优势策略 (weakly dominant strategy)
并不是每一个博弈都存在严格优势策略,有 这样的情形,不存在不管其他局中人选择什 么策略,某个局中人选择他的某个策略给他 带来的支付始终高于他选择其它策略。 不管其他局中人选择什么策略,一个局中人 选择他的某个策略给他带来的支付仅仅只是 不低于他选择其它策略,我们通常把满足这 一性质的策略称为弱优势策略。
2013-8-4 9
优势策略
在引论我们已经学习用支付矩阵的方 法描述一个同时决策博弈。将博弈描 述清楚并不是我们的最终目的,我们 的最终目的是把这个博弈的结果分析 清楚,即预测什么情况可能发生,什 么情况不会发生。在非合作博弈理论 中,常用的一种方法是寻找优势策略。
2013-8-4 10
优势策略P45-46
猜 硬 币
2013-8-4
-1, 1 1, -1
1, -1 -1, 1
23
相对优势策略划线法
-5, -5 -8, 0 0, -8 -1, -1 2, 1 0, 0
囚 徒 困 境
夫 妻 之 争
0, 0
1, 3
猜 硬 币
-1, 1
1, -1
1, -1
-1, 1
2013-8-4
24
箭头指向法的思路
对于博弈中的每一个策略组合进行分析,考察 在这个策略组合下各个局中人是否能够通过单 独改变自己的策略而增加支付。
相关文档
最新文档