第二章 同时决策博弈
第二章_博弈思维:向前展望,从后倒推
结果是什么呢?
声称的策略与实际的策略:言语博弈问题
A向B发出威胁:如果你进入,我将阻挠。而对B来说,如
果进入,A真的阻挠的话,它将受损失-1亿,当然此时A 也有损失。对于B来说,问题是:A的威胁可臵信吗?
B 不进入 (0,10) (-1,2) 阻挠 (0,10)
进入
(4,4)
不阻挠
A
B通过分析得出:A的威胁是不可臵信的。
老板不用多付薪金
加薪谈判博弈树
加薪谈判
让老板相信你的威胁,最好的办法就是向他证明另一家 公司愿意每年多花12000元聘用你。(当然,如果真有 其事,你就不必运用博弈论来要求加薪了。) 争取加薪的另一办法是自断后路,告诉公司里的每个人, 如果你得不到加薪,你肯定会跳槽。你的目标是,把加
薪不成而留任的局面搞得越尴尬越好。
声称的策略与实际的策略:言语博弈问题
博弈论中,经常用“可臵信”和“不可臵信”的“威胁” 或“承诺”来区分行动者说出来的策略。而分析“威胁” 或“承诺”是可臵信的还是不可臵信的方法是倒推法。 倒推法(backward induction)也叫逆向归纳法。那么什 么是倒推法?
声称的策略与实际的策略:言语博弈问题
加薪谈判
如果你只是经理,不是老板。向你要求加薪的员工对你非
常重要,很不幸的是,你的员工也知道自己很重要,而且 你不想失去他们,但你又想压制一下下属的加薪要求。
这使你的谈判处于下风,因为假如员工能让你相信,只要 你不为他加薪,他就会跳槽,那你只好答应给他加薪。 你最好的办法是交出调薪的控制权,表明你对加薪无能为
加薪谈判
在博弈论的世界里没有仁慈或怜悯,只有一己之利。
在劳资博弈中,劳方是为了争取加薪,资方是为了确保 员工能在工作上全力以赴。老板绝不会无条件为员工加 薪,只有让老板相信对他有好处,员工才能得到加薪。 假如你对公司有所贡献,公司也依赖你。你希望加薪
第二章 完全信息静态博弈
2.3.1 古诺的寡头模型
企业Cournot模型 (无限策略博弈) 古诺( Cournot ,1838)比纳什(1950)定义早100年 假设条件: 1. 在一个寡头市场上两企业生产销售同质产品,市场 总垄产断量了Q某=一q行1+业q2的(两市寡场头) 企业就是指这两家企业 2. 市场出清价格 P = 8 - Q 3. 生产无固定成本,边际成本 c=c1=c2=2 4. 两企业同时独立地决定各自的生产产量(q1, q2) 问题:两家企业应如何决策?
一阶条件:
u1 p1
a1 2b1 P1 d1 P2
0
u2 p2
a2 2b2 P2 d2 P1
0
Cont…
❖
反应函数:
P1*
1 2b1
(a1
d1P2* )
P2*
1 2b2
(a2
d2 P1* )
❖ 纳什均衡( p1* , p2*)必需满足
P1*
1 2b1
2, 12 1, 11 2, 13
(3) (1)
上
甲
中
下
(3) 乙
(1)
左
中
右
4 ,12 0 , 12
3, 10 2, 11
2, 12 1, 11
3, 12
1, 8
2, 13
(2)
腐败与廉洁——两种路径
路径依赖:就是人们陷入一种情 况而发现从此难以脱身
❖ 1、换工作(我的工作:教师) ❖ 2、电脑操作系统 ❖ 3、婚姻 ❖ 4、腐败
第二章 完全信息静态博弈
完全信息静态博弈——各博弈方同时决策, 且所有博弈方对各方得益都了解的博弈。
囚徒的困境、齐威王田忌赛马、猜硬币、 石头剪子布、古诺产量决策
090302同时决策博弈已看
2同时决策博弈共同知识假定•通常还假设,所有的参与人都知道博弈的结构,知道他们的对手知道这一结构,知道他们的对手了解他们知道······如此直至无穷,也即博弈的结构是共同知识。
•博弈分析的目的:预测博弈的均衡结果,•即给定“每个参与人都是理性的”是共同知识,什么是每个参与人的最优策略?什么是所有参与人的最优策略组合?同时决策博弈•完全信息静态博弈中的行为假定理性参与人----追求支付最大化完全信息----对策略、策略组合及相关支付完全了解独立决策----无勾结(不管是明的还是暗的)•同步决策(静态博弈)在寡头市场,当经理们必须在无法知道竞争对手的决策的情况下做出自己的决策时,同步决策博弈发生。
同步不必同时•问题:如何预测对手的行动?乙坦白抵赖-3-5甲坦白-300-1抵赖-5-1Prisoners ’ Dilemma占优策略均衡Dominant-strategy Equilibrium严格劣策略strictly dominated strategy 深圳大学章平占优策略均衡Dominant-strategy Equilibrium 如果在某个博弈中,无论其他参与人选择什么策略,一个参与人的某个策略给他带来的支付始终不低于其他策略,则称该策略为这个参与人的一个占优策略Dominant strategy。
如果一个博弈的某个策略组合中所有策略都是各个博弈方自己的占优策略,则称这样的策略组合为该博弈的一个“占优策略均衡”。
•首先对亚当·斯密的“看不见的手”的原理提出挑战。
按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。
•《国富论》:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。
”•引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。
经济博弈论 02 完全信息静态博弈(Park)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
第二章同时决策博弈静态博弈(博弈论教程石家庄经济
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
第二节 优势策略与优势策略均衡
➢二、寻找优势策略:定义法
➢(一)案例:超市中的可乐价格大战
➢
PESPI
➢
低价
高价
➢ ➢COCO ➢
低价 高价
3,3 1,6
6,1 5,5
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
都是各参与人各自的上策 Ø(低价,低价) Ø特征:博弈中的稳定结果
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
第二节 优势策略与优势策略均衡
➢三、优势策略均衡
➢(二)寻找优势策略均衡
➢艺术家公明要求看装修商的设计方案
➢
装修商
➢
给看 不给看
➢
要求看 800,600 0,0
➢公明 ➢
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
第二节 优势策略与优势策略均衡
Ø二、寻找优势策略:定义法
Ø(四)结论 Ø严格优势策略组合(低价,低价)
Ø囚徒困境:对个人而言最优的策略 (低价),对集体而言非最优。个人 理性与集体理性冲突
Ø原因:只关心己方利益,双输
2020/12/10
第二章同时决策博弈静 态博弈(博弈论教程石家
庄经济
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
夫妻吵架——斗鸡博弈
Ø特征
Ø1.双方了解各种情况下的得益:完全
信息
Ø进——胜利
•亲爱的,你先 吵,你吵完了
Ø退——丢面子
我再吵?
博弈论讲义_05_同时博弈与序贯博弈
第三节
子博弈精炼纳什均衡
三、纳什均衡的存在性:库恩定理 完全信息的有限序贯博弈都存在纳 什均衡
2013年9月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
29
第六节 连续支付情形的序贯博弈
复习:完全信息静态博弈
古诺模型:同质产品、产量竞争、合作博弈 两家企业 市场总需求:q=a-p,a>0 企业i的成本:cqi,c>0 企业i的利润:i(q1, q2)=pqi-cqi=(a-q1-q2-c)qi 行为原则:勾结起来象一个垄断企业一样决定市场总产量 max (q)=pq-cq=(a-q-c)q f.o.c. / q 0 纳什均衡产量 均衡利润
高价 高投入 低投入 低价 高价 低价
3,4 1,2 4,3 2,1
第二节
混和博弈
案例:研发投入与定价博弈 (三)第二阶段:根据对方研发投入定价 4.(低投入,低投入)
高价 低投入 低投入 低价 高价 低价
6,6 3,7 7,3 5,5
第二节
混和博弈
案例:研发投入与定价博弈 (四)简化形式与纳什均衡 联想 1. 简化表述
子博弈:指向(2,1) 子博弈精炼纳什均衡 的策略组合——女方 无单独偏离激励
是子博弈精炼 纳什均衡
( 2, 1)
( 0, 0)
(-1, -1) ( 1, 2)
芭蕾
子博弈:指向(1,2) 的策略组合——女方 无单独偏离激励
第三节
例:情侣博弈 三个纳什均衡 (芭蕾,{芭蕾,芭蕾})
女 男 进入 芭蕾 女 进入 芭蕾 进入
(a c) ac * q* 4 2 双方在上述总产量的条件下通过讨价还价来决定各自生产多少, 这是一个零和博弈的问题
3第二章 同时决策博弈(2)[52页]
– 市场的反需求函数 p(q) a - q
– 设企业 i 生产 q i 单位产品的总成本是 ciqi ,其中 ci 是 正常数,i 1,2
这是一个寡头竞争的产量选择模型,其产品 满足同质性假定。
产量是连续变量,因此参与者的策略有无穷 多个,无法使用矩阵表的方法求解
具体操作方法
依次考察矩阵型博弈的每个策略组合,如果在 这个策略组合某个局中人能够通过单独改变策略选 择增加自己的支付,则从所分析的策略组合下他所 对应的支付处引一箭头,指向他单独改变策略后新 的策略组合下他所对应的支付。当所有策略组合都 这样处理完了以后,没有箭头指出去的那些格子表 征的策略组合,就是博弈的纳什均衡。
第二章 同时决策博弈(2)
• 2-7箭头指向法 • 2-8纳什均衡的正式定义 • 2-9“最后归宿”博弈 • 2-10纳什均衡的应用 • 2-11 纳什均衡的观察与验证 • 2-12 弱劣势策略消去法的讨论
2-7箭头指向法
• 基本思路:
– 对博弈中的每个策略组合进行分析,考察在这 个策略组合下各个局中人是否能够通过单独改 变自己的策略而增加支付。
上述问题是一个简单的最优化求解,可以通过一 阶必要条件进行分析:
一阶条件定义了反应函数
反应函数的含义就在于:每个企业的最优战 略都是其他企业战略的函数,是建立在相互影 响、相互博弈的基础上的。
反应函数的交点就是纳什均衡
例如,在反应函数为线性的情况下:
具体来说,假定两个企业具有不变单位成本 c, 逆需求函数 P=a-(q1+q2)
连续情形纳什均衡的必要条件
连续情形纳什均衡的检验方法
• 例:设一个3人的策略型博弈,每个局中人的策
同时博弈论
两人都丢面子
B
进
退
-3
0
进 -3
2
2
0
退0
0
Case4.石头剪子布
1. 博弈方1,2;
2. 可选策略: 石头、剪子 和布;
3. 几乎同时决 策;
4. 所得利益: 0表示没有输 赢;1表示赢; -1表示输。
博弈方2 石头 剪子 布
石 0,0 1,-1 -1,1 博头 弈 方 剪 -1,1 0,0 1,-1
1.2.6 完全信息博弈和不完全信息博弈
• 完全信息博弈:是指每一参与者都拥有所有其他参 与者的特征、策略集及得益函数等方面的准确信息的博弈。 • 不完全信息博弈:是指参与者只了解上述信息中的 一部分的博弈。
将博弈的信息特征和行为时间特征结合起来,可以进一 步把博弈细分为下面四种类型的非合作博弈,得到四种均衡:
乙
左
中
右
0
3
1
甲上 1
1
0
4
2
0
下0
0
2
划线法——情侣博弈battle of sexes
一对情侣面临周末晚上安排什么节目的决策,Jim 是铁杆球迷,怎肯放过一场世界杯的生死之战?Eva 崇尚高雅艺术,正好有一场《胡桃夹子》的芭蕾舞剧。 分开各自做喜欢的事,对于热恋中的他们也是一种折 磨,怎么办?
Eva
同时决策/行动博弈
• 完全信息静态博弈中的行为假定
理性参与人 ----追求支付最大化
完全信息
----对策略、策略组合及相关支付完全了解
独立决策
----无勾结(不管是明的还是暗的)
• 同步决策(静态博弈)
在寡头市场,当经理们必须在无法知道竞争对手的决策的情况下做出自己的 决策时,同步决策博弈发生。
博弈论第二章——博弈规则
U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
第二章同时决策博弈
2021/3/11
10
优势策略
在某个博弈中,如果不管其他局中人选择什么 策略,一个局中人的某种策略选择给他带来 的支付始终高于其他策略选择,或者至少不低 于其他策略选择,这个策略就称为优势策略。
只要这个局中人是一个理性的局中人,那么 他优势策略(strictly dominant strategy) ——弱优势策略(weakly dominant strategy)
的冲突。
2021/3/11
5
博弈的表述
博弈的三个基本要素:局中人、策略(或行动) 和得益(或支付)。
局中人:独立决策、独立承担博弈结果的个人或 组织。用i=1,2, …表示局中人,用N={1,2, …,n}表 示局中人的集合。
策略:局中人的决策内容。用Si表示局中人i可以 选择的一个特定策略,如果n个局中人每人选择 一如个 在特 囚定 徒的 困策 境略中,,则局n中维人向i的量策s=略(s集1,ss2i,=s{i…坦,白sn),。抵例 赖},而s=(坦白,坦白)是这个博弈的一个策 略组合。
设在一个n人博弈中,诸局中人的策略 集为S1,…Sn,每个局中人的支付 u1,…,un都是定义在S1×S2×…×Sn上的 函数,我们将这个博弈记作 G={S1,…Sn; u1,…,un}。这种表述方 法称为博弈的策略型表述或者正规型 表述。
2021/3/11
9
优势策略
在引论我们已经学习用支付矩阵的方 法描述一个同时决策博弈。将博弈描 述清楚并不是我们的最终目的,我们 的最终目的是把这个博弈的结果分析 清楚,即预测什么情况可能发生,什 么情况不会发生。在非合作博弈理论 中,常用的一种方法是寻找优势策略。
2021/3/11
3
二人同时博弈
博弈论第二章 (1)
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3
3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略
二、重复剔除严格劣战略
(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5
02 完全信息静态博弈
假设C为单位成本,则两商店的利润分别为
( p , p ) ( p c) D ( p , p ) ( p , p ) ( p c) D ( p , p )
当a=1-b时,即两商店位于同一位置,完全无差异,则
p
*
1
p
* 2
c
如果企业的竞争战略是价格,则Bertrand证明,即使只 有两个企业,在均衡情况下,价格等于边际成本,企业的 利润为零,与完全竞争市场均衡一样。这就是“伯川德悖 论(Bertrand Paradox)”。 解开这个悖论的办法之一就是引入产品的差异性。
* * ,sn ) 的各一个策略组成的某个策略组合 (s1 中,任一参与人
* * 的策略,都是对其余参与人策略的组合 (s1 ,si*1 , si*1 ,...sn )
* * * * ,si*1, si* , si*1,...sn ) ui (s1 ,si*1, si , si*1,...s, 的最佳对策,即 ui (s1 n)
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1
6q1 q1q2 q12
u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2
6q2 q1q2 q22
古诺模型的反应函数
maxu1 max(6q1 q1q2 q12 )
* * ( ui (si* , s )对任意 s S i 都成立,则称 ) u ( s , s i i i i )
i
s
*
* * ( s1 , sn ) 为 G 的一个纳什均衡
决策管理-第二章同时决策博弈静态博弈博弈论教程石家庄经济 精品
第二章 同时决策博弈
第二节 优势策略与优势策略 均衡
2021年2月28日
博弈论第二章
10
第一讲优势策略
第二节 优势策略与优势策略均衡
➢一、优势策略:占优策略
➢(一)定义
➢无论其他参与人选择什么策略,某参 与人的某策略产生的支付高于(至少 不低于)自己的其他策略产生的支 付——此策略为优势策略
si* si '和si , 有ui (si*, si ) ui (si ', si )
➢(四)结论 ➢严格优势策略组合(低价,低价)
➢囚徒困境:对个人而言最优的策略 (低价),对集体而言非最优。个人 理性与集体理性冲突
➢原因:只关心己方利益,双输
2021年2月28日
博弈论第二章
17
第一讲优势策略
继续小试牛刀:智猪博弈
➢ ➢ ➢ ➢大猪 ➢
要食 等待
小猪
要食
等待
5,1
4,4
9,-1
0,0
➢s=(s1,…,si,…,sn),所有人的某一策略
2021年2月28日
博弈论第二章
4
第一讲优势策略
第一节 二人同时博弈
➢一、复习:要素 ➢(三)支付(得益) ➢1.某人支付:取决于所有人的策略
➢ui=(S1,…,Si,…,Sn) ➢2.支付组合:所有人的支付
➢u=(u1,…,ui,…un)
2021年2月28日
13
第一讲优势策略
第二节 优势策略与优势策略均衡
➢二、寻找优势策略:定义法
➢(一)案例:超市中的可乐价格大战
➢
PESPI
➢
低价
高价
➢ ➢COCO ➢
低价 高价
博弈论的时间顺序
在博弈论中,时间顺序指的是玩家在决策过程中所处的时间位置。
博弈论中有两种主要的时间顺序:先手后手和同时决策。
在先手后手博弈中,一方先做出决策,然后另一方再做出决策。
这种情况常见于博弈中的信息不对称。
例如,在博弈中,一方可能拥有更多的信息,因此可以先做出决策,以便根据对方的决策做出更好的决策。
在同时决策博弈中,两方同时做出决策,并且在做出决策之前都没有任何信息。
这种情况常见于博弈中的信息对称。
例如,在博弈中,两方都拥有相同的信息,并且都不知道对方的决策。
时间顺序在博弈论中非常重要,因为它会影响玩家的决策策略和最终的博弈结果。
在先手后手博弈中,先手玩家有一定的优势,因为他可以根据后手玩家的决策做出更好的决策。
因此,先手玩家可以使用更为保守的策略,以最大化自己的收益。
在同时决策博弈中,由于两方同时做出决策,因此没有先手后手之分。
在这种情况下,玩家通常会采用更加进取的策略,因为他们不能依赖对方的决策来帮助自己做出更好的决策。
总的来说,时间顺序是博弈论中一个重要的概念,它会影响玩家的决策策略和博弈的结果。
因此,在进行博弈分析时,需要特别注意时间顺序的影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013-8-2 11
弱优势策略 (weakly dominant strategy)
并不是每一个博弈都存在严格优势策略,有 这样的情形,不存在不管其他局中人选择什 么策略,某个局中人选择他的某个策略给他 带来的支付始终高于他选择其它策略。 不管其他局中人选择什么策略,一个局中人 选择他的某个策略给他带来的支付仅仅只是 不低于他选择其它策略,我们通常把满足这 一性质的策略称为弱优势策略。
2013-8-2 12
严格劣势策略
不管其它博弈方的策略如何变化,给一个博 弈方带来的收益总是比另一种策略给他带来 的收益小的策略。 注意:界定一个策略是否是劣势策略,只需 要证明它比另一种策略,而不是其它所有的 策略给他带来的收益小。也就是说,对整体 而言一个博弈中只可能存在一个优势策略, 其它都是严格劣势策略。
2013-8-2 6
支付:每个局中人从博弈中获得的利益,它 体现每个参与博弈的局中人的追求,也是他 们行为和决策的主要依据。支付可以是利润、 收入、量化的效用、社会收益、福利等。可 以取正值,也可以取负值。 用ui表示局中人i的支付,它是策略组合s 的 函数。例如在囚徒困境博弈中,对于s=(沉 默,招供),u1(s)= -9,u2(s)=0。如果用向 量表示,支付向量为(u1(s),u2(s))=(-9,0)。 如果有n个参与人,支付向量为 (u1(s),u2(s),…, un(s) )。
2013-8-2 9
优势策略
在引论我们已经学习用支付矩阵的方 法描述一个同时决策博弈。将博弈描 述清楚并不是我们的最终目的,我们 的最终目的是把这个博弈的结果分析 清楚,即预测什么情况可能发生,什 么情况不会发生。在非合作博弈理论 中,常用的一种方法是寻找优势策略。
2013-8-2 10
优势策略
2013-8-2
纳什均衡的数学定义
态博弈模型,称策略组合 s (s , s ), s S , s S \ Si * si 为一个纳什均衡,如果对 i N , s
* * i * * * i i i i * i 是在 si
设 G {N , S1 ,, Sn , u1,un } 为一组完全信息的静
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
29
2013-8-2
箭头指向法
-5, -5 0, -8 2, 1 0, 0
囚 徒 困 境
-8, 0
-1, -1
夫 妻 之 争
0, 0
1, 3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
2013-8-2
30
什么是纳什均衡?
均衡(equilibrium):所有参与人的最优策略的 组合。在博弈达到均衡时,局中每一个博弈者 都不可能因为单方面改变自己的策略而增加收 益,于是各方为了自己利益的最大化而选择了 某种最优策略,并与其他对手达成了某种暂时 的平衡。纳什均衡:局中人单独改变策略不会 得到好处的对局策略组合。 John Nash,Jr.1950年建立纳什均衡这一概念, 1994年荣获诺贝尔经济学奖。
s*=(s1*,s2*,…,sn*) ∈S1×S2×…×Sn,都成立,
才说s*=(s1*,s2*,…,sn*) ∈S1×S2×…×Sn,是博弈G的 一个严格优势策略均衡。
2013-8-2
20
相对优势策略
相对优势策略就是当局中人在他的对手 选定某个具体策略条件下具有他的优势 策略。 优劣的相对性,是相对对手的具体策略 选择而言的,在多人博弈的情况下,局 中人的相对优势策略,是在他的每个对 手都选定各自的具体策略的条件下他的 优势策略。
2013-8-2 13
严格劣势策略逐次消去法
理性的局中人是不会采用对自己不利的严 格劣势策略的,所以在分析博弈的可能结 局时,我们可以把局中人的严格劣势策略 都删去,只留下严格优势策略,由此得到 由双方的严格优势策略组成的博弈均衡, 叫做严格优势策略均衡。
2013-8-2
14
用严格劣势策略逐次消去法求 严格优势策略均衡
2013-8-2
24
箭头指向法的思路
对于博弈中的每一个策略组合进行分析,考察 在这个策略组合下各个局中人是否能够通过单 独改变自己的策略而增加支付。
如果能够在对手或者对手们保持策略选择不变 的情况下,通过单独改变自己的策略选择,到 达或者形成新的策略组合而增加自己的支付, 那么原来的策略组合就不是博弈的具有稳定性 的结果,我们将它排除在均衡之外,这样做完 以后,剩下没有被排除的,就是博弈的纳什均 衡。
2013-8-2 17
定义:严格优势策略和严格劣势策略
设一个二人同时决策的博弈,si,sj∈S1,即 si , sj都是局中人1可以选择的策略,那么 (1)如果对于局中人2的每一个策略s ∈ S2, 都有u1(si,s) >u1(sj,s),则称局中人1的策略si 严格优于局中人1的策略 sj ; (2)如果对于局中人2的每一个策略s ∈ S2 , 都有u1(si,s) <u1(sj,s) ,则称局中人1的策略 si严格劣于局中人1的策略 sj 。
2013-8-2 7
举例
• 例如,在囚徒困境中,u1((沉默,沉默))= -1, u1((沉默,招供))= -9, u1=((招供,沉默))= 0, u1=((招供,招供))= -6。
• 同学们也可以选择支付矩阵来表示。
2013-8-2
8
博弈的策略型表述P43
设在一个n人博弈中,诸局中人的策略 集为S1,…Sn,每个局中人的支付 u1,…,un都是定义在S1×S2×…×Sn上的 函数,我们将这个博弈记作 G={S1,…Sn; u1,…,un}。这种表述方 法称为博弈的策略型表述或者正规型 表述。
第二章 同时决策博弈
2013-8-2
1
主要知识点的安排
博弈的三要素和支付矩阵(第1节) *优势策略(第2节)和优势策略均衡(第3节) *相对优势策略( 第4节)和纳什均衡(第5节) 相对优势策略划线法(第6节)和箭头指向法 (第7节) 以上内容为完全信息静态博弈的分析方法 *纳什均衡的正式定义(第8节) 纳什均衡的性质——“最后归宿”(第9节) *纳什均衡的应用(第10节) 以上内容为完全信息静态博弈经典模型的应用 2 2013-8-2
Ui (s1,…, si-1, si*, si+1,…, sn) ≥ Ui (s1,…, si-1, si, si+1,…, sn)
对于所有的策略组合都成立。
2013-8-2 19
定义:严格优势策略均衡
如果进一步对于任何一个局中人i∈{1,2,…,n},严格 不等式
ui(s1,…, si-1, si*, si+1,…, sn) > ui(s1,…, si-1, si, si+1,…, sn) , 对于所有si≠ si*的策略组合
左 上 1,0 0,4
中 1,3 0,2
右 0,1 2,0
左 1,0 0,4
中 1,3 0,2
左 1,0
中 1,3
下
2013-8-2
15
公明博弈
注意:虚线划去的是劣势策略而不是严格劣势策略。
装修行
给看 要求看
公 明 不要求看 800,600 0,1000
不给看
0,0 0,1000
公明博弈支付矩阵
在某个博弈中,如果不管其他局中人选择什么 策略,一个局中人的某种策略选择给他带来 的支付始终高于其他策略选择,或者至少不低 于其他策略选择,这个策略就称为优势策略。 只要这个局中人是一个理性的局中人,那么 他必定愿意选择这个策略。 优势策略可分为 ——严格优势策略(strictly dominant strategy) ——弱优势策略(weakly dominant strategy)
2013-8-2 18
定义:优势策略均衡
设s*=(s1*,s2*,…,sn*) ∈S1×S2×…×Sn是n人博弈 G={S1,…Sn; u1,…,un}的一个策略组合。 如果s*=(s1*,s2*,…,sn*) ∈S1×S2×…×Sn, 符合以下条件,就说它是博弈G的一个优势策略均 衡: 对于任何一个局中人i∈{1,2,…,n},不等式
二人同时博弈
博弈中局中人的个数是博弈结构的关键 因素之一,根据局中人的个数,将博弈 分为“二人博弈”和“多人博弈”。 两人博弈就是两个各自独立决策,但策 略和利益相互依存关系的博弈方的决策 问题。例如,囚徒困境、田忌赛马、猜 硬币、打球等;经济活动中这样例子也 常见两个厂商之间的竞争、谈判、兼并 收购和劳资纠纷等。
2013-8-2 16
严格劣势逐次消去法的局限性
当博弈中某个局中人的不同策略之间并 不存在严格的优劣关系时,集中于寻求 优势策略试图得到优势策略均衡的做法 就行不通,采取严格劣势逐次消去法也 未必奏效。也就是说严格劣势逐次消去 法存在其局限性。所以,我们必须进一 步寻找更普遍适用的博弈结果分析方法。
条件下局中人 i
的最优选择,即
si Si
* * ui ( si* , si ) maxui ( si , si )
或
* * ui (si* , si ) ui (si , si )
2013-8-2
对于 si Si 成立。
优势策略均衡与纳什均衡
在优势策略均衡中,不论所有其他 参与人选择什么策略,一个参与人 的优势策略都是他的最优策略,显 然这一策略一定是所有其他参与人 选择某一特定策略时该参与人的优 势策略。因此,优势策略均衡一定 是纳什均衡。