第五章 重复博弈完全且非完美信息动态博弈(博弈论张醒洲)PPT课件
合集下载
博弈论 完全信息动态博弈.ppt
4、工会、雇主与中央银行的经济博弈
考虑工资、物价、就业的宏观经济模型:
• 中央银行:选择货币供应量,在其效用函 数中关注通货膨胀率与就业水平;
• 企业:选择就业数量,使企业利润最大化 (受工人的工资影响);
• 就业者:要求工资水平,使自身福利最大 化(受通货膨胀率影响)。
• 由于劳动合同和工资刚性,博弈顺序为:
• 企业1首先选择产量q1,企业2观察到企业1的产量 后选择自己的产量q2,令: P(Q)=a-q1-q2代表逆需求函数 Ci(qi)=cqi代表成本函数 则第i企业的利润函数为:
i(q1,q2)=qiP(q1+q2)-Ci(qi)
企业1 q1
企业2 q2
市场
i=1,2
P(Q)
企业利润:
i(q1,q2)
• 若T=1,在T=1时,参与人1出价,如果他提出 x1=1,参与人2只能接受。
两阶段博弈(T=2)
• 若T=2,在T=2时,参与人2出价,如果他提 出x2=0,参与人1只能接受;
• 由于参与人2在T=2时的1单位支付相当于在 t=1时δ2单位,如果参与人在t=1时出价1-x1≥δ2, 则参与人2会接受。
承诺价值
• 在该博弈中,拥有信息优势反而使参与人处 于劣势,企业1称为领导者,企业2称为随从。
• 现在考察完全信息静态情形下:如果企业1 承 信诺呢?(威协)生产q1*=(a-c)/2,企业2是否会相
• 若 优 信企选企业择业将21选的是择威qq1胁*2=*,=3((唯aa--一cc))//的48, ,纳则 因什此 此均时企衡企业是业2不1会的相最 q1*=q2*=(a-c)/3。
企业1 q1
企业2 q2
市场
P(Q)
博弈论课件 谢识予 03 完全且完美信息动态博弈共47页
Hale Waihona Puke 谢谢11、越是没有本领的就越加自命不凡。——邓拓 12、越是无能的人,越喜欢挑剔别人的错儿。——爱尔兰 13、知人者智,自知者明。胜人者有力,自胜者强。——老子 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。——歌德 15、最具挑战性的挑战莫过于提升自我。——迈克尔·F·斯特利
博弈论课件 谢识予 03 完全且完美信 息动态博弈
16、自己选择的路、跪着也要把它走 完。 17、一般情况下)不想三年以后的事, 只想现 在的事 。现在 有成就 ,以后 才能更 辉煌。
18、敢于向黑暗宣战的人,心里必须 充满光 明。 19、学习的关键--重复。
20、懦弱的人只会裹足不前,莽撞的 人只能 引为烧 身,只 有真正 勇敢的 人才能 所向披 靡。
博弈论课件4-重复博弈
4.1.1 为什么研究重复博弈 4.1.2 基本概念
生活中的重复博弈
——你到菜场去买菜,当你担心上当受骗而犹豫不决时,
卖菜的摊主便会对你说:“你放心好了,我天天在这里卖菜, 不会骗你的,如果菜不好你回来找我!‛他强调自己‚天天‛ 在这里卖菜,你通常便会放下心来,与之成交。因为他的这 句话翻译成经济学的语言就是‚我跟你是‘重复博弈’‛! ———而一次性的买卖往往发生在双方以后不再有买卖机会 的时候,特点是尽量谋取暴利并且带欺骗性,比如车站、码 头、旅游景点的东西往往质次价高,其原因就在于买卖双方 很少有‚重复博弈‛的机会。
两人零和博弈的有限次重复博弈 惟一纯策略纳什均衡的有限次重复博弈 多个纯策略纳什均衡的有限次重复博弈 有限次重复博弈的无名氏定理
4.2.1 两人零和博弈的有限次重复博弈
猜硬币博弈
正 面 盖 硬 币 方 正 面 反 面 -1, 1 1, -1
猜硬币方 反 面 1, -1 -1, 1
零和博弈是严格竞争的,重复博弈并不改变这一点。 重复零和博弈不会创造出新的利益。
4.2.1 两人零和博弈的有限次重复博弈
以零和博弈为原博弈的有限次重复博弈与猜硬币博 弈的有限次重复博弈一样,博弈方的正确策略是重 复一次性博弈中的纳什均衡策略。 可用逆推归纳法来证明 可以推广到非零和或多个博弈方,但博弈方的利益 严格对立,没有纯策略纳什均衡的其他严格竞争博 弈中 产生原因:利益关系严格对立,矛盾不可调和
有限次重复博弈民间定理
设原博弈的一次性博弈有均衡得益数组优于w, 那么在该博弈的多次重复中,所有不小于个体理性 得益的可实现得益,都至少有一个子博弈完美纳什 均衡的极限的平均得益来实现它们。
完全但不完美信息动态博弈PPT演示文稿
多节点信息集和子博弈
14
5.1.3 多节点信息集和子博弈
能够自成博弈的,某动态博弈的某一点起的全部后续 阶段,它必须有一个初始节点(子博弈开始的明确的 起点)。且具备进行博弈所必须的各种信息。
含义: 原博弈不是自己的一个子博弈。 不包含不跟在此初始节点之后的节点。 不分割任何信息集。——针对完全不完美信息动态 博弈
性相对应,由此也称这种均衡为“序列均衡” 子博弈完美纳什均衡是完美贝叶斯均衡的一个特例,
完美贝叶斯均衡在静态博弈中就是纳什均衡(理性)
完美贝叶斯均衡
21
5.2 完美贝叶斯均衡
第五讲 完全但不完美信息动态博弈
苏兵
西安工业大学经济管理学院 2008年8-12月
5 完全但不完美信息动态博弈
不完美信息动态博弈 完美贝叶斯均衡 单一价格二手车交易 双价二手车交易模型 昂贵的承诺
完全但不完美信息动态博弈
2
5.1 不完美信息动态博弈
概念 多节点信息集和不完美信息动态博弈的表示 多节点信息集和子博弈
买方应不应该买车呢?买那种价格的车呢? 卖方好车和差车分别应该怎样定价呢?
不完美信息动态博弈的表示
11
5.1.2 不完美信息动态博弈的表示
信息集
1
好
差
1
1
卖
卖
不卖
不卖
2
0,0 0,0
买
买
不买
不买
2,1 0,0 1,-1 -1, 0
——四种可能的结局
不完美信息动态博弈的表示
12
5.1.2 不完美信息动态博弈的表示
注意到最后的得益一定要有一个基本的前提,即有一 个选择信息集中两个节点各自达到的概率判断(比如 天气好坏,好差的可能性)
博弈论与信息经济学--完全信息动态博弈 ppt课件
©&® by H. Q. Feng, CUFE
5/58
一、动态博弈的表述——扩展式
(2)博弈的扩展式表述包括以下要素: 参与人集合:i=1,…,n,此外,N代表虚拟参与人“自然” 参与人的行动顺序:谁在什么时候行动; 参与人的行动空间:在每次行动时,参与人有些什么选择; 参与人的信息集:每次行动时,参与人知道什么; 参与人的支付函数:在行动结束之后,每个参与人得到些什 么(支付是所有行动的函数); 外生条件(即自然的选择)的概率分布。 假定房地产开发博弈的行动顺序如下:开发商A首先行动, 选择开发或不开发;在A决策后,自然选择市场需求的大小; 开发商B在观测到A的决策和市场需求后,决定开发或不开 发。
该博弈的扩展式表述为:
©&® by H. Q. Feng, CUFE
15/58
一、动态博弈的表述——扩展式
进入者
进入
不进入
在位者
斗争 默许
(0,300)
(-10,0)
(40,50)
©&® by H. Q. Feng, CUFE
16/58
二、子博弈精炼纳什均衡
纳什均衡有几个问题:
第一,一个博弈不止一个均衡,事实上,有些 博弈可能有无数个纳什均衡,究竟哪一个更合 理? 纳什均衡假定每一个参与人在选择自己的最优 战略时假定所有其他参与人的战略是给定的, 但是如果参与人的行动有先有后,后行动者的 选择空间依赖于前行动者的选择,先行动者在 选择时不可能不考虑自己的行动对后行动者的 影响。
©&® by H. Q. Feng, CUFE 20/58
二、子博弈精炼纳什均衡
“子博弈”的概念:从每一个行动选择开始至 博弈结束又构成一个博弈,称为“子博弈”。 如在进入者选择进入之后,在位者选择行动 开始就是一个子博弈。 子博弈需满足的条件:
博弈论完全且完美信息动态博弈.ppt
甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
能否找到子博弈?
好1差
1 不卖
1
卖
卖
不卖
2
(0,0) (0,0)
买 不买
买 不买
(2,1)
(0,0)
(1,-1)
(-1,0)
二手车交易扩展形
结论:
(1)子博弈不能包括原博弈的第一阶段, 即动态博弈本身不会是它自己的子博弈;
(2)子博弈必须有一个明确的初始信息集, 以及必须包含初始阶段之后的所有博弈 阶段,即子博弈不能分割任何信息集或在 有多节点信息集的不完美信息博弈中可 能不存在子博弈。
3.3 子博弈和子博弈完美纳什均衡
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
3.3.1 子博弈
定义:由一个动态博弈 第一阶段以外的某阶段 开始的后续博弈阶段构 成的,有初始信息集和 进行博弈所需要的全部 信息,能够自成一个博 弈的原博弈的一部分, 称为原动态博弈的一个 “子博弈”。
乙 借
第三种开金矿博弈中, (不借-不打,不分)和 (借-打,分)都是纳什均衡。但后者不可信,不 可能实现或稳定。
结论:纳什均衡在动态博弈可能缺乏稳定性,也就 是说,在完全信息静态博弈中稳定的纳什均衡,在 动态博弈中可能是不稳定的,不能作为预测的基础。
根源:纳什均衡本身不能排除博弈方策略中包含的 不可信的行为设定,不能解决动态博弈的相机选择 引起的可信性问题
《博弈论与信息经济学》
第三章
完全且完美信息动态博弈
本章讨论动态博弈,所有博弈方都对博弈 过程和得益完全了解的完全且完美信息动态博 弈。这类博弈也是现实中常见的基本博弈类型。 由于动态博弈中博弈方的选择、行为有先后次 序,因此在表示方法、利益关系、分析方法和 均衡概念等方面,都与静态博弈有很大区别。 本章对动态博弈分析的概念和方法,特别是子 博弈完美均衡和逆推归纳法作系统介绍,并介 绍各种经典的动态博弈模型。
博弈论8 完全但不完美信息动态博弈PPT课件
2
(0,0) (0,0)
买 不买
买 不买
(P, V-P) (0, 0) (P-C, W-P) (-C, 0)
➢ 买方在自己的决策信息集 处选择“不买”的期望得益:
单一价格二手车交易
E2 = 0.
Cont…
第一阶段: 由于P<C, 卖方伪装成好车然后卖掉仍然要亏损,理性的卖方不卖差
车,但车好时,卖方总选择卖。
➢ 市场完全成功:只有质量好的商品才被卖,而质 量差的卖方不敢卖,买方选择买。市场上的商品 都是好的
➢ 市场部分成功:所有卖方不管商品好坏都卖,买 方不管商品好坏都买,交易总是能够完成
➢ 市场接近失败:所有好商品都被投放在市场,只 有部分坏商品被投放,但买方按一定概率购买市 场上的商品
二、均衡类型
合并均衡 分开均衡
混成均衡
8.1.3 模型的纯策略完美贝叶斯均衡
一、市场部分成功的(纯策略)完美贝叶斯均衡(合并均衡) 如果V>P>W,P>C, 并且pb很小
(纯策略)完美贝叶斯均衡(合并均衡): (1)卖方选择卖,不管车子好或差; (2)买方选择买,只要卖方卖; (3)买方的判断为 p(g|s)=pg,p(b|s)=pb
二、市场接近失败的数字例子
假设: V3000,W0,P2000,C1000 pgpb0.5
容易检验前面的两个条件。略
下面考虑混合策略:
混合策略完美贝叶斯均衡均衡:
(1)卖方在车好时选卖,车差时以0.5概率随机选择卖或不 卖
(2)买方以0.5概率随机选择买或不买
(3)买方的判断为 p(g|s)2,p(b|s)1
第八章
不完全信息动态博弈的应用: 二手车模型
8.1 单一价格二手车模型
完全信息动态博弈-PPT
(1) 开发商A先行动, 选择开发或不开发;(2) 开发商B在
观测到A得决策后, 再决定开发或不开发。博弈树如下
图。
A
开
不
B
B
开
不
开
不
(-3,-3)
(1,0) (0,1)
(0,0)
注:所有n个局中人得一个纯策略组合决定了博弈树上得一条 路径。但每条路径可由不同得策略组合决定。
例如, (开发,(不开发,开发))决定了 A -> 开发 -> B -> 不开发 -> (1,0)
进 入 进入 者 不进入
在位者
默许
斗争
5,5 1,10
-2,3 1,10
承诺行动使 不可ቤተ መጻሕፍቲ ባይዱ信威胁可信威胁,否则,当事人将为自 己得“失信”付出成本。
例如,该例中,在位者与某第三者打赌,如果进入者进入后她 不斗争,她就付给后者3,这时,斗争成为可置信得威胁。因为 如果进入后,选择默许,收益更小。注意:有了这个赌,进入者 就不敢进入了,实际上,在位者无需支付赌注。
开 (-3,-3)
A
开
BI
不
不
B
开
(1,0) (0,1)
Ⅱ
不 (0,0)
房地产开发中,子博弈I与Ⅱ属于单人博弈,子博弈I中,B得最优 选择就是不开发,子博弈Ⅱ中,B得最优选择就是开发,因此: (1)(不开发, (开发,开发))在子博弈I上不构成Nash均衡; (2)(开发,(不开发,不开发))在子博弈Ⅱ上不构成Nash均衡; (3)(开发,(不开发,开发))在所有子博弈上都构成Nash均衡, 就是子博弈精炼Nash均衡。
Max π1(q1,s2(q1))=q1(a-q1-s2(q1)-c)
重复博弈博弈论课件.ppt
重 复 博 弈
重复博弈
动态博弈的类型
序贯博弈sequential game
每一个阶段的博弈结构是不同的,即从后一个决策结开 始的子博弈不同于从前一个决策结开始的子博弈。或者 说,同样结构的博弈只出现一次。 是指同样结构的博弈重复多次,其中的每次博弈称为 “阶段博弈”。如“囚徒困境”中小偷每次作案后判刑 释放后又作案。 分为有限次重复博弈与无限次重复博弈
H H 厂商1 M L 5, 5 6, 0 2,0
厂商2 M
L 0,2 0,2 1,1
0,6 3,3 2,0
触发策略可信的情况
博弈方1:第一次选H,如 果第一次结果为 (H,H),则第二次选择 M;否则采用P 博弈方2:第一次选H,如 果第一次结果为 (H,H),则第二次选择 M;否则采用Q
博弈方1 H M L P Q
5,5 6,0 2,0
重复两阶段三价博弈的等价博弈:如果 认为触发策略不可信,即不可信报复, 最佳选择为(M,M)
触发策略可信性问题
实际上,触发策略中的报复机制的可信性是一个很复 杂的问题,会受到相互预期等很多复杂因素的影响。 例如,未偏离的一方并不想报复偏离的一方,而偏离 的一方却因为害怕报复而采用L,结果心慈手软的未偏 离一方再次遭受损失,这种可能性的存在会使得报复 机制实施的可能性增加。 此外,考虑策略的制定者和执行者分离的情况,执行 者会严格执行决策者指令的情况等等。
在有限次重复博弈中,如果原博弈存在唯一的纯策略NE, 则有限次重复博弈的唯一的均衡解就是各博弈方在每阶段 中都采用原博弈的NE。 因为每个阶段NE都是SPNE,即不存在不可信的威胁和许 诺,因此重复博弈的解也是SPNE。
重复博弈
动态博弈的类型
序贯博弈sequential game
每一个阶段的博弈结构是不同的,即从后一个决策结开 始的子博弈不同于从前一个决策结开始的子博弈。或者 说,同样结构的博弈只出现一次。 是指同样结构的博弈重复多次,其中的每次博弈称为 “阶段博弈”。如“囚徒困境”中小偷每次作案后判刑 释放后又作案。 分为有限次重复博弈与无限次重复博弈
H H 厂商1 M L 5, 5 6, 0 2,0
厂商2 M
L 0,2 0,2 1,1
0,6 3,3 2,0
触发策略可信的情况
博弈方1:第一次选H,如 果第一次结果为 (H,H),则第二次选择 M;否则采用P 博弈方2:第一次选H,如 果第一次结果为 (H,H),则第二次选择 M;否则采用Q
博弈方1 H M L P Q
5,5 6,0 2,0
重复两阶段三价博弈的等价博弈:如果 认为触发策略不可信,即不可信报复, 最佳选择为(M,M)
触发策略可信性问题
实际上,触发策略中的报复机制的可信性是一个很复 杂的问题,会受到相互预期等很多复杂因素的影响。 例如,未偏离的一方并不想报复偏离的一方,而偏离 的一方却因为害怕报复而采用L,结果心慈手软的未偏 离一方再次遭受损失,这种可能性的存在会使得报复 机制实施的可能性增加。 此外,考虑策略的制定者和执行者分离的情况,执行 者会严格执行决策者指令的情况等等。
在有限次重复博弈中,如果原博弈存在唯一的纯策略NE, 则有限次重复博弈的唯一的均衡解就是各博弈方在每阶段 中都采用原博弈的NE。 因为每个阶段NE都是SPNE,即不存在不可信的威胁和许 诺,因此重复博弈的解也是SPNE。
博弈论5. Information Sets and Mixed Strategies
支付:(史密斯,琼斯)
这个博弈的支付关于参与人是对称的,所以他们 的混合策略相同,其中θ表示个人坚持的概率。
32
张醒洲,大连
2014/3/26
斗鸡博弈,payoff - equating
U琼斯(避让)= θ ·( 0 ) + (1- θ) · (1) U琼斯(坚持)= θ · (-3) + (1- θ) ·(2)
参与人 i 的一个混合策略是在其策略空间Si中的
(一些或全部)纯策略上的概率分布。
8
张醒洲,大连
2014/3/26
互为最优反应对应,导致纳什均衡
最优反应r*(q)和q*(r)的交 点确定了猜硬币博弈的 纳什均衡:
如果参与人i的策略是 (1/2,1/2) ,则参与人j的最 优反应是 (1/2,1/2),满足 纳什均衡的要求。 反之亦然。
15
张醒洲,大连
2014/3/26
策略
策略是参与人的行动规划:给定他的信息 集,一个策略决定他在相应时点所选择的 行动。 一旦博弈到达他的一个信息集,参与人将 采取某个由策略规定的行动。
16
张醒洲,大连
2014/3/26
策略集与策略组合
策略集是一个参与人可行策略的集合 一个策略组合是由博弈的所有参与人每人 选择一个策略组成的有序集 s = (s1, . . . , sn).
再论混合策略均衡
Information Sets and
Mixed Strategy Equilibrium 张醒洲
1
张醒洲,大连
2014/3/26
回顾我们在讨论过的
纳什均衡与混合策略均衡
猜硬币博弈,石头-剪刀-布博弈, 性别战博弈
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 参与人1和2同时从各自的可行集A1和A2中选择a1和a2;
2. 收益情况为ui(a1,a2,a3*(a1,a2),a4*(a1,a2)),i=1,2;
假定(a1*,a2*)为以上同时行动博弈唯一的纳什均衡,我们称 (a1*,a2*,a3*(a1*,a2*),a4*(a1*,a2*))为这一两阶段博弈的子博弈完 美结果。
2009-03-16
张醒洲,大连
7
两阶段囚徒Байду номын сангаас境
• 得到 a3*(a1,a2),a4*(a1,a2)
– 根据第一阶段的行动a1和 a2 ,预测第二阶段参与人的反应; – 请注意,在囚徒困境博弈中存在唯一的纳什均衡,因此参与人
的反应独立于其在第一阶段的行动。
• 计算 ui(a1,a2,a3*(a1,a2),a4*(a1,a2)),i=1,2
• 两阶段囚徒困境博弈是“2×2 两人同时行动”博弈的一 个特殊例子。在这个博弈中,我们在上一节利用后向归纳 法的思路分析了“子博弈完美结果”,具体见2.2.1。
• 子博弈完美结果
如果参与人1和2预测到参与人3和4在第二阶段的行动将由 (a3*(a1,a2),a4*(a1,a2))给出,则参与人1和2在第一阶段的问题就可 以用以下的同时行动博弈表示:
参与人 1
参与人 2
L2
L1
1, 1
R1
0, 5
R2 5, 0 4, 4
图 2.3.1
• 让两个参与人进行两次囚徒困境博弈,观察第二次博弈 开始之前第一次博弈的结果,并假设整个过程博弈的总 收益等于两阶段博弈收益的简单相加 (即不考虑贴现因 素) 。
2009-03-16
张醒洲,大连
6
“2 × 2 ×2” 博弈和子博弈完美结果
2009-03-16
张醒洲,大连
9
有限重复博弈:重复独立
• 令 G = {A1, ...,An; u1, ..., un} 表示一个完全信息博弈,其中参与人1
到n同时从各自的行动空间A1到An中分别选择行动a1到an ,得到的
收益分别为u1(a1, ..., an) , ..., un(a1, ..., an),我们称博弈G为重复博弈 中的阶段博弈。 • 定义1 对给定的阶段博弈G,令 G(T)表示G重复进行T次的有限 博弈,并且在下一次博弈开始前,所有以前博弈的进行都可以被 观察到。G(T)的收益为T次阶段博弈收益的简单相加。 • 定理1 如果阶段博弈G有唯一的纳什均衡,则对任意有限的T, 重复博弈G(T)有唯一的子博弈完美结果:即G的纳什均衡结果在 每一阶段重复进行。
• 我们在本节先作简要介绍,以便后面的展开。
2009-03-16
张醒洲,大连
4
两阶段重复博弈
• 两阶段囚徒困境 • 两阶段博弈的阶段博弈有多个纳什均衡
– 预测第二阶段的行动 – 重复博弈的子博弈完美结果
2009-03-16
张醒洲,大连
5
两阶段囚徒困境
考虑囚徒困境 给定如图2.3.1的标准式 – 纳什均衡为(L1 , L2) – 同时行动博弈
头垄断模型 鲁宾斯坦 (1982) 讨价还价 模型
Backwards Induction Outcome (BIO) 后向归纳结果
Lazear&Rosen Tournaments (1981 ) 工作 竞赛模型
Subgame Perfect Outcome (SPO) 子博弈完美结果
动态博弈主题: 可信威胁与 承诺会影响现在的行为
2009-03-16
张醒洲,大连
10
两阶段重复博弈: 阶段博弈有多个纳什均衡
参与人 2
•
L2
M2
R2
L1 1, 1 5, 0 参与人 1 M1 0, 5 4, 4
0, 0 0, 0
重复博弈 完全且非完美信息动态博弈
Unit 5
2009-03-16
张醒洲,大连
1
第3章和第4章要点
博弈类型
简单的完全且完美信息 动态博弈
2人两阶段重复博弈 (“同时行动” 意味着 “不完美信息”)
下一次博弈开始前的所 有博弈的结果都能被观 察到的重复博弈
2009-03-16
举例
解的概念
Stackelberg (1934) 双寡
2009-03-16
张醒洲,大连
3
重复博弈
• 要点
– 在(参与者)重复关系中,关于将来行动的威胁或承诺能否影响 到当前的行动。
• 直观
– 大部分直观的结论是由两阶段的例子给出的 – 一些观点需要讨论无限次的情况
• 子博弈完美纳什均衡 – 我们还将定义重复博弈中子博弈完美纳什均衡的概念
• 这一定义在重复博弈的条件下表述比较容易理解,而在2.4.B. 节分析一般完全信息动态博弈中则要复杂一些;
段的交互行动如图2.3.2所示; • 这个一次性博弈有唯一的纳什均衡
(L1 ,L2) 。
参与人 1 L1 R1
参与人 2
L2 2, 2
R2 6, 1
1, 6
5, 5
图 2.3.2
• 两阶段囚徒困境唯一的子博弈完美结果就是第一阶段的 (L1,L2) 和第二阶段的 (L1,L2)。
• 在子博弈完美结果中,任意阶段都不能达成相互合作 (R1,R2)。
扩展式
Nash Equilibrium (NE) Nash均衡
Subgame-perfect Nash equilibrium (SPNE) 子博弈完美Nash均衡
credibility threats or promise (self-enforcement) 可信性威胁或承诺
一个完全信息动态博弈可能会有很多个纳什均衡,但 是有些均衡包含了不可置信的威胁和承诺。子博弈完 美纳什均衡就是通过了可信任检测的均衡。
Subgameperfect Nash equilibrium 子博弈完美NE
张醒洲,大连
2
第3章和第4章要点
表述
解的概念
Central Issue 中心问题 Theme 主题思想
完全信息动态博弈
Normal-form / Strategic- Extensive-form
form 标准式/策略式
ui(a1,a2,a1*'(a1,a2 ),a*2'(a1,a2 )) =ui(a1,a2 ,a1*' ,a*2' ) =ui(a1,a2 )+ui(a1*' ,a*2' )
2009-03-16
张醒洲,大连
8
两阶段囚徒困境
• 第二阶段博弈的结果为纳什均衡 (L1 , L2) ,两人收益为(1, 1);参与 人在两阶段囚徒困境博弈中第一阶
2. 收益情况为ui(a1,a2,a3*(a1,a2),a4*(a1,a2)),i=1,2;
假定(a1*,a2*)为以上同时行动博弈唯一的纳什均衡,我们称 (a1*,a2*,a3*(a1*,a2*),a4*(a1*,a2*))为这一两阶段博弈的子博弈完 美结果。
2009-03-16
张醒洲,大连
7
两阶段囚徒Байду номын сангаас境
• 得到 a3*(a1,a2),a4*(a1,a2)
– 根据第一阶段的行动a1和 a2 ,预测第二阶段参与人的反应; – 请注意,在囚徒困境博弈中存在唯一的纳什均衡,因此参与人
的反应独立于其在第一阶段的行动。
• 计算 ui(a1,a2,a3*(a1,a2),a4*(a1,a2)),i=1,2
• 两阶段囚徒困境博弈是“2×2 两人同时行动”博弈的一 个特殊例子。在这个博弈中,我们在上一节利用后向归纳 法的思路分析了“子博弈完美结果”,具体见2.2.1。
• 子博弈完美结果
如果参与人1和2预测到参与人3和4在第二阶段的行动将由 (a3*(a1,a2),a4*(a1,a2))给出,则参与人1和2在第一阶段的问题就可 以用以下的同时行动博弈表示:
参与人 1
参与人 2
L2
L1
1, 1
R1
0, 5
R2 5, 0 4, 4
图 2.3.1
• 让两个参与人进行两次囚徒困境博弈,观察第二次博弈 开始之前第一次博弈的结果,并假设整个过程博弈的总 收益等于两阶段博弈收益的简单相加 (即不考虑贴现因 素) 。
2009-03-16
张醒洲,大连
6
“2 × 2 ×2” 博弈和子博弈完美结果
2009-03-16
张醒洲,大连
9
有限重复博弈:重复独立
• 令 G = {A1, ...,An; u1, ..., un} 表示一个完全信息博弈,其中参与人1
到n同时从各自的行动空间A1到An中分别选择行动a1到an ,得到的
收益分别为u1(a1, ..., an) , ..., un(a1, ..., an),我们称博弈G为重复博弈 中的阶段博弈。 • 定义1 对给定的阶段博弈G,令 G(T)表示G重复进行T次的有限 博弈,并且在下一次博弈开始前,所有以前博弈的进行都可以被 观察到。G(T)的收益为T次阶段博弈收益的简单相加。 • 定理1 如果阶段博弈G有唯一的纳什均衡,则对任意有限的T, 重复博弈G(T)有唯一的子博弈完美结果:即G的纳什均衡结果在 每一阶段重复进行。
• 我们在本节先作简要介绍,以便后面的展开。
2009-03-16
张醒洲,大连
4
两阶段重复博弈
• 两阶段囚徒困境 • 两阶段博弈的阶段博弈有多个纳什均衡
– 预测第二阶段的行动 – 重复博弈的子博弈完美结果
2009-03-16
张醒洲,大连
5
两阶段囚徒困境
考虑囚徒困境 给定如图2.3.1的标准式 – 纳什均衡为(L1 , L2) – 同时行动博弈
头垄断模型 鲁宾斯坦 (1982) 讨价还价 模型
Backwards Induction Outcome (BIO) 后向归纳结果
Lazear&Rosen Tournaments (1981 ) 工作 竞赛模型
Subgame Perfect Outcome (SPO) 子博弈完美结果
动态博弈主题: 可信威胁与 承诺会影响现在的行为
2009-03-16
张醒洲,大连
10
两阶段重复博弈: 阶段博弈有多个纳什均衡
参与人 2
•
L2
M2
R2
L1 1, 1 5, 0 参与人 1 M1 0, 5 4, 4
0, 0 0, 0
重复博弈 完全且非完美信息动态博弈
Unit 5
2009-03-16
张醒洲,大连
1
第3章和第4章要点
博弈类型
简单的完全且完美信息 动态博弈
2人两阶段重复博弈 (“同时行动” 意味着 “不完美信息”)
下一次博弈开始前的所 有博弈的结果都能被观 察到的重复博弈
2009-03-16
举例
解的概念
Stackelberg (1934) 双寡
2009-03-16
张醒洲,大连
3
重复博弈
• 要点
– 在(参与者)重复关系中,关于将来行动的威胁或承诺能否影响 到当前的行动。
• 直观
– 大部分直观的结论是由两阶段的例子给出的 – 一些观点需要讨论无限次的情况
• 子博弈完美纳什均衡 – 我们还将定义重复博弈中子博弈完美纳什均衡的概念
• 这一定义在重复博弈的条件下表述比较容易理解,而在2.4.B. 节分析一般完全信息动态博弈中则要复杂一些;
段的交互行动如图2.3.2所示; • 这个一次性博弈有唯一的纳什均衡
(L1 ,L2) 。
参与人 1 L1 R1
参与人 2
L2 2, 2
R2 6, 1
1, 6
5, 5
图 2.3.2
• 两阶段囚徒困境唯一的子博弈完美结果就是第一阶段的 (L1,L2) 和第二阶段的 (L1,L2)。
• 在子博弈完美结果中,任意阶段都不能达成相互合作 (R1,R2)。
扩展式
Nash Equilibrium (NE) Nash均衡
Subgame-perfect Nash equilibrium (SPNE) 子博弈完美Nash均衡
credibility threats or promise (self-enforcement) 可信性威胁或承诺
一个完全信息动态博弈可能会有很多个纳什均衡,但 是有些均衡包含了不可置信的威胁和承诺。子博弈完 美纳什均衡就是通过了可信任检测的均衡。
Subgameperfect Nash equilibrium 子博弈完美NE
张醒洲,大连
2
第3章和第4章要点
表述
解的概念
Central Issue 中心问题 Theme 主题思想
完全信息动态博弈
Normal-form / Strategic- Extensive-form
form 标准式/策略式
ui(a1,a2,a1*'(a1,a2 ),a*2'(a1,a2 )) =ui(a1,a2 ,a1*' ,a*2' ) =ui(a1,a2 )+ui(a1*' ,a*2' )
2009-03-16
张醒洲,大连
8
两阶段囚徒困境
• 第二阶段博弈的结果为纳什均衡 (L1 , L2) ,两人收益为(1, 1);参与 人在两阶段囚徒困境博弈中第一阶