完全信息动态博弈(子博弈完美的纳什均衡)
子博弈精炼纳什均衡的基本概念
子博弈精炼纳什均衡的基本概念在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行为,来获得有关先行动者的信息,从而证实或修正自己对先行动者的判断。
完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息。
在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。
而在不完全信息动态博弈中,问题变得更加简单。
博弈开始时,某一参与人既不知道其他参与人的真实类型,也不知道其他参与人所属类型的分布概率。
他只是对这一概率分布有自己的主观判断,即有自己的信念。
博弈开始后,该参与人将根据他所观察到的其他参与人的行为,来修正自己的信念。
并根据这种不断变化的信念,作出自己的战略选择。
动态博弈行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择,因此,为了做最优的行动选择,每个参与人都必须这样思考问题:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?如下棋。
[1]子博弈精炼纳什均衡包含两层含义:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。
子博弈精炼纳什均衡就是要剔除那些只在特定情况下是合理的,而在其他情况下并不合理的行动规则在动态博弈中,参与人的行动有先后顺序,后行动的参与人在自己行动之前就可以观察到先行动者(参与人)的行为,并在此基础上选择相应的策略。
而且,由于先行动者拥有后行动者可能选择策略的完全信息,因而先行动者在选择自己的策略时,就可以预先考虑自己的选择对后行动者选择的影响,并采取相应的对策。
子博弈是指在动态博弈中,所有参与人先后都采取了一次行动后所构成的一组新的博弈,这组博弈中的每一个都称为“子博弈”。
当只当参与人的战略在其子博弈的系列(第二代、第三代…)中,每一个子博弈都构成纳什均衡,就构成了子博弈精练纳什均衡子博弈子博弈(Subgame)[编辑]什么是子博弈子博弈是指在动态博弈中,所有参与人先后都采取了一次行动后所构成的一组新的博弈,这组博弈中的每一个都称为“子博弈”。
经济博弈论_谢识予_2_完全信息动态博弈0.1
单结信息集:只包含一个决策结的信息集 完美(Perfect)信息:博弈树的所有信息都是单结的。 ——博弈中没有任何参与人同时行动,且后行动者能观察到先 行动者的行动,且所有参与人观察到N的行动)
1 动态博弈的扩展式表述
静态博弈用扩展式表述 A
坦白 抵赖 坦白
Q:何为完 全信息? B
抵赖
囚 徒 困 境 博 弈
-3,-3 -4,-3
-3,-3 0,0
1,-2 -4,-3 割耳
1,-2 0,0 (-3,-3) (1,-2) 默认 割耳 (-4,-3) (0,0)
三个NE: (不画,{割耳,默认}) (画,{默认,割耳}) (画,{默认,默认})
画 小孩 不画
父亲
父亲
默认
4 NE的缺陷——不可置信的威胁
换句话说,与抽烟有关决策不是单人在中性环境中 的决定,而是一种博弈。“今日卡门”和不同偏好的卡 门自己,即“未来卡门”间的博弈。
5 逆向归纳法
继续抽 未来的 卡门 不抽 今天的卡门
-1,1
1,-1
0,0 两个“卡门”如何行事? 未来卡门如何行事? 考虑到未来卡门的未来行动,今日卡门今日如何行事?
2 动态博弈中的策略
博弈树中参与人在结点上所选择的单个行动—— 一步/招 (move)
美中军事博弈
但是,参与人可以制定一个行动计划,将每个决策结上 的选择都事先规定好,即使这个决策点实际上不会出 美国 现。——策略
中国 中国
策略: 人不犯我、我不犯人; 人若犯我、我必犯人
不犯人
(-2,-2) (2,-4) (3,-5) (0,0)
4 NE的缺陷——不可置信的威胁
尼克尔森考研重难点分析 出题题型 思路
尼克尔森微观经济学考研难点解析博弈定价模型博弈论要求掌握均衡观念,不同博弈类型对应的均衡观念。
在中级阶段我们掌握的均衡观念有两个纳什均衡和子博弈完美纳什均衡,这些都是在完全信息下的均衡观念,前者是完全信息静态的均衡观念,后者是完全信息动态的均衡观念。
另一类要求掌握的博弈是重复博弈。
尼克尔森书上比较乱,我们稍加整理一下使得更加系统化。
1.基本概念(1)博弈三要素参与人:谁与谁互为博弈对手策略:每个参与人在不同情况下的可选行动支付:博弈结果给予每个参与人的报酬。
比如著名的囚徒困境参与人B参与人A坦白抵赖坦白-3,-30,-6抵赖-6,0-1,-1在这个博弈中:参与人是:A,B;策略:坦白,抵赖;支付(-3,-3)(0,-6)(-6,0)(-1,-1)(2)NE(纳什均衡)NE:每个参与者都选择了给定对方策略的最优策略。
在上述囚徒困境的例子中,我们可以看到(坦白,坦白)是NE。
因为,从A来看,如果B坦白,他选择坦白比选择抵赖要好,同样,如果A选择坦白,B选择坦白要比选择抵赖要好,因此NE是(坦白,坦白)。
从A来看,如果B选择抵赖,A选择坦白一定要比抵赖要好,从B 来看,A选择抵赖的话,他选择坦白要更好一些。
因此他们都不会选择抵赖。
(3)占优策略和NE如(2)所分析的那样,不管对手选择什么,坦白都是A或者B的最优选择,因此坦白就是他们的占优策略。
占优策略是指,不管对手选择什么策略,存在一个策略比任何其他策略都要好。
如果参与人都选择了占优策略,则一定是NE。
与占优策略相对应的是严格劣策略。
严格劣策略是参与人绝对不会选择的策略,因此,我们在分析博弈的时候,应该首先删除严格劣策略。
严格劣策略是指存在这样一种策略,给定对手的策略,总存在另外一个策略(包括混合策略)要好于该策略。
(3)混合策略与NE的存在性教授创办集训营、一对一保分、视频、小班北大、人大、中财、北外、中传中传教授创办。
博弈论第四章 完全且完美信息动态博弈
房地产开发博弈 精选ppt
支付
横向扩展式举例:
进入者
进入 在位者
合作(40,50) 斗争(-10,0)
不进入(0,300) 市场进入阻挠博弈树
精选ppt
扩展型
为了让“树”描绘博弈,其结点和枝需要满足三 条性质:
1.单一的出发点。重要的是知道博弈从何处开 始,所以必须有一个,也只能有一个出发点。
2. 无循环。重要的是在博弈运行中,我们不要 陷入僵局;树枝循原路折回并造成一个循环一定 是不可接受的。
3. 单方向前进。重要的是,对于博弈如何进行 下去不能模棱两可,因此,必定不存在二个或多 个枝导向同一个结。
精选ppt
为保证这三条性质,在前结点上强加下述限
制: 1.结点不能是自身的前结点。
一个纳什均衡称为精炼纳什均衡,当只当参与人 的战略在每个子博弈中都构成纳什均衡,也就是 说,组成完美纳什均衡的战略必须在每一个子博 弈中都是最优的。
一个精炼纳什均衡首先必须是一个纳什均衡,但 纳什均衡不一定是精炼纳什均衡。
承诺行动-当事人使自己的威胁战略变得可置信的 行动。
精选ppt
子博弈完美纳什均衡
精选ppt
完全且完美信息动态博弈的主要特点
(1)行动是顺序发生的, (2)下一步行动选择之前,所有以前的行动都
可以被观察到, (3)每个可能的行动组合下局中人的收益是共
同知识。
精选ppt
第三章 完全且完美信息动态博弈
一 博弈扩展式表述 二 子博弈完美纳什均衡 三、用逆向归纳法求-子博弈完美
精选ppt
扩展式表示的一个例子
精选ppt
博弈树始于 局中人1 的一个决策结点,这时1
要从L和R中作出选择,如果局中人1选择L,其后就
《经济博弈论》期末考试复习题及参考答案
经济博弈论复习题(课程代码262268)一、 名词解释混合战略纳什均衡;子博弈精炼纳什均衡:完全信息动态博弈:不完全信息动态博弈:完 全信息静态博弈:帕累托上策均衡;囚徒困境:纳什均衡:子博弈;完美信息动态博弈;颐 抖手均衡;柠檢原理:完美贝叶斯均衡二、 计算分析题1、 在市场进入模型中,市场需求函数为p=13-Q,进入者和在位者生产的边际成本都为1, 固泄成本为0,潜在进入者的进入成本为4。
博弈时序为:在位者首先决左产量水平;潜在 进入者在观察到在位者的产量水平之后决定是否进入:如果不进入,则博弈结束,如果进入, 则进入者选择产疑水平。
求解以上博弈精炼纳什均衡。
2、 考虑如下扰动的性别战略博弈,其中A 服从[0, 1]的均匀分布,Of£<l 山和匕是独 立的,匕是参与人i 的私人信息。
求出以上博弈所有纯战略贝叶斯均衡。
3、求下列信号传递模型的贝叶斯Nash 均衡(讨论分离均衡和混同均衡)(2.1)(6.2)(3.1)(4J)5、古诺IW 弈:市场反需求函数为P (Q )= a- Q,其中Q = q 】+q2为市场总产豊q :为企 业i (i = l, 2)的产量。
两个企业的总成本都为Ci (qJ = cqi 。
请您思考以下问题: 1)在完全信息静态条件下,这一博弈的纳什均衡是什么?2)假设这一阶段博弈重复无限次。
试问:在什么样的贴现条件下,证产量组合(響,響)是子博弈精炼纳什均衡的?6、考虑一卞工作申请的佔弈。
两个学生同时向两家企业申请工作,每家企业只有一个工作 岗位。
工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个 学生申请,该学生获得工作:如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。
现在假泄每家企业的工资满足:W 1/2<W :<2W 1,则问: a.写出以上博弈的战略式描述b.求出以上博弈的所有纳什均衡7、(差异价格竞争)假立两个寡头企业进行价格竞争,但产品并不完全相同,企业,的市场需求门厂)="-门+匕仏丿=1,2),两家企业的生产成本函数为 g 求两个寡头同 时选择价格时的纳什均衡。
博弈类型
fan1952在n个参与者博弈中如果每个参与者的纯策略空间s是欧氏空间上的一个非空的闭的有界的凸集收益函数是连续的且对si是拟凹的则博弈至少存在一个纯策略纳什均衡
第5章 博弈类型 章
5.1 完全信息静态博弈 完全信息静态博弈—— 纳什均衡
纳什均衡:在n个参与者博弈G={S1,…, Sn;u1,…,un}中,如果对于每一个参与者 i(i=1,2,…,n),si*是针对其他n-1个参与者所选策 略(s1*,…,si-1*,si+1*,…,sn*)的最优反应策略,即 ui(si*,…,si-1*,si+1*,…,sn*) ≥ui(s1*,…,si-1*,si+1*,sn*)_NE 对Si中所有的si都成立,则策略组合 s*=(s1*,…,si*,…,sn*)称为该博弈的一个纳什均衡。
纳什均衡的存在性定理II (Nubreu,1952;Glicksberg,1952;Fan,1952)
在n个参与者博弈中,如果每个参与者的纯策略 空间Si是欧氏空间上的一个非空的、闭的、有界 的凸集,收益函数是连续的且对si是拟凹的,则 博弈至少存在一个纯策略纳什均衡。
纳什均衡的存在性定理III(Glicksherg,1952)
每一个严格占优策略均衡一定是纳什均衡 每一个逐步剔除严格劣策略均衡一定是纳什 均衡 若一个策略组合是纳什均衡,则它一定不会 被逐步剔除严格劣策略所剔除。 纳什均衡是一个比逐步剔除严格劣策略均衡 条件更强的解
纳什均衡的存在性定理I(Nash,1950)
在n个参与者的博弈中,若每个参与者的策略空 间中纯策略是有限的,则博弈至少存在一个纳什 均衡。
划线法:选一个博弈参与者,找出其每一策略 的最优收益,下收益下划线;再选另一个参与 者,划出其每个策略的最优收益;…,每一收益 都有下划线的策略组合即为纳什均衡。 参与者2 例:
完全信息动态博弈
5、完美回忆
完美回忆是指没有参与人会忘记自己以 前知道的事情,并且所有参与人都知道 自己以前的选择。 通常,我们假定博弈满足“完美回忆” 的要求。
参与人不满足完美回忆要求
1 U D 1
2
L R L R 1
U 2 L
1
D
R
L
R
1
A
参与人不满足完美回忆要求
N 1 U 2 L R 1 B L 1 D U 1 U 2 R L 1 2 R N 1 D U D 2
参与人集合:i=1,2,…,n。此外, 用N代表虚拟参与人——自然。 行动顺序:i(x) 参与人的行动空间:Ai(x) 参与人的信息集:hi(x) 支和路径 参与人的支付函数: 外生事件的概率分布:
二、标准式博弈与扩展式博弈
1、纯策略与混合策略 2、扩展型博弈与标准式博弈的转换 3、一个二阶段博弈的例子 4、博弈树求解--逆向归纳法
一个扩展式博弈的纯策略
L (3,2) (1,1) (0,2) (4,5) R L R
U
○ A D
B
这是一扩展型博弈,参与人A有1个信息集,两 种行动选择;参与人B有两个信息集(参与人A 选择U或D),每个信息集各有两种行动选择L 和R,相应地有四个纯策略LL、LR、RL和RR。
(2)纯策略
令Hi为第i个参与人的信息集的集合,Ai=hiHiA(hi)为 其行动集合,A(hi)为在信息集hi的行动集合。 参与人i的一个纯策略是从信息集Hi 到行动集合Ai 的一 个映射si:HiAi,对所有的hiHi,满足si(hi)A(hi)。 参与人i的纯策略空间Si就是所有纯策略的集合:
si * arg maxui ( si , s i *)
si Si
第二章完全信息动态博弈篇章
i (q1, q2 ) qi ( P(Q) c),i 1,2
斯坦克尔伯的寡头竞争模型
用逆向归纳法求解,首先考虑给定q1的情况下,企业2 的最优选择。企业2的问题是:
Max 2 (q1 , q2 ) q2 (a q1 q2 c)
最优化一阶条件意味着:
轮流出价的讨价还价模型
一般来说,如果 0 i 1, i 1, 2均衡结果不 仅依赖于贴现因子的相对比率,而且依赖于博 弈时间长度T和谁在最后阶段出价。然而这种 依存关系随T的变大而变小;当T趋于无穷大时 ,我们得到“先动优势”:即如果 1 2 唯 一的均衡是 x 1 (1 ). 定理(Rubinstein 1982):在无限期轮流出价 博弈中,唯一的子博弈精炼纳什均衡结果是: 1 2 1 * * x (if 1 2 x ) 1 1 2 1
典型的旅行者困境收益矩阵 (仅考虑整数)
100 100 99 98 97 96 95 …… 5 4 3 2
100,100 101,97 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
99
97,101 99,99 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
•
一 博弈扩展式表述
二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 四 应用举例 斯坦克尔伯的寡头竞争模型
•
• •
轮流出价的讨价还价模型
囚徒的救赎 旅行者困境 五 重复博弈
轮流出价的讨价还价模型(1)
03 完全信息动态博弈
开发
A
N
大(1/2) 小(1/2) 大(1/2)
N
小(1/2)
hB B
开发 不开发 开发
B
B
不开发 开发
B hB
不开发
′
不开发 开发
(4,4)
(8,0) (-3,-3) (1,0) (0,8)
(0,0) (0,1)
(0,0)
3、B知道自然的选择,但不知道A的选择, 博弈树如下:
开发
A
不开发
N
大 小 大
参 与 人2
1
T B 2
R
L (4,0) (1,0)
R (3,1)
参 与 人1
T
L 2,2
R 4,0
B 1,0
3,1
例
动态博弈: L (2,2) 2
1 T B 2 R L R (3,1)
(4,0) (1,0)
参与人2的完整策略有四个 1. 2. 3. 4. 不论对方如何,我都选L (L L) 不论对方如何,我都选R (R R) 对方选T,我选L,对方选B,我选R (L R) 对方选T,我选R,对方选B,我选L (R L)
1、房 地 产 开 发 博 弈
A 开发 不开发
N 需求大 需求小 需求大
N 需求小
B
开发 不开发 开发
B
B
不开发 开发 不开发 开发
B
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8) (0,0) (0,1)
(0,0)
单 位:百万元
2、如果B在决策时并不知道自然的选择,则 hA
不开发
一 动态博弈的表示——博弈树 (extensive form representation)
11-完全信息动态博弈(子博弈完美的纳什均衡)
威胁 ---- 事后:B威胁,若A选下,自己选左
• A相信
• A不信
(U,L) (2,9) (D,R) (3,1)
问题:可信性 Credibility
承诺和威胁都是不可信的!
思考:
如何能使承诺和威胁变得可信?
增加撤销承诺或威胁所要受到的损失 让对方知道 “破釜沉舟” & “穷寇莫追”
B
(L,L) U 2, 9 1, 0 (L,R) 2, 9 3, 1 (R,R) 2, 1 3, 1 (R,L) 2, 1 1, 0
A
D
例:动态游戏 - 博弈树
假设:A 先行动,B 后行动
L U
( 2, 9 )
( 2, 1 )
B1
R
A
D
B2
L R
( 1, 0 )
( 3, 1 )
博弈树
game tree
完全信息动态博弈
Subgame Perfect Nash Equilibrium
完全信息动态博弈
序贯博弈问题
动态博弈经典模型 重复博弈与合作问题
§3.1 序贯博弈问题
Sequential Games
强盗分金
答案是:
1号强盗分给 3号1枚金币, 五个强盗抢得100 枚金币,他们决定:
dbackwardbackwardinductioninduction3311均衡路径均衡路径equilibriumpathequilibriumpathspnespne子博弈精炼纳什均衡子博弈精炼纳什均衡seltenselten19651965subgameperfectnashequilibriumsubgameperfectnashequilibrium泽尔腾19651965年发表年发表需求减少条件下寡需求减少条件下寡头垄断模型的对策论描述头垄断模型的对策论描述一文提出了一文提出了子博弈精炼纳什均衡子博弈精炼纳什均衡的概念又称的概念又称子子对策完美纳什均衡对策完美纳什均衡reinhardseltenreinhardselten19301930reinhardseltenreinhardselten子博弈精子博弈精炼纳什均均衡的创立者
博弈论(完全信息动态博弈)
In
Incumbent A 2, 1 F 0, 0
1, 2
Accommodate is the Nash equilibrium in this subgame.
2.3、确定子博弈纳 什均衡的方法:逆向 归纳(backward induction)
1
A
2 DD
A
2,2, …,2
D
1,1, …,1
1/2,1/2, …,1/2
1/I,1/I, …,1/I
定义:如果某一策略组合在该展开形 的每一个子博弈上的所形成的策略组 合都构成了一个纳什均衡,则该策略 组合构成展开形博弈的子博弈精炼纳 什均衡。 由于任何博弈都是它自身的子博弈, 因此,SPNE一定是NE。 子博弈完美是对构成NE的策略组合施 加了更为严格的要求,所以,一个具 有真子博弈的展开形博弈的NE未必是 SPNE。
(-100,100) (-1100,-100)
3.2 对于博弈阶段次数的依赖
阶段越多,逆向归纳越难依靠。
1 D 1,0 A 2 A 1 D 3,0 2,4 A 1 D A I D 6,3 A
5,5
D
0,1
3、对于SPNE和逆向归纳法的批评
3.1、对于人数的依赖
参与人越多,逆向归纳越难以成立。
博弈的颤抖手均衡Trembling hand E.
(p101)
(出,上)是 THE
1-e
上
1-e
e
e
下 1,1
出
1,1
进
1,4
0,2
Entry game
两个NE
( In, Accommodate ) 是一个SPNE. ( Out, Fight ) 则不是一个SPNE,因为他在由节 点Incumbent开始的子博弈 上没有导出一个纳什 均衡。
经典:博弈论-完全信息动态博弈
2、博弈的扩展式表述的要素
博弈的扩展式表述包含以下要素: (1) 参与人集合:i=1,2,…,n。此外,用N代表虚拟
参与人——自然。 (2) 行动顺序:谁在什么时候行动。 (3) 参与人的行动空间: (4) 参与人的信息集: (5) 参与人的策略集: (6) 参与人的支付函数: (7)外生事件的概率分布。
博弈的收益矩阵
(1)高需求
开发 开发商A 不开发
(2)低需求
开发 开发商A 不开发
开发商B
开发
不开发
2, 2
4, 0
0, 4
0, 0
开发商B
开发
不开发
-1, -1
1, 0
0, 1
0, 0
博弈分类
按开发商博弈的先后顺序分: 静态博弈:两个开发商同时决策,或后决策者不
能观察到先行动者的行动。 动态博弈:博弈有先后顺序,且后决策者能观察
完全信息动态博弈图示:N A B
开发 (2,2)
高需求
○
A
N
低需求
开发 不开发 开发 不开发
不开发 (4,0)
开发 (0,4) B 不开发 (0,0)
开发 (-1,-1) 不开发 (1,0)
开发 (0,1) 不开发 (0,0)
(4)不完全信息动态情形:ANB
开发商A不清楚市场的需求状态,决定是否开发; 开发商B 在观察到市场需求和A的决策后决定是否开发。
到先行动者的行动后再行动。 按开发商是否知道市场需求状态分:
完全信息博弈:若两个开发商都知道市场需求状 态(高需求或低需求)。
不完全信息博弈:由自然决定市场的需求状态, 两开发商不知道。 共同知识:在市场各种可能状态和各开发商不同策 略组合下的得益矩阵是双方的共同知识。
完全信息动态博弈
一般来说,由于后行动的博弈方有更多的信息帮助自己选择 行动,可减少决策的盲目性,因此处于较有利的地位。不过, 后行动和具有较多信息并不总是有利的。
乙
左
中
右
上 4,12 3,10 2,12 甲 下 3,12 2,10 1,11
注意:当博弈方按上述子博弈精炼纳什均衡策略组合行动时, 实际上不会进行到博弈的第二、三阶段,两博弈方在第二、 三阶段的行为实际上不会发生。但作为完整策略的表达,在 描述子博弈精炼纳什均衡的策略选择时,必须将其给出。
例 市场进入博弈
进入者
进
● 不进
默许
x ● 在位者
x ' ● 在位者
打击 默许
打击
●
●
●
(0,0) (-1,-1) (1,2)
男方策略是两个:足球,芭蕾。女方是在知道男方决策后才 行动的,其策略可以归纳为四个:追随策略(他选什么我就 选什么)、对抗策略(他选什么我偏不选什么)、芭蕾策略 (无论他选什么我都选芭蕾)、足球策略(无论他选什么我 都选他喜欢的足球)。
动态博弈的非对称性
静态博弈下,各参与人同时选择,既无法知道别人的选择, 也无暇对此作出反应。但动态博弈中,后行动者会根据先行 动者的选择来调整自己的选择,而先行动者也会预期到这一 点,所以会考虑自己的选择对其他参与人有什么影响,从而 调整自己的策略。
纳什均衡不能排除不可信的威胁(或承诺),因此在分析动 态博弈时不能往往不能做出可靠的判断。
不打
(1,0)
(0,4)
当博弈进行到第三阶段即甲选择“不分”时,乙的合理选择 是“打”官司,这一威胁是可信的;则甲在第二阶段的合理 选择是“分”,这一许诺是可信的;乙在第一阶段选择“借” 是合理的。因此,乙的完整策略是“第一阶段选择‘借’ ,
第三讲完全信息动态博弈
在这里,B选择的策略称为“冷酷策略” (grim strategies)。冷酷策略是指重复 博弈中的任何参与人的一次性不合作将引 起其他参与人的永远不合作,从而导致所 有参与人的收益减少。因此,所有参与人 具有维持合作的积极性。我们再来讨论博 弈重复次数为有限时的情况。
第16页,本讲稿共23页
第1页,本讲稿共23页
一、子博弈精炼纳什均衡
子博弈精炼纳什均衡的创立者. ——1994年诺贝尔经济 学奖获奖者、莱茵哈德·泽尔腾。
泽尔腾则在60年代中期将纳什均衡概念引入动态 分析。在1965年发表《需求减少条件下寡头垄断模型 的对策论描述》一文,提出了“子博弈精炼纳什均衡” 的概念,又称“子对策完美纳什均衡”。这一研究对纳 什均衡进行了第一次改进,选择了更具说服力的均衡点。 海萨尼在60年代末把不完全信息引入博弈分析。
第9页,本讲稿共23页
以上的分析,就是子博弈精炼纳什均衡解的过程。 策略(A开发,B不开发)就是上述子博弈精炼纳 什均衡解。 ▪ 所谓“子博弈”(sub-game)是指它本身可以作为一 个独立的博弈进行分析,它是原博弈的一部分。例如 ,在表3-1中,每一行或每一列都是整个博弈的一个 子博弈。而且,任何博弈本身可被称为自身的一个子 博弈。 ▪ 只有当某一策略组合在每一个子博弈(包括原博弈 )上都构成一个纳什均衡,这一策略组合才是子博 弈精炼纳什均衡解。显然,如果整个博弈是惟一的 子博弈,纳什均衡与子博弈精炼纳什均衡是完全相 同的。
第18页,本讲稿共23页
三、动态博弈策略行动
在动态博弈中,由于参与人的行动有先后 顺序,而参与人行动顺序直接影响博弈的 结果。因此,参与人为了使其他参与人的 选择对自己有利,往往会主动采取一些行 动影响其他参与人对自己行为的预期,从 而达到对自己有利的结果。参与人所采取 的这些行为称之为“策略行”(strategic move)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对抗
强硬
甲
丙
不行动(-2,1,-1)
不对抗
(-1,1,0)
.
例:
2 L
1 R
(200,200) M
S (a,b)
N 1
T
(50,300)
(300,0)
➢ 若 a=100,b=150,SPNE是什么? ➢ 若改变a b的数值,能否使L-N-T成为SPNE? ➢ 什么情况下,2会获得300或更高的支付?
Stage1: 哥哥的方案若能使弟弟获得至少一半冰欺凌,则方案通过;
若不能使弟弟获得至少一半冰欺凌,则弟弟不会接受,而哥哥最 终将一无所获。
均衡路径: 哥哥提出方案为1/2:1/2, 弟弟接受
.
例:要挟诉讼
(要求赔偿S) 指控
B
拒绝
起诉
A
放弃
威胁不可 信
(TX-P-C, -TX-D)
( -C , 0 )
A
不指控
接受
( 0 ,0 ) ( S-C, -S )
若 TX<P 则 A将选择放弃
SPNE:A不指控
.
例:要挟诉讼
威胁可信
拒绝
(要求赔偿S) 指控
B
A
不指控
接受
( 0 ,0 )
起诉
A
(TX-P-C, -TX-D)
放弃
( -P- C , 0 )
(S-P-C,-S)
.
例:要挟诉讼
如果原告将P提前支付,TX-C-P>-C-P, 只要胜诉的可能大于0,原告将起诉。 如果S<TX+D, 被告将接受原告的赔偿请求。 如果TX >P+C , 原告会指控。
.
例:是否请律师?
• 某人在打一场官司,不请律师肯定会输,请律师后的结 果与律师的努力程度有关。
• 假设律师努力工作(100小时)时有50%的概率能赢,
不努力工作(10小时)只有15%的概率能赢。
• 如果诉讼获胜可得到250万元的赔偿,失败则没有赔偿。 • 委托方与律师约定根据结果向律师付费,赢官司律师可 得赔偿金的10%,失败则不付费。 • 如果律师的效用函数为m-0.05e,m为报酬,e为付出时间, 律师的机会成本为5万元。
完全信息动态博弈
完全信息动态博弈 ➢ 序贯博弈 Sequential Games ➢ 重复博弈 Repeated Games
逆推方法 Backward induction 博弈的扩展式 —— 博弈树 game tree 子博弈精炼的纳什均衡 SPNE
.
子博弈
子博弈 subgame
➢ 给定“历史”,每一个行动选择开始至博弈结束 构成了一个博弈,称为“子博弈”。
.
(200,200) M
2
S (a,b)
L
N
1
1
T
(50,300)
R (300 , 0)
✓ L-N-T不可能是 SPNE ✓ 2不可能通过 L-N-T 获得300 ✓ 唯一能够获得300或更多支付的可能是L-N-S ✓ 必须满足 a > 300, b≥ 300
.
例:分冰欺凌博弈
• 两个兄弟分一个冰欺凌。 • 哥哥先提出一个分割比例,弟弟 接受则按哥哥的提议分割,若拒 绝则自己再提出一个比例。但此 时冰欺凌已化掉一半。
.
1:委托人
2:律师
赢 0.5
0
努力
(225,20)
委托
1
不委托
接受 2
输 0.5 (0,-5)
2
不努力 0 赢 0.15
(225,24.5)
不接受
输
(0,5)
(0,5)
➢ 扩展式博弈的子博弈G是由一个单结信息集x开始 的与所有该决策结的后续结(包括终点结)组成的, 能自成一个博弈。
.
子博弈 Sub-game
原博弈中的一部分(次级博弈)
L
B1
U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
.
不是子博弈
L
B1
U R
A
D
L
B2
R
.
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
• 弟弟的提议,哥哥接受则按弟弟的提议分割,若拒绝冰欺 凌将全部化掉。 • 假设接受和拒绝利益相同时,两个人都会接受。 • 兄弟俩会怎样分割冰欺凌?
.
出 S1 哥
设:哥哥的方案是 S1:1- S1 弟弟的方案是 S2:1- S2
不接受 出S2 弟
不接受 哥
(0,0)
接受 (½S2, ½(1-S2) )
不是子博弈
A
B
A
A
B
.
子博弈精炼纳什均衡 SPNE
子博弈精炼纳什均衡 SPNE
扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* ) 是一个子博弈精炼纳什均衡, 如果: ➢ 它是原博弈的纳什均衡; ➢ 它在每一个子博弈上也都构成纳什均衡。
.
例:四阶段博弈
e
(4, 3)
c
1
2
a
h
➢ 什么情况会使甲方选择对抗,乙方选择强硬,丙方 选择行动?
.
什么情况下会使甲方选择对抗,乙方选择软弱?
威胁可信
软弱 (1,-1,1)
乙
行动 (0,-2,-20)
对抗
强硬
甲
丙
不行动(-2,1,-1)
不对抗
(-1,1,0)
.
什么情况下会使甲方选择对抗,乙方选择强硬,丙方
选择行动?
软弱 (1,--31,1)
.
(200,200) M
2
S (100,150)
L
N
1
1
(50,300)
T
R (300,0)
.
(200,200) M
2
S
L
N
1
1
T
R
若 SPNE 为 L-N-T
(300,0)
➢ stage 3: a<50
➢ stage 2: OK!
➢ stage 1: 50>300 不可能!
(a,b) (50,300)
(3, 6)
f
2
1
d
g
b
( 5 ,3 ) ( 2 , 4 )
(8, 5)
思考:找出全部子博弈 可信性问题 SPNE
.
子博弈
e
(4, 3)
1
c
2
a f
(3, 6)
h
2
1
d
g
(2 , 4)
b ( 5 ,3 )
(8, 5)
.
可信性问题
不可信
不可信
e
(4, 3)
1 不可信
c
(3, 6)
2
h
a f
2
1
d
g
(2 , 4)
b ( 5 ,3 )
(8, 5)
不可信
.
例:
甲方 是某国的一股企图对抗中央的地方势力 乙方 是该国中央政府 丙方 是支持甲方的某国际势力
.
威胁不
软弱 (1,-1,1)
可信
乙
行动 (0,-2,-2)
对抗
强硬
甲
丙
不行动(-2,1,-1)
不对抗
( -1,1,0)
➢ 什么情况会使甲方选择对抗,乙方选择软弱?
接受
(S1, (1-S1) )
.
出 S1 哥
不接受 出S2 弟
不接受 哥
(0,0)
接受 (½S2, ½(1-S2) )
接受
(S1 , (1-S1) )
Stage3 : 哥哥接受的条件为½S2≥0 ,哥哥会接受弟弟的任何方案
Stage2: 弟弟知道哥哥会同意自己的方案,弟弟能获得的最多的冰 欺凌是1/2