第三章完全信息动态博弈(博弈论,张醒洲)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由上式可得 已知 q1< a - c.
2009-03-09 张醒洲 大连理工 15
斯塔克尔贝里双寡头垄断模型
• 共同知识
由于企业1也能像企业2一样解出企业2的最优反应,企业1就可以 预测出如果他选择q1 ,企业2将会选择产量R2(q1)。那么,在博弈的 第一阶段,企业1的问题可ห้องสมุดไป่ตู้示为
由上式可得
这就是斯塔克尔贝里双寡头垄断博弈的后向归纳结果。
• 为解决简单类型的CPI, 应用后向归纳法求解的过程如下:
2009-03-09
张醒洲 大连理工
5
理论:后向归纳法(续)
• 第1步 : 分析第二阶段博弈
– 参与人2的问题: 对参与人1的行动a1 选择最优的反应R2(a1), 参与人2 面 临的最优化问题是:
m a x u ( a , a ) ,f o r a n o b s e r v e d a A 212 1 1
m a xu (a ,Ra ( 1) ) 1 1
a A 1 1
–即
a a r g m a x uaR (1 , ( a ) ) 1 1 1 a A 1 1
2009-03-09
张醒洲 大连理工
7
理论:后向归纳法(续)
• 定义. 简单的完全且完美信息博弈的后向归纳结果是 (a1*, R2(a1*)。 • 注意到后向归纳结果不包括不可置信的威胁 – 参与人1预测到参与人2是理性的,也就是2会对1可能 选择的A1中的任何行动a1 作出最优反应R2(a1) ; – 并且,参与人1认为参与人2不会选择不符合自身利益 的行动。 – 下面看一个例子
2009-03-09
张醒洲 大连理工
8
后向归纳法内在的理性假定
• 一个两个人的三阶段博弈
1.参与人1选择L或R,其中L使博 弈结束,参与人1的收益为2,参与 人2的收益为0; 2. 参与人2观测参与人1的选择。 如果1选择R,则2选择选择L’ 或 R’,其中 L’ 使博弈结束,两人的 收益均为1; 3. 参与人1观察2的选择(并且回 忆自己在第一阶段的选择),如果 前两阶段的选择分别是R 和 R’ ,则 1可选择L’’ 或R’’,每一选择都将结 束博弈,选择L’’ 是参与人1的收益 为3,参与人2的收益为0;选择R’’ 时,1的收益是0,2的收益是2。
• 两人博弈类型
1. 参与人1从可行集A1中选择一个行动a1 ; 2. 参与者2观察到a1并从可行集A2中选择行动a2 ; 3. 两人的收益分别为u1 (a1, a2) 和 u2 (a1, a2)。 Ex. 斯塔克尔贝里 (1934) 双寡头垄断模型 Tool 后向归纳法 Anticipation 后向归纳结果
{提议 (δs, 1- δs), 提议 (s2,1-s2) ,这里 s2<δs}
阶段2
提议(s2, 1-s2)
阶段 3
P2
接受
P1
(s2,1-s2)
拒绝
A (s,1-s)
解:
对参与人2,如果他提议分配s2<δs 给参与人1, 则δ(1-s) <1-δs。 因此参与人2的最优选择是 提议 (δs, 1-δs)
张醒洲 大连理工
第3章概要
完全信息动态博弈
Representation 表述
Normal-form / Strategicform 标准式/策略式
Extensive-form 扩展式
Subgame-perfect Nash equilibrium (SPNE) 子博弈完美Nash均衡
Solution concepts Nash Equilibrium (NE) 解的概念 Nash均衡 Central Issue 中心问题 Theme 主题思想
阶段 3
P1
接受
P2
(s1,1-s1)
拒绝
P2
接受
P1
(s2,1-s2)
A (s,1-s)
2009-03-09
张醒洲 大连理工
24
2009-03-09 张醒洲 大连理工 16
双寡头垄断博弈:静态 vs. 动态
模型 古诺 斯塔克尔贝 里 每个企业的均衡产 量 (a-c)/3, (a-c)/3 (a-c)/2,(a-c)/4 总产量 2(a-c)/3 3(a-c)/4 市场出清价格 (a+2c)/3 (a+3c)/4
• 古诺模型和斯塔克尔贝里模型的区别:q1是共同知识 ( 能被企业2观 察到 ) • 要点 – 企业1知道企业2知道q1损害了企业2。
提议 (s1, 1-s1)
P1
接受
P2
(s1,1-s1)
拒绝
(δs, 1-δs)
2009-03-09
张醒洲 大连理工
23
鲁宾斯坦谈判模型
• 在第3阶段如何确定s? • 鲁宾斯坦说,均衡收益是 (1/(1+δ), δ/(1+δ) )。
阶段 1
提议 (s1, 1-s1)
阶段 2
提议 (s2, 1-s2) 拒绝
1/4 1/3
1/2
2009-03-09
张醒洲 大连理工
17
序惯谈判
• 一个三阶段谈判模型 • 鲁宾斯坦 (1982)模型
2009-03-09
张醒洲 大连理工
18
一个三阶段谈判模型
参与人1和2就一美元的分配进行谈判。他们轮流提出 方案: 首先参与人1提出一个分配方案,参与人2可以接受 或拒绝;如果参与人2拒绝,就由参与人2提出分配建议, 参与人1选择接受或拒绝;如此进行下去。 一个条件一旦被拒绝,它就不再有任何约束力,并与 博弈下面的进程不再相关。每一个条件都代表一个阶段, 参与人都没有足够的耐心:他们对后面阶段得到的收益进 行贴现,每一阶段的贴现因子为δ,这里0 <δ< 1。
2009-03-09 张醒洲 大连理工 9
后向归纳法内在的理性假定:
一个两个人的三阶段博弈
计算后向归纳结果
• 第1步 参与人1会在博 弈的第三阶段选择L”
2009-03-09
张醒洲 大连理工
10
后向归纳法内在的理性假定:
一个两个人的三阶段博弈
• 第2步 参与人2在第二 阶段选择L’。
2009-03-09
斯塔克尔贝里双寡头垄断模型
• 斯塔克尔贝里(1934) 提出一个双头垄断的动态模型,其 中一个支配企业(领导者)首先行动,然后从属企业 (追随者)行动。 • 博弈的时间顺序如下:
(1) 企业1选择产量q1≥0; (2) 企业2观察到q1 ,然后选择产量q2 ≥ 0; (3) 企业i 的利润函数如下:
2
讨价还价模型(1982)
2人两阶段重复博弈 (“同 Lazear&Rosen 时行动” 意味着 “不完 Tournaments (1981 ) 工作 美信息”) 竞赛模型 下一次博弈开始前的所 有博弈的结果都能被观 察到的重复博弈 动态博弈主题: 可信威胁与 承诺会影响现在的行为
2009-03-09
i i j i
( q , q ) q [ P ( Qc ) ]
其中P(Q) = a − Q ,是市场上的总产品Q = q1 +q2 时的出清价格, c 是生产的边际成本,为一常数(固定成本为0)。
张醒洲 大连理工
2009-03-09
14
斯塔克尔贝里双寡头垄断模型
求解后向归纳结果
• 第1步 计算企业2对企业1任意产量的最优反应, R2(a1) 应满足
credibility threats or promise (self-enforcement) 可信性威胁或承诺
一个完全信息动态博弈可能会有很多个纳什均衡, 但是有些均衡包含了不可置信的威胁和承诺。子博 弈完美纳什均衡就是通过了可信任检测的均衡。
2009-03-09
张醒洲 大连理工
3
简单类型的完全且完美信息博弈
a A 2 2
–即
R ()a a r g m a x u (, a a ) , aA 2 1 2 1 2 1 1
a A 2 2
2009-03-09
张醒洲 大连理工
6
理论:后向归纳法(续)
• 请注意这个问题对两个参与人来说是一个共同知识。 因此参与人1可以预测到参与人2对他的行动a1所做出的 反应R2(a1)。 • 第2步: 分析第一阶段 – 参与人1的问题: 对参与人2的最优反应R2(a1) ,选择 最优的行动a1:
张醒洲 大连理工
11
后向归纳法内在的理性假定:
一个两个人的三阶段博弈
• 第3步 参与人1在第 一阶段作出最优反应 选择L 后向归纳结果是 (L, nothing, nothing)
2009-03-09
张醒洲 大连理工
12
后向归纳法内在的理性假定:
一个两个人的三阶段博弈
理性和预测 P1 是理性的, P2 是理性的。 (L,N,N); (2,0) P1是非理性的, P2是理性的。 (R,R’,R”); (0,2)
2009-03-09 张醒洲 大连理工 20
一个三阶段谈判模型
阶段 1
提议(s1, 1-s1)
阶段 2
提议 (s2, 1-s2)
阶段3
P1
接受
P2
(s1,1-s1)
拒绝
P2
接受
P1
(s2,1-s2)
拒绝
A (s,1-s)
2009-03-09
张醒洲 大连理工
21
一个三阶段谈判模型
后向归纳法步骤 • 第1步 参与者2的战略空间
P1是理性的, P2是非理性的。 (R,R’,L”); (3,0)
P1是非理性的, P2是非理性的。 (R’,L’,N); (1,1)
• 为什么?? • 思考:P1 认为别人以为他是疯子, P2自聪明以为P1是 疯子, 但是P1真的不是疯子。 结果是什么?
2009-03-09 张醒洲 大连理工 13
2009-03-09 张醒洲 大连理工 19
一个三阶段谈判模型: 时间顺序
(1a) 在第一阶段开始时,参与人1建议他分走1美元的s1,留给参与人2的份额是1 − s1 ; (1b) 参与人 2接受或不接受这一条件(这种情况下,博弈结束,参与人1的收益为 s1 ,参与人2的收益为1 − s1 ),或者拒绝这一条件(在这种情况下,博弈将继续 进行,进入第二阶段); (2a) 在第二阶段的开始,参与人2提议参与人1分得1美元的s2 ,留给参与人2的 份额是 1 − s2 (请注意在阶段t,st 总是表示分给参与人1的,而不论是谁先提出的 条件); (2b) 参与人1 或者接受条件(这种情况下,博弈结束,参与人1的收益s2和参与 人2的收益 1 − s2 都可立即拿到),或者拒绝这一条件(在这种情况下,博弈将 继续进行,进入第三阶段); (3) 一旦进入第三阶段,参与人1得到美元的s,参与人2得到1-s,这里0 < s < 1 。
张醒洲 大连理工
2009-03-09
22
一个三阶段谈判模型
第2步:分析第1阶段
参与人1的战略空间为 {提议 (1-δ(1- δs), δ(1- δs)) , 提议 (s1,1-s1) 这里 1-s1< δ(1- δs)} 请注意1-δ(1- δs)> δs 参与人1可以提议分配δ(1- δs) 给参与人2, 参与人2接受这一条 件,博弈在第1阶段结束。 阶段1
2009-03-09
张醒洲 大连理工
4
理论:后向归纳法
• 简单的完全且完美信息博弈 (CPI)
– 两个参与人,同时行动 – 完全且完美信息 – 举例:斯塔克尔贝里 (1934) 双寡头垄断模型
• 为了使模型更加一般化,允许更长的行动序列(可以加入 更多的参与人或允许参与人行动多于一次)
– 一个例子. 鲁宾斯坦的讨价还价博弈
完全信息动态博弈
Unit 3-1
2009-03-09
张醒洲 大连理工
1
第3章和第4章概要
博弈分类
简单的完全且完美信息 动态博弈
举例
双寡头垄断模型(1934)
解的概念
后向归纳结果 (BIO) Subgame Perfect Outcome (SPO) 子博弈完美结果 Subgameperfect Nash equilibrium 子博弈完美NE