重复博弈简介
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
无限支付序列 , , 的现值之和为
如果 /(1 )
t 1
t 1
/(1 )。
那么, 是无限支付序列 1, 2 ,的平均支 付,它是各阶段支付现值之和的 (1 ) 倍。
2016/1/6 19
t 1
即 (1 ) t 1 t, t,
1
2016/1/6
33
•两零售商的情形
D(I1, I2 ) D a(I1 I 2 )b
•零售商1的利润函数为
1 ( I1 , I 2 , w, s) ( p w)
I1 [ D a( I1 I 2 )b ] (1 s) I1 I1 I 2
(1 ) t i ( pit , p jt ) i
t 0
2016/1/6 21
含义:在无限期重复博弈中,如果参与人有足够的耐 心(即 足够大),那么,任何满足个人理性的可行 支付向量都可以通过一个特定的子博弈完美均衡得到。
两个暗示:
•它们表明了如果参与人是短视的,则不能维持团体 想要的结果,参与人有长期目标的情况下可以维持; •它们表明重复博弈的均衡结果集合是巨大的, 所以,均衡概念缺乏预测的能力。
8
对于有限期重复博弈,有下面的定理
定理2.4.1 令G是阶段博弈,G(T)是G重复T次的重 复博弈(T有限)。那么,如果G有唯一的纳什均衡, 重复博弈G(T)的唯一子博弈完美纳什均衡结果是阶 段博弈G的纳什均衡重复T次,即每个阶段博弈出现 的是一次性博弈的均衡结果。
2016/1/6
9
双头重复价格竞争
2.4 重复博弈
•逆向归纳法回顾
2016/1/6
1
求解步骤:
•在给定参与人I的行动的情况下,求参与人II的最优行动
•在预测到参与人II的策略的情况下,求参与人I的最优行动
2016/1/6
2
重复博弈
•序贯博弈(sequential game): 同样结构的子 博弈只出现一次的动态博弈 •重复博弈(repeated game):具有同样结构的 博弈重复多次的博弈,其中的每次博弈称为 “阶段博弈”(stage game)。 •有限期界 •无限期界
T+1期价格博弈的结果仅是伯川德均衡重复T+1次
2016/1/6
13
无限期重复博弈的解
•可以验证伯川德均衡无限期的重复仍 然是这一博弈的均衡。
考虑下述的博弈:每家企业在每个时期t选择等 于边际成本的价格,而不管直到t以前的博弈历 史。给定对手企业在此方式下索取等于c的价格, 则每家企业所能做的不会比本身收取c更好些。
t 1
无名氏定理
2016/1/6
20
•对于目前考察的重复价格博弈来说,无名 氏定理说的是,任何一对满足
1 0, 2 0 以及 1 2 m
的利润 ( 1, 2 ) 都是 的阶段均衡支付。
Baidu Nhomakorabea
充分接近于1时
•就是说,存在完美均衡策略 ( p1t , p2t ) 。使 得对所有的企业i来说,企业的阶段支付为
2016/1/6
25
• 无限期的鲁宾斯坦模型中存 在唯一一个子博弈完美均衡:
1 2 x 1 1 2
2016/1/6
26
2016/1/6
27
2016/1/6
28
2016/1/6
29
供应链的协调
•经济系统 一个制造商和一个零售商组成的供应链 •需求函数为
制造商
(w, s)
零售商
2016/1/6
16
•其他均衡
•让p属于区间[c, p ] ,并且让每家企业, 在还没有企业背离那个价格的期间,索取价 格 p。如果其中有一家企业过去曾经背离这 个价格,双方就都永远索取竞争性价格。 在一致遵守价格p的情况下,每家企业得到
1 ( p)(1 2
m
)
2
如果一家企业背离,在背离期间,它最多 得到 ( p ) (因为它的对手可取p)。因此, 它在那一时期最多多赚到 ( p) 2 ,而它 在以后永远失去p时利润的一半,即
2016/1/6
14
•重复的伯川德均衡不再是唯一的均衡 •假设价格 p m 使( p c) D( p) 最大化。 •触发策略:每家企业在0时期索取 p m。若是在 t以前各时期两家企业都曾索取 p m,它在t时期 m 继续索取 p ;否则,它将永远把价格定在边际 成本c上 . •如果贴现因子足够高,它们就构成一个均衡。
2016/1/6 23
•多重纳什均衡
例如“参与人1总是要求得到 x 1 ,并拒绝任何其他提 议,参与人2总是提议 x 1 ,并接受任何提议”就是一 个纳什均衡 但它不是一个子博弈完美均衡:如果参与人2拒绝参与 人1的第一次出价,而还价 x 1 ,则参与人1应该接 受,因为即使下一阶段他得到整个蛋糕,其价值也只 有 1 。
I
市 场
D( I ) D aI b
•集中决策者的渠道利润
( I ) ( p c)( D aI ) I
c b
•最优解
2016/1/6
I [ab( p c)]
c
1 (1b )
30
分散系统
•契约安排
(w, s)
b
•零售商的利润函数
(I , w, s) ( p w)(D aI ) (1 s)I
•在每个时期,两家企业同时选择他们的价格( p1t , p2t ) 。
•在各个时期之间没有“物质”联系;当一家企业选 定其价格时,其对手以前选定的价格已经过时了。 •完美均衡要求:对于任何给定的t时期的历史, 从t时期开始,企业i的策略,在企业j从那时开始 的策略给定的情况下,将使利润的贴现值最大化。
2016/1/6
4
•囚徒困境重复博弈
阶段博弈为
•对每个参与人来说,行动D严格优于 行动C,所以导致了结果 (D,D)
2016/1/6 5
•主要思想:如果每个参与人相信背叛将终止 合作从而导致其后的损失对他来说超过短期所 得,那么,若博弈被重复进行,则共同想要的 结果(C,C)在每个时期发生是稳定的。
1 m (1 2
2 ) m
1 2
2016/1/6 15
•这个均衡是默契合谋的结果。
如果一家企业削减其垄断价格,它将在整 个背离时期得利,但它破坏了以后时期的 合谋——所有企业回复到“触发策略”上 去(即他们永远执行纯竞争对策,这是一 个均衡)。注意,合谋是通过一个纯粹不 合作的机制实现的。
2016/1/6 17
1 ( p)( 2
) ( p)
2
2(1 )
因此,如果 (1 ) ,即 1 2 ,背离价格p 并非最佳做法。
2016/1/6
18
•平均支付(average payoff):为得到相等的现 值之和在每一阶段都应得到的等额支付值 令贴现因子为 ,那么,无限支付序列 1 , 2 , 的现值之和V 为 V t 1 t
•将表2.4.1表示的博弈重复(固定)有限期, 我们采用逆向归纳法,发现纳什均衡(D, D) 是唯一的子博弈完美均衡。 Step 1 求解第T期,两个参与人必定都在第T期选 择D,即背叛,因为选择背叛将提高他们在第T期的 收益而且也没有未来受到惩罚的可能
2016/1/6
6
Step 2 在第T-1期对任何以正的概率出现的历史, 两参与人都必定背叛.已经证明沿着均衡路径的两 个参与人将在最后一期都选择背叛,所以,特别的, 如果参与人i在时期T-1遵循均衡策略,那么,他的 对手必然在最后一期背叛。因此,参与人i没有激励 不在时期T-1背叛。 •团体规范的重要性:维持共同想要的结果所需的团体 规范涉及到每个参与人“惩罚”背叛者;在团体规范 要求惩罚者去实行威胁的情形中,团体规范也必须确 保惩罚者有动机这样去做。
2016/1/6
12
• T-1时期的均衡价格是什么?
由于在 T时期的价格选择不依赖于 T-1 时期发生什么事, 一切事情都会像T-1就是最后一个时期一样。因此,各 企业也在T-1时期选择竞争性的价格,而不管直到这个 时期之前的历史如何。对于任何T-1时期的历史,有
p1,T 1 p2,T 1 c
•零售商的最优投资为
I [ab( p w)(1 s) ]
1 1 (1b )
2016/1/6
31
协调机制
•协调机制 (w , s ) 满足
s 1 ( p w )( p c)1
证明:
•制造商利润
M (I , w, s) (w c)(D aI b ) sI
2016/1/6
3
•有限期重复博弈和无限期重复博弈的区分
•如果参与人明显地察觉到有一个确定的 最后时期,则称为有限期重复博弈更为恰 当; •如果人们进行博弈非常频繁推移非常缓慢,那 么,将该博弈描述为无限期重复博弈更为合理。 •关键准则:最后的时期是否明确地进入了参与 人的策略考虑。如果进入了参与人的考虑范围, 那么,就是有限期重复博弈,否则是无限期重 复博弈。
•分散决策时渠道利润为 (I , w, s) M (I , w, s) (I , w, s) ( p c)(D aI b ) I c ( I )
2016/1/6 32
•协调的条件
即最优补贴 为
I Ic
s 1 ( p w )( p c)
2016/1/6
11
有限期重复博弈的解
•先给定博弈在时期T的历史,每家企业在最 后时期如何选择价格? 因为过去的价格不影响T时期的利润,各企业在其对手价 格给定的情况下,应当使它的“静态利润” i ( piT , p jT ) 最大化。因此,对任何历史情况来说,均衡是伯川德均 衡,即
p1T p2T c
2016/1/6
7
惩罚机制
•触发策略(trigger strategies):(1)开始选择合 作;(2)选择合作直到有一方选择了背叛,然后 永远选择背叛。
•针锋相对策略(tit-for-tat)或称投桃报李,意思 是说,比如在囚徒困境博弈中,开始选择合作, 在t阶段选择对手在t-1阶段的选择。
2016/1/6
2016/1/6
22
2.5.4 鲁宾斯坦讨价还价模型
•两个参与人需要就如何分割一块蛋糕达成协议, 在第 0, 2, 4, 阶段 (偶数阶段)参与人1提出 ( x,1 x) ,参与人2可以接受 一种分配方案(出价) 也可以拒绝,如果接受,那么博弈结束,如果拒 绝,他就在其后的奇数阶段中提出自己的分配方 案建议。 • 每个参与人的支付函数为:如果在t阶段达成协 t 议,那么,贴现支付为 (1t x, 2 (1 x)) ,x为参与人 1获得的蛋糕份额,1-x 为参与人2获得的蛋糕份 额, 1与 2 分别为两个参与人的贴现因子。
2016/1/6
24
• 有限博弈的唯一子博弈均衡:在最后一个阶段, 不失一般性,设出价者为参与人1,他要得到整 个蛋糕,而另一方接受;在这之前的一个阶段中, 参与人1拒绝所有使他的份额小于 的提议。然 1 后,按照这种方式逆推。
• 有限期模型的缺点
•解依赖于期限的长短与最后是哪一方出价;
•如果最后一阶段没有达成协议,有限期模型不 允许参与人进一步努力以达成一个合理的协议。
•两企业以同样的边际成本c生产可以完全相互 替代的产品 •低价企业得到了整个市场,而各家企业在收 取同样价格的情况下,则分享这个市场。 •基本的伯川德博弈重复了T+1次,T 可能 是有限数,也可能是无限数。 •企业i的贴现利润为
t t 0
2016/1/6
T
i
( pit , p jt )
10