第八章 4 重复博弈和无名氏定理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由此我们证明,如果>=1/6,冷酷战略 是无限次重复博弈的一个子博弈精炼纳 什均衡,帕雷托最优(沉默,沉默)是 每一个阶段的均衡结果,囚徒走出了一 次性博弈的困境。
实际上,也存在一些其它的战略使得当 事人之间实现合作。
大众定理:存在无穷多对战略,可以成 为无限次重复博弈的平衡点,并同时实 现双方的合作。
这样,我们就证明了冷酷战略是一个纳什均衡。 接下来的任务是证明这个纳什均衡是一个子博 弈精炼纳什均衡,即在每一个子博弈上构成纳 什均衡。 因为博弈重复无限次,从任何一个阶段开始的 子博弈与这个博弈的结构相同。 在冷酷战略纳什下,子博弈可以划分为两类: A类,没有任何人曾经坦白;B类,至少一人曾 经坦白。我们已经证明,冷酷战略在A类子博 弈中构成纳什均衡。在B类,根据冷酷战略, 参与人只是重复单阶段博弈的纳什均衡,它自 然也是整个子博弈的纳什均衡。
0 (6) 2 (6) 1 (1) 2 (1)
或
6 1 1 1
1/ 6
解上述条件得:
Baidu Nhomakorabea
1/ 6
1 / 6 ,给定j坚持冷酷战略并且j没有
也就是说,如果
首先坦白,i不会选择首先坦白。
现在假定j首先选择了坦白,那么i是否有积极 性坚持冷酷战略惩罚j的不合作行为呢? 假定j坚持冷酷战略,j一旦坦白将永远坦白; 如果i坚持冷酷战略,他随后每阶段的支付是- 6,但如果他选择任何其它战略,他在任何阶 段的支付不会大于-6,因此不论为多少,i有 积极性坚持冷酷战略。类似的,假定j坚持冷酷 战略,即使i自己首先选择了坦白,坚持冷酷战 略也是最优的。
我们首先证明冷酷战略是一个纳什均衡。假定 囚徒j选择上述冷酷战略,冷酷战略是不是囚徒 i的最优战略呢? 令为贴现因子(假定两人的贴现因子相同)。 如果i在博弈的某个阶段首先选择了坦白,他在 该阶段得到0单位的支付。但他的这种行为将 触发囚徒j的“永远坦白”的惩罚,因此,i随 后每个阶段的支付都是-6。因此如果给定下列 条件满足,假设j没有选择坦白,i将不会选择 坦白:
其他的战略
恕道战略 恶棍战略 流氓战略 傻客战略
在这个博弈中,在位者选择斗争的 惟一原因是希望斗争能起到一种威摄力 量,使进入者不敢进入。但在有限次重 复博弈中,斗争并不是一个值得置信的 威胁。 该博弈的惟一子博弈精炼均衡是: 在位者在每一个市场上都选择默许,进 入者在每一个市场上选择进入。
囚徒困境与市场进入阻挠博弈类似。只 要博弈重复的次数是有限的,最后阶段 的惟一纳什均衡就是两个囚徒都选择坦 白;逆向归纳法意味着“总是坦白”是 惟一的子博弈精炼均衡。 上述结果表明:只要博弈的重复次数是 有限的,重复本身并不改变囚徒困境的 结果。
重复博弈和无名氏定理
动态博弈的另一种特殊但是非常重要的 类型就是所谓的“重复博弈”。 顾名思义,重复博弈是指同样结构的博 弈重复多次,其中的每次博弈称为“阶 段博弈”
有限次重复博弈:连锁店悖论
考虑市场进入阻挠博弈
在位者 默许 斗争
进入者
进入 不进入
40,50 0,300
-10,0 0,300
现在假定同样的市场有20个(可以理解为在位 者有20个连锁店),进入者每次进入一个市场, 博弈就变成了20次重复博弈。假定进入者先进 入第一个市场,在位者应该如何反应? 大家可能会猜想,尽管从一个市场上看,在位 者的最优选择是默认,但因为现在有20个市场 要保护,为了阻止进入者进入其他19个市场, 在位者应该选择斗争。但这个猜想是不正确的。
无限次重复博弈和无名氏定理
当博弈重复无穷次而不是有限次时,存 在着完全不同于一次博弈的子博弈精炼 均衡。
考虑囚徒困境博弈,假定博弈重复无穷 次。
囚徒2的战略 囚徒1的战略 沉默 招认
沉默
招认
-1,-1
0,-9
-9,0
-6,-6
考虑下列所谓的“冷酷战略”: (1) 开始选择沉默;(2)选择沉默直到有一 方选择坦白,然后永远选择坦白。 根据这个战略,一旦一个囚徒在某个阶 段博弈中选择了坦白,之后他将永远选 择坦白。