[经济学]博弈论第六章 重复博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
触发策略
两个最著名的触发策略:冷酷策略和礼尚往来策略。 触发策略包含着威胁和惩罚,但惩罚的力度有所不同。 冷酷策略:双方一开始的时候选择合作,然后继续选 择合作,知道有一方选择背叛,从此永远选择背叛。 即任何局中人的一次性不合作将触发永远不合作。 礼尚往来策略:开始的时候和冷酷策略一样,即双方 从合作开始,在以后的每个阶段,如果你的对手在最 近的一次或连续K次博弈中采取合作策略,则你继续 跟他合作;如果你的对手在上一阶段的博弈中采取背 叛策略,则你在下次的博弈中背叛他,或者连续K次 背叛他。
有限次重复博弈的结果
由此表明,如果纳什均衡是唯一的,只要 博弈的重复次数有限,重复本身不改变均 衡的结果。 如果纳什均衡不是唯一的,上述结论就不 一定成立。导致这个结果的原因是,当阶 段博弈有多个纳什均衡时,参与人可以使 用不同的纳什均衡惩罚第一阶段的不合作 行为或奖励第一阶段的合作行为。
第二节 囚徒困境的无限次重复
在囚徒困境中,重复博弈是一种促使局中 人采用合作策略的机制。因为,局中人担 心一次不合作会招致未来合作机会的丧失。 如果未来合作的价值很大,超过采取背叛 策略所能获得的短期收益,则双方会出于 长远利益的考虑,形成非契约的默契,使 彼此都从默契的非契约合约中得到好处。
重复博弈产生“道德感”
有一群猴子被关在笼子里,从笼子上方垂下 一条绳子,绳子的末端栓着一个香蕉, 上端 连着一个机关,机关可以开启水源。猴子们 发现了香蕉,纷纷跳上去够这个香蕉,当猴 子够着香蕉时,相连的绳子带动了机关,于 是一盆水倒了下来,尽管够到香蕉的猴子吃 到了香蕉,但是大多数的猴子都被淋湿了。 这个过程重复着,猴子们发现,吃到香蕉的 猴子是少数,其余的猴子都被淋湿了。于是, 每当有猴子去以香蕉时,其它的猴子主动地 去撕咬那个猴子,久而久之,猴子们产生了 默契,再也没有猴子敢去取香蕉了。
礼尚往来策略பைடு நூலகம்
惩罚一次的礼尚往来策略,叫做严格礼尚 往来策略:即你对我好我也对你好,你对 我坏我马上也对你坏,“以牙还牙”、 “针锋相对”。它“不记仇”。
礼尚往来策略的结果分析
假如在前面那个案例中,企业乙背叛了一 个星期后,突然又“改邪归正”,选择继 续合作,则选择合作的这个星期,利润只 有1万,因为此时,甲企业为了惩罚他的上 次背叛使用了低价策略,因此,这次背叛 的收益是1万(在背叛的那个星期获得的), 背叛的成本是损失了4万(在背叛后接下来 的一个星期发生的),那么他这次背叛是 否值得呢?
即使在不完全信息的情况下,如果博弈重复无穷 多次,均衡结果也可能大大不同于一次性博弈。
一种威胁策略,即使在一次博弈中是不可置信的, 在无限次重复博弈中却可能是值得置信的,因为 在后一种情况下,当事人考虑的所有未来收益的 贴现值之和,而不是一次性收益。如果施行威胁 带来的贴现值之和大于不施行威胁的贴现值之和, 威胁就是可置信的。
低价 高价
低价
企业甲 高价
3,3 1,6
6,1 5,5
有限次重复博弈的定义
有限次重复博弈:给定一个基本博弈G(可 以是静态博弈,也可以是动态博弈),重 复进行T次G,并且在每次重复G之前各博弈 方都能观察到以前博弈的结果,这样的博 弈过程称为“G的T次重复博弈”,记为 G(T)。而G则称为G(T)的“原博弈”。G(T) 中的每次重复称为G(T)的一个“阶段”。
博弈重复无穷多次而不是有限次时,存在着完全 不同于一次博弈的子博弈精炼纳什均衡。 在任何博弈中,局中人会根据前一阶段双方是否 合作,决定自己下一阶段的策略是选择合作还是 背叛。——依存策略(或称之为相机策略)。 大多数依存策略是触发策略:即只要他的对手在 博弈中一直采取合作策略,则该局中人也会在博 弈中继续采取合作策略;但是,一旦对手在某一 个阶段采取背叛策略,将会触发该局中人在往后 的一段时期内采取不合作策略,甚至永远采取不 合作策略,从而对对手实施惩罚。
一、重复博弈的概念
重复博弈是一种特殊的动态博弈,它是指同样结 构的博弈重复多次。 其中的每一次博弈称为“阶段博弈”。 局中人可以根据先前双方的博弈行为,决定自己 下一阶段的策略选择。 三项基本特征:(1)阶段博弈之间没有“物质上” 的联系,也就是说,前一阶段的博弈不改变后一 阶段博弈的结构;(2)所有参与人都观测到博弈 过去的历史;(3)参与人的总支付是所有阶段博 弈支付的贴现值之和或加权平均值。
二、影响结果的主要因素
(1)重复次数。其重要性来自于参与人在短期利益 与长期利用之间的权衡。当博弈只进行一次时, 每个参与人可能只关心一次性的支付;但如果博 弈重复多次,参与人可能会为了长远利益而牺牲 眼前利益,从而选择不同的均衡策略。—这是重 复博弈分析给出的一个强有力的结果,它为现实 中观测到的许多合作行为和社会规范提供了解释。 (2)信息完备性。退一步讲,即便一个参与人的 支付函数(特征)不为其他参与人所知时,该参 与人可能有积极性建立一个“好声誉”以换取长 远利益。这一点或许可以解释为什么那些本质并 不好的人在相当长的时间内干好事。
第一节 囚徒困境的有限次重复
假如两个企业垄断了一种商品市场,他们之间的 博弈如图所示。假定开始的时候两家企业彼此合 作,双方都实行高价。假如一个星期后乙背叛合 作采取低价,他的利润将从5万增加到6万。但甲 企业看到后也将采取低价,从此双方的利润各为3 万。即乙企业在背叛的当周获得了1万利润的增加, 但往后的每个星期都以损失2万为代价。 企业乙 博弈的结果?
第六章 重复博弈和策略性行动
本章主要考察重复博弈是如何进行 的,如何计算重复博弈的支付,以及如 何寻找重复博弈的纳什均衡。
主要内容
1、囚徒困境的有限次重复 2、囚徒困境的无限次重复 3、重复次数不确定的情形 4、策略型行动的分类 5、承诺及其可信性 6、重复博弈的运用
为什么研究重复博弈
有限次重复博弈的结果
假如该企业之间的合作关系只有两次,博弈的结 果? 利用倒推法.在第二阶段中,双方都意识到这是最 后一次合作,即以后没有合作关系了,即没有损 失“2万”的代价了,因此,双方都会背叛合作以 获得1万元好处。
在第一阶段中,双方想到下个阶段对方会背叛自 己,因此想:自己在这个阶段背叛可能获得1万元 的好处,因此,双方在第一个阶段就都会采取低 价。博弈的结果和一次囚徒困境博弈的结果一样。