第三讲声誉和对称信息重复博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
接下来我们考虑倒数第二个市场,也就是第19个城市的市场, 在这个市场上,双方都知道“在位者将在最后一个市场上选 择合谋”,因此在位者在这个市场上也没有必要选择反斗争。 依次类推,在位者在包括第1个市场的所有市场上都将选择
合谋。这个结论称为连锁店悖论。
通过对连锁店悖论的分析,我们得出一个有意思的结论:有 限次重复博弈的均衡解和一次博弈没有区别。把这个结论推 广到囚徒困境博弈中,就是说,尽管两个人都选择不坦白是 集体最优的,但如果同样的博弈重复有限次,这个重复博弈
第五讲 声誉和对称信息重复博弈
重复博弈(Repeated Game)是动态博弈的一种特殊情况。
在重复博弈里,完全相同的环境一次次重复出现,参与人在 重复出现的相同环境中做出决策。
❖ 有限次重复博弈——连锁店悖论(Chain-store Paradox)
某家电连锁销售企业“美乐”在20个城市里都设有 分店。现有一家外国家电连锁企业“益家”也计划 在这20个城市陆续开设分店。显然,在某个特定的 城市,如果“美乐”默许“益家”的进入,则会降 低“美乐”分店的利润。但是,如果 “益家”进入 后,“美乐”实施掠夺性削价以反击,将会遭受比 合谋更大的亏损。那么,面对“美乐”的进入, “益家”应该怎么办?是合谋?还是反击(掠夺性 削价)?
从现在开始,如果A、B两公司自始至终地合作,每家企业
每期的收益为1152,那么每家企业n期(n→∞)的总收益
为
(1ii2in)115211152 1i
如果两家企业从第1期就选择背叛,那么每家企业n期的 总收益为
1 1024 1 i
现在我们来考虑这样一种策略,某家企业从一开始就选择合
的均衡仍然是(坦白,坦白)。
❖ 教材113页有最后一次的重复博弈
理性人假设的绝对性
❖ 教材135页非理性与囚徒困境
很多人都有善良之心,但也不喜欢被占便宜。
如果你对对手的理性程度有所怀疑,你可能 会在第一次博弈时选择用好心。这并不表明 非理性对你的对手有利,而是表明看起来非 理性对他有利。
有一个人是有名的妻管严。一天,同事问他: “你们家谁拿主意?”他回答说:“一半一 半。”同事接着问:“一半一半是什么意 思?”他说::“当意见不一致时听老婆的, 当意见一致时听我的。”
在此一次卡特尔博弈中,如果A、B两家都选择背叛,增加 产量,那么它们的收益均为1024。但它们若能互相合谋,压 缩产量,报酬就可以达到1152。显然,两个公司都想要合作, 但又怕被背叛。在一次性博弈里,被欺骗之后便无法报复了。 想要合谋的企业希望对方能相信自己的诚意,但在一次性博 弈里,企业也不可能令人信服地表白诚意。但在无限次重复 博弈里,情况就不一样了。因为两家企业还要一直打交道, 所以想要表达诚意的企业就有可能通过实际行动来建立良好 的声誉。
重复博弈比不重复进行的一次性博弈要复杂得多。在连锁店 悖论中,进入者的策略是进入和不进入,而在位者的策略则 是合谋和斗争。参与人的策略描述了当两个参与人在上一期
的行动给定时,参与人在这一期将选择什么行动。
现在我们来求解这一博弈。在采取第一个行动的时候,参与
人必然要预先估计他现在所采取的行动对将来各期的影响, 所以我们使用求解动态博弈的方法——逆推法来求解重复博 弈,也就是从多期重复博弈的最后一期开始求解。我们现在 假设进入者已经进入了第19个城市。在最后一个城市的市场 上,两个参与人发现他们所在的子博弈和一个一次性的市场 进入博弈没有区别,因此无论博弈过去的历史怎样,进入者 都会选择进入,而在位者都会选择合谋。
更严格还是更宽松?为什么?
声誉应用一 ❖ 绑架、勒索和诚实(教材14页):绑架和勒索一样,会
面临很大的信用问题 ❖ 绑架
假设你是刚拿到赎金的绑匪,此时你该不该释放被绑架 者?只有当被绑架者家属相信付赎金可以增加被绑架者 的获释的机会时,他们才会付钱。 ❖ 勒索 勒索是非法的。对被勒索者来说,就算暂时满足了勒索 者的要求,他/她为什么不继续勒索你呢?
❖ 无限次重复博弈
某地区有A、B两家生产同一产品的企业,这两家企业的成 本状况完全相同。如果这两个企业合谋结成卡特尔,就可以 通过限制产量来获得垄断利润。假设这两家企业不断重复如 图9 .4-1所示的卡特尔博弈。
B 合谋
背叛
合谋
百度文库
(1152,1152) (864,1296)
A
背叛
(1296,864) (1024,1024)
❖ 声誉应用三(教材31页) 精神失常的收益:精神失常与非理性 考虑一个小村庄 有报复名声的人在商场上也能够增加个人收 益 思考:为什么一般企业都雇有法律顾问?
❖ 思考:如何避免连锁店悖论?
在无限次重复博弈里,参与者每期都得到一定的收益。为了
比较不同策略下收益的大小,我们必须把各期的报酬加总起 来。但今年的报酬不等于明年的报酬。假设银行一年期定期 存款利率为10%,就意味着,今年的1元钱存在银行里,明 年可得本利l.10元。同样道理,明年的1元钱只想当于今年的 0.91元。所以,只有用贴现率把未来的收入折算成现在的等 价收入,才可以把各期的收入加在一起。用i表示贴现率, 1>i>0。以现在为第0期,那么第1期的收益折算到现在便是 iR1,第2期的收益折算到现在是i*iR2,第n期的收益折算到 现在是。i n R n
思考:对于职业绑架者或职业勒索者而言, 哪种策略是最优的?
❖ 声誉应用二(教材16页)
广告、商标和企业的商誉:要是企业行骗后 就可以赚得足够的钱,它为什么不这么做呢? 你的企业考虑向一个过去很公道的供应商下 一笔很大的订单,而这家供应商如果欺骗你 就能使自己狠狠地赚一笔。供应商行骗的后 果是什么?
❖ 声誉(Reputation)
在重复进行的囚徒困境博弈里,只有博弈将重复进行无限次 时,参与人才会选择合作。这是声誉的一个大问题。因为每 个人都知道一个参与人将在最后一期选择坦白,那么为什么 他们还要假设这个参与人会在目前建立起自己的声誉呢?
思考:
1,为什么隔一代的长辈比如爷爷、奶奶会对小孩子更溺爱? 2,和独生子女家庭相比,拥有多个孩子的家庭对孩子的教育