重复性博弈

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

如果你打我的战地医院，我绝对要以牙还牙，报仇雪恨。
以上这些对人类行为的观察能够帮助我们更好地认识人类的行为方式。
© 2011-13 王秋石
6/100
重复性博弈
以牙还牙策略能否成功实施取决于博弈的次数。我们将重复性博弈按次数分类为有限次重复性博弈和无限次重复性博弈。
有限次重复性博弈就是未来博弈的次数已经确定的博弈，也被称为固定次数的重复性博弈。
同理，第八轮、第七轮……都会出现只玩一次博弈的纳什均衡。
只要这一博弈重复的次数已知，每一轮的结果都是原纳什均衡的结果。
© 2011-13 王秋石
8/100
无限次重复性博弈
以牙还牙策略只有在无限次重复性博弈中才能有效。
欧佩克（OPEC）是一个合作比较成功的卡特尔组织，其原因之一就是无限次重复性博弈所隐含的各种惩罚机制。
而我们很可能为朋友买车票，我们与朋友的交往是重复性博弈。如果他是个吝啬鬼，你可以选择不与他同车等。
在重复性博弈中，每个人都比较关心自己的声誉，正是这种声誉机制使得人们大量采取合作性策略。
© 2011-13 王秋石
4/100
重复性博弈：军事合作
牙还牙策略在军事上也有所表现。《有核国家首先不使用核武器的协议》到目前为
再看看选手B，他有些可怜，他本可享受9，最后只好收益为1。他要看人家的脸色行事。
© 2011-13 王秋石
15/100
“先动优势”
当然，他可以向A发出威胁：如果A选下，他报复性地选左，两人都同归于尽，各自收益为零。
如果A相信B会实施威胁，A只好选择上，这样，A 的收益至少为1，而不是零。
无限次重复性博弈就是可以无限次数地、重复性地玩的一种博弈。
© 2011-13 王秋石
7/100
有限次重复性博弈
假定我们知道囚犯困境博弈只玩十次，现在就是最后一次，结果会如何呢？最后玩的那次博弈就像只玩一次的博弈。因此，两者的结果应该是相同的。
第九轮会如何呢？我们已知在第十轮双方都会承认犯罪，为什么在第九轮就要合作呢？
重复性博弈
在现实生活中,寡头间关于彼此产量和价格的决策远不止一次,他们根据对手的行为在不断地调整自己的产量和价格。
这种不断调整其策略并改变收益的博弈被称为重复性博弈。
当囚犯困境的双方只能进行一次性博弈时，很难进行有效的惩罚；而在重复性博弈时，有效的惩罚对方或者威胁对方就成为可能了。
扩展型博弈
图11. 1 是表11. 9 中的博弈的扩展型博弈，它有些像树状,故被称为博弈树。
因此,用博弈树表示的博弈被称为扩展型,用表格所表示的博弈被称为常规型。
© 2011-13 王秋石
12/100
扩展型博弈
■如何求解扩展型博弈的纳什均衡呢？
■ 假定A已经选择了上，B一定会选择左，收益为（1，9）； ■ 但如果A选择下，B只好选择右，收益为（2，1）。
在囚犯困境的重复性博弈中，大家都清楚地知道，合作的巨大收益提供了合作的正面激励，对方的有效威胁和潜在伤害则提供了合作的负面激励。
© 2011-13 王秋石
2/100
重复性博弈：价格
在固定价格的一次性博弈中，哪怕有约在先，双方都保持垄断价格同时分享市场需求，最后的均衡为各自采用竞争性价格获得零经济利润。
但这个威胁可信吗？在一次性博弈中，一旦A选择了下，B就没办法了，只有在0和1的收益中进行理性选择，只好有气无力地选择右啰。
© 2011-13 王秋石
16/100
“先动优势”
现在我们这样思考:在此博弈中，如果由于种种原因，B为先动者，均衡点又何在呢？它是否证明了所谓“先动优势”？
如果上例中的B先动，他会选择左，然后A没办法，只好选择上。先动者得到了9的收益，后动时他只得到1。
但在重复性博弈中，情况有所不同。双方知道，如果我降价，对方一定会降价，可能降得还更惨，对方要置我于死地而后快；如果我采取合作态度，对方很可能也会合作。
为什么我不首先采取合作态度——把价格定在垄断价格呢？
© 2011-13 王秋石
3/100
重复性博弈：日常生活
在公交车上，我们很少为素不相识的乘客买车票，因为这大凡是一次性博弈。
斯坦伯格模型就是序列博弈的一个例子，一企业是领导者，率先决定其产量，另一企业是跟随者，相应决定其产量。
© 2011-13 王秋石
10/100
序列博弈
经过分析,我们知道该博弈有两个纳什均衡:(上,左) 和(下,右)。但是,我们将说明其中的一个均衡不大合理。
© 2011-13 王秋石
11/100
无限次重复性博弈所形成的合作均衡解并不是稳定的，它较为容易被打破。
© 2011-13 王秋石
9/100
序列博弈
到目前为止所讨论的博弈都是两个选手要同时选择策略。例如，在古诺模型中，两家企业同时决定产量。
在序列博弈中，选手们按先后顺序进行选择。因此，序列博弈就是选手依次出招的博弈。
止遵守得很好的原因就是这个以牙还牙策略。但是，《两国导弹互不对准协议》遵循得就会差
一些，两国关系一旦恶化，很有可能都在暗地里违约。
© 2011-13 王秋石
5/100
重复性博弈：战地医院
以牙还牙策略可以使战地医院享受爱情的浪漫。
如果你专门轰炸对方的战地医秋石
13/100
扩展型博弈
A是先动者，在信息完备时，当他看到博弈树端点的收益情况后，他一定会选择下。
这样（上，左）就不再是一个合理的均衡了。从扩展型博弈看，（下，右）是唯一的纳什均衡。
© 2011-13 王秋石
14/100
“先动优势”
A好开心，他享受到了“ 先动优势”。一步为先，步步为先。
重复性博弈——摆脱囚犯困境。
© 2011-13 王秋石
1/100
重复性博弈
20 世纪60 年代进行的实验性研究寻找到了一种简单的办法——以牙还牙(tit-for-tat)策略——能够有效地让意欲违约者保持克制。
以牙还牙策略是指在重复性博弈过程中某一选手对对方在前一期的合作同样也采取合作的态度，对对方不合作则采取报复性的策略。