重复性博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如果你打我的战地医院, 我绝对要以牙还牙,报仇 雪恨。
以上这些对人类行为的观 察能够帮助我们更好地认 识人类的行为方式。
© 2011-13 王秋石
6/100
重复性博弈
以牙还牙策略能否成功实施取决于博弈的次数。 我们将重复性博弈按次数分类为有限次重复性博 弈和无限次重复性博弈。
有限次重复性博弈就是未来博弈的次数已经确定 的博弈,也被称为固定次数的重复性博弈。
止遵守得很好的原因就是这个以牙还牙策略。 但是,《两国导弹互不对准协议》遵循得就会差
一些,两国关系一旦恶化,很有可能都在暗地里 违约。
© 2011-13 王秋石
5/100
重复性博弈:战地医院
以牙还牙策略可以使战地 医院享受爱情的浪漫。
如果你专门轰炸对方的战 地医院,你自己的医院也 就处于危险之中。
© 2011-13 王秋石
13/100
扩展型博弈
A是先动者,在信息完备时,当他看到博弈树端点 的收益情况后,他一定会选择下。
这样(上,左)就不再是一个合理的均衡了。 从扩展型博弈看,(下,右)是唯一的纳什均 衡。
© 2011-13 王秋石
14/100
“先动优势”
A好开心,他享受到了“ 先动优势”。一步为先, 步步为先。
扩展型博弈
图11. 1 是表11. 9 中的博弈的扩展型博弈,它有些 像树状,故被称为博弈树。
因此,用博弈树表示的博弈被称为扩展型,用表格所 表示的博弈被称为常规型。
© 2011-13 王秋石
12/100
扩展型博弈
■如何求解扩展型博弈的纳什均衡呢?
■ 假定A已经选择了上,B一定会选择左,收益 为(1,9); ■ 但如果A选择下,B只好选择右,收益为(2,1)。
无限次重复性博弈就是可以无限次数地、重复性 地玩的一种博弈。
© 2011-13 王秋石
7/100
有限次重复性博弈
假定我们知道囚犯困境博弈只玩十次,现在就是 最后一次,结果会如何呢?最后玩的那次博弈就 像只玩一次的博弈。因此,两者的结果应该是相 同的。
第九轮会如何呢?我们已知在第十轮双方都会承 认犯罪,为什么在第九轮就要合作呢?
斯坦伯格模型就是序列博弈的一个例子,一企业 是领导者,率先决定其产量,另一企业是跟随者 ,相应决定其产量。
© 2011-13 王秋石
10/100
序列博弈
经过分析,我们知道该博弈有两个纳什均衡:(上,左) 和(下,右)。但是,我们将说明其中的一个均衡不大 合理。
© 2011-13 王秋石
11/100
在囚犯困境的重复性博弈中,大家都清楚地知道 ,合作的巨大收益提供了合作的正面激励,对方 的有效威胁和潜在伤害则提供了合作的负面激励 。
© 2011-13 王秋石
2/100
重复性博弈:价格
在固定价格的一次性博弈中,哪怕有约在先,双 方都保持垄断价格同时分享市场需求,最后的均 衡为各自采用竞争性价格获得零经济利润。
但在重复性博弈中,情况有所不同。双方知道, 如果我降价,对方一定会降价,可能降得还更惨 ,对方要置我于死地而后快;如果我采取合作态 度,对方很可能也会合作。
为什么我不首先采取合作态度——把价格定在垄 断价格呢?
© 2011-13 王秋石
3/100
重复性博弈:日常生活
在公交车上,我们很少为素不相识的乘客买车票 ,因为这大凡是一次性博弈。
但这个威胁可信吗?在一次性博弈中,一旦A选择 了下,B就没办法了,只有在0和1的收益中进行理 性选择,只好有气无力地选择右啰。
© 2011-13 王秋石
16/100
“先动优势”
现在我们这样思考:在此博弈中,如果由于种种原 因,B为先动者,均衡点又何在呢?它是否证明了 所谓“先动优势”?
如果上例中的B先动,他会选择左,然后A没办法 ,只好选择上。先动者得到了9的收益,后动时他 只得到1。
同理,第八轮、第七轮……都会出现只玩一次博 弈的纳什均衡。
只要这一博弈重复的次数已知,每一轮的结果都 是原纳什均衡的结果。
© 2011-13 王秋石
8/100
无限次重复性博弈
以牙还牙策略只有在无限 次重复性博弈中才能有效 。
欧佩克(OPEC)是一个合 作比较成功的卡特尔组织 ,其原因之一就是无限次 重复性博弈所隐含的各种 惩罚机制。
重复性博弈——摆脱囚犯困境。
© 2011-13 王秋石
1/100
重复性博弈
20 世纪60 年代进行的实验性研究寻找到了一种简 单的办法——以牙还牙(tit-for-tat)策略——能够有 效地让意欲违约者保持克制。
以牙还牙策略是指在重复性博弈过程中某一选手 对对方在前一期的合作同样也采取合作的态度, 对对方不合作则采取报复性的策略。
而我们很可能为朋友买车票,我们与朋友的交往 是重复性博弈。如果他是个吝啬鬼,你可以选择 不与他同车等。
在重复性博弈中,每个人都比较关心自己的声誉 ,正是这种声誉机制使得人们大量采取合作性策 略。
© 2011-13 王秋石
4/100
重复性博弈:军事合作
牙还牙策略在军事上也有所表现。 《有核国家首先不使用核武器的协议》到目前为
重复性博弈
在现实生活中,寡头间关于彼此产量和价格的决策 远不止一次,他们根据对手的行为在不断地调整自 己的产量和价格。
这种不断调整其策略并改变收益的博弈被称为重 复性博弈。
当囚犯困境的双方只能进行一次性博弈时,很难 进行有效的惩罚;而在重复性博弈时,有效的惩 罚对方或者威胁对方就成为可能了。
无限次重复性博弈所形成 的合作均衡解并不是稳定 的,它较为容易被打破。
© 2011-ຫໍສະໝຸດ Baidu3 王秋石
9/100
序列博弈
到目前为止所讨论的博弈都是两个选手要同时选 择策略。例如,在古诺模型中,两家企业同时决 定产量。
在序列博弈中,选手们按先后顺序进行选择。因 此,序列博弈就是选手依次出招的博弈。
再看看选手B,他有些可 怜,他本可享受9,最后 只好收益为1。他要看人 家的脸色行事。
© 2011-13 王秋石
15/100
“先动优势”
当然,他可以向A发出威胁:如果A选下,他报复 性地选左,两人都同归于尽,各自收益为零。
如果A相信B会实施威胁,A只好选择上,这样,A 的收益至少为1,而不是零。
以上这些对人类行为的观 察能够帮助我们更好地认 识人类的行为方式。
© 2011-13 王秋石
6/100
重复性博弈
以牙还牙策略能否成功实施取决于博弈的次数。 我们将重复性博弈按次数分类为有限次重复性博 弈和无限次重复性博弈。
有限次重复性博弈就是未来博弈的次数已经确定 的博弈,也被称为固定次数的重复性博弈。
止遵守得很好的原因就是这个以牙还牙策略。 但是,《两国导弹互不对准协议》遵循得就会差
一些,两国关系一旦恶化,很有可能都在暗地里 违约。
© 2011-13 王秋石
5/100
重复性博弈:战地医院
以牙还牙策略可以使战地 医院享受爱情的浪漫。
如果你专门轰炸对方的战 地医院,你自己的医院也 就处于危险之中。
© 2011-13 王秋石
13/100
扩展型博弈
A是先动者,在信息完备时,当他看到博弈树端点 的收益情况后,他一定会选择下。
这样(上,左)就不再是一个合理的均衡了。 从扩展型博弈看,(下,右)是唯一的纳什均 衡。
© 2011-13 王秋石
14/100
“先动优势”
A好开心,他享受到了“ 先动优势”。一步为先, 步步为先。
扩展型博弈
图11. 1 是表11. 9 中的博弈的扩展型博弈,它有些 像树状,故被称为博弈树。
因此,用博弈树表示的博弈被称为扩展型,用表格所 表示的博弈被称为常规型。
© 2011-13 王秋石
12/100
扩展型博弈
■如何求解扩展型博弈的纳什均衡呢?
■ 假定A已经选择了上,B一定会选择左,收益 为(1,9); ■ 但如果A选择下,B只好选择右,收益为(2,1)。
无限次重复性博弈就是可以无限次数地、重复性 地玩的一种博弈。
© 2011-13 王秋石
7/100
有限次重复性博弈
假定我们知道囚犯困境博弈只玩十次,现在就是 最后一次,结果会如何呢?最后玩的那次博弈就 像只玩一次的博弈。因此,两者的结果应该是相 同的。
第九轮会如何呢?我们已知在第十轮双方都会承 认犯罪,为什么在第九轮就要合作呢?
斯坦伯格模型就是序列博弈的一个例子,一企业 是领导者,率先决定其产量,另一企业是跟随者 ,相应决定其产量。
© 2011-13 王秋石
10/100
序列博弈
经过分析,我们知道该博弈有两个纳什均衡:(上,左) 和(下,右)。但是,我们将说明其中的一个均衡不大 合理。
© 2011-13 王秋石
11/100
在囚犯困境的重复性博弈中,大家都清楚地知道 ,合作的巨大收益提供了合作的正面激励,对方 的有效威胁和潜在伤害则提供了合作的负面激励 。
© 2011-13 王秋石
2/100
重复性博弈:价格
在固定价格的一次性博弈中,哪怕有约在先,双 方都保持垄断价格同时分享市场需求,最后的均 衡为各自采用竞争性价格获得零经济利润。
但在重复性博弈中,情况有所不同。双方知道, 如果我降价,对方一定会降价,可能降得还更惨 ,对方要置我于死地而后快;如果我采取合作态 度,对方很可能也会合作。
为什么我不首先采取合作态度——把价格定在垄 断价格呢?
© 2011-13 王秋石
3/100
重复性博弈:日常生活
在公交车上,我们很少为素不相识的乘客买车票 ,因为这大凡是一次性博弈。
但这个威胁可信吗?在一次性博弈中,一旦A选择 了下,B就没办法了,只有在0和1的收益中进行理 性选择,只好有气无力地选择右啰。
© 2011-13 王秋石
16/100
“先动优势”
现在我们这样思考:在此博弈中,如果由于种种原 因,B为先动者,均衡点又何在呢?它是否证明了 所谓“先动优势”?
如果上例中的B先动,他会选择左,然后A没办法 ,只好选择上。先动者得到了9的收益,后动时他 只得到1。
同理,第八轮、第七轮……都会出现只玩一次博 弈的纳什均衡。
只要这一博弈重复的次数已知,每一轮的结果都 是原纳什均衡的结果。
© 2011-13 王秋石
8/100
无限次重复性博弈
以牙还牙策略只有在无限 次重复性博弈中才能有效 。
欧佩克(OPEC)是一个合 作比较成功的卡特尔组织 ,其原因之一就是无限次 重复性博弈所隐含的各种 惩罚机制。
重复性博弈——摆脱囚犯困境。
© 2011-13 王秋石
1/100
重复性博弈
20 世纪60 年代进行的实验性研究寻找到了一种简 单的办法——以牙还牙(tit-for-tat)策略——能够有 效地让意欲违约者保持克制。
以牙还牙策略是指在重复性博弈过程中某一选手 对对方在前一期的合作同样也采取合作的态度, 对对方不合作则采取报复性的策略。
而我们很可能为朋友买车票,我们与朋友的交往 是重复性博弈。如果他是个吝啬鬼,你可以选择 不与他同车等。
在重复性博弈中,每个人都比较关心自己的声誉 ,正是这种声誉机制使得人们大量采取合作性策 略。
© 2011-13 王秋石
4/100
重复性博弈:军事合作
牙还牙策略在军事上也有所表现。 《有核国家首先不使用核武器的协议》到目前为
重复性博弈
在现实生活中,寡头间关于彼此产量和价格的决策 远不止一次,他们根据对手的行为在不断地调整自 己的产量和价格。
这种不断调整其策略并改变收益的博弈被称为重 复性博弈。
当囚犯困境的双方只能进行一次性博弈时,很难 进行有效的惩罚;而在重复性博弈时,有效的惩 罚对方或者威胁对方就成为可能了。
无限次重复性博弈所形成 的合作均衡解并不是稳定 的,它较为容易被打破。
© 2011-ຫໍສະໝຸດ Baidu3 王秋石
9/100
序列博弈
到目前为止所讨论的博弈都是两个选手要同时选 择策略。例如,在古诺模型中,两家企业同时决 定产量。
在序列博弈中,选手们按先后顺序进行选择。因 此,序列博弈就是选手依次出招的博弈。
再看看选手B,他有些可 怜,他本可享受9,最后 只好收益为1。他要看人 家的脸色行事。
© 2011-13 王秋石
15/100
“先动优势”
当然,他可以向A发出威胁:如果A选下,他报复 性地选左,两人都同归于尽,各自收益为零。
如果A相信B会实施威胁,A只好选择上,这样,A 的收益至少为1,而不是零。