重复博弈和默契合谋 PPT
合集下载
博弈论课件4-重复博弈
4.1.1 为什么研究重复博弈 4.1.2 基本概念
生活中的重复博弈
——你到菜场去买菜,当你担心上当受骗而犹豫不决时,
卖菜的摊主便会对你说:“你放心好了,我天天在这里卖菜, 不会骗你的,如果菜不好你回来找我!‛他强调自己‚天天‛ 在这里卖菜,你通常便会放下心来,与之成交。因为他的这 句话翻译成经济学的语言就是‚我跟你是‘重复博弈’‛! ———而一次性的买卖往往发生在双方以后不再有买卖机会 的时候,特点是尽量谋取暴利并且带欺骗性,比如车站、码 头、旅游景点的东西往往质次价高,其原因就在于买卖双方 很少有‚重复博弈‛的机会。
两人零和博弈的有限次重复博弈 惟一纯策略纳什均衡的有限次重复博弈 多个纯策略纳什均衡的有限次重复博弈 有限次重复博弈的无名氏定理
4.2.1 两人零和博弈的有限次重复博弈
猜硬币博弈
正 面 盖 硬 币 方 正 面 反 面 -1, 1 1, -1
猜硬币方 反 面 1, -1 -1, 1
零和博弈是严格竞争的,重复博弈并不改变这一点。 重复零和博弈不会创造出新的利益。
4.2.1 两人零和博弈的有限次重复博弈
以零和博弈为原博弈的有限次重复博弈与猜硬币博 弈的有限次重复博弈一样,博弈方的正确策略是重 复一次性博弈中的纳什均衡策略。 可用逆推归纳法来证明 可以推广到非零和或多个博弈方,但博弈方的利益 严格对立,没有纯策略纳什均衡的其他严格竞争博 弈中 产生原因:利益关系严格对立,矛盾不可调和
有限次重复博弈民间定理
设原博弈的一次性博弈有均衡得益数组优于w, 那么在该博弈的多次重复中,所有不小于个体理性 得益的可实现得益,都至少有一个子博弈完美纳什 均衡的极限的平均得益来实现它们。
重复博弈.ppt
中科院博弈论课程-乔晗
4
重复博弈的三个特征
1. 阶段博弈之间没有物理上的联系,即前一阶段博 弈的结果不改变后一阶段的结构(比如剪刀、石 头、布的重复);
2. 所有参与人观察到博弈过去的历史; 3. 参与人的总支付(报酬)是所有阶段博弈支付的
贴现值之和(局中人关心的不仅是现阶段收益, 还包括未来收益,因而有积极性做出不同于一次 性博弈的最优选择)。
{合作,不合作} {不合作,合作} {不合作,不合作} • 三阶段博弈? • N阶段博弈?
中科院博弈论课程-乔晗
7
重复博弈的策略空间
• 单阶段博弈:局中人的选择无法建立在对手前阶 段行动的基础上
• 重复博弈:过去的行动历史可以被观察到,局中 人的选择可以建立在其他局中人过去行动的基础 上
如:过去你欺骗我,这次我不与你合作
中科院博弈论课程-乔晗
动;(针锋相对)
• trigger strategies: 从合作开始,一直到有一方不合作,然后 永远选择不合作。(触发)
……
局中人1
合作 不合作
局中人2
合作
不合作
3,3
-1,4
4,-1
0,0
中科院博弈论课程-乔晗
9
重复博弈的策略空间
• 重复博弈中,局中人可以选择的策略空间变大 • 新策略的出现使得局中人可以对对方过去的行动
1 L1 2
R1 2
L2 1
R2 1
L2 1
R2 1
L1
R1
L1
R1
L1
R1
L1
R1
2
2
2
2
2
2
2
2
L2
R2 L2
重复博弈博弈论课件.ppt
重 复 博 弈
重复博弈
动态博弈的类型
序贯博弈sequential game
每一个阶段的博弈结构是不同的,即从后一个决策结开 始的子博弈不同于从前一个决策结开始的子博弈。或者 说,同样结构的博弈只出现一次。 是指同样结构的博弈重复多次,其中的每次博弈称为 “阶段博弈”。如“囚徒困境”中小偷每次作案后判刑 释放后又作案。 分为有限次重复博弈与无限次重复博弈
H H 厂商1 M L 5, 5 6, 0 2,0
厂商2 M
L 0,2 0,2 1,1
0,6 3,3 2,0
触发策略可信的情况
博弈方1:第一次选H,如 果第一次结果为 (H,H),则第二次选择 M;否则采用P 博弈方2:第一次选H,如 果第一次结果为 (H,H),则第二次选择 M;否则采用Q
博弈方1 H M L P Q
5,5 6,0 2,0
重复两阶段三价博弈的等价博弈:如果 认为触发策略不可信,即不可信报复, 最佳选择为(M,M)
触发策略可信性问题
实际上,触发策略中的报复机制的可信性是一个很复 杂的问题,会受到相互预期等很多复杂因素的影响。 例如,未偏离的一方并不想报复偏离的一方,而偏离 的一方却因为害怕报复而采用L,结果心慈手软的未偏 离一方再次遭受损失,这种可能性的存在会使得报复 机制实施的可能性增加。 此外,考虑策略的制定者和执行者分离的情况,执行 者会严格执行决策者指令的情况等等。
在有限次重复博弈中,如果原博弈存在唯一的纯策略NE, 则有限次重复博弈的唯一的均衡解就是各博弈方在每阶段 中都采用原博弈的NE。 因为每个阶段NE都是SPNE,即不存在不可信的威胁和许 诺,因此重复博弈的解也是SPNE。
重复博弈
动态博弈的类型
序贯博弈sequential game
每一个阶段的博弈结构是不同的,即从后一个决策结开 始的子博弈不同于从前一个决策结开始的子博弈。或者 说,同样结构的博弈只出现一次。 是指同样结构的博弈重复多次,其中的每次博弈称为 “阶段博弈”。如“囚徒困境”中小偷每次作案后判刑 释放后又作案。 分为有限次重复博弈与无限次重复博弈
H H 厂商1 M L 5, 5 6, 0 2,0
厂商2 M
L 0,2 0,2 1,1
0,6 3,3 2,0
触发策略可信的情况
博弈方1:第一次选H,如 果第一次结果为 (H,H),则第二次选择 M;否则采用P 博弈方2:第一次选H,如 果第一次结果为 (H,H),则第二次选择 M;否则采用Q
博弈方1 H M L P Q
5,5 6,0 2,0
重复两阶段三价博弈的等价博弈:如果 认为触发策略不可信,即不可信报复, 最佳选择为(M,M)
触发策略可信性问题
实际上,触发策略中的报复机制的可信性是一个很复 杂的问题,会受到相互预期等很多复杂因素的影响。 例如,未偏离的一方并不想报复偏离的一方,而偏离 的一方却因为害怕报复而采用L,结果心慈手软的未偏 离一方再次遭受损失,这种可能性的存在会使得报复 机制实施的可能性增加。 此外,考虑策略的制定者和执行者分离的情况,执行 者会严格执行决策者指令的情况等等。
在有限次重复博弈中,如果原博弈存在唯一的纯策略NE, 则有限次重复博弈的唯一的均衡解就是各博弈方在每阶段 中都采用原博弈的NE。 因为每个阶段NE都是SPNE,即不存在不可信的威胁和许 诺,因此重复博弈的解也是SPNE。
第讲博弈论重复博弈课件
反悔去用其他策略?
• 如果你知道对方会一直坦白,那么你的最佳应对是一直坦白 • T,T,T,T,… • T,T,T,T,…
第讲博弈论重复博弈
24
重复博弈和无名氏定理
• 考虑下列所谓的“冷酷策 略”(grim strategies):
• 开始时选择抵赖;
• 选择抵赖直到有一方选择
囚 徒
1
了坦白,然后永远选择坦
19
• 当博弈有多个纳什均衡时,参与人可以使用不同的纳什均衡惩罚 前面阶段的不合作行为或奖励第一阶段的合作行为。
• 从而迫使大家合作
第讲博弈论重复博弈
20
今天欺骗的收获 合作后的收获(承诺) – 欺骗后的收获 (威胁)
教训:在发展关系的时候,承诺合作后的收益以及威胁欺骗的惩罚, 有时能够激励今天良好行为的发生。 而这种行为,有助于创建一个好的未来!
• 但这个机会主义行为将触发他的伙伴选择“永远坦白” 的惩罚,因此i随后每个阶段的支付都是-8。
• 因此,如果下列条件满足,给定对手没有选择坦白,i 将不会选择坦白
0 a ( 8 ) a 2 ( 8 ) . . 1 . a ( 1 ) a 2 ( 1 ) ...
即
8a 1 1a 1a
第讲博弈论重复博弈
• 今天投资100万元的项目,将来如能收回200万,也不能证明此项投资一定有效。因为如果这回收的 200万要等50年之后,今天衡量的价值就远低于100万。这是由于如果利率是3%,100万元存银行,50
年内得到的利息也将达338万元(利率为2%的话,50年的利息为169万元)。所以50年后回收200万的
白。
坦白 抵赖
囚徒2 坦白 抵赖 -8,-8 0,-10
-10, 0 -1,-1
• 如果你知道对方会一直坦白,那么你的最佳应对是一直坦白 • T,T,T,T,… • T,T,T,T,…
第讲博弈论重复博弈
24
重复博弈和无名氏定理
• 考虑下列所谓的“冷酷策 略”(grim strategies):
• 开始时选择抵赖;
• 选择抵赖直到有一方选择
囚 徒
1
了坦白,然后永远选择坦
19
• 当博弈有多个纳什均衡时,参与人可以使用不同的纳什均衡惩罚 前面阶段的不合作行为或奖励第一阶段的合作行为。
• 从而迫使大家合作
第讲博弈论重复博弈
20
今天欺骗的收获 合作后的收获(承诺) – 欺骗后的收获 (威胁)
教训:在发展关系的时候,承诺合作后的收益以及威胁欺骗的惩罚, 有时能够激励今天良好行为的发生。 而这种行为,有助于创建一个好的未来!
• 但这个机会主义行为将触发他的伙伴选择“永远坦白” 的惩罚,因此i随后每个阶段的支付都是-8。
• 因此,如果下列条件满足,给定对手没有选择坦白,i 将不会选择坦白
0 a ( 8 ) a 2 ( 8 ) . . 1 . a ( 1 ) a 2 ( 1 ) ...
即
8a 1 1a 1a
第讲博弈论重复博弈
• 今天投资100万元的项目,将来如能收回200万,也不能证明此项投资一定有效。因为如果这回收的 200万要等50年之后,今天衡量的价值就远低于100万。这是由于如果利率是3%,100万元存银行,50
年内得到的利息也将达338万元(利率为2%的话,50年的利息为169万元)。所以50年后回收200万的
白。
坦白 抵赖
囚徒2 坦白 抵赖 -8,-8 0,-10
-10, 0 -1,-1
博弈论4 重复博弈62页PPT
26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。——卢梭
▪
27、只有把抱怨环境的心情,化为上进的力量,才是成功的保证。——罗曼·罗兰
▪
ቤተ መጻሕፍቲ ባይዱ
28、知之者不如好之者,好之者不如乐之者。——孔子
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇
▪
30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华
谢谢!
62
博弈论4 重复博弈
56、死去何所道,托体同山阿。 57、春秋多佳日,登高赋新诗。 58、种豆南山下,草盛豆苗稀。晨兴 理荒秽 ,带月 荷锄归 。道狭 草木长 ,夕露 沾我衣 。衣沾 不足惜 ,但使 愿无违 。 59、相见无杂言,但道桑麻长。 60、迢迢新秋夕,亭亭月将圆。
▪
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
注:(1)、可以理解为只要博弈的重复次数是有限 的,重复本身并不改变囚徒困境的均衡结果。
(2)、当阶段博弈有多个纳什均衡的时候,参 与人可以使用不同的纳什均衡惩罚或者奖励第一阶段不合 作或者合作的行为,而这点在阶段博弈只有唯一的纳什均 衡是办不到的。
2.3:有限期重复博弈(完全信息)和默契合谋
3、有限次重复博弈下默契合谋的可能性 结论:有限期重复博弈只是阶段博弈的T次简单重复,
方过去的选择; 3、参与人的总支付是所有现阶段博弈支付的贴现值之
和或者加权平均。
2.3:有限期重复博弈(完全信息)和默契合谋
2、有限次重复博弈的一个定理
定理:令G是阶段博弈,G(T)是G重复T次的重复博弈 (T<∞),那么如果G有唯一的纳什均衡,重复博弈G(T)的 唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重 复T次。
2.4:无限期重复博弈(完全信息)和默契合谋
3、上述条件之下,冷酷战略是否构成子博弈精炼纳什均衡?
在冷酷战略纳什均衡下,子博弈可以分为两类: (1)没有厂商曾经选择不合作 (2)至少有一个厂商曾经选择不合作
在(1)的情况之下,子博弈构成纳什均衡,冷酷战略是无限期重复博弈的子博弈精炼 纳什均衡,(合谋,合谋)是每个阶段博弈的均衡结果;
在(2)的情况之下,子博弈构成纳什均衡,冷酷战略是无限期重复博弈的子博弈精炼 纳什均衡,(不合作,不合作)是每个阶段的博弈的均衡结果(即伯特兰均衡的无限次重 复依然是这一博弈的均衡)。
2.4:无限期重复博弈(完全信息)和默契合谋
4、子博弈精炼纳什均衡的多重性和无名氏定理
(1)一个结论:对于δ>=1/2,如果在冷酷战略下,不是选择P=P(M)的价格, 而是选择一个价格P∈[MC,P(M)],那么介于这个区间的任何一个价格都有可能 成为冷酷战略精炼纳什均衡,而价格的选取的决定因素在于δ的大小。
分析:在一致遵守价格P的情况之下,每个企业得到
V=1/2π(p)+1/2δπ(p)+1/2δ^2π(p)+1/2δ^3π(p)+….
如果一个企业背离,在背离期间,它最多得到π(p),在以后的期间永远失 去价格为P时候的利润的一半,即
1/2δπ(p)+1/2δ^2π(p)+1/2δ^3π(p)+….=π(p)δ/2(1-δ)
例子:以囚徒困境为例,如果每次判刑不是很重,那么两 个囚犯在刑满释放之后再作案,作案之后再判刑,释放之后再作案, 如此等等,他们之间就是进行的重复博弈,其中每次作案就是一个 阶段博弈。
2.3:有限期重复博弈(完全信息)和默契合谋
(2)基本特征: 1、阶段博弈之间没有“物质上”的联系,前一个阶段
的博弈不改变后阶段的博弈; 2、所有的参与人都观测到过去的博弈的历史,知道对
所以,只要δ>=(1-δ),即δ>=1/2,背离价格P并非最佳做法
2.4:无限期重复博弈(完全信息)和默契合谋
•
也就是说企业始终制定了等于边际成本的价格水平,无法 构成合谋。
大家有疑问的,可以询问和交流
可以互相讨论下,但要小声点
2.4:无限期重复博弈(完全信息)和默契合谋
1、冷酷战略: (1)诱惑:开始选择合作,制定价格P=P(M); (2)惩罚:选择合作直到一方选择了不合作,然后永
远选择不合作,制定价格为P=MC。 注意:根据这个战略,一旦一个厂商在某个阶段选择
了不合作,那么它便会一直选择不合作
2.4:无限期重复博弈(完全信息)和默契合谋
2、什么条件之下,冷酷战略构成纳什均衡?
分析:
(1)因为两个厂商是对称的,所以对于厂商二而言,上面的分析结果相同; (2)如果V>=V’(δ>=1/2),那么给定厂商一选择冷酷战略,厂商二的最优选择 也是冷酷战略,同样的分析对于厂商一也成立,所以冷酷战略构成纳什均衡。
1.前提假设 (1)两家厂商之间的产品完全相同
(2)两家厂商无固定成本,且成本函数相同,边际成 本都为C
(3)同时决策,决策变量是价格
2.结论
Bertrand均衡是唯一的,即两家企业的价格相同且等
于边际成本C,经济利润为零。
2.3:有限期重复博弈(完全信息)和默契合谋
1.重复博弈的概念和基本特征
(1)概念:“重复博弈”(repeat game)是指同样的结构的博 弈重复多次,其中每次博弈称为“阶段博弈”(stage game)。
重复博弈和默契合谋
2.1:默契合谋——定义
1.默契合谋 ( Tacit Collusion ):即企业间通过相互观 察或发出某种信号来传递信息,并预期竞争者的行为来实 现,也有人戏称其为“早餐卡特尔”或“挤眼卡特尔”。
2.所谓默契合谋,是指寡头垄断企业以一种非合作的方式 进行勾结。
2.2:回顾——两家厂商的伯特兰均衡(纳什均衡)
(2)、当阶段博弈有多个纳什均衡的时候,参 与人可以使用不同的纳什均衡惩罚或者奖励第一阶段不合 作或者合作的行为,而这点在阶段博弈只有唯一的纳什均 衡是办不到的。
2.3:有限期重复博弈(完全信息)和默契合谋
3、有限次重复博弈下默契合谋的可能性 结论:有限期重复博弈只是阶段博弈的T次简单重复,
方过去的选择; 3、参与人的总支付是所有现阶段博弈支付的贴现值之
和或者加权平均。
2.3:有限期重复博弈(完全信息)和默契合谋
2、有限次重复博弈的一个定理
定理:令G是阶段博弈,G(T)是G重复T次的重复博弈 (T<∞),那么如果G有唯一的纳什均衡,重复博弈G(T)的 唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重 复T次。
2.4:无限期重复博弈(完全信息)和默契合谋
3、上述条件之下,冷酷战略是否构成子博弈精炼纳什均衡?
在冷酷战略纳什均衡下,子博弈可以分为两类: (1)没有厂商曾经选择不合作 (2)至少有一个厂商曾经选择不合作
在(1)的情况之下,子博弈构成纳什均衡,冷酷战略是无限期重复博弈的子博弈精炼 纳什均衡,(合谋,合谋)是每个阶段博弈的均衡结果;
在(2)的情况之下,子博弈构成纳什均衡,冷酷战略是无限期重复博弈的子博弈精炼 纳什均衡,(不合作,不合作)是每个阶段的博弈的均衡结果(即伯特兰均衡的无限次重 复依然是这一博弈的均衡)。
2.4:无限期重复博弈(完全信息)和默契合谋
4、子博弈精炼纳什均衡的多重性和无名氏定理
(1)一个结论:对于δ>=1/2,如果在冷酷战略下,不是选择P=P(M)的价格, 而是选择一个价格P∈[MC,P(M)],那么介于这个区间的任何一个价格都有可能 成为冷酷战略精炼纳什均衡,而价格的选取的决定因素在于δ的大小。
分析:在一致遵守价格P的情况之下,每个企业得到
V=1/2π(p)+1/2δπ(p)+1/2δ^2π(p)+1/2δ^3π(p)+….
如果一个企业背离,在背离期间,它最多得到π(p),在以后的期间永远失 去价格为P时候的利润的一半,即
1/2δπ(p)+1/2δ^2π(p)+1/2δ^3π(p)+….=π(p)δ/2(1-δ)
例子:以囚徒困境为例,如果每次判刑不是很重,那么两 个囚犯在刑满释放之后再作案,作案之后再判刑,释放之后再作案, 如此等等,他们之间就是进行的重复博弈,其中每次作案就是一个 阶段博弈。
2.3:有限期重复博弈(完全信息)和默契合谋
(2)基本特征: 1、阶段博弈之间没有“物质上”的联系,前一个阶段
的博弈不改变后阶段的博弈; 2、所有的参与人都观测到过去的博弈的历史,知道对
所以,只要δ>=(1-δ),即δ>=1/2,背离价格P并非最佳做法
2.4:无限期重复博弈(完全信息)和默契合谋
•
也就是说企业始终制定了等于边际成本的价格水平,无法 构成合谋。
大家有疑问的,可以询问和交流
可以互相讨论下,但要小声点
2.4:无限期重复博弈(完全信息)和默契合谋
1、冷酷战略: (1)诱惑:开始选择合作,制定价格P=P(M); (2)惩罚:选择合作直到一方选择了不合作,然后永
远选择不合作,制定价格为P=MC。 注意:根据这个战略,一旦一个厂商在某个阶段选择
了不合作,那么它便会一直选择不合作
2.4:无限期重复博弈(完全信息)和默契合谋
2、什么条件之下,冷酷战略构成纳什均衡?
分析:
(1)因为两个厂商是对称的,所以对于厂商二而言,上面的分析结果相同; (2)如果V>=V’(δ>=1/2),那么给定厂商一选择冷酷战略,厂商二的最优选择 也是冷酷战略,同样的分析对于厂商一也成立,所以冷酷战略构成纳什均衡。
1.前提假设 (1)两家厂商之间的产品完全相同
(2)两家厂商无固定成本,且成本函数相同,边际成 本都为C
(3)同时决策,决策变量是价格
2.结论
Bertrand均衡是唯一的,即两家企业的价格相同且等
于边际成本C,经济利润为零。
2.3:有限期重复博弈(完全信息)和默契合谋
1.重复博弈的概念和基本特征
(1)概念:“重复博弈”(repeat game)是指同样的结构的博 弈重复多次,其中每次博弈称为“阶段博弈”(stage game)。
重复博弈和默契合谋
2.1:默契合谋——定义
1.默契合谋 ( Tacit Collusion ):即企业间通过相互观 察或发出某种信号来传递信息,并预期竞争者的行为来实 现,也有人戏称其为“早餐卡特尔”或“挤眼卡特尔”。
2.所谓默契合谋,是指寡头垄断企业以一种非合作的方式 进行勾结。
2.2:回顾——两家厂商的伯特兰均衡(纳什均衡)