第四章重复博弈.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
如果厂商2偏离上述触发策略,则他在第一阶段所 选产量应为给定厂商1产量为1.5时,自己的最大利润产 量,即满足:
max8 1.5 q q 2q max4.5 q q
q2
2
2
2
q2
2
2
解得 q 2.25 ,此时利润为5.0625,高于 触发策略第一阶段得益4.5。
厂商2 得益
(0,5) (1,4)
什均衡,各博弈方的平 均得益为( x1 ,, xn )
(4,4)
(4,1) (1,1) (5,0)
厂商1得益
4.3.3 无限次重复古诺模型
假定: P 8 Q, 其中Q q q
1
在无限次重复古诺模型中,当贴现率 满足一 定条件时,两厂商采用下列触发策略构成一个子博弈完美 纳什均衡:
可以运用触发策略实 现较好的结果 厂商2 厂 商 1 H M L H 5,5 6,0 2,0 M 0,6 3,3 2,0 三价博弈 L 0,2 0,2 1,1 厂 H 商 M 1 L H 8,8 7,1 3,1 厂商2 M 1,7 4,4 3,1
L 1,3 1,3 2,2
两次重复三价博弈的等价模型
触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复 博弈方1:第一次选H;如第一次结果为(H,H),则第二次选M,否则选L 博弈方2:同博弈方1 子博弈完美纳什均衡路径:第一阶 段(H,H),第二阶段(M,M)
定理:设原博弈G有唯一的纯 策略纳什均衡,则对任意整数T, 重复博弈 G(T)有唯 一的子博 弈完美纳什均衡,即各博弈方 每个阶段都采用G的纳什均衡 策略。各博弈方在G(T)中的总 得益为在G中得益的T倍,平均 得益等于原博弈G的得益。
囚徒2 坦 白 不坦白
囚 坦白 徒 1 不坦白
-5,-5 -8,0
V 4 V
V 4 1
因此当 1 / 4
时,
4 5 1 1
此触发策略为纳什均衡策略
两寡头削价竞争无限次重复博弈的民间定理
无限次重复博弈民间定 理:设G是一个完全信息 的静态博弈。用 (e1 ,, en )记G的纳什均衡的得益, 用( xi ,, xn )表示G的任意可实现得益。如 果xi ei 对任意博弈方i都成立,而足够接近 1,那么无限 次重复博弈G (, )中一定存在一个子博弈 完美纳
重复博弈的得益
平均得益 :如果一常数 作为重复博弈(有限次 重复博弈或 无限次重复博弈)各个 阶段的得益,能产生与 得益序列
1, 2 ,相同的现在值,则称 为 1, 2 ,的平均得益
有限次重复博弈不一定 考虑贴现因素
若重复次数较少,或每次 重复时间间隔短
无限次重复博弈必须考 虑贴现问题 (1 ) t 1 t
削价竞争博弈
上述结论对有限次古诺模型重复博弈也成立。
重复囚徒困境悖论和连锁店悖论
重复囚徒困境博弈结果与直觉经验和大量 实验结果不一致;
进
B 不进
塞尔顿(1978)提出”连锁店悖论”
A 不打击
打击
(1,10)
(-2,3)
(5 ,5)
症结:较多阶段的动态博弈中逆推归纳法 的适用性
4.2.3多个纯策略纳什均衡博弈的 有限次重复博弈
该博弈一次性博弈均衡是都采用低价,是囚徒困境型 博弈
无限次重复两寡头削价博弈
触发策略:第一阶段采用H,如果前t-1阶段的结 果都是(H,H),则继续采用H,否则采用L。 如果博弈方2采用L,总得益现值为
5 1 1 5
2
1
如果博弈方2采用H,总得益现值为
采用触发策略:π*/(1-δ) 第一阶段偏离:此时厂商2最优产量q2=(6-q*)/2,得益 πd=(6-q*)2/4,无限次博弈得益现值为
4 d c (6 q ) / 4 1 1
* 2
低水平的合作
只有当
(6 2q* )q* / (1 ) (6 q*) 2 / 4 4 1
策略与平均得益
重复博弈不同策略、均衡及一次性博弈得益比较
不同策略组合、均衡得益图示
厂商2 得益
(1,4) (1.5,3) (3,3) (2.5,2.5) (2,2)
平均效率和公平性 较好的均衡结果
(3,1.5)
(4,1) 厂商1得益
两市场博弈的重复博弈(重复三次或以上)
三次及以上存在触发策略运用的条件 触发策略
厂商1 第一阶段选A;若第一阶段结果为(A,A),则第二 阶段选A, 若第一阶段为(A,B),则第二阶段选B,第三阶 段无条件选B 厂商2 第一阶段选A;第二阶段无条件选B,若第一阶段 结果为(A,A), 则第三阶段选A,若第一阶段为(B,A),则 第三阶段选B
均衡路径(A,A) (A,B) (B,A)
其中w为一次性博弈中各 方最差均衡得益数组
厂商2 得益
(1,4) (3,3)
w=(1.1) (1,1)
(4,1)
厂商1得益
4.3 无限次重复博弈
4.3.1 两人零和博弈的无限次重复博弈 4.3.2 唯一纯策略纳什均衡博弈 的无限次重复博弈 4.3.3 无限次重复古诺模型 4.3.4 有效工资率
4.2.1 两人零和博弈的有限次重复博弈
零和博弈是严格竞争的,重复博弈并不改变这 一点。 以零和博弈为原博弈的有限次重复博弈与猜硬 币博弈的有限次重复博弈一样,博弈方的正确 策略是重复一次性博弈中的纳什均衡策略。 上述结论可推广到非零和或多个博弈方,没有 纯策略纳什均衡的严格竞争博弈中。
4.2.2唯一纯策略纳什均衡博弈的 有限次重复博弈
(1 p)t 1 1 p t 1 t 1 t t ( ) t t 1 (1 ) 1 t 1 t 1 t 1
其中, (1 p) /(1 )
4.2 有限次重复博弈
4.2.1 两人零和博弈的有限次重复博弈 4.2.2 唯一纯策略纳什均衡博弈 的有限次重复博弈 4.2.3 多个纯策略纳什均衡博弈 的有限次重复博弈 4.2.4 有限次重复博弈的民间定理
2
,边际成本都为2。
在第一阶段生产垄断产量的一半1.5;在第 t 阶段, 如果前 t-1 阶段结果都是(1.5,1.5),则继续生产1.5, 否则生产古诺产量2。
设厂商1已采用该触发策略,若厂商2也采用该触发策 略,则每期得益4.5,无限次重复博弈总得益的现值为:
4.5 4.51 1
2
但从第二阶段开始,厂商1将报复性地永远采用古诺产 量2,这样厂商2也被迫永远采用古诺产量,从此得利润4。 因此,无限次重复博弈第一阶段偏离的情况下总得益的现 值为: 4 5.0625 4 5.0625 1
2
当
4.5 4 5.0625 即 9 17 1 1
t 1
/ (1 ) t 1 t
t 1
随机停止和贴现率
随机结束重复博弈:停止重复概率p,重复下去概率1-p。 设某博弈方第t阶段得益为πt,利率为γ,则该博弈方 期望得益的现在值为:
1 2 (1 p) /(1 ) 3 (1 p)2 /(1 )2
厂 H 商 M 1 L
重复三价博弈的等价博弈: 不可信报复
触发策略在不少情况是 非常可信的
Leabharlann Baidu
两市场博弈的重复博弈(重复两次)
厂商2 A 厂 商 1 A B 3,3 4,1 B 1,4 0,0 没有运用触发策略的条 件(或机会)
触发策略不是普遍 存在的
两市场博弈
(A,B)+(A,B) OR (B,A)+(B,A)——(1,4)(4,1) 连续两次采用混合策略——(2,2) (A,B)+(B,A) OR (B,A)+(A,B)——(2.5,2.5)轮换策略 一次纯策略+一次混合策略——(1.5,3)(3,1.5)
0,-8
-1,-1
(-5,-5) 囚徒2 坦 白 不坦白 囚 坦白 -10,-10 徒 1 不坦白 -13,-5 -5,-13 -6,-6
(-10,-10)
有限次重复削价竞争博弈
寡头2 高 价 低 价
寡 头 1
高价 低价
100,100 150,20
20,150 70,70
有唯一纯策略纳什均衡 (70,70) 有限次重复的结果仍然是 (低价,低价)
4.3.1 两人零和博弈的无限次重复博弈
不存在合作的潜 在利益
两人零和博弈无限次重复的所有阶段都不可能发生合作, 博弈方会一直重复原博弈的混合策略纳什均衡 上述结论可以推广到更多博弈方、非零和严格竞争的无 限次重复博弈
4.3.2唯一纯策略纳什均衡博弈 的无限次重复博弈
两寡头削价竞争博弈
H H L 4,4 5,0 L 0,5 1,1
厂商2才愿意采用触发策略,否则肯定会偏离。即只有 当 q*≥2(9-5δ)/(9-δ)时,触发策略是稳定的。
结论:
δ越大,能支持越低的子博弈完美纳什均衡产量 q* δ接近0时,q*接近古诺产量2 0<δ<9/17时,qm/2<q*<qc
因此,通货膨胀越严重的国家,企业在经济活动中的短期行为更严重。
上述策略是厂商2对厂商1的同样触发策略的最佳反应, 否则偏离是最佳反应。
低水平的合作
δ<9/17时,可构造如下触发策略:
第一阶段生产q*(qm/2<q*<qc),第t阶段,如果前t-1 阶段的结果都是(q*,q*),则继续生产q*,否则生产 古诺产量qc。 设厂商1已采用该触发策略,则厂商2期望得益
第四章 重复博弈
重复博弈:基本博弈重复进行 重复博弈中博弈方的行为和博弈结果不一定是基 本博弈的简单重复 必须把整个重复博弈过程作为整体进行研究。
本章分三节
4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈
已知概率的随机 停止重复博弈
4.1 重复博弈引论
4.1.1 为何研究重复博弈 4.1.2 基本概念
加大惩罚力度提高合作水平
构造如下触发策略:
第一阶段生产垄断产量的一半qm/2 ;在第 t 阶段,如 果前 t-1 阶段结果都是(qm/2, qm/2),则继续生产 qm/2 ,如果第t 阶段结果为(x,x),也生产qm/2,否则 生产x。
触发策略有很强的可信性,是子博弈完美纳什 均衡,双方每阶段平均得益: (3+1+4)/3=2.67
4.2.4 有限次重复博弈的民间定理
个体理性得益:不管其它博弈方的行为如 何,一博弈方在某个博弈中只要自己采取 某种特定的策略,最低限度保证能获得的 得益 可实现得益:博弈中所有纯策略组合得益 的加权平均数组 定理:设原博弈的一次性博弈有均衡得益 数组优于w,那么在该博弈的多次重复中所 有不小于个体理性得益的可实现得益,都 至少有一个子博弈完美纳什均衡的极限的 平均得益来实现它们
4.1.1 为何研究重复博弈
普遍存在性:经济中的长期关系
与一次性博弈的差异:未来利益对当前行为的制约
与动态博弈的差异:各阶段有独立的选择和利益
短期关系中缺乏 形成某种默契或 合作关系,或通 过报复、制裁的 威胁,约束相互 行为,追求共同 利益的机会
4.1.2 基本概念
有限次重复博弈:给定一个基本博弈G(可以是静态博弈, 也可以是动态博弈),重复进行T次G,并且在每次重复G 之前各博弈方都能观察到以前博弈的结果,这样的博弈过 程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T) 的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶 段”。 无限次重复博弈:一个基本博弈G一直重复进行下去的博 弈,记为G( )—没有可以预见的结束时间,主观上认为会不断进行 策略:博弈方在每个阶段针对每种情况如何行为的计划 子博弈:从某个阶段(不包括第一阶段)开始,包括此后 所有的重复博弈部分 均衡路径:由每个阶段博弈方的行为组合串联而成
触发策略的进一步讨论
触发策略存在报复机制 的可信性问题
触发策略不可信,因此 不管第一阶段结果如何, 第二阶段都是(M,M)
第一阶段 得益矩阵 H 8,8 9,3 5,3 厂商2 M 3,9 6,6 5,3 L 3,5 3,5 4,4
如果第一阶段一方偏离H,另 一方第二阶段采用报复性的L 策略是不可信的。
如果厂商2偏离上述触发策略,则他在第一阶段所 选产量应为给定厂商1产量为1.5时,自己的最大利润产 量,即满足:
max8 1.5 q q 2q max4.5 q q
q2
2
2
2
q2
2
2
解得 q 2.25 ,此时利润为5.0625,高于 触发策略第一阶段得益4.5。
厂商2 得益
(0,5) (1,4)
什均衡,各博弈方的平 均得益为( x1 ,, xn )
(4,4)
(4,1) (1,1) (5,0)
厂商1得益
4.3.3 无限次重复古诺模型
假定: P 8 Q, 其中Q q q
1
在无限次重复古诺模型中,当贴现率 满足一 定条件时,两厂商采用下列触发策略构成一个子博弈完美 纳什均衡:
可以运用触发策略实 现较好的结果 厂商2 厂 商 1 H M L H 5,5 6,0 2,0 M 0,6 3,3 2,0 三价博弈 L 0,2 0,2 1,1 厂 H 商 M 1 L H 8,8 7,1 3,1 厂商2 M 1,7 4,4 3,1
L 1,3 1,3 2,2
两次重复三价博弈的等价模型
触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复 博弈方1:第一次选H;如第一次结果为(H,H),则第二次选M,否则选L 博弈方2:同博弈方1 子博弈完美纳什均衡路径:第一阶 段(H,H),第二阶段(M,M)
定理:设原博弈G有唯一的纯 策略纳什均衡,则对任意整数T, 重复博弈 G(T)有唯 一的子博 弈完美纳什均衡,即各博弈方 每个阶段都采用G的纳什均衡 策略。各博弈方在G(T)中的总 得益为在G中得益的T倍,平均 得益等于原博弈G的得益。
囚徒2 坦 白 不坦白
囚 坦白 徒 1 不坦白
-5,-5 -8,0
V 4 V
V 4 1
因此当 1 / 4
时,
4 5 1 1
此触发策略为纳什均衡策略
两寡头削价竞争无限次重复博弈的民间定理
无限次重复博弈民间定 理:设G是一个完全信息 的静态博弈。用 (e1 ,, en )记G的纳什均衡的得益, 用( xi ,, xn )表示G的任意可实现得益。如 果xi ei 对任意博弈方i都成立,而足够接近 1,那么无限 次重复博弈G (, )中一定存在一个子博弈 完美纳
重复博弈的得益
平均得益 :如果一常数 作为重复博弈(有限次 重复博弈或 无限次重复博弈)各个 阶段的得益,能产生与 得益序列
1, 2 ,相同的现在值,则称 为 1, 2 ,的平均得益
有限次重复博弈不一定 考虑贴现因素
若重复次数较少,或每次 重复时间间隔短
无限次重复博弈必须考 虑贴现问题 (1 ) t 1 t
削价竞争博弈
上述结论对有限次古诺模型重复博弈也成立。
重复囚徒困境悖论和连锁店悖论
重复囚徒困境博弈结果与直觉经验和大量 实验结果不一致;
进
B 不进
塞尔顿(1978)提出”连锁店悖论”
A 不打击
打击
(1,10)
(-2,3)
(5 ,5)
症结:较多阶段的动态博弈中逆推归纳法 的适用性
4.2.3多个纯策略纳什均衡博弈的 有限次重复博弈
该博弈一次性博弈均衡是都采用低价,是囚徒困境型 博弈
无限次重复两寡头削价博弈
触发策略:第一阶段采用H,如果前t-1阶段的结 果都是(H,H),则继续采用H,否则采用L。 如果博弈方2采用L,总得益现值为
5 1 1 5
2
1
如果博弈方2采用H,总得益现值为
采用触发策略:π*/(1-δ) 第一阶段偏离:此时厂商2最优产量q2=(6-q*)/2,得益 πd=(6-q*)2/4,无限次博弈得益现值为
4 d c (6 q ) / 4 1 1
* 2
低水平的合作
只有当
(6 2q* )q* / (1 ) (6 q*) 2 / 4 4 1
策略与平均得益
重复博弈不同策略、均衡及一次性博弈得益比较
不同策略组合、均衡得益图示
厂商2 得益
(1,4) (1.5,3) (3,3) (2.5,2.5) (2,2)
平均效率和公平性 较好的均衡结果
(3,1.5)
(4,1) 厂商1得益
两市场博弈的重复博弈(重复三次或以上)
三次及以上存在触发策略运用的条件 触发策略
厂商1 第一阶段选A;若第一阶段结果为(A,A),则第二 阶段选A, 若第一阶段为(A,B),则第二阶段选B,第三阶 段无条件选B 厂商2 第一阶段选A;第二阶段无条件选B,若第一阶段 结果为(A,A), 则第三阶段选A,若第一阶段为(B,A),则 第三阶段选B
均衡路径(A,A) (A,B) (B,A)
其中w为一次性博弈中各 方最差均衡得益数组
厂商2 得益
(1,4) (3,3)
w=(1.1) (1,1)
(4,1)
厂商1得益
4.3 无限次重复博弈
4.3.1 两人零和博弈的无限次重复博弈 4.3.2 唯一纯策略纳什均衡博弈 的无限次重复博弈 4.3.3 无限次重复古诺模型 4.3.4 有效工资率
4.2.1 两人零和博弈的有限次重复博弈
零和博弈是严格竞争的,重复博弈并不改变这 一点。 以零和博弈为原博弈的有限次重复博弈与猜硬 币博弈的有限次重复博弈一样,博弈方的正确 策略是重复一次性博弈中的纳什均衡策略。 上述结论可推广到非零和或多个博弈方,没有 纯策略纳什均衡的严格竞争博弈中。
4.2.2唯一纯策略纳什均衡博弈的 有限次重复博弈
(1 p)t 1 1 p t 1 t 1 t t ( ) t t 1 (1 ) 1 t 1 t 1 t 1
其中, (1 p) /(1 )
4.2 有限次重复博弈
4.2.1 两人零和博弈的有限次重复博弈 4.2.2 唯一纯策略纳什均衡博弈 的有限次重复博弈 4.2.3 多个纯策略纳什均衡博弈 的有限次重复博弈 4.2.4 有限次重复博弈的民间定理
2
,边际成本都为2。
在第一阶段生产垄断产量的一半1.5;在第 t 阶段, 如果前 t-1 阶段结果都是(1.5,1.5),则继续生产1.5, 否则生产古诺产量2。
设厂商1已采用该触发策略,若厂商2也采用该触发策 略,则每期得益4.5,无限次重复博弈总得益的现值为:
4.5 4.51 1
2
但从第二阶段开始,厂商1将报复性地永远采用古诺产 量2,这样厂商2也被迫永远采用古诺产量,从此得利润4。 因此,无限次重复博弈第一阶段偏离的情况下总得益的现 值为: 4 5.0625 4 5.0625 1
2
当
4.5 4 5.0625 即 9 17 1 1
t 1
/ (1 ) t 1 t
t 1
随机停止和贴现率
随机结束重复博弈:停止重复概率p,重复下去概率1-p。 设某博弈方第t阶段得益为πt,利率为γ,则该博弈方 期望得益的现在值为:
1 2 (1 p) /(1 ) 3 (1 p)2 /(1 )2
厂 H 商 M 1 L
重复三价博弈的等价博弈: 不可信报复
触发策略在不少情况是 非常可信的
Leabharlann Baidu
两市场博弈的重复博弈(重复两次)
厂商2 A 厂 商 1 A B 3,3 4,1 B 1,4 0,0 没有运用触发策略的条 件(或机会)
触发策略不是普遍 存在的
两市场博弈
(A,B)+(A,B) OR (B,A)+(B,A)——(1,4)(4,1) 连续两次采用混合策略——(2,2) (A,B)+(B,A) OR (B,A)+(A,B)——(2.5,2.5)轮换策略 一次纯策略+一次混合策略——(1.5,3)(3,1.5)
0,-8
-1,-1
(-5,-5) 囚徒2 坦 白 不坦白 囚 坦白 -10,-10 徒 1 不坦白 -13,-5 -5,-13 -6,-6
(-10,-10)
有限次重复削价竞争博弈
寡头2 高 价 低 价
寡 头 1
高价 低价
100,100 150,20
20,150 70,70
有唯一纯策略纳什均衡 (70,70) 有限次重复的结果仍然是 (低价,低价)
4.3.1 两人零和博弈的无限次重复博弈
不存在合作的潜 在利益
两人零和博弈无限次重复的所有阶段都不可能发生合作, 博弈方会一直重复原博弈的混合策略纳什均衡 上述结论可以推广到更多博弈方、非零和严格竞争的无 限次重复博弈
4.3.2唯一纯策略纳什均衡博弈 的无限次重复博弈
两寡头削价竞争博弈
H H L 4,4 5,0 L 0,5 1,1
厂商2才愿意采用触发策略,否则肯定会偏离。即只有 当 q*≥2(9-5δ)/(9-δ)时,触发策略是稳定的。
结论:
δ越大,能支持越低的子博弈完美纳什均衡产量 q* δ接近0时,q*接近古诺产量2 0<δ<9/17时,qm/2<q*<qc
因此,通货膨胀越严重的国家,企业在经济活动中的短期行为更严重。
上述策略是厂商2对厂商1的同样触发策略的最佳反应, 否则偏离是最佳反应。
低水平的合作
δ<9/17时,可构造如下触发策略:
第一阶段生产q*(qm/2<q*<qc),第t阶段,如果前t-1 阶段的结果都是(q*,q*),则继续生产q*,否则生产 古诺产量qc。 设厂商1已采用该触发策略,则厂商2期望得益
第四章 重复博弈
重复博弈:基本博弈重复进行 重复博弈中博弈方的行为和博弈结果不一定是基 本博弈的简单重复 必须把整个重复博弈过程作为整体进行研究。
本章分三节
4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈
已知概率的随机 停止重复博弈
4.1 重复博弈引论
4.1.1 为何研究重复博弈 4.1.2 基本概念
加大惩罚力度提高合作水平
构造如下触发策略:
第一阶段生产垄断产量的一半qm/2 ;在第 t 阶段,如 果前 t-1 阶段结果都是(qm/2, qm/2),则继续生产 qm/2 ,如果第t 阶段结果为(x,x),也生产qm/2,否则 生产x。
触发策略有很强的可信性,是子博弈完美纳什 均衡,双方每阶段平均得益: (3+1+4)/3=2.67
4.2.4 有限次重复博弈的民间定理
个体理性得益:不管其它博弈方的行为如 何,一博弈方在某个博弈中只要自己采取 某种特定的策略,最低限度保证能获得的 得益 可实现得益:博弈中所有纯策略组合得益 的加权平均数组 定理:设原博弈的一次性博弈有均衡得益 数组优于w,那么在该博弈的多次重复中所 有不小于个体理性得益的可实现得益,都 至少有一个子博弈完美纳什均衡的极限的 平均得益来实现它们
4.1.1 为何研究重复博弈
普遍存在性:经济中的长期关系
与一次性博弈的差异:未来利益对当前行为的制约
与动态博弈的差异:各阶段有独立的选择和利益
短期关系中缺乏 形成某种默契或 合作关系,或通 过报复、制裁的 威胁,约束相互 行为,追求共同 利益的机会
4.1.2 基本概念
有限次重复博弈:给定一个基本博弈G(可以是静态博弈, 也可以是动态博弈),重复进行T次G,并且在每次重复G 之前各博弈方都能观察到以前博弈的结果,这样的博弈过 程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T) 的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶 段”。 无限次重复博弈:一个基本博弈G一直重复进行下去的博 弈,记为G( )—没有可以预见的结束时间,主观上认为会不断进行 策略:博弈方在每个阶段针对每种情况如何行为的计划 子博弈:从某个阶段(不包括第一阶段)开始,包括此后 所有的重复博弈部分 均衡路径:由每个阶段博弈方的行为组合串联而成
触发策略的进一步讨论
触发策略存在报复机制 的可信性问题
触发策略不可信,因此 不管第一阶段结果如何, 第二阶段都是(M,M)
第一阶段 得益矩阵 H 8,8 9,3 5,3 厂商2 M 3,9 6,6 5,3 L 3,5 3,5 4,4
如果第一阶段一方偏离H,另 一方第二阶段采用报复性的L 策略是不可信的。