博弈论课件 第四章
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
共性:重复博弈本质上只不过是原博弈的简单重复, 重复博弈每个阶段采取的策略就是原博弈中所采取的 策略,在零和博弈的情况下是同样的混合策略NE,在 后一种情况下则是纯策略NE;
重复博弈并不能给博弈方带来比一次博弈更好的结果, 每阶段的平均得益与一次性博弈的得益相同。
例:如果T次重复齐威王田忌赛马,双方在该重
触发策略trigger strategy:首先试探合作,一 旦发觉对方不合作,则也用不合作相报复的策略。 冷酷策略grim strategy
例3:分析两次重复制式问题时双方的 均衡策略
彩电有不同的制式,采用相同的制式,则厂商 之间由于零部件的通用性,相关设备可相互匹 配等大家都能获得一定的好处。
设有两厂商都决定引进彩电生产线,可选择的 有A,B两种制式,则两厂商面临一个决定制式 的博弈。
A 厂商A
B
厂商B
A
B
1,3
0,0
0,0
2,2
定理 设原博弈G有惟一的纯策略纳什均衡,则对任意正整数T,重复博弈G(T)有惟一的子博弈
一般结论:
(1)在有限次重复博弈中,如果原博弈存在唯一的纯策略纳什 均衡策略组合,则有限次重复博弈的唯一的均衡解即各博弈方在 每阶段中都采用原博弈的纳什均衡; (2)由于在这样的双方策略下,均衡路径中的每个阶段都不存 在任何不可信的威胁或许诺,因此这种均衡是子博弈完美纳什均 衡。 (3)在一个博弈中的每个博弈方的所有得益上各自加上相同的 数值不会改变博弈原来的均衡
有限次重复博弈的囚徒困境
两次
囚
坦白
徒
1
不坦白
囚徒2
坦白
不坦白
-Hale Waihona Puke , -50, -8-8, 0
-1, -1
重复博弈等价于图4.2
图 4 .1 囚 徒 的 困 境 博 弈
囚徒2
坦白
不坦白
囚
坦白
徒
-10, -10
-5, -13
1
不坦白
-13, -5
-6, -6
TG G G (T )
图 4 .2 逆 推 归 纳 法 和 等 价 博 弈
有限次重复猜硬币博弈
各博弈方的正确策略就是在每次重复中都采用 一次性博弈中的纳什均衡策略。
4.2.2 惟一纯策略纳什均衡博弈的有限 次重复博弈
在有惟一纯策略纳什均衡的博弈中,博弈方之间的利 益关系不再是始终对立的,而是有很大一致性甚至完 全一致。
在以这样的博弈为原博弈的有限次重复博弈中,博弈 方的行动和博弈结果会不会发生质的变化?
一般结论:在有限次重复博弈中,如果原博弈存在唯一的纯策略纳什均衡策略组 合,则有限次重复博弈的唯一的均衡解即各博弈方在每阶段中都采用原博弈的纳 什均衡;
(2)由于在这样的双方策略下,均衡路径中的每个阶段都不存在任何不可信的 威胁或许诺,因此这种均衡是子博弈完美纳什均衡。 (3)在一个博弈中的每个博弈方的所有得益上各自加上相同的数值不会改变博弈 原来的均衡
复博弈中的策略是什么?博弈结果如何?
特点:此博弈是混合博弈NE的严格竞争零和 博弈,对一方有利的策略组合总是对另一方不 利,没有一个策略组合双方同时愿意接受。
例2:重复博弈与一次性博弈效率不同?
4.2.3 有两个纳什均衡博弈的有限次重 复博弈
重复博弈有可能有多个子博弈完美纳会均衡 路径重复次数越多,这种路径也越多,并且 会出现在原博弈中并非均衡的策略组合在重 复博弈中却构成其子博弈完美纳什均衡的一 个部分的情况。
厂 商 1得 益 图 4 .9 两 市 场 博 弈 及 重 复 博 弈 各 均 衡 的 平 均 得 益
例:两市场博弈的重复博弈(进行三次)
厂商1:第一阶段选A;如果第一阶段结果是(A,A),
则第二阶段选A;如果第一阶段结果是(A,B),则第二
阶段选B;第三阶段无条件选B。
厂商2:第一阶段选A;则第二阶段无条件选B;如果第
结论:纯策略NE多于一个,无法肯定在一次博 弈中两博弈方究竟会作何选择,哪个结果会出 现。
4.2.3 多个纯策略纳什均衡博弈的有限 次重复博弈
触发策略trigger strategy:首先试探合作, 一旦发觉对方不合作,则也用不合作相报 复的策略。 冷酷策略grim strategy
例:博弈G如下图:
例:两市场博弈的重复博弈
两个厂商1和2,同时面临两个市场机会A和B。假设每个 厂商都只有能力选择一个市场发展,即他们的可选策略 都是A或B。 A:市场较大,但开发程度还很低 B:市场较小,但已不需花大力气去开发市场
厂商2
A
B
轮换策略:双方轮流去两个不同市场的策略。
产A 商
1 B
3, 3
1, 4
4, 1
– 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的 每种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m 种策略组合,那么重复两次就有m2条博弈路径,重复次就有mt条博弈路径。
4.2.1 两人零和博弈的有限次重复博弈
重复零和博弈不会创造出新的利益。 合作的可能性根本不存在。即使双方都知道还要重复
最重要的是:触发策略所带的威胁的可信性。
两博弈方:不管第一阶段结果如何,第二阶段总为(R,R), 得益(3,3) 所采用的触发策略的威胁的可信性是勉强的。
博弈2
LM R 博 L 4,4 8,3 3,3 弈 M 3,8 7,7 3,3 1 R 3,3 3,3 6,6
最重要的是:触发策略所带的威胁的可信性。
如果原博弈惟一的纯策略纳什均衡本身就是帕累托意 义上的最佳策略组合,那么因为符合所有博弈方的利 益,因此,有限次重复显然不会改变博弈方的行动方 式。
分析:原博弈惟一的纳什均衡没有达到帕累托效率, 因此存在通过合作进一步提高效率的潜在可能性的囚 徒困境式的博弈,在有限次重复博弈中能不能实现合 作和提高效率呢?
市场; (3)石油输出国组织成员之间地位的不平衡; (4)有些国家由于政治、经济、军事等方面
的原因造成资金、财政紧张;
有限次重复削价竞争模型
高价 寡
头
1
低价
寡头2
高价
低价
100, 100
20, 150
150 , 20
70 , 70
图 4.3 削 价 竞 争 博 弈
重复囚徒困境悖论和连锁店悖论
一阶段结果是(A,A),则第三阶段选A ;如果第一阶段
结果是(B,A),则第三阶段选B; 厂商2
A
B
三阶段路径:(A,A)到(A,B) 产 A 3, 3
1, 4
再到(B,A)是SPNE路径
商 1
平均得益=(3+1+4)/3=2.67
B
4, 1
0, 0
轮换策略:双方轮流去两个不同市场的策略。
图 4 .8 两 市 场 博 弈
0, 0
图 4 .8 两 市 场 博 弈
例:两市场博弈的重复博弈
产A 商
1 B
厂商2
A
B
3, 3
1, 4
4, 1
0, 0
图 4 .8 两 市 场 博 弈
厂 商 2得 益
(1 ,4 )
(1 .5 ,3 )
(3 ,3 )
(2 .5 ,2 .5 )
(2 ,2 ) (3 ,1 .5 ) (4 ,1 )
轮换策略:双方轮流去两个不同市场的策略。
博弈2 LM R 博 L 1,1 5,0 0,0 弈 M 0,5 4,4 0,0 1 R 0,0 0,0 3,3
最重要的是:两次重复的路径中包括的SPNE中 可在第一阶段采用非原博弈的均衡策略
例:博弈G如下图:
博弈方1:第一阶段选M;如第一阶段结果为(M,M), 则第一阶段选R;如第一阶段结果为任何其他 策略组合,则选L.
定理 : 设原博弈G有惟一的纯策略纳什均衡,则对任意 正整数T,重复博弈G(T)有惟一的子博弈完美纳什均衡 ,即各博弈方每个阶段都采用G的纳什均衡策略。各博 弈方在G(T)中的总得益为在G中得益的T倍,平均得益 等于原博弈G中的得益。
石油输出国组织的困境
(1)某些成员国的石油资源已趋枯竭; (2)不少非石油输出国组织成员国加入石油
三价博弈的重复博弈
H
H 产 商M 1
L
5, 5 6, 0 2, 0
厂商2 M
0, 6 3, 3 2, 0
L
0, 2 0, 2 1, 1
图 4.4 三 价 博 弈
H 产 商M 1
L
厂商2
H
M
8,8
1,7
L
1,3
7,1
4,4
1,3
3,1
3,1
2,2
图 4.5 两 次 重 复 三 价 博 弈 的 等 价 博 弈
第四章 博弈论课件
何为“重复博弈”?
重复博弈是指基本博弈重复进行构成的博弈过程。 – 重复博弈中每个阶段中的博弈方、可选策略、规则 和得益都是相同的----是特殊的动态博弈; – 形式上是基本博弈的重复进行,但博弈方的行为和 博弈结果不一定是基本博弈的简单重复,因为博弈 方对于博弈会重复进行的意识,会使他们对利益的 判断发送变化,从而使他们在重复博弈过程不同阶 段的行为选择受到影响。 – 可信度:子博弈完美性仍是判断均衡是否稳定可靠 的重要判断依据
§4.1 引 论
4.1.1 为何研究“重复博弈” (Game):
4.1.2 基本概念:
分类:有限次重复博弈,无限次重复博弈
– 有限次重复博弈:给定一个基本博弈G(可以静态,也可以动 态),重复进行了T次G,并且在每次重复G之前,各博弈方都 能观察到以前博弈的结果,这样的博弈过程称为“G的T次重 复博弈”,记为G(T)。而G称为G(T)的“原博弈”。G(T)中的 每次重复称为G(T)的一个“阶段”。
4.2 有限次重复博弈
有限次重复博弈:给定一个基本博弈G(可以 静态,也可以动态),重复进行了T次G,并且 在每次重复G之前,各博弈方都能观察到以前 博弈的结果,这样的博弈过程称为“G的T次重 复博弈”,记为G(T)。而G称为G(T)的“原博 弈”。G(T)中的每次重复称为G(T)的一个“阶 段”。
– 无限次重复博弈:理论上,重复博弈可以无限制进行下去, 不一定经过一定次数重复以后就必须结束。如果一个基本博 弈G一直重复下去,这样的重复博弈就是“无限次重复博弈”, 记为G(∞)。无限次重复博弈的基本博弈也称为“原博弈”。
– 无限次重复博弈是有无限个阶段的动态博弈。
重复博弈的次数虽然有限,但重复的次数或 博弈结束的时间不确定,这种重复博弈中博弈方 的行为选择与确定结束时间的有限次重复博弈很 不同,与无限次重复博弈很相似,甚至可以通过 某种方式与无限次重复博弈统一起来。这种重复 博弈可以称为“随机结束的重复博弈”。
(1)与直觉的差异 (2)连锁店悖论(Selten,1978)泽尔腾 一个在n个市场都开设有连锁店的企业,对于各个市
场的竞争者是否应该加以打击排斥? 由于n个市场的竞争者一般不会同时进入竞争,如果
忽略各个市场环境、竞争者不同等方面的微小差异, 这个问题对上述连锁企业来说相当于一个n次重复的 重复博弈。
博弈方2:同博弈方1:
结论:路径为第一阶段(M,M), 第二阶段(R,R),是一个SPNE路径
两博弈方都采用触发策略:第一阶段选结果为(M,M), 则第二阶段必为(R,R);而第一阶段结果为任何其他8种结 果时,第二阶段必为(L,L)
博弈2
LM R 博 L 2,2 6,1 1,1 弈 M 1,6 7,7 1,1 1 R 1,1 1,1 4,4
较多阶段的动态博弈
例:若10次重复下先来后到博弈,SPNE? 97
打进 B
不进
(0,10)
打击 A 和平
(-2,3)(5,5)
结论 : 10个重复博弈的SPNE就是重复原博弈G的子博 弈纳什均衡。这就有有名的“连锁店悖论。
总结:
第一类是由零和博弈构成的,不存在纯策略NE;第二 类是唯一的纯策略纳什么均衡的静态博弈构成的。
策略、子博弈和均衡路径
策略:
– 博弈方的一个策略就是在每个阶段(即每次重复),针对每种情况(以前阶段 的结果)如何行动的计划。
子博弈:
– 重复博弈的子博弈就是从某个阶段(不包括第一阶段)开始,包括此后所有阶 段的重复博弈部分。
– 子博弈:重复博弈?原博弈?(最后一个阶段)
路径:
– 子博弈完美纳什均衡,以逆推归纳法(逆向归纳法)为核心的子博弈完美纳什均衡 分析及相关结论,可以推广到重复博弈中。
进行许多次基本博弈,也不会改变它们在当前阶段博 弈中的行动方式,不可能变得(哪怕是暂时的)合作 和顾及对方的利益。 所有以零和博弈为原博弈的有限次重复博弈,博弈方 的正确策略都是重复一次性博弈中的纳什均衡策略。 推广:非零和或多个博弈方,博弈方的利益严格对立, 没有纯策略纳什均衡的其他严格竞争博弈中。在以这 些博弈作为原博弈构成的有限次重复博弈中,惟一的 子博弈完美纳什均衡就是所有博弈方都始终采用原博 弈的混合策略纳什均衡策略。
重复博弈并不能给博弈方带来比一次博弈更好的结果, 每阶段的平均得益与一次性博弈的得益相同。
例:如果T次重复齐威王田忌赛马,双方在该重
触发策略trigger strategy:首先试探合作,一 旦发觉对方不合作,则也用不合作相报复的策略。 冷酷策略grim strategy
例3:分析两次重复制式问题时双方的 均衡策略
彩电有不同的制式,采用相同的制式,则厂商 之间由于零部件的通用性,相关设备可相互匹 配等大家都能获得一定的好处。
设有两厂商都决定引进彩电生产线,可选择的 有A,B两种制式,则两厂商面临一个决定制式 的博弈。
A 厂商A
B
厂商B
A
B
1,3
0,0
0,0
2,2
定理 设原博弈G有惟一的纯策略纳什均衡,则对任意正整数T,重复博弈G(T)有惟一的子博弈
一般结论:
(1)在有限次重复博弈中,如果原博弈存在唯一的纯策略纳什 均衡策略组合,则有限次重复博弈的唯一的均衡解即各博弈方在 每阶段中都采用原博弈的纳什均衡; (2)由于在这样的双方策略下,均衡路径中的每个阶段都不存 在任何不可信的威胁或许诺,因此这种均衡是子博弈完美纳什均 衡。 (3)在一个博弈中的每个博弈方的所有得益上各自加上相同的 数值不会改变博弈原来的均衡
有限次重复博弈的囚徒困境
两次
囚
坦白
徒
1
不坦白
囚徒2
坦白
不坦白
-Hale Waihona Puke , -50, -8-8, 0
-1, -1
重复博弈等价于图4.2
图 4 .1 囚 徒 的 困 境 博 弈
囚徒2
坦白
不坦白
囚
坦白
徒
-10, -10
-5, -13
1
不坦白
-13, -5
-6, -6
TG G G (T )
图 4 .2 逆 推 归 纳 法 和 等 价 博 弈
有限次重复猜硬币博弈
各博弈方的正确策略就是在每次重复中都采用 一次性博弈中的纳什均衡策略。
4.2.2 惟一纯策略纳什均衡博弈的有限 次重复博弈
在有惟一纯策略纳什均衡的博弈中,博弈方之间的利 益关系不再是始终对立的,而是有很大一致性甚至完 全一致。
在以这样的博弈为原博弈的有限次重复博弈中,博弈 方的行动和博弈结果会不会发生质的变化?
一般结论:在有限次重复博弈中,如果原博弈存在唯一的纯策略纳什均衡策略组 合,则有限次重复博弈的唯一的均衡解即各博弈方在每阶段中都采用原博弈的纳 什均衡;
(2)由于在这样的双方策略下,均衡路径中的每个阶段都不存在任何不可信的 威胁或许诺,因此这种均衡是子博弈完美纳什均衡。 (3)在一个博弈中的每个博弈方的所有得益上各自加上相同的数值不会改变博弈 原来的均衡
复博弈中的策略是什么?博弈结果如何?
特点:此博弈是混合博弈NE的严格竞争零和 博弈,对一方有利的策略组合总是对另一方不 利,没有一个策略组合双方同时愿意接受。
例2:重复博弈与一次性博弈效率不同?
4.2.3 有两个纳什均衡博弈的有限次重 复博弈
重复博弈有可能有多个子博弈完美纳会均衡 路径重复次数越多,这种路径也越多,并且 会出现在原博弈中并非均衡的策略组合在重 复博弈中却构成其子博弈完美纳什均衡的一 个部分的情况。
厂 商 1得 益 图 4 .9 两 市 场 博 弈 及 重 复 博 弈 各 均 衡 的 平 均 得 益
例:两市场博弈的重复博弈(进行三次)
厂商1:第一阶段选A;如果第一阶段结果是(A,A),
则第二阶段选A;如果第一阶段结果是(A,B),则第二
阶段选B;第三阶段无条件选B。
厂商2:第一阶段选A;则第二阶段无条件选B;如果第
结论:纯策略NE多于一个,无法肯定在一次博 弈中两博弈方究竟会作何选择,哪个结果会出 现。
4.2.3 多个纯策略纳什均衡博弈的有限 次重复博弈
触发策略trigger strategy:首先试探合作, 一旦发觉对方不合作,则也用不合作相报 复的策略。 冷酷策略grim strategy
例:博弈G如下图:
例:两市场博弈的重复博弈
两个厂商1和2,同时面临两个市场机会A和B。假设每个 厂商都只有能力选择一个市场发展,即他们的可选策略 都是A或B。 A:市场较大,但开发程度还很低 B:市场较小,但已不需花大力气去开发市场
厂商2
A
B
轮换策略:双方轮流去两个不同市场的策略。
产A 商
1 B
3, 3
1, 4
4, 1
– 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的 每种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m 种策略组合,那么重复两次就有m2条博弈路径,重复次就有mt条博弈路径。
4.2.1 两人零和博弈的有限次重复博弈
重复零和博弈不会创造出新的利益。 合作的可能性根本不存在。即使双方都知道还要重复
最重要的是:触发策略所带的威胁的可信性。
两博弈方:不管第一阶段结果如何,第二阶段总为(R,R), 得益(3,3) 所采用的触发策略的威胁的可信性是勉强的。
博弈2
LM R 博 L 4,4 8,3 3,3 弈 M 3,8 7,7 3,3 1 R 3,3 3,3 6,6
最重要的是:触发策略所带的威胁的可信性。
如果原博弈惟一的纯策略纳什均衡本身就是帕累托意 义上的最佳策略组合,那么因为符合所有博弈方的利 益,因此,有限次重复显然不会改变博弈方的行动方 式。
分析:原博弈惟一的纳什均衡没有达到帕累托效率, 因此存在通过合作进一步提高效率的潜在可能性的囚 徒困境式的博弈,在有限次重复博弈中能不能实现合 作和提高效率呢?
市场; (3)石油输出国组织成员之间地位的不平衡; (4)有些国家由于政治、经济、军事等方面
的原因造成资金、财政紧张;
有限次重复削价竞争模型
高价 寡
头
1
低价
寡头2
高价
低价
100, 100
20, 150
150 , 20
70 , 70
图 4.3 削 价 竞 争 博 弈
重复囚徒困境悖论和连锁店悖论
一阶段结果是(A,A),则第三阶段选A ;如果第一阶段
结果是(B,A),则第三阶段选B; 厂商2
A
B
三阶段路径:(A,A)到(A,B) 产 A 3, 3
1, 4
再到(B,A)是SPNE路径
商 1
平均得益=(3+1+4)/3=2.67
B
4, 1
0, 0
轮换策略:双方轮流去两个不同市场的策略。
图 4 .8 两 市 场 博 弈
0, 0
图 4 .8 两 市 场 博 弈
例:两市场博弈的重复博弈
产A 商
1 B
厂商2
A
B
3, 3
1, 4
4, 1
0, 0
图 4 .8 两 市 场 博 弈
厂 商 2得 益
(1 ,4 )
(1 .5 ,3 )
(3 ,3 )
(2 .5 ,2 .5 )
(2 ,2 ) (3 ,1 .5 ) (4 ,1 )
轮换策略:双方轮流去两个不同市场的策略。
博弈2 LM R 博 L 1,1 5,0 0,0 弈 M 0,5 4,4 0,0 1 R 0,0 0,0 3,3
最重要的是:两次重复的路径中包括的SPNE中 可在第一阶段采用非原博弈的均衡策略
例:博弈G如下图:
博弈方1:第一阶段选M;如第一阶段结果为(M,M), 则第一阶段选R;如第一阶段结果为任何其他 策略组合,则选L.
定理 : 设原博弈G有惟一的纯策略纳什均衡,则对任意 正整数T,重复博弈G(T)有惟一的子博弈完美纳什均衡 ,即各博弈方每个阶段都采用G的纳什均衡策略。各博 弈方在G(T)中的总得益为在G中得益的T倍,平均得益 等于原博弈G中的得益。
石油输出国组织的困境
(1)某些成员国的石油资源已趋枯竭; (2)不少非石油输出国组织成员国加入石油
三价博弈的重复博弈
H
H 产 商M 1
L
5, 5 6, 0 2, 0
厂商2 M
0, 6 3, 3 2, 0
L
0, 2 0, 2 1, 1
图 4.4 三 价 博 弈
H 产 商M 1
L
厂商2
H
M
8,8
1,7
L
1,3
7,1
4,4
1,3
3,1
3,1
2,2
图 4.5 两 次 重 复 三 价 博 弈 的 等 价 博 弈
第四章 博弈论课件
何为“重复博弈”?
重复博弈是指基本博弈重复进行构成的博弈过程。 – 重复博弈中每个阶段中的博弈方、可选策略、规则 和得益都是相同的----是特殊的动态博弈; – 形式上是基本博弈的重复进行,但博弈方的行为和 博弈结果不一定是基本博弈的简单重复,因为博弈 方对于博弈会重复进行的意识,会使他们对利益的 判断发送变化,从而使他们在重复博弈过程不同阶 段的行为选择受到影响。 – 可信度:子博弈完美性仍是判断均衡是否稳定可靠 的重要判断依据
§4.1 引 论
4.1.1 为何研究“重复博弈” (Game):
4.1.2 基本概念:
分类:有限次重复博弈,无限次重复博弈
– 有限次重复博弈:给定一个基本博弈G(可以静态,也可以动 态),重复进行了T次G,并且在每次重复G之前,各博弈方都 能观察到以前博弈的结果,这样的博弈过程称为“G的T次重 复博弈”,记为G(T)。而G称为G(T)的“原博弈”。G(T)中的 每次重复称为G(T)的一个“阶段”。
4.2 有限次重复博弈
有限次重复博弈:给定一个基本博弈G(可以 静态,也可以动态),重复进行了T次G,并且 在每次重复G之前,各博弈方都能观察到以前 博弈的结果,这样的博弈过程称为“G的T次重 复博弈”,记为G(T)。而G称为G(T)的“原博 弈”。G(T)中的每次重复称为G(T)的一个“阶 段”。
– 无限次重复博弈:理论上,重复博弈可以无限制进行下去, 不一定经过一定次数重复以后就必须结束。如果一个基本博 弈G一直重复下去,这样的重复博弈就是“无限次重复博弈”, 记为G(∞)。无限次重复博弈的基本博弈也称为“原博弈”。
– 无限次重复博弈是有无限个阶段的动态博弈。
重复博弈的次数虽然有限,但重复的次数或 博弈结束的时间不确定,这种重复博弈中博弈方 的行为选择与确定结束时间的有限次重复博弈很 不同,与无限次重复博弈很相似,甚至可以通过 某种方式与无限次重复博弈统一起来。这种重复 博弈可以称为“随机结束的重复博弈”。
(1)与直觉的差异 (2)连锁店悖论(Selten,1978)泽尔腾 一个在n个市场都开设有连锁店的企业,对于各个市
场的竞争者是否应该加以打击排斥? 由于n个市场的竞争者一般不会同时进入竞争,如果
忽略各个市场环境、竞争者不同等方面的微小差异, 这个问题对上述连锁企业来说相当于一个n次重复的 重复博弈。
博弈方2:同博弈方1:
结论:路径为第一阶段(M,M), 第二阶段(R,R),是一个SPNE路径
两博弈方都采用触发策略:第一阶段选结果为(M,M), 则第二阶段必为(R,R);而第一阶段结果为任何其他8种结 果时,第二阶段必为(L,L)
博弈2
LM R 博 L 2,2 6,1 1,1 弈 M 1,6 7,7 1,1 1 R 1,1 1,1 4,4
较多阶段的动态博弈
例:若10次重复下先来后到博弈,SPNE? 97
打进 B
不进
(0,10)
打击 A 和平
(-2,3)(5,5)
结论 : 10个重复博弈的SPNE就是重复原博弈G的子博 弈纳什均衡。这就有有名的“连锁店悖论。
总结:
第一类是由零和博弈构成的,不存在纯策略NE;第二 类是唯一的纯策略纳什么均衡的静态博弈构成的。
策略、子博弈和均衡路径
策略:
– 博弈方的一个策略就是在每个阶段(即每次重复),针对每种情况(以前阶段 的结果)如何行动的计划。
子博弈:
– 重复博弈的子博弈就是从某个阶段(不包括第一阶段)开始,包括此后所有阶 段的重复博弈部分。
– 子博弈:重复博弈?原博弈?(最后一个阶段)
路径:
– 子博弈完美纳什均衡,以逆推归纳法(逆向归纳法)为核心的子博弈完美纳什均衡 分析及相关结论,可以推广到重复博弈中。
进行许多次基本博弈,也不会改变它们在当前阶段博 弈中的行动方式,不可能变得(哪怕是暂时的)合作 和顾及对方的利益。 所有以零和博弈为原博弈的有限次重复博弈,博弈方 的正确策略都是重复一次性博弈中的纳什均衡策略。 推广:非零和或多个博弈方,博弈方的利益严格对立, 没有纯策略纳什均衡的其他严格竞争博弈中。在以这 些博弈作为原博弈构成的有限次重复博弈中,惟一的 子博弈完美纳什均衡就是所有博弈方都始终采用原博 弈的混合策略纳什均衡策略。