第四章 重复博弈【博弈论经典】

合集下载

4第四章:重复博弈

4第四章:重复博弈

颤抖手均衡
U
博弈方2 L
10,0
R
6,2
博弈方1
D
10,1
2,0
• 顺推归纳法
1. 顺推归纳法——分析方法,其结果到底是策略还是均衡?
以退为进,迂回争取最大利益。以策略选择为依据,整体形成一 条均衡路径。
2.顺推归纳法与颤抖手均衡不要混为一谈
顺推归纳法的基本前提是博弈方有意识的犯错误以争取更大得益,
1. 重复博弈的策略 在每个阶段(即每次重复),针对每种情况(前期阶段的 结果)如何行为的计划。
2. 重复博弈的子博弈
重复博弈是动态博弈,故其同动态博弈一样既有阶段也有 子博弈。
重复博弈的子博弈是从某个阶段(不包括第一阶段)开始,
包括以后所有阶段的重复博弈部分。 重复博弈的子博弈要么仍然是重复博弈,要么就是原博弈。
蜈蚣博弈
逆推归纳法:博弈的效率越来越低 理论依据
多个纯策略纳什均衡的有限次重复博弈
关注点:原博弈的纳什均衡没有达到帕累托效率,是 否存在通过合作进一步提高效率的潜在可能性及其在有限 次重复博弈中能不能实现合作和提高效率的问题。
1. 三价博弈的重复博弈
博弈模型:
设一市场有两个生产同质产品的厂商,他们对产品
均衡策略(组合)不管是静态博弈还是动态博弈均衡没有强 调策略的次序问题。
如囚徒困境博弈的均衡策略是博弈双方均选择坦白;或如甲
乙开矿法律保障不足的博弈。
3.颤抖手均衡中偶然性犯错及其概率到底如何理解?
颤抖手均衡是在多个纳什均衡中寻找,其偶然性犯错误的概
率恰为多个纳什均衡的混合策略纳什均衡中不同博弈方选择不同策 略的概率。
三、重复博弈的分类
1. 有限次重复博弈 基本博弈进行有限次重复 2. 无限次重复博弈

博弈论(重复博弈)

博弈论(重复博弈)
第四章 重复博弈 (p129~)
§4.1 基本概念
一、什么是重复博弈 二、重复博弈的分类 三、重复博弈的策略 四、重复博弈的收益
§4.2 有限次重复博弈
一、2人零和博弈的重复 二、有唯一纯策略NE的有限次重复博弈 三、连锁店悖论(Chainstore Paradox)
H
L
4,4
5,0
0,5
1,1
ห้องสมุดไป่ตู้
可以证明,当贴现因子 较大时,上述 策略组合构成了SPNE:
1)TS 是 NE 2)这个NE是SPNE
2.无限次重复博弈的民间定理 (p133,定理5.1)
一个n人有限博弈G中,设(x1, x2,… xn)是G的任意可 实现收益,那么无限次重复博弈G(∞, δ) 中必存在一个 SPNE,各局中人的平均收益即为(x1, x2,… xn),只要 满足如下条件: 1) 时间偏好率 r =0 或是充分小的正数; 2)博弈在任意阶段结束的概率为0或是充分小的正数; 3)支付组合的元素是n维的,且严格帕累托优于G的最 小最大收益组合。
若干无限次充分博弈的例
1.“单边”的囚徒困境 博弈(p139)
抵赖 抵赖 坦白 5,5
10,-5
坦白
-5,10
购买 高质 低质 5,5
10,-5
抵制 0,0 0,0
0,0
2.产品质量博弈(p143)
均衡成立应满足的条件: 激励相容 竞争 市场出清
3.消费者转换成本博弈(p146)
马尔可夫过程 寻求马尔可夫策略(Markov st.)
合作收益集

B1 (开发A) B2 (开发B) a1 (开发A) 3,3 a2 (开发B) 4,1 1,4 0,0

博弈论(第四章)

博弈论(第四章)
谢富纪 2009年3月 11
2.有限次重复博弈
有唯一纯策略纳什均衡博弈的有限次重复博弈
有限次重复博弈的囚徒困境博弈,可以理解成警察 给两人两次交代的机会。
囚 徒2 坦白 不坦白
囚 徒 1
坦白
不坦白
-5, -5
-8, 0
0, -8
-1, -1
谢富纪 2009年3月
12
2.有限次重复博弈
因为重复博弈全过程是一种动态博弈过程,从第二 阶段开始。 此前的博弈已是既成的事实,而在此后又没有任何 的后继阶段,因此实现本阶段最大利益是两博弈 方在该阶段的唯一原则。结果是(坦白,坦白),
谢富纪 2009年3月
29
2.有限次重复博弈
本博弈中之所以不能或不能部分实现最佳结果
(A,A),是因为在两次重复博弈中博弈方没
有运用触发策略的条件或者说机会。后面的选择 并不取决于第一次博弈的结果。
谢富纪 2009年3月
30
2.有限次重复博弈
厂商2 得益
(1,4) (1.5,3) (3,3)
谢富纪 2009年3月
17
2.有限次重复博弈
削价竞争博弈
高价 寡 高价 头 1 低价
寡头2
低价
100,100 20,150 150,20 70,70
由于两个寡头在同一市场的竞争可以看作维持很 长时间,因此可以看作是重复博弈。然而结果是 令人遗憾的。
谢富纪 2009年3月 18
2.有限次重复博弈
两个悖论
谢富纪 2009年3月
27
2.有限次重复博弈
两市场博弈的重复博弈
厂商 2 A 厂A 商 1 B B
3,3
1,4
4,1
0,0

4经济博弈论-重复博弈

4经济博弈论-重复博弈

8、第一阶段混合策略,第二阶段(A,B) (3,6)
9、第一阶段混合策略,第二阶段(B,A) (6,3)
5
结论:
轮换策略是该重复博弈的最佳子博弈 完美纳什均衡
三次重复博弈的情形?
厂商1和厂商2可以分别采用如下触发策略:
厂商1:第一阶段选A;如果第一阶段结果是(A,A),则第 二阶段选A,如果第一阶段结果是(A,B),则第二阶段选B; 第三阶段无条件选B。 厂商2:第一阶段选A;第二阶段无条件选B;如果第一阶段 结果是(A,A),则第三阶段选A,如果第一阶段结果是(B, A),则第三阶段选B。
寡 高价 头 1 低价
寡头2 高价 低价
100,100
20,150
150, 20
70, 70
削价竞争博弈
根据前面得到的一般结论,以它为原博弈的有限次重复 博弈的唯一的子博弈完美纳什均衡,就是两博弈方重复5次 原博弈的纳什均衡策略,也就是削价,两寡头还是会不断打 价格战。
4.2 有限次重复博弈
结果为(A,A)、(A,B)、(B,A),得益为(8,8)
证明:
1、第三阶段(B,A)是原博弈的纳什均衡,不会有哪一 方愿单独偏离。
厂A 商
1B
厂商2 A B
3,3
1,4
4, 1
0,0
两市场博弈
证明:
2、第二阶段(A,B)是原博弈的纳什均衡,不会有哪一 方愿单独偏离。
厂A 商
1B
厂商2 A B
总得益
如果一个无限次重复博弈的某博弈方某一均衡下各 阶段得益分别为 p1,p 2 ,L L ,则考虑时间价值的重 复博弈总得益现在值为
¥
å p = p 1 + dp 2 + d 2p 3 + L = d t-1p t

博弈论课件4重复博弈

博弈论课件4重复博弈

5 1 1 2 5
如果博弈方2采用H,总得益现值为:
1
V 4 V
因此当 1/ 4时,此触发策略纳什均衡策略。
4.3.2 惟一纯策略纳什均衡的无限次重复博弈
无限次重复博弈民间定理(弗里德曼,1971)
设G是一个完全信息的静态博弈,用(e1, , en )记G的纳什均衡得益,
用(x , 1
重复囚徒困境悖论和连锁 店悖论
☻理论和实践的直觉矛盾,现实 中寡头之间的价格战问题并 不十分普遍,重复次数较大 的实验研究的结果(重复200 次的囚徒困境)
☻泽尔腾(1978),“连锁店悖论” (导论中的先来后到博弈), 实际中对开头几个市场的进 入者不计代价的打击
☻问题的症结与蜈蚣博弈类似, 在于在较多阶段的动态博弈 中逆推归纳法的适用性T t1t 1t1 2 23
t1
t 1
t
4.1.2 基本概念
平均得益:如果一常数作为重复博弈(有限次重复博弈或
无限次重复博弈)各个阶段的得益,能产生与得益序列
1, 2,相同的现在值,则称为1, 2,的平均得益
无限次重复博弈时
2 (1 )
1 2 23
4.2.3 多个纯策略纳什均衡的有限次重复博弈
三价博弈的两次重复博弈
+1
厂H 商M
1L
H
5,5 6,0 2,0
厂商2
M 0,6 3,3 2,0
L
0,2 0,2 1,1
+3
厂H 商M 1L
H
8,8 7,1 3,1
厂商2 M
1,7 4,4 3,1
L
1,3 1,3 2,2
三价博弈
两次重复三价博弈的等价博弈
有限次重复博弈民间定理

博弈论以及应用之4重复博弈

博弈论以及应用之4重复博弈

重复博弈分类

无限次重复博弈

给定一个基本博弈G重复无限多次,记为G(∞)。 重复的次数是有限的,但是具体结束时间是不确定的,每一 阶段都有可能结果博弈。

随机结束重复博弈


重复博弈特点



各阶段相互独立,前阶段博弈不会改变后阶段博弈的结构 所有局中人都能看到博弈历史 参与人的收益等于各阶段收益的贴现值之和或加权平均
22
4.2 有限次重复博弈

两市场博弈的重复博弈

重复三次

触发机制



厂商1:第一阶段,选择A;如果第一阶段结果为(A, A),那么 第二阶段选择A;如果第一阶段结果为(A, B),那么第二阶段选 择B;第三阶段无条件选择B。 厂商2:第一阶段,选择A;第二阶段无条件选择B;如果第一 阶段结果为(A, A),那么第三阶段选择A;如果第一阶段结果为 (A, B),那么第三阶段选择B。 子博弈精炼纳什均衡为(A ,A), (A, B), (B, A),双方平均收益分 别为(2.67, 2.67),较重复两次有提高,验证了猜想!
T M
L 3, 1 2, 1 1, 2
C 0, 0 1, 2 1, 1
R 5, 0 3, 1 4, 4
B
2013-8-4104.2 有 Nhomakorabea次重复博弈

多重纳什均衡博弈的有限次重复博弈

阶段博弈的纳什均衡
用画线法容易求得纯战略纳什均衡为(3,1)和(1,2)。 根据奇数定理,很可能还有一个混合战略纳什均衡。求解可 得混合战略纳什均衡为((1/3, 1/2, 1/6), (1/5, 3/5, 1/5)),其中局 中人1的收益为8/5,局中人2的收益为7/6。

@第4章 重复博弈

@第4章 重复博弈
*
*
*
最后这个不等式正是存在有效工资率,工作激励有效的基 131 本条件。
三 、 无 限 次 重 复 博 弈
(四)效率工资博弈
综上所述,在满足 y w 0和w w e 1 e (1 p)
* * 0
的条件下,双方的触发策略构成一个纳什均衡。而上述两式 实际上意味着 1 y e w e (1 p)
131
(一)两人零和博弈的无限次重复博弈
两人零和博弈无限次重复与有 限次重复博弈的结果并不会有什 么不同,所有阶段都不可能发生 合作,博弈方会一直重复原博 弈的混合策略纳什均衡。
三 、 无 限 次 重 复 博 弈
131
(二)唯一纯策略纳什均衡无限次重复博弈 两种情况
三 、 无 限 次 重 复 博 弈
*
e
s
0
0
努力是工人的最佳选择。
反过来,设工人已采用上述触发策略。若厂商给的工资率满 足上式条件,并且威胁一旦产量降低就解雇工人,则各阶段 的得益为 y w,无限次重复博弈得益现值为 ( y w ) (1 ) 。 * 若不愿给 w ,则解雇工人,以后得益为0。因此只要y w 0 厂商选择前述触发策略就是最佳反应。
131
(二)唯一纯策略纳什均衡无限次重复博弈
【例】两寡头竞价博弈(P132)
H2
H1
L2
L1
4,4 5,0
0,5 1,1
该博弈一次性博弈均衡是都采用低价,是囚徒困境型博弈
三 、 无 限 次 重 复 博 弈
131
(二)唯一纯策略纳什均衡无限次重复博弈
【例】两寡头竞价博弈(P132)
【了解】无限次重复博弈的“民间定理”(P134)

[经济学]4 重复博弈--博弈论

[经济学]4 重复博弈--博弈论
不少非OPEC成员国加入市场,使得OPEC的限产作用失 效,白白丧失许多市场份额和利润。
OPEC成员之间地位不平衡,部分成员觉得限额不公平从 而相继突破限额。
有些国家因为政治、经济、军事等方面的原因造成资金、 财政紧张,促使其杀鸡取卵、大量超产。
h
19
4.2.3 有限次重复猜硬币博弈
正面 盖 方
反面
4 重复博弈
4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈
h
1
何为重复博弈?
动态博弈分为两类:
序贯博弈(sequential games)
参与人在前一个阶段的行动选择决定随后的子博弈结 构,即同样结构的子博弈只出现一次。
重复博弈(repeated games) 指同样结构的博弈重复多次。
h
2
为什么要研究重复博弈
在形式上,重复博弈是基本博弈的重复进行,但博弈 方的行为和结果却不一定是简单重复。
短期利益
长期利益
例:
• 两家企业在一个市场上的长期竞争 • 企业之间的长期协议(如10年) • 商业中的回头客等
h
3
基本概念
有限次与无限次重复博弈
给定一个博弈G,重复T次,各博弈方能观察到以前 的博弈进程,称为G的一个“T次重复博弈”,记为 G(T)。G为原博弈。每次重复称为G(T)的一个阶段。
Med Q 9,4
12,10 10, 18
Low Q 3, 6 20, 8
18, 15
Saudi Arabia
h
16
重复博弈
合理的猜想:
石油生产和出口年年持续进行,OPEC的制约和协调按 理说总是有一定作用的。各国不可能对合作的巨大好处 无动于衷,再加上我们要考虑到成员国中最大的产油国, 如沙特阿拉伯在其中会起一定的积极作用,带头克制自 己的行为。因此OPEC这个是否突破限额的重复博弈的结 果理应比完全没有制约独立决定产量的结果要好得多。

第四章(重复博弈)

第四章(重复博弈)

在G(T)中的总得益为在G中得益的T倍,平均得益等于
原博弈G中的得益。
(三)有限次重复削价竞争博弈
根据右图得益矩阵不难看 寡头2 出,一次性博弈的结果必然是 高价 低价 双方都采用“低价”策略,各 100,100 20,150 寡 高价 得到70个单位的利益。假设两 头 150, 20 70, 70 1 低价 寡头都意识到相互竞争的市场 格局大约可以持续 5年,也就 图4-3 削价竞争博弈 是面临一个 5次重复博弈,它 们是不是还会采用低价不断打 价格战呢? 根据前面得到的一般结论,以它为原博弈的有限次重复博弈的惟一的 子博弈完美纳什均衡,就是两博弈方重复 5次原博弈的纳什均衡策略,也 就是削价,两寡头还是会不断打价格战。
2、无限次重复 某个重复博弈没有可以预见的结束时间,各博弈
方主观上认为博弈会不断进行下去,那么就可以看作
是无限次重复博弈。 3、随机结束博弈 重复博弈的次数虽然是有限的,但重复的次数或 博弈结束的时间却是不确定的。这种重复博弈可以称
为“随机结束的重复博弈”。
二、重复博弈的策略、子博弈和均衡路径

2 t 1
无限次重复博弈也写成 G(, ) 。
四、随机停止和贴现率
可理解为通过抽签来决定是否停止重复,设抽 到停止的概率是 p ,重复下去的概率为 1 p 。 设某博弈方的阶段得益为
1 p
t
,利率为

,因
为在第一次博弈以后能继续下一次重复的可能性是
ห้องสมุดไป่ตู้
,第二阶段的期望得益为
3 (1 p) 2 (1 ) 2
而成的。

如果原博弈有m种策略组合,那么重复两次就有 m 2
条博弈路径,重复T次就有 mT 条博弈路径;当T或 m较大时,重复博弈的路径数是很大的。

博弈论4 重复博弈

博弈论4  重复博弈
厂 H 商 M 1 L H 8,8 9,3 5,3 厂商2 M 3, 9 6, 6 5, 3 L 3,5 1,3 4,4
重复三价博弈的等价模型 不可信报复
第一阶段不管选什么策略,二阶段都选 (M,M),于是将(3,3)加到其余策略上,得到 右边等价的得益矩阵。结果第一阶段最 佳策略不是(H,H),而是(M,M)
囚徒2 坦 白 不坦白 囚 坦白 -5,-5 徒 1 不坦白 -8,0 0,-8
-1,-1
(-5,-5)
囚徒2 坦 白 不坦白 囚 坦白 -10,-10 -5,-13 徒 -13,-5 -6,-6 1 不坦白 (-10,-10)
二、一般结论 定理:设原博弈G有唯一的纯策略纳什 均衡,则对任意整数T,重复博弈 G(T)有 唯 一的子博弈完美纳什均衡,即各博弈 方每个阶段都采用G的纳什均衡策略。
4.2.1 两人零和博弈的有限次重复博弈
以零和博弈为原博弈的有限次重复博弈中,所 有博弈方的唯一选择策略是重复一次性博弈中 的纳什均衡策略 (混合策略纳什均衡)。
原因:重复不会改变博弈效率是利益是 对立的不可调和的。
4.2.2唯一纯策略纳什均衡博弈的 有限次重复博弈
唯一的Nash均衡有两种: 一是:本身是帕雷托最优的。它都符合双方的利益, 重复不会改变 二是:本身不是帕雷托最优的。重复能否改变得益? 一、有限次重复囚徒的困境博弈
两人零和博弈有限次重复的所有阶段都不可能发生合 作,因为他们的利益关系是完全对立的。博弈方会一 直重复原博弈的混合策略纳什均衡。 两人零和博弈无限次重复的所有阶段都不可能发生合 作,博弈方会一直重复原博弈的混合策略纳什均衡 由于无限次重复博弈没有最后一个阶段,所以无法用 逆向归纳法证明。 类似的方法是从无限次重复博弈的第t阶段,进行逆向 归纳。注意t是任意的。

4第四章:重复博弈

4第四章:重复博弈

前面提及,重复博弈注重研究的是长期的合作或竞争 关系,时间是一个非常重要的考量因素!
如果重复博弈的次数较少,时间间隔较短,其结果对 博弈方的得益可能并没多大影响,但是若重复次数较多, 时间就不得不考虑。
因心理作用和资金有时间价值,不同时间获得的单位 利益对人们的价值是有差别的,忽略这一点就不能得出符 合实际的分析结论。
其解决方法:引进将后一阶段得益折算成当前得益的 贴现系数。
1 1
阶段 1 原博弈
1
阶段 2 原博弈
2
阶段 T 原博弈
T
all 1 2 23
T
T 1T t1 t t 1
总得益
如何求得“平均得益”?源自基本概念:若一常数 作为重复博弈各个阶段的得益,能
产生与得益序列 1, 2 , 相同的现在值,则称 为 1, 2 , 的“平均得益”。
all 2
T
第四章 重复博弈
基本博弈重复进行构成的博弈过程
例如:石头剪刀布博弈
虽然重复博弈形式上是基本博弈的重复进行, 但博弈方的行为和博弈结果却不一定是基本博弈的 简单重复。
博弈方对于博弈会重复进行的意识使得他们对 利益的判断发生变化,进而在重复博弈的不同阶段 的行为选择发生变化。
不能把重复博弈当作基本博弈的简单叠加,必 须把整个重复博弈过程作为整体进行研究。
三、重复博弈的分类
1. 有限次重复博弈 基本博弈进行有限次重复
2. 无限次重复博弈 如果某个重复博弈没有可以预见的结束时间,各博弈方主
观上认为博弈会不断进行下去,即可视为无限次重复博弈。 3. 随机结束的重复博弈
重复博弈的次数是有限的,但重复的次数或博弈结束的时 间是不确定的。
四、策略、子博弈和均衡路径

第四章__重复博弈

第四章__重复博弈

4.2.1 两人零和博弈的有限次重复博弈
田忌赛马
田 忌 上 中 下 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上 下 中 1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
中 上 下
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
中 下 上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
之前各博弈方都能观察到以前博弈的结果,这样的博弈过
程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T) 的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶 段”。 无限次重复博弈:一个基本博弈G一直重复博弈下去的博
弈,记为G(∞)。
4.1.2 基本概念
注意重复博弈与动态博弈的联系与区别: 重复博弈是一个动态的过程,具有多个阶段,属于动态博弈的
1 1 r
2
现值之和就为
V R1 R2 R3
2

T 1
RT
t 1 t 1 t 1
T
t 1
Rt
V R1 R2 R3

Rt
4.2 有限次重复博弈
4.2.1 两人零和博弈的有限次重复博弈 4.2.2 唯一纯策略纳什均衡博弈的有限次重复博弈 4.2.3 多个纯策略纳什均衡博弈的有限次重复博弈 4.2.4 有限次重复博弈的民间定理
8,6 4,8
4,10 6,4
1
4.2.2 唯一纯策略纳什均衡博弈的 有限次重复博弈
如果纳什均衡本身就是帕累托意义上的最佳策略组合,符合所有博
弈方的利益,那么,有限次重复博弈的惟一均衡即是:各博弈方不会 改变自己的行为,在每阶段都采用原博弈的纳什均衡策略。

博弈论4 重复博弈62页PPT

博弈论4 重复博弈62页PPT

26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。——卢梭

27、只有把抱怨环境的心情,化为上进的力量,才是成功的保证。——罗曼·罗兰

ቤተ መጻሕፍቲ ባይዱ
28、知之者不如好之者,好之者不如乐之者。——孔子

29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇

30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华
谢谢!
62
博弈论4 重复博弈
56、死去何所道,托体同山阿。 57、春秋多佳日,登高赋新诗。 58、种豆南山下,草盛豆苗稀。晨兴 理荒秽 ,带月 荷锄归 。道狭 草木长 ,夕露 沾我衣 。衣沾 不足惜 ,但使 愿无违 。 59、相见无杂言,但道桑麻长。 60、迢迢新秋夕,亭亭月将圆。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4.2.2 有限次重复的囚徒困境博弈

如果原博弈存在唯一的纯策略纳什均衡组合,则有限次重复博弈的唯一的均衡 解即各博弈方在每阶段(即每次重复)中都采用原博弈的纳什均衡策略。由于 在这样的双方策略下,均衡路径中的每个阶段都不存在不可信的威胁或许诺, 因此这种均衡是子博弈完美纳什均衡。
4.2.2 有限次重复的囚徒困境博弈
坦白 此时,博弈的纳什均衡仍是(坦白,坦白)。
不坦白
坦白
不坦白
-10,-10
- 5,
-13
-13, -5
-6,-6
4.2.2 有限次重复的囚徒困境博弈


结论: 在有限次重复博弈G(T)中,如果原博弈G存在唯一的纯策略纳什均衡 组合,则重复博弈的唯一的子博弈完美纳什均衡解为各博弈方在每阶段都采 取的原博弈纳什均衡策略。 含义:在原博弈具有唯一均衡的有限次重复博弈中,由于完全理性的博弈方 具有“共同知识”的分析推理能力,因此在从最后阶段开始的逆推过程中, 仍然无法摆脱囚徒困境。
4.2.3 有两个纳什均衡的重复博弈 考虑三次重复博弈各策略组合子博弈纳什均衡路径: 1.由原博弈的纳什均衡组合而成的路径,如采取轮换策略(在上述的协调博弈中, 双方轮换采取纯纳什均衡策略,路径为(A,B),(B,A),(A,B)…..不考虑时间的价值 (贴现系数),每阶段的平均得益为(4+1)/2 =2.5,高于混合策略的得益2。 2.触发策略,博弈方首先采取合作行为,如果发现对方没有进行合作,那么在后 续阶段的博弈中采取不合作策略进行惩罚。
第二节
有限次重复博弈

有限次重复的猜硬币博弈——原博弈为零和博弈 有限次重复的囚徒困境博弈——原博弈有唯一的纯策略纳什均衡 有多个纳什均衡的重复博弈的策略设计——触发策略 有多个纳什均衡重复博弈的得益范围——民间定理
4.2.1 有限次重复的猜硬币博弈 在零和博弈中,双方不存在合作的可能性,因此在长期进行的重复博弈中, 子博弈完美纳什均衡由各个阶段原博弈的纳什均衡构成(例,在猜硬币博弈中 以0.5的概率选择正面或者反面,即采取混合策略)。 实际上,所有以零和博弈为原博弈所构成的重复博弈与猜硬币博弈构成的重 复博弈一样,各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳 什均衡策略。
4.1.2 有限次重复博弈的概念
定义:给定一个博弈G,重复进行T次G,并且在每次重复之前各博弈方都能观察到 以前博弈的结果,称为G的一个“T次重复博弈”,记为G(T)。其中,G成为G(T) 的原博弈。每次重复称为G(T)的一个阶段。
4.1.2 有限次重复博弈的概念
几个概念: 1 子博弈:从某一阶段(不包括第一阶段)开始,包含以后所有阶段的原重复 博弈的一部分。 2 策略:博弈方在每个阶段针对每种情况如何行动的计划(注:在每一阶段之 前,博弈方是可以观察到以前博弈的结果的)。
4.2.3 有两个纳什均衡的重复博弈 在图4-2中,触发策略的设计为: (1)博弈方1的策略是第一阶段合作A,如果发现对方采取B不合作,则第二阶段采取不 合作的B策略惩罚,否则第二阶段继续合作;第三阶段无条件采取B策略。 (惩罚放在第二阶段) (2)博弈方2的策略是第一阶段合作A,第二阶段无条件选B,如果第一阶段结果是(A, A),则第三阶段A;如果第一阶段结果是(B,A),则第三阶段选B。(惩罚放在第 三阶段) (3)是一子博弈完美纳什均衡,双方每阶段的平均得益为(3+1+4)/3=2.67,效率较高。 (4)如果增加博弈的重复次数到101次。若采用的触发策略是: 博弈方1在前99次中都选A,但从其中的第二次开始,一旦发现
第四章 重复博弈
本章主要内容: 1 重复博弈的概念; 2 作为一种特殊的动态博弈,有限次和无限次重复 博弈的子博弈完美纳什均衡的求解方法; 3 无限次重复博弈古诺模型和效率工资模型。 本章主要结论(民间定理): 由于参与者在重复博弈中具有了长期利益,可以通过在后面阶段中采取的报复 策略使得威胁变得可信,从而摆脱静态博弈中“追求自身利益最大化”导致的囚 徒困境,实现长期合作的结局。
4.2.2 有限次重复的囚徒困境博弈
坦白 坦白 不坦白
不坦白
-5,-5
-8,
图4-1 囚徒困境
0,
0
-8
-1,-1

求解思路:对于有限次重复囚徒困境博弈,根据动态博弈的逆推归纳ቤተ መጻሕፍቲ ባይዱ可以求 解。
4.2.2 有限次重复的囚徒困境博弈
以两阶段(以该博弈作为原博弈G重复两次)为 例:分析最后一阶段,子博弈即为原博弈,唯一的 均衡为(-5,-5);分析第一阶段,将最后阶段 的收益(-5)添加到第一阶段的矩阵中,即:

第一节 几个概念

重复博弈的概念 有限次重复博弈的概念
4.1.1 重复博弈的概念 1 由简单的静态博弈(或动态博弈)的有限次(或无限次)重复进行构成的。 2 每一阶段博弈方、策略集合、规则和得益都相 同。 3 包括:有限次重复博弈和无限次重复博弈 4 例子: 多场决胜负的体育比赛(有限次) 两寡头市场上两个厂商之间的竞争(无限次) 商场与顾客交易
定理 设原博弈G有唯一的纯策略纳什均衡,则对任意正整数T,重复博弈G(T) 有唯一的子博弈完美的解,即各博弈方每个阶段都采用G的纳什均衡策略。各 博弈方在G(T)中的总得益为在G中得益的T倍,平均每阶段得益等于原博弈G 中的得益。
4.2.3 有两个纳什均衡的重复博弈
例 两个厂商1和2,同时 A B 面临两个市场机会A和B。假 A 设每个厂商都只有能力选择 3,3 1, 4 一市场发展,即他们的可选 B 4,1 0,0 择策略都是A或B,其得益矩 阵如图所示。 图4-2 两厂商差别市场博弈 此博弈具有2个纯策略纳什均衡(1,4)、 (4,1)和混合策略纳什均衡概率(0.5,0.5)。
4.1.2 有限次重复博弈的概念
3 路径: 是每个阶段博弈结果(原博弈的一个策略组合)连接而成。对于具有 n个策略组合的原博弈,重复T次的路径数为nT,重复博弈的求解即找出具有 稳定性的均衡路径。 4 得益:不同于一般的动态博弈,重复博弈的得益为各个阶段得益的加总。考 虑到时间的价值,需要引进“贴现系数”将未来的得益折算成当期得益的价 值。
相关文档
最新文档