第六章第一讲重复博弈的类型解读
[小学教育]重复博弈
![[小学教育]重复博弈](https://img.taocdn.com/s3/m/a00a243d2f60ddccda38a07c.png)
博弈论与信息经济学
2018年9月10日10时10分
经济管理学院 曹正勇
博弈论与信息经济学
2018年9月10日10时10分
经济管理学院 曹正勇
博弈论与信息经济学
2018年9月10日10时10分
经济管理学院 曹正勇
博弈论与信息经济学
重复博弈的得益
平均得益:如果一常数 作为重复博弈(有限次 重复博弈或 无限次重复博弈)各个 阶段的得益,能产生与 得益序列
L 0,2 0,2 1,1
厂 H 商 M 1 L
H 8,8 7,1 3,1
L 1,3 1,3 2,2
三种可选战略博弈
两次重复三种可选战略博弈的等价模型
触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复 博弈方1:第一次选h;如第一次结果为(H,H),则第二次选M,否则选L 博弈方2:同博伊方1
博弈论与信息经济学
1、重复博弈的定义及特征 (1) 定义: 重复博弈指同样结构的博弈重复多次, 其中每次博弈称为阶段博弈。 (2) 特征: A、阶段博弈之间没有“物质”上的联系,即 前一阶段的博弈不改变后一阶段博弈的结构; B、所有参与人都观测到博弈过去的历史; C、参与人的总支付是所有阶段博弈支付的 贴现值之和或加权平均值。
例:有限次重复囚徒困境博弈
2018年9月10日10时10分
经济管理学院 曹正勇
博弈论与信息经济学
如果我们以该博弈作为原博弈G进行重复博弈,
结果是否会与一次性博弈有所不同,还是仍然是一次
性博弈的简单重复呢? 如果重复的次数是两次,则该重复博弃的现实意 义可以理解为官方给这两个囚徒两次机会,他们最后 的得益(被关年数的负值表示的负效用)是两个阶段博
弈中各自得益之和(当然在第二阶段开始之前是让每
第六章:重复博弈与合作行为

触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复 博弈方1:第一次选h;如第一次结果为(H,H),则第二次选M,否则选L 博弈方2:同博弈方1
14
触发策略的进一步讨论
+3 厂商2 厂 商 1 H M L H 5,5 6,0 2,0 M 0,6 3,3 2,0 三价博弈 L 0,2 0,2 1,1 厂 H 商 M 1 L H 8,8 9,3 5,3 厂商2 M 3,9 6,6 5,3 L 3,5 3,5 4,4
4.5 4.51 1
2
如果厂商2偏离上述触发策略,则他在第一阶段所选产
量应为给定厂商1产量为1.5时,自己的最大利润产量,
即满足:
25
无限次重复古诺模型
max 8 1.5 q q 2q max 4.5 q q
q2
2
2
2
q2
2
4.5 4 5.0625 即 9 17 1 1
上述策略是厂商2对厂商1的同样触发策略的最佳反应, 否则偏离是最佳反应。
27
低水平的合作
在第一阶段生产q * , 在第t阶段, 如果前t 1阶段的结果都 是 q *,q * , 则继续生产q *, 否则生产古诺产量qc 2。
博弈方1:在第一阶段采用H,如果第一阶段结果是(H,H),那么第 二阶段采用M,否则采用P; 博弈方2:在第一阶段采用H;如果第一阶段结果是(H,H),那么 第二阶段采用M,否则采用Q。
16
两市场博弈的重复博弈(重复两次) 两个纯策略NE
一个混合策略NE
厂 商 1
A B
A 3,3 4,1
厂商2
w
。
31
重复博弈

5
有限次重复博弈的案例
小偷பைடு நூலகம்警察的博弈
假设小镇上只有一个警察和一个小偷,根据他们的 选择可以做出如下得益矩阵:
小偷 警 察 偷 睡 -D, V 不偷 S, 0
不睡
0, -P
0, 0
从上图中我们可以明显看出,小偷和守卫都没有最优策 略,小偷偷与不偷跟守卫睡与不睡有关,同时守卫睡与不睡 也跟小偷偷与不偷有关。
从上图可以看出
一、小偷偷盗的概率小于一定程度的时候守 卫睡觉的收益是正的!
二、加大对守卫的处罚会降低小偷偷盗的概 率,因为守卫的处罚更大,小偷只有偷盗的概率 更低守卫睡觉才能取得正效用。
三、最惊人的地方在于小偷偷盗的概率原来 跟对小偷的处罚无关,却与守卫的处罚力度有关 !!!!!!
生活中的重复博弈
陌生人之间为何会因为踩一脚 而发生口角,甚至拳脚相向? 恋爱中的男女为什么会对彼此忠诚? 旅游景点为何坑特多,餐馆都价高不好吃?
重复博弈给你答案 让我们认识并走进重复博弈~
2
重复博弈的分类
有限次重复博弈
有限次重复博弈是指相同结构的博弈有限次重复进行。 在有限次重复博弈中,参与者会欺骗和违约,但当参与者不 知道哪一次是末期时,决策近于无限次博弈。
无限次重复博弈
重复博弈的详细介绍

收益: (3,3) 权重: (1/ 3,1/ 3,1/ 3,0) [(4, 4),(5,0),(0,5),(1,1)]
平均收益
给定贴现 率 ,无限的收1益,序2,列3
的平均收益为
(1 )
t1 t
t 1
阶段博弈收益 相等时的总收益
2 t1t t 1
重复博 弈总收益
所以 故
也称触发战略;
以囚徒困境为例:开始 选择抵赖,而且一直选 择抵赖直到有一方选择 了坦白,然后永远选择 坦白;
这意味着:一旦哪个参 与人选择了坦白,就触 发了惩罚的扳机。
根据上述原则,可构造如下战略:
01 S1:第一阶段选择M1;如果第一阶段结果为(M1, M2),则下一阶段选R1;否则选择L1。
1
竞赛的第一个回合交上来的14个程序中包含了各种复杂 的战略。但使爱克斯罗德和其他人深为吃惊的是,竞赛 的桂冠属于其中最简单的战略:一报还一报(Tit for Tat)。这是多伦多大学心理学家阿纳托 ·拉帕波特提交上 来的战略。
2
一报还一报战略:它总是以合作开局,但从此以后就采 取以其人之道还治其人之身的战略。也就是说,一报还 一报的战略实行了胡萝卜加大棒的原则。
i
集合。 若存在
G(, )
(x , x , , x ) 则 存 在 贴 现 率 , 使 无 限 重 复博弈
可达到
12
。n
存在一个子博弈精炼Nash均衡,其平均收益
子博弈精炼Nash均衡的可行收益区间 (0,5) (1,1) (0,0) (4,4) (5,0)
无名氏定理的一个解释
在无限次重复博弈中,如果参与人具有足够的耐心(只要满足一定的 条件),那么任何满足个人理性的可行收益向量都可以通过一个特定的
第六章 重复博弈

细分礼尚往来策略
惩罚一次的礼尚往来策略,叫做严格礼尚 往来策略:即你这次对我不好,我下次马 上对你不好;你这次改过来对我好,我下 次马上也对你好。 还存在惩罚K次的礼尚往来策略,这就是如 果你的对手在某一阶段博弈中采取背叛策 略,则你在下面连续K个阶段博弈中采取背 叛策略来惩罚他。实际上冷酷策略也可以 被叫做惩罚无穷次的礼尚往来策略。
囚徒困境博弈重复无穷多次而不是有限次 时,结果是否与一次博弈的结果一样呢?
一、在分析之前,先介绍博弈重复多次时 常见的策略。 依存策略 触发策略 冷酷策略 礼尚往来策略
在重复博弈中,互动关系的序贯意味着先 前双方的博弈行为,决定自己下一阶段的 策略选择。这种策略被称为依存策略或相 机策略。
2 1 r 2 (1 r )
2
2 (1 r )
3
2 (1 r )
4
r 表示投资收益率,1/(1+r)称为折现因子,通常用 δ 表示。折现因子衡量了“未来相比于现在的重要 性”。折现因子越大,表示未来越重要。
当1>2/r时,即周收益率r>200%时,乙选择 永远背叛下去才是值得的。而这种情况几乎 是不太可能的。
一个局中人在决定是否采取背叛行动时,他需 要考虑的是权衡背叛行为所产生的即时收益以 及未来需要承担的损失。而未来承担的损失又 受折现因子δ和博弈持续下去的概率P两个因 素的影响。
如果重复博弈有足够高的概率在某一阶段结束, 也就是P足够小,则通过礼尚往来策略支持的 合作会由于局中人的背叛而结束。
低价
企业甲 高价
重复博弈

1 P 1 e w e e 时,努力工作是工人 0 (1 P) (1 P) 的最佳选择,也就是说,要使工人努力工作,y w*不仅要包括工人个体收入 w0
* 当 Ve Vs ,即 w w0
1 e。 和努力工作的负效用e,还要有一点升水 (1 P)
6 随即停止的重复博弈的期望得益现值:
E[ 1 ]
E[ 2 ]
E[ t ]
上述结果说明无限次重复博弈和随机停止博弈具有统一的表示形式。
7 重复博弈的几个重要理论成果
无纯策略 混合策论 有唯一纯策略
有纯策略 有多个纯策略 T h:存在合作的可能 (Folk Theorem, Friedman,1971) 三价博弈 两市场博弈
1 * e ,则只要各阶段得益 y w 0 ,厂商选择前述触 (1 P) * 发策略就是对工人触发策略的最佳反应。故在满足 y w 0 和工资率 w* w0 e 1 * e 时,双方触发策略构成一个纳什均衡。而 y w 0 (1 P) 1 * e 意味着工人努力工作产出减去努力工作的负效用 和 w w0 e (1 P) w* w0 e
e越大,工资补偿越多;
越小,说明未来利益越不重要,工人更看重当前利益,当前工资也必须高;
P越高,工人丢饭碗的风险越小,除非工资更高,否则工人宁愿偷懒。 计划经济体制下劳动者偷懒总是难以被发觉或无人认真发觉,工资又是固 定在平均水平,无任何刺激,故工人必然倾向于偷懒。
* 而若工人已采用触发策略,则对工人的选择,厂商给的工资率 w 若满足
[经济学]博弈论第六章 重复博弈
![[经济学]博弈论第六章 重复博弈](https://img.taocdn.com/s3/m/438baa672e3f5727a5e962ec.png)
r表示投资收益率,1/(1+r)称为折现因子。 当1>2/r时,即周收益率r>200%时,乙选择永远背叛下去 才是值得的。而这种情况几乎是不太可能的.因此,当双方 都实行礼尚往来策略时,双方是不会背叛对方的.这样礼尚 往来策略就解决了囚徒困境的难题了!
举例
假如投资收益率为10%(即r=0.1,从而 δ=1/1.1=0.91),并且博弈在持续一期的概率为 35%(即P=0.35),那么投资的有效收益率为:
R 1 1 2.14 0.35 0.91
在前面礼尚往来例子中,假如甲坚持采用礼尚往来策略, 只有当投资收益率大于200%时,乙采用永久性背叛策略就是值 得的。但是如果乙面临10%的投资收益率以及博弈再多维持一 期的概率是0.35时,有效收益率为214%,超过了200%的临界值。 因此,如果重复博弈有足够高的概率在一阶段结束,也就是P 足够小,则通过礼尚往来策略支持的合作会由于局中人的背叛 而结束。
假如在前面那个案例中企业乙背叛了一假如在前面那个案例中企业乙背叛了一个星期后突然又个星期后突然又改邪归正改邪归正选择继选择继续合作则选择合作的这个星期利润只续合作则选择合作的这个星期利润只有有11万因为此时甲企业为了惩罚他的上万因为此时甲企业为了惩罚他的上次背叛使用了低价策略因此这次背叛次背叛使用了低价策略因此这次背叛的收益是的收益是11万在背叛的那个星期获得的万在背叛的那个星期获得的背叛的成本是损失了背叛的成本是损失了44万在背叛后接下来万在背叛后接下来的一个星期发生的那么他这次背叛是的一个星期发生的那么他这次背叛是否值得呢
在囚徒困境中,重复博弈是一种促使局中 人采用合作策略的机制。因为,局中人担 心一次不合作会招致未来合作机会的丧失。 如果未来合作的价值很大,超过采取背叛 策略所能获得的短期收益,则双方会出于 长远利益的考虑,形成非契约的默契,使 彼此都从默契的非契约合约中得到好处。
重复博弈

重复博弈重复博弈(Repeated Games)[什么是重复博弈 顾名思义,重复博弈是指同样结构的博弈重复许多次,其中的每次博弈称为“阶段博弈”(stage games)[1]。
重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。
在重复博弈中,每次博弈的条件、规则和内容都是相同的, 但由于有一个长期利益的存在, 因此各博弈方在当前阶段的博弈中要考虑到不能引起其它博弈方在后面阶段的对抗、报复或恶性竞争, 即不能象在一次性静态博弈中那样毫不顾及其它博弈方的利益。
有时, 一方做出一种合作的姿态, 可能使其它博弈方在今后阶段采取合作的态度, 从而实现共同的长期利益。
下面给出两个重要定义: 定义1:可信性是指动态博弈中先行动的博弈方是否该相信后行动的博弈方会采取对自己有利或不利的行为。
定义2:如果动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成均衡, 则称该策略组合具有子博弈完美性。
在重复博弈中, 可信性同样是非常重要的, 也即子博弈完美性仍是判断均衡是否稳定可靠的重要依据, 又由于长期利益对短期行为的制约作用, 因此有一些在一次性博弈中不可行的威胁或诺言在重复博弈中会变为可信的, 从而使博弈的均衡结果出现更多的可能性。
[编辑]重复博弈的特征 1、阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构。
2、所有参与人观察到博弈过去的历史。
3、参与人的总得益是所有阶段博弈得益的贴现值之和。
如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的策略可以选择,均衡结果可能与一次博弈大不相同。
[编辑]重复博弈的例子[1] 以下我们用一个产品定价的例子讨论重复博弈,给出了一次性完全信息静态博弈的收益矩阵。
A、B两个参与人都有两种定价待选择:定高价或定低价。
第六章 重复博弈

第六章 重复博弈与群体博弈§6-1 重复博弈与合作重复博弈(Repeated Games)是基本博弈重复进行构成的博弈过程。
虽然重复博弈形式上是基本博弈的重复进行,但博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发生变化,从而使他们在重复博弈过程不同阶段的行为选择受到影响。
在肯尼亚有一种猴子,受到威胁时就会嚎叫,它的朋友也会跟着嚎叫助威。
而助阵的猴子大都是上次互相抓痒的猴子,不互相抓痒的猴子很少相互助阵。
在大海的珊瑚礁中,有一种小鱼可以为大鱼清除牙齿中的寄生虫,当然小鱼清除寄生虫时也获得了食物。
但是,大鱼在小鱼清除寄生虫后,完全可以一口把小鱼吃掉。
如果它们见面机会少,那么吃掉小鱼是大鱼的最佳策略,由此可见,珊瑚礁地域小,双方必定可以相互认识。
茫茫大海,萍水相逢,一生若只见一回,那么就不可能见到这些合作的鱼了。
来自生物界的这两个例子,深刻地说明了合作产生的根源。
存在合作利益、保持有长期关系并且能够识别和惩罚欺骗者,对于生物界的合作必不可少。
同样,对于人类社会的合作,这些因素似乎也是最根本的。
至少通过学习博弈论,我们得到的结论是这样的。
1、合作的模式在某些情况下,合作看起来一点也不奇怪。
比如图6-1的博弈中:乙合作 对抗甲 合作 对抗图6-1 简单的互惠合作这个博弈中,大家都选择对抗则谁也得不到一点好处,一方合作而另一方对抗也不符合双方利益。
只有双方都选择合作才是稳定的结果。
显然,图6-1中出现的合作,并非甲、乙道德高尚,其原因仅仅因为合作对双方都是有明显好处的,所以合作就产生了。
此类合作被称为简单的互惠合作,对于研究者并没有太大的吸引力。
相反,另外一些存在冲突的博弈中,是否能够达成合作呢?这是研究者们深感兴趣的话题。
比如图6-2的博弈:图6-2的博弈实际上是一个囚徒困境博弈,因为它具有囚徒困境一样的博弈结构:不管对方选择对抗还是合作,甲选择对抗总是更有利;当然乙也是一样的想法。
博弈论-重复博弈

(-5,-5) 囚徒2 坦白 不坦白 -10,-10 -5,-13 -6,-6
囚 坦白 徒 -13,-5 1 不坦白
(-10,-10)
有限次重复削价竞争博弈
寡头2 高 价
寡 头 1
低 价
20,150 70,70
高价
低价
100,100 150,20
有唯一纯策略纳什均衡 (70,70) 有限次重复的结果仍然是 (低价,低价)
《博弈论与信息经济学》
第四章
重复博弈
本章介绍基本博弈重复进行构成的重复博弈。 虽然形式上是基本博弈的重复进行,但重复博弈中 博弈方的行为和博弈结果却不一定是基本博弈的简 单重复,因为博弈方对于博弈会重复进行的意识, 会使他们对利益的判断发生变化,从而使他们在重 复博弈过程中的行为选择受到影响。这意味着不能 把重复博弈当作基本博弈的简单叠加,必须把整个 重复博弈过程作为整体进行研究。
t 1
4.2 有限次重复博弈
4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈 的有限次重复博弈 4.2.3多个纯策略纳什均衡博弈 的有限次重复博弈 4.2.4 有限次重复博弈的民间定理
4.2.1 两人零和博弈的有限次重复博弈
零和博弈是严格竞争的,重复博弈并不改变这 一点。 以零和博弈为原博弈的有限次重复博弈与猜硬 币博弈的有限次重复博弈一样,博弈方的正确 策略是重复一次性博弈中的纳什均衡策略。
1 2
设厂商1已采用该触发策略,若厂商2也采用该触发策 略,则每期得益4.5,无限次重复博弈总得益的现值为: 4.5 4.5 1 + + + L 1 如果厂商2偏离上述触发策略,则他在第一阶段所选 产量应为给定厂商1产量为1.5时,自己的最大利润产量, 即满足:
6.重复博弈

I11
C
D
①
I21
D
C
I12
C
② ① I13
D C D C
C
②
D
① I1.5
C D
①
①
I14
D
②
I22
C
②
D C
②
D
I23
C
②
D C
②
D
I24
C
②
D C D
②
I25
C
②
D
C
D
10 5 13 6 5 0 8 1 13 8 16 9 6 1 9 2 10 13 5 6 13 16 8 9 5 8 0 1 6 9 1 2
重复博弈的子博弈
当博弈进行到t阶段,t前历史是局中人的共同知识,因而重复博弈是信息 完美的动态博弈。从t阶段开始直到博弈的终止的博弈称为原博弈的子博 弈。在 t 1,2,3, , T 中,由t+1阶段开始的子博弈为将G重复T-t次的重复博 弈 G (T t , ) 。到达t+1阶段的历史有多少,就有多少子博弈。 子博弈精炼纳什均衡在每个子博弈上都给出纳什均衡。
初期,t阶段前的博弈历史都可被局中人观察到。 局中人在 G (T , ) 中的支付函数为阶段支付的贴现和,即
t 1
T
it 1 it
重复博弈的策略
无论是有限还是无限的重复博弈,局中人的策略都是指一个完整的行 动计划。它给出在任何情况下,局中人所选择的行动。在 G (T , ) 中, 局中人i的一个策略系指在每一阶段t,局中人i的t期前的历 t t。这里 a t 表示参 t 1 2 t 1 ,到t期行动 a t 的映射: 史 h (a ,a, ,a ) i s i (h ) a i i 与人 i 在 t 期采取的行动。而 a t 表示 t 期的行动组合, 1,2,3, , T 。 t
重复博弈PPT课件

定理:设原博弈的一次性博弈有均衡得 益数组优于w,那么在该博弈的多次重复 中所有不小于个体理性得益的可实现得 益,都至少有一个子博弈完美纳什均衡
的极限的平均得益来实现它们。
厂商1得益
第15页/共30页
4.3 无限次重复博弈
4.3.1 两人零和博弈的无限次重复博弈 4.3.
w* w
时努V力工作,否则偷懒0 。 e
设厂商已采用上述触发V策略(w。* 由 e于) V
,
e
e
工人接受工作V是最(w佳* 反 e应) 。(1用 ) 记工人努力工作 e
时无限次重复博弈得益的现值,则 第26页/共30页
用V 记工人选偷懒时无限重复博弈得益的
在无限次重复古诺模型中,当贴现率 满足一定条
件时,两厂商采用下列触发策略构成一个子博弈完美纳什
均衡:
在第一阶段生产垄断产量的一半1.5;在第 t 阶段,如 果前 t-1 阶段结果都是(1.5,1.5),则继续生产1.5,否则生 产古诺产量2。
第21页/共30页
设厂商1已采用该触发策略,若厂商2也采用该触发策 略,则每期得益4.5,无限次重复博弈总得益的现值为:
4.51 2 4.5
1
如果厂商2偏离上述触发策略,则他在第一阶段所选
产量应为给定厂商1产量为1.5时,自己的最大利润产量,
即满足:
max q2
8 1.5 q2
q2 2q2
max q2
4.5
q2
q2
q 2.25
解得 2
,此时利润为5.0625,高于触发策略
第一阶段得益4.5。 第22页/共30页
第3页/共30页
策略:博弈方的一个策略就是在每个阶段(即每 次重复)针对每种情况如何行为的计划。 子博弈:从某个阶段(不包括第一阶段)开始, 包括此后所有阶段的重复博弈部分。 均衡路径:由每个阶段博弈方的行为组合串联而 成。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020年11月18日
博弈论第六章
1
重复博弈的类型
“宽容”OR“不好惹”?
A家长教育孩子A的原则: 宽容
A的选择: 及时还击, 培养“不好惹”的声誉—— “他打你,你就打他”
C家长教育孩子C的原则: 好斗
若A与C之间的博 弈重复进行?
要与人为善
2020年11月18日
博弈论第六章
1
1 r r 市场利率
1 2 2 3 T 1T
T
2020年11月18日
t 1 博t 弈论第六章
13
t 1
重复博弈的类型
第一节 重复博弈的类型
➢二、无限次重复
➢(一)案例:寡头削价竞争
➢1.案例
➢
寡头1
➢
高价
低价
➢
高价
➢寡头2
4,4
➢
低价 5,0
0,5 1,1
2020年11月18日
重复博弈的类型
第一节 重复博弈的类型
➢二、无限次重复 ➢(一)案例:寡头削价竞争 ➢2.无限次重复博弈策略分析 ➢(3)以后各期
A、if寡头2合作,“高价”→ 寡头1坚持“高价”
2020年11月18日
B、 if寡头2不合作,“低价”→ 寡头1报复,永远低价
博弈论第六章
16
重复博弈的类型
第一节 重复博弈的类型
9
重复博弈的类型
第一节 重复博弈的类型
➢一、有限次重复
➢(二)定理:有限次重复博弈的均衡
G(T):有限次重复博弈 G:博弈 T:重复次数 G:阶段博弈,T<∞
2020年11月18日
若G有唯一的纳什均衡,
则G(T)的唯一子博弈精炼
纳什均衡是:
G的纳什均衡重复T次。博弈来自第六章10重复博弈的类型
第一节 重复博弈的类型
2
重复博弈的类型
价格串通卡特尔
➢一次博弈:唯一纳什均衡——(低价,
低价)
经过一次博弈,
➢重复博弈:合作(高价,豁高然开价朗 )
B国
2020年11月18日
A国
高价 低价
高价 5,5 -5,10
低博价弈论第六章10,-5
重复博弈的类型
0,0 3
博弈论
第六章 重复博弈和策略行动
2020年11月18日
博弈论第六章
2.信息的完全与完美性
3.存在的必要性: 基于长期与反复的合作和竞争关系
商业中的“回头客”:
商家与顾客的重复博弈
2020年11月18日
博弈论第六章
12
重复博弈的类型
第一节 重复博弈的类型
➢一、有限次重复
➢(三)重复博弈的特征
4.参与人的总支付(得益): 所有阶段博弈得益的值之和or 所有阶段博弈得益的贴现值之和。
➢一、有限次重复 ➢(一)案例分析 ➢2.一次博弈的纳什均衡
➢(打折,打折),囚徒困境
2020年11月18日
博弈论第六章
7
重复博弈的类型
第一节 重复博弈的类型
➢一、有限次重复 ➢(一)案例分析 ➢3.引入重复博弈:价格大战/周·次
(1)假定:初始状态 (不打折,不打折)——合作
2020年11月18日
博弈论第六章
23
重复博弈的类型
第一节 重复博弈的类型
➢二、无限次重复
➢(一)案例:寡头削价竞争
➢3.触发策略与纳什均衡
(1)情形一:寡头2不合作
寡头2:选择“低价”,
第一阶段得益=5 寡头2:其余阶段只能选择“低价”,
得益=1,总得益——
寡头1:报复,
永远选择“低价”
2020年不11合 月1作 8日
5 1 博弈论1第六章 2 重复博弈的类型
5
17
重复博弈的类型
寡头2的权衡
合作OR背叛?——
2020年11月18日
比较“合作”与“背叛”的得益
博弈论第六章
19
重复博弈的类型
第一节 重复博弈的类型
➢二、无限次重复 ➢(一)案例:寡头削价竞争 ➢3.触发策略与纳什均衡
(3)寡头2选择“高价” (合作)的条件
4 5 1 1
2020年11月18日
博弈论第六章
8
重复博弈的类型
第一节 重复博弈的类型
➢一、有限次重复 ➢(一)案例分析 ➢3.引入重复博弈:价格大战/周·次
(2)第二周:if“京东”背叛 ——打折,5→6 (3)第三周:国美报复,永远打折 “京东”,6→3,永远得3
(4)结果:合作——
(不打折,不打折)
2020年11月18日
博弈论第六章
1
第一节 重复博弈的类型
➢二、无限次重复
➢(一)案例:寡头削价竞争
➢3.触发策略与纳什均衡
(2)情形二:寡头2合作
寡头2:选择“高价”, 寡头2:其余阶段选择“高价”, 第一阶段得益=4
总得益——
寡头1:合作,永远选择“高价”
4 4 4 2
2020年11月18日
4
博弈论第六章
18
1
1 博弈论第六章
4 重复博弈的类型
20
合作还是背叛?
寡头厂商的抉择
2020年11月18日
博弈论第六章
21
重复博弈的类型
第一节 重复博弈的类型
➢二、无限次重复 ➢(一)案例:寡头削价竞争 ➢3.触发策略与纳什均衡
(4)结论
4 5
贴现因子大于1/4时(合作的长期价值大), 1
1
触发策略:纳什均衡(高价,高价)。 1
博弈论第六章
14
重复博弈的类型
第一节 重复博弈的类型
➢二、无限次重复
➢(一)案例:寡头削价竞争
➢2.无限次重复博弈策略分析:Trigger Strategies(触发战略,冷酷战略)
(1)前提:两寡头商议结果 (高价,高价)
2020年11月18日
(2)第一期:寡头1
选择“高价”,合作
博弈论第六章
15
4
重复博弈的类型
第一节 重复博弈的类型
➢一、有限次重复 ➢(一)案例分析 ➢1.案例:电器商城的价格大战
2020年11月18日
博弈论第六章
5
重复博弈的类型
电器商城的价格大战
➢
➢
➢
打折
➢国 美
➢
不打折
京东
打折
不打折
3,3
6,1
1,6
5,5
2020年11月18日
博弈论第六章
6
重复博弈的类型
第一节 重复博弈的类型
➢一、有限次重复 ➢(三)重复博弈的特征
1.结构上的独立性 (与序贯博弈区分)
阶段博弈之间无“物质上的”联系:no physical link 前一阶段博弈不改变后一阶段博弈的结构; 各阶段具有独立的选择和得益。
2020年11月18日
博弈论第六章
11
重复博弈的类型
第一节 重复博弈的类型
➢一、有限次重复 ➢(三)重复博弈的特征
4
2020年11月18日
博弈论第六章
22
重复博弈的类型
第一节 重复博弈的类型
➢二、无限次重复 ➢(一)案例:寡头削价竞争 ➢3.触发策略与纳什均衡
(5)启示
如果博弈方有足够耐心,
任何可行的个人理性得益
都能在均衡中得以实现。 如果博弈方极端有耐心,
任何得益都能
2020年11月18日
成为均衡的博弈结果。