博弈论(重复博弈)

合集下载

重复博弈的经典例子

重复博弈的经典例子

重复博弈的经典例子重复博弈的经典例子在经济学和游戏理论中,博弈论是一种非常重要的分析工具。

它通过对智力游戏、竞争和合作等情境的描述,来研究参与者的行为和决策方式,以及他们的利益。

其中,重复博弈是一种经典的博弈类型,透露了很多有趣的现象和策略。

本文就将介绍其中的两个典型例子。

例子一:囚徒困境囚徒困境是博弈论史上最著名的例子之一。

它描述了两名罪犯在审讯时的选择。

如果他们都保持沉默,那么他们各被判三年徒刑;如果其中一个人背叛了另一个人并供出了他的罪行,那么背叛者将被判无期徒刑而另一个人将被无罪释放;如果两个人都背叛了对方,那么都将被判十年徒刑。

显然,各自为政并不能得到最好的结果,但是如果双方都不信任彼此,那么无法避免地会被卷入恶性循环,陷入坏的局面。

所以,如何打破僵局,达到合作互惠的结果呢?答案是,在重复博弈的前提下,让双方建立起稳定的信任关系,并通过稳健的策略来激励对方合作。

比如,如果一方合作另一方背叛,那么背叛者的惩罚应该比另一方少,这样可以让背叛者看到合作的好处;如果另一方也背叛了,那么惩罚应该更大,从而降低背叛的动机。

这种实验表明,人们在重复博弈中往往会采取长远最大化利益的策略,而不是只考虑眼前的利益。

例子二:公共产品的提供公共产品是指对所有人都有益处,但是没有私人市场提供或者通过个人机会成本无法享受的产品,比如环保、文化教育等。

由于公共产品的自由乘坐,导致许多人往往倾向于“裹着麻袋过河”,即只享受公共产品的好处而不出任何力气来投资。

这样,公共产品会出现供给不足的情况,逐渐凋零。

那么,如何解决公共产品的提供问题呢?重复博弈可以给出一些帮助。

假设每个人都可以选择投资或不投资,而且每个人都可以看到其他人的决策;如果有足够多的人投资了,那么所有人都可以获得好处;如果投资的人太少了,那么所有人都得不到好处。

那么,如何让更多的人参与投资呢?答案是,通过适当设定利益偏好,比如对投资者给予优惠,以鼓励更多的人来投资。

第六讲 重复博弈

第六讲 重复博弈

at a1 a2 aT
t 1 T 1 t 1
T
• 无限次重复博弈的总得益的现值就是

t 1

t 1
at a1 a2
T 1
aT
• 平均得益:如果一个常数A作为重复博弈的各个阶段 的得益,能产生与得益序列a1,a2, …,aT相同的现在 值,就称A为a1,a2, …,aT的平均得益。 • 如果不考虑贴现因素,可让贴现率为1,就可以同样 适用上述定义。 • 在无限次重复博弈中,当每一阶段的得益都是A时, A 现在值就是
• 重复博弈的各阶段有时间次序,各阶段的得益也有时 序。重复次数不多或时间间隔不长,得益的时序问题 无关紧要,但若是次数较多,或时间较长,比如是无 限阶段重复博弈,就必须考虑得益的时序问题。 • 一般是把各阶段的得益折合成现值来计算。若利率为r, 则贴现系数为 1

1 r
• 则重复T次,各阶段的得益分别为a1,a2, …,aT时的总 得益的现值就是
• 2.基本概念 • (1)设G是一个基本博弈(动静都可以,但一 般研究静态),重复进行T次,并且每次重复之 前各博弈方都能看到此前的博弈结果,这样的博 弈过程称为“G的T次重复博弈”,记为G(T), G称为G(T)的原博弈,每一次重复称为G(T) 的一个阶段。 • 重复博弈的每一个阶段都是独立的博弈,各方都 有得益。这是与一般动态博弈的重要不同。另一 方面,重复博弈中各阶段的博弈方和博弈内容都 必须相同,与一般的动态博弈也不同。
1 p (1 p) A a1 a2 a3 2 1 r (1 r )
2 (1 p) 1 p t 1 at at , 其中 t 1 (1 r ) 1 r t 1 t 1 t 1

博弈论(第四章)

博弈论(第四章)
谢富纪 2009年3月 11
2.有限次重复博弈
有唯一纯策略纳什均衡博弈的有限次重复博弈
有限次重复博弈的囚徒困境博弈,可以理解成警察 给两人两次交代的机会。
囚 徒2 坦白 不坦白
囚 徒 1
坦白
不坦白
-5, -5
-8, 0
0, -8
-1, -1
谢富纪 2009年3月
12
2.有限次重复博弈
因为重复博弈全过程是一种动态博弈过程,从第二 阶段开始。 此前的博弈已是既成的事实,而在此后又没有任何 的后继阶段,因此实现本阶段最大利益是两博弈 方在该阶段的唯一原则。结果是(坦白,坦白),
谢富纪 2009年3月
29
2.有限次重复博弈
本博弈中之所以不能或不能部分实现最佳结果
(A,A),是因为在两次重复博弈中博弈方没
有运用触发策略的条件或者说机会。后面的选择 并不取决于第一次博弈的结果。
谢富纪 2009年3月
30
2.有限次重复博弈
厂商2 得益
(1,4) (1.5,3) (3,3)
谢富纪 2009年3月
17
2.有限次重复博弈
削价竞争博弈
高价 寡 高价 头 1 低价
寡头2
低价
100,100 20,150 150,20 70,70
由于两个寡头在同一市场的竞争可以看作维持很 长时间,因此可以看作是重复博弈。然而结果是 令人遗憾的。
谢富纪 2009年3月 18
2.有限次重复博弈
两个悖论
谢富纪 2009年3月
27
2.有限次重复博弈
两市场博弈的重复博弈
厂商 2 A 厂A 商 1 B B
3,3
1,4
4,1
0,0

第六章第一讲重复博弈的类型解读

第六章第一讲重复博弈的类型解读
感谢室友不杀之恩 重复 博弈
2020年11月18日
博弈论第六章
1
重复博弈的类型
“宽容”OR“不好惹”?
A家长教育孩子A的原则: 宽容
A的选择: 及时还击, 培养“不好惹”的声誉—— “他打你,你就打他”
C家长教育孩子C的原则: 好斗
若A与C之间的博 弈重复进行?
要与人为善
2020年11月18日
博弈论第六章
1
1 r r 市场利率
1 2 2 3 T 1T
T
2020年11月18日
t 1 博t 弈论第六章
13
t 1
重复博弈的类型
第一节 重复博弈的类型
➢二、无限次重复
➢(一)案例:寡头削价竞争
➢1.案例

寡头1

高价
低价

高价
➢寡头2
4,4

低价 5,0
0,5 1,1
2020年11月18日
重复博弈的类型
第一节 重复博弈的类型
➢二、无限次重复 ➢(一)案例:寡头削价竞争 ➢2.无限次重复博弈策略分析 ➢(3)以后各期
A、if寡头2合作,“高价”→ 寡头1坚持“高价”
2020年11月18日
B、 if寡头2不合作,“低价”→ 寡头1报复,永远低价
博弈论第六章
16
重复博弈的类型
第一节 重复博弈的类型
9
重复博弈的类型
第一节 重复博弈的类型
➢一、有限次重复
➢(二)定理:有限次重复博弈的均衡
G(T):有限次重复博弈 G:博弈 T:重复次数 G:阶段博弈,T<∞
2020年11月18日
若G有唯一的纳什均衡,
则G(T)的唯一子博弈精炼

经济博弈论之重复博弈

经济博弈论之重复博弈

9
三、重复博弈的得益
重复博弈的得益,必须兼顾其他阶段的得益,或者考虑整个重复博弈过程得益 的总体情况。
1.计算重复博弈的“总得益”,即博弈方各次重复得益的总和 2.计算各阶段的“平均得益”,即总得益除以重复次数
10
三、重复博弈的得益
考虑到重复博弈额次数和时间的先后次数,不同时间获得的利益对人们的价值是 有差别的,考虑到这个因素,引进将后一段的得益折算成当前阶段得益(现在值) 的贴现系数δ 。
连锁店悖论
是指一个在n个市场都开设连锁店的企业,对于各个市场的竞争者是否打击排斥的策略选择。
“先来后到”博弈,竞争者选择进入,先占领市场的连锁店不打击, A 打进 B 不进 (1,10) 是原博弈的唯一的子博弈完美纳什均衡,是两个理性的博弈方之间 博弈的唯一结果。 根据上诉的定理和一般结论,以这个博弈为原博弈的有限次重复博弈, 唯一的子博弈完美纳什均衡就是原博弈的纳什均衡,也就是每个竞争者 可以进入,连锁店不打击。 (-2,3) (5,5) 现实中类似问题的直觉经验与该理论结论明显不符。
三价博弈
厂商2 H H 厂商1 M
M
L
5,5 6,0 2,0
0,6 3,3
0,6 0,2
L
2,0
1,1
两个纯纳什均衡(M,M),(L,L);符合博弈方总利益最大(H,H)
26
4.2.3多个纯策略纳什均衡博弈的有限次重复博弈
一、三价博弈的重复博弈
三价博弈
厂商2 H H 厂商1 M
M
L
5,5 6,0 2,0
31
4.2.3多个纯策略纳什均衡博弈的有限次重复博弈
三、两市场博弈的重复博弈 厂商2 A 3,3 4,1 B 1,4 0,0 三次重复博弈的均衡路径是(A,A),(A,B),(B,A), 得益是(3+1+4)/3=2.67.

博弈论课件4重复博弈

博弈论课件4重复博弈

5 1 1 2 5
如果博弈方2采用H,总得益现值为:
1
V 4 V
因此当 1/ 4时,此触发策略纳什均衡策略。
4.3.2 惟一纯策略纳什均衡的无限次重复博弈
无限次重复博弈民间定理(弗里德曼,1971)
设G是一个完全信息的静态博弈,用(e1, , en )记G的纳什均衡得益,
用(x , 1
重复囚徒困境悖论和连锁 店悖论
☻理论和实践的直觉矛盾,现实 中寡头之间的价格战问题并 不十分普遍,重复次数较大 的实验研究的结果(重复200 次的囚徒困境)
☻泽尔腾(1978),“连锁店悖论” (导论中的先来后到博弈), 实际中对开头几个市场的进 入者不计代价的打击
☻问题的症结与蜈蚣博弈类似, 在于在较多阶段的动态博弈 中逆推归纳法的适用性T t1t 1t1 2 23
t1
t 1
t
4.1.2 基本概念
平均得益:如果一常数作为重复博弈(有限次重复博弈或
无限次重复博弈)各个阶段的得益,能产生与得益序列
1, 2,相同的现在值,则称为1, 2,的平均得益
无限次重复博弈时
2 (1 )
1 2 23
4.2.3 多个纯策略纳什均衡的有限次重复博弈
三价博弈的两次重复博弈
+1
厂H 商M
1L
H
5,5 6,0 2,0
厂商2
M 0,6 3,3 2,0
L
0,2 0,2 1,1
+3
厂H 商M 1L
H
8,8 7,1 3,1
厂商2 M
1,7 4,4 3,1
L
1,3 1,3 2,2
三价博弈
两次重复三价博弈的等价博弈
有限次重复博弈民间定理

有限次重复博弈名词解释(一)

有限次重复博弈名词解释(一)

有限次重复博弈名词解释(一)有限次重复博弈在博弈论中,有限次重复博弈(Finite Repeated Games)指的是一种博弈过程,参与者在有限的回合内重复进行相同或相关的博弈行为。

这种博弈过程允许参与者根据对对手策略的观察进行调整,并在每一回合中做出决策。

1. Tit-for-Tat(以牙还牙)Tit-for-Tat是一种著名的策略,其中参与者在每一回合采取与对手上一回合行为相同的决策。

这种策略的核心思想是以相同的方式对待对手,如果对手合作,自己也合作;如果对手背叛,自己也背叛。

Tit-for-Tat策略在一些情况下可以有效地维持合作,促进稳定的协作关系。

2. Grim Trigger(严厉触发)Grim Trigger是另一种重要的策略,其基本原理是一旦对手背叛,参与者将永远背叛,不再参与合作。

这种策略要求参与者严格执行,因为只要一次背叛就会触发永久背叛状态,无论对手后续如何合作。

3. Folk Theorem(民间定理)民间定理是博弈论中关于有限次重复博弈的一个重要定理。

该定理指出,在重复博弈中,多种平衡策略组合可用于维持协作。

这意味着,参与者可以通过选择一种合适的策略组合来达到共同利益,并在一段时间内维持合作关系。

4. 巨人的耐心(Fictitious Play)巨人的耐心是一种基于对历史决策的观察和预测的策略。

在每一回合,参与者会根据对对手过去行为的观察进行预测,并假设对手会继续坚持相同的策略。

这种策略允许参与者根据对手的行为进行调整,并选择最优的决策。

5. 有限回合合作博弈(Finite Round Cooperation Game)有限回合合作博弈是一种特殊类型的有限次重复博弈。

在该博弈中,参与者在预定的有限回合内采取决策,其目标是在这些有限回合内最大化利益。

这种博弈通常涉及团队合作,参与者需要权衡个体利益与整体目标之间的平衡。

6. 随机策略(Mixed Strategy)随机策略是指参与者在决策中随机选择不同的行动概率分布。

博弈论读书笔记(五)重复博弈

博弈论读书笔记(五)重复博弈

博弈论读书笔记(五)重复博弈2.3重复博弈从这⾥开始,就进⼊博弈论⽐较难以理解的地⽅了。

我也不跟着书上的章节⾛,根据⾃⼰的理解和书上的例⼦来写,如果理解有什么不对的地⽅,欢迎各位⼤佬的指正。

⾸先我们来明晰博弈论到底在讨论些什么:对于这个问题,前⾯⼏章的内容可能对⼤家会造成⼀定的误导。

因为根据前⾯⼏章的例⼦,我们可以很容易地认为,博弈论就是在讨论在某个规则下,参与者最优的策略和参与者之间达到的平衡。

这句话本⾝没有错误,但是我们很容易理解为:这个平衡是像最开始那两个囚徒⼀样,选择“保证对⽅不会背叛并且⾃⼰在此情况下能获得最⼤利益”的战略所达到的平衡(这句话有点难以理解,不过我相信你能明⽩我的意思)。

例如第⼀章第⼀节中囚徒困境双⽅都选择招认(因为选择合作即不招认,结果可能是被背叛)。

但是⼀旦进⼊了重复博弈那么我们就不能只考虑眼前的利益(即保守地只去选择单次博弈的纳什均衡),⽽要考虑多次重复博弈的总收益。

这个时候就需要参与双⽅共同商定⼀个“协议”(例如双⽅说好都选择不招认),这个协议必须是对于双⽅都有利的(⾄少由于选择单次博弈的纳什均衡,例如双⽅不招认总⽐双⽅都招认要好),并且协议中会对不遵守规则的进⾏惩罚,以便于对每个⼈来说选择合作是最好的结果。

从这⾥我们就可以理解“博弈论教你如何制定规则的”这句话了。

好了,这⼀章最核⼼的思想在这⾥已经讲完了,虽然我可能说的不是那么清晰,不过还是希望你能认真理解上⾯所说的,这会对下⾯的概念理解有很⼤帮助。

2.3.A两阶段重复博弈先给出⼏个先⾏的定义和定理:定义:对个定的阶段博弈G,令G(T)表⽰G重复T次的有限重复博弈,并且在下⼀次博弈开始前,所有以前的博弈都可以被观测到。

G(T)的收益为T次阶段博弈收益的简单相加。

这个定义最重要的是引出⼀个重复博弈中收益的概念,即T次博弈的收益简单相加,后⾯我们会提到贴现的概念,不过到这⾥先理解到简单相加就⾏。

定理:如果阶段博弈G有唯⼀的纳什均衡,则对任意有限的T,重复博弈G(T)有唯⼀的⼦博弈精炼解:即G的纳什均衡结果在每⼀阶段重复进⾏。

重复博弈

重复博弈

©2008仅供课程参考。

未经许可,请勿传播1博弈论与信息经济学重复博弈姚洪心重复博弈的现象•1.王朝更替(分久必合,合久必分)•2.情侣相处•3.政治集团的制衡与风险期(吴三桂为什么要在晚年叛变,死前封帝?)©2008仅供课程参考。

未经许可,请勿传播2重复博弈•一次动态博弈也称为“序贯博弈”。

•重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。

如囚徒困境。

•重复博弈的特征:✓1、阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变后一阶段的结构;✓2、所有参与人都观测到博弈过去的历史;✓3、参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均值。

贴现因子:下一期的一单位支付在这一期的价值。

注意:在每个阶段,参与人可同时行动,也可不同时行动。

©2008仅供课程参考。

未经许可,请勿传播3重复博弈©2008仅供课程参考。

未经许可,请勿传播4重复博弈©2008仅供课程参考。

未经许可,请勿传播5重复博弈因为其他参与人过去的历史总是可以观测到的,因此,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史,因此,参与人在重复博弈中的战略空间远远大于和复杂于每一阶段的战略空间,这意味着,重复博弈可能带来一些“额外”的均衡结果。

影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。

博弈重复的次数的重要性来源于参与人在短期利益和长远利益之间的权衡。

信息的完备性:当一个参与人的支付函数不为其他参与人知道时,该参与人可能有积极性建立一个“好”的声誉以换取长远利益。

©2008仅供课程参考。

未经许可,请勿传播6重复博弈和无名氏定理•有限次重复博弈—连锁店悖论重复博弈冷酷策略©2008仅供课程参考。

未经许可,请勿传播9冷酷型重复博弈囚徒A争锋相对的重复博弈•12345•行抵赖坦白抵赖坦白抵赖•列抵赖抵赖坦白抵赖坦白背离争锋相对•12345•行抵赖坦白坦白坦白坦白•列抵赖抵赖坦白坦白坦白©2008仅供课程参考。

博弈论(第十一讲 重复博弈与声誉)PPT课件

博弈论(第十一讲 重复博弈与声誉)PPT课件
10
11.1 基本概念
为了对不同的支付流进行比较,需要确定一个标准。 一个标准就是对支付流进行加总,求得各阶段支付之和 。这样做不仅因为简单,而且当单一阶段的支付增加时 ,总和也随之增加。 对于上述三个支付流有:
11
11.1 基本概念
很多时候,使用单一阶段支付总计并不能达到满意效果 ,因为没有体现出来不同阶段支付对参与人重要性的差 别。 一般而言,人们更看重及早到手的收益。因此,提出以 带权重的支付之和作为衡量标准,越往后一阶段的支付 的权重越小。用ut表示阶段t所得支付,总支付为:
第十一讲 重复博弈 与声誉
Yang Ling 13898801325
1
标题添加
点击此处输入相 关文本内容
标题添加
点击此处输入相 关文本内容
总体概述
点击此处输入 相关文本内容
点击此处输入 相关文本内容
2
11 重复博弈与声誉
11.1 基本概念
重复博弈:所有参与者周而复始地面对相同的阶段博弈的一 种动态博弈。 阶段博弈是构成重复博弈的组件。 在重复博弈中,参与者不仅考虑当前处境所产生的支付,还 要考虑所有未来可能的处境所产生的支付。 下面博弈就是德国士兵与协约国士兵重复博弈中的阶段博 弈:
16
11.2 有限次重复博弈
11.2.1 有限次重复博弈——阶段博弈只有一个纳什均衡 假设重复博弈要经历T个阶段而此时是T-1阶段,总支付为各 个独立阶段的支付之和。在阶段T都会选择击中。用AT-2和GT-2 分别表示盟军与德军从阶段1到阶段T-2的各阶段支付之和,T 阶段的子博弈如下所示:
可以看出,AT-2和GT-2对求解 过程不产生任何影响。
17
11.2 有限次重复博弈
11.2.1 有限次重复博弈——阶段博弈只有一个纳什均衡

重复博弈的名词解释

重复博弈的名词解释

重复博弈的名词解释重复博弈(Repeated Games)是博弈论中的一个重要分支,指的是在一定时间内重复进行相同博弈过程的一类博弈模型。

在重复博弈中,参与者的行为不再是仅基于当前回合的局部最优策略选择,而是考虑到未来回合的长期利益。

通过持续进行博弈,参与者可以互相观察对方过去的行为,并以此来调整自己的决策策略,进而达到一种稳定的合作或竞争姿态。

1. 重复博弈的基本特征重复博弈具有以下基本特征:1.1 时间维度:与一次性博弈(One-shot Games)相比,重复博弈将博弈过程拉长至多个时间回合,并通过观察对方的历史行为来调整策略选择。

1.2 互动性:重复博弈需要有多个参与者之间的相互作用,参与者的决策会受到对方决策的影响,并进一步影响对方的决策。

1.3 不完全信息:在重复博弈中,参与者对于对方的信息不完全,无法准确了解对方的策略选择和收益函数。

因此,参与者需要通过观察对方的历史行为来推测对方的潜在策略和潜在目标。

2. 重复博弈的策略选择在重复博弈中,参与者的策略选择通常可以分为两种基本类型:协作(Cooperation)和背叛(Defection)。

2.1 协作策略:协作策略指的是参与者在每一轮博弈中均选择对双方都有利的行动,追求长期合作和互利利益最大化。

协作策略的核心是建立合作的声誉和信任,通过长期合作获得稳定收益。

2.2 背叛策略:背叛策略指的是参与者在某些轮次中选择对自己有利但对对方不利的行动,追求个体利益最大化。

背叛策略的核心是以牺牲他人利益为代价,获得短期利益。

3. 重复博弈的平衡在重复博弈中,参与者通过观察对方过去的行为和收益来判断对方的策略选择,并以此为依据来调整自己的行动策略。

由于参与者之间的相互影响和信息不对称,重复博弈中存在多种平衡。

3.1 历史依赖平衡:指的是参与者根据对方过去的行为来决定自己的最优策略选择,并以此为依据来推测对方的未来行为。

通过建立声誉机制和信誉积累,在博弈的不同时间段实现稳定合作关系。

博弈论07 重复博弈2

博弈论07 重复博弈2

博弈论重复博弈重复博弈就是同样结构的博弈重复进行。

例如,囚徒困境、情侣博弈等重复进行多次时,每次都是相同的博弈,就是重复博弈。

重复博弈关系在现实中具有普遍性。

社会经济活动中除了短期一次性关系外,大量存在的是长期反复的合作和竞争关系。

重复博弈每次重复进行的博弈称为阶段博弈,或基本博弈,或原博弈。

重复博弈在理论上属于动态博弈,但重复进行的阶段博弈本身可以是静态博弈,也可以是动态博弈。

可以是完全信息重复博弈,也可以是不完全信息重复博弈。

本节讨论完全信息重复博弈。

博弈的重复是否会改变局中人的均衡策略,与重复次数及信息对称与否有关。

按重复次数可以分为有限次重复博弈和无限次重复博弈。

重复博弈的策略由于重复博弈中每个局中人在每个阶段都必须行动,因此局中人的一个策略就是在每个阶段针对每种情况(以前各阶段的结果)如何行动的整体计划。

因为重复博弈中其他局中人过去行动的历史是可以观测到的,所以一个局中人可以使自己在某个阶段的选择依赖于其他局中人过去的行动历史。

例如,囚徒困境博弈中,“如果你这次选择了坦白,我下次将选择坦白;如果你这次选择了抵赖,我下次将选择抵赖。

”重复博弈的策略也就是说,一个策略是一个完备的相机行动规则,它明确了在每一种可能的情况下局中人的行动选择。

因此,局中人在重复博弈中的策略空间远远大于和复杂于在每一个阶段博弈中的策略空间。

重复博弈的策略也就是说,一个策略是一个完备的相机行动规则,它明确了在每一种可能的情况下局中人的行动选择。

因此,局中人在重复博弈中的策略空间远远大于和复杂于在每一个阶段博弈中的策略空间。

重复博弈的策略也就是说,一个策略是一个完备的相机行动规则,它明确了在每一种可能的情况下局中人的行动选择。

因此,局中人在重复博弈中的策略空间远远大于和复杂于在每一个阶段博弈中的策略空间。

重复博弈的策略也就是说,一个策略是一个完备的相机行动规则,它明确了在每一种可能的情况下局中人的行动选择。

因此,局中人在重复博弈中的策略空间远远大于和复杂于在每一个阶段博弈中的策略空间。

博弈论第五章 重复搏弈(Repeated Games)

博弈论第五章 重复搏弈(Repeated Games)

4 5
1
1
1,局中人会H采 ,用 否则会采 L。用
4
精选ppt
无限次重复古诺模型:垄断合作
假定:P 8 Q ,其 Q 中 q q , 边际成本都为2。
1
2
在无限次重复古诺模型中,当贴现率 满足一定条件
时,两厂商采用下列触发策略构成一个子博弈完美纳什均
衡:
在第一阶段生产垄断产量的一半1.5;在第 t 阶段,如 果前 t-1 阶段结果都是(1.5,1.5),则继续生产1.5,否则生产 古诺产量2。
远选择不合作。
精选ppt
无限次重复博弈
无限次重复博弈与有限重复博弈的区别:
➢ 无限次重复博弈没有结束重复的确定时间。在
有限次重复博弈中,存在最后一次重复正是破坏重 复博弈中局中人利益和行为的相互制约关系,使重 复博弈无法实现更高效率均衡的关键问题。
➢ 无限次重复博弈不能忽视不同时间得益的价值 差异和贴现问题,必须考虑后一期得益的贴现系数,
t1
t ((1 1 rp))tt 1 1t 1
t(1 1 rp)t1t 1
t1 t
精选ppt
有限重复博弈
❖ 定义:令G={A1, A2,…,An; u1, u2,…,un)表 示n个局中人的完全信息博弈,对G重复 若干次,称G为阶段博弈。
给定阶段博弈G,令G(T)表示G 实施T (T为大于1的整数)次的重复博弈。在 某次阶段博弈开始之前,所有已采取过 的前面阶段的行动都可以观察到。局中 人在G(T)的盈利函数或效用简单的为来 自T个阶段博弈盈利现时值之和。
精选ppt
举例
有限次重复博弈:寡头市场的削价竞争 连锁店悖论:
精选ppt
寡头市场的削价竞争

博弈论重复博弈

博弈论重复博弈
(2.5,2.5)
(2,2) (3,1.5)
(4,1)
厂商1得益
轮换策略仍然不是最理想的情况, 最佳结果(A,A)无法实现是因为两次 博弈中博弈方没有运用触发策略的条件 或机会
两市场博弈的重复博弈(重复三次)
厂 商
A
1B
触发策略:
A 3,3 4,1
厂商2 B
1,4 0,0
两市场博弈
有运用触发策略的条件
4.51++2+L 14 .5
如果厂商2偏离上述触发策略,则他在第一阶段所选
产量应为给定厂商1产量为1.5时,自己的最大利润产量,
即满足:
m 8 1 . 5 a q q x 2 q m 4 . 5 q a qx
q 2
22
2
q 2
22
解得 q 2.25 2
,此时利润为5.0625,高于触发策略
本章介绍基本博弈重复进行构成的重复博弈。
虽然形式上是基本博弈的重复进行,但重复博弈中 博弈方的行为和博弈结果却不一定是基本博弈的简 单重复,因为博弈方对于博弈会重复进行的意识, 会使他们对利益的判断发生变化,从而使他们在重 复博弈过程中的行为选择受到影响。这意味着不能 把重复博弈当作基本博弈的简单叠加,必须把整个 重复博弈过程作为整体进行研究。
两市场博弈的重复博弈(重复101次)结果?
4.3 无限次重复博弈
4.3.1 两人零和博弈的无限次重复博弈 4.3.2 唯一纯策略纳什均衡博弈
的无限次重复博弈 4.3.3 无限次重复古诺模型
4.3.1 两人零和博弈的无限次重复博弈
两人零和博弈无限次重复的所有阶段都 不可能发生合作,博弈方会一直重复原 博弈的混合策略纳什均衡
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 重复博弈 (p129~)
§4.1 基本概念
一、什么是重复博弈 二、重复博弈的分类 三、重复博弈的策略 四、重复博弈的收益
§4.2 有限次重复博弈
一、2人零和博弈的重复 二、有唯一纯策略NE的有限次重复博弈 三、连锁店悖论(Chainstore Paradox)
H
L
4,4
5,0
0,5
1,1
ห้องสมุดไป่ตู้
可以证明,当贴现因子 较大时,上述 策略组合构成了SPNE:
1)TS 是 NE 2)这个NE是SPNE
2.无限次重复博弈的民间定理 (p133,定理5.1)
一个n人有限博弈G中,设(x1, x2,… xn)是G的任意可 实现收益,那么无限次重复博弈G(∞, δ) 中必存在一个 SPNE,各局中人的平均收益即为(x1, x2,… xn),只要 满足如下条件: 1) 时间偏好率 r =0 或是充分小的正数; 2)博弈在任意阶段结束的概率为0或是充分小的正数; 3)支付组合的元素是n维的,且严格帕累托优于G的最 小最大收益组合。
若干无限次充分博弈的例
1.“单边”的囚徒困境 博弈(p139)
抵赖 抵赖 坦白 5,5
10,-5
坦白
-5,10
购买 高质 低质 5,5
10,-5
抵制 0,0 0,0
0,0
2.产品质量博弈(p143)
均衡成立应满足的条件: 激励相容 竞争 市场出清
3.消费者转换成本博弈(p146)
马尔可夫过程 寻求马尔可夫策略(Markov st.)
合作收益集

B1 (开发A) B2 (开发B) a1 (开发A) 3,3 a2 (开发B) 4,1 1,4 0,0
4.5 4 3.5 3 2.5 2 1.5 1 0.5 0 0 1 2 3 4 5

§4.3 无限次重复博弈
一、二人零和博弈的重复 二、非零和博弈的无限次重复博弈 1、囚徒困境--寡头削价竞争博弈 NE: (L,L) 无限次重复的触发策略 P1: (1) H H (2)若上次是(H,H)则H, L 否则L P2:同P1
•连锁店悖论(Chainstore Paradox)
1.进入威慑(p104)
进入 容忍 (40,50) (-10,-10)
斗争
不进入
(0,300)
2.理论与实际的差别
四、多个纯策略NE的重复博弈 1。三价博弈
H
H(高价) 5,5 M(中价) 6,0 L(低价) 2,0
M
0,6 3,3 2,0
L
0,2 0,2 1,1
0,2 1,1 0,0 0,0
0,0 0,0
0,0 0,0
4,1/2 0,0 0,0 ½,4
例:两市场博弈的重复博弈
B1(开发A)
a1(开发A) 3,3
B2 (开发B)
1,4
a2 (开发B)
4,1
0,0
五、有限次重复博弈的民间定理 1.合作收益集(Cooperative payoff set) 2.安全值(security value) 最小最大值(Minimax V.) 3.民间定理(Folk Theorem) 设原博弈的一次性博弈有均衡收益数 组优于(u0,v0), 则在该博弈的多次重复中,所有不小于个 体理性收益的可实现收益至少有一个子博 弈精炼NE的极限平均收益来实现它。
H
H(高价) 8,8 M(中价) 7,1 L(低价) 3,1
M
1,7 4,4 3,1
L
1,3 1,3 2,2
2.关于触发策略(Trigger S.)的讨论
报复是否可信--很复杂 **可信的报复
H
H 5,5
M 0,6
L 0,2
P 0,0
Q 0,0
M L P Q
6,0 2,0 0,0 0,0
3,3 2,0 0,0 0,0
相关文档
最新文档