四章重复博弈

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章节重复博弈

何为“重复博弈”? 重复博弈是指基本博弈重复进行构成的博弈过程。–重复博弈中每个阶段中的博弈方、可选策略、规则和得益都是相同的----是特殊的动态博弈;

–形式上是基本博弈的重复进行,但博弈方的行为和博弈结果不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发送变化,从而使他们在重复博弈过程不同阶段的行为选择受到影响。

–可信度:子博弈完美性仍是判断均衡是否稳定可靠的重要判断依据

4.1 引论

4.1.1 为什么研究重复博弈

4.1.2 基本概念

分类:有限次重复博弈,无限次重复博弈

给定一个基本博弈G(可以静态,也可以动态),重复进行了T次G,并且在每次重复G之前,各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为()

G T的“原

G T。而G称为()

博弈”。()

G T的一个“阶段”。

G T中的每次重复称为()

理论上,重复博弈可以无限制进行下去,不一定经过一定次数重复以后就必须结束。如果一个基本博弈G一直重复下去,这样的重复博弈就是“无限次重复博弈”,记为()

G 。无限次重复博弈的基本博弈也称为“原博弈”。

无限次重复博弈是有无限个阶段的动态博弈。

重复博弈的次数虽然有限,但重复的次数或博弈结束的时间不确定,这种重复博弈中博弈方的行为选择与确定结束时间的有限次重复博弈很不同,与无限次重复博弈很相似,甚至可以通过某种方式与无限次重复博弈统一起来。这种重复博弈可以称为“随机结束的重复博弈”。

策略、子博弈和均衡路径

●策略:

–博弈方的一个策略就是在每个阶段(即每次重复),针对每种情况(以前阶段的结果)如何行动的计划。●

博弈:

–重复博弈的子博弈就是从某个阶段(不包括第一阶段)开始,包括此后所有阶段的重复博弈部分。●

路径:

-–子博弈完美纳什均衡,以逆推归纳法(逆向归纳法)为核心的子博弈完美纳什均衡分析及相关结论,可以推广到重复

博弈中。 -–

重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为

对应前一阶段的每种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m 种策略组合,那么重复两次就有2m 条博弈路径,重复T 次就有T m 条博弈路径。

重复博弈的得益(支付)

任何博弈中博弈方策略选择的依据都是得益的大小。 计算重复博弈的“总得益”。 计算各阶段的“平均得益”。 时间有先后,引入贴现系数δ

2

1

11231

...T

T t T t t ππδπδπδ

πδπ--==++++=∑

无限次重复博弈:

2

1

11231

...T t T t t ππδπδπδ

πδπ∞

--==++++=∑

无限次重复博弈有时也写作(,)G δ∞

在考虑贴现因素的情况下,重复博弈的平均得益与不考虑贴现因素时的平均得益,必然也有所不同。通常可以用下列方式定义平均得益。 如果一常数π作为重复博弈(有限次重复或无限次重复)各个阶段的得益,能产生与得益序列1π,2π,…相同的现值,则称π为1π,2π,…的“平均得益”。

有限次重复博弈不一定考虑贴现问题。

无限次重复博弈必然要考虑贴现问题。由于无限次重复博弈每阶段得益都是π时,现值为

δ

-,而每阶段得益为1π,2π,…时,无限次重复博弈的得益现值是11

t t t δπ∞

-=∑,因此令

δ-=11

t t t δπ∞

-=∑ 11

(1) t t t πδδπ∞

-==-∑

这就是计算无限次重复博弈平均得益的公式。

随机停止和贴现率

典型的随机结束重复博弈可以理解为在进行一个重复博弈时,每次都通过抽签来决定是否停止重复,如果抽到停止重复的概率为p ,则抽

到重复下去的概率为1p -。

设某博弈方在此博弈中的阶段得益为t π,利率为γ,因为在每一次博弈以后能继续下一次重复的可能性是1p -,因此第二阶段的期望得益为2(1)/(1)p πγ-+,进一步,第三阶段的期望得益为223(1)/(1)p πγ-+,… 故该博弈方在重复博弈中期望得益的现值为:

221231

11

1

111(1)/(1)(1)/(1)...

(1)(1)1()

1t t

t t t t t t t

t p p p p πππγπγπγπγδπ-∞

-=∞

-=∞

-==+-++-++-=+-=+=∑∑∑

其中最后一个等式是通过令(1)/(1)p γδ-+=得到的。

把这个δ与前面纯粹考虑时间价值的贴现率统一起来,我们就把已知概率的随机停止重复博弈与无限次重复博弈统一起来了。随机停止重复博弈问题可以当作无限次重复博弈来进行分析。

4.2 有限次重复博弈

4.2.1 两人零和博弈的有限次重复博弈

重复零和博弈不会创造出新的利益。

合作的可能性根本不存在。即使双方都知道还要重复进行许多次基本博弈,也不会改变它们在当前阶段博弈中的行动方式,不可能变得(哪

怕是暂时的)合作和顾及对方的利益。

所有以零和博弈为原博弈的有限次重复博弈,博弈方的正确策略都是重复一次性博弈中的纳什均衡策略。

推广:非零和或多个博弈方,博弈方的利益严格对立,没有纯策略纳什均衡的其他严格竞争博弈中。在以这些博弈作为原博弈构成的有限次重复博弈中,惟一的子博弈完美纳什均衡就是所有博弈方都始终采用原博弈的混合策略纳什均衡策略。

例:有限次重复猜硬币博弈

各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳什均衡策略。

4.2.2 惟一纯策略纳什均衡博弈的有限次重复博弈

在有惟一纯策略纳什均衡的博弈中,博弈方之间的利益关系不再是始终对立的,而是有很大一致性甚至完全一致。

在以这样的博弈为原博弈的有限次重复博弈中,博弈方的行动和博弈结果会不会发生质的变化?

如果原博弈惟一的纯策略纳什均衡本身就是帕累托意义上的最佳策略组合,那么因为符合所有博弈方的利益,因此,有限次重复显然不会改变博弈方的行动方式。

相关文档
最新文档