博弈论课件 第四章
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四讲 重复博弈
1
精选PPT
何为“重复博弈”?
重复博弈是指基本博弈重复进行构成的博弈过程。 – 重复博弈中每个阶段中的博弈方、可选策略、规则 和得益都是相同的----是特殊的动态博弈;
– 形式上是基本博弈的重复进行,但博弈方的行为和 博弈结果不一定是基本博弈的简单重复,因为博弈 方对于博弈会重复进行的意识,会使他们对利益的 判断发送变化,从而使他们在重复博弈过程不同阶 段的行为选择受到影响。
– 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的
每种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m
7
种策略组合,那么重复两次就有m2条博弈路径,重复次就有mt条博弈路径。
精选PPT
重复博弈的得益
任何博弈博弈方策略选择依据都是得益的大小。 计算重复博弈的“总得益”。 计算各阶段的“平均得益”。 时间有先后,引入贴现系数
推广:非零和或多个博弈方,博弈方的利益严格对立,
没有纯策略纳什均衡的其他严格竞争博弈中。在以这
些博弈作为原博弈构成的有限次重复博弈中,惟一的
子博弈完美纳什均衡就是所有博弈方都始终采用原博
12
弈的混合策略纳什均衡策略。
精选PPT
有限次重复猜硬币博弈
各博弈方的正确策略就是在每次重复中都采用 一次性博弈中的纳什均衡策略。
精选PPT
4.2.1 两人零和博弈的有限次重复博弈
重复零和博弈不会创造出新的利益。
合作的可能性根本不存在。即使双方都知道还要重复 进行许多次基本博弈,也不会改变它们在当前阶段博 弈中的行动方式,不可能变得(哪怕是暂时的)合作 和顾及对方的利益。
所有以零和博弈为原博弈的有限次重复博弈,博弈方 的正确策略都是重复一次性博弈中的纳什均衡策略。
– 可信度:子博弈完美性仍是判断均衡是否稳定可靠
2
的重要判断依据
精选PPT
§4.1 引 论
3
精选PPT
4.1.1 为何研究“重复博弈” (Game):
4
精选PPT
4.1.2 基本概念:
分类:有限次重复博弈,无限次重复博弈
– 有限次重复博弈:给定一个基本博弈G(可以静态,也可以动 态),重复进行了T次G,并且在每次重复G之前,各博弈方都 能观察到以前博弈的结果,这样的博弈过程称为“G的T次重 复博弈”,记为G(T)。而G称为G(T)的“原博弈”。G(T)中的 每次重复称为G(T)的一个“阶段”。
13
精选PPT
4.2.2 惟一纯策略纳什均衡博弈的有限 次重复博弈
在有惟一纯策略纳什均衡的博弈中,博弈方之间的利 益关系不再是始终对立的,而是有很大一致性甚至完 全一致。
在以这样的博弈为原博弈的有限次重复博弈中,博弈 方的行动和博弈结果会不会发生质的变化?
如果原博弈惟一的纯策略纳什均衡本身就是帕累托意 义上的最佳策略组合,那么因为符合所有博弈方的利 益,因此,有限次重复显然不会改变博弈方的行动方 式。
分析:原博弈惟一的纳什均衡没有达到帕累托效率,
10
精选PPT
策略、子博弈和均衡路径
策略:
– 博弈方的一个策略就是在每个阶段(即每次重复),针对每种情况(以前阶段 的结果)如何行动的计划。
子博弈:
– 重复博弈的子博弈就是从某个阶段(不包括第一阶段)开始,包括此后所有阶 段的重复博弈部分。
– 子博弈:重复博弈?原博弈?(最后一个阶段)
路径:
T
1 223 ...T 1T
t 1 t
t 1
1223 ...T 1T
t 1 t
无限次重复博弈:
8
t 1精选PPT来自随机停止和贴现率典型的随机结束重复博弈可以理解为在进行一个重复博弈时, 每次都通过抽签来决定是否停止重复,如果抽到停止重复的概 率为,则抽到重复下去的概率为。
设某博弈方在此博弈中的阶段得益为,利率为,因为在每一次 博弈以后能继续下一次重复的可能性是,因此第二阶段的期望 得益为,进一步,第三阶段的期望得益为,…
– 无限次重复博弈:理论上,重复博弈可以无限制进行下去, 不一定经过一定次数重复以后就必须结束。如果一个基本博 弈G一直重复下去,这样的重复博弈就是“无限次重复博弈”, 记为G(∞)。无限次重复博弈的基本博弈也称为“原博弈”。
5
– 无限次重复博弈是有无限个阶段的动态博弈。
精选PPT
重复博弈的次数虽然有限,但重复的次数或 博弈结束的时间不确定,这种重复博弈中博弈方 的行为选择与确定结束时间的有限次重复博弈很 不同,与无限次重复博弈很相似,甚至可以通过 某种方式与无限次重复博弈统一起来。这种重复 博弈可以称为“随机结束的重复博弈”。
故该博弈方在重复博弈中期望得益的现值为:
其中最后一个等式是通过令得到的。
把这个与前面纯粹考虑时间价值的贴现率统一起来,我们就把 已知概率的随机停止重复博弈与无限次重复博弈统一起来了。 随机停止重复博弈问题可以当作无限次重复博弈来进行分析。
9
精选PPT
4.2 有限次重复博弈
有限次重复博弈:给定一个基本博弈G(可以 静态,也可以动态),重复进行了T次G,并且 在每次重复G之前,各博弈方都能观察到以前 博弈的结果,这样的博弈过程称为“G的T次重 复博弈”,记为G(T)。而G称为G(T)的“原博 弈”。G(T)中的每次重复称为G(T)的一个“阶 段”。
– 子博弈完美纳什均衡,以逆推归纳法(逆向归纳法)为核心的子博弈完美纳什均衡 分析及相关结论,可以推广到重复博弈中。
– 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的
每种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m
11
种策略组合,那么重复两次就有m2条博弈路径,重复次就有mt条博弈路径。
6
精选PPT
策略、子博弈和均衡路径
策略:
– 博弈方的一个策略就是在每个阶段(即每次重复),针对每种情况(以前阶段 的结果)如何行动的计划。
子博弈:
– 重复博弈的子博弈就是从某个阶段(不包括第一阶段)开始,包括此后所有阶 段的重复博弈部分。
– 子博弈:重复博弈?原博弈?(最后一个阶段)
路径:
– 子博弈完美纳什均衡,以逆推归纳法(逆向归纳法)为核心的子博弈完美纳什均衡 分析及相关结论,可以推广到重复博弈中。
1
精选PPT
何为“重复博弈”?
重复博弈是指基本博弈重复进行构成的博弈过程。 – 重复博弈中每个阶段中的博弈方、可选策略、规则 和得益都是相同的----是特殊的动态博弈;
– 形式上是基本博弈的重复进行,但博弈方的行为和 博弈结果不一定是基本博弈的简单重复,因为博弈 方对于博弈会重复进行的意识,会使他们对利益的 判断发送变化,从而使他们在重复博弈过程不同阶 段的行为选择受到影响。
– 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的
每种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m
7
种策略组合,那么重复两次就有m2条博弈路径,重复次就有mt条博弈路径。
精选PPT
重复博弈的得益
任何博弈博弈方策略选择依据都是得益的大小。 计算重复博弈的“总得益”。 计算各阶段的“平均得益”。 时间有先后,引入贴现系数
推广:非零和或多个博弈方,博弈方的利益严格对立,
没有纯策略纳什均衡的其他严格竞争博弈中。在以这
些博弈作为原博弈构成的有限次重复博弈中,惟一的
子博弈完美纳什均衡就是所有博弈方都始终采用原博
12
弈的混合策略纳什均衡策略。
精选PPT
有限次重复猜硬币博弈
各博弈方的正确策略就是在每次重复中都采用 一次性博弈中的纳什均衡策略。
精选PPT
4.2.1 两人零和博弈的有限次重复博弈
重复零和博弈不会创造出新的利益。
合作的可能性根本不存在。即使双方都知道还要重复 进行许多次基本博弈,也不会改变它们在当前阶段博 弈中的行动方式,不可能变得(哪怕是暂时的)合作 和顾及对方的利益。
所有以零和博弈为原博弈的有限次重复博弈,博弈方 的正确策略都是重复一次性博弈中的纳什均衡策略。
– 可信度:子博弈完美性仍是判断均衡是否稳定可靠
2
的重要判断依据
精选PPT
§4.1 引 论
3
精选PPT
4.1.1 为何研究“重复博弈” (Game):
4
精选PPT
4.1.2 基本概念:
分类:有限次重复博弈,无限次重复博弈
– 有限次重复博弈:给定一个基本博弈G(可以静态,也可以动 态),重复进行了T次G,并且在每次重复G之前,各博弈方都 能观察到以前博弈的结果,这样的博弈过程称为“G的T次重 复博弈”,记为G(T)。而G称为G(T)的“原博弈”。G(T)中的 每次重复称为G(T)的一个“阶段”。
13
精选PPT
4.2.2 惟一纯策略纳什均衡博弈的有限 次重复博弈
在有惟一纯策略纳什均衡的博弈中,博弈方之间的利 益关系不再是始终对立的,而是有很大一致性甚至完 全一致。
在以这样的博弈为原博弈的有限次重复博弈中,博弈 方的行动和博弈结果会不会发生质的变化?
如果原博弈惟一的纯策略纳什均衡本身就是帕累托意 义上的最佳策略组合,那么因为符合所有博弈方的利 益,因此,有限次重复显然不会改变博弈方的行动方 式。
分析:原博弈惟一的纳什均衡没有达到帕累托效率,
10
精选PPT
策略、子博弈和均衡路径
策略:
– 博弈方的一个策略就是在每个阶段(即每次重复),针对每种情况(以前阶段 的结果)如何行动的计划。
子博弈:
– 重复博弈的子博弈就是从某个阶段(不包括第一阶段)开始,包括此后所有阶 段的重复博弈部分。
– 子博弈:重复博弈?原博弈?(最后一个阶段)
路径:
T
1 223 ...T 1T
t 1 t
t 1
1223 ...T 1T
t 1 t
无限次重复博弈:
8
t 1精选PPT来自随机停止和贴现率典型的随机结束重复博弈可以理解为在进行一个重复博弈时, 每次都通过抽签来决定是否停止重复,如果抽到停止重复的概 率为,则抽到重复下去的概率为。
设某博弈方在此博弈中的阶段得益为,利率为,因为在每一次 博弈以后能继续下一次重复的可能性是,因此第二阶段的期望 得益为,进一步,第三阶段的期望得益为,…
– 无限次重复博弈:理论上,重复博弈可以无限制进行下去, 不一定经过一定次数重复以后就必须结束。如果一个基本博 弈G一直重复下去,这样的重复博弈就是“无限次重复博弈”, 记为G(∞)。无限次重复博弈的基本博弈也称为“原博弈”。
5
– 无限次重复博弈是有无限个阶段的动态博弈。
精选PPT
重复博弈的次数虽然有限,但重复的次数或 博弈结束的时间不确定,这种重复博弈中博弈方 的行为选择与确定结束时间的有限次重复博弈很 不同,与无限次重复博弈很相似,甚至可以通过 某种方式与无限次重复博弈统一起来。这种重复 博弈可以称为“随机结束的重复博弈”。
故该博弈方在重复博弈中期望得益的现值为:
其中最后一个等式是通过令得到的。
把这个与前面纯粹考虑时间价值的贴现率统一起来,我们就把 已知概率的随机停止重复博弈与无限次重复博弈统一起来了。 随机停止重复博弈问题可以当作无限次重复博弈来进行分析。
9
精选PPT
4.2 有限次重复博弈
有限次重复博弈:给定一个基本博弈G(可以 静态,也可以动态),重复进行了T次G,并且 在每次重复G之前,各博弈方都能观察到以前 博弈的结果,这样的博弈过程称为“G的T次重 复博弈”,记为G(T)。而G称为G(T)的“原博 弈”。G(T)中的每次重复称为G(T)的一个“阶 段”。
– 子博弈完美纳什均衡,以逆推归纳法(逆向归纳法)为核心的子博弈完美纳什均衡 分析及相关结论,可以推广到重复博弈中。
– 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的
每种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m
11
种策略组合,那么重复两次就有m2条博弈路径,重复次就有mt条博弈路径。
6
精选PPT
策略、子博弈和均衡路径
策略:
– 博弈方的一个策略就是在每个阶段(即每次重复),针对每种情况(以前阶段 的结果)如何行动的计划。
子博弈:
– 重复博弈的子博弈就是从某个阶段(不包括第一阶段)开始,包括此后所有阶 段的重复博弈部分。
– 子博弈:重复博弈?原博弈?(最后一个阶段)
路径:
– 子博弈完美纳什均衡,以逆推归纳法(逆向归纳法)为核心的子博弈完美纳什均衡 分析及相关结论,可以推广到重复博弈中。