博弈论课件第四章

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第四讲重复博弈
1
精选PPT
何为“重复博弈”？
重复博弈是指基本博弈重复进行构成的博弈过程。 – 重复博弈中每个阶段中的博弈方、可选策略、规则和得益都是相同的----是特殊的动态博弈；
– 形式上是基本博弈的重复进行，但博弈方的行为和博弈结果不一定是基本博弈的简单重复，因为博弈方对于博弈会重复进行的意识，会使他们对利益的判断发送变化，从而使他们在重复博弈过程不同阶段的行为选择受到影响。
– 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的
每种结果，下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m
7
种策略组合，那么重复两次就有m2条博弈路径，重复次就有mt条博弈路径。
精选PPT
重复博弈的得益
任何博弈博弈方策略选择依据都是得益的大小。计算重复博弈的“总得益”。计算各阶段的“平均得益”。时间有先后，引入贴现系数
推广：非零和或多个博弈方，博弈方的利益严格对立，
没有纯策略纳什均衡的其他严格竞争博弈中。在以这
些博弈作为原博弈构成的有限次重复博弈中，惟一的
子博弈完美纳什均衡就是所有博弈方都始终采用原博
12
弈的混合策略纳什均衡策略。
精选PPT
有限次重复猜硬币博弈
各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳什均衡策略。
精选PPT
4.2.1 两人零和博弈的有限次重复博弈
重复零和博弈不会创造出新的利益。
合作的可能性根本不存在。即使双方都知道还要重复进行许多次基本博弈，也不会改变它们在当前阶段博弈中的行动方式，不可能变得（哪怕是暂时的）合作和顾及对方的利益。
所有以零和博弈为原博弈的有限次重复博弈，博弈方的正确策略都是重复一次性博弈中的纳什均衡策略。
– 可信度：子博弈完美性仍是判断均衡是否稳定可靠
2
的重要判断依据
精选PPT
§4.1 引论
3
精选PPT
4.1.1 为何研究“重复博弈” （Game）：
4
精选PPT
4.1.2 基本概念：
分类：有限次重复博弈，无限次重复博弈
– 有限次重复博弈：给定一个基本博弈G（可以静态，也可以动态），重复进行了T次G，并且在每次重复G之前，各博弈方都能观察到以前博弈的结果，这样的博弈过程称为“G的T次重复博弈”，记为G(T)。而G称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。
13
精选PPT
4.2.2 惟一纯策略纳什均衡博弈的有限次重复博弈
在有惟一纯策略纳什均衡的博弈中，博弈方之间的利益关系不再是始终对立的，而是有很大一致性甚至完全一致。
在以这样的博弈为原博弈的有限次重复博弈中，博弈方的行动和博弈结果会不会发生质的变化？
如果原博弈惟一的纯策略纳什均衡本身就是帕累托意义上的最佳策略组合，那么因为符合所有博弈方的利益，因此，有限次重复显然不会改变博弈方的行动方式。
分析：原博弈惟一的纳什均衡没有达到帕累托效率，
10
精选PPT
策略、子博弈和均衡路径
策略：
– 博弈方的一个策略就是在每个阶段（即每次重复），针对每种情况（以前阶段的结果）如何行动的计划。
子博弈：
– 重复博弈的子博弈就是从某个阶段（不包括第一阶段）开始，包括此后所有阶段的重复博弈部分。
– 子博弈：重复博弈？原博弈？（最后一个阶段）
路径：
T
1 223 ...T 1T
t 1 t
t 1
1223 ...T 1T
t 1 t
无限次重复博弈：
8
t 1精选PPT来自随机停止和贴现率典型的随机结束重复博弈可以理解为在进行一个重复博弈时，每次都通过抽签来决定是否停止重复，如果抽到停止重复的概率为，则抽到重复下去的概率为。
设某博弈方在此博弈中的阶段得益为，利率为，因为在每一次博弈以后能继续下一次重复的可能性是，因此第二阶段的期望得益为，进一步，第三阶段的期望得益为，…
– 无限次重复博弈：理论上，重复博弈可以无限制进行下去，不一定经过一定次数重复以后就必须结束。如果一个基本博弈G一直重复下去，这样的重复博弈就是“无限次重复博弈”，记为G(∞)。无限次重复博弈的基本博弈也称为“原博弈”。
5
– 无限次重复博弈是有无限个阶段的动态博弈。
精选PPT
重复博弈的次数虽然有限，但重复的次数或博弈结束的时间不确定，这种重复博弈中博弈方的行为选择与确定结束时间的有限次重复博弈很不同，与无限次重复博弈很相似，甚至可以通过某种方式与无限次重复博弈统一起来。这种重复博弈可以称为“随机结束的重复博弈”。
故该博弈方在重复博弈中期望得益的现值为：
其中最后一个等式是通过令得到的。
把这个与前面纯粹考虑时间价值的贴现率统一起来，我们就把已知概率的随机停止重复博弈与无限次重复博弈统一起来了。随机停止重复博弈问题可以当作无限次重复博弈来进行分析。
9
精选PPT
4.2 有限次重复博弈
有限次重复博弈：给定一个基本博弈G（可以静态，也可以动态），重复进行了T次G，并且在每次重复G之前，各博弈方都能观察到以前博弈的结果，这样的博弈过程称为“G的T次重复博弈”，记为G(T)。而G称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。
– 子博弈完美纳什均衡，以逆推归纳法（逆向归纳法）为核心的子博弈完美纳什均衡分析及相关结论，可以推广到重复博弈中。
– 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的
每种结果，下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m
11
种策略组合，那么重复两次就有m2条博弈路径，重复次就有mt条博弈路径。
6
精选PPT
策略、子博弈和均衡路径
策略：
– 博弈方的一个策略就是在每个阶段（即每次重复），针对每种情况（以前阶段的结果）如何行动的计划。
子博弈：
– 重复博弈的子博弈就是从某个阶段（不包括第一阶段）开始，包括此后所有阶段的重复博弈部分。
– 子博弈：重复博弈？原博弈？（最后一个阶段）
路径：
– 子博弈完美纳什均衡，以逆推归纳法（逆向归纳法）为核心的子博弈完美纳什均衡分析及相关结论，可以推广到重复博弈中。

博弈论课件 第四章

博弈论课件第四章