第九章多阶段博弈

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

• 4、对于两阶段博弈而言，要使第一阶段上选择非纳什均衡的行为成为可能，需要以下两个条件：
– 在第二个阶段必有至少两个不同的均衡：“大棒”和“胡萝卜”。
– 对于“大棒”和“胡萝卜”之间在支付上的差异来说，折现因子一定会大到对博弈的第一个阶段有着足够充分的影响。
• 为了检查一个策略剖面是否在一个多阶段（或任一有限扩展式）博弈中是子博弈完
• 它是参与人预期在这博弈序列中所得支付的折现总和。
三、策同阶段的博弈间
创造策略性关联的策略（一般是将后面阶段博弈中的行为建立在早前阶段博弈中采取的行动这一条件之上的），以此从中获利。 • 参与人可以使用这种形式的策略：“如果在博弈1,2， ……，t-1中如此等等皆发生了，那我们博弈t中就选择行动。”
–和
• D、该博弈在第二阶段具有两个纳什均衡，（L，l）或（ G，g），由上文中第4点可知，在折现因子足够大的情况下，该博弈在第一阶段就有可能选择非纳什均衡策略，实现策略性相连。其中（L，l）为“胡萝卜”，而（G，g）为“大棒”。
美纳什均衡，我们所需证明的全部就是在给定的条件下，每一参与人i不具有一个他打算偏离的单一信息集。
• 举例：囚徒-复仇博弈
– 假设在第一个时期t=1，来自两个相邻社区的参与人进行我们熟悉的囚徒困境博弈，各自采取两个纯行动:沉默(mum)和告密（fink）（大写的表示参与人1的行动，小写的表示参与人2的行动），其支付矩阵为：
• 2.条件性纯策略 • 在一个有T个阶段博弈构成的多阶段博弈中，
参与人i的一个纯策略可以是下面这种形式的条件性纯策略列表：
其中
是出现在时期t之前的特定结果，
但是不包括时期t，而
是参与人从第t
个阶段博弈中得出的行动。
• 我们来看一个n企业博弈，这些企业在一系列市场上进行价格选择 • 对于这个例子来说，参与人i的一个纯策略就是一个连续函数的列表，每一个
第九章多阶段博弈
本章重点：多阶段博弈的定义及其特征多阶段博弈总支付的计算理解多阶段博弈的纯策略，理解及其运用策略性关联理解及运用在t-1期前选择非纳什均衡策略的条件多阶段子博弈纳什均衡及其与策略性关联的关系几个定理及一阶段偏离原则的理解
本章主要内容
• 一、预备知识 • 二、支付 • 三、策略和条件性博弈行为 • 四、子博弈完美纳什均衡 • 五、一阶段偏离原则
• 在这个博弈结束之后，同样是这两个参与人在时期t=2继续玩复仇博弈。每个参与人都可以选择是否加入他的社区帮（gang，即G或g）或者继续保持“孤家寡人（loner ，即L或l）”的状态。相应的支付矩阵如下：
• A、如果我们对这个两阶段博弈进行单独的分析，则可得：
– 在第一阶段博弈——囚徒困境博弈中，存在唯一的一个纳什均衡（F，f）。
• 在多阶段博弈中判定每个参与人的信息集是很重要的，而在任一阶段t上信息集的数目必然与前面的阶段博弈1,2，……，t-1中得来的可能结果的数目相等。
• 例如，第一阶段博弈有四个结果，则在第二个阶段博弈上，每个参与人应当有四个信息集。需要注意的是，在每一个阶段博弈中，参与人并不知道其对手在该阶段的选择是什么，这意味着我们在该阶段的某些信息集上有不止一个结点。
都是从连续多个历史的集合到一个单一价格之上。
• 总而言之，多阶段博弈策略的定义可以使用扩展式来表达该博弈的结构。进而言之，和在扩展式博弈中一样，策略被定为每一参与人在每一信息集上（混合或纯）策略的完备列表。在多阶段博弈中，每个参与人的信息集都和之前阶段博弈中的博弈历史相联结。
四、子博弈完美均衡
• 2、命题9.2 如果是由阶段博弈构成的多阶段博弈的纳什均衡，那么将限制在时期T上的阶段博弈，必是该阶段博弈的一个纳什均衡。
• 这个命题告诉我们，对于时长为T的任一有限阶段博弈而言，在最后一个阶段博弈上参与人必然会采取该阶段博弈上的一个纳什均衡。
• 3、命题9.3 如果一个有限的多阶段博弈，其每个阶段博弈都有唯一的一个纳什均衡，那么这一多阶段博弈就有唯一的子博弈完美纳什均衡。
一、预备知识
• 多阶段博弈的定义：为一个标准阶段博弈的有限序列，在其中每一个阶段博弈都是独立的、完全但不完美信息的博弈（同时行动博弈）。
• 这些阶段博弈由相同的参与人依次进行，而由这一博弈序列得到的总支付用博弈结果序列来评价。每个阶段结束之后，所有参与人都可以观察到该阶段的结果，而且这一信息结构是共同知识
– 在第二个阶段博弈——复仇博弈中，存在两个纳什均衡（L，l）和（G，g），还有一个是每个参与人以0.5的概率在这两个纳什均衡之间进行混合的混合策略均衡
– B、使用折现支付（折现率为）的概念，我们可以写下这个多阶段囚徒-复仇博弈的扩展式，以说明所有可能的结果和折现支付的总和。
• C、根据命题9.1，将该博弈看成彼此独立的每个博弈的纳什均衡构成一个行为序列，通过考虑这样一些无条件策略，我们可以将阶段之间的任何策略性关联予以排除。由此我们可以得到两个子博弈完美均衡：
二、支付
• 因为多阶段博弈是一个跨期博弈，当涉及跨期
问题时我们就需要对未来的收益进行折现。而
折现因子
的大小则由参与人的耐心
决定，折现因子越高意味着参与人越有耐
心，也就更为关心未来的支付。没有耐心的极
端情况发生在
的时候，此时说明参与
人只关心当前这一阶段博弈的支付。
• 我们来看这样一个多阶段博弈，其中共有T个阶段博弈，每个时期标号为1,2，……，T。令表示参与人i预期从在时期t的阶段博弈结果中得到的参与人i的支付。我们用表示参与人i在这个多阶段博弈中进行该博弈序列所得到的总支付，将它定义为：
• 1、命题9.1 考虑具有T个阶段的一个多阶段博弈，令
为第t个阶段博弈的一个纳什均衡策略剖面。在这个多
阶段博弈中，存在一个子博弈完美均衡，其均衡路径与
产生自
的路径是一致的。
• 在多阶段博弈中引入子博弈完美纳什均衡就相当于将阶段之间的任何策略性关联予以排除，这样我们就可以把每一个阶段当做一个独立博弈一样进行求解。

第九章 多阶段博弈

第九章多阶段博弈