第九章 多阶段博弈

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 在这个博弈结束之后,同样是这两个参与 人在时期t=2继续玩复仇博弈。每个参与人 都可以选择是否加入他的社区帮(gang, 即G或g)或者继续保持“孤家寡人(loner ,即L或l)”的状态。相应的支付矩阵如下 :
• A、如果我们对这个两阶段博弈进行单独的 分析,则可得:
– 在第一阶段博弈——囚徒困境博弈中,存在唯 一的一个纳什均衡(F,f)。
– 在第二个阶段博弈——复仇博弈中,存在两个 纳什均衡(L,l)和(G,g),还有一个是每 个参与人以0.5的概率在这两个纳什均衡之间进 行混合的混合策略均衡
– B、使用折现支付(折现率为 )的概念,我 们可以写下这个多阶段囚徒-复仇博弈的扩展式 ,以说明所有可能的结果和折现支付的总和。
Biblioteka Baidu
• C、根据命题9.1,将该博弈看成彼此独立的每个博弈的纳 什均衡构成一个行为序列,通过考虑这样一些无条件策略 ,我们可以将阶段之间的任何策略性关联予以排除。由此 我们可以得到两个子博弈完美均衡:
–和
• D、该博弈在第二阶段具有两个纳什均衡, (L,l)或( G,g),由上文中第4点可知,在折现因子足够大的情况 下,该博弈在第一阶段就有可能选择非纳什均衡策略,实 现策略性相连。其中(L,l)为“胡萝卜”,而(G,g) 为“大棒”。
一、预备知识
• 多阶段博弈的定义:为一个标准阶段博弈的有限序 列,在其中每一个阶段博弈都是独立的、完全但不 完美信息的博弈(同时行动博弈)。
• 这些阶段博弈由相同的参与人依次进行,而由这一 博弈序列得到的总支付用博弈结果序列来评价。每 个阶段结束之后,所有参与人都可以观察到该阶段 的结果,而且这一信息结构是共同知识
• 2.条件性纯策略 • 在一个有T个阶段博弈构成的多阶段博弈中,
参与人i的一个纯策略可以是下面这种形式的 条件性纯策略列表:
其中
是出现在时期t之前的特定结果,
但是不包括时期t,而
是参与人从第t
个阶段博弈中得出的行动。
• 我们来看一个n企业博弈,这些企业在一系列市场上进行价格选择 • 对于这个例子来说,参与人i的一个纯策略就是一个连续函数的列表,每一个
二、支付
• 因为多阶段博弈是一个跨期博弈,当涉及跨期
问题时我们就需要对未来的收益进行折现。而
折现因子
的大小则由参与人的耐心
决定,折现因子 越高意味着参与人越有耐
心,也就更为关心未来的支付。没有耐心的极
端情况发生在
的时候,此时说明参与
人只关心当前这一阶段博弈的支付。
• 我们来看这样一个多阶段博弈,其中共有T个阶段 博弈,每个时期标号为1,2,……,T。令 表 示参与人i预期从在时期t的阶段博弈结果中得到的 参与人i的支付。我们用 表示参与人i在这个多阶 段博弈中进行该博弈序列所得到的总支付,将它定 义为:
• 1、命题9.1 考虑具有T个阶段的一个多阶段博弈,令
为第t个阶段博弈的一个纳什均衡策略剖面。在这个多
阶段博弈中,存在一个子博弈完美均衡,其均衡路径与
产生自
的路径是一致的。
• 在多阶段博弈中引入子博弈完美纳什均衡就相当于将阶 段之间的任何策略性关联予以排除,这样我们就可以把 每一个阶段当做一个独立博弈一样进行求解。
美纳什均衡,我们所需证明的全部就是在 给定 的条件下,每一参与人i不具有一 个他打算偏离的单一信息集。
• 举例:囚徒-复仇博弈
– 假设在第一个时期t=1,来自两个相邻社区的参 与人进行我们熟悉的囚徒困境博弈,各自采取 两个纯行动:沉默(mum)和告密(fink)(大写 的表示参与人1的行动,小写的表示参与人2的 行动),其支付矩阵为:
• 在多阶段博弈中判定每个参与人的信息集是很重要 的,而在任一阶段t上信息集的数目必然与前面的阶 段博弈1,2,……,t-1中得来的可能结果的数目相 等。
• 例如,第一阶段博弈有四个结果,则在第二个阶段 博弈上,每个参与人应当有四个信息集。需要注意 的是,在每一个阶段博弈中,参与人并不知道其对 手在该阶段的选择是什么,这意味着我们在该阶段 的某些信息集上有不止一个结点。
• 4、对于两阶段博弈而言,要使第一阶段上 选择非纳什均衡的行为成为可能,需要以 下两个条件:
– 在第二个阶段必有至少两个不同的均衡:“大 棒”和“胡萝卜”。
– 对于“大棒”和“胡萝卜”之间在支付上的差 异来说,折现因子一定会大到对博弈的第一个 阶段有着足够充分的影响。
• 为了检查一个策略剖面是否在一个多阶段 (或任一有限扩展式)博弈中是子博弈完
都是从连续多个历史的集合到一个单一价格之上。
• 总而言之,多阶段博弈策略的定义可以使用扩 展式来表达该博弈的结构。进而言之,和在扩 展式博弈中一样,策略被定为每一参与人在每 一信息集上(混合或纯)策略的完备列表。在 多阶段博弈中,每个参与人的信息集都和之前 阶段博弈中的博弈历史相联结。
四、子博弈完美均衡
• 它是参与人预期在这博弈序列中所得支付的折现总 和。
三、策略和条件性博弈行为
• 1.策略 • 在多阶段博弈中,参与人可以通过在不同阶段的博弈间
创造策略性关联的策略(一般是将后面阶段博弈中的行 为建立在早前阶段博弈中采取的行动这一条件之上的) ,以此从中获利。 • 参与人可以使用这种形式的策略:“如果在博弈1,2, ……,t-1中如此等等皆发生了,那我们博弈t中就选择 行动 。”
• 2、命题9.2 如果 是由阶段博弈 构成的多阶段博弈的纳什均衡,那么将 限制在时期T上的阶段博弈,必是该阶段博弈 的一个纳什均衡。
• 这个命题告诉我们,对于时长为T的任一有限 阶段博弈而言,在最后一个阶段博弈 上参与 人必然会采取该阶段博弈上的一个纳什均衡。
• 3、命题9.3 如果一个有限的多阶段博弈, 其每个阶段博弈都有唯一的一个纳什均衡 ,那么这一多阶段博弈就有唯一的子博弈 完美纳什均衡。
第九章 多阶段博弈
本章重点: 多阶段博弈的定义及其特征 多阶段博弈总支付的计算 理解多阶段博弈的纯策略,理解及其运用策略性关联 理解及运用在t-1期前选择非纳什均衡策略的条件 多阶段子博弈纳什均衡及其与策略性关联的关系 几个定理及一阶段偏离原则的理解
本章主要内容
• 一、预备知识 • 二、支付 • 三、策略和条件性博弈行为 • 四、子博弈完美纳什均衡 • 五、一阶段偏离原则
相关文档
最新文档