答疑]动态博弈与子博弈精练纳什均衡

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

我们已经了解了完全信息静态博弈的内容。这时候,参与人同时行动,或者不同时行动,但是后动的人观察不到先动的人的任何有关其行动的信息,这于同时行动等价。这时候,任何一个参与人选择行动的时候,没有任何可以依据的信息。

当博弈成为动态的时候,参与人先后行动,后动者可以观察到先动者的行动,因此,后动者选择他的行动的时候,可以依据观察到的信息作选择。因为先动者可能采取的行动是若干个,所以后动者就有可能观察到同样多的信息。因此,这时后动者选择的已经不简单的行动,而是一套完整的行动计划——这套行动计划指出,在观察到不同的信息时该怎样随机应变选择自己的行动。因此,现在后动者的选择变量就是行动计划,我们就把一套完整的行动计划叫做一个策略。

以下图为例,参与人1先动,之后参与人2行动,参与人2可以观察到参与人1的选择。参与人的选择就是L或者R,这既是他的行动有时他的策略,因为参与人1行动时可能出现的信息只有一种情况——空信息集——因为他先动,这时什么信息也没有。1行动之后,1的行动可以被2观察,因此2可能观察到的信息就有可能是L或者R,因此,2的行动会根据这些信息作出。2的一套完整的行动计划应该告诉他,在观察到L时选择什么,观察到R时选择什么,由此我们也可以看出,如果2把行动的选择委托给另外的人,这个人可以根据2的行动计划处理任何可能发生或者面对的形式。这样,2的行动计划——我们称为策略,就有四种可能:

1,观察到L时,选F,观察到R时,选F。我们用一个有序二维向量(F,F)表示。

2,观察到L时,选F,观察到R时,选C。我们用一个有序二维向量(F,C)表示。

3,观察到L时,选C,观察到R时,选F。我们用一个有序二维向量(C,F)表示。

4,观察到L时,选C,观察到R时,选C。我们用一个有序二维向量(C,C)表示。

总结:参与人1的行动是L或者R,由于是先动,没有信息,所以策略也就是行动。

参与人2的行动是F或者C,由于是后动,有信息,策略是建立在信息上的完整行动——计划,有四个策略:(F,F),(F,C)(C,F)(C,C)。

参与人1

L R

参与人2 参与人2

F C F C

6 4 5 8

6 1 ‐10 ‐3

子博弈:在动态博弈中,我们现在接触到的都可以用树形图来表示。从每一个结点开始的剩余博弈,就是这个动态博弈的子博弈。在上面的图中,包括起始点在内,总共有三个结点,于是就有三个子博弈。其中博弈本身也是一个子博弈。

子博弈精练纳什均衡:一组策略组合在所有的子博弈上都构成纳什均衡,那么这组策略称为子博弈精练纳什均衡。

在上图的例子中,{L,(F,F)}构成一个纳什均衡。因为给定(F,F),参与1选L得到6,选R得到5,给定L,参与人2选(F,F)得6,选(F,C)得6,选(C,F)得1,选(C,C)得1。选(F,F)最大化了自己的支。

但是{L,(F,F)}在红色线标出的这个子博弈中没有给出纳什均衡。因为红色线构成的子博弈,相当于只有1个参与人2,有两种行动的单人博弈,这个子博弈的纳什均衡就是C,因为2选择F只能得到‐10<选C可以得到的‐3。因此,{L,(F,F)}虽然是纳什均衡,但不是子博弈纳什均衡。

同理,我们也可以看出在兰色线构成的子博弈中,子博弈纳什均衡一定是F,所以子博弈精练纳什均衡中2的策略必须是(F,C),给定2的这一策略,1的最优策略就是R。所以子博弈精练纳什均衡就是{R,(F,C)},大家可以检验这个策略组合是否在所有的子博弈上都给出了纳什均衡。

相关文档
最新文档