博弈论——完全信息动态博弈
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 完全信息的动态博弈
2.1完全和完美信息的动态博弈
动态博弈(dynamic game):参与人在不同的时间选择行动。
完全信息动态博弈指的是各博弈方先后行动,后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合下所有参与人相应的得益都完全了解的博弈
静态博弈习惯用战略式(Strategic form representation)表述,动态博弈习惯用扩展式(Extensive form representation)表述。战略式表述的三要素:参与人集合、每个参与人的战略集合、由战略组合决定的每个参与人的支付。扩展式表述的要素包括:参与人集合、参与人的行动顺序、参与人的行动空间、参与人的信息集、参与人的支付函数、外生事件(自然的选择)的概率分布。
n人有限战略博弈的扩展式表述用博弈树来表示
1
(1,2) (0,3)
①结:包括决策结和终点结。决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。第一个行动选择对应的决策结为“初始结”,用空心圆表示,其它决策结用实心圆表示。X表示结的集合,x X表示某个特定的结。z表示终点结,Z表示终点结集合。表示结之间的顺序关系,x x´表示x在x´之前。x之前所有结的集合称为x的前列集,x之后所有结的集合称为x的后续集。以下两种情况不允许:
前者违背了传递性和反对称性;后者违背了前列节必须是全排序的。在以上两个假设之下,每个终点结都完全决定了博弈树的某个路径。
②枝:博弈树上,枝是从一个决策结到其直接后续结的连线,每一个枝代表参与人的一个行动选择。在每一个枝旁标注该具体行动的代号。一般地,每个决策结下有多个枝,给出每次行动时参与人的行动空间,即此时有哪些行动可供选择。
③信息集(information sets):博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结集合称为一个信息集。博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集(信息集是由决策结构成的集合),该子集包括所有满足下列条件的决策结:(1)每一个决策结都是同一个参与人的决策结。(2)该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。引入信息集的目的是为了描述当一个参与人要作出决策时他可能不知道“之前”发生的所有事情。(之前加引号是因为,博弈树中的决策结的排序并不一定与行动的时间顺序相一致)
H 表示信息集集合,h 表示一个特定的信息集。h (x )表示包含决策结x 的信息集。h (x )是一个信息集,意味着在x 决策的参与人不确定他处在x 结点还是其它x ´ h (x )结点。这同时意味着一个决策结只能属于一个信息集。
信息集满足的条件:1、任何一个决策结不能是属于同一信息集的其它决策结的前列结或后续结。2、同一信息集的所有结都是同一参与人的决策结,即参与人不会将自己行动的结与他人行动的结混淆。3、一个参与人在属于同一信息集的每一个决策结的行动空间应该是相同的。
1
a b 2 c d e 1 1
一个静态博弈的扩展式表述
一个信息集可能包含多个决策结,也可能只包含一个决策结。只
2
f 1 1
g h i j k l m n
2
(2,1)
(3,1)
(2,4) (5,1) (0,6) (7,1)
(2,4)
v
w
(1,2)
(0,3)
包含一个决策结的信息集称为单结信息集;如果博弈树的所有信息集都是单结的(如果有虚拟参与人自然,则所有的参与人都知道自然的行动),该博弈称为完美信息博弈(Game of perfect information);否则就是不完美信息博弈。
完美信息(perfect information): 在博弈的每次行动的参与人完全知道博弈的历史,即每个信息集只有一个决策结。完美信息博弈意味着博弈中没有任何两个参与人同时行动,而且所有后行动者都能确切知道先行动者选择的行动,所有参与人都知道自然的行动。
完全信息(complete information):参与人完全了解对手特征,既没有事前的不确定性。
不完全信息意味着不完美信息,但逆定理不成立。
在博弈论中,自然的信息集一般假定为单结的。因为自然是随机行动的,自然在参与人决策之后行动等价于自然在参与人决策之前行动但参与人不能观测到自然的行动。因此,博弈树上是否出现连接不同决策结的虚线取决于我们如何安排决策结的顺序。
决策结的顺序:如果知道前决策者的选择,后决策者必须出现在后面,如果不知道前决策者的选择,后决策者可以出现在后面,也可以出现在前面。
相同的博弈可以不同的博弈树表示,但同一个参与人在代表同一博弈的不同博弈树中的信息集的数量必须相同,自然除外。
博弈一般假定满足完美回忆的要求,完美回忆是指没有参与人会忘记自己以前知道的事情,所有参与人都知道自己以前的选择。
1
确保博弈具有完美回忆的要求:如果①x 2和x 1属于同一信息集;②x 是x 1的前列结;③x 和x 1都是同一个参与人的决策结;那么,存在一个x ´´(可能是x 本身)满足:①x ´´和x 属于同一信息集;②x ´´是x 2的前列结;③从x 到达x 1的行动和x ´´到达x 2的行动是一样的。即必须满足“同一行动”和“同一信息集”假设。
当博弈涉及到外生不确定性事件时,我们假定“自然”以某种概率选择某个特定事件,所有参与人对于自然的选择具有相同的先验概率。即所谓的“海萨尼公理”。
均衡结果有三个(进入,默许)、(不进入,斗争)、(不进入、默许)
定理:一个有限完美信息博弈有一个纯战略纳什均衡(zermelo,1913; kuhn,1953)。
策略的可置信性问题:策略是博弈方自己预先设定的,在各个博弈阶段针对各种情况所作的相应行为选择的计划,本身没有强制力,且实施起来有一个过程。在该过程中,根据自己的利益需要,他完全可以改变这个计划,从而存在“相机选择”,产生策略的可置信性问题。
B
B
(40,50)(-10,0)(0,300)默许
斗争
进入
不进入A
默许
斗争
(0,300)
纳什均衡:(进入、(默许、默许))
(不进入、(斗争、斗争))(进入、(默许、斗争))(不进入、(斗争、默许))