博弈类型及其表述形式

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈类型及其表述形式

1 博弈的分类

博弈模型一般分为合作博弈(cooperative game )和非合作博弈(non- cooperative game ),如图1.1。合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素(Martin J.Osborne and Ariel Rubinstein ,2000,P2),也就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关系,并因为这种关系影响到博弈的结局。合作博弈强调的是团体理性(collective rationality )、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是低效率或无效率的(张维迎,1996,P5)。20世纪50年代,合作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐步转向在非合作博弈领域。有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认为两者不相上下(Martin J.Osborne and Ariel Rubinstein ,2000,P2)。 合作博弈,有时也叫做联盟博弈(coalitional game ),一般根据有无转移支付而分为两类:可转移支付联盟博弈(coalitional game with transferable payoff )和不可转移支付联盟博弈(coalitional game with non-transferable payoff )。可转移支付也叫有旁支付(side payment ),可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得,且各联盟的赢得可以按任意方式在联盟成员中分摊;否则,就是不可转移支付联盟博弈。

图1.1 博弈的分类

非合作博弈的分类主要从两个角度进行划分。一是参与者的行动顺序。

从这个角度博弈

可以分为静态博弈(static game )和动态博弈(dynamic game )。静态博弈是指参与者同时选择行动或虽非同时但后行动者并不知前行动者采取了何种行动;动态博弈是指参与者的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。二是参与者掌握的信息水平。从这个角度,博弈可以分为完全信息博弈和不完全信息博弈。完全信息(complete information )指的是每一个参与者对所有其他参与者的特征、战略空间及支付函数有准确的知识;否则就是不完全信息(incomplete information )。

综合上述两种分类方法,可将非合作博弈分成四类。这四类博弈及其对应的均衡概念,大致上反映了20世纪50年代以来非合作博弈理论的主要进展和1994年三位诺贝尔经济学将得主的主要贡献,同时也大致表明了“纳什均衡”及其精炼在博弈论发展中的地位和影响(如表1.1)。

表1.1 非合作博弈的分类及对应的均衡概念、主要贡献者

2 博弈的表述形式

现代博弈理论根据不同的博弈类型给出了博弈模型的三种基本表达形式:标准式(normal form )表述、扩展式表述(extensive form representation )和特征函数型表述。前两者主要用于非合作博弈,后者主要用于合作博弈。

2.1 标准式表述

标准式表述又称为战略式表述(strategic form )或矩阵式表述(matrix form )。标准式表述将战略局势抽象为三个基本要素:

(a )博弈的参与者集},,2,1{n N =;

(b )每个参与者的战略集N i S i ∈∀,;

(c )每个参与者的支付函数集N i R i ∈∀,。

因此,一个标准式表述的博弈可以表示为>=<}{},{,i i R S N G 。标准式表述主要用来表示静态博弈。标准式博弈也叫做战略博弈。

2.2 扩展式表述

扩展式表述在标准式表述的基础上,扩展了描述博弈局势的要素,比如参与者的行动顺序以及外生事件的概率分布等,可以描述更复杂的博弈局势,极大地扩大了博弈理论所能描述的范围,一般用来表述动态博弈。扩展式表述一般包含六个要素:

(a )博弈的参与者集},,2,1{n N =;

(b )参与者的行动顺序(the order of moves ):即什么参与者在什么时候行动; (c )参与者的行动空间(action set ):在每次行动时,参与者有些什么行动可供选择;

(d )参与者的信息集(information set ):每次行动时,参与者知道些什么; (e )参与者的支付函数:在行动结束时,每个局中人得到什么;

(f )外生事件(即“自然”的选择)的概率分布。

2.3 特征函数型表述

特征函数型表述主要用来表述联盟博弈或合作博弈。令参与者集合为N ,则称N 的任意子集S 为联盟(coalition ),所有联盟的全体记为)(N ψ。可转移支付联盟博弈包括两个要素:

(a )有限的参与者集},,2,1{n N =;

(b )将N 的每个非空子集S (即一联盟)与某个实数v (S )相联系的一个特征函数v 。 因此,可转移支付联盟博弈可记为(N ,v )。其中特征函数v 是指定义在)(N ψ上的一个实函数,其中v (S )表示联盟S 通过协调其成员的策略所能保证得到的最大赢得。

不可转移支付联盟博弈包括四个要素:

(a )有限的参与者集},,2,1{n N =;

(b )结果集X ;

(c )将N 的每个非空子集S (即一联盟)赋一个集合X S V ⊆)(的特征函数V ; (d )对每个参与者N i ∈有一个X 上的支付函数N i X R i ∈∀),(。

因此,不可转移支付联盟博弈可记为)})({,,,(X R X V N i 。

博弈的三种表述形式之差别,主要在于描述信息的多寡。扩展型表述形式包括的信息最多,如果去掉其中参与者行动顺序和信息结构等信息,可以简化出标准型表述形式。在标准型表述形式的基础上,如果引入有约束力的义务且可强制执行的假设,省略掉战略集,则可进一步简化为特征函数型表述形式。三种表述形式的可转化性,表明非合作博弈与合作博弈之间是可转化的。

相关文档
最新文档