合作博弈
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
合作博弈
博弈论又称为对策论,是一门应用极其广泛的学科,它既是一个数学分支,又属于经济学和管理科学范畴,其应用涉及经济学、管理学、社会科学以及计算机科学等众多学科领域。在过去的几十年中,博弈论在国内外发展迅速,既有对传统非合作博弈的突破,更有新的理论分支,比如合作博弈、模糊合作博弈等的飞速发展。如今,博弈论在经济学中的地位日益凸显,已经成为一种标准用于衡量生产活动的经济性。
博弈论发展至今的种类繁多,可以根据不同标准进行不同分类。按博弈中的参与者采用的对策能否在博弈开始前确定,可以将博弈分为策略型博弈和展开型博弈。根据博弈的周期是否与时间长短有关,分为动态博弈和静态博弈。如果一场博弈活动中,参与者之间互不关联,参与者在进行博弈时禁止任何形式的信息往来,同时禁止参与者互相签订任何形式的强制性约定,则称这种博弈为非合作博弈(non-cooperative game);合作博弈(cooperative game)则是指参与者在进行博弈前可以互相沟通,交换信息,共同完成博弈过程,合作博弈中相互合作的参与者通常称之为一个联盟。本文主要针对合作博弈进行讨论。
合作博弈理论主要关系的是联盟(即参与者集合),协调他们的行动并且经营他们的收益。因此,合作博弈研究的重点问题是如何在组成联盟的成员之间分配他们的额外收益(或节省的费用)。分配该额外收益的结果或方法称为合作博弈的解。由于合作博弈的解能够适用于复杂或者运算量较大的系统,因此合作博弈解法在电力工业中的应用已经得到国内外学者的广泛研究,其模型涵盖输配电竞价、电网建设招投标、输电定价、系统费用分摊等领域。与采用传统的非合作博弈模型求解相比,合作博弈解可以为市场中的参与者提供良好的经济信号,刺激参与者互相竞争获得更大的利益。
通常情况下,生产活动中的参与者(或局中人)通过某种协定形成联盟,各联盟之间的参与者通过协商并联合行动,来实现联盟整体利益的最大化,进一步实现个体利益的最优分配。参与者在追求整体和个体利益最大化的同时,也受到相互之间协定的约束,从而避免自身获取利益的行为造成其他参与者利益的损失。由于参与者采用合作博弈方法进行生产活动时,各自分配的利益能够被全体参与者所接受,因此对合作博弈方法的研究很有必要。
令N为参与者(这些参与者考虑不同的合作可能性)的非空有限集合,即{}
=,每个子集S看作是参与者不同的合作组成的一个联盟,则联盟N n
1,2,3,...,
∈。对于每一个联盟S,其中的参与者均通过协商采取一致的策略行动,为S N
实现该联盟的总利益最大而互相合作。集合N称为大联盟,集合φ称为空联盟。
将联盟的集合,即N 的所有子集用2N 表示,对于一个参与者为n 的大联盟,其子联盟有2n 个,用()N ϕ表示所有联盟的全体。
实值函数()V S 在理解时可认为为当联盟S 合作时其成员可以获得的最大收益或可节省的最大成本。一般设博弈(,)N V 的特征函数为V 。换句话说,对于()N ϕ中的任意一个联盟S ,该联盟与其他联盟进行博弈的过程中,总能够根据调整策略使其总收益最大化,该收益记为()V S 。因此,联盟φ的特征函数值为零,即:
()0V φ= (2.1)
现实中的很多合作博弈的是超可加性博弈,超可加性是指若()N ϕ中的两个联盟的交集为空集,则它们合作后所获得的总收益(或节省的费用)应当不少于两个联盟不进行合作单独产生的收益(或节省的费用)之和,即当S ,T 满足{}S T φ⋂=,则有:
()()()V S T V S V T ⋃≥+ (2.2)
式(2-2)所表示的超可加性也可以理解为:对于公式中的()V S T ⋃,联盟S 和联盟T 合作对抗N S T --;对于公式中的()()V S V T +,联盟S 同时对抗
N S T --和T (T 在()V S 中)
,联盟T 同时对抗N S T --和S (S 在()V S 中)。可见联盟S 和T 合作后获得的总利益应当不少于它们同时对抗其他联盟的利益之和。也就是说式(2-2)表明联盟S 和T 进行合作能够使产生的利益之和更大,从而分别使各自获得更大的利益;反过来,当对生产成本进行分摊时,则式(2-2)表明联盟S 和T 进行合作博弈后完成生产活动所需的总成本小于等于它们各自独立进行生产活动所需的成本之和。对于满足超可加性的博弈,进行合作博弈对于博弈中的每个参与者或联盟来讲都是有利的。
在合作博弈中,参与者通过彼此间的合作协议而受到约束。当大联盟中存在n (n >2)个参与者时,参与者相互之间可能进行合作博弈活动,从而分别组成联盟。因此,在建立合作博弈模型之前,应当首先确定参与者形成联盟的数量和种类。联盟的数量和参与者的组合不同直接影响合作博弈的结果。在确定了参与者的所有可能组合以及联盟数量之后,需要分别对这些联盟所产生的收益(或节省的费用)进行计算。
大联盟中的参与者进行合作博弈时,特征函数()V S 只代表联盟的总收益,随之产生的问题是如何将该总收益在所有参与者中合理分配,从而满足参与者进行合作博弈的基本要求。因为一旦分配结果不能被所有参与者所接受,合作联盟就没有了存在的意义,即使是对于已存在的联盟也会因此而分裂。对于一次合作博弈活动,需要解决的最重要问题就是所有参与者合作时所获得的收益(或节省的费用)如何在个体参与者之间进行分配,同时这个分配需要考虑所有参与者形
成不同联盟时可能存在的潜在收益。在实际生产活动中,每个参与者都希望自己所选择的策略是最优的,即选择能够进入能够使自身在生产活动中获利最大的联盟,参与者为加入这样的联盟所采取的策略也会随之改变,从而影响其他参与者的策略。因此,在各联盟形成前,联盟就应向其参与者提供可能获得的收益信息,使参与者自由选择合作对象形成联盟。
对于分配联盟获取的总收益,需要引入分配向量的概念进行说明。分配向量代表联盟中每个参与者所获收益的一组函数值。在参与者为n 的合作博弈中,分配向量通常为{}12,,...,n x x x =x ,其中i x 表示参与者i 分配到的收益,1,2,3,...,i n =。
分配向量通常满足一下两个约束:
(1)群体合理性
1()n i i x
V N ==∑ (2.3)
(2)个体合理性
()i x V i ≥ (2.4)
其中群体合理性表明对于所有参与者组成的大联盟N ,其特征函数V 必须得到完全分配,否则不会被参与者认可;同时总的分配也不能超过特征函数V ,否则就会导致某些参与者无法获得收益,出现所谓的“空头支票”。个体合理性表明,对任意一个参与者来说,加入联盟进行合作后的所分配的收益应当不少于其独立进行生产活动的获得,否则加入联盟对其没有意义。
合作博弈中的分配方案通常不止一种,当出现另一个分配向量时,需要对两种方案的优劣进行对比。此时,各参与者往往会采取不同的策略,因为两种分配方案都应当满足式(2.3)中的群体合理性,即:
11
()n n i i i i x
V N y ====∑∑ (2.5) 对于两种分配方案,可能存在参与者i ,使得分配向量i i x y >,因此对参与者i 而言,生产活动中加入前者进行合作对自身更为有利。同样,也会存在参与者j ,在生产活动中加入后者进行合作对自身更为有利。在此时为了表示在联盟S 中所有参与者对两种分配方案的支持与否,需要引入分配支配的定义:
对于分配方案x 和y 及联盟S ,如果i i x y > ,i S ∀∈,有()i i S
x V S ∈≤∑,则
称x 关于联盟S 支配y 。