合作博弈及其应用案例

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

合作博弈及其应用案例

1多人合作博弈概念

在日常生活及社会经济活动中，一个人（或集团）为了克服自身弱点（如力量或财力有限），寻求与他人（集团）进行合作，结成一个联盟，以完成单个人或集团所不能完成的事，这就是多人合作博弈．该联盟一旦形成，就作为一个整体共同采取行动，其目标是使联盟获得最大利益．一旦博弈完毕，可以根据某种事先商定的契约以及各个局中人本身的贡献大小，分配共同所得的利益．

联盟的数学定义是：设有n 个局中人{}n N ,,2,1 =进行博弈，所谓一个联盟就是N 的

一个非空子集S ．为方便起见，有时称空集∅也是一个联盟．n 个局中人共能形成n 2个联盟．

一旦联盟S 形成，组成联盟S 的局中人不再关心自己的特殊利益，而为整个联盟的最大利益去努力．因此，他们主要关心联盟S 所能获得的最大值．所有联盟S 所获得的最大值都确定以后，整个博弈就完全清楚．这样的博弈可以用特征函数加以描述：

定义1[]

1：给定{

}n N ,,2,1 =，合作n 人博弈记为[]v N ,=Γ，N 上的特征函数v 是定义在N 2上的实值函数，满足：

()0=∅v ，

()()()N T S T S T v S v T S v ⊂∅=+≥,,, . （1）

对于一个联盟S ，()S v 的值可以通过下列方式获得：S 中局中人形成联盟为使S 获得最大利益而努力，这时最糟的情况是剩下的所有局中人S N -形成一个联盟和S 抗衡，这样可看成是两个局中人S 与S N -在进行非合作博弈，()S v 就是在上述两人非合作博弈中，

S 所获得的最大收入．

对于合作博弈，局中人之间可以相互协商，共同采取使全体都有利的策略，如果某些局

中人对采取某些特定策略不满意，可以事先订立契约，等博弈完了以后再进行补偿，以便大家共同采取的策略使联盟总体的利益达到最大．因此，博弈完毕后，如何分配共同形成的总体联盟N 所得的收入()N v 就是合用博弈研究的主要任务．

()S v 的一种分配方案由n 维向量{}n x x x X ,,,21 =表示,i x 表示局中人i 的所得．显

然，对每一个局中人i 来说，它至少期望得到的i x 满足：

()N i i v x i ∈≥,. （2）（2）称为个体合理性条件；还有一个必须满足的条件是：

()N v x

i i

=∑=1

. （3）

（3）称为群体合理性条件．（2）、（3）合到一起就得到一种分配方案．

当所有n 个局中人均参与合作时，{

}n N ,,2,1 =为最大的一个联盟，记()N v 为最大的联盟成果，如何将()N v 分配给各局中人？一个很自然的方法就是依据各局中人给联盟带来的贡献来分配．

设i x 为第i 个局中人从()N v 中获得的分配，n i ,,2,1 =则有：

{}()11v x =，

{}(){}()12,12v v x -=， {}(){}()2,13,2,13v v x -=，

……，

(){}()n N v N v x n --=.

然而上述的分配通常与局中人编号的次序有关，如把局中人1,2,,1, -n n 的编号改为

n ''',,2,1 ，则有新的分配方案：

{}()n v x ='

1，

{}(){}()n v n n v x --='

1,2，

{}(){}()1,2,1,3----='

n n v n n n v x ，

……，

(){}()1--='

N v N v x n .

对于局中人其它编号的次序均有对应的分配方案，由于n 个局中人编号的次序共有!

n 种，所以对应的分配方案也有!n 种．为此取各局中人分配的平均值作为局中人的平均贡献．

记()v i ϕ为第i 个局中人的平均贡献，则有：

(){}()()[]

n i S v i S v n v i

i i ,,2,1,!1 =-=

∑π

ππϕ. （4）其中π为由n ,,2,1 组成的所有n 级排列，∑为针对所有的!n 个不同n 级排列求和，

{}i j j S i <=ππ|，显然i S π为排列π中排在i 之前的那些局中人组成的联盟，将满足S

S i

=π

排列归为一类，（4）式可以表示为:

()()()(){}()[]n i i S v S v n S S n v S

i i ,,2,1,!

1! =----=∑

∈ϕ, （5）

其中S 为N 中包含{}

i 的所有子集，S 为子集S 中局中人的人数．可以证明： ()()N v v n

i i =∑=1

ϕ. （6）

（6）式表明各局中人在联盟中的平均贡献()v i ϕ之和等于联盟的总“成果”．定义2[]3 称()()()()()v v v v n ϕϕϕϕ,,,21 =为合作n 人博弈的Shapley 值.

在多人合作博弈中，利用Shapley 值法解决分配问题是一种比较公正、合理且行之有效

的方法．本文的目的是探讨Shapley 值法在利益分配问题，费用分摊问题，及如何确定组合预测权系数中的应用．下面就通过实例来说明Shapley 值法在这些方面的具体应用．

1 利益分配问题

随着科学技术进步和信息技术的迅速发展，世界市场已由过去的相对稳定变成动态多变的特征，由过去的局部竞争演变成全球范围的竞争．在此情景下，以最快的速度推出产品、以最好的质量、最低的成本和最优的服务满足不同用户的需求成为每个企业认真解决的问题．于是越来越多的企业纷纷寻找合作伙伴，结成联盟，利用各方优势以更好地适应快速变化的市场要求．各企业结成联盟后获得了更大的收益，如何利用Shapley 值把联盟的整体收益合理地分配给各个企业，下面给出一实例．

设现有三家企业A 、B 、C 为了抓住某一市场机遇，决定实施联盟生产某种新产品投入市场，联盟成功后将获得一批可观的收益，现如何用Shapley 值分配这一联盟收益．让我们先看在特定场合单家企业生产或两家联盟生产以及三家联盟生产的收益情况（见表1）．

值法计算：

()()()20031200

48032402808024013120=⨯-+⨯-+-+⨯=

A ϕ， ()()()14031280

48032402001202401380=⨯-+⨯-+-+⨯=B ϕ，

()()()1403

1240

48032802001202801340=⨯-+⨯-+-+⨯=C ϕ．