合作博弈

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、合作博弈的概念及其表示
定义6.1.1 在 n 人博弈中,参与人集用N {1, 2 , , n}
N 的任意子集 S 称为一个联盟(coalition)。
表示,
S 是一个联盟, v ( S )是指 S 和 定义6.1.2 给定一个 n人博弈, v(S) 称为联盟 N S {i | i N,i S} 的两组博弈中S 的最大效用, S 的特征函数(characteristic function)。
n
二、分配
所谓分配就是博弈的一个n 维向量集合,之所以是 n 维向 量,是由于每个参与人都要得到相应的分配。 n 维的分配 向量称为博弈的“解”,各种方法即各种解概念代表着分 配的不同观点。 定义6.2.1 对于合作博弈( N , v), N 1, 2,, n ,对每个参与 人 i N ,给予一个实值参数 xi ,形成 n 维向量 x ( x1 , , xn ) n 且其满足:
u v ( N )
存在无限个正向量 u (u1 , u2 , , un ) ,满足 u u1 u2 ,, un 。 用 E(v) 表示一个博弈 ( N , v ) 的所有分配方案组成的集合。
v (i) 0
n i 1
显然如下的 x ( x1 , , xn ) 都是分配,其中 xi v i ui ,1 i n 。
例6.1 设有一个3人合作对策,每个参与人各有两个纯策略A 和B。当三人不合作时,其支付见下表。假设采用最稳妥 策略,即最坏情况下选择最好,求合作博弈的支付函数
超可加性表示两个不相交的联盟分别行动,其分别单干的结 果不如组成一个联盟的联合而共同行动,这是大联盟形成的 动因。特征函数只有满足超加性,才有形成新联盟的必要性 。否则,如果一个合作博弈的特征函数不满足超可加性,那 么,其成员没有动机形成联盟,已经形成的联盟将面临解散 的威胁。
一、合作博弈的概念及其表示
合作博弈的结果必须是一个帕累托改进,合作双方的 利益都有所增加,或者至少是一方的利益增加,而另一方 的利益不受损害。合作博弈研究人们达成合作时如何分配 合作得到的收益,即收益分配问题。 合作博弈采取的是一种合作的方式,合作之所以能够 增进双方的利益,就是因为合作博弈能够产生一种合作剩 余。至于合作剩余在博弈各方之间如何分配,取决于博弈 各方的力量对比和制度设计。因此,合作剩余的分配既是 合作的结果,又是达成合作的条件。 合作博弈的核心问题是参与人如何联盟以及如何重新 分配联盟的支付。下面首先分析联盟的概念。与联盟相关 联的特征函数,特征函数的性质决定了合作博弈的特征。
三 (v) 是 E (v )中的一个闭凸集。
C ( v ) ,则将 C (v ) 中的向量 2.若 个人理性,又满足集体理性。
0 v(S ) 1
( N , v ) 称作对称博


如果 v( S ) v ( N S ) v( N ) ,则 ( N , v) 称作常和博弈。 则 ( N , v ) 称作简单博弈。
({1, 2, , m}) ( K {m+1}) ({1,2, ,m+1} ) + ({ K }) ({1,2, ,m+1} ) - ({1, 2, , m}) ( K {m+1})-({ K })
2.全联盟 N 上也不可能有优超关系。
否则,x {i} y, yi xi v({i}), 则有 yi v({i})与 y是分配方案矛盾
如果分配方案x 在 S 上优超于 y ,则联盟 S 会拒绝分配 方案 y , y 方案得不到切实执行。因为从 y 到 x , S 中的 每个参与人的收益都得到改善,S 创造的剩余v( S )又足以满 足他们在 x 中的分配。
规定 v ( ) 0。根据定义 , v (i ) 表示参与人 i 与全体其他人博弈时 的最大效用值,表示为 v ({ i}) 。 用 ( N , v) 表示参与人集为 N ,特征函数为 v 的合作博弈,其中 v 是定 义在 2 N 上的实值映射。 在很多情况下,一个联盟能获得的支付依赖于其他参与人所采取的行 动。 v ( S ) 有时被解释为联盟 S 独立于联盟 N S 的行动可保证的最大 支付 。
v( N ) v(1) v(2,, n) v(1) v(2) v(3,, n) v(i)
至此特征函数的值已全部求出。
根据上述不等式,特征函数 v 分成两种类型: n v 满足 v( N ) v (i) 。即大联盟的效用是每个 类型1: i 1 参与人的效用之和。这说明通过联盟并没有创造新的合作 剩余,联盟没有价值,这种联盟也不可能维持。这种对策 称为非实质性对策,没有研究价值。
, 上述矩阵对策没有纯策略, S 的混合策略是 N S 4 4 , 1 3 1 的混合策略是 4 , 0 , 0 , 4 。 S 的均衡值是 4 。 1 故 v (2) 。
一、合作博弈的概念及其表示
4
3 1
同理,可以求出 v(1) 1, v(3) 1
xi v(i), xi v( N )
i 1
则称 x 是联盟 S 的一个分配方案。
二、分配
x i v ( i ) ,
二、分配
x1 v({1}) 1, x2 v({2})
能超过集体剩余v( N ) 。另外若 v( N ) 没有全部被分配,显然 x 不是一个帕类托最优的分配方案,不会参与人所接受。
3
三、占优方法:核心、核仁
尽管可行分配集合E (v) 中有无限个分配,但实际上,有 许多分配是不会被执行的,或者不可能被参与人所接受的 。 很显然,联盟的每一个成员都不偏好于劣分配方案,因此, 真实可行的分配方案应该剔除劣分配方案。 定义6.3.1 在一个 n 人合作博弈( N , v ) 中,全体最优分配 方案形成的集合称为博弈的核心(core),记为 C ( v )。显然 有 C ( v ) E ( v) 。
一、合作博弈的概念及其表示

一、合作博弈的概念及其表示
对于合作博弈( N , v), N 1, 2,, n 性,自然有: ,特征函数 v 满足超加
n i 1
S N ,最大的联盟.各策略组合对于 S 有1个, 当 S = 3, 的支付总和如下:
v ( N ) max 2, 0, 4, 2, 2,1, 3, 2 4
3.优超关系是集合 E (v) 上的序关系,这种序关系一般情况下 不具有传递性和反身性。

因此,如果在 S 上有优超关系, 则 2 S n 1
4.对于相同的联盟 S ,优超关系具有传递性, y S z ,则有 x z 。 即x y ,
S
S
5.对于不同的联盟 S ,优超关系不具有传递性。
则有 的任何 即 新成员m+1加入联盟 S后边际贡献不小于新成员与联盟 S 增大而越来越大。
入的新成员,记 T=K {m+1},则由凸性可知
S {1, 2, m} N , 对于任意 K S,有某一个成员 m 1 N为加
凸性表示联盟越大,新成员的贡献率就越 大。因为设

例如,在投票博弈中,每个参与人的权重 wi (wi Q),1 i n 如果 v ( S ) v (T ) v ( S T ) v( S T ) ,则 ( N , v ) 称作凸博弈。

i 1
xi v(i) 是基于个人理性,合作中的收益 分配的定义中 , 不能小于非合作中的收益,反映了参与人的参与约束。如 xi v(i ) ,那么,参与人 i 是不可能参加联盟的。 果 n
x i v ( N ) 是基于集体理性,每个参与人的分配之和不

n
i1
xi v ( N )
在例6.1中存在一种分配方案: x { x1 , x2 , x3 }满足:
1 , x3 v({3}) 1, x1 x2 x3 4 4
分配显然不是一个,而是无限个,无限个分配形成一个分配 集合。对于实质博弈,其分配总是有无限个。 例如,对于实质博弈 ( N , v ) ,由于
2
一、合作博弈的概念及其表示
类型2:v 满足 v(N) v(i) 。即大联盟的效用大于每个 i 1 参与人的效用之和。这说明通过联盟创造了新的合作剩余, 联盟有意义,这种联盟能否维持,取决于如何分配合作剩 余,使每个参与人的支付都有改善。这种对策称为实质性 对策,是本部分研究的范畴。
二、分配
定义6.2.2 设 E (v ) 的两个分配 x 和y ,S 是一个联盟。如果 分配方案 x 和 y 满足 (i) xi y i , i S (ii) x i v ( S ) 。
i S
二、分配
在优超关系中,联盟 S 的特征:
1.单人联盟不可能有优超关系。

则称分配方案 x 在 S 上优超于 y ,或称分配方案 y 在S 上 劣于x ,记为 x S y 。
w Q
iS iS i
w Q
i

子联盟 K 所组合产生的边际贡献,即新成员的边 际 贡献随联盟的
1
一、合作博弈的概念及其表示

一、合作博弈的概念及其表示
1
和 S ,S S ,有 v(S ) v(T ) v(S T ) 则称特征函数具有超可加性。
2 1 2
S 定义6.1.3如果特征函数 v 满足:对于联盟
当 S =2, S 有3个,以 S 1,2 为例。 当 S 1, 2 ,则 N S 3 。 S 的策略集 , ),(B, A),(B, B) , 合(A, A),(AB 策略组合 。 与 进行如下矩阵对策: 。
S 的均衡值是 3。故 v(1, 2) 3 上述矩阵对策有纯策略, 同理,可以求出 v (1, 3) 1, v (2 , 3) 1 。
一、合作博弈的概念及其表示
第六章 合作博弈


一、合作博弈的概念及其表示 二、分配 三、占优方法(合作博弈的一类解概念): 核心、核仁 四、估值方法(合作博弈的一类解概念): Shapley值
合作博弈,与非合作博弈相对称,是一种参与者能够 联合达成一个具有约束力且可强制执行的协议的博弈类型。 合作博弈强调的是集体理性,强调效率、公正、公平。 合作博弈最重要的两个概念是联盟和分配。每个参与 者从联盟中分配的收益正好是各种联盟形式的最大总收益, 每个参与者从联盟中分配到的收益不小于单独经营所得收 益。 合作博弈的基本形式是联盟博弈,它隐含的假设是存 在一个在参与者之间可以自由流动的交换媒介(如货币), 每个参与者的效用与它是线性相关的。这些博弈被称为 “ 单 边 支 付 ” 博 弈 , 或 可 转 移 效 用 (Transferable Utility ,TU)博弈。
空集 和全集 N 也可以看成是一个联盟,当然单点集{ i } 也是一个联 盟。
一、合作博弈的概念及其表示 一、合作博弈的概念及其表示
合作博弈的分类主要是根据特征函数的性质。下面根据特征 函数的性质介绍几类特殊的合作对策。

如果v( S ) 仅与 S 中元素的个数有关,则 弈。
0 S i , 如果 v(S ) 1 S N
显然,凸博弈的特征函数一定满足超可加性 。
一、合作博弈的概念及其表示
解:用 S 表示一个联盟, S 表示联盟中参与人的个数。 当 S =0,自然 S ,有v() 0 。 当 S =1, S 有3个,以 S 2 为例。 当 S 2 ,则 N S 1,3 。 S 的策略集合 A, B , N S 策略组合 ( A, A), ( A, B ), ( B , A), ( B , B ) 。 S 与 N S 进行如下矩阵对策:
相关文档
最新文档