合作联盟博弈课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
不具有传递性和反身性。 4.对于相同的联盟 S ,优超关系具有传递性,
即 x f S y , y f S z ,则有 x f S z 。 5.对于不同的联盟 S ,优超关系不具有传递性。
核心
尽管可行分配集合 E(v) 中有无限个分配,但实际上, 有许多分配是不会被执行的,或者不可能被参与人所接受 的 。很显然,联盟的每一个成员都不偏好于劣分配方案, 因此,真实可行的分配方案应该剔除劣分配方案。
人2赢利 9-x 元。联盟{1,2} 的总收益为9元。类似,联{盟1,3} 的总赢
利为10元。于是有u{1,2} 9, v{1,3} 10 。
另一方面,单个局中人或者两个买主在一起都不可能赢利,
即 v{i} v{2,3} 0 , i 1,2,3 。
当三个局中人在一起交易时,局中人1显然要把物品卖给局中人3,从而
方案x 和 y 满足
(i) xi yi ,i S ;
(ii) xi v(S ) 。
iS
则称分配方案
x

S 上优超于 y
,或称分配方案 y 在S
上劣于 x ,记为 x S y 。
如果分配方案 x 在 S 上优超于 y ,则联盟 S 会拒绝分
配方案 y , y 方案得不到切实执行。因为从 y 到 x ,S
能超过集体剩余 v(N ) 。另外若 v(N ) 没有全部被分配,显
然 x 不是一个帕累托最优的分配方案,不会参与人所接
受。
分配
在前面的例子分配中,分配显然不是一个,而是无限个, 无限个分配形成一个分配集合。 对于实质博弈,其分配总是有无限个。 例如,对于实质博弈(N, v) ,由于
n
u v(N) v(i) 0 i 1
合作博弈的概念及其表示
解:用 S 表示一个联盟, S 表示联盟中参与人的个数。
当 S =0,自然 S ,有 v() 0 。
当 S =1, S 有3个,以 S 2 为例。
当 S 2 ,则 N S 1,3 。 S 的策略集合 A, B ,
N S 策略组合 (A, A),(A, B),(B, A),(B, B) 。
核心
定理 1 分配方案 x (x1,, xn ) 在核心 C(v)中的充要条件是:
(i) xi v(S) , S N , iS
n
(ii) xi v(N ) 。
证明
i 1
如果
x E(v)

x 满足(i)、(ii),则
x 不可能被优超,
即 x C(v) 。
反证法,设存在 S ,使 y f S x 。根据优超的定义,有:
N S 策略组合 A, B。 S 与 N S进行如下矩阵对策:
合作博弈的概念及其表示
上述矩阵对策有纯策略, S 的均衡值是3 。故 v(1,2) 3 。 同理,可以求出v(1,3) 1, v(2,3) 1 。
当 S =3, S 有1个,S N ,最大的联盟。 S 的策略 空间 3A,B 。
坦白 抵抗
坦白 抵抗
-8,-8 0,-10 -10,0 -1,-1
在囚徒困境中,还有另外一个策略组合<抵抗,抵抗>,该 组合为参与人带来的支付是<-1,-1>。由<-8,-8>到<-1,-1>, 每个参与人的支付都增加了,即得到一个帕累托改进。
导论
<抵抗,抵抗>构不成一个均衡是基于参与人的个人理性。在参 与人选择抵抗的情况下,每个参与人都有动机偏离这个组合, 通过投机行为谋取超额收益1。如果两个参与人在博弈之前, 签署了一个协议:两个人都承诺选择抵抗,为保证承诺的实现, 参与人双方向第三方支付价值大于1的保证金;如果谁违背了 这个协议,则放弃保证金。有了这样一个协议,<抵抗,抵抗> 就称为一个均衡,每个人的收益都得到改善。
L
R
-1,2
5,5
0,10
0,10
最小最大值法:联盟外局 中人将采取行动使该联盟 的总和收益最小(极度悲 观),联盟选择策略-- 最大化这些最小值。
V()=0 V(1)=0 V(2)=5 V(1,2)=10
例:垃圾博弈--分析博弈局势
在一区域中住着7户居民,每户居民每天产生一袋 垃圾,这些垃圾只能扔在这一区域的某一户人家 领地(区域中没有空地)。
v({1,2,3})=10,v() 显然满足超可加性,于是我们建立了联盟博弈 N,v 。
特征函数是研究联盟博弈的基础,确定特征函数过程实际就是一个建
立合作博弈模型的过程。有的问题,特征函数可以容易地得到,有的问 题需要仔细分析,甚至需要一些专业知识。
由策略型博弈导出特征函数型博弈
局中人 U
1
D
局中人2
存在无限个正向量 u (u1,u2,L ,un ) ,满足 u u1 u2,L , un 。
显然如下的 x (x1,, xn ) 都是分配,其中 xi vi ui,1 i n 。
用E(v)表示一个博弈v 的所有分配方案组成的集合。
分配中的优超
定义4 设 E(v)的两个分配 x 和 y , S 是一个联盟。如果分配
如果 v(S) v(N S) v(N) ,则(N,v) 称作常和博弈。
如果
v(S)
0
S i ,则 (N,v) 称作简单博弈。
1 S N
例如,在投票博弈中,每个参与人的权重 wi (wi Q),1 i n ,
0
v(S
)
1
wi Q
iS
wi Q
iS
如果 v(S) v(T ) v(S T ) v(S T )
N S {i | i N,i S} 的两人博弈中 S 的最大效用,v(S) 称为联 盟 S 的特征函数(characteristic function)。
规定 v() 0。根据定义,v({i})表示参与人i 与全体其他人博弈时的 最大效用值,表示为 v(i) 。
用 (N,v)表示参与人集为 N ,特征函数为v 的合作博弈,其中v 是定
中的每个参与人的收益都得到改善,S 创造的剩余v(S)又
足以满足他们在 x 中的分配。
分配中的优超
在优超关系中,联盟 S 的特征: 1.单人联盟不可能有优超关系。 2.全联盟 N 上也不可能有优超关系。 因此,如果在 S上有优超关系,则 2 S n 1 。 3.优超关系是集合E(v) 上的序关系,这种序关系一般情况下
合作博弈最重要的两个概念是联盟和分配。 每个参与者从联盟中分配的收益正好是各种联盟 形式的最大总收益,每个参与者从联盟中分配到的 收益不小于单独经营所得收益。
合作博弈的概念及其表示
合作博弈的结果必须是一个帕累托改进,博弈双方 的利益都有所增加,或者至少是一方的利益增加,而另 一方的利益不受损害。
合作博弈采取的是一种合作的方式,合作之所以能 够增进双方的利益,就是因为合作博弈能够产生一种合 作剩余。至于合作剩余在博弈各方之间如何分配,取决 于博弈各方的力量对比和制度设计。
有 v(N ) ? v(N) max2,0, 4, 2, 2,1,。3, 2 4
至此特征函数的值已全部求出。
分配
所谓分配就是博弈的一个 n 维向量集合,之所以 n 是维向 量,是由于每个参与人都要得到相应的分配。n 维的分配 向量称为博弈的“解”。
定义3 对于合作博弈 (N,v), N 1,2,L , n,对每个参与
上述分析表明,通过一个有约束力的协议,原来不能实现 的合作方案现在可以实现。这就是合作博弈与非合作博弈的区 别。二者的主要区别在于人们的行为相互作用时,当事人是否达 成一个具有约束力的协议。如果有,就是合作博弈;反之,则是 非合作博弈。
合作博弈的概念及其表示
合作博弈,非合作博弈的对称,一种博弈类 型。参与者能够联合达成一个具有约束力且可强 制执行的协议的博弈类型。合作博弈强调的是集 体理性,强调效率、公正、公平。
义在 2N 上的实值映射。 在很多情况下,一个联盟能获得的支付依赖于其他参与人所采取的行 动。v(S) 有时被解释为联盟 S 独立于联盟 N S 的行动可保证的最 大支付 。
合作博弈的概念及其表示
合作对策的分类主要是根据特征函数的性质。下面根据特 征函数的性质介绍几类特殊的合作对策。
如果v(S) 仅与 S 的个数有关,则 (N, v) 称作对称博弈。
S 与 N S 进行如下矩阵对策:
合作博弈的概念及其表示
上述矩阵对策没有纯策略,
S
的混合策略是
3 4
,
1 4
,N
的混合策略是
1 4
,
0,
0,
3 4
。S
的均衡值是
1 4
。故 v(2)
S
1 4

同理,可以求出 v(1) 1,v(3) 1 。
当 S =2,S 有3个,以S 1,2为例。
当 S 1, 2,则 N S 3。S 的策略集合(A, A),(A,B),(B, A),(B,B),
,则 (N,v)称作凸博弈。
合作博弈的概念及其表示
v 之所以称为特征函数,是因为这个合作博弈的性质基本 由 v 决定。由此可见 v 对合作博弈的重要性。 定理 设 v 是参与人集合上 N 的特征函数,则有如下的超 可加性:对于联盟 S1 和 S2 ,如果 S1 S2 ,则
v(S1 S2 ) v(S1) v(S2 )
如果在实际博弈问题中,具有有力的保障使局中 人能够进行协商、谈判,联合选择行动,共同分 享利益,我们就面对一个合作博弈问题。本章通 过合作博弈模型的介绍,讨论在合作博弈中,局 中人如何进行协商谈判、结成联盟及分享利益。
1、联盟博弈
2、联盟博弈的分配
3、核和稳定集
4、沙普利值
导论
先回忆一下囚徒困境的例子:
博弈论
主讲人:
合作博弈
( COOPERATIVE GAMES)
合作博弈
COOPERATIVE GAMES
熊、狼、狐狸一起抓了一只兔子,民主协商如何分 配。狐狸对熊说:平均分只能各得1/3,这样吧,我 们俩联合起来,平分如何?熊要答应,狼急了,于 是狐狸对狼说:怎么样,我和熊联合起来可以让你 什么也得不到,我可以和你合作,不过我要3/4。狼 感激的点头,熊琢磨过味来,对狼说:别听那个两 面三刀的,和我合作,我给你1/3。狐狸见势不妙, 对狼说:别,我给你2/3,我只要1/3。狼成了抢手 货,正得意,没留神狐狸和熊又开始嘀咕起来,有 再次把自己晾在一边的不妙趋势,连忙钻去继续讨 价还价。结果呢?
人 i N,给予一个实值参数xi ,形成 n 维向量x (x1,, xn )
且其满足:
n
xi v(i),L xi v(N ) i 1
则称 x 是联盟 S 的一个分配方案。
Βιβλιοθήκη Baidu
分配
分配的定义中,xi v(i) 是基于个人理性,合作中的
收益不能小于非合作中的收益,反映了参与人的参与约束。
如果 xi v(i) ,那么,参与人i 是不可能参加联盟的。 n xi v(N ) 是基于集体理性,每个参与人的分配之和不 i 1
上式说明,特征函数只有满足超加性,才有形成新联盟 的必要性。否则,如果一个合作博弈的特征函数不满足 超可加性,那么,其成员没有动机形成联盟,已经形成 的联盟将面临解散的威胁。
例: 局中人1(卖主)要把一件物品卖掉,局中人2和3(买主)分别出 价9元和10元。如果局中人1将物品卖给局中人2的要价是 x 元,则局中
记Vn(n=0,1, …,7)表示任意n个局中人组成的特征 函数值,在合作博弈条件下,有:
V0=V()=0 V1=-6 V2=-5 V3=-4, V4=-3, V6=-1, V7=-7
V5=-2
合作博弈的概念及其表示
例:设有一个3人合作对策,每个参与人各有两个纯策略。 当三人不合作时,其支付见下表。假设采用最稳妥策略, 即最坏情况下选择最好,求合作博弈的支付函数
合作博弈的核心问题是参与人如何结盟以及如何重 新分配结盟的支付。
合作博弈的概念及其表示
定义 1 在 n 人博弈中,参与人集用 N {1,2, , n}表示,
N 的任意子集S 称为一个联盟(coalition)。
空集 和全集N 也可以看成是一个联盟,当然单点集{i} 也是一个联
盟。
定义2 给定一个 n 人博弈,S 是一个联盟,v(S) 是指 S 和
定义5 在一个 n 人合作博弈 (N, v) 中,全体优分配方案
形成的集合称为博弈的核心(core),记为 C(v)。显然 有 C(v) E(v) 。
核心
说明:
1.核心 C(v) 是 E(v)中的一个闭凸集。
2.若 C(v) ,则将 C(v) 中的向量 x 作为分配, x 既满
足个人理性,又满足集体理性。 3.用核心作为博弈的解,其最大缺陷是 C(v) 可能是空集。
相关文档
最新文档