合作博弈ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
要讨论的问题,我们主要讨论的问题是局中人如何分配通过合作所获得 的收益或效用。
联盟与特征函数
设局中人集合 N{1,2,,n},称 N的任一子集为一个联盟。为方便, 把 N 的空子集 也视为一个联盟。记所有联盟构成的集类为 B。
对 SB ,用 v ( S ) 表示联盟 S中的局中人通过合作所能获得的最大
分配的优超关系
为了比较哪个分配好些,给出以下定义。
定义7.4 设有分配 x, yI(v),及联盟 SB ,如果
(1) 对 iS,xi yi ,
(2) x i v ( S )
i s
则称联盟
S 为分配
x优于分配
y,记作 x s
y。如果对于,I(v),存
在一个联盟
TB,使
T
,则称 优于
,记为
v({1,2,3})=10,v () 显然满足超可加性,于是我们建立了联盟博弈 N , v 。
特征函数是研究联盟博弈的基础,确定特征函数过程实际就是一个建立 合作博弈模型的过程。有的问题,特征函数可以容易地得到,有的问题 需要仔细分析,甚至需要一些专业知识。
若对 S,TB, ST,都有 v(ST)v(S)v(T),则称 v满
(1) 每个工厂每天必须因每个直接向湖中排放污水的工厂(包括自身)花 费 c 美元净化它所用的水。
(2)每个工厂可以安装一个过滤器,在污水排回湖中之前就将水净化。 每个工厂每天的净水费用为 b 美元。
为使问题有意义,假设 0cbnc。
(3) s(1,2,,n)个局中人可以组成一个联盟 S,共同决定是否采用过
任何人结盟,余下1与3各持己见。(1,0,1) 不构成分配。同样,如果
{2 ,3} 结盟,y (0,1,1)是合理的分配 ;{1,3} 结盟,z (1,0,1) 是
合理的分配。易知 w{x, y,z} 是稳定集
(1) x, y, z 之间没有优超关系;
(2)对于 W 之外的任何一个分配 ,必被中某个分配优超。

定义中条件(1)表明,联盟 S 中每个成员都认为分配 x比 y好。条
件(2)表明分配 S对 x中成员的支付能够由联盟 S付出。
单人联盟不可能存在转归之间的占优关系
实际,如果 Y X ,由定义
i
yi
v({i}),且
yi
xi ,于是
有 v(i{} ) yi xi ,这与 X为转归相矛盾。
全联盟 N 也不可能存在转归之间的占优关系
第7章 合作博弈
COOPERATIVE GAMES
熊、狼、狐狸一起抓了一只兔子,民主协商如何分 配。狐狸对熊说:平均分只能各得1/3,这样吧,我 们俩联合起来,平分如何?熊要答应,狼急了,于 是狐狸对狼说:怎么样,我和熊联合起来可以让你 什么也得不到,我可以和你合作,不过我要3/4。狼 感激的点头,熊琢磨过味来,对狼说:别听那个两 面三刀的,和我合作,我给你1/3。狐狸见势不妙, 对狼说:别,我给你2/3,我只要1/3。狼成了抢手 货,正得意,没留神狐狸和熊又开始嘀咕起来,有 再次把自己晾在一边的不妙趋势,连忙钻去继续讨 价还价。结果呢?
合作:为共同的目的而一起行动 需要一个描述集体理性的效用函数。 描述n人合作博弈,通常假设合作博弈具有可传递效用。简单
地说,该效用就像货币一样,可以在各局中人之间自由转让。 (合作,人类进化之舟。)
7.2 具有可转移支付的联盟博弈
7.2.1 具有可转移支付的联盟博弈及分类
具有可转移支付的 n人合作博弈 在非合作的n人博弈中,局中人之间不允许事先协商如何选择策略,不允
其图形为单纯形 A { x ( x 1 ,x 2 ,x 3 ) x 1 x 2 x 3 5 ,x 1 ,x 2 ,x 3 0 } 内以
(4 ,0 ,1 )(,4 ,1 ,0 )(,3 ,2 ,0 )(,2 ,2 ,1 )为顶点的四边形,如图7-1所示(p201) 。
图 7-1
(0,0,5)
n
(1) xi v(N ) , (2) xi v({i}) 。 i 1
(1)式表明n个局中人的支付总和应与他们全体构成一个联盟所获的支 付相等。这说明如果要使某个局中人的支付增加,必需减少其它局中人 的支付。这描写了帕累托最优性,因而,称(1)为整体合理性。
(2)式表明每个局中人在合作博弈中所获得的支付不应低于他“单干” 所获的支付。称(2)为个体合理性。
如果
Y X,则
N
n
v(N) yi
, yi
xi
,i N
。于是
n
yi
n
xi
v(N)
,这与
i 1
i1
i1
Y为转归矛盾。
关于某个联盟 S 转归之间的占优关系满足下述的传递性:

X,Y,ZI(v),如果 X
Y
S
,Y
S
Z
,则X
S
Z
。但由 XY,YZ,一
般不能得到 XZ的结论。
7.4 稳定集与核
稳定集的定义
2赢利 9-x 元。联盟 {1, 2} 的总收益为9元。类似,联盟 {1 ,3 } 的总赢利
为10元。于是有 u{1,2}9,v{1,3}1。0
另一方面,单 i 1,2,3。
当三个局中人在一起交易时,局中人1显然要把物品卖给局中人3,从而
滤器。注意,如果S 决定采用过滤器,联盟 S之外的工厂仍会向湖中排 放污水。因而联盟 S的特征函数值为
v(S)masxn{,cs(b(ns)c} n s(bc(sns)c)s s b cb c
即当s b 时,联盟 S决定采用过滤器, s b
c
c

S决定不采用
过滤器。

n3,b2,c1,有
合作博弈的意义与构成
合作博弈的意义表现在它与非合作博弈的差别上。如果协议有 外在力量保证强制执行,则为合作博弈,否则为非合作博弈。
非合作博弈的重点是在个体,是每个局中人该采用什么策略; 强调个体理性(individual rationality)
合作博弈的重点则在群体,讨论何种联盟将会形成,联盟中的 成员将如何分配他们可以得到的支付;强调群体理性(group rationality)
7.3 联盟博弈的分配
转归或分配的定义
在联盟博弈中局中人通过合作,获得一定的联盟支付,联盟还要将这笔 支付转归于每个局中人,联盟博弈中每个局中人 i(1,2,,n)从联盟
中所获的支付或转归可用 n维向量 X(x1,x2,,xn)表示,这里 x i 为局中
人 i(1,2,,n)所得到的支付。
定义7.3 称向量 X(x1,x2,,xn)是联盟博弈 N , v 的一个转归或分配, 如果 X满足
支付。且可认为这个值与N \ S 中的局中人的行为是独立的,因而 v ( S )
是定义于 B 上的函数,即 v:BR。
定义7.2 对于局中人集合N{1,2,,n}的任一子集 S,给定集合 S的
支付 v ( S ) ,如果 v满足 v() 0 ,则称 v () 为特征函数,称 N , v
为具有可转移支付的联盟博弈。
s(5s) v(S) 3s
s2 s2
由定理7.2, X(x1,x2,x3) c(v)的充要条件是X满足下述不等
式组
x1 x2 x3 6
x1 x1
x2
三人利润分配是向量x(x1,x2,x3) ,满足
x 1 x 2 x 3 v { 1 ,2 ,3 } 2 xi0,i1,2,3.
如果联盟{1,2}形成,即局中人 1、2合伙,则分配 x(1,1,0) 是合理的。
否则,局中人1要求采取分配(1,1,0) ,其中 (0,1) ,那么局中人2
将与局中人3合伙。如果局中人3也采取类似的要求,则局中人2不与
足可加性。
我们可以给出满足可加性的特征函数的例子。
例7.2 在某项工作中,不熟练工人 1,2,,n1可获报酬
a 元,熟练工人可得报酬 b 元,于是可以定义特征函数
v(s) sa b(s1)a
当 nS 当 nS

这里 S 表示集合 S中的局中人个数,以后也用这种记法。
(小知识:中国参与环保组织的志愿者约30万人,美国有60%,欧洲有 50%的人参与。参与环保,保护共同家园,需要我们合作,如二氧化碳 排放,如如何保护森林。当前,最大的善,不是施舍,而是节约资源!)
由定理7.2 易知,该博弈的核由下面不等式组确定: x1 x2 4 x1 x3 3 x2 x3 1 x1 x2 x3 5 x1, x2 , x3 0
易知 ,x1 4 ,x2 2 ,x3 1 。 故该博弈的核 c(v) {(x1, x2, x3) x1 x2 x3 5,0 x1 4,0 x2 2,0 x3 1}
(4,0,1)
(2,2,1)
(5,0,0)
(4,1,0)
(3,2,0)
(0,5,0)
例7.5 污染问题
沙普利(Shaplay) 和舒比克( Shubik)描述了一个湖的污染模型。设 有个工厂分布在某湖的沿岸,为简便起见,设问题是对称的。即每个工 厂的污染程度相同。假设每个工厂每天必须在湖里抽取相同数量的清洁 水,用完后将污水排入湖中。所涉及的方案和费用如下:
核的充要条件
定理7.2 X(x1,x2,,xn)是 n人联盟博弈 N , v
充要条件是
n
(1) xi v(N )
i 1
(2)对 SB , x(S)xi v(S) 。
iS
的核中的分配的
例7.4 设有三人联盟对策,其特征函数
v{1}v{2}v{3} }0, v { 1 ,2 } 4 ,v { 2 ,3 } 1 ,v { 1 ,3 } 3 ,v { 1 ,2 ,3 } 5
青山原不动,白云自去来
如果在实际博弈问题中,具有有力的保障使局 中人能够进行协商、谈判,联合选择行动,共 同分享利益,我们就面对一个合作博弈问题。 本章通过合作博弈模型的介绍,讨论在合作博 弈中,局中人如何进行协商谈判、结成联盟及 分享利益。
1、纳什讨价还价问题(略) 2、联盟博弈 3、联盟博弈的分配 4、核和稳定集 5、沙普利值
分配 x。
稳定集定义中第1条表明在稳定集内部的任何两个分配之间不存在优 超关系,称为稳定集的内稳定性,它可以防止由于联盟内部成员因 利益冲突而导致联盟解体;第2条表明稳定集外的任一分配,至少被 稳定集内的某个分配优超,称为稳定集的外稳定性。稳定集的概念 由冯.诺依曼(V.Neumann)和摩根斯坦恩(Morgenstern)提出, 也称为合作博弈的 VNM 解。
若 v(S ) 满足对 S,TB,ST,有v(ST)v(S)v(T),则说 v()
满足超可加性。
下面讨论的联盟博弈都是指具有可转移支付的联盟博弈。特征函数满 足超可加性。
例7.1 局中人1(卖主)要把一件物品卖掉,局中人2和3(买主)分别出 价9元和10元。如果局中人1将物品卖给局中人2的要价是 x 元,则局中人
例7.3 设有三个局中人 ,拟合伙开商店,每月可赢利2000元。要使商 店正常营业,起码需要两人。试问,应采用怎样的方式经营,以及怎 样分配利润才是合理的。
这是一个联盟博弈问题。特征函数为v(i)0,i1,2,3 v { 1 , 2 } v { 2 , 3 } v { 1 , 3 } v { 1 , 2 , 3 } 2 .
人们花费了近20年的时间来证明联盟博弈的存在性。但卢卡斯(Lucas, 1969)举出了反例说明联盟博弈的稳定集可以是空的。另外,寻求 稳定集至今还没有通用的方法。
核的定义
n 定义7.6 人联盟博弈 N , v 的所有不被优超的分配构成的集合称为核,
记为 c ( v。)
对于核中的分配 X ,局中人不能通过重组联盟而增加支付。
许他们把策略结合起来,不允许局中人对得到的支付重新分配,一个局 中人不能分享另一个局中人的支付,或支付是不可能转移的。
本章所讨论的 n人合作博弈对上述问题都不加限制。局中人在选择策略时
可以协商,并且局中人的支付可以相互转让,或支付是可以转移的。在
具有可转移支付的 n人合作博弈中,局中人如何选择自己的策略已不是主
定义7.5 对于联盟博弈 N , v ,集合 S(v)I(v) 称为联盟博弈 N , v 的稳定集(stable set),如果以下条件成立。
(1)S (v) 中任意分配 x都不优于 S (v) 中的其余分配。 (2) 不属于S (v) 中的任何分配 y,总可以在 S (v) 中找到优于 y 的
相关文档
最新文档