9.合作博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x1 , x2 , x3 0 易知 ,1 4 , x2 2 ,x3 1 。 x
故该博弈的核 c(v ) {( x1 , x2 , x3 ) x1 x2 x3 5,0 x1 4,0 x2 2,0 x3 1}
其图形为单纯形 A {x ( x1 , x 2 , x3 ) x1 x 2 x3 5, x1 , x 2 , x3 0} 内以
第7章 合作博弈 COOPERATIVE GAMES
熊、狼、狐狸一起抓了一只兔子,民主协商如何分 配。狐狸对熊说:平均分只能各得1/3,这样吧,我 们俩联合起来,平分如何?熊要答应,狼急了,于 是狐狸对狼说:怎么样,我和熊联合起来可以让你 什么也得不到,我可以和你合作,不过我要3/4。狼 感激的点头,熊琢磨过味来,对狼说:别听那个两 面三刀的,和我合作,我给你1/3。狐狸见势不妙, 对狼说:别,我给你2/3,我只要1/3。狼成了抢手 货,正得意,没留神狐狸和熊又开始嘀咕起来,有 再次把自己晾在一边的不妙趋势,连忙钻去继续讨 价还价。结果呢?
y ,总可以在 S (v) 中找到优于 y
的
x。
稳定集定义中第1条表明在稳定集内部的任何两个分配之间不存在优
超关系,称为稳定集的内稳定性,它可以防止由于联盟内部成员因 利益冲突而导致联盟解体;第2条表明稳定集外的任一分配,至少被
稳定集内的某个分配优超,称为稳定集的外稳定性。稳定集的概念
由冯.诺依曼(V.Neumann)和摩根斯坦恩(Morgenstern)提出, 也称为合作博弈的 VN M 解。
s
在一个联盟 T B ,使 ,则称 优于 ,记为 T
。
定义中条件(1)表明,联盟 S 中每个成员都认为分配
x 比 y 好。条
件(2)表明分配 S 对 x 中成员的支付能够由联盟 S 付出。
单人联盟不可能存在转归之间的占优关系 实际,如果 Y X,由定义 yi v ({i}) ,且 y i x i ,于是 i 有 v({i}) yi xi ,这与 X 为转归相矛盾。 全联盟 N 也不可能存在转归之间的占优关系
S
SFra Baidu bibliotek
S
般不能得到 X Z 的结论。
7.4 稳定集与核
稳定集的定义
定义7.5 对于联盟博弈 N, v ,集合 S (v) I (v) 称为联盟博弈 N, v 的稳定集(stable set),如果以下条件成立。
(1) S (v) 中任意分配
分配
x
都不优于 S (v) 中的其余分配。
(2) 不属于S (v) 中的任何分配
(1)式表明n个局中人的支付总和应与他们全体构成一个联盟所获的支 付相等。这说明如果要使某个局中人的支付增加,必需减少其它局中人 的支付。这描写了帕累托最优性,因而,称(1)为整体合理性。 (2)式表明每个局中人在合作博弈中所获得的支付不应低于他“单干” 所获的支付。称(2)为个体合理性。
i 1
青山原不动,白云自去来
如果在实际博弈问题中,具有有力的保障使局 中人能够进行协商、谈判,联合选择行动,共 同分享利益,我们就面对一个合作博弈问题。 本章通过合作博弈模型的介绍,讨论在合作博 弈中,局中人如何进行协商谈判、结成联盟及 分享利益。 1、纳什讨价还价问题(略) 2、联盟博弈 3、联盟博弈的分配 4、核和稳定集 5、沙普利值
分配的优超关系
为了比较哪个分配好些,给出以下定义。
定义7.4 设有分配 x, y I (v) ,及联盟 S B ,如果
(1) 对 i S , x i y i ,
(2)
is
x i v( S )
则称联盟 S 为分配 x 优于分配
y ,记作 x y。如果对于 , I (v),存
下面讨论的联盟博弈都是指具有可转移支付的联盟博弈。特征函数满
足超可加性。
例7.1 局中人1(卖主)要把一件物品卖掉,局中人2和3(买主)分别出
价9元和10元。如果局中人1将物品卖给局中人2的要价是 x 元,则局中人 2赢利 9-x 元。联盟 { ,2} 的总收益为9元。类似,联盟 { ,3}的总赢利 1 1
我们可以给出满足可加性的特征函数的例子。
例7.2 在某项工作中,不熟练工人 1,2, , n 1
可获报酬
a
元,熟练工人可得报酬
sa v( s ) b ( s 1)a
b 元,于是可以定义特征函数
当nS 当n S
。
这里 S 表示集合 S 中的局中人个数,以后也用这种记法。
例7.3 设有三个局中人 ,拟合伙开商店,每月可赢利2000元。要使商
店正常营业,起码需要两人。试问,应采用怎样的方式经营,以及怎 样分配利润才是合理的。
这是一个联盟博弈问题。特征函数为 v(i ) 0, i 1,2,3
v{ ,2} v{2,3} v{ ,3} v{ ,2,3} 2. 1 1 1
人们花费了近20年的时间来证明联盟博弈的存在性。但卢卡斯(Lucas, 1969)举出了反例说明联盟博弈的稳定集可以是空的。另外,寻求 稳定集至今还没有通用的方法。
核的定义
定义7.6 记为
n
人联盟博弈 c (v。 )
N, v 的所有不被优超的分配构成的集合称为核,
对于核中的分配
X
,局中人不能通过重组联盟而增加支付。
合作博弈的意义与构成
合作博弈的意义表现在它与非合作博弈的差别上。如果协议有 外在力量保证强制执行,则为合作博弈,否则为非合作博弈。 非合作博弈的重点是在个体,是每个局中人该采用什么策略; 强调个体理性(individual rationality) 合作博弈的重点则在群体,讨论何种联盟将会形成,联盟中的 成员将如何分配他们可以得到的支付;强调群体理性(group rationality) 合作:为共同的目的而一起行动 需要一个描述集体理性的效用函数。 描述n人合作博弈,通常假设合作博弈具有可传递效用。简单 地说,该效用就像货币一样,可以在各局中人之间自由转让。 (合作,人类进化之舟。)
核的充要条件 定理7.2
充要条件是
n
X ( x1 , x2 ,, xn ) 是
i 1
n 人联盟博弈 N, v
的核中的分配的
(1) xi v( N ) (2)对 S B , x( S ) xi v( S ) 。
iS
例7.4 设有三人联盟对策,其特征函数
7.2 具有可转移支付的联盟博弈
7.2.1 具有可转移支付的联盟博弈及分类
具有可转移支付的
n 人合作博弈
在非合作的 n 人博弈中,局中人之间不允许事先协商如何选择策略,不允 许他们把策略结合起来,不允许局中人对得到的支付重新分配,一个局 中人不能分享另一个局中人的支付,或支付是不可能转移的。
三人利润分配是向量 x ( x1 , x 2 , x3 ) ,满足
如果联盟 1,2}形成,即局中人 1、2合伙,则分配 x (1,1,0) 是合理的。 { ( 否则,局中人1要求采取分配1 ,1 ,0) ,其中 (0,1) ,那么局中人2 将与局中人3合伙。如果局中人3也采取类似的要求,则局中人2不与 (1 任何人结盟,余下1与3各持己见。 , 0, 1 ) 不构成分配。同样,如果
本章所讨论的 n人合作博弈对上述问题都不加限制。局中人在选择策略时 可以协商,并且局中人的支付可以相互转让,或支付是可以转移的。在 具有可转移支付的 n人合作博弈中,局中人如何选择自己的策略已不是主 要讨论的问题,我们主要讨论的问题是局中人如何分配通过合作所获得 的收益或效用。
联盟与特征函数
为10元。于是有
u{1,2} 9, v{1,3} 10。
另一方面,单个局中人或者两个买主在一起都不可能赢利, 即 v{i} v{2,3} 0 , i 1,2,3 。
当三个局中人在一起交易时,局中人1显然要把物品卖给局中人3,从而
v({1,2,3})=10, () 显然满足超可加性,于是我们建立了联盟博弈 N, v 。 v
如果 Y X,则 v( N ) yi , yi xi , i N 。于是 yi xi v( N ) ,这与
N
i 1
i 1 i 1
n
n
n
Y 为转归矛盾。
关于某个联盟 S 转归之间的占优关系满足下述的传递性: 设 X , Y , Z I (v) ,如果 X Y ,Y Z ,则X Z 。但由 X Y , Y Z,一
x1 x 2 x3 v{ ,2,3} 2 1
xi 0, i 1,2,3.
{2,3} 结盟, (0,1,1) 是合理的分配 ;{1,3} 结盟, (1,0,1) 是 y z 合理的分配。易知 w {x, y, z} 是稳定集
(1) x, y, z 之间没有优超关系; (2)对于 W 之外的任何一个分配 ,必被中某个分配优超。
v: B R
。
定义7.2 对于局中人集合N {1,2, , n} 的任一子集 S ,给定集合 S 的 支付 v(S ) ,如果 v满足 v() 0 ,则称 v () 为特征函数,称 N, v 为具有可转移支付的联盟博弈。
若 v(S ) 满足对 S , T B,S T ,有v(S T ) v(S ) v(T ) ,则说 v () 满足超可加性。
(小知识:中国参与环保组织的志愿者约30万人,美国有60%,欧洲有 50%的人参与。参与环保,保护共同家园,需要我们合作,如二氧化碳 排放,如如何保护森林。当前,最大的善,不是施舍,而是节约资源!)
7.3 联盟博弈的分配
转归或分配的定义
在联盟博弈中局中人通过合作,获得一定的联盟支付,联盟还要将这笔 支付转归于每个局中人,联盟博弈中每个局中人 i ( 1,2,, n) 从联盟 中所获的支付或转归可用 n 维向量 X ( x1 , x2 ,, xn ) 表示,这里 x i 为局中 人 i ( 1,2,, n) 所得到的支付。 定义7.3 称向量 X ( x1 , x2 ,, xn ) 是联盟博弈 N , v 的一个转归或分配, 如果 X 满足 n (1) x i v( N ) , (2) xi v ({i}) 。
v{1} v{2} v{3}} 0 , v{1,2} 4, v{2,3} 1, v{1,3} 3, v{1,2,3} 5
由定理7.2 易知,该博弈的核由下面不等式组确定: x1 x2 4
x1 x3 3 x2 x3 1 x1 x2 x3 5
特征函数是研究联盟博弈的基础,确定特征函数过程实际就是一个建立
合作博弈模型的过程。有的问题,特征函数可以容易地得到,有的问题
需要仔细分析,甚至需要一些专业知识。
若对 S , T B , S T
,都有
v( S T ) v(S ) v(T ) ,则称
v
满
足可加性。
(4,0,1), (4,1,0), (3,2,0), (2,2,1)为顶点的四边形,如图7-1所示(p201) 。
图 7-1
(0,0,5)
(4,0,1)
(2,2,1)
(0,5,0) (5,0,0) (4,1,0) (3,2,0)
例7.5 污染问题
沙普利(Shaplay) 和舒比克( Shubik)描述了一个湖的污染模型。设 有个工厂分布在某湖的沿岸,为简便起见,设问题是对称的。即每个工 厂的污染程度相同。假设每个工厂每天必须在湖里抽取相同数量的清洁 水,用完后将污水排入湖中。所涉及的方案和费用如下: (1) 每个工厂每天必须因每个直接向湖中排放污水的工厂(包括自身)花 费 c 美元净化它所用的水。
设局中人集合 N {1,2, , n} ,称 N 的任一子集为一个联盟。为方便, 把 N 的空子集 也视为一个联盟。记所有联盟构成的集类为 B 。
对 S B ,用 v (S ) 表示联盟 S 中的局中人通过合作所能获得的最大 支付。且可认为这个值与N \ S 中的局中人的行为是独立的,因而 v(S ) 是定义于 B 上的函数,即