第五章合作博弈
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
S=,V()=0。
(2)超可加性
若一个多人博弈的特征函数具有下列性质,即
对任意结盟S,T N源自文库S∩T= ,满足
V(S∪T)≥V(S)+V(T).
称这个多人博弈具有超可加性。
如果特征函数不满足超可加性,博弈中的结盟 是不稳定的。
例1 :(爵士乐队博弈,A Jazz Band Gounce)
一位歌手(S),一位钢琴家(P)和一位鼓手 (D)组成一个小乐队在俱乐部同台演出能得到 演出费1000元,若歌手和钢琴家一起演出能得 800元。而只有钢琴家和鼓手一起演出能得到 650元,钢琴独奏表演能得300元,钢琴家没有 其它收入。然而,歌手和鼓手在地铁中表演能挣 500元,歌手独奏可以从The Terasses 挣200元, 而鼓手单独什么也挣不到。
问题:如何在这三人爵士乐队中合理分配共同 演出费1000元?
这个问题可归为一个三人合作博弈,它 的特征函数V(S)为:
结盟S {S,P,D} {S,P} {S, D} {P,D} {S} {P} {D} V(S) 1000 800 500 650 200 300 0
很容易验证此博弈是具有超可加性的。
作为一个博弈的解X,即在博弈中对N个局中人得失的合 理分配,至少应满足两个条件:
(1) xi V ({i}) n
(2) xi V (N )
i N(个人合理性)
i N(集体合理性)
条件(i11)称为:“个人合理性”(Individual Rationality),
表示局中人i所分配值xi不小于特征函数中规定他至少能得 到的值V(i)。
i 1
显然,作为多人结盟博弈的一个解X,至少必须 是一个合理分配,即 X I(V )
1、局中人与结盟
(1) N={1,2,…,n}表示局中人集合。 (2)结盟S,表示一个联盟,即一局多人对
策中,一部份局中人联合成一体像一 个“局中人”一样选择策略,这种联合 称为结盟。显然结盟S是局中人集合N 的子集,SN。 (3)2n是局中人可能形成结盟的个数。
2、特征函数 V(S)
(1)V(S)表示当若干局中人联合成一个结盟S时,在 这局博弈中能获得的最大收益值,即当形成结盟S,只 要S内每一个局中人共同策略,选择相应策略结盟S 能保证获得,而与联盟外局人采用什么策略无关。若
C(S) 0 100 140 130 150 130 160 150 V(S) 0 0 0 0 90 100 110 220
博弈<W,V>的特征函数值V(S),由下式得出
V (S) C(i) C(S) iS
S 2N
150
A
B
100 150 140
C
160
130
130
90
A 0
220
100
C 0
问题:如何在这三人爵士乐队中合理分配共同演出费 1000元?
例2: 成本分摊问题(A Cost Game)
三个城镇A,B,C欲与附近的一座电站连接起 来,其可能的线路及其成本如下网络图表示:
100
AA
30
电站
50
CC
140
B
20
这三个镇可相互联合建设,试问如何在这三个小 镇合理分摊这笔建设费?
条件(2)称为“集体合理性”条件(Group Rationality),
表示对于一个博弈解,所有局中人分配得失之和应等于所
有局中人联合起来形成一个大联盟时得到的收益值,也就
是这局博弈中的最大收益值V(N)。
由超可加性
满足上述两种条件的X=(x1……xn)称为“合理分 配”,即有
I(V ) X R nxi V ({ i} ),nxi V (N ), i N
二、多人结盟博弈的基本概念
多人结盟博弈:局中人多于二人时的博弈称为 多人博弈。这种博弈中如果局中人可以和其它 局中人联合成一体统一行动与其它局中人对抗, 这种博弈称为多人结盟博弈。
这种博弈有三个基本要素: – 局中人N={1,2,…,n}; – 结盟S; – 特征函数V(S)。
一般可用<N,V>表示一个多人结盟博弈。
第五章 多人合作博弈模型
一、问题引入 二、多人结盟博弈的基本概念 三、多人结盟博弈的解 四、常用解法
一、问题引入
例1 :(爵士乐队博弈,A Jazz Band Gounce)
一位歌手(S),一位钢琴家(P)和一位鼓手(D) 组成一个小乐队在俱乐部同台演出能得到演出费1000元, 若歌手和钢琴家一起演出能得800元。而只有钢琴家和 鼓手一起演出能得到650元,钢琴独奏表演能得300元, 钢琴家没有其它收入。然而,歌手和鼓手在地铁中表演 能挣500元,歌手独奏可以从The Terasses 挣200元, 而鼓手单独什么也挣不到。
例2:(产品博弈A Production Game)
生从产M11个、单M2位、的M某3、种M产4四品种,原这材个料产中品各的取价一格个要单比位它能的 原材料成本高出1000元,现有三个人,他们拥有这 四种材料情况如下表:
原材料
人
M1
M2
M3
M4
1
1/2
1/2
0
0
2
1/2
0
1
0
3
0
1/2
0
1
问:若这三人联合起来生产这种产品,他们之间该 如何分配所得利润?
B 0
110
三、多人结盟博弈的解
多人结盟博弈的解的概念
多人结盟博弈中,每个局中人都希望 通过结盟的形式去得到更多,而博弈解 的问题是如何合理确定这局博弈中每个 局中人的分配收益,博弈解一般用
X=(x1, x2 ,… xn ) 表局示中n人个之局所中得人。的得失向量,xi 表示第i个
1、合理分配(Imputation)
三个城镇A,B,C欲与附近的一座电站连
接起来,其可能的线路及其成本如下网络图表 示:
100
AA
30
电站
50
C
140
BB
20
这三个镇可相互联合建设,试问如何在这三个 小镇合理分摊这笔建设费?
这个问题的合作博弈对<N,C>,N={A,B,C},成本 分摊博弈的特征函数V(S)为成本节省,如下表:
S {A} {B} {C} {A,B} {A,C} {B,C} {A,B,C}
将此问题转化为三人博弈,其特征函数如下:
S
V(S) 0
{1} {2} {3} {1,2} {1,3} {2,3} 0 0 0 0 0 500
{1,2,3} 1000
局中人2,3,通过合作生产,但由于他们 共有四种原材料只能生产1/2个单位产品,所以 能挣500元。
例3:成本分摊问题(A Cost Game)
(2)超可加性
若一个多人博弈的特征函数具有下列性质,即
对任意结盟S,T N源自文库S∩T= ,满足
V(S∪T)≥V(S)+V(T).
称这个多人博弈具有超可加性。
如果特征函数不满足超可加性,博弈中的结盟 是不稳定的。
例1 :(爵士乐队博弈,A Jazz Band Gounce)
一位歌手(S),一位钢琴家(P)和一位鼓手 (D)组成一个小乐队在俱乐部同台演出能得到 演出费1000元,若歌手和钢琴家一起演出能得 800元。而只有钢琴家和鼓手一起演出能得到 650元,钢琴独奏表演能得300元,钢琴家没有 其它收入。然而,歌手和鼓手在地铁中表演能挣 500元,歌手独奏可以从The Terasses 挣200元, 而鼓手单独什么也挣不到。
问题:如何在这三人爵士乐队中合理分配共同 演出费1000元?
这个问题可归为一个三人合作博弈,它 的特征函数V(S)为:
结盟S {S,P,D} {S,P} {S, D} {P,D} {S} {P} {D} V(S) 1000 800 500 650 200 300 0
很容易验证此博弈是具有超可加性的。
作为一个博弈的解X,即在博弈中对N个局中人得失的合 理分配,至少应满足两个条件:
(1) xi V ({i}) n
(2) xi V (N )
i N(个人合理性)
i N(集体合理性)
条件(i11)称为:“个人合理性”(Individual Rationality),
表示局中人i所分配值xi不小于特征函数中规定他至少能得 到的值V(i)。
i 1
显然,作为多人结盟博弈的一个解X,至少必须 是一个合理分配,即 X I(V )
1、局中人与结盟
(1) N={1,2,…,n}表示局中人集合。 (2)结盟S,表示一个联盟,即一局多人对
策中,一部份局中人联合成一体像一 个“局中人”一样选择策略,这种联合 称为结盟。显然结盟S是局中人集合N 的子集,SN。 (3)2n是局中人可能形成结盟的个数。
2、特征函数 V(S)
(1)V(S)表示当若干局中人联合成一个结盟S时,在 这局博弈中能获得的最大收益值,即当形成结盟S,只 要S内每一个局中人共同策略,选择相应策略结盟S 能保证获得,而与联盟外局人采用什么策略无关。若
C(S) 0 100 140 130 150 130 160 150 V(S) 0 0 0 0 90 100 110 220
博弈<W,V>的特征函数值V(S),由下式得出
V (S) C(i) C(S) iS
S 2N
150
A
B
100 150 140
C
160
130
130
90
A 0
220
100
C 0
问题:如何在这三人爵士乐队中合理分配共同演出费 1000元?
例2: 成本分摊问题(A Cost Game)
三个城镇A,B,C欲与附近的一座电站连接起 来,其可能的线路及其成本如下网络图表示:
100
AA
30
电站
50
CC
140
B
20
这三个镇可相互联合建设,试问如何在这三个小 镇合理分摊这笔建设费?
条件(2)称为“集体合理性”条件(Group Rationality),
表示对于一个博弈解,所有局中人分配得失之和应等于所
有局中人联合起来形成一个大联盟时得到的收益值,也就
是这局博弈中的最大收益值V(N)。
由超可加性
满足上述两种条件的X=(x1……xn)称为“合理分 配”,即有
I(V ) X R nxi V ({ i} ),nxi V (N ), i N
二、多人结盟博弈的基本概念
多人结盟博弈:局中人多于二人时的博弈称为 多人博弈。这种博弈中如果局中人可以和其它 局中人联合成一体统一行动与其它局中人对抗, 这种博弈称为多人结盟博弈。
这种博弈有三个基本要素: – 局中人N={1,2,…,n}; – 结盟S; – 特征函数V(S)。
一般可用<N,V>表示一个多人结盟博弈。
第五章 多人合作博弈模型
一、问题引入 二、多人结盟博弈的基本概念 三、多人结盟博弈的解 四、常用解法
一、问题引入
例1 :(爵士乐队博弈,A Jazz Band Gounce)
一位歌手(S),一位钢琴家(P)和一位鼓手(D) 组成一个小乐队在俱乐部同台演出能得到演出费1000元, 若歌手和钢琴家一起演出能得800元。而只有钢琴家和 鼓手一起演出能得到650元,钢琴独奏表演能得300元, 钢琴家没有其它收入。然而,歌手和鼓手在地铁中表演 能挣500元,歌手独奏可以从The Terasses 挣200元, 而鼓手单独什么也挣不到。
例2:(产品博弈A Production Game)
生从产M11个、单M2位、的M某3、种M产4四品种,原这材个料产中品各的取价一格个要单比位它能的 原材料成本高出1000元,现有三个人,他们拥有这 四种材料情况如下表:
原材料
人
M1
M2
M3
M4
1
1/2
1/2
0
0
2
1/2
0
1
0
3
0
1/2
0
1
问:若这三人联合起来生产这种产品,他们之间该 如何分配所得利润?
B 0
110
三、多人结盟博弈的解
多人结盟博弈的解的概念
多人结盟博弈中,每个局中人都希望 通过结盟的形式去得到更多,而博弈解 的问题是如何合理确定这局博弈中每个 局中人的分配收益,博弈解一般用
X=(x1, x2 ,… xn ) 表局示中n人个之局所中得人。的得失向量,xi 表示第i个
1、合理分配(Imputation)
三个城镇A,B,C欲与附近的一座电站连
接起来,其可能的线路及其成本如下网络图表 示:
100
AA
30
电站
50
C
140
BB
20
这三个镇可相互联合建设,试问如何在这三个 小镇合理分摊这笔建设费?
这个问题的合作博弈对<N,C>,N={A,B,C},成本 分摊博弈的特征函数V(S)为成本节省,如下表:
S {A} {B} {C} {A,B} {A,C} {B,C} {A,B,C}
将此问题转化为三人博弈,其特征函数如下:
S
V(S) 0
{1} {2} {3} {1,2} {1,3} {2,3} 0 0 0 0 0 500
{1,2,3} 1000
局中人2,3,通过合作生产,但由于他们 共有四种原材料只能生产1/2个单位产品,所以 能挣500元。
例3:成本分摊问题(A Cost Game)