第五章 合作博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
90
A 100
130
150
B 140
160
A 0
100
220
B 0
110
C 130
C 0
三、多人结盟博弈的解
多人结盟博弈的解的概念
多人结盟博弈中,每个局中人都希望 通过结盟的形式去得到更多,而博弈解 的问题是如何合理确定这局博弈中每个 局中人的分配收益,博弈解一般用 X=(x1, x2 ,… xn ) 表示n个局中人的得失向量,xi 表示第i个 局中人之所得。
例2:(产品博弈A Production Game)
从M1、M2、M3、M4四种原材料中各取一个单位能 生产1个单位的某种产品,这个产品的价格要比它的 原材料成本高出1000元,现有三个人,他们拥有这 四种材料情况如下表:
原材料 人
M1
1/2
1/2 0
M2
1/2
0 1/2
M3
0
1 0
M4
0
0 1
1
例1 :(爵士乐队博弈,A Jazz Band Gounce)
一位歌手(S),一位钢琴家(P)和一位鼓手 (D)组成一个小乐队在俱乐部同台演出能得到 演出费1000元,若歌手和钢琴家一起演出能得 800元。而只有钢琴家和鼓手一起演出能得到 650元,钢琴独奏表演能得300元,钢琴家没有 其它收入。然而,歌手和鼓手在地铁中表演能挣 500元,歌手独奏可以从The Terasses 挣200元, 而鼓手单独什么也挣不到。
问题:如何在这三人爵士乐队中合理分配共同演出费
1000元?
例2: 成本分摊问题(A Cost Game)
三个城镇A,B,C欲与附近的一座电站连接起 来,其可能的线路及其成本如下网络图表示:
100
A A
50
30
电站 140
C C
20
B
这三个镇可相互联合建设,试问如何在这三个小 镇合理分摊这笔建设费?
二、多人结盟博弈的基本概念
多人结盟博弈:局中人多于二人时的博弈称为 多人博弈。这种博弈中如果局中人可以和其它 局中人联合成一体统一行动与其它局中人对抗, 这种博弈称为多人结盟博弈。 这种博弈有三个基本要素: – 局中人N={1,2,…,n}; – 结盟S; – 特征函数V(S)。 一般可用<N,V>表示一个多人结盟博弈。
2 3
问:若这三人联合起来生产这种产品,他们之间该 如何分配所得利润?
将此问题转化为三人博弈,其特征函数如下:
S V(S)
0
{1} 0
{2} 0
{3} {1,2} {1,3} {2,3} 0 0 0 500
{1,2,3} 1000
局中人2,3,通过合作生产,但由于他们 共有四种原材料只能生产1/2个单位产品,所以 能挣500元。
满足上述两种条件的X=(x1……xn)称为“合理分
配”,即有
n n I (V ) X R xi V ({i}), xi V ( N ), i N i 1
问题:如何在这三人爵士乐队中合理分配共同
演出费1000元?
这个问题可归为一个三人合作博弈,它 的特征函数V(S)为:
结盟S {S,P,D} {S,P} V(S) 1000 800 {S, D} 500 {P,D} 650 {S} 200 {P} 300 {D} 0
很容易验证此博弈是具有超可加性的。
第五章 多人合作博弈模型
一、问题引入 二、多人结盟博弈的基本概念 三、多人结盟博弈的解 四、常用解法
一、问题引入
例1 :(爵士乐队博弈,A Fra Baidu bibliotekazz Band Gounce)
一位歌手(S),一位钢琴家(P)和一位鼓手(D) 组成一个小乐队在俱乐部同台演出能得到演出费1000元, 若歌手和钢琴家一起演出能得800元。而只有钢琴家和 鼓手一起演出能得到650元,钢琴独奏表演能得300元, 钢琴家没有其它收入。然而,歌手和鼓手在地铁中表演 能挣500元,歌手独奏可以从The Terasses 挣200元, 而鼓手单独什么也挣不到。
1、合理分配(Imputation)
作为一个博弈的解X,即在博弈中对N个局中人得失的合 理分配,至少应满足两个条件:
(1) x i V ({i }) ( 2) x i V ( N )
i 1 n
iN (个人合理性)
i N(集体合理性)
条件(1)称为:“个人合理性”(Individual Rationality), 表示局中人i所分配值xi不小于特征函数中规定他至少能得 到的值V(i)。 条件(2)称为“集体合理性”条件(Group Rationality), 表示对于一个博弈解,所有局中人分配得失之和应等于所 有局中人联合起来形成一个大联盟时得到的收益值,也就 是这局博弈中的最大收益值V(N)。 由超可加性
例3:成本分摊问题(A Cost Game)
三个城镇A,B,C欲与附近的一座电站连 接起来,其可能的线路及其成本如下网络图表 示:
100
A A
50
30
电站 140
C
20
B B
这三个镇可相互联合建设,试问如何在这三个 小镇合理分摊这笔建设费?
这个问题的合作博弈对<N,C>,N={A,B,C},成本 分摊博弈的特征函数V(S)为成本节省,如下表:
1、局中人与结盟
(1) N={1,2,…,n}表示局中人集合。 (2)结盟S,表示一个联盟,即一局多人对 策中,一部份局中人联合成一体像一 个“局中人”一样选择策略,这种联合 称为结盟。显然结盟S是局中人集合N 的子集,SN。 (3)2n是局中人可能形成结盟的个数。
2、特征函数 V(S)
(1)V(S)表示当若干局中人联合成一个结盟S时,在 这局博弈中能获得的最大收益值,即当形成结盟S,只 要S内每一个局中人共同策略,选择相应策略结盟S 能保证获得,而与联盟外局人采用什么策略无关。若 S=,V()=0。 (2)超可加性 若一个多人博弈的特征函数具有下列性质,即 对任意结盟S,T N,S∩T= ,满足 V(S∪T)≥V(S)+V(T). 称这个多人博弈具有超可加性。 如果特征函数不满足超可加性,博弈中的结盟 是不稳定的。
S
{A} {B} {C} {A,B} {A,C} {B,C} {A,B,C}
0
0
C(S)
V(S)
100 140 130
0 0 0
150
90
130
100
160
110
150
220
博弈<W,V>的特征函数值V(S),由下式得出
V ( S ) C (i ) C ( S )
iS
S 2N
150