合作博弈四川大学
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
则 S 和 N \ S 进行的二人零和 博弈支付矩阵如右所示:
联盟N\S={3} AB
可得矩阵博弈的值,即联盟 S的所得为
v ({1, 2}) 3
A A 2 -2
联盟S={1, A B 2
1
2}
BA 3
2
BB 4 3
2010-3-3
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#4›
§5.1.2 联盟与特征函数
※ 联盟的定义 ※ 可转移效用(TU) ※ 特征函数的定义 ※ 特征函数的确定
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#5›
联盟的定义
定义5.1.1 设博弈的局中人集合为 N {1,2, , n},则任意S N,称S为N
(5.1.2)
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#7›
纳什谈判的例子
• 很显然,这时可达结果集为: U {(x1, x2, x3) | x1 x2 x3 300, xi 0,i 1, 2,3}
• 而三个人所得的最低水平为0,即:初始参考点是 (d1,d2,d3) (0,0,0) • 应用(5.1.1)式,容易得: (u1,u2,u3) (x1, x2, x3) (100,100,100) • 在这一博弈中,三人都采用了同样的策略 y1* y2* y3* (100,100,100) • 显然,作为理性的局中人,它的策略中不会使自己的收益小于
人 i 的混合策略集合为 Xi ,收益函数为 Pi ,可以由多种方法
从策略式博弈推导出特征函数。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹2#1›
特征函数的确定
第一种方法: -特征函数和 -特征函数。
• 在G [N,{Xi},{Pi}]中(给定N 的子集,即联 S ), -特征函数
定义为:
解 (u,v ) 。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#5›
n人纳什谈判解的决定
设 N {1, 2, , n} 是局中人的集合,U Rn 是n人经过谈
判进行合作的可达结果集。当允许采用抽彩方法对结果分配时, 结果集是一个凸集。
令 (d1, d2, , dn )是谈判达不成协议的支付分配(或n个局中 人的保守收益),作为谈判的初始参考点。将纳什公理化体系扩
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#3›
合作博弈与非合作博弈区分的 两个假设条件
作为合作博弈与非合作博弈的相区分的主要两个假设条件如下: (1) 合作博弈中允许局中人在博弈前进行谈判;而非合作博弈不允
许。 (2) 合作博弈中一旦达成协议,形成一个联盟,则协议有了强制约
束力,因而联盟的一系列行动被局中人所承认;在非合作博弈 中也有一定的博弈前沟通,如“相关均衡”,但它不具有强制 的约束力,只能用利益进行诱导或激励。 在多人合作博弈中,联盟具有核心重要的作用。
‹#6›
纳什谈判的例子
例5.1.1
设有三个人参与分配300元,若第个人分得 xi ,则它的效用 为 ui xi ,i 1, 2,3,三个人提出的分配方案分别为 y1, y2, y3 R3 , 则当三个人方案一致时有收益,否则收益为零,用收益函数表达
为:
ui
(
y1 ,
y2
,
y3
)
xi 0
当 y1 y2 y3 (x1, x2 , x3 ) 当 yi y j , i j, i, j 1, 2, 3
• 此后局中人2又可以和{1,3}中一个局中人,如局中人3谈判,提 出分配方案 y2'' y3'' (0,130,170) ,这种过程可以一直进行下去。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#2›
纳什谈判的例子
对这一谈判过程的终止可以有两种规定: • 一是规定局中人通过一轮谈判后形成一个协议,按照协议规
为 {A, B} ,其收益函数如右表 所示:
ABA 策略组
合 ABB BAA
(4,-2,2) (0,1,1) (1,2,-1)
B A B (2,0,-1)
B B A (3,1,-1)
B B B (2,1,-1)
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹2#3›
特征函数的确定
设局中人1,2组成联盟 N \ S {3}
《博弈论及其应用》 (汪贤裕)
‹1#9›
特征函数的确定
方法一 若联盟S的成立可以获得独立于联盟S之外成交行为的收益,
值 v(S) 表示此时联盟可获得的最大机会收益。
• 在例5.1.1中 N {1,2,3},v(N) 300, v() v({1}) v({2}) v({3}) v({1,2}) v({1,3}) v({2,3}) 0
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#0›
纳什谈判的例子
例5.1.3
类同例5.1.1 。但该博弈规定,如果有两个局中人提出相同 的分配策略时,则每人按这一策略进行支付,否则每个局中人的 支付都为0。其收益函数可以表达为:
ui
(
y1
,
y2
,
y3
)
xi 0
若 若
y j yk (x1, x2, x3), j k, j, k 1, 2,3 y j yk , j k, j, k 1, 2,3
‹#2›
§5.1 基本概念
§5.1.1 纳什谈判解与联盟 §5.1.2 联盟与特征函数 §5.1.3 特征函数的性质 §5.1.4 合作博弈中的解概念
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#3›
§5.1.1 纳什谈判解与联盟
※ 2人纳什谈判解的决定 ※ n人纳什谈判解的决定 ※ 纳什谈判的例子 ※ 合作博弈与非合作博弈区分的两个假设条件
的对立面,以保证自己的保守收益。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹2#2›
特征函数的确定
例5.1.4 设有一个非合作博弈 G [N,{Xi},{Pi}] 其中 N {1, 2,3(P1,P2,
123
P3)
A A A (1,1,0)
A A B (-3,1,2)
移效用下合作博弈,记为 G [N,v] 。它称为特征函数式博弈 (characteristic function form)或联盟式博弈(coalitional form)。 • 在可转移效用下合作博弈,我们着重研究联盟中的收益分配问题。 由于本章不涉及到不可转移效用,因此下面简称合作博弈。
2010-3-3
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#4›
2人纳什谈判解的决定
在2人纳什谈判解(s,u*, v*)讨论中,S R2 是二人经过谈判
后可能达到的结果集。(u*, v*)是谈判的初始参考点,经过纳什公理 化体系,通过求解 max (u u* )(v v* ) ,可以得到一对谈判
(u ,v)S
v({1}) v({2}) v({3}) v() 0
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹2#0›
特征函数的确定
方法二 联盟S的成立可以获得受到独立于联盟S之外局中人的影响和
阻扰下的最好收益。 下面我们从策略式博弈到特征函数式博弈的转换加以说明。 若给定一个策略形的非合作博弈 G [N,{Xi},{Pi}] ,其中局中
• 在例5.1.2中 N {1, 2,3}, v(N) v({1, 2}) 300,
v({2,3}) v({1,3}) v({1}) v({2}) v() 0
• 在例5.1.3中 N {1, 2,3},v(N) v({1, 2}) v({2,3}) v({1,3}) 300,
可在转移效用(TU)的合作博弈中,联盟S的一个收益 v(S) 表示它加入大联盟进行博弈的机会收益,或联盟 S 独立活动 可获得的最大收益。这是进行合作博弈首先应确立的。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#7›
特征函数的定义
定义5.1.2
设博弈的局中人集合为 N {1,2, ,n} ,v(S) 是定义在N的一切 子集(即联盟)上的实值函数,其满足:
定,每个局中人进行再谈判不能与以前的谈判相违背。可以 看到,在三人博弈中,先行谈判的局中人具有先动优势。 • 二是规定谈判的次数的顺序。如规定谈判的顺序是先由{1, 2}谈判,其次由{2,3}谈判。第3由{1,3}谈判,最后{1,2, 3}谈判,这时局中人1和局中人3,即{1,3}谈判具有后动的优 势。
大到n人,则有n人纳什谈判解的唯一结果 (d1, d2, , dn) 。 一般 情况下,它由下式决定:
max(u1 d1)(u2 d2 ) (un dn )
s.t ui di , i 1, 2, , n
(5.1.1)
(u1,u2, ,un ) U
2010-3-3
《博弈论及其应用》 (汪贤裕)
• 在例5.1.2博弈中,局中人1和局中人2可以联合起来对支付的分 配策略进行选择,而局中人3的任何策略都无法干预分配方案。 因而,可以合理地认为该博弈仅在局中人1和局中人2两人之间进 行分配讨论。若局中人1和局中人2采用二人合作博弈的纳什谈判 解。则其结果将是(150,150,0)。
• 在n人谈判问题中,若出现联盟,则可能发生实质性的变化。
博弈论及其应用 第5章 合作博弈
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#›
第5章 合作博弈
• 主要内容:
§ 5.1 基本概念 § 5.2 占优方法:合作博弈一类解概念 § 5.3 估值方法:合作博弈的一类解概念 § 5.4 合作博弈的应用范例
2010-3-3
《博弈论及其应用》 (汪贤裕)
的一个联盟(coalition)。 特殊情况,允许取 S 和 S N ,后一种情况称为一个
大联盟。
若 N n ,则 N 中联盟个数为 Cn0 Cn1 Cnn 2n 。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#6›
可转移效用(TU)
若联盟S中局中人的收益可以自由地分配,且任何局中人 的收益变化1个单位,它的效用也变化1个单位,我们称为可转 移效用(TU)(transformable utility),也称有旁支付的 (with side-payments)。本章仅对可转移效用情况进行讨论。
v
(S)
max
xX S
min
yX N\S
iS
Ei (x,
y)
(5.1.6)
• 其中x Xs Xi , y X N /S Xi 为在混合策略 (x, y) 情况下,局
iS
iN \S
中人 i 的期望收益 Ei。
• -特征函数是把局中人集合划分为两个联盟 S 和 N \ S 这两个联
盟进行一种二人零和博弈。联盟 S 将联盟 N \ S 看成利益完全冲突
(1)
v() 0
(5.1.4)
(2)
v(N) v({i}) iN
(5.1.5)
称 v(s) 为一个特征函数(characteristic function),或联
盟函数(coalitional function)。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#8›
特征函数的定义
• 给定局中人集合和特征函数 v(S) ,所进行的合作博弈称为可转
ui
(
y1,
y2
,
y3
)
xi
0
若 若
y1 y2 (x1, x2 , x3 ) y1 y2
• 这时的可达结果结仍为:
(5.1.3)
U {(x1, x2, x3) | x1 x2 x3 300, xi 0,i 1, 2,3}
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#9›
纳什谈判的例子
100元,而他若使自己的收益高于100元,则不会使其他人得到 认同。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#8›
纳什谈判的例子
例5.1.2
类同例5.1.1,但规定只有当局中人1和局中人2提出的分配
策略不同时,各局中人的收益所得为0;若局中人1和局中人2提
出的分配策略相同时,即 y1 y2 ,则按这一分配向各局中人支 付,其收益函数可表达为:
• 这时的可达结果集仍为:
U {(x1, x2, x3) | x1 x2 x3 300, xi 0,i 1, 2,3}
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#1›
纳什谈判的例子
• 在例5.1.3的博弈中,情况就非常复杂了。若局中人1和局中人2 谈判分配方案为 y1 y2 (150,150,0) ,局中人3可以和其中一个局 中人再谈判.如与局中人1再谈判,提出分配方案 y1' y3' (175,0,125)
联盟N\S={3} AB
可得矩阵博弈的值,即联盟 S的所得为
v ({1, 2}) 3
A A 2 -2
联盟S={1, A B 2
1
2}
BA 3
2
BB 4 3
2010-3-3
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#4›
§5.1.2 联盟与特征函数
※ 联盟的定义 ※ 可转移效用(TU) ※ 特征函数的定义 ※ 特征函数的确定
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#5›
联盟的定义
定义5.1.1 设博弈的局中人集合为 N {1,2, , n},则任意S N,称S为N
(5.1.2)
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#7›
纳什谈判的例子
• 很显然,这时可达结果集为: U {(x1, x2, x3) | x1 x2 x3 300, xi 0,i 1, 2,3}
• 而三个人所得的最低水平为0,即:初始参考点是 (d1,d2,d3) (0,0,0) • 应用(5.1.1)式,容易得: (u1,u2,u3) (x1, x2, x3) (100,100,100) • 在这一博弈中,三人都采用了同样的策略 y1* y2* y3* (100,100,100) • 显然,作为理性的局中人,它的策略中不会使自己的收益小于
人 i 的混合策略集合为 Xi ,收益函数为 Pi ,可以由多种方法
从策略式博弈推导出特征函数。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹2#1›
特征函数的确定
第一种方法: -特征函数和 -特征函数。
• 在G [N,{Xi},{Pi}]中(给定N 的子集,即联 S ), -特征函数
定义为:
解 (u,v ) 。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#5›
n人纳什谈判解的决定
设 N {1, 2, , n} 是局中人的集合,U Rn 是n人经过谈
判进行合作的可达结果集。当允许采用抽彩方法对结果分配时, 结果集是一个凸集。
令 (d1, d2, , dn )是谈判达不成协议的支付分配(或n个局中 人的保守收益),作为谈判的初始参考点。将纳什公理化体系扩
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#3›
合作博弈与非合作博弈区分的 两个假设条件
作为合作博弈与非合作博弈的相区分的主要两个假设条件如下: (1) 合作博弈中允许局中人在博弈前进行谈判;而非合作博弈不允
许。 (2) 合作博弈中一旦达成协议,形成一个联盟,则协议有了强制约
束力,因而联盟的一系列行动被局中人所承认;在非合作博弈 中也有一定的博弈前沟通,如“相关均衡”,但它不具有强制 的约束力,只能用利益进行诱导或激励。 在多人合作博弈中,联盟具有核心重要的作用。
‹#6›
纳什谈判的例子
例5.1.1
设有三个人参与分配300元,若第个人分得 xi ,则它的效用 为 ui xi ,i 1, 2,3,三个人提出的分配方案分别为 y1, y2, y3 R3 , 则当三个人方案一致时有收益,否则收益为零,用收益函数表达
为:
ui
(
y1 ,
y2
,
y3
)
xi 0
当 y1 y2 y3 (x1, x2 , x3 ) 当 yi y j , i j, i, j 1, 2, 3
• 此后局中人2又可以和{1,3}中一个局中人,如局中人3谈判,提 出分配方案 y2'' y3'' (0,130,170) ,这种过程可以一直进行下去。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#2›
纳什谈判的例子
对这一谈判过程的终止可以有两种规定: • 一是规定局中人通过一轮谈判后形成一个协议,按照协议规
为 {A, B} ,其收益函数如右表 所示:
ABA 策略组
合 ABB BAA
(4,-2,2) (0,1,1) (1,2,-1)
B A B (2,0,-1)
B B A (3,1,-1)
B B B (2,1,-1)
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹2#3›
特征函数的确定
设局中人1,2组成联盟 N \ S {3}
《博弈论及其应用》 (汪贤裕)
‹1#9›
特征函数的确定
方法一 若联盟S的成立可以获得独立于联盟S之外成交行为的收益,
值 v(S) 表示此时联盟可获得的最大机会收益。
• 在例5.1.1中 N {1,2,3},v(N) 300, v() v({1}) v({2}) v({3}) v({1,2}) v({1,3}) v({2,3}) 0
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#0›
纳什谈判的例子
例5.1.3
类同例5.1.1 。但该博弈规定,如果有两个局中人提出相同 的分配策略时,则每人按这一策略进行支付,否则每个局中人的 支付都为0。其收益函数可以表达为:
ui
(
y1
,
y2
,
y3
)
xi 0
若 若
y j yk (x1, x2, x3), j k, j, k 1, 2,3 y j yk , j k, j, k 1, 2,3
‹#2›
§5.1 基本概念
§5.1.1 纳什谈判解与联盟 §5.1.2 联盟与特征函数 §5.1.3 特征函数的性质 §5.1.4 合作博弈中的解概念
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#3›
§5.1.1 纳什谈判解与联盟
※ 2人纳什谈判解的决定 ※ n人纳什谈判解的决定 ※ 纳什谈判的例子 ※ 合作博弈与非合作博弈区分的两个假设条件
的对立面,以保证自己的保守收益。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹2#2›
特征函数的确定
例5.1.4 设有一个非合作博弈 G [N,{Xi},{Pi}] 其中 N {1, 2,3(P1,P2,
123
P3)
A A A (1,1,0)
A A B (-3,1,2)
移效用下合作博弈,记为 G [N,v] 。它称为特征函数式博弈 (characteristic function form)或联盟式博弈(coalitional form)。 • 在可转移效用下合作博弈,我们着重研究联盟中的收益分配问题。 由于本章不涉及到不可转移效用,因此下面简称合作博弈。
2010-3-3
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#4›
2人纳什谈判解的决定
在2人纳什谈判解(s,u*, v*)讨论中,S R2 是二人经过谈判
后可能达到的结果集。(u*, v*)是谈判的初始参考点,经过纳什公理 化体系,通过求解 max (u u* )(v v* ) ,可以得到一对谈判
(u ,v)S
v({1}) v({2}) v({3}) v() 0
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹2#0›
特征函数的确定
方法二 联盟S的成立可以获得受到独立于联盟S之外局中人的影响和
阻扰下的最好收益。 下面我们从策略式博弈到特征函数式博弈的转换加以说明。 若给定一个策略形的非合作博弈 G [N,{Xi},{Pi}] ,其中局中
• 在例5.1.2中 N {1, 2,3}, v(N) v({1, 2}) 300,
v({2,3}) v({1,3}) v({1}) v({2}) v() 0
• 在例5.1.3中 N {1, 2,3},v(N) v({1, 2}) v({2,3}) v({1,3}) 300,
可在转移效用(TU)的合作博弈中,联盟S的一个收益 v(S) 表示它加入大联盟进行博弈的机会收益,或联盟 S 独立活动 可获得的最大收益。这是进行合作博弈首先应确立的。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#7›
特征函数的定义
定义5.1.2
设博弈的局中人集合为 N {1,2, ,n} ,v(S) 是定义在N的一切 子集(即联盟)上的实值函数,其满足:
定,每个局中人进行再谈判不能与以前的谈判相违背。可以 看到,在三人博弈中,先行谈判的局中人具有先动优势。 • 二是规定谈判的次数的顺序。如规定谈判的顺序是先由{1, 2}谈判,其次由{2,3}谈判。第3由{1,3}谈判,最后{1,2, 3}谈判,这时局中人1和局中人3,即{1,3}谈判具有后动的优 势。
大到n人,则有n人纳什谈判解的唯一结果 (d1, d2, , dn) 。 一般 情况下,它由下式决定:
max(u1 d1)(u2 d2 ) (un dn )
s.t ui di , i 1, 2, , n
(5.1.1)
(u1,u2, ,un ) U
2010-3-3
《博弈论及其应用》 (汪贤裕)
• 在例5.1.2博弈中,局中人1和局中人2可以联合起来对支付的分 配策略进行选择,而局中人3的任何策略都无法干预分配方案。 因而,可以合理地认为该博弈仅在局中人1和局中人2两人之间进 行分配讨论。若局中人1和局中人2采用二人合作博弈的纳什谈判 解。则其结果将是(150,150,0)。
• 在n人谈判问题中,若出现联盟,则可能发生实质性的变化。
博弈论及其应用 第5章 合作博弈
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#›
第5章 合作博弈
• 主要内容:
§ 5.1 基本概念 § 5.2 占优方法:合作博弈一类解概念 § 5.3 估值方法:合作博弈的一类解概念 § 5.4 合作博弈的应用范例
2010-3-3
《博弈论及其应用》 (汪贤裕)
的一个联盟(coalition)。 特殊情况,允许取 S 和 S N ,后一种情况称为一个
大联盟。
若 N n ,则 N 中联盟个数为 Cn0 Cn1 Cnn 2n 。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#6›
可转移效用(TU)
若联盟S中局中人的收益可以自由地分配,且任何局中人 的收益变化1个单位,它的效用也变化1个单位,我们称为可转 移效用(TU)(transformable utility),也称有旁支付的 (with side-payments)。本章仅对可转移效用情况进行讨论。
v
(S)
max
xX S
min
yX N\S
iS
Ei (x,
y)
(5.1.6)
• 其中x Xs Xi , y X N /S Xi 为在混合策略 (x, y) 情况下,局
iS
iN \S
中人 i 的期望收益 Ei。
• -特征函数是把局中人集合划分为两个联盟 S 和 N \ S 这两个联
盟进行一种二人零和博弈。联盟 S 将联盟 N \ S 看成利益完全冲突
(1)
v() 0
(5.1.4)
(2)
v(N) v({i}) iN
(5.1.5)
称 v(s) 为一个特征函数(characteristic function),或联
盟函数(coalitional function)。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#8›
特征函数的定义
• 给定局中人集合和特征函数 v(S) ,所进行的合作博弈称为可转
ui
(
y1,
y2
,
y3
)
xi
0
若 若
y1 y2 (x1, x2 , x3 ) y1 y2
• 这时的可达结果结仍为:
(5.1.3)
U {(x1, x2, x3) | x1 x2 x3 300, xi 0,i 1, 2,3}
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#9›
纳什谈判的例子
100元,而他若使自己的收益高于100元,则不会使其他人得到 认同。
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹#8›
纳什谈判的例子
例5.1.2
类同例5.1.1,但规定只有当局中人1和局中人2提出的分配
策略不同时,各局中人的收益所得为0;若局中人1和局中人2提
出的分配策略相同时,即 y1 y2 ,则按这一分配向各局中人支 付,其收益函数可表达为:
• 这时的可达结果集仍为:
U {(x1, x2, x3) | x1 x2 x3 300, xi 0,i 1, 2,3}
2010-3-3
《博弈论及其应用》 (汪贤裕)
‹1#1›
纳什谈判的例子
• 在例5.1.3的博弈中,情况就非常复杂了。若局中人1和局中人2 谈判分配方案为 y1 y2 (150,150,0) ,局中人3可以和其中一个局 中人再谈判.如与局中人1再谈判,提出分配方案 y1' y3' (175,0,125)