合作博弈四川大学

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

则 S 和 N \ S 进行的二人零和博弈支付矩阵如右所示：
联盟N\S={3} AB
可得矩阵博弈的值，即联盟 S的所得为
v ({1, 2}) 3
A A 2 -2
联盟S={1, A B 2
1
2}
BA 3
2
BB 4 3
2010-3-3
2010-3-3
《博弈论及其应用》（汪贤裕）
‹1#4›
§5.1.2 联盟与特征函数
※ 联盟的定义 ※ 可转移效用（TU） ※ 特征函数的定义 ※ 特征函数的确定
2010-3-3
《博弈论及其应用》（汪贤裕）
‹1#5›
联盟的定义
定义5.1.1 设博弈的局中人集合为 N {1,2, , n}，则任意S N，称S为N
(5.1.2)
2010-3-3
《博弈论及其应用》（汪贤裕）
‹#7›
纳什谈判的例子
• 很显然，这时可达结果集为： U {(x1, x2, x3) | x1 x2 x3 300, xi 0,i 1, 2,3}
• 而三个人所得的最低水平为0，即：初始参考点是 (d1,d2,d3) (0,0,0) • 应用（5.1.1）式，容易得： (u1,u2,u3) (x1, x2, x3) (100,100,100) • 在这一博弈中，三人都采用了同样的策略 y1* y2* y3* (100,100,100) • 显然，作为理性的局中人，它的策略中不会使自己的收益小于
人 i 的混合策略集合为 Xi ，收益函数为 Pi ，可以由多种方法
从策略式博弈推导出特征函数。
2010-3-3
《博弈论及其应用》（汪贤裕）
‹2#1›
特征函数的确定
第一种方法： -特征函数和 -特征函数。
• 在G [N,{Xi},{Pi}]中（给定N 的子集，即联 S ）, －特征函数
定义为：
解 (u,v ) 。
2010-3-3
《博弈论及其应用》（汪贤裕）
‹#5›
n人纳什谈判解的决定
设 N {1, 2, , n} 是局中人的集合，U Rn 是n人经过谈
判进行合作的可达结果集。当允许采用抽彩方法对结果分配时，结果集是一个凸集。
令 (d1, d2, , dn )是谈判达不成协议的支付分配（或n个局中人的保守收益），作为谈判的初始参考点。将纳什公理化体系扩
2010-3-3
《博弈论及其应用》（汪贤裕）
‹1#3›
合作博弈与非合作博弈区分的两个假设条件
作为合作博弈与非合作博弈的相区分的主要两个假设条件如下： (1) 合作博弈中允许局中人在博弈前进行谈判；而非合作博弈不允
许。 (2) 合作博弈中一旦达成协议，形成一个联盟，则协议有了强制约
束力，因而联盟的一系列行动被局中人所承认；在非合作博弈中也有一定的博弈前沟通，如“相关均衡”，但它不具有强制的约束力，只能用利益进行诱导或激励。在多人合作博弈中，联盟具有核心重要的作用。
‹#6›
纳什谈判的例子
例5.1.1
设有三个人参与分配300元，若第个人分得 xi ，则它的效用为 ui xi ,i 1, 2,3，三个人提出的分配方案分别为 y1, y2, y3 R3 ，则当三个人方案一致时有收益，否则收益为零，用收益函数表达
为：
ui
(
y1 ,
y2
,
y3
)
xi 0
当 y1 y2 y3 (x1, x2 , x3 ) 当 yi y j , i j, i, j 1, 2, 3
• 此后局中人2又可以和{1，3}中一个局中人，如局中人3谈判，提出分配方案 y2'' y3'' (0,130,170) ，这种过程可以一直进行下去。
2010-3-3
《博弈论及其应用》（汪贤裕）
‹1#2›
纳什谈判的例子
对这一谈判过程的终止可以有两种规定： • 一是规定局中人通过一轮谈判后形成一个协议，按照协议规
为 {A, B} ，其收益函数如右表所示：
ABA 策略组
合 ABB BAA
(4,-2,2) (0,1,1) (1,2,-1)
B A B (2,0,-1)
B B A (3,1,-1)
B B B (2,1,-1)
2010-3-3
《博弈论及其应用》（汪贤裕）
‹2#3›
特征函数的确定
设局中人1，2组成联盟 N \ S {3}
《博弈论及其应用》（汪贤裕）
‹1#9›
特征函数的确定
方法一若联盟S的成立可以获得独立于联盟S之外成交行为的收益，
值 v(S) 表示此时联盟可获得的最大机会收益。
• 在例5.1.1中 N {1,2,3},v(N) 300, v() v({1}) v({2}) v({3}) v({1,2}) v({1,3}) v({2,3}) 0
2010-3-3
《博弈论及其应用》（汪贤裕）
‹1#0›
纳什谈判的例子
例5.1.3
类同例5.1.1 。但该博弈规定，如果有两个局中人提出相同的分配策略时，则每人按这一策略进行支付，否则每个局中人的支付都为0。其收益函数可以表达为：
ui
(
y1
,
y2
,
y3
)
xi 0
若若
y j yk (x1, x2, x3), j k, j, k 1, 2,3 y j yk , j k, j, k 1, 2,3
‹#2›
§5.1 基本概念
§5.1.1 纳什谈判解与联盟 §5.1.2 联盟与特征函数 §5.1.3 特征函数的性质 §5.1.4 合作博弈中的解概念
2010-3-3
《博弈论及其应用》（汪贤裕）
‹#3›
§5.1.1 纳什谈判解与联盟
※ 2人纳什谈判解的决定 ※ n人纳什谈判解的决定 ※ 纳什谈判的例子 ※ 合作博弈与非合作博弈区分的两个假设条件
的对立面，以保证自己的保守收益。
2010-3-3
《博弈论及其应用》（汪贤裕）
‹2#2›
特征函数的确定
例5.1.4 设有一个非合作博弈 G [N,{Xi},{Pi}] 其中 N {1, 2,3(P1,P2,
123
P3)
A A A (1,1,0)
A A B (-3,1,2)
移效用下合作博弈，记为 G [N,v] 。它称为特征函数式博弈（characteristic function form）或联盟式博弈（coalitional form）。 • 在可转移效用下合作博弈，我们着重研究联盟中的收益分配问题。由于本章不涉及到不可转移效用，因此下面简称合作博弈。
2010-3-3
2010-3-3
《博弈论及其应用》（汪贤裕）
‹#4›
2人纳什谈判解的决定
在2人纳什谈判解(s,u*, v*)讨论中，S R2 是二人经过谈判
后可能达到的结果集。(u*, v*)是谈判的初始参考点，经过纳什公理化体系，通过求解 max (u u* )(v v* ) ，可以得到一对谈判
(u ,v)S
v({1}) v({2}) v({3}) v() 0
2010-3-3
《博弈论及其应用》（汪贤裕）
‹2#0›
特征函数的确定
方法二联盟S的成立可以获得受到独立于联盟S之外局中人的影响和
阻扰下的最好收益。下面我们从策略式博弈到特征函数式博弈的转换加以说明。若给定一个策略形的非合作博弈 G [N,{Xi},{Pi}] ，其中局中
• 在例5.1.2中 N {1, 2,3}, v(N) v({1, 2}) 300,
v({2,3}) v({1,3}) v({1}) v({2}) v() 0
• 在例5.1.3中 N {1, 2,3},v(N) v({1, 2}) v({2,3}) v({1,3}) 300,
可在转移效用（TU）的合作博弈中，联盟S的一个收益 v(S) 表示它加入大联盟进行博弈的机会收益，或联盟 S 独立活动可获得的最大收益。这是进行合作博弈首先应确立的。
2010-3-3
《博弈论及其应用》（汪贤裕）
‹1#7›
特征函数的定义
定义5.1.2
设博弈的局中人集合为 N {1,2, ,n} ，v(S) 是定义在N的一切子集（即联盟）上的实值函数，其满足：
定，每个局中人进行再谈判不能与以前的谈判相违背。可以看到，在三人博弈中，先行谈判的局中人具有先动优势。 • 二是规定谈判的次数的顺序。如规定谈判的顺序是先由{1， 2}谈判,其次由{2，3}谈判。第3由{1，3}谈判，最后{1，2， 3}谈判,这时局中人1和局中人3，即{1，3}谈判具有后动的优势。
大到n人，则有n人纳什谈判解的唯一结果 (d1, d2, , dn) 。一般情况下，它由下式决定：
max(u1 d1)(u2 d2 ) (un dn )
s.t ui di , i 1, 2, , n
(5.1.1)
(u1,u2, ,un ) U
2010-3-3
《博弈论及其应用》（汪贤裕）
• 在例5.1.2博弈中，局中人1和局中人2可以联合起来对支付的分配策略进行选择，而局中人3的任何策略都无法干预分配方案。因而，可以合理地认为该博弈仅在局中人1和局中人2两人之间进行分配讨论。若局中人1和局中人2采用二人合作博弈的纳什谈判解。则其结果将是（150，150，0）。
• 在ｎ人谈判问题中，若出现联盟，则可能发生实质性的变化。
博弈论及其应用第5章合作博弈
2010-3-3
《博弈论及其应用》（汪贤裕）
‹#›
第5章合作博弈
• 主要内容：
§ 5.1 基本概念 § 5.2 占优方法：合作博弈一类解概念 § 5.3 估值方法：合作博弈的一类解概念 § 5.4 合作博弈的应用范例
2010-3-3
《博弈论及其应用》（汪贤裕）
的一个联盟（coalition）。特殊情况，允许取 S 和 S N ，后一种情况称为一个
大联盟。
若 N n ，则 N 中联盟个数为 Cn0 Cn1 Cnn 2n 。
2010-3-3
《博弈论及其应用》（汪贤裕）
‹1#6›
可转移效用（TU）
若联盟S中局中人的收益可以自由地分配，且任何局中人的收益变化1个单位，它的效用也变化1个单位，我们称为可转移效用（TU）（transformable utility），也称有旁支付的（with side-payments）。本章仅对可转移效用情况进行讨论。
v
(S)
max
xX S
min
yX N\S
iS
Ei (x,
y)
(5.1.6)
• 其中x Xs Xi , y X N /S Xi 为在混合策略 (x, y) 情况下，局
iS
iN \S
中人 i 的期望收益 Ei。
• -特征函数是把局中人集合划分为两个联盟 S 和 N \ S 这两个联
盟进行一种二人零和博弈。联盟 S 将联盟 N \ S 看成利益完全冲突
（1）
v() 0
（5.1.4）
（2）
v(N) v({i}) iN
（5.1.5）
称 v(s) 为一个特征函数(characteristic function)，或联
盟函数(coalitional function)。
2010-3-3
《博弈论及其应用》（汪贤裕）
‹1#8›
特征函数的定义
• 给定局中人集合和特征函数 v(S) ，所进行的合作博弈称为可转
ui
(
y1,
y2
,
y3
)
xi
0
若若
y1 y2 (x1, x2 , x3 ) y1 y2
• 这时的可达结果结仍为：
(5.1.3)
U {(x1, x2, x3) | x1 x2 x3 300, xi 0,i 1, 2,3}
2010-3-3
《博弈论及其应用》（汪贤裕）
‹#9›
纳什谈判的例子
100元，而他若使自己的收益高于100元，则不会使其他人得到认同。
2010-3-3
《博弈论及其应用》（汪贤裕）
‹#8›
纳什谈判的例子
例5.1.2
类同例5.1.1，但规定只有当局中人1和局中人2提出的分配
策略不同时，各局中人的收益所得为0；若局中人1和局中人2提
出的分配策略相同时，即 y1 y2 ，则按这一分配向各局中人支付，其收益函数可表达为：
• 这时的可达结果集仍为：
U {(x1, x2, x3) | x1 x2 x3 300, xi 0,i 1, 2,3}
2010-3-3
《博弈论及其应用》（汪贤裕）
‹1#1›
纳什谈判的例子
• 在例5.1.3的博弈中，情况就非常复杂了。若局中人1和局中人2 谈判分配方案为 y1 y2 (150,150,0) ，局中人3可以和其中一个局中人再谈判.如与局中人1再谈判,提出分配方案 y1' y3' (175,0,125)