第16章 合作博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 按照这个调解程序,最后能够达到一个结 果 U = (U ,U ) ,这个结果在全部可行方案P之中, 并且应该是双方满意的帕累托最优方案。 • 谈判中的调解程序Ψ 可以定义为一个从d 和P 到 的P中某点的 U = (U ,U ) 映射,即:
* * A * B
* * A * B
U = (U , U ) = ψ (d , P)
* A A * B B
* A
* B
A
B
A
* A
B
* B
A
* A
B
* B
* A
* B
A
A
B
B
* A
* B
* A
* B
A
B
B
A
A
B
*
*
• • • •
定理:合作博弈(d,P)存在满足以上公理的 唯一的纳什谈判解U=Ψ(d,P), 当且仅当:
* * − d A )(U B − d B ) > (U A − d A )(U B − d B ) (U A
• 对V(S)作简单的讨论。 • •
S
T
①V(φ)=0, φ为空集; ② 若 V(S∪T)≥V(S)+V(T) , S∈N,T∈N 且 S∩T=φ 成立,则称特征函数 V 具有超可加性。 它意味着对于局中人而言合作至少不比不合作 差; • ③ 若 V(S∪T)=V(S)+V(T),S∈N,T∈N, 且 S∩T=φ 成立,则称特征函数 V 具有可加性。这 时S和T合作还是不合作没有区别。
V (N ) = ∑ X i
i =1 n
(16.3)
• •
优超 一个分配方案X在满足了(16.2)式的条件后是 否能够被集合N中全部成员接受呢?不一定,一 些人可能仍会拒绝这个方案,他们可能会提出 至少要按照 Y 进行分配,而不能按照 X 进行分 配的要求。原因为两个: • ① Yi>Xi, i∈S (16.4) • ② ∑ X ≤ V (S ) • 这对于联盟S来说,分配方案Y优超 (dominates)分配方案X,简称Y优超X。这种情 况下,分配方案 X 是不能实现的。优超的概念 说明集体 N 的分配方案不仅仅要满足个体理性 (Xi≥Ui),而且要满足“小集体”的理性。否则 大集体 N 的分配方案是无法实现的,从而大联 盟就不能实现。
• 联盟(Coalition) • 设有n个人参与博弈, N= {1,2,3,…,n}, N是全部参与人的集合,一个联盟被定义 成 N 的子集 S , S∈N , S 中的成员能达到 有约束力的协议。当他们一旦达到结盟 协议,这个协议是有约束力的,可以 “保证”他们采取统一的集体行动。
• 特征函数 • 设S={1,2,…,k},S∈N,S是N中 的一个联盟,记V(S)是联盟S可以保证得 到的最大利益。N中的其它人可以结成联 盟 N-S ,并与 S 对抗(当然这种情况不一 定会发生),V(S)就是联盟S即使在这种 情况下也可以保证获得的最大利益。V(S) 被称为多人 (n 人 ) 合作博弈中的特征函数。
百度文库 稳定集
• 记所有可能分配组成的集合为E(V),则稳定集的定义如下: • 定义:对于n人合作博弈(ξ,V),分配集 W ⊂ E (V ) 为稳定集,则W满 足: • (1)(内部稳定性)不存在 x, y ∈W ,满足x>y(x超优y); • (2)(内部稳定集)对于任意 x ∉ W ,存在 y ∈ W ,使得y>x(y超优 x)。 • 定理16.3 如果合作博弈中联盟的特征函数不是0就是1,则称之为简单 博弈。对于简单博弈(ξ,V),S是一个极小获胜联盟[即V(S)=1,但 对S的任何真子集T有V(T)=0],则稳定集为:
* * A * B
(16.1)
• 纳什提出的谈判调解程序应满足的公理如下: U ≥ d ,U ≥ d ; • 公理一(个体理性): • 公理二(可行性): (U ,U ) ∈ P ; • 公理三(帕累托最优性):如果 (U ,U ) ∈ P , 且 U ≥ U ,U ≥ U , 则 U = U ,U = U ; • 公理四 ( 无关方案的独立性 ) :如果 P2 是 P1 的 子集,且是调解程序Ψ由[d, P2 ]达到的合作 解,那么只要 (U ,U ) ∈ P ,则它也是调解程序Ψ 由[d, P1]达到的合作解; • 公理五(线性变换的不变性):设P′是P经过线 +b U ′ = cU 而合成的集合, +d 性变换 U ′ = aU 和 a,c >0。如果 (U ,U ) 是调解程序Ψ由[d, P]达到 (aU + b, cU + d ) 是调解程序Ψ(d,P′)达 的解,那么, 到的解; ,U ) ∈ P • 公理六(对称性):如果P是对称的,即 (U ,U ) ∈ P, (U , 并且 d = d ,则 U = U 。
W = {x x = ( x1 , , xn ) ∈ E (V ), 若i ∉ S , 则xi = 0}
• 定理16.4 设n人合作博弈(ξ,V)的稳定集为W,核为C(V),则稳 定集与核的关系为 C (V ) ⊂ W 。 • [例16.3] 仍以三个强盗分赃的的合作博弈为例,分析其是否存在稳定集。 • 解:根据定理16.3可知,该例的合作博弈有三个稳定集: • {(x,y,0)∣x,y≧0,x+y=1} • {(x,0,z)∣x,z≧0,x+z=1} • {(0,y,z)∣z,y≧0,z+y=1}
16.4 夏普利值
• • • • 夏普利值(Shapley value)是利用公理化方法得到合作博弈的唯一解。设为 局中人i博弈(N,V)中应该得到的期望收益,则夏普利值指出,它应 满足几个公理。 定义1: 对于n人合作博弈(N,V),T是一个联盟,如果对任意S联盟 均V(S∩T)=V(S),则称T为这个博弈的承载。 定义2: 对于n人合作博弈(N,V),Л为其上的一个置换运算。定义 博 弈 (N, Л) 为 这 样 一 个 新 博 弈 ( N,U ) , 对 任 意 联 盟 S={i1,…,is} 有 U[Л(i1),…, Л(is)]=V(S)。 在上述定义的基础上,可以给出值 ϕi [V ](i ∈ N ) 应满足的以下公理: ϕi [V ] = V (; s) 公理7(有效性公理): 若S为(N,V)任意一个承载,则有 ∑ i∈S
n i =1 i
i∈ S i
• 核心是闭凸集。如果博弈的核心非空,就可以 将总收益 V(N) 按照(16.5 )方式分配给局中各 个参与人。但核有时是空的,是否存在核就成 为一个很重要的问题(例如,常和博弈的核是 空的),因此,有以下关于核心存在的定理: • 定理 16.2 :对于 n 人合作博弈( N,V ),核心 C(N , V) 非空的充要条件是下属线性规划有最 小值Z*≤V(N):
16.2 双人合作博弈
• • • • • 利益分配 谈判与仲裁也是人们得到利益的方式。 合作博弈的基础或基本假设仍然是个体理性 合作不能损害个体利益 分配方案只有被双方都认可才能实现其合理性, 才能是“公正”的。 • 利益的分配需要通过谈判解决,谈判的“仲裁 者”是“公正的理由”,即谈判双方都接受的 “公理”——公认的理由。
i∈S i
• 核心 • 核心 (Core) 表示全部不可优超的分配方案的 集合,记为 C(N , V) 。如果某个分配方案在核 心中,那么,它满足条件: • ① ∑ X = V (N ) (16.5) • ② ∑ X ≥ V (S ), ∀S ⊂ N • 由此看出,这个分配方案现在不是任何小集 体可以用实力对抗并拒绝的分配方案了。 • 如果人们能够找到这样的分配方案,集体利 益的最大化就有可能实现。 • 局中人从分配中得到的利益超过 ( 或不低于 ) 他们自己单干或形成小集体可以得到的利益。 • 图16.1中的CD曲线形成了核心。
• [例 16.1]垃圾博弈。在一个区域中居住着7户居民, 每户居民每天产生一袋垃圾,这些垃圾只能扔在 这一区域的某一户家的地里。分析在合作博弈条 件下的特征函数。 • 解:我们以V(S)表示任意个局中人组成的特征函 数值。其中 V0 ≡ V (φ ) = 0 ,而一个局中人组成的联 盟所遭受的最糟糕处境是其它局中人将他们产生 的垃圾都扔到自己地里,自己的垃圾扔到其它任 意一个居民地里,所对应地特征函数值为; • V = −6 ;两个人的联盟将收到5袋垃圾,故 V = −5 ; 以次类推,三个、四个、五个、六个、七个人组 V = −2 , V = −4 , V = −3, 成的联盟的特征函数值分别为: • V = −1 , V = −7 (无法扔到其它人地里)。
n min z = ∑ xi i =1 ( P) s.t.∑ xi ≥ V ( S ), 对任意S ⊂ N i∈S
(16.6)
• [例6.2]三个强盗分赃的的合作博弈 • 三个强盗掠到一箱银子,民主决定如何分配。强盗A对强盗
B说,我们两个联合起来平均分配如何?强盗C看到这种情景,马 上对强盗B说,我们两个联合,我给你2/3,我只要1/3。强盗A见 事情不妙,马上对对强盗C说,我们两个联合,我给你2/3,我只 要1/3,强盗B着急了,赶紧也加入了讨价还价的协商中。 • 用核的概念分析该三人合作博弈。 • 解:我们考察三个强盗分配方案(x,y,z)之间的优超关系。强 盗A第一次提议的分配方案为(1/2,1/2,0),在强盗A和强盗B 的联盟上这个方案优超平均分配方案(1/3,1/3,1/3),因此, 平均分配被超优,不是核中的元素。强盗C和强盗B结成联盟,分 配方案为(0,2/3,1/3),在此联盟上优超(1/2,1/2,0), 因此,分配方案为(1/2,1/2,0)也不在核中。 • 可以证明,没有任何一种方案不被另一种方案优超。分配(x,y, z )∈ C(V) 需要找到非负的 x , y , z 满足: x+y+z=1 , x+y≧1 , y+z≧1 , x+z≧1 ,但这是办不到的,因为后三个不等式相加得 x+y+z≧3/2。
•
纳什谈判解 •
对于交换中的分配问题(如图16. 1所示),A 、B的 起点在d=(dA,dB), dA为A的初始效用,dB 为B的初始效 用。如果他们进行交换,对双方都有利,CD线表示了 他们可以达到的全部帕累托最优状态。
UB C
P d D
• 图 16.1
UA
• 谈判是根据初始条件 d、可行集 P给出某个双方同意的 调解或谈判程序Ψ。
1
2
3
4
5
6
7
• 分配 • 在合作博弈中集体理性的实现是以个体理性 的满足为条件的。因此,合作博弈问题是如何 在不违背个体理性的条件下实现集体理性。而 集体理性目标实现的障碍是分配问题。假设参 与人i自己单干可获得的收益为Ui,而合作后集 体分配给他的收益为Xi。对于合作博弈而言, 如果要实现集体利益最大化,就是要寻找一种 分配方案: X=(X1,X2,…,Xn) ,这个方案满足条 件: X i ≥ U i , i = 1,2, , n
第16章 合作博弈
16.1 合作博弈的含义
博弈论依据当事人是否达成具有约 束力的协议分为合作博弈论和非合作博 弈论。合作博弈是博弈各方在进行信息 交流基础上可达成具有强制性约束力契 约的博弈。非合作博弈论强调个人理性、 个人最优决策,合作博弈则强调团体理 性、效率、公平。
•
合作博弈允许博弈各方通过谈判与沟通来树立合作 意识,并建立相互间信任、克制和承诺的机制,以实 现帕累托最优。其理论要点如下: (1) 存有共同利益。 这是合作博弈的前提条件。(2) 必要的信息交流。合作 博弈强调通过信息交流、讨价还价的谈判形式,消除 各参与者之间的信息不对称,以使各参与者能对合作 结果有一个较为稳定的预期,对合作事项的未来趋势 有一个比较清晰的轮廓。(3) 自愿、平等和互利。在合 作博弈中,各参与者是自愿和平等的,达成契约是一 致同意的结果。互利,则体现在各参与者能从合作博 弈中分享到合作收益。(4) 强制性契约。经谈判后缔结 的契约具有很强的约束力,参与者若有违背,将受到 相应的惩罚。 • 合 作 博 弈 一 般 可 分 成 双 人 合 作 博 弈 (Two person cooperative games)与多人合作博弈(n-person cooperative games)两种情况。
(16.2)
所有的U∈P,U≥d,并且U≠U*。 由上述定理可以知道,谈判的结果就是使 福利函数(支付函数)达到最大化。谈判的关 键问题是看是否能够形成一种包含双方利益的 “共同价值”观,即“谈判福利”函数。
16.3 多人合作博弈
•
局中人的数目多于两人的合作博弈称为多人 合作博弈。假设局中人是三个,也许三者全部 参加合作,并且使得每个成员的利益得到最大 的增进。也有可能是三人中的两个人进行合作, 这两个人的联盟可以使他们两个获得最大利益。 而可能的利益分配结果支配着联盟的形成。这 里只介绍多人合作博弈的基本概念。