合作联盟博弈课件

合集下载

博弈论PPT课件

博弈论PPT课件
有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)

合作博弈与讨价还价ppt课件

合作博弈与讨价还价ppt课件

核的特征
定理1:I人合作博弈 ,(V)中的核由所有满 下足 条以
件的I维向量 x(x1,x2,,xI )组成:
(1)对任S意, xi V(S); iS (2)xi V() i
• 定理2:本质的常和合作博弈的核是空的。
•垃圾博弈:在一区域中住着7户居民,每户居 民每天产生一袋垃圾,这些垃圾只能扔在这一 区域的某一户人家领地(区域中没有空地)。
• 记Vn(n=0,1, …,7)表示任意n个局中人组成的 特征函数值,在合作博弈条件下,有:
V0=V()=0
V1=-6
V2=-5 V3=-4, V4=-3, V6=-1, V7=-7
V5=-2
烧伤病人的治疗通常是取烧伤病人的 健康皮 肤进行 自体移 植,但 对于大 面积烧 伤病人 来讲, 健康皮 肤很有 限,请 同学们 想一想 如何来 治疗该 病人
(3)联盟能保证自己得到的效用,它是联盟外收益的 最悲观的评价。对应的合作博弈均衡集合是合作博弈 的核心。
• 在优超这一思路下,合作博弈的解概念还包括:稳定 集、谈判集、核心、核仁等
烧伤病人的治疗通常是取烧伤病人的 健康皮 肤进行 自体移 植,但 对于大 面积烧 伤病人 来讲, 健康皮 肤很有 限,请 同学们 想一想 如何来 治疗该 病人
烧伤病人的治疗通常是取烧伤病人的 健康皮 肤进行 自体移 植,但 对于大 面积烧 伤病人 来讲, 健康皮 肤很有 限,请 同学们 想一想 如何来 治疗该 病人
合作博弈存在的基本条件
• 合作博弈存在的两个基本条件: (1)对联盟来说,整体收益大于其每个成员单
独经营时的收益之和; (2)对联盟内部而言,应有着具有帕累托改进
烧伤病人的治疗通常是取烧伤病人的 健康皮 肤进行 自体移 植,但 对于大 面积烧 伤病人 来讲, 健康皮 肤很有 限,请 同学们 想一想 如何来 治疗该 病人

博弈论与竞争策略ppt课件

博弈论与竞争策略ppt课件

下图博弈中,厂商A和厂商B都选择做广告的博均衡解就
是纳什均衡。
厂 商B
做广告
不做广告
厂商A
做广告 10,5
15,0
不做广告 6,8
20,2
修改过的广告博弈矩阵
每一个上策均衡一定是纳什均衡,但并非每一个纳什均
衡都是上策均衡。上策均衡是纳什均衡的特例。
3.存在多个纳什均衡的博弈
下图博弈有两个纳什均衡,即(进入,允许)和
沃尔马成功的关键在于其市场进入与市场扩张策略。在 60年代,人们通常都认为折扣店只能在10万或以上人口的城 市中才能成功经营,但山姆·华尔顿不同意这种看法并决定 在美国西南部的小镇上开店,到1970年已经有30家沃尔马店 开设在阿肯色、密苏里和俄克拉荷马的小镇上。一个10万人 口以下的小镇所具有的市场容量并不太大,但却足够容纳下 一个大型折扣店,并能让它获得一定的利润。
(二)博弈的基本要素
1.参与者,或称博弈方:可以是一个、二个或多个;可 以是个人、厂商,也可以是国家 。
2.策略:是指博弈中的任一参加者针对其他参加者的可 能的行为所采取的行为原则和应对办法。
3.得益:是指博弈参与者所获得的收益或效用,在囚徒 困境中。
4.均衡:是指博弈的所有参与者从自我利益最大化出发 选择的策略所组成的策略集。
二、博弈的基本分类
(一)合作博弈和非合作博弈 1.合作博弈:如果各博弈方能达成某种有约束力的契约
或协议(包括默契)以使他们选择共同的或联合的策略。 2.非合作博弈:反之,就属于非合作博弈。
二、博弈的基本分类 (一)合作博弈和非合作博弈
1.合作博弈:如果各博弈方能达成某种有约束力的契 约或协议(包括默契)以使他们选择共同的或联合的策略。 2.非合作博弈:反之,就属于非合作博弈。

第五章-合作博弈

第五章-合作博弈

称这组合理分配为博弈的核,并用C(V)表示,记

C(V )
X
R
n
n
xi
V(N)
xi V (S)
S
N
i 1
is
25
2、核(The Core )
定义:设 X 是联盟博弈<N,V>的一个合理分配,若 存在一联盟S,使得
V (S) xi
iS
则称联盟S瓦解分配 X。
所以,核是不会被任何联盟瓦解的合理分配的集 合。
S=,V()=0。
(2)超可加性
若一个多人博弈的特征函数具有下列性质,即
对任意结盟S,T N,S∩T= ,满足
V(S∪T)≥V(S)+V(T).
称这个多人博弈具有超可加性。
如果特征函数不满足超可加性,博弈中的结盟是 不稳定的。
6
例1 :(爵士乐队博弈,A Jazz Band Gounce)
一位歌手(S),一位钢琴家(P)和一位鼓手 (D)组成一个小乐队在俱乐部同台演出能得到 演出费1000元,若歌手和钢琴家一起演出能得 800元。而只有钢琴家和鼓手一起演出能得到 650元,钢琴独奏表演能得300元,钢琴家没有 其它收入。然而,歌手和鼓手在地铁中表演能挣
14
1、合理分配(Imputation)
作为一个博弈的解X,即在博弈中对N个局中人得失的合理 分配,至少应满足两个条件:
(1) xi V ({i}) n
(2) xi V ( N )
i N(个人合理性)
i N(集体合理性)
条件(i11)称为:“个人合理性”(Individual Rationality),
1
所以有(1,1,0)或(1,0,1) Z成立。

合作博弈

合作博弈

一、合作博弈的概念及其表示
定义6.1.1 在 n 人博弈中,参与人集用N {1, 2 , , n}
N 的任意子集 S 称为一个联盟(coalition)。
表示,
S 是一个联盟, v ( S )是指 S 和 定义6.1.2 给定一个 n人博弈, v(S) 称为联盟 N S {i | i N,i S} 的两组博弈中S 的最大效用, S 的特征函数(characteristic function)。
n
二、分配
所谓分配就是博弈的一个n 维向量集合,之所以是 n 维向 量,是由于每个参与人都要得到相应的分配。 n 维的分配 向量称为博弈的“解”,各种方法即各种解概念代表着分 配的不同观点。 定义6.2.1 对于合作博弈( N , v), N 1, 2,, n ,对每个参与 人 i N ,给予一个实值参数 xi ,形成 n 维向量 x ( x1 , , xn ) n 且其满足:
u v ( N )
存在无限个正向量 u (u1 , u2 , , un ) ,满足 u u1 u2 ,, un 。 用 E(v) 表示一个博弈 ( N , v ) 的所有分配方案组成的集合。
v (i) 0
n i 1
显然如下的 x ( x1 , , xn ) 都是分配,其中 xi v i ui ,1 i n 。
例6.1 设有一个3人合作对策,每个参与人各有两个纯策略A 和B。当三人不合作时,其支付见下表。假设采用最稳妥 策略,即最坏情况下选择最好,求合作博弈的支付函数
超可加性表示两个不相交的联盟分别行动,其分别单干的结 果不如组成一个联盟的联合而共同行动,这是大联盟形成的 动因。特征函数只有满足超加性,才有形成新联盟的必要性 。否则,如果一个合作博弈的特征函数不满足超可加性,那 么,其成员没有动机形成联盟,已经形成的联盟将面临解散 的威胁。

《博弈论初步》课件

《博弈论初步》课件

THANKS
感谢观看
02
纳什均衡是一种非合作博弈均衡 ,其中每个参与者都认为当前策 略是最好的,不会受到其他参与 者的欺骗或影响。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的策略,逐步逼近纳什均衡。这 种方法适用于较简单的博弈模型,但对于复杂的博弈模型 可能收敛速度较慢。
线性规划法
将纳什均衡问题转化为线性规划问题,通过求解线性规划 来找到纳什均衡。这种方法适用于具有线性特征的博弈模 型,但计算复杂度较高。
价格战与非价格战
博弈论分析了价格战和非价格战的利弊,为企业制定营销策略提供 博弈论可以用来分析选民的投票行为和政治立场,预测选举结果。
02
候选人策略
博弈论为候选人提供了制定最优竞选策略的方法,帮助他们在选举中获
胜。
03
政治联盟与利益交换
博弈论中的合作博弈理论可以用来分析政治联盟的形成和利益交换机制
特征值法
利用特征值和特征向量的性质来求解纳什均衡。这种方法 适用于具有矩阵特征的博弈模型,但需要一定的数学基础 。
纳什均衡的应用实例
1 2
价格竞争
在寡头市场中,企业之间通过价格策略进行竞争 ,最终形成价格均衡,即纳什均衡。
劳资谈判
劳资双方在谈判中会提出自己的工资要求,最终 达成工资协议,这也是一种纳什均衡。
博弈类型
合作博弈
定义
01
参与者通过合作达成共赢的博弈。
特点
02
存在合作协议,强调集体行动和收益分配。
应用场景
03
国际关系、商业合作、团队协作等。
非合作博弈
定义
应用场景
参与者追求各自利益最大化的博弈。
市场竞争、个人决策、资源分配等。

合作博弈——精选推荐

合作博弈——精选推荐

第五章 合作博弈1. 设三人联盟博弈的特征函数v 的值是:v({i})=0,i=1,2,3;v({1,2})=2/3,v({1,3})=7/12,v({2,3}) =1/2, v({1,2,3})=1。

求出该联盟博弈的核心,并用图形表示出来。

解:博弈G 的核心C(v)。

博弈G 的转归集I[N,v]为:123123123[,]{(,,)0,0,0,1}I N v x x x x x x x x x x ==≥≥≥++=若],[),,(321v N I x x x x ∈=,则)(v C x ∈的充分条件为:x 1≥0; x 2≥0; x 3≥0;x 1+x 2≥2/3; x 1+x 3≥7/12; x 2+x 3≥1/2; x 1+x 2+x 3=1由后面几个不等式得到x 1≤1/2 ;x 2 ≤5/12, x 3≤1/3.该联盟博弈的核心C(v)={(x 1,x 2,x 3)| 0≤x 1≤1/2,0≤x 2 ≤5/12,0≤x 3≤1/3,x 1+x 2+x 3=1}核心C(v)是图中阴影区域(含边界)。

2. 假设有一3人合作博弈,其特征函数为:v({1, 2, 3})=200,v({1,2})=150,v({1,3})=110, v({2,3})=20,v({1})=100,v({2})=10,v({3})=0。

计算该合作博弈的Shapley 值,核心,最小ε-核心,稳定集,内核和核仁。

1、Shapley 值φ1(v)=1/3(100-0)+1/6(150-10)+1/6(110-0)+1/3(200-20)=135 φ2(v)=1/3(10-0)+1/6(150-100)+1/6(20-0)+1/3(200-110)=45 φ3(v)=1/3(0-0)+1/6(20-10)+1/6(110-100)+1/3(200-150)=20 所以该博弈的Shapley 值φ(v)=(135,45,20) 2、博弈G 的核心C(v)。

第5章 合作博弈09

第5章 合作博弈09

熊、狼、狐狸合作博弈的稳定集
• 在该简单博弈中,有三种稳定集: {(x,y,0)|x,y≥0,x+y=1} {(x,0,z)|x,z≥0,x+z=1} {(0,y,z)|y,z≥0,y+z=1} • 该稳定集中不包含平均分配。 • 接下来将考察公平如何进入合作解概念。
(四)核仁
• 核仁具有如下意义的性质:1)每个博弈有且 仅有一个核仁;2)如果核存在的话,则核仁 是它的一部分。 • 对于I人合作博弈(ζ,V),S为一个联盟, x=(x1,x2, …, xI) 为一个收益向量(不一定为一 个分配),记x(S)=∑i∈Sxi,则称e(S,x)=V(S)-x(S) 为S关于x的剩余。 • 若x为一个分配,则剩余e(S,x)反映了联盟对于 分配的不满意程度。
博弈论建模过程
• 经济现象:通过假设条件抽象出经济问题 • 构建模型:经济变量,效用函数 • 模型求解:一阶条件法、逆向归纳法、拉 格朗日函数法等 • 模型扩展:放松假设条件 • 解释现象:
合作博弈引言:
熊、狼、狐狸瓜分猎物
• 熊、狼、狐狸一起抓到了一只兔子,协商如何分配。 • 狐狸对熊说:平分只能各得1/3,我们联合起来平分 如何?熊要答应,狼急了。 • 狐狸对狼说:我和熊联合起来你什么也得不到,不如 我和你合作,但你只得1/4如何?狼很感激地点头。 • 熊琢磨过来,对狼说:别听那个两面三刀的,和我合 作,我给你1/3。 • 狼正得意,没想到狐狸和熊又开始嘀咕起来,大有把 自己晾在一边之势,狼连忙钻过去继续讨价还价。 • 三个家伙继续这样协商下去,结果呢?
优超的分析方法
• 在优超定义中,最关键的是联盟能提供给成员的效用 分配,主要分析方法有三种: (1)联盟中各成员在联盟外成员策略固定时能获得的 效用水平:联盟内的局中人将联盟外局中人所采取的 策略视为既定的,即不期望任何报复性反应。 (2)联盟不能被阻止得到的效用:即不管联盟外成员 如何行动,联盟总可以达成的效用水平。由此得到的 合作博弈均衡集合称为合作博弈的β核心。 (3)联盟能保证自己得到的效用,它是联盟外收益的 最悲观的评价。对应的合作博弈均衡集合是合作博弈 的α核心。 • 在优超这一思路下,合作博弈的解概念还包括:稳定 集、谈判集、核心、核仁等

第六章、合作博弈 《经济博弈论基础》PPT课件

第六章、合作博弈 《经济博弈论基础》PPT课件
与摩根斯特恩提出来的概念,有时被 记为VN-M解。记所有可能分配组成的集合为E(V),则稳定 集定义如下:
• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。

第七章 合作博弈 《博弈论与经济》 PPT课件

第七章  合作博弈  《博弈论与经济》 PPT课件
能取得的产出份额,如果 A 与 B 达成了协议,则分别以努力水 平 eA 0 ,eB 0 投入生产, A , B 的利润函数分别为
A (eA , eB ) xQ cA , B (eA , eB ) (1 x)Q cB
▪ 容易计算出纳什均衡努力水平
3
1
1
3
e*A
x 4 (1
3
x) 4

2
2
▪ 对于命题7.1中两式可解释如下:参与人 A, B 对于分割
单位
利益进行讨价还价。他们所达成的协议是,首先分给A 支付 u ,
分给 B 支付 v ,然后再平分剩余利益 u v 。
▪ 7.1.2 不对称纳什讨价还价(谈判)解 ▪ 一般的纳什讨价还价(谈判)解的概念 ▪ 纳什讨价还价解取决于可能的支付向量集合 S 与 d 无协议点 。此
x
(
3 4
,1)上严格递减。U
B
(
x)
上严格递减。因而,可
4
4
4
行支付向量集合 S 的帕累托有效边界为

{(u, v)
x [1 4
,
3 ]满足U 4
A (x)
u, U b
(x)
v}
▪ 纳什讨价还价解中 所得的协议x 是下述最大化问题的解
max U
x[ 1 , 3]
A
(
x)U
B
(
x)
44
▪ 其解为 x* 1
▪ 定义7.2 对于局中人集合 N {1,2,, n} 的任一子集 S,给定集合 S 的支
付v(S,) 如果 v满足
▪ v() 0 ,
▪ 则称 v() 为特征函数,称 N,v 为具有可转移支付的联盟博弈。

合作博弈 shapley值PPT课件

合作博弈 shapley值PPT课件

2 1/6
0
13
x1 =19.7, x2 =32.1,
x2最大,如何解释?
三 x3=城1在2.2总投资556中的分
城1 C(1)-x1=担210.4, 城2 C授(课2:)X-XxX2=127.8, 城3 C(3)- 14 x3=217.8
合作对策的应用 例2 派别在团体中的权重
• 90人的团体由3个派别组成,人数分别为40, 30, 20人. 团体表决时需过半数的赞成票方可通 •过若. 每个派别的成员同时投赞成票或反对票,用 Shapley合作对策计算各派别在团体中的权重.
平均分配获利B
di xi
2)Nash解 1)协商解
授课:XXX
19
(3)最小距离解 记 x(x1, ,xn)为 x的上

mi n ( x i x i ) 2
i
型 s.t. xi B
xi xi
若令 xi Bbi
第i 方的边际效益
x i
xi 1n(xi B)
xi 1nbi bi B n
例 .b(4,5,7),B11 3)最小距离解
s S i
(ns)!(s1)! w(s)
n!
s~子集 s中的元素数目, Si ~包含i的所有子
集[v(s)v(s\i)] ~ i 对合作s 的“贡献” (is)
w( s ) ~由s决定的“贡献”的权重
授课:XXX
8
三人(I={1,2,3})经商中甲的分配x1的计算
x1 w (s)v [(s)v(s\1)] s S1
x (7 ,6 ,4 ),x i B 6 , 1)协商解
xx(2 ,2 ,2)(5 ,4 ,2)
授课:XXX
20
(4)满意解

合作联盟博弈ppt课件

合作联盟博弈ppt课件
上述分析表明,通过一个有约束力的协议,原来不能实现 的合作方案现在可以实现。这就是合作博弈与非合作博弈的区 别。二者的主要区别在于人们的行为相互作用时,当事人是否达 成一个具有约束力的协议。如果有,就是合作博弈;反之,则是 非合作博弈。
6
合作博弈的概念及其表示
合作博弈,非合作博弈的对称,一种博弈类 型。参与者能够联合达成一个具有约束力且可强 制执行的协议的博弈类型。合作博弈强调的是集 体理性,强调效率、公正、公平。
不具有传递性和反身性。 4.对于相同的联盟 S ,优超关系具有传递性,
即 x S y , y S z ,则有 x S z 。 5.对于不同的联盟 S ,优超关系不具有传递性。
23
核心
尽管可行分配集合 E(v) 中有无限个分配,但实际上, 有许多分配是不会被执行的,或者不可能被参与人所接受 的 。很显然,联盟的每一个成员都不偏好于劣分配方案, 因此,真实可行的分配方案应该剔除劣分配方案。
V5=-2
14
合作博弈的概念及其表示
例:设有一个3人合作对策,每个参与人各有两个纯策略。 当三人不合作时,其支付见下表。假设采用最稳妥策略, 即最坏情况下选择最好,求合作博弈的支付函数
15
合作博弈的概念及其表示
解:用 S 表示一个联盟, S 表示联盟中参与人的个数。
当 S =0,自然 S ,有 v() 0 。
配方案 y , y 方案得不到切实执行。因为从 y 到 x ,S
中的每个参与人的收益都得到改善,S 创造的剩余v(S)又
足以满足他们在 x 中的分配。
22
分配中的优超
在优超关系中,联盟 S 的特征: 1.单人联盟不可能有优超关系。 2.全联盟 N 上也不可能有优超关系。 因此,如果在 S上有优超关系,则 2 S n 1 。 3.优超关系是集合E(v) 上的序关系,这种序关系一般情况下

《博弈论教程》课件

《博弈论教程》课件

博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。

联盟博弈

联盟博弈



核中分配不会被任何联盟推翻,具有稳定性。 核作为联盟博弈的解具有合理性。 核是合作博弈理论最早的解概念,非常重要。 核作为联盟博弈解概念的问题是,联盟博弈的 核常常是空集,即使非空也不一定唯一。
三人分300元博弈的核就是空集。因为事实 上不存在任何不被优超的分配。如 (100,100,100)关于{1,2} 被(150,150,0)优超, (150,150,0)关于 被(0,170,130)优超。
{2,3}
n户居民垃圾博弈的核也是空集。该博弈的 所有可行分配也都能够被优超。
三人分300元(须全部同意)


非空核 C ( N , v) ={( x1, x2 , x3 ) 0 xi 300, x1 x2 x3 300} 任何非三人联盟的 v(S ) 0 ,无法瓦解任何x; 三人联盟 因为 ,不可能 x1 x2 x {1,2,3} 存在同时满足 , , 和 3 300 y1 x1 y2 x2 y3 x3 的分配 ,因此也无法 y1 y2 y3 ( y1, y2 , y3 ) 瓦解任何 x300 ,因此上述集合构成该博弈的核。 核中元素无穷多。
(2)分配和可行分配集

联盟博弈的分配概念与两人讨价还价相似:
x ( x1,, xn ) Rn



分配必须符合博弈问题的基本假设。 分配必须满足每个博弈方得益都不少于不参加任何联 盟的得益,否则相关博弈方不会参与联盟博弈,联盟 博弈无意义。 满足这些要求的分配全体构成联盟博弈“可行分配 集”。 联盟博弈可以用有约束力的协议形成联盟统一行动和 分配利益,分配在联盟博弈中有核心作用。
垃圾博弈


n户居民,每户产1袋垃圾,每袋1单位负效用,可自己处理 或扔到某个邻居院子。 如果都留给自己,每户效用-1。如果都随意扔给任一邻居, 每户期望效用-1。这也是纳什解。 部分人家结成联盟,保证互不扔垃圾,联盟成员期望效用 会上升。 n-1户家庭结成联盟,都把垃圾扔给唯一非联盟成员,联盟 成员期望效用各 1 ,联盟之外家庭期望效用-(n-1)。

合作博弈联盟均衡的基本原理

合作博弈联盟均衡的基本原理

合作博弈联盟均衡的基本原理合作博弈是博弈论中的一个重要分支,它强调的是集体理性,即参与者的联合行动可以产生比单个行动更大的收益。

在合作博弈中,参与者之间可以通过形成联盟来共同制定策略,以实现各自的利益最大化。

联盟均衡是合作博弈中的一个核心概念,它指的是在博弈中,参与者组成的联盟所采取的策略组合,使得任何参与者离开该联盟都会损失利益。

联盟均衡的基本原理可以概括为以下几点:1. 联盟的形成:在合作博弈中,参与者可以自由组合形成联盟。

联盟可以是固定的,也可以是临时的,取决于参与者的策略和利益。

2. 收益分配:在形成的联盟中,参与者之间需要协商确定收益分配的方式。

理想的联盟均衡应该是帕累托有效的,即任何参与者的收益都不可能通过改变策略而增加,而不损害其他参与者的利益。

3. 策略的稳定性:在联盟均衡中,任何参与者的策略都是最优的,也就是说,在其他条件不变的情况下,参与者没有动机单独改变自己的策略。

4. 联盟的强制执行:联盟均衡通常假设联盟内的参与者会遵守共同的策略,并且联盟外的人无法轻易加入或离开联盟。

这种约束可以是外部的(如法律或规则),也可以是内部的(如信任或声誉机制)。

5. 核心概念:在合作博弈中,核心是指无法通过剔除任何参与者而提高某些参与者收益的联盟集合。

核心内的联盟是稳定的,因为任何联盟外的参与者加入核心联盟都会增加其收益。

6. 效率和公平:联盟均衡通常追求的是效率和公平的平衡。

效率体现在联盟总收益的最大化,而公平则体现在收益分配的合理性。

7. 实际应用:在实际应用中,联盟均衡的实现可能需要借助于诸如协商、合同、第三方调解等机制,以确保参与者能够遵循联盟协议。

合作博弈的联盟均衡理论在经济学、政治学、社会学等多个领域都有广泛的应用,它有助于我们理解和分析个体如何在集体行动中寻求合作和共赢。

第八讲(合作博弈)

第八讲(合作博弈)

• 案例:自行车交易
– 乔伊有一辆自行车,他认为自行车价值有$80。米奇有 100美元,但没有自行车,他认为自行车的价值有$100。 如果自行车的交易价格设为$90。乔伊在不知道米奇是 否会给钱的情况下可以选择出让或保留自行车。而米 奇在不知道乔伊是否会出让自行车的情况下可以选择 给钱$90,或不给钱。
• R、W和S是毗邻一个 陆地上 近海处 海湾的三个国家。各 S S 国在海湾附近都驻扎 西 东 西 东 这军队,要想控制整 R 北 6,6,6 7,7,1 7,1,7 0,0,0 个海湾,需要至少两 南 0,0,0 4,4,4 4,4,4 1,7,7 个国家联合起来,并 与军队部署密切相关。 由于国与国相互资助的情况时有发 古国两国联手控制了 生,因此该博弈可以看做存在转移 效用的博弈问题。 海湾,会造成第三国 利益的巨大损失。 该博弈的解集是怎样的? • 三国收益如右表:
请分别用非合作博弈模 式和存在转移效用的合 作博弈模式进行分析。
0,0,12 0,12,0
3 PDF 文件使用 "pdfFactory Pro" 试用版本创建
抢座博弈 – 答案
• 非合作博弈:
– 存在占优均衡(上,上,上)。
Exercise2 – 商业伙伴
• 吉娜(J),哈雷(H)和劳 拉(L)开办一家网站设 计公司。J精通计算机 技术,H擅长图形制 作,L则是个出色的推 销员。右表表示了三 人组成各种联盟形式 的收益。 • 核是什么?A、H和L 的收益各为多少?
• 如果两人结成联盟,并协调各自的战略,视为联盟的统一 决策。
– 该博弈变成了合作博弈。 – 合作博弈解为(出让,给钱)。 – 自行车从估价低的人手里转向估价高的人手里,商品的交换使双 方都获益。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
上述分析表明,通过一个有约束力的协议,原来不能实现 的合作方案现在可以实现。这就是合作博弈与非合作博弈的区 别。二者的主要区别在于人们的行为相互作用时,当事人是否达 成一个具有约束力的协议。如果有,就是合作博弈;反之,则是 非合作博弈。
合作博弈的概念及其表示
合作博弈,非合作博弈的对称,一种博弈类 型。参与者能够联合达成一个具有约束力且可强 制执行的协议的博弈类型。合作博弈强调的是集 体理性,强调效率、公正、公平。
博弈论
主讲人:
合作博弈
( COOPERATIVE GAMES)
合作博弈
COOPERATIVE GAMES
熊、狼、狐狸一起抓了一只兔子,民主协商如何分 配。狐狸对熊说:平均分只能各得1/3,这样吧,我 们俩联合起来,平分如何?熊要答应,狼急了,于 是狐狸对狼说:怎么样,我和熊联合起来可以让你 什么也得不到,我可以和你合作,不过我要3/4。狼 感激的点头,熊琢磨过味来,对狼说:别听那个两 面三刀的,和我合作,我给你1/3。狐狸见势不妙, 对狼说:别,我给你2/3,我只要1/3。狼成了抢手 货,正得意,没留神狐狸和熊又开始嘀咕起来,有 再次把自己晾在一边的不妙趋势,连忙钻去继续讨 价还价。结果呢?
如果在实际博弈问题中,具有有力的保障使局中 人能够进行协商、谈判,联合选择行动,共同分 享利益,我们就面对一个合作博弈问题。本章通 过合作博弈模型的介绍,讨论在合作博弈中,局 中人如何进行协商谈判、结成联盟及分享利益。
1、联盟博弈
2、联盟博弈的分配
3、核和稳定集
4、沙普利值
导论
先回忆一下囚徒困境的例子:
坦白 抵抗
坦白 抵抗
-8,-8 0,-10 -10,0 -1,-1
在囚徒困境中,还有另外一个策略组合<抵抗,抵抗>,该 组合为参与人带来的支付是<-1,-1>。由<-8,-8>到<-1,-1>, 每个参与人的支付都增加了,即得到一个帕累托改进。
导论
<抵抗,抵抗>构不成一个均衡是基于参与人的个人理性。在参 与人选择抵抗的情况下,每个参与人都有动机偏离这个组合, 通过投机行为谋取超额收益1。如果两个参与人在博弈之前, 签署了一个协议:两个人都承诺选择抵抗,为保证承诺的实现, 参与人双方向第三方支付价值大于1的保证金;如果谁违背了 这个协议,则放弃保证金。有了这样一个协议,<抵抗,抵抗> 就称为一个均衡,每个人的收益都得到改善。
人 i N,给予一个实值参数xi ,形成 n 维向量x (x1,, xn )
且其满足:
n
xi v(i),L xi v(N ) i 1
则称 x 是联盟 S 的一个分配方案。
分配
分配的定义中,xi v(i) 是基于个人理性,合作中的
收益不能小于非合作中的收益,反映了参与人的参与约束。
如果 xi v(i) ,那么,参与人i 是不可能参加联盟的。 n xi v(N ) 是基于集体理性,每个参与人的分配之和不 i 1
定义5 在一个 n 人合作博弈 (N, v) 中,全体优分配方案
形成的集合称为博弈的核心(core),记为 C(v)。显然 有 C(v) E(v) 。
核心
说明:
1.核心 C(v) 是 E(v)中的一个闭凸集。
2.若 C(v) ,则将 C(v) 中的向量 x 作为分配, x 既满
足个人理性,又满足集体理性。 3.用核心作为博弈的解,其最大缺陷是 C(v) 可能是空集。
记Vn(n=0,1, …,7)表示任意n个局中人组成的特征 函数值,在合作博弈条件下,有:
V0=V()=0 V1=-6 V2=-5 V3=-4, V4=-3, V6=-1, V7=-7
V5=-2
合作博弈的概念及其表示
例:设有一个3人合作对策,每个参与人各有两个纯策略。 当三人不合作时,其支付见下表。假设采用最稳妥策略, 即最坏情况下选择最好,求合作博弈的支付函数
义在 2N 上的实值映射。 在很多情况下,一个联盟能获得的支付依赖于其他参与人所采取的行 动。v(S) 有时被解释为联盟 S 独立于联盟 N S 的行动可保证的最 大支付 。
合作博弈的概念及其表示
合作对策的分类主要是根据特征函数的性质。下面根据特 征函数的性质介绍几类特殊的合作对策。
如果v(S) 仅与 S 的个数有关,则 (N, v) 称作对称博弈。
中的每个参与人的收益都得到改善,S 创造的剩余v(S)又
足以满足他们在 x 中的分配。
分配中的优超
在优超关系中,联盟 S 的特征: 1.单人联盟不可能有优超关系。 2.全联盟 N 上也不可能有优超关系。 因此,如果在 S上有优超关系,则 2 S n 1 。 3.优超关系是集合E(v) 上的序关系,这种序关系一般情况下
L
R
-1,2
5,5
0,10
0,10
最小最大值法:联盟外局 中人将采取行动使该联盟 的总和收益最小(极度悲 观),联盟选择策略-- 最大化这些最小值。
V()=0 V(1)=0 V(2)=5 V(1,2)=10
例:垃圾博弈--分析博弈局势
在一区域中住着7户居民,每户居民每天产生一袋 垃圾,这些垃圾只能扔在这一区域的某一户人家 领地(区域中没有空地)。
不具有传递性和反身性。 4.对于相同的联盟 S ,优超关系具有传递性,
即 x f S y , y f S z ,则有 x f S z 。 5.对于不同的联盟 S ,优超关系不具有传递性。
核心
尽管可行分配集合 E(v) 中有无限个分配,但实际上, 有许多分配是不会被执行的,或者不可能被参与人所接受 的 。很显然,联盟的每一个成员都不偏好于劣分配方案, 因此,真实可行的分配方案应该剔除劣分配方案。
合作博弈最重要的两个概念是联盟和分配。 每个参与者从联盟中分配的收益正好是各种联盟 形式的最大总收益,每个参与者从联盟中分配到的 收益不小于单独经营所得收益。
合作博弈的概念及其表示
合作博弈的结果必须是一个帕累托改进,博弈双方 的利益都有所增加,或者至少是一方的利益增加,而另 一方的利益不受损害。
合作博弈采取的是一种合作的方式,合作之所以能 够增进双方的利益,就是因为合作博弈能够产生一种合 作剩余。至于合作剩余在博弈各方之间如何分配,取决 于博弈各方的力量对比和制度设计。
能超过集体剩余 v(N ) 。另外若 v(N ) 没有全部被分配,显
然 x 不是一个帕累托最优的分配方案,不会参与人所接
受。
分配
在前面的例子分配中,分配显然不是一个,而是无限个, 无限个分配形成一个分配集合。 对于实质博弈,其分配总是有无限个。 例如,对于实质博弈(N, v) ,由于
n
u v(N) v(i) 0 i 1
方案x 和 y 满足
(i) xi yi ,i S ;
(ii) xi v(S ) 。
iS
则称分配方案
x

S 上优超于 y
,或称分配方案 y 在S
上劣于 x ,记为 x S y 。
如果分配方案 x 在 S 上优超于 y ,则联盟 S 会拒绝分
配方案 y , y 方案得不到切实执行。因为从 y 到 x ,S
核心
定理 1 分配方案 x (x1,, xn ) 在核心 C(v)中的充要条件是:
(i) xi v(S) , S N , iS
n
(ii) xi v(N ) 。
证明
i 1
如果
x E(v)

x 满足(i)、(ii),则
x 不可能被优超,
即 x C(v) 。
反证法,设存在 S ,使 y f S x 。根据优超的定义,有:
有 v(N ) ? v(N) max2,0, 4, 2, 2,1,。3, 2 4
至此特征函数的值已全部求出。
量集合,之所以 n 是维向 量,是由于每个参与人都要得到相应的分配。n 维的分配 向量称为博弈的“解”。
定义3 对于合作博弈 (N,v), N 1,2,L , n,对每个参与
S 与 N S 进行如下矩阵对策:
合作博弈的概念及其表示
上述矩阵对策没有纯策略,
S
的混合策略是
3 4
,
1 4
,N
的混合策略是
1 4
,
0,
0,
3 4
。S
的均衡值是
1 4
。故 v(2)
S
1 4

同理,可以求出 v(1) 1,v(3) 1 。
当 S =2,S 有3个,以S 1,2为例。
当 S 1, 2,则 N S 3。S 的策略集合(A, A),(A,B),(B, A),(B,B),
上式说明,特征函数只有满足超加性,才有形成新联盟 的必要性。否则,如果一个合作博弈的特征函数不满足 超可加性,那么,其成员没有动机形成联盟,已经形成 的联盟将面临解散的威胁。
例: 局中人1(卖主)要把一件物品卖掉,局中人2和3(买主)分别出 价9元和10元。如果局中人1将物品卖给局中人2的要价是 x 元,则局中
v({1,2,3})=10,v() 显然满足超可加性,于是我们建立了联盟博弈 N,v 。
特征函数是研究联盟博弈的基础,确定特征函数过程实际就是一个建
立合作博弈模型的过程。有的问题,特征函数可以容易地得到,有的问 题需要仔细分析,甚至需要一些专业知识。
由策略型博弈导出特征函数型博弈
局中人 U
1
D
局中人2
,则 (N,v)称作凸博弈。
合作博弈的概念及其表示
v 之所以称为特征函数,是因为这个合作博弈的性质基本 由 v 决定。由此可见 v 对合作博弈的重要性。 定理 设 v 是参与人集合上 N 的特征函数,则有如下的超 可加性:对于联盟 S1 和 S2 ,如果 S1 S2 ,则
v(S1 S2 ) v(S1) v(S2 )
相关文档
最新文档