合作博弈理论初步
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
合作博弈
• 合作博弈简介 • 两人讨价还价问题 • 联盟博弈
博弈的分类
1、博弈方的数量: 单人博弈、两人博弈和多人博弈
2、博弈方策略的数量:有限博弈 无限博弈 3、得益情况:常和博弈 变和博弈 4、信息结构:(不)完全信息博弈
(不)完美信息博弈 5、博弈方的理性和行为逻辑差别:
完全理性博弈 有限理性博弈 合作博弈 非合作博弈
博弈的分类
博弈方决策行为的目标: 理性经济人假设人们的决策和行为是以
个体自身利益最大化为根本目标的。 “个体理性”与“集体理性”
集体理性最大化本身不是博弈方的根本目标。 “有约束力的协议” 有效补偿博弈方采取符合集体利益最大化
而不符合个体利益最大化的决策
合作博弈和非合作博弈
我们将(不)允许存在有“约束力协议”的博弈称为 “(非)合作博弈”
• 可以用非合作博弈理论进行分析。 • 两种方法的比较:
1、非合作博弈中博弈方选择的是自身策略 2、 讨价还价中,重要是作为协议对象的,同时 包含双方利益的分配方案
两人讨价还价问题
分配协议:是个二元组S=(s1
,s 2
),描述了每
个人所得到的利益
效用偶:是个二元组U (u1,u2 ) ,分别描述了双
可以得到Nash解
两人讨价还价问题纳什解导出
命题:
同时满足帕累托效率、对称性、线性变换
不变性、对立与无关选择公理的两人讨价还
价问题的唯一解,就是下列约束最优化问题 的解:
ms1as2x[(u1(s) u1(d ))(u2 (s) u2 (d ))]
S.T.(s1, s2 ) S
(s1, s2 ) (d1, d2 )
两人讨价还价问题纳什解导出
2、对称性公理:如果 B(S, d;u1,u2 )是一个对称的讨价
还价问题,满足(u1, u2 ) U 的条件是 (u2,u1) U ,且 d1 d2 , 则作为博弈的解必须满足 u2* u1* 。
图示:纳什解必须落在对称线上的
红色部分。
两人讨价还价问题纳什解导出
3、线性变换不变形公理:
这个分类是博弈论最基本的一个分类
合作博弈和非合作博弈的比较
1、个体理性和集体理性 2、二者的联系 3、研究合作博弈的难度大 4、“合作”的意义:前者是博弈的一部分
而后者是结果
合作博弈
“协议”产生的本质原因:
博弈方之间既存在共同利益但利益又不完全一致。 如果博弈方之间的利益完全对立或完全一致,就不
能产生这样一个“协议”。
• 可行分配集:分配协议受问题条件和基本 理性要求的约束--- -可行分配协议
• 效用配置集:可行分配集在效用函数下的 像。
• 以上两个集一般是凸紧集。
• 两人讨价还价问题可以是对称的或不对称 的。
两人讨价还价问题纳什解导出
• 分配满足效率和公平两个基本要求。 1、帕累托效率公理
效率要求是与个体理性没有 矛盾的帕累托效率。
“协议”的内容:
约定行为 利益分配:
关于利益分割的讨价还价,是合作博弈的共同 特征。
达成“协议”的前提:
通过讨价还价就利益分割达成一致。
合作博弈问题本质上都是关于利益分割的讨价还价
两人讨价还价问题
• “联盟博弈”和“两人讨价还价博弈”是合 作博弈理论的两大研究对象。
• “两人讨价还价博弈”是博弈论最早研究的 问题之一,是合作博弈理论的理论基础。
如果 (s1* s2*) 是一个两人讨价还价问题的解,那么当讨 价还价问题中的效用变换为ui' ai biui 时,(s1* s2*) 仍然是 讨价还价的解。
两人讨价还价问题纳什解导出
4、独立于无关选择公理:
如果B(S, d; u1, u2 ) 和B(S ', d ';u1,u2 )是两个讨价还价
这个解被称为讨价还价的“纳什解”,或者
“纳什讨价还价解”
两人讨价还价问题的K-S解法
• 假设某公司破产清算时有剩余资产K,有两 个债权人持有债券分别为 D1、D2 且 D1 D2 K 1、 D1 D2 2、D1 D2
问题且满足:S
的合作博弈解 (
s1*
S'
s2*
且d d'
) (对应(u1*,
ቤተ መጻሕፍቲ ባይዱ
那么,若 u2* ))落在
B(
S'
S, d;u1, u2 )
中,则(s1* s2*
)
一定也是 B(S ', d ';u1, u2 ) 的解。
两人讨价还价问题纳什解导出
用仿射变换: 1、先通过仿射变换使 原问题的效用集 与扩 展问题的帕累托边界 在解处正好相切。 2、再用逆仿射变换
方对分配协议的主观效用评价。其中ui是局中
人i的期望效用,是可行分配协议集S到实数集 的实值函数,ui : S R
谈判破裂点:二元组d (d1, d2) ,任何谈判都有
破裂的可能,di 表示谈判破裂时局中人i能得到
的利益
两人讨价还价问题
•
一般用 问题
B(
S
,
d
;
u1,
u2
)
表示一个两人讨价还价
• 合作博弈简介 • 两人讨价还价问题 • 联盟博弈
博弈的分类
1、博弈方的数量: 单人博弈、两人博弈和多人博弈
2、博弈方策略的数量:有限博弈 无限博弈 3、得益情况:常和博弈 变和博弈 4、信息结构:(不)完全信息博弈
(不)完美信息博弈 5、博弈方的理性和行为逻辑差别:
完全理性博弈 有限理性博弈 合作博弈 非合作博弈
博弈的分类
博弈方决策行为的目标: 理性经济人假设人们的决策和行为是以
个体自身利益最大化为根本目标的。 “个体理性”与“集体理性”
集体理性最大化本身不是博弈方的根本目标。 “有约束力的协议” 有效补偿博弈方采取符合集体利益最大化
而不符合个体利益最大化的决策
合作博弈和非合作博弈
我们将(不)允许存在有“约束力协议”的博弈称为 “(非)合作博弈”
• 可以用非合作博弈理论进行分析。 • 两种方法的比较:
1、非合作博弈中博弈方选择的是自身策略 2、 讨价还价中,重要是作为协议对象的,同时 包含双方利益的分配方案
两人讨价还价问题
分配协议:是个二元组S=(s1
,s 2
),描述了每
个人所得到的利益
效用偶:是个二元组U (u1,u2 ) ,分别描述了双
可以得到Nash解
两人讨价还价问题纳什解导出
命题:
同时满足帕累托效率、对称性、线性变换
不变性、对立与无关选择公理的两人讨价还
价问题的唯一解,就是下列约束最优化问题 的解:
ms1as2x[(u1(s) u1(d ))(u2 (s) u2 (d ))]
S.T.(s1, s2 ) S
(s1, s2 ) (d1, d2 )
两人讨价还价问题纳什解导出
2、对称性公理:如果 B(S, d;u1,u2 )是一个对称的讨价
还价问题,满足(u1, u2 ) U 的条件是 (u2,u1) U ,且 d1 d2 , 则作为博弈的解必须满足 u2* u1* 。
图示:纳什解必须落在对称线上的
红色部分。
两人讨价还价问题纳什解导出
3、线性变换不变形公理:
这个分类是博弈论最基本的一个分类
合作博弈和非合作博弈的比较
1、个体理性和集体理性 2、二者的联系 3、研究合作博弈的难度大 4、“合作”的意义:前者是博弈的一部分
而后者是结果
合作博弈
“协议”产生的本质原因:
博弈方之间既存在共同利益但利益又不完全一致。 如果博弈方之间的利益完全对立或完全一致,就不
能产生这样一个“协议”。
• 可行分配集:分配协议受问题条件和基本 理性要求的约束--- -可行分配协议
• 效用配置集:可行分配集在效用函数下的 像。
• 以上两个集一般是凸紧集。
• 两人讨价还价问题可以是对称的或不对称 的。
两人讨价还价问题纳什解导出
• 分配满足效率和公平两个基本要求。 1、帕累托效率公理
效率要求是与个体理性没有 矛盾的帕累托效率。
“协议”的内容:
约定行为 利益分配:
关于利益分割的讨价还价,是合作博弈的共同 特征。
达成“协议”的前提:
通过讨价还价就利益分割达成一致。
合作博弈问题本质上都是关于利益分割的讨价还价
两人讨价还价问题
• “联盟博弈”和“两人讨价还价博弈”是合 作博弈理论的两大研究对象。
• “两人讨价还价博弈”是博弈论最早研究的 问题之一,是合作博弈理论的理论基础。
如果 (s1* s2*) 是一个两人讨价还价问题的解,那么当讨 价还价问题中的效用变换为ui' ai biui 时,(s1* s2*) 仍然是 讨价还价的解。
两人讨价还价问题纳什解导出
4、独立于无关选择公理:
如果B(S, d; u1, u2 ) 和B(S ', d ';u1,u2 )是两个讨价还价
这个解被称为讨价还价的“纳什解”,或者
“纳什讨价还价解”
两人讨价还价问题的K-S解法
• 假设某公司破产清算时有剩余资产K,有两 个债权人持有债券分别为 D1、D2 且 D1 D2 K 1、 D1 D2 2、D1 D2
问题且满足:S
的合作博弈解 (
s1*
S'
s2*
且d d'
) (对应(u1*,
ቤተ መጻሕፍቲ ባይዱ
那么,若 u2* ))落在
B(
S'
S, d;u1, u2 )
中,则(s1* s2*
)
一定也是 B(S ', d ';u1, u2 ) 的解。
两人讨价还价问题纳什解导出
用仿射变换: 1、先通过仿射变换使 原问题的效用集 与扩 展问题的帕累托边界 在解处正好相切。 2、再用逆仿射变换
方对分配协议的主观效用评价。其中ui是局中
人i的期望效用,是可行分配协议集S到实数集 的实值函数,ui : S R
谈判破裂点:二元组d (d1, d2) ,任何谈判都有
破裂的可能,di 表示谈判破裂时局中人i能得到
的利益
两人讨价还价问题
•
一般用 问题
B(
S
,
d
;
u1,
u2
)
表示一个两人讨价还价