第2章 纳什均衡
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n个参与人的最优反应映射的乘积
r ( s) = r1 ( s) × r2 ( s) × × rn ( s) = {(t1 , t 2 , , t n ) t i ∈ ri ( s), i = 1,2, , n}
称为博弈G的最优反应映射 最优反应映射. 最优反应映射 博弈的最优反应映射与纳什均衡之间的关系 定理2.1 s* ∈ S 为策略型博弈 G = N, S1,, Sn , u1,, u n 的 定理 纳什均衡的充要条件是 s * ∈ r ( s * ). 设 f (Y ) 为一集值映射.若 X ∈ f ( X ) ,称x为 f (Y ) 的不 不 动点. 动点 利用不动点概念,定理2.1可以如下叙述. 命题2.4 s*是策略型博弈G的纳什均衡的充要 命题 条件是 s*是最优反应映射 r (s) 的不动点,即 s*∈ r (s*) .
按 按
等待
(4, ) 4 ( 5 ,1 ) 等待 ( 9 , 1 ) ( 0 , 0 )
严格纳什均衡为大猪"按",小猪"等待".
例2.7 在例1.8中的大堤维护博弈中,支付矩阵为
维护 维护 不维护 ( 4 , 4 ) ( 14 , 10 ) ( 10 , 14 ) ( 10 , 10 ) 不维护
N , = {1,2} , G
给出. * * * * s 2 是局中人2对 设 s = ( s1 , s 2 ) 为G的纳什均衡.即 * * * s 2的最优反应. s 于 s1 的最优反应,1 是局中人1对于
(a1n , b1n ) (a2 n , b2 n ) (amn , bmn )
2.3 最优反应映射与纳什均衡
定义2.2 局中人的最优反应映射 定义 局中人i的最优反应映射是一个定义于策略组合集合S, 取值于 策略集 Si 的子集的集值映射(映射值为集合的映射称为集值映 S 射), ri ( s) S i ,满足
i
ri ( s ) = {t i ∈ S i u i (t i , s i ) = max u i ( s i , s i )}
伯川德( 例2.2 伯川德(Berchand) 均衡 )
设有生产同质产品的两个企业,同时独立地确定产品的价格.已知该产品市 ' 场需求函数为 q = D( p) ,满足 D ( p) < 0 .这里q代表产量, p代表价格.两个企业具有相同的单位成本 C1 = C 2 = C . 企业的利润函数 如下: π i ( p i , p j ) = ( pi C ) Di ( p i , p j ) (i, j = 1,2) 这里 Di ( p i , p j ) 表示两个企业的价格分别为 p i , p j 时,市场对于 企业的产品的需求量.
N, S1 , S2 , u1 , u 2
βn
划线法 对于二人有限博弈 G = 可由支付矩阵
β1 β2 α1 α2 αm (a11 , b11 ) (a12 , b12 ) (a21 , b21 ) (a22 , b22 ) (a , b ) (a , b ) m2 m2 m1 m1
退 (2 , 0 ) ( 0 ,0 )
用划线法可得严格纳什均衡(退,进),(进,退). (试写出金发女郎博弈的矩阵,并求出NE)
例2.6 智猪博弈
猪圈里圈着两头猪,一头大猪,一头小猪.猪圈的一边有一 个猪食槽,另一边安装一个按钮,按一下按钮会有10个单位 的猪食进槽.但谁按按钮就需要付2个单位的成本.若大猪先 到,大猪吃到9个单位,小猪吃到1个单位;若同时到,大猪 吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位, 小猪吃4个单位,支付矩阵如下.
* 2.对每个局中人 i , s i 是他应对 s i 的最好的策略. 纳什均衡的定义
*
定义2.1 设 G = N, S1, , Sn , u1,, u n 为一具有完全信息的策略型博弈 定义 * * 模型,称策略组合 s * = ( s i* , s i ), s i* ∈ S i , s i ∈ S \ S i 为G的一个纳什均 纳什均 * 衡.如果对 i ∈ N , Si* 是在 i的对手策略组合为 s i = s i 条件下局中 人i的最优反应策略,即 * * u i ( s i* , s i ) ≥ u i ( s i , s i ) 或
G的纳什均衡可由以下划线法 划线法求得. 划线法 例2.4在囚徒困境问题中,其支付矩阵为
C C ( 5, 5 ) D ( 8, 0 )
D ( 1, 1 )
(0 , 8 )
应用划线法,支付矩阵中的元素(-5,-5)下 都划上了短线,其所对应的策略组合为纳什 均衡,且是严格的纳什均衡,
* * u i ( s i* , s i ) = max u i ( s i , s i ) * si ∈s i
对 si ∈ S i
.
如果以上不等式对严格成立,称 s * 为 G 的严格纳什均衡 严格纳什均衡. 严格纳什均衡
在完全信息静态博弈中可用纳什均衡预测每个参与人的策略,进 而预测我们所关心的各种博弈结果. 扩展型博弈模型的纳什均衡定义为它所对应的策略型博弈的纳什 均衡. 均衡 例2.1 囚徒困境问题 在例1.6给出的囚徒困境问题中,s * = ( C , C ) 是惟一的严格纳什 均衡.(对斯密"看不见的手"的质疑) 策略组合 (C, D), (D, C), (D, D) 都不是纳什均衡. 这个模型中,基于自利理性的假设,局中人为了各自利益选择坦 白的策略,其结果是双方各获得-5的支付. 显然双方可以得到更好的结局,即双方都采取抵赖策略各得-1的 支付(帕累托最优),自利理性选择的结果并非帕累托最优,从 个体利益出发的行为往往不能实现社会的最大利益;不止如此, 自利理性本身存在内在矛盾——从个体利益出发的行为最终也不 一定能真正实现个体的最大利益,甚至会得到相当差的结果.
第2章 纳什均衡 章
电影《美丽心灵》中,有人向纳什提出了这样一个 问题,问题的背景如下:在一个舞会上,有两个以 上的男士,有比男士更多的魅力十足的女士,但只 有一个金发女郎,男人开始邀请舞伴,但只能邀请 一次请一个女郎作为舞伴,所有男士更喜欢金发女 郎,但有女伴比无女伴要好,如果两个男士同时邀 请一个女士,两人都会被拒绝.假设你作为一个男 士,你会如何邀请舞伴?
0 q B = n B n + n B A PB > PA + δ PA δ ≤ PB ≤ PA + δ PB < PA δ
若,PA≥0,PB≥0,则可以证明上述产品的差 异化模型的纳什均衡为( PA=0,PB=0 ).
纳什均衡的不变性
* 由纳什均衡的定义知, s * = ( s i* , s i )
(1)纳什均衡在支付函数的正仿射变换 正仿射变换下不变. 正仿射变换 对 ,令 i∈N
ui' ( s) = δ iui ( s) + Ci ,其中
δ i > 0 ,则G与
' G' = N,S1,,Sn , u1,, u'n 有相同的纳什均衡.
(2)纳什均衡在支付函数的局部变换 局部变换下不变. 局部变换 给定
例2.5 斗鸡博弈
两个人举着火棍从独木桥的两端走向中央进行火拼,每个人 都有两种战略:继续前进,或退下阵来.若两个人都继续前 进,则两败具伤;若一方前进,另一方退下来,前进者胜利, 退下来的丢了面子;若两人都退下来,两人都丢面子,支付 矩阵如下:
进 进 ( 3 , 3 ) (0, 2 ) 退
i∈N及
si
s .令 u i' ( s ) = u i ( s ) + C i , s i = , i u i (9; = N, S1,, Sn , u1,, u 'n
有相同的纳什均衡.
重复剔除被严格占优策略均衡与纳什均衡的关系
* * 命题2.2 若 s* = ( s1 , , sn ) 命题
D ( pi ) 1 Di ( pi , p j ) = D( pi ) 2 0 pi < p j pi = p j pi > p j , i, j = 1,2.
上述企业价格竞争问题可以归结为完全信息 静态博弈模型 G = N, S1, S2 , u1, u 2 其中: 局中人集合N = {1,2} . 策略集合 S1 = S2 = [C, ∞ ) 表示企业所有可行价格 构成的集合. 支付函数 u i ( pi , p j ) = π i ( pi , p j ) , i, j = 1,2 . 为求该模型的纳什均衡,可先将策略组合集 合中的点分为4类,分别讨论它们是否能构 成纳什均衡.
例2.3 简单产品差异化模型 考虑由商店 A , B 构成的市场,A与B分别销售不同品牌的商 品,进行价格竞争.假设生产的单位成本为零.消费者分 n 为两类, n A (> 0) 个消费者偏好于产品A, B (> 0)个消费者偏好 于产品B.A,B两种品牌价格分别为 PA , PB .设消费者可 从A或B处购买单位商品. 用 δ ≥ 0表示由于购买不喜欢的产品所付出的厌恶成本,假设 消费者具有如下的效用函数
PA UA = PB δ A类消费者购买商品A A类消费者购买商品 B
PA δ UB = PB
B类消费者购买商品A B类消费者购买商品B
q 用 q A 表示消费者对于产品A的需求量; B 表 示消费者对于产品B的需求量.则 0 PA > PB +δ qA = nA PB δ ≤ PA ≤ PB +δ n +n PA < P δ A B B
利用划线法可得纳什均衡(维护,维护),(不维护, 不维护). 为了保护生命财产的安全,政府可以立法,如果参与人 不维护大堤,需付罚款5,则有支付矩阵
维护 不维护 维护 ( 4, 4 ) ( 14, 15) ( 15 , 14 ) ( 15 , 15 ) 不维护
这时该博弈有惟一的纳什均衡(维护,维护).
第1类,R1 = {( p1 , p2 ) p1 = p2 > C} 第2类, R2 = {( p1 , p2 ) p1 > p2 > C} ∪{( p1 , p2 ) p2 > p1 > C} R 第3类 ,3 = {( p1, p2 ) p1 > p2 = C} ∪ {( p1, p2 ) p2 > p1 = C} 第4类 , R4 = {( p1 , p 2 ) p1 = p 2 = C} 4 (1)当 ( p1 , p 2 ) ∈ R1 , ( p1 , p 2 ) 不是纳什均衡. (2)当 ( p1 , p 2 ) ∈ R 2 ,( p1 , p 2 ) 不是纳什均衡. (3)当 ( p1 , p 2 ) ∈ R3 , ( p1 , p 2 ) 不是纳什均衡. (p (4)当 ( p1 , p 2 ) ∈ R4 , 1 , p2 ) = (C , C ) 是纳什均衡.称其 为伯川德均衡 伯川德均衡. 伯川德均衡
为纳什均
衡的充要条件是对任何局中人,支付差为
* * u i ( s i* , s i ) u i ( s i , s i ) ≥ 0
,而与这个差
值是多少无关,由此可导出纳什均衡的一个性质: 纳什均衡的不变性
命题2.1 设 命题
G = N, S1 , , Sn , u1 , , u n
为已知策略型博弈.
si ∈S i
定义2.2表明,局中人i的最优化反应映射 ri (s) 仅与 s i 有关. 反应函数 当 ri (s) 为单点集时,称 ri (s ) 为局中人i的最优反应函数 最优反应函数,简称 最优反应函数 反应函数.这时将 ri (s ) 记为 BRi (s i ) . 反应函数
定义2.3 最优反应映射 定义
2.1 纳什均衡的定义
纳什均衡是博弈论中最重要的概念, 纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概 最重要的概念 念都是建立在纳什均衡基础之上的. 念都是建立在纳什均衡基础之上的
* 纳什均衡是个策略组合 s* = ( si* , si ) ,它满足两个要求. * 1.对每个局中人 i ∈ N ,能够预期到对手采用策略组合 s i .
是有限策略型博弈的纳
什均衡,那么它不会被重复剔除被严格占优策略的过程 所剔除. 命题2.3 在有限策略型博弈 命题 中,如果
G = N, S1 , , Sn , u1 , , u n
* * s* = ( s1 , , s n )
是重复剔除被严格占优策略均衡,则它必为纳什均衡.
2.2
求纳什均衡的划线法
r ( s) = r1 ( s) × r2 ( s) × × rn ( s) = {(t1 , t 2 , , t n ) t i ∈ ri ( s), i = 1,2, , n}
称为博弈G的最优反应映射 最优反应映射. 最优反应映射 博弈的最优反应映射与纳什均衡之间的关系 定理2.1 s* ∈ S 为策略型博弈 G = N, S1,, Sn , u1,, u n 的 定理 纳什均衡的充要条件是 s * ∈ r ( s * ). 设 f (Y ) 为一集值映射.若 X ∈ f ( X ) ,称x为 f (Y ) 的不 不 动点. 动点 利用不动点概念,定理2.1可以如下叙述. 命题2.4 s*是策略型博弈G的纳什均衡的充要 命题 条件是 s*是最优反应映射 r (s) 的不动点,即 s*∈ r (s*) .
按 按
等待
(4, ) 4 ( 5 ,1 ) 等待 ( 9 , 1 ) ( 0 , 0 )
严格纳什均衡为大猪"按",小猪"等待".
例2.7 在例1.8中的大堤维护博弈中,支付矩阵为
维护 维护 不维护 ( 4 , 4 ) ( 14 , 10 ) ( 10 , 14 ) ( 10 , 10 ) 不维护
N , = {1,2} , G
给出. * * * * s 2 是局中人2对 设 s = ( s1 , s 2 ) 为G的纳什均衡.即 * * * s 2的最优反应. s 于 s1 的最优反应,1 是局中人1对于
(a1n , b1n ) (a2 n , b2 n ) (amn , bmn )
2.3 最优反应映射与纳什均衡
定义2.2 局中人的最优反应映射 定义 局中人i的最优反应映射是一个定义于策略组合集合S, 取值于 策略集 Si 的子集的集值映射(映射值为集合的映射称为集值映 S 射), ri ( s) S i ,满足
i
ri ( s ) = {t i ∈ S i u i (t i , s i ) = max u i ( s i , s i )}
伯川德( 例2.2 伯川德(Berchand) 均衡 )
设有生产同质产品的两个企业,同时独立地确定产品的价格.已知该产品市 ' 场需求函数为 q = D( p) ,满足 D ( p) < 0 .这里q代表产量, p代表价格.两个企业具有相同的单位成本 C1 = C 2 = C . 企业的利润函数 如下: π i ( p i , p j ) = ( pi C ) Di ( p i , p j ) (i, j = 1,2) 这里 Di ( p i , p j ) 表示两个企业的价格分别为 p i , p j 时,市场对于 企业的产品的需求量.
N, S1 , S2 , u1 , u 2
βn
划线法 对于二人有限博弈 G = 可由支付矩阵
β1 β2 α1 α2 αm (a11 , b11 ) (a12 , b12 ) (a21 , b21 ) (a22 , b22 ) (a , b ) (a , b ) m2 m2 m1 m1
退 (2 , 0 ) ( 0 ,0 )
用划线法可得严格纳什均衡(退,进),(进,退). (试写出金发女郎博弈的矩阵,并求出NE)
例2.6 智猪博弈
猪圈里圈着两头猪,一头大猪,一头小猪.猪圈的一边有一 个猪食槽,另一边安装一个按钮,按一下按钮会有10个单位 的猪食进槽.但谁按按钮就需要付2个单位的成本.若大猪先 到,大猪吃到9个单位,小猪吃到1个单位;若同时到,大猪 吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位, 小猪吃4个单位,支付矩阵如下.
* 2.对每个局中人 i , s i 是他应对 s i 的最好的策略. 纳什均衡的定义
*
定义2.1 设 G = N, S1, , Sn , u1,, u n 为一具有完全信息的策略型博弈 定义 * * 模型,称策略组合 s * = ( s i* , s i ), s i* ∈ S i , s i ∈ S \ S i 为G的一个纳什均 纳什均 * 衡.如果对 i ∈ N , Si* 是在 i的对手策略组合为 s i = s i 条件下局中 人i的最优反应策略,即 * * u i ( s i* , s i ) ≥ u i ( s i , s i ) 或
G的纳什均衡可由以下划线法 划线法求得. 划线法 例2.4在囚徒困境问题中,其支付矩阵为
C C ( 5, 5 ) D ( 8, 0 )
D ( 1, 1 )
(0 , 8 )
应用划线法,支付矩阵中的元素(-5,-5)下 都划上了短线,其所对应的策略组合为纳什 均衡,且是严格的纳什均衡,
* * u i ( s i* , s i ) = max u i ( s i , s i ) * si ∈s i
对 si ∈ S i
.
如果以上不等式对严格成立,称 s * 为 G 的严格纳什均衡 严格纳什均衡. 严格纳什均衡
在完全信息静态博弈中可用纳什均衡预测每个参与人的策略,进 而预测我们所关心的各种博弈结果. 扩展型博弈模型的纳什均衡定义为它所对应的策略型博弈的纳什 均衡. 均衡 例2.1 囚徒困境问题 在例1.6给出的囚徒困境问题中,s * = ( C , C ) 是惟一的严格纳什 均衡.(对斯密"看不见的手"的质疑) 策略组合 (C, D), (D, C), (D, D) 都不是纳什均衡. 这个模型中,基于自利理性的假设,局中人为了各自利益选择坦 白的策略,其结果是双方各获得-5的支付. 显然双方可以得到更好的结局,即双方都采取抵赖策略各得-1的 支付(帕累托最优),自利理性选择的结果并非帕累托最优,从 个体利益出发的行为往往不能实现社会的最大利益;不止如此, 自利理性本身存在内在矛盾——从个体利益出发的行为最终也不 一定能真正实现个体的最大利益,甚至会得到相当差的结果.
第2章 纳什均衡 章
电影《美丽心灵》中,有人向纳什提出了这样一个 问题,问题的背景如下:在一个舞会上,有两个以 上的男士,有比男士更多的魅力十足的女士,但只 有一个金发女郎,男人开始邀请舞伴,但只能邀请 一次请一个女郎作为舞伴,所有男士更喜欢金发女 郎,但有女伴比无女伴要好,如果两个男士同时邀 请一个女士,两人都会被拒绝.假设你作为一个男 士,你会如何邀请舞伴?
0 q B = n B n + n B A PB > PA + δ PA δ ≤ PB ≤ PA + δ PB < PA δ
若,PA≥0,PB≥0,则可以证明上述产品的差 异化模型的纳什均衡为( PA=0,PB=0 ).
纳什均衡的不变性
* 由纳什均衡的定义知, s * = ( s i* , s i )
(1)纳什均衡在支付函数的正仿射变换 正仿射变换下不变. 正仿射变换 对 ,令 i∈N
ui' ( s) = δ iui ( s) + Ci ,其中
δ i > 0 ,则G与
' G' = N,S1,,Sn , u1,, u'n 有相同的纳什均衡.
(2)纳什均衡在支付函数的局部变换 局部变换下不变. 局部变换 给定
例2.5 斗鸡博弈
两个人举着火棍从独木桥的两端走向中央进行火拼,每个人 都有两种战略:继续前进,或退下阵来.若两个人都继续前 进,则两败具伤;若一方前进,另一方退下来,前进者胜利, 退下来的丢了面子;若两人都退下来,两人都丢面子,支付 矩阵如下:
进 进 ( 3 , 3 ) (0, 2 ) 退
i∈N及
si
s .令 u i' ( s ) = u i ( s ) + C i , s i = , i u i (9; = N, S1,, Sn , u1,, u 'n
有相同的纳什均衡.
重复剔除被严格占优策略均衡与纳什均衡的关系
* * 命题2.2 若 s* = ( s1 , , sn ) 命题
D ( pi ) 1 Di ( pi , p j ) = D( pi ) 2 0 pi < p j pi = p j pi > p j , i, j = 1,2.
上述企业价格竞争问题可以归结为完全信息 静态博弈模型 G = N, S1, S2 , u1, u 2 其中: 局中人集合N = {1,2} . 策略集合 S1 = S2 = [C, ∞ ) 表示企业所有可行价格 构成的集合. 支付函数 u i ( pi , p j ) = π i ( pi , p j ) , i, j = 1,2 . 为求该模型的纳什均衡,可先将策略组合集 合中的点分为4类,分别讨论它们是否能构 成纳什均衡.
例2.3 简单产品差异化模型 考虑由商店 A , B 构成的市场,A与B分别销售不同品牌的商 品,进行价格竞争.假设生产的单位成本为零.消费者分 n 为两类, n A (> 0) 个消费者偏好于产品A, B (> 0)个消费者偏好 于产品B.A,B两种品牌价格分别为 PA , PB .设消费者可 从A或B处购买单位商品. 用 δ ≥ 0表示由于购买不喜欢的产品所付出的厌恶成本,假设 消费者具有如下的效用函数
PA UA = PB δ A类消费者购买商品A A类消费者购买商品 B
PA δ UB = PB
B类消费者购买商品A B类消费者购买商品B
q 用 q A 表示消费者对于产品A的需求量; B 表 示消费者对于产品B的需求量.则 0 PA > PB +δ qA = nA PB δ ≤ PA ≤ PB +δ n +n PA < P δ A B B
利用划线法可得纳什均衡(维护,维护),(不维护, 不维护). 为了保护生命财产的安全,政府可以立法,如果参与人 不维护大堤,需付罚款5,则有支付矩阵
维护 不维护 维护 ( 4, 4 ) ( 14, 15) ( 15 , 14 ) ( 15 , 15 ) 不维护
这时该博弈有惟一的纳什均衡(维护,维护).
第1类,R1 = {( p1 , p2 ) p1 = p2 > C} 第2类, R2 = {( p1 , p2 ) p1 > p2 > C} ∪{( p1 , p2 ) p2 > p1 > C} R 第3类 ,3 = {( p1, p2 ) p1 > p2 = C} ∪ {( p1, p2 ) p2 > p1 = C} 第4类 , R4 = {( p1 , p 2 ) p1 = p 2 = C} 4 (1)当 ( p1 , p 2 ) ∈ R1 , ( p1 , p 2 ) 不是纳什均衡. (2)当 ( p1 , p 2 ) ∈ R 2 ,( p1 , p 2 ) 不是纳什均衡. (3)当 ( p1 , p 2 ) ∈ R3 , ( p1 , p 2 ) 不是纳什均衡. (p (4)当 ( p1 , p 2 ) ∈ R4 , 1 , p2 ) = (C , C ) 是纳什均衡.称其 为伯川德均衡 伯川德均衡. 伯川德均衡
为纳什均
衡的充要条件是对任何局中人,支付差为
* * u i ( s i* , s i ) u i ( s i , s i ) ≥ 0
,而与这个差
值是多少无关,由此可导出纳什均衡的一个性质: 纳什均衡的不变性
命题2.1 设 命题
G = N, S1 , , Sn , u1 , , u n
为已知策略型博弈.
si ∈S i
定义2.2表明,局中人i的最优化反应映射 ri (s) 仅与 s i 有关. 反应函数 当 ri (s) 为单点集时,称 ri (s ) 为局中人i的最优反应函数 最优反应函数,简称 最优反应函数 反应函数.这时将 ri (s ) 记为 BRi (s i ) . 反应函数
定义2.3 最优反应映射 定义
2.1 纳什均衡的定义
纳什均衡是博弈论中最重要的概念, 纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概 最重要的概念 念都是建立在纳什均衡基础之上的. 念都是建立在纳什均衡基础之上的
* 纳什均衡是个策略组合 s* = ( si* , si ) ,它满足两个要求. * 1.对每个局中人 i ∈ N ,能够预期到对手采用策略组合 s i .
是有限策略型博弈的纳
什均衡,那么它不会被重复剔除被严格占优策略的过程 所剔除. 命题2.3 在有限策略型博弈 命题 中,如果
G = N, S1 , , Sn , u1 , , u n
* * s* = ( s1 , , s n )
是重复剔除被严格占优策略均衡,则它必为纳什均衡.
2.2
求纳什均衡的划线法