第二章 完全信息静态非合作博弈

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2015/10/22
博弈论 重庆大学 刘辛
5
2.1.3 划线法
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
2015/10/22
博弈论 重庆大学 刘辛
6
囚 徒 困 境
猜 硬 币
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
-1, 1
1, -1
2.1.1 占优均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法
2015/10/22
博弈论 重庆大学 刘辛
3
2.1.1 占优均衡
l 占优策略:不管其它博弈方选择什么策略,一博 弈方的某个策略给他带来的收益始终高于其它的 策略,至少不低于其他策略的策略 l 举例:囚徒的困境中的“坦白”;双寡头削价中 “低价”。 l 占优均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的占优,必然是该博弈比 较稳定的结果 l 占优均衡不是普遍存在的
* P 1
1 * (a1 b1c1 d1 P 2 ) 2b1
* P 2
1 * (a2 b2 c2 d 2 P 1 ) 2b2
博弈论 重庆大学 刘辛 17
2015/10/22
2.3.4 公共资源问题
公共草地养羊问题
Q q1 qn V V (Q) 100 Q
2015/10/22 博弈论 重庆大学 刘辛 1
本章分六部分
2.1基本分析思路和方法 2.2纳什均衡 2.3无限策略博弈分析和反应函数 2.4混合策略和混合策略纳什均衡 2.5纳什均衡的存在性 2.6纳什均衡的选择和分析方法扩展
2015/10/22
博弈论 重庆大学 刘辛
2
2.1 基本分析思路和方法
博 弈 方 1 A B 2, 3 3, 1 5, 2 1, 5
博弈方1的混合策略
pA 3 pB 1 pA 2 pB 5
博弈方2的混合策略
pC 2 pD 5 pC 3 pD 1
策略 收益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6
第二章 完全信息静态博弈
本章介绍完全信息静态博弈。 完全信息静态博弈即各博弈方同时决策,且所 有博弈方对各方收益都了解的博弈。 囚徒的困境、齐威王田忌赛马、猜硬币、石头 剪子布、古诺产量决策都属于这种博弈。 完全信息静态博弈属于非合作博弈最基本的类 型。 本章介绍完全信息静态博弈的一般分析方法、 纳什均衡概念、各种经典模型及其应用等。
6q2 q1q2 q22
2015/10/22
博弈论 重庆大学 刘辛
14
两寡头间的囚徒困境博弈
厂商2
不突破 厂 不突破 商 1 突破 突破
4.5,4.5
5,3.75
3.75,5
4,4
以自身最大利益为目标:各生产 2单位产量,各自收益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自收益为4.5
1, -1 -1, 1
博弈论 重庆大学 刘辛
8
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
2015/10/22
博弈论 重庆大学 刘辛
9
2.2.1 纳什均衡的定义
•策略空间: S1 ,Sn si j Si •博弈方i 的第 j个策略: •博弈方i 的收益: ui G {S1 ,Sn ; u1 ,un } •博弈:
2015/10/22 博弈论 重庆大学 刘辛 20
2.4 混合策略和混合策略纳什均衡
2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数
2015/10/22
博弈论 重庆大学 刘辛
21
2.4.1 严格竞争博弈和混合策略的引进
寡头产量竞争——以两厂商产量竞争为例
Q q1 q2 P P(Q) 8 Q
c1 c2 2
1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1
6q1 q1q2 q12 2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2
一、猜硬币博弈
猜硬币方 正 面 盖 硬 币 方 正 面 反 面 -1, 1 1, -1 反 面 1, -1 -1, 1
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略
这类博弈很多,引出混合策略纳什均衡概念
2015/10/22 博弈论 重庆大学 刘辛 22
二、混合策略、混合策略博弈 和混合策略纳什均衡
2015/10/22 博弈论 重庆大学 刘辛 12
2.3 无限策略分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 最佳反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性
2015/10/22
博弈论 重庆大学 刘辛
13
2.3.1 古诺的寡头模型
ui qiV (Q) qi c
以三农户为例 n=3,c=4
2015/10/22
博弈论 重庆大学 刘辛
18
竞争:个体利益最大化
1 1 q1 R1 (q2 , q3 ) 48 q2 q3 2 2 1 1 q2 R2 ( q1 , q3 ) 48 q1 q3 2 2 1 1 q3 R3 ( q1 , q2 ) 48 q1 q2 2 2
1, -1
-1, 1
2015/10/22
博弈论 重庆大学 刘辛
7
2.1.4 箭头法
1, 0 0, 4 囚 徒 困 境 猜 硬 币
2015/10/22
1, 3 0, 2
0, 1 2, 0 夫 妻 之 争
-5, -5 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
-1, 1 1, -1
纳什均衡:在博弈 G {S1,Sn ; u1 ,un } 中,如果由各个博 * * 弈方的各一个策略组成的某个策略组合 (si ,sn ) 中,任一博 * 弈方i 的策略,都是对其余博弈方策略的组合(si* ,si*1 , si*1,...sn ) * * ) ui (si* ,si*1, sij , si*1,...sn ) 对 的最佳对策,也即 ui (si* ,si*1, si* , si*1,...sn 任意 si j Si 都成立,则称 (s ,s ) 为G 的一个纳什均衡
(P u1 u1 ( P 1 c1 )(a1 b1P 1 d1P 2) 1, P 2) P 1q1 c1q1 ( P 1 c1 )q1
u2 u2 (P1, P2 ) P2q2 c2q2 ( P2 c2 )q2 (P2 c2 )(a2 b2 P2 d2 P1 )
混合策略:在博弈 G {S1,Sn ; u1,un} 中,博弈方i 的策略空 间为Si {si1,sik },则博弈方i 以概率分布 pi ( pi1 ,pik ) 随机 在其k 个可选策略中选择的“策略”,称为一个“混合策略”, j 1,, k 0 p 1 pi1 pik 1 其中 对 都成立,且
ij
混合策略扩展博弈:博弈方在混合策略的策略空间(概 率分布空间)的选择看作一个博弈,就是原博弈的“混合策 略扩展博弈)。 混合策略纳什均衡:包含混合策略的策略组合,构成纳 什均衡。
2015/10/22 博弈论 重庆大学 刘辛 23
三、一个例子
该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析
博弈方2 C D
2015/10/22
博弈论 重庆大学 刘辛
15
2.3.2 最佳反应函数
古诺模型的最佳反应函 数
q2
理性局 限和古 诺调整
maxu1 max(6q1 q1q2 q12 )
q1
q1 R1 (q2 ) 1 2 ( 6 q2 ) q2 R2 (q1 ) (6 q1 )
1 2
2015/10/22 博弈论 重庆大学 刘辛 11
2.2.3 纳什均衡与严格下策反复消去法
• 占优均衡肯定是纳什均衡,但纳什均衡不一定是占优均衡
命题2.1:在n个博弈方的博弈 G {S1,Sn ; u1,un } 中,如果严格 * ) 之外的所有策略组合, 下策反复消去法排除了除 (si* ,sn * ) 一定是该博弈的唯一的纳什均衡 那么(si* ,sn 命题2.2:在n个博弈方的博弈中 G {S1,Sn ; u1,un } 中,如果 * (si* ,sn ) 是 G 的一个纳什均衡,那么严格下策反复消 去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严 格下策反复消去法简化博弈是可行的
一、夫妻之争的混合策略纳什均衡
丈夫 时装 妻 子 时装 足球 2, 1 0, 0 足球 0, 0 1, 3 妻子的混合策略
pw (C) 1 pw (F ) 0 pw (C) 0 pw (F ) 3
丈夫的混合策略
* * * q1 q2 q3 24
* * * u1 u2 u3 576
Q* 72
合作:总体利益最大化
u Q(100 Q) 4Q 96 Q
2015/10/22
u * 1728
Q 48 3 24 72 u 2304 3 576 1728
(0,6) (0,3)
R1 (q2 )
R2 (q1 )
(3,0) (6,0)
q1
古诺模型的反应函数图示
2015/10/22 博弈论 重庆大学 刘辛 16
2.3.3 伯特兰德寡头模型
• 价格竞争寡头的博弈模型 • 产品无差别,消费者对价格不十分敏感
q1 q1 ( P 1, P 2 ) a1 b 1P 1 d1 P 2 q2 q2 ( P 1, P 2 ) a2 b2 P 2 d2 P 1
* i * n
2015/10/22
博弈论 重庆大学 刘辛
10
2.2.2 纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈 结果会出现,所有博弈方都不会利用该预测或者 这种预测能力选择与预测结果不一致的策略,即 没有哪个博弈方有偏离这个预测结果的愿望,因 此预测结果会成为博弈的最终结果 •只有纳什均衡才具有一致预测的性质 •一致预测性是纳什均衡的本质属性 •一致预测并不意味着一定能准确预测,因为有 多重均衡,预测不一致的可能
24
2015/10/22
博弈论 重庆大学 刘辛
五、小偷和守卫的博弈
守卫 收益((睡)
守卫 睡 V,-D 小 偷 偷 不偷 0,S 不睡 -P,0 0,0
S
0
1 -D
Pt 小偷 偷的概率
- D’
加重对保安的处罚:短期中的效果是使保安真正尽职 在长期中并不能使保安更尽职,但会降低盗窃发生的概略
2015/10/22 博弈论 重庆大学 刘辛 25
19
博弈论 重庆大学 刘辛
2.3.5 反应函数的问题和局限性
• 在许多博弈中,博弈方的策略是有限且非连 续时,其收益函数不是连续可导函数,无法 求得最佳反应函数,从而不能通过解方程组 的方法求得纳什均衡。 • 即使收益函数可以求导,也可能各博弈方的 收益函数比较复杂,因此各自的反应函数也 比较复杂,并不总能保证各博弈方的最佳反 应函数有交点,特别不能保证有唯一的交点。
2015/10/22
博弈论 重庆大学 刘辛
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去:
左 上 下 中 右 左 中 左 中 1,0 1,3 0,1 0,4 0,2 2,0 1,0 1,3 0,4 0,2 1,0 1,3
小偷 收益(偷)
守卫
V

小 偷 偷 不偷 V,-D 0, S
不睡
-P,0 0, 0 0 -P 1
Pg 守卫 睡的概略
- Fra Baidu bibliotek’
加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会是的守卫更多的偷懒
2015/10/22 博弈论 重庆大学 刘辛 26
2.4.2 多重均衡博弈和混合策略
相关文档
最新文档