博弈论及其应用-混合策略纳什均衡

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

小结
混合策略的定义,含义
期望效用 混合策略纳什均衡: –定义 –求解 –含义 案例
张红霞 国民经济管理系
Homework
1. Find all “mixed” strategy NE to a Prisoners’ Dilemma. Comment on any connection with dominant strategies.
张红霞 国民经济管理系
Homework
2. Find all mixed strategy NE to the football game shown below.
Defense
Run Run
Offense
张红霞 国民经济管理系
Pass
5, -5 0, 0
1, -1 15, -15
张红霞 国民经济管理系
混合战略纳什均衡
由上述混合战略纳什均衡的定义,以及混合战略 的定义,可以得到:
* 定义:混合战略组合 * ( 1* ,, n )是一个纳什均衡,
若对所有的i 1,2, , n,有
* * vi ( i* , i ) vi ( si , i ), si i
参与人1认为参与人2的混合策略为 2=( 21 , 22 , 23 ) 则参与人1选择s11时的期望效用为

j 1
3
2j
u1 ( s11 , s2 j ) 21u1 ( s11 , s21 ) 22 u1 ( s11 , s22 ) 23u1 ( s11 , s23 )
张红霞 国民经济管理系
混合策略
,i K,Si si1 ,, siK S ,那么,概率分布 参与者i选择sik的概率。 1) ik [0,1] 2)k 1 ik 1
K
n个参与人参加的博弈G S1 ,, Sn ; u1 ,, un
i ( i1 ,, iK ), 称为i的一个混合战略, ik为
j 1 j 1
3
3
3
1k 2 j u源自文库 ( s1k , s2 j ) 1k 2 j u1 ( s1k , s2 j )
k 1 j 1 k 1 j 1
2
3
2
张红霞 国民经济管理系
混合策略
举例:两人博弈的情况
类似的,可以写出参与人2的期望效用
关于期望效用函数更为简炼的表达 vi ( ) ( s)ui ( s)
张红霞 国民经济管理系
混合战略纳什均衡
定义:混合战略纳什均衡 对于博弈G {S1 ,, Sn ; u1 ,, un }, 混合战略组合
* ( 1* ,, n* )是一个纳什均衡,若对所有的
i 1,2,, n,有
* * vi ( i* , i ) vi ( i , i ), i i
张红霞 国民经济管理系
混合策略
混合策略:把不确定性引入纯战略,即
参与者以一定的概率选择他的战略,比 如网球比赛中,运动员以60%的概率发 正手球,40%的概率发反手球。
张红霞 国民经济管理系
混合策略
为什么采用“混合策略”? –考虑下面的博弈:扑克牌对色游戏 两个人参与这个游戏,从自己的扑克牌中抽 出一张,一起翻开,如果颜色一样,甲输给 乙一根火柴;如果颜色不一样,甲赢得乙一 根火柴。不允许出大小鬼。描述这个博弈, 寻找纳什均衡。
张红霞 国民经济管理系
混合战略纳什均衡

若 i ( i1 , iK )是给定 i时的最优混合战略 则对所有的 ik 0, 有 vi ( sik , i ) vi ( sij , i ), sij Si
所有以正的概率进入最优混合战略的纯战略都
是最优战略,参与人在这些战略之间无差异 即,如果 i1 0, iK 0, vi ( si1 , i )=vi ( si 2 , i )==vi ( siK , i ), sij Si
(1-p) b1
张红霞 国民经济管理系
混合战略纳什均衡
纯战略纳什均衡
混合战略纳什均

–对于某个参与人来说,最优混合战略是指期望效 用最大化的混合战略 –对于前面的例子:二人博弈来说:
* 混合战略纳什均衡 *=( 1* , 2 )必须满足
v1 ( 1* , 2* ) v1 ( 1 , 2* ), 1 1 v2 ( 1* , 2* ) v2 ( 1* , 2 ), 2 2
a2 3,2
b2 -1, 3 0, 0
v2 ( 1 , 2 ) q( 2 p (1 p ) 1) (1 q )( 3 p (1 p ) 0) q( 2 p 1) 3 p
-1, 1
张红霞 国民经济管理系
混合战略纳什均衡
反应函数
v1 5q 1 0, q* 0.2 p v2 (2 p 1) 0, p* 0.5 q
BR1(q)
0
p
0.5
1
找工作 混合策略 不找工作
混合战略纳什均衡
硬币博弈 q (1-q) 期望效用
v1 ( 1 , 2 ) pq 1 p(1 q)( 1) (1 p ) q ( 1) (1 p )(1 q) 1
v2 ( 1 , 2 ) pq ( 1) p(1 q) 1 (1 p )q 1 (1 p )(1 q) ( 1)
n
张红霞 国民经济管理系
混合策略
举例 –扑克牌对色游戏中,假设p=0.5,q=0.5, 写出双方在这种情况下的期望支付
张红霞 国民经济管理系
混合策略
举例:两人博弈的情况
参与人1的纯战略:S1 {s11 , s12 }; 参与人2的纯战略:S2 {s21 , s22 , s23 }
(1 p ) c / v
j j i
张红霞 国民经济管理系
混合战略纳什均衡
由此,p1
p2 pn p
n 1
c (1 p ) v p 1 ( c / v )1 /( n 1)
c/v<1,因此,随着人数n的增加,p减小,即人越 多,每个人选择报案的概率就会越小,如果n=1, 则p=1 社会心理学与博弈分析
反应对应 1 p(a1) 0.5 BR2(p)
反 应 对 应
BR1(q) 0.5 q(a2) 1 0
张红霞 国民经济管理系
混合战略纳什均衡
报案(reporting a crime) –n个人目睹一桩罪行,每个人都希望报警, 但是都倾向于其他人打电话。特别的,假定 能从报警中得到v单位的收益,而打电话的 人需要付出c单位的成本,v>c>0。分析这个 问题的纯战略NE和混合战略NE。
张红霞 国民经济管理系
混合战略纳什均衡
1. 几乎所有有限博弈都有有限奇数个纳什
均衡 2. 对每个参与人来讲,在构成混合战略均 衡纯战略之间是无差异的,即带来的支
付是无差异的
3. 因此,寻找混合战略纳什均衡的方法除
了优化方法,还有等值法
张红霞 国民经济管理系
案例分析
有人要打网球吗??
张红霞 国民经济管理系
张红霞 国民经济管理系
混合战略纳什均衡
社会福利博弈 流浪汉 q (1-q) 政府 p a 1 (1-p) b1 期望效用 v1 ( 1 , 2 ) p(3q (1 q)( 1))
(1 p )( q ( 1) (1 q) 0) p(5q 1) q
张红霞 国民经济管理系
混合策略
举例:两人博弈的情况
如果参与人1选择混合战略 1=(11 , 12 )
那么, 他的期望效用为 v1 ( 1 , 2 ) 11 2 j u1 ( s11 , s2 j ) 12 2 j u1 ( s12 , s2 j )
张红霞 国民经济管理系
混合战略纳什均衡
–混合战略NE
• 任何一个参与人i的期望效用函数: 假设i提供的概率为pi,
Vi ( i , i ) pi (v c)
(1 pi ) {0 (1 p j ) v(1 (1 p j ))}
j i j i
第i个参与人最大化自己的期望效用,得到
张红霞 国民经济管理系
混合策略
乙 红 q 甲 红p -1,1 1,-1 黑 1-q
1,-1
-1,1
黑 1-p
张红霞 国民经济管理系
混合策略
–当参与人可以选择的策略比较多时(3个,4 个,…),用一个字母就不够用了,需要用 多个字母表示其混合策略 –可以想象,混合策略情况下,参与人的支付 不再是确定性的。需要用期望支付的概念
a2
p
b2 -1, 1 1, -1
a1
1,-1 -1, 1
(1-p) b1
张红霞 国民经济管理系
混合战略纳什均衡
反应函数
BR1 q 4q 2 BR2 p 2 4 p
q 1/ 2 1 BR1 q [0,1] q 1/ 2 0 q 1/ 2 0 BR2 p [0,1] 1 p 1/ 2 p 1/ 2 p 1/ 2
博弈论及其应用
——完全信息静态博弈: 混合策略纳什均衡
混合策略纳什均衡
混合策略
混合策略纳什均衡
张红霞 国民经济管理系
混合策略纳什均衡
混合策略
混合策略纳什均衡
张红霞 国民经济管理系
混合策略
混合策略 期望效用 NE和最优反应 案例 混合策略博弈的性质
The cliffhanger…
张红霞 国民经济管理系
混合战略纳什均衡
–分析:
• 参与人:n个 • 每个参与人的战略集:{打电话,不打电话} • 效用:没有任何人打,所有人0支付; 打,v-c; 不打,但其他人至少有一个人打,v
–纯战略NE
• 当只有两个参与人的时候(公共产品提供的斗鸡博弈)— —两个NE • n个人的时候:假设有m个人提供,m>1 or m=1 n个NE
张红霞 国民经济管理系
混合策略


甲 红 黑 -1,1 1,-1
黑 1,-1
-1,1
张红霞 国民经济管理系
混合策略
–这个博弈“不存在”我们前面所讲的纳什均衡 –在这个游戏中,重要的是猜测对方的出牌规律, 同时避免对方猜到自己的出牌规律。也就是说, 要尽量让对手迷失。这种随机化自己可选策略 的做法,就是采取“混合策略”的思想。 –局中人以一定的概率p选择红,以一定的概率 1-p选择黑,则(p,1-p)概括了某个局中人所 有的混合策略。可知这样的混合策略有无穷多 个。两个局中人的策略组合有无穷多个
反应对应 q 1 BR2(p)
反 应 对 应
张红霞 国民经济管理系
0, if q 0.2 p [0,1], if q 0.2 1, if q 0.2 1, if p 0.5 q [0,1], if p 0.5 0, if p 0.5
0.2
不救济 混合策略 救济
张红霞 国民经济管理系
混合策略
i的混合战略空间: i 混合战略组合空间: i i ( 1 , n )为混合战略组合
参与人i的期望效用函数:vi ( ) vi ( i , i )
vi ( ) ( j ( s j ))ui ( s )
sS j 1
sS
张红霞 国民经济管理系
混合战略
硬币博弈 q (1-q)
a2
p
b2 -1, 1 1, -1
a1
1,-1 -1, 1
各种战略组合及其概率 pq (a1,a2) p(1-q) (a1,b2) (1-p)q (b1,a2) (1-p)(1-q) (b1,b2) 期望效用
v1 ( 1 , 2 ) pq 1 p(1 q)( 1) (1 p )q ( 1) (1 p )(1 q) 1 v2 ( 1 , 2 ) pq ( 1) p(1 q) 1 (1 p )q 1 (1 p )(1 q) ( 1)
相关文档
最新文档