第3.2讲:纳什均衡(II):混合策略意义上的分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
* 1 pc 2 p* 1 g 2
20
期望得益等值法
21
给定“猜硬币方”选择混合策略 ( p g,1 p g ) ,那么: – “盖硬币方”选择纯战略“盖正面”的期望得益为
u c (1) p g 1 1 p g
1 2 pg
1 1 p c p g (1) 1 p c 1 p g
16
•
“猜硬币方”的期望得益为
u g 1 p c p g (1) p c 1 p g 2( p c p g ) 4 p c p g 1
猜硬币方
盖硬币方
15
期望得益最大化法
– 首先假定“盖硬币方”的混合策略为 ( p c,1 p c) , “猜硬 币方”的混合策略为 ( p g,1 p g ) 。 那么“盖硬币方”的期 望得益为:
u c (1) p c p g 1 p c 1 p g 2( p c p g ) 4 p c p g 1
37
38
–
两个反应函数的唯一交点为(1/2,1/2) ,这表
1 1 明, 在该博弈中, 只有 p c 和 p g 才是相 2 2
互对对方最佳反应的混合策略概率分布,这正 是本博弈唯一的混合策略纳什均衡.
39
混合策略反应函数法
反应函数是一博弈方对另一博弈方每种可能的决策内容的最佳反应决策组成的函 数. 在纯策略的范畴中,反应函数是个博弈方选择的纯策略对其他博弈方纯策略的反 应. 在混合策略的范畴内,博弈方的决策内容为选择概率分布,反应函数就是以方对另 一方的概率分布的反应,同样也是一定的概率分布.
31
–
首先假定“盖硬币方”的混合策略为 ( p c,1 p c) ,“猜硬币方” 的混合策略为 ( p g,1 p g ) 。那么我们可以确定一下 p c 与 p g 之间的相互决定关系。
32
1 (1)当猜硬币方选择“猜正面”的概率 p g 时,“盖硬币方”应该 2
选择纯策略“盖正面”,这就相当于在混合策略 ( p c,1 p c) 中令
1 1 当 时 p g 2 1 p c R c ( p g ) [0,1] 当 p g 时 2 1 当pg 时 0 2
36
–
同理,可以得到“猜硬币方”对“盖硬币方”的反应函数:
1 当pc 时 0 2 1 p g R g ( p c ) [0,1] 当 p c 时 2 1 当pc 时 1 2
纳什均衡的本质规定性是“均衡策略组合满足各博弈方的策略相互是对其他博弈方 策略的最佳对策”。
12
1.确定“混合策略纳什均衡”的方法
期望得益最大化法; 期望得益等值法; 反应函数法。
13
以“猜硬币博弈”为例
14
猜硬币博弈
博弈的混合策略纳什均衡为“盖硬币方”以1/2的概率随机选择纯策略“盖正面”, “猜硬币方”以1/2的概率随机选择纯策略“猜正面”。
u c u c 的混合策略。
23
1 u u pg 2
c c
“猜硬币方”应该采取混合策略(1/2,1/2) 。
24
给定“盖硬币方”选择混合策略 ( p c,1 p c) ,那么 – “猜硬币方”选择纯战略“猜正面”的期望得益为
u g 1 p c (1) 1 p c
1
第3讲: 纳什均衡(Nash Equilibrium)
——混合策略意义上的分析
2
我们已经学习了如下四种博弈的基本分析思 路和方法:
I、严格上策均衡分析 II、严格下策反复消去法 III、划线法
IV、箭头法
其中,前两种是以策略之间的绝对优劣关系为基础,后两种是以策略之间的相对优 劣关系为基础。
pc 1 ,因为这样赢多输少;
1 当 p g 时, 2 p c =1
33
1 (2)当猜硬币方选择“猜正面”的概率 p g 时, “盖硬币 2
方”应该选择纯策略“盖反面” ,这就相当于在混合策略
( p c,1 p c) 中令 pc 0 ,因为这样赢多输少;
1 当 p g 时, 2 p c =0
2 pc 1
– “猜硬币方”选择纯战略“猜反面”的期望得益为
u g (1) p c 1 1 p c
1 2 pc
25
•
当 u g u g 时,“猜硬币方”将选择纯战略“猜正面”而获益,当 u g u g 时,“猜硬币
方”将选择纯战略“猜反面”而获益。 •
40
确定“混合策略纳什均衡”的方法
期望得益最大化法; 期望得益等值法;
反应函数法。
41
2.纳什均衡的存在性
42
纳什定理
– 在一个有 n 个博弈方的博弈 G S1,, S n; u1,, u n 中,如果 n 是有限的,且 S i 都是有限集(对 ,则该博弈至少存在一个纳什均衡,但可 i 1,, n ) 能包含混合策略.
– “盖硬币方”选择纯战略“盖反面”的期望得益为
u c 1 p g (1) 1 p g
2 p g 1
22
•
当 uc 时,“盖硬币方”将选择纯战略“盖正面”而获益,当 uc u u c 时,“盖硬币方”将选择纯战略“盖反面”而获益。 c
•
为了不给予“盖硬币方”以可乘之机,“猜硬币方”应该选择满足
(1) 1 p c p g 1 1 p c 1 p g
17
–
对 u c 求偏微分,得到“盖硬币方”最优化的一阶条件为:
u c 2 4 pg 0 pc
– 对 u g 求偏微分,得到“盖硬币方”最优化的一阶条件为:
来自百度文库
u g 2 4 p c 0 pg
34
1 (3) 当猜硬币方选择“猜正面”的概率 p g 时,对 2
于“盖硬币方”来说, p c 等于任何值都一样,即不管 采用纯策略还是任何混合策略,所得到的期望得益都一 样。
1 当 p g 时, p c [0,1] 2
35
–
上述三条刻画了一个 p c 随 p g 的变化而变化的函数关 系(反应函数) ,记为 p c R c( p g ) 。具体地,
18
–
求解如下方程组
u c p 2 4 pg 0 c u g 2 4 p 0 c pg
19
–
在混合策略纳什均衡中,“盖硬币方”以 1/2 的概率选择“盖正 面”,以 1/2 的概率选择“盖反面”;“猜硬币方”以 1/2 的概率 选择“猜正面”,以 1/2 的概率选择“猜反面”。
6
混合策略的较正式定义:
在博弈 G S1,, S n; u1,, u n 中,博弈方 i 的 纯策略空间为 S i si1, si 2,, sik , 则博弈方 i 以 概率分布 pi pi1, pi 2,, pik 随机在其 k 个可 选策略中选择的 “策略” , 称为一个 “混合策略” , 其 中 对 于 j 1,, k , 都 成 立 0 pij 1 , 且
为了不给予“猜硬币方”以可乘之机,“盖硬币方”应该选择满足 u g u g 的混合策
略。
26
1 u u pc 2
g g
•
“盖硬币方”应该采取混合策略(1/2,1/2) 。
27
期望得益等值法
博弈的混合策略纳什均衡为“盖硬币方”以1/2的概率随机选择纯策略“盖正面”, “猜硬币方”以1/2的概率随机选择纯策略“猜正面”。这与利用“期望得益最大 化法”获得的结果完全一致。
pi1 pi 2 pik 1。
7
纯策略与混合策略之间的关系
纯策略可以看作为特殊的混合策略,即选择相应纯策略的概率为1,选择其余纯策 略的概率为0的混合策略。 如“猜硬币博弈”中,纯策略“盖正面”可以看做为(1,0),纯策略“盖反面” 可以看做为(0,1)。
8
猜硬币方
28
“期望得益等值法”的思路总结
令各个博弈方随机选择纯策略的概率分布,满足使对方或其他博弈方采用不同纯策 略的期望得益相同,从而计算出各个博弈方随机选择各纯策略的概率。
29
反应函数法
30
反应函数法
将博弈方的策略空间扩展到混合策略,将纳什均衡扩展到包括混合策略纳什均衡以 后,求纯策略纳什均衡的反应函数法也可以扩展到求混合策略纳什均衡。
43
用通俗的语言,纳什定理就是说“每一个有限博弈都至 少有一个混合策略纳什均衡”.该定理说明了纳什均衡 的普遍存在性,这也就意味着纳什均衡分析在我们遇 到的大多数博弈问题中,都是一种基本的分析方法.
44
纳什均衡的普遍存在性,意味着纳什均衡分析在我们 所遇到的大多数博弈问题中,都是一种基本的分析方 法。 正是因为有普遍存在性,纳什均衡是博弈结果的“一 致预测性”的性质才有意义,纳什均衡才会成为分析 博弈和预测博弈结果的中心概念和基本出发点。
3
前述四种纳什均衡分析方法无法对如下两类博弈的博弈方的选择和博弈结果作明确 的预测,也就无法给博弈方提供明确的建议:
不存在纳什均衡的博弈,如猜硬币博弈。 纳什均衡不唯一的博弈,如夫妻之争博弈。
4
需要引入“混合策略”和“混合策略纳什均衡”概念
5
混合策略
博弈方以一定的概率分布在可选策略中随机选择的决策方式,在分析原来没有纳什 均衡的博弈时有非常重要的意义。 在博弈论中,通常把这种策略选择方式称为“混合策略”(Mixed Strategy)。与此 对应地,把博弈中原来意义上的策略称为“纯战略”(Pure Strategy)。
盖硬币方
9
混合策略可以看作纯策略的扩展,即如果给一个博弈的每个博弈方的纯策略空间赋 予不同的概率分布,就形成了不同的混合策略。
10
需要在混合策略的意义上定义纳什均衡
博弈方的策略从“纯策略”扩展到“混合策略”。 博弈方的策略空间从“纯策略空间”扩展到“混合策略空间”。
11
混合策略意义上的纳什均衡,简称为“混合 策略纳什均衡”。