《博弈论与信息经济学》混合战略纳什均衡
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
p*
q*
1, 1,
3,0 4 1 ,0 4
有两个纯战略均衡:(德语,德语)、(法语,法语);
一个混合战略均衡:p*, q* 3 4,1 4。
p
甲
1
3/4 乙
O 1/4
12
1q
博弈论与信息经济学
▪ 解法2:代数法
甲和乙的期望盈利:v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
q2
C
r1
C
r2
4r1 2 2q1 q2 4r2 1 q1 q2 8q1 4q2 6 0
4r1 r2 11 q1 q2 1 0
4r1 2 2 p1 p2 4r2 1 p1 p2 8 p1 4 p2 6 0
4r1 r2 11 p2 p2 1 0
参与人i的期望盈利为:vi pi , pi
n
pj
sj
ui
s
。
sS j1
6
博弈论与信息经济学
2020/6/11
父母/儿子
支助 父 (p1) 母 不助
(p2)
儿子
立志(q1)
不立志(q2)
32
-1 3
-1 1
00
期望盈利:
1 3 p1q1 p1q2 p2q1 0 2 2q1 p1 q1 p2 3q2 p1 0
4q1 2 2 p1 p2 4q2 1 p1 p2 8 p1 4 p2 6 0
4q1 q2 11 p1 p2 1 0
p1*
1 2
,
p2*
0,
p3*
1 2
q1*
1 2
, q2*
0, q3*
1 2
r1*
1 2
,
r2*
0, r3*
1 2
17
博弈论与信息经济学
2
即p 1 ,则q能取任意值,即q 0,1。
2
9
博弈论与信息经济学
2020/6/11
0 如果q 1 2
1 如果q 1 2
反应函数:p 0,1如果q 1 2,q 0,1如果q 1 2
1 如果q 1 2
0 如果q 1 2
由此可知,这个博弈的纳什均衡为p* 1 2,q* 1 2。
p
2020/6/11
14
博弈论与信息经济学
2020/6/11
A/B/C (sc=1)
1 A2
3
A/B/C (sc=2)
1 A2
3
A/B/C (sc=3)
1 A2
3
1 3,3,3 2,3,3 1,3,3
1 3,3,2 2,3,2 1,3,2
1 3,3,1 2,3,1 1,3,1
B 2 3,2,3 2,2,3 1,2,3
儿子
立志
放荡
32
-1 3
-1 1 0 0
1
博弈论与信息经济学
假定父母选择支助的概率为p1,选择不支助的概率为p2 1- p1 ; 儿子选择立志的概率为q1,选择不立志的概率为q2 1- q1 。那么
对两个参与人,各自的盈利函数为:
v1
3 p1q1
1
p1q2
1
p2q1
5
p1q1
p1
q1
v2 2 p1q1 p2q1 3 p1q2 2 p1q1 q1 3 p1
完全信息静态博弈。)
甲/乙
乙 红(q) 黑(1-q)
红(p) -1
11
-1
甲
黑(1-p) 1
-1 -1
1
2020/6/11
期望盈利为:v甲 v乙
p, p,
q q
2p 2q
1 2p
2q 1
2q 1 2 p 1
8
博弈论与信息经济学
2020/6/11
对于甲来说,为使盈利达到最大,只有调整p。如果1 2q 0, 即q 1 ,则p越大越好,而p的最大值只能取1;如果1 2q 0,
B 2 3,2,2 6,6,6 5,6,6
B 2 3,2,1 6,6,5 5,6,5
3 3,1,3 2,1,3 1,1,3
3 3,1,3 6,5,6 5,5,6
3 3,1,1 6,5,5 9,9,9
15
博弈论与信息经济学
解:
矩阵1
A1 A2
r1 2 p1 p2 1 r2 4q1 2 p1
不助 3
3 ,2 -1,1
-1,3 0 ,0
博弈论与信息经济学
▪ 父母的最佳选择p*=0.5,儿子的最佳选择q*=0.2,解释如下:
• (1)当父母选择支助的概率p>0.5时,儿子的最佳选择就是放荡;当父母选择 支助的概率p<0.5时,儿子的最佳选择就是立志。
• (2)当儿子选择立志的概率q>0.2时,父母的最佳选择就是支助;当儿子选择 立志的概率q<0.2时,父母的最佳选择就是不支助。
v甲
p
v乙
q
4q 1 0 4p 3 0
p*
q*
3 4 1 4
2020/6/11
13
博弈论与信息经济学
▪ 例3(三人博弈)
• 三个参与人A、B、C,每个人的战略集为{1,2,3}。每个人对应于某个战略 的支付是用三个人选择战略中的最小数字乘以4,再减去自己所选择战略的值。
• 三个局中人的混合战略为:p,q,r • 学习如何写出三个局中人的矩阵型表达式。
甲
1
1/2
乙
O
1/2
1q
10
博弈论与信息经济学
2020/6/11
▪ 解法2:代数法
v甲 p, q 2 p 1 2q 2q 1 v甲
v乙
p,
q
2q
2
p
1
2
p
1
v乙
p q
1 2q 2p 1
0 0
p* q*
1 1
2 2
▪ 例2.
甲/乙
乙 德(q) 法(1-q)
德(p) 3
21
1
甲
法(1-p) 0
02
3
甲和乙的期望盈利:v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
11
博弈论与信息经济学
2020/6/11
▪ 解法1:反应函数法
反应函数如下:
1
p 0,1
0
如果q 1 4
1
如果q 1 4,q 0,1
如果q 1 4
0
如果p 如果p 如果q
3 3 3
4 4 ,均衡 4
▪ (1)混合策略
• 纯战略:参与人在给定的信息下只选择一种特定战略, 这样情况下的战略,称为纯战略。
• 混合战略:参与人在给定信息下以某种概率分布选择不 同的战略,在原来纯战略的基础上,选择某个战略的概 率分布称为混合战略。
2020/6/11
5
博弈论与信息经济学
2020/6/11
混合策略的定义:在n人博弈G S1,L , Sn;u1,L ,un中,假定参与人i有 K个纯战略,即Si si1,L , siK ,则概率分布pi pi1,L , piK ,0 pik 1,
b.对于儿子的期望盈利v2,如果1 2 p1 0,即父母的混合战略p1 0.5,则
儿子的混合战略取最大值q1 1时,v2最大;相反,如果1 2 p1 0,父母的
混合战略p1 0.5,则儿子的混合战略取最大值q1 0时,v2最大。
儿子 父母/儿子
立志(q1) 放荡(q2)
支助 父 (p1) 母
v1
p1
v2
q1
5q1 1 0 1 2 p1 0
p1 q1
p2 0.5 0.2,q2
0.8
2020/6/11
2
博弈论与信息经济学
2020/6/11
▪ 进一步浪子博弈还可以作出如下解释:
期望盈利:v1 v2
3 p1q1 2q1 p1
p1q2 q1 p2
p2q1 3q2 p1
3r1 r2
4q1
p1
1
6
4
p1
C 3
1
r1
r2
4q1
2
p1
p2
2
4q2
p1
p2
1
ຫໍສະໝຸດ Baidu
9
8 p1
4
p2
2020/6/11
16
博弈论与信息经济学
2020/6/11
A A1 A2 A3 B B1 B2 B3 C C1 C2 C3
A
p1
A
p2
B
q1
B
K
pik 1,pik p sik 是i选择战略sik的概率,pi称为参与人i的混合战略。
k 1
i 代表i的混合战略空间,pi i 。
▪ (2)期望盈利
对于博弈G S1,..., Si ,..., Sn;u1,..., ui ,..., un,对应于s s1,..., si,..., sn 有p p1,..., pi ,..., pn ,pi i ,p表示局中人i的混合战略组合,那么,
2020/6/11
父母/儿子 父 支助 母 不助
儿子
立志
放荡
32
-1 3
-1 1 0 0
4
博弈论与信息经济学
• 从上例中可以看出,当参与人在选择战略具有不确定性, 考虑纳什均衡时,具体战略的盈利已经显得不很重要, 重要的是某个战略的概率分布,因此,纳什均衡的解也 就必须包含概率,这样的支付或盈利就称为期望盈利。
0
0
p1 5q1 1 q1 1 2 p1
q1 3
p1
a.对于父母的期望盈利v1,如果5q1 1 0,即儿子的混合战略q1 0.2,则
父母的混合战略取最大值p1 1时,v1最大;相反,如果5q1 1 0,即儿子
的混合战略q1 0.2,则父母的混合战略取最小值p1 0时,v1最大。
p2
5
4q1
A3 1 r1 r2 p1 8q1 4q2 6 p2 4q1 4q2 3 9 8q1 4q2
矩阵2
BB21
r1 2q1 r2 4 p1
q2 1 2 q1
q2
5
4
p1
B3
1
r1
r2
q1
8 p1
4
p2
6
q2
4
p1
4
p2
3
9
8 p1
4 p2
矩阵3
C1 C2
2
即q 1 ,则p越小越好,而p的最小值只能取0;如果1 2q 0,
2
即q 1 ,则p能取任意值,即p 0,1。
2
对于乙来说,为使盈利达到最大,只有调整q。如果2 p 1 0, 即p 1 ,则q越大越好,而q的最大值只能取1;如果2 p 1 0,
2
即p 1 ,则q越小越好,而q的最小值只能取0;如果2 p 1 0,
❖ 1.混合策略与期望盈利
▪ 例:浪子博弈
• 在这一博弈中,两个参与人都不知道对方选择是否确定地选择某个策略,因此, 按照以前所学的知识无法得出均衡解。但是,如果知道对方将以某一概率对某 一策略进行选择的话,就可以得出反应函数,就可以按照纳什均衡的方法求得 解。
2020/6/11
父母/儿子 父 支助 母 不助
7
博弈论与信息经济学
❖ 2.混合战略纳什均衡
▪ 例1.
对于n人混合博弈G S1,L , Sn;u1,L ,un,pi si i ,如果
p* p1*,L , pn* 满足vi pi*, p*i vi pi , p*i ,则称p*为该博弈
的混合战略纳什均衡。(海萨尼认为,混合战略博弈就是不