管理运筹学课件第13章对策论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i xi ≥ 0
j 1, 2,L , n i 1, 2,L , m
甲的目标是期望赢得最大:maxV或min 1
令:xi
xi V
,则:
m i 1
xi
1 V
, 于是有 :
V
m
min xi i 1
aij xi ≥1 j 1, 2,L , n
i
课件xi ≥ 0
i 1, 2,L , m
20
综上所述,二人零和对策可 以表述成一对对偶规划:
max 514 21 434
min1
2020/5/14
课件
11
13.2.2 最大最小原则
1 L
A 1
M
a11
M
L O
m am1 L
n min
a1n M
max
ars
amn
如果ars ahk ,则该值所对 应的策略为最优纯策略
max 1 44 2 4 43
min ahk
【例13.4】
最优混合策略为max min E(X,Y ) min max E(X,Y )时X,Y的解
X S1 YS2
YS2 X S1
2020/5/14
课件
15
13.3.1 混合策略的概念
矩阵对策G S1 , S2 , A
甲的策略集S1 1 , ...,m 乙的策略集S2 1 , ..., n 赢得矩阵A aij mn
A M
M
O
M
xm am1 L amn
m
m
max ai1xi L ain xi
i 1
i 1
mn
min max
YS2* X S1* i 1
aij xi y j
j 1
V
2020/5/14
乙会使用某种策略组合y1,…,yn,使得最大 损失的某种概率组合尽可能地小.
因此有:
aij xi ≥V
i
xi 1
局中人采用不同策略对策时,各方总是有得或有失,统称赢得(payoff)或
得益。
1
2
3
4
5
6
(上中下) (上下中) (中上下) (中下上) (下上中) (下中上)
(1上中下) (2上下中) (3中上下) (4中下上) (5下上中) (6下中上)
3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
混合扩充:设有矩阵对策 G S1 , S2 , A 混合扩充 G* S1* , S2* , E
S2* y1 L yn
S1* S2
1 L n
S1
甲各方案最 小期望赢得
甲至少期望赢得
n
x1 1
A M M
xm m
a11 L
M
O
am1 L
a1n M amn
min a1 j y j
j 1
min
2 3 4 4 4
A 6 4 2
4 3 3
2 3 2
5 2 4
5 2
max
2
4
max 61 4432 44 432
最优纯策略(3 ,4 )
2020/5/14
min2
课件
12
13.3.1 混合策略的概念
【例13.5】 猜硬币游戏:甲、乙两个儿童玩猜硬币游戏, 甲手中拿着一枚硬币,把硬币盖在桌子上,让儿童乙猜是 正面向上还是反面向上。如若猜对甲给乙1元钱,猜错乙给 甲1元钱。
(2) 当x>0.5时,E1 E2 ,理性的儿童乙会选择猜正面; (3) 当x=0.5时,E1 E2 0 ,儿童乙不论采取何种策略,平均赢得都是零。
x
x
x
1
1
1
0.5
0.5
0.5
0
0.5
1y
乙的策略
2020/5/14
0
0.5
1y
同理甲的策略
课件
0
0.5
1y
最优混合策略
14
13.3.1 混合策略的概念
1 1 6
A1 3 5
4 1
0 4 2 1 3
第1列优超于 第5列,第4列 优超于第2列
1
1 6 A2 3 5
3
5 1.5
4 1 3
4
4 4
第1行优于 2、3行
0
A3
1
2 3 4 5
4 5 4 6.5
5 1.5 4
9
3 3 0 8
1
2
3
6 4 5
2020/5/14
最优纯策略(α1,β2)
第13章 对策论
教学目标与要求
【教学目标】 1. 理解下列基本概念: 矩阵对策,矩阵对策三要素,最优纯策略与最优混合策略,鞍点和对策值 2. 算法要求: (1) 会用“超优原则”和“最大最小”原则求矩阵对策的最优纯策略 (2) 会用“线性规划”方法求矩阵对策的最优混合策略 (3) 了解纯策略和混合策略的纳什均衡求取。 【知识结构】
课件
10
【例13.3】 某地区有甲、乙两家企业生产同种产品,采取相同的价格
出售,为了提高市场份额,均采取做广告的方式扩大自己的销售量。
甲和乙均有三种广告策略。甲企业所占的市场份额增加的百分数如下
面矩阵A所示。 1 2 3 min
A 1 2
3 5
1 6
4 1 1 6 max 1
3 4 2 3 3
2020/5/14
课件
5
13.1.1 对策模型的基本要素
1.局中人
局中人(players)是指参与竞争的各方,每方必须有独立的决策能力和承 担风险的能力。(如:田忌、齐王)
2.策略集
在对策问题中,局中人为了应对其他局中人的行动而采取的方案和手段 称为该局中人的一个策略(strategy)。
3.赢得及赢得函数
M
n
min amj y j
max
min
X S1* YS2*
m i 1
n
aij xi y j
j 1
m
m
j 1
乙各方案最大损失max ai1xi L max ain xi
i 1
i 1
mn
乙最多期望损失 min max a x y YS2* XS1* i1 j1 ij i j
由于甲乙都是理智的,故
1,-1 3,-3 -1,1 1,-1 1,-1 1,-1
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
2020/5/14
基本概念:三要素,分类
对
二人零和纯策略:超优原则、maxmin 和 minmax 原则
策
论
二人零和混合策略:图解法(2 行或 2 列收益矩阵)
LP 方法(一般情况)
2020/5/14
纳什均衡(非零和):纯策略(划线法) 混合策略(LP 方法)
课件
2
2020/5/14
课件
3
2020/5/14
课件
4
设局中人甲使用策略i的概率为xi
m
则m维概率向量x (x1,..., xm )T , xi 1, xi 0称为甲的一个混合策略 i 1
则m维称S1*
x
(x1,..., xm )T
|
m i 1
xi
1, xi
0 称为甲的混合策略集
同理可定义局中人乙的混合策略与混合策略集.
当甲采取混合策略x,乙采取混合策略y,则称(x,y)为一个混合局势.
β3
3
5
2
2
α2
3
0
x*
2 1x
故β1的概率为0.设β2,β3的概率为 y,(1-y).由效率矩阵:
0
y* 1 y
由于甲是理智的,故乙取最大损
2 3 11
A 7 5
2
失(粗线)
乙会在最大损失中找出最小,即 乙最优混合策略为:
可知,当甲使用α1,α2,时,乙的损失
2值020为/5/14:
课件
Y * (0, 9 , 2 ) 11 11 18
猜硬币游戏属于矩阵对策,儿童甲的策略有出正面向上(α1)
和出反面向上(α2),儿童乙的策略有猜正面向上(β1)和猜反
面向上(β2)。
min
A
1
1
1 1 1 1 max 1
max 1{1
min1
min j
max i
aij
min j
max i
aij
2020/5/14
课件
13
13.3.1 混合策略的概念
本章主要内容
13.1 对策论的基本概念 13.1.1 对策模型的基本要素 13.1.2 对策问题的分类 13.2 矩阵对策的纯策略 13.2.1优超原则 13.2.2最大最小原则 13.3 矩阵对策的混合策略 13.3.1 混合策略的概念 13.3.2 图解法 13.3.3 线性规划法 13.4 纳什均衡 13.4.1 纯策略纳什均衡的划线法 13.4.2 混合策略纳什均衡的LP方法 13.4 应用举例 案例13-1 市场竞争策略 案例13-2 对抗赛项目确定 本章小结
2 3 11
A 7
5
2
S1 1,2 S2 1, 2 , 3
解 设甲的混合策略为x,(1x),x∈[0,1], 则 乙 分 别 使 用 β1,β2,β3时,甲赢得值:
1 : v1 2x 7(1 x) 7 5x
2 : v2 3x 5(1 x) 5 2x
: v 2020/5/14 33
11
7 β1
5 β2
β3
3
2
2
课0 件
x*
1 x 17
13.3.2 图解法
从图还可以看出局中人乙的最 优混合策略为β2β3的组合.
11
1 : v3 3y 11(1 y) 11 8y 2 : v4 5y 2(1 y) 2 3y
y分别取0和1,绘制图形如下:
7 β1 5 β2
11 α1
2020/5/14
课件
9
13.2.1超优原则
1.对 r ,s 若恒有arj asj 则称 r 超优于 s 2.对 h , k 若恒有aih aik 则称 h 超优于 k
【例13.2】
第3行优超
6
1
A5
1
4 2 5 3
5 0 1.5 3
4 3 4 0
6.5
7
9
8
于第2行, 第1行优超 于第5行
甲会使用某种策略组合x1,…,xm,使得在最小赢得的概率组合尽可能地大.
因此有: aij y j ≤V
j
y j 1
j
i 1, 2,L , m
令:yj
yj V
,则:
n j 1
yj
1 V
,于是有 :
n
max
y
j
j 1
y j ≥ 0
j 1, 2,L , n
乙的目标是期望损失最小:minV或max 1
11x
2(1
x)
9x
2
步骤:
(1)绘制x数轴,标出x取值范围[0,1]
(2)x取0和1,确定三条直线端点,绘制三 条甲赢得值直线
(3)由于乙是理智的,甲的赢得值只能是 最小的(粗线所示)
(4)甲只能在最小中取最大,对应的策略 为 X * ( 3 , 8 ) ,最优对策值为V*=49/11
11 11
设甲出正面(α1)的概率x,出反面(α2)的概率1-x;乙猜正面(β1)的概率y,猜反 面(β2)的概率1-y。则乙两个策略的期望值分别为:
E1 1 x (1)(1 x) 2x 1 E2 (1) x 1 (1 x) 1 2x
令E1 E2 , 可得x 0.5
(1) 当x<0.5时,E1 E2,理性的儿童乙会选择猜反面;
课件
8
13.2 矩阵对策的纯策略
为求出对策模型的解,首先需要对双方的对策条 件作如下的假设。
(1) 对策双方的行为是理智的,对策略的选择不存 在任何侥幸心理。
(2) 局中人选取策略的目标是收益最大或损失最小。 (3) 局中人同时选取各自的行动策略,且不知道对
方选取哪一个策略。 (4) 对策中的有关规定和要求,局中人是知道的。
m
min xi i 1
aij xi ≥1 j 1, 2,L , n
i
xi ≥ 0
i 1, 2,L , m
n
max yj j 1
j
aij
y
j
≤1
i 1, 2,L , m
y
j
≥
0
j 1, 2,L , n
【例13.7】 7 2 9
A 2
2020/5/14
课件 V
j
aij yj ≤1
i 1, 2,L , m
yj ≥ 0
j 1, 2,L , n 19
13.3.3 线性规划法
同理,甲采取策略组合 x1,…,xm 时,也是从利己主 义出发的,会使自己的期望 赢得最大(也即乙的损失最 大)
y1 L yn
x1 a11 L a1n
G* S1* , S2* , E 表示一个混合策略矩阵对策及G的一个混合扩充.
2020/5/14
课件
16
13.3.2 图解法
图解法求解矩阵对策,一般
适用于赢得矩阵为 或 的对
策问题,对于 和 都较大的
对策问题就不适用了。下面
通过例子来说明这种方法。
【 例 13.7】 求 解 矩 阵 对
策 G S1, S2 , A ,其中
课件
6
13.1.2 对策问题的分类
局中人之
间是否允 许合作?
策略选择
是否与时 间有关?
合作对策 对 策 论
非合作对策
静态对策 动态对策
二人对策 多人对策
2020/5/14
局中人多 寡?
课件
零和对策 常和对策 变和对策
赢得值代 数和是否 为0?
7
13.1.2 对策问题的分类
2020/5/14
13.3.3 线性规划法
y1 L
x1 a11 L
A M
M
O
xm am1 L
yn
min
甲至少期望赢得
n
a1n a1 j y j
aM mn
j 1
M
n
amj y j
max
min
Βιβλιοθήκη Baidu
X S1* YS2*
m i 1
n
aij xi y j
j 1
V
j 1
乙采取策略组合y1,…,yn时,是从利己主义出发的,会使自己的期望损失最 小(也即甲的赢得最小)
j 1, 2,L , n i 1, 2,L , m
甲的目标是期望赢得最大:maxV或min 1
令:xi
xi V
,则:
m i 1
xi
1 V
, 于是有 :
V
m
min xi i 1
aij xi ≥1 j 1, 2,L , n
i
课件xi ≥ 0
i 1, 2,L , m
20
综上所述,二人零和对策可 以表述成一对对偶规划:
max 514 21 434
min1
2020/5/14
课件
11
13.2.2 最大最小原则
1 L
A 1
M
a11
M
L O
m am1 L
n min
a1n M
max
ars
amn
如果ars ahk ,则该值所对 应的策略为最优纯策略
max 1 44 2 4 43
min ahk
【例13.4】
最优混合策略为max min E(X,Y ) min max E(X,Y )时X,Y的解
X S1 YS2
YS2 X S1
2020/5/14
课件
15
13.3.1 混合策略的概念
矩阵对策G S1 , S2 , A
甲的策略集S1 1 , ...,m 乙的策略集S2 1 , ..., n 赢得矩阵A aij mn
A M
M
O
M
xm am1 L amn
m
m
max ai1xi L ain xi
i 1
i 1
mn
min max
YS2* X S1* i 1
aij xi y j
j 1
V
2020/5/14
乙会使用某种策略组合y1,…,yn,使得最大 损失的某种概率组合尽可能地小.
因此有:
aij xi ≥V
i
xi 1
局中人采用不同策略对策时,各方总是有得或有失,统称赢得(payoff)或
得益。
1
2
3
4
5
6
(上中下) (上下中) (中上下) (中下上) (下上中) (下中上)
(1上中下) (2上下中) (3中上下) (4中下上) (5下上中) (6下中上)
3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
混合扩充:设有矩阵对策 G S1 , S2 , A 混合扩充 G* S1* , S2* , E
S2* y1 L yn
S1* S2
1 L n
S1
甲各方案最 小期望赢得
甲至少期望赢得
n
x1 1
A M M
xm m
a11 L
M
O
am1 L
a1n M amn
min a1 j y j
j 1
min
2 3 4 4 4
A 6 4 2
4 3 3
2 3 2
5 2 4
5 2
max
2
4
max 61 4432 44 432
最优纯策略(3 ,4 )
2020/5/14
min2
课件
12
13.3.1 混合策略的概念
【例13.5】 猜硬币游戏:甲、乙两个儿童玩猜硬币游戏, 甲手中拿着一枚硬币,把硬币盖在桌子上,让儿童乙猜是 正面向上还是反面向上。如若猜对甲给乙1元钱,猜错乙给 甲1元钱。
(2) 当x>0.5时,E1 E2 ,理性的儿童乙会选择猜正面; (3) 当x=0.5时,E1 E2 0 ,儿童乙不论采取何种策略,平均赢得都是零。
x
x
x
1
1
1
0.5
0.5
0.5
0
0.5
1y
乙的策略
2020/5/14
0
0.5
1y
同理甲的策略
课件
0
0.5
1y
最优混合策略
14
13.3.1 混合策略的概念
1 1 6
A1 3 5
4 1
0 4 2 1 3
第1列优超于 第5列,第4列 优超于第2列
1
1 6 A2 3 5
3
5 1.5
4 1 3
4
4 4
第1行优于 2、3行
0
A3
1
2 3 4 5
4 5 4 6.5
5 1.5 4
9
3 3 0 8
1
2
3
6 4 5
2020/5/14
最优纯策略(α1,β2)
第13章 对策论
教学目标与要求
【教学目标】 1. 理解下列基本概念: 矩阵对策,矩阵对策三要素,最优纯策略与最优混合策略,鞍点和对策值 2. 算法要求: (1) 会用“超优原则”和“最大最小”原则求矩阵对策的最优纯策略 (2) 会用“线性规划”方法求矩阵对策的最优混合策略 (3) 了解纯策略和混合策略的纳什均衡求取。 【知识结构】
课件
10
【例13.3】 某地区有甲、乙两家企业生产同种产品,采取相同的价格
出售,为了提高市场份额,均采取做广告的方式扩大自己的销售量。
甲和乙均有三种广告策略。甲企业所占的市场份额增加的百分数如下
面矩阵A所示。 1 2 3 min
A 1 2
3 5
1 6
4 1 1 6 max 1
3 4 2 3 3
2020/5/14
课件
5
13.1.1 对策模型的基本要素
1.局中人
局中人(players)是指参与竞争的各方,每方必须有独立的决策能力和承 担风险的能力。(如:田忌、齐王)
2.策略集
在对策问题中,局中人为了应对其他局中人的行动而采取的方案和手段 称为该局中人的一个策略(strategy)。
3.赢得及赢得函数
M
n
min amj y j
max
min
X S1* YS2*
m i 1
n
aij xi y j
j 1
m
m
j 1
乙各方案最大损失max ai1xi L max ain xi
i 1
i 1
mn
乙最多期望损失 min max a x y YS2* XS1* i1 j1 ij i j
由于甲乙都是理智的,故
1,-1 3,-3 -1,1 1,-1 1,-1 1,-1
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
2020/5/14
基本概念:三要素,分类
对
二人零和纯策略:超优原则、maxmin 和 minmax 原则
策
论
二人零和混合策略:图解法(2 行或 2 列收益矩阵)
LP 方法(一般情况)
2020/5/14
纳什均衡(非零和):纯策略(划线法) 混合策略(LP 方法)
课件
2
2020/5/14
课件
3
2020/5/14
课件
4
设局中人甲使用策略i的概率为xi
m
则m维概率向量x (x1,..., xm )T , xi 1, xi 0称为甲的一个混合策略 i 1
则m维称S1*
x
(x1,..., xm )T
|
m i 1
xi
1, xi
0 称为甲的混合策略集
同理可定义局中人乙的混合策略与混合策略集.
当甲采取混合策略x,乙采取混合策略y,则称(x,y)为一个混合局势.
β3
3
5
2
2
α2
3
0
x*
2 1x
故β1的概率为0.设β2,β3的概率为 y,(1-y).由效率矩阵:
0
y* 1 y
由于甲是理智的,故乙取最大损
2 3 11
A 7 5
2
失(粗线)
乙会在最大损失中找出最小,即 乙最优混合策略为:
可知,当甲使用α1,α2,时,乙的损失
2值020为/5/14:
课件
Y * (0, 9 , 2 ) 11 11 18
猜硬币游戏属于矩阵对策,儿童甲的策略有出正面向上(α1)
和出反面向上(α2),儿童乙的策略有猜正面向上(β1)和猜反
面向上(β2)。
min
A
1
1
1 1 1 1 max 1
max 1{1
min1
min j
max i
aij
min j
max i
aij
2020/5/14
课件
13
13.3.1 混合策略的概念
本章主要内容
13.1 对策论的基本概念 13.1.1 对策模型的基本要素 13.1.2 对策问题的分类 13.2 矩阵对策的纯策略 13.2.1优超原则 13.2.2最大最小原则 13.3 矩阵对策的混合策略 13.3.1 混合策略的概念 13.3.2 图解法 13.3.3 线性规划法 13.4 纳什均衡 13.4.1 纯策略纳什均衡的划线法 13.4.2 混合策略纳什均衡的LP方法 13.4 应用举例 案例13-1 市场竞争策略 案例13-2 对抗赛项目确定 本章小结
2 3 11
A 7
5
2
S1 1,2 S2 1, 2 , 3
解 设甲的混合策略为x,(1x),x∈[0,1], 则 乙 分 别 使 用 β1,β2,β3时,甲赢得值:
1 : v1 2x 7(1 x) 7 5x
2 : v2 3x 5(1 x) 5 2x
: v 2020/5/14 33
11
7 β1
5 β2
β3
3
2
2
课0 件
x*
1 x 17
13.3.2 图解法
从图还可以看出局中人乙的最 优混合策略为β2β3的组合.
11
1 : v3 3y 11(1 y) 11 8y 2 : v4 5y 2(1 y) 2 3y
y分别取0和1,绘制图形如下:
7 β1 5 β2
11 α1
2020/5/14
课件
9
13.2.1超优原则
1.对 r ,s 若恒有arj asj 则称 r 超优于 s 2.对 h , k 若恒有aih aik 则称 h 超优于 k
【例13.2】
第3行优超
6
1
A5
1
4 2 5 3
5 0 1.5 3
4 3 4 0
6.5
7
9
8
于第2行, 第1行优超 于第5行
甲会使用某种策略组合x1,…,xm,使得在最小赢得的概率组合尽可能地大.
因此有: aij y j ≤V
j
y j 1
j
i 1, 2,L , m
令:yj
yj V
,则:
n j 1
yj
1 V
,于是有 :
n
max
y
j
j 1
y j ≥ 0
j 1, 2,L , n
乙的目标是期望损失最小:minV或max 1
11x
2(1
x)
9x
2
步骤:
(1)绘制x数轴,标出x取值范围[0,1]
(2)x取0和1,确定三条直线端点,绘制三 条甲赢得值直线
(3)由于乙是理智的,甲的赢得值只能是 最小的(粗线所示)
(4)甲只能在最小中取最大,对应的策略 为 X * ( 3 , 8 ) ,最优对策值为V*=49/11
11 11
设甲出正面(α1)的概率x,出反面(α2)的概率1-x;乙猜正面(β1)的概率y,猜反 面(β2)的概率1-y。则乙两个策略的期望值分别为:
E1 1 x (1)(1 x) 2x 1 E2 (1) x 1 (1 x) 1 2x
令E1 E2 , 可得x 0.5
(1) 当x<0.5时,E1 E2,理性的儿童乙会选择猜反面;
课件
8
13.2 矩阵对策的纯策略
为求出对策模型的解,首先需要对双方的对策条 件作如下的假设。
(1) 对策双方的行为是理智的,对策略的选择不存 在任何侥幸心理。
(2) 局中人选取策略的目标是收益最大或损失最小。 (3) 局中人同时选取各自的行动策略,且不知道对
方选取哪一个策略。 (4) 对策中的有关规定和要求,局中人是知道的。
m
min xi i 1
aij xi ≥1 j 1, 2,L , n
i
xi ≥ 0
i 1, 2,L , m
n
max yj j 1
j
aij
y
j
≤1
i 1, 2,L , m
y
j
≥
0
j 1, 2,L , n
【例13.7】 7 2 9
A 2
2020/5/14
课件 V
j
aij yj ≤1
i 1, 2,L , m
yj ≥ 0
j 1, 2,L , n 19
13.3.3 线性规划法
同理,甲采取策略组合 x1,…,xm 时,也是从利己主 义出发的,会使自己的期望 赢得最大(也即乙的损失最 大)
y1 L yn
x1 a11 L a1n
G* S1* , S2* , E 表示一个混合策略矩阵对策及G的一个混合扩充.
2020/5/14
课件
16
13.3.2 图解法
图解法求解矩阵对策,一般
适用于赢得矩阵为 或 的对
策问题,对于 和 都较大的
对策问题就不适用了。下面
通过例子来说明这种方法。
【 例 13.7】 求 解 矩 阵 对
策 G S1, S2 , A ,其中
课件
6
13.1.2 对策问题的分类
局中人之
间是否允 许合作?
策略选择
是否与时 间有关?
合作对策 对 策 论
非合作对策
静态对策 动态对策
二人对策 多人对策
2020/5/14
局中人多 寡?
课件
零和对策 常和对策 变和对策
赢得值代 数和是否 为0?
7
13.1.2 对策问题的分类
2020/5/14
13.3.3 线性规划法
y1 L
x1 a11 L
A M
M
O
xm am1 L
yn
min
甲至少期望赢得
n
a1n a1 j y j
aM mn
j 1
M
n
amj y j
max
min
Βιβλιοθήκη Baidu
X S1* YS2*
m i 1
n
aij xi y j
j 1
V
j 1
乙采取策略组合y1,…,yn时,是从利己主义出发的,会使自己的期望损失最 小(也即甲的赢得最小)