《运筹学教程》胡云权第五版运筹学6对策论矩阵对策 34页
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ⅱ的策略集为: S2 {1, 2 , j , , n} 。
当Ⅰ、Ⅱ分别选择纯策略i , j 时,形成了一个纯局势
(i , j ) S S1 S2 ,则对任一 (i , j ) S ,记Ⅰ的赢得 值为 ai j ,即Ⅱ赢得值为 ai j (i 1,2,, m; j 1,2,, n) .
矩阵对策的混合策略
2、混合局势
对每一个
x
S1*
和
y
S
* 2
分别称为Ⅰ和Ⅱ的混合策
略(或策略)。 (x, y) 称为一个混合局势(或局势)。
3、赢得期望
对每一个混合局势 (x, y) ,用
mn
E(x, y) xT Ay
aij xi y j
i1 j1
表示局中人 I 在混合局势(x, y)的赢得期望值。
为3, 1分别是局中人Ⅰ、Ⅱ的最优纯策略。
事实:对策 G 的值VG ai* j* 是 A a 中 i* j* 所在的行的最小
元素,又是所在列的最大元素,即
a ij
*
ai* j*
ai* j 。
矩阵对策的纯策略
4、矩阵对策的鞍点与解
对于一个对策G={S1, S2, A}, 若
有
max i
1)+ 2
9 2
取 x* {1 ,3}, y* {1 ,1}
44
22
则 E(x*, y*) 9 ,E(x*, y) E(x, y*) 9 ,即 E(x, y*) E(x*, y*) E(x*, y)
2
2
故 x* {1 ,3}, y* {1 ,1} 分别为局中人 I 和局中人 II 的最优混合策略,
第六章 对策论
基本概念
对策论又称博弈论,研究冲突对抗条件下最优决策问题
的理论。
策略形势:不完全竞争条件下的对抗行为,各方收益由
自身行为和其他方行为共同决定。
基本要素
局中人(I ):有权决定自己行动方案的对策参加者,理性人 策略集(S ):供局中人选择的实际可行完整行动方案的集合,
一局对策中,各局中人选定策略的集合,称局势
赢得函数( H(s) ):对于任一局势,局中人的赢得值。支付函数
严格占优策略/严格劣势策略 上策均衡/纳什均衡
典型案例和重要结论
囚徒困境 智猪博弈
结论1:不要选择严格劣势策略。 结论2:个人理性选择导致非最优。 结论3:学会换位思考。 求解方法:删除严格劣势策略
矩阵对策的基本理论
x* ( 3 , 8 )T 11 11
由图可见局中人II的混合策 略只有β2和β3组成。
如
果
max i
min j
aij
min j
max i
aij
ai* j*
成立,记 VG
ห้องสมุดไป่ตู้ai* j*
,则
称VG ai* j* 为矩阵对策 G 的值.
相应的纯局势 (i* , j* ) 为 G 在纯策略下的解,i* 与 j*
分别称为局中人Ⅰ与Ⅱ的最优纯策略。
从上例看出,矩阵A中平衡局势(α2 ,β2)对应的元素
44
22
对策的值(局中人
I
的赢得期望值)VG
9 2
。
矩阵对策的解法
图解法
仅适用于赢得矩阵为2×n或m×2阶的矩阵对策问题。
例:求解矩阵对策G={S1 , S2 ; A} ,其中
A
解:(1)不存在鞍点,为混合策略求解问题。
2 7
3 5
11
2
(2)图解法求解
设局中人I的混合策略为(x, 1-x)T,x [0,1] 。
{S1*
,
S
* 2
;
E}
是矩阵对策
G
{S1, S2; A}的混合扩充。
如果
max min
xS1* yS2*
E(x,
y)
min
yS2*
max
xS1*
E(x,
y)
,其值为 VG
,则称
VG 为
对策 G* 的值,相应的混合局势 (x*, y*) 称为在混合策略意义下的
解, x* , y* 分别称为局中人Ⅰ和Ⅱ的最优混合策略(最优策略)。
例:田忌赛马
局中人:田忌(I)、齐王(II) S1 ={(上、中、下),(上、下、中),(中、上、下),
(中、下、上),(下、中、上),(下、上、中)}= S2
3 1 1 1 1 1
1
3
1
1
1
1
1 1 3 1 1 1
A 1 1
1
3
1
1
1 1 1 1 3 1
对策/博弈分类
局中人个数:二个,多个 策略集中的个数:有限,无限 支付/赢得代数和:零和,非零和 局中人是否合作:非合作,合作 局中人行动时间:静态,动态 局中人对他者信息了解程度:完全信息,非完全信息 对策次数:单次,重复
课程目标
理解并掌握矩阵对策的纯策略 理解并掌握矩阵对策的混合策略 掌握矩阵对策的求解方法
,,
yn}
S
* 2
是局中人Ⅱ的一个混合策略;
局中人Ⅰ选取
x S1* 使得保证赢得不少于 v1
max min
xS1* yS2*
E(x,
y) ,
局中人Ⅱ力争保证自己的所失至多 v2
min max E(x, y) 。
yS2* xS1*
矩阵对策的混合策略
5、最优混合策略
定义 4:设 G*
据定义 1,不存在纯策略意义下的解。 无鞍点
例:
G
{S1,
S2;
A} ,其中
A
3 5
63 44
56
局中人Ⅰ和Ⅱ在策略集 S1 和 S 2 中采取每一策略都有一
定的可能性,即有一定的概率,则构成了混合策略。
矩阵对策的混合策略
1、混合策略
定义 2:设矩阵对策 G {S1, S2; A},其中 S1 {1,2,,m} ,
矩阵对策的策略
纯策略:确定的选择某策略 混合策略:以某一概率分布选择各策略。
矩阵对策的纯策略
1、矩阵对策的一般表达
设用Ⅰ、Ⅱ分别表示两局中人,Ⅰ有 m 个纯策略
1,2 ,,m ,Ⅱ有 n 个纯策略 1, 2 ,, n ,则
Ⅰ的策略集为: S1 {1,2 , i , ,m},
1 1 1 1 1 3
矩阵对策的纯策略
2、矩阵对策解的引例
例: 设 G {S1, S2; A} ,
其中 S1 {1,2,3,4} , S2 {1, 2, 3},
6
A
3
9
3
1 2 1 0
8 -8
4
2
10 -
6
10
ai1j1 = ai2j2
性质2:可交换性
若(αi1 ,βj1)和(αi2,βj2)是对策G的两个解,则(αi1 ,βj2) 和(αi2,βj1)也是对策G的两个解。
矩阵对策的值唯一。即当一个局中人选择了最
优纯策略后,他的赢得值不依赖于对方的纯策略。
作业
P385 习题 • 12.2 • 12.3 • 12.4
I
II
11
7
5
B2
2 B1
0 I
B3
3
B4 2
1 II
2 3 11
A 7 5
2
④ 求解方程组可得最优混合策 略和矩阵对策的值。
联立过B2点两条直线的方程组 为
3x 5(1 x) VG 11x 2(1 x) VG
可解得
3
49
x 11,VG 11
则,局中人I 的最优策略为
I
II ① 数轴上坐标为0和1的两点分
11 别做两条垂线I-I和II-II。
7
② 画出局中人II的不同策略下 局中人I的赢得线段。
5
3
β1: v11 = 2x+7(1-x)
2
2
β2 : v12 = 3x+5(1-x)
0
1
β3 : v13 = 11x+2(1-x)
I
II
图解法
③由于局中人II理性,局中人 I从最少可能收入中选择最大 的一个,为局中人I的最优对 策。B2
min j
aij
min j
max i
aij
ai* j*
则称局势(αi*, βj*)为对策G的
鞍点,V = a i*j*为对策G的值。
注:在矩阵中,一个数在所在行中是最大值,在所 在列中是最小值,则被称为鞍点。
矩阵对策的纯策略
4、矩阵对策的鞍点与解 多鞍点与无鞍点对策 例: 设有一矩阵对策如下,求它的解。
4、混合策略对策模型
一个新的对策 G*
{S1*
,
S
* 2
;
E}
,则称
G
*
为
G
的混合扩充。
矩阵对策的混合策略
5、最优混合策略
设
G*
{S1*
,
S
* 2
;
E}
,是矩阵对策
G
{S1,
S2;
A}
的混合扩充。
x {x1, x2 ,, xm} S1* 是局中人Ⅰ的一个混合策略;
y
{ y1 ,
y2
a22既是其所在行的最小元素,也是其所在列的最大元素,
即有 ai2≤a22 ≤ a2j i=1,2,3,4 j=1,2,3
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定理 1: 矩阵对策 G {S1, S2; A}在纯策略意义下有解的充要条
件是:存在纯局势
( i
*
,
j*
)
使得对一切
i
1,2,, m;
6 5 6 5
A 1 4 2 1 8 5 7 5
0 2 6
2
局势(α1, β2),(α1, β4),(α3, β2)(α3, β4) 均构成鞍点,此对策有多个解。
矩阵对策的纯策略
5、矩阵对策纯策略的性质
性质1:无差别性
若(αi1 ,βj1)和(αi2,βj2)是对策G的两个解,则
S2 {1, 2 ,, n}, A {aij }mn ,记
m
S1* {x E m | xi 0,1 i m, xi 1} i 1
n
S
* 2
{y En
|
yj
0,1
j
n,
y j 1},
j 1
则称
S1*
和
S
* 2
分别为局中人Ⅰ和Ⅱ的混合策略集或策略集。
E(x, y*) E(x*, y*) E(x*, y)
E(x, y*) xT Ay* E(x*, y*) (x*)T Ay* E(x*, y) (x*)T Ay
矩阵对策的混合策略
3、最优混合策略解的引例
例:对策
G
{S1,
S2;
A} ,其中
A
3 5
6 4
设 x (x1, x2 ) 为局中人 I 的混合策略, y ( y1, y2 ) 为局中人 II 的混合策略,则
矩阵对策的混合策略
1、混合策略
对于 G {S1, S2; A}
局中人Ⅰ有把握的赢得至少为 v1
max min
i
j
aij
局中人Ⅱ有把握的支付至多为 v2
min j
max i
aij
一般为 v1 v2 ,特别地当 v1 v2 时,则称对策 G 在
纯策略意义下的解,即VG v1 v2 。实际多 v1 v2 ,根
a11 a12 a1n
记
A
a21
a22
a2n
am1
am2
amn
Ⅰ的赢得矩阵 或Ⅱ的支付矩阵
Ⅱ的赢得矩阵为-A 。
矩阵对策的纯策略
1、矩阵对策的一般表达
如果局中人Ⅰ、Ⅱ的策略集为 S1, S2 ,局中人Ⅰ的赢得矩阵
为 A,则矩阵对策的模型为
G {, ; S1, S2; A} 或 G {S1, S2; A}
S1* {(x1, x2 ) | x1, x2 0, x1 x2 1}, S2* {( y1, y2 ) | y1, y2 0, y1 y2 1}
局中人 I 的赢得期望值
E(x,
y)
3x1 y1
6x1y2
5x2 y1
4x2 y2
4(x1
1 4
)(
y1
j
1,2,, n
均有
a ij
*
ai* j*
ai* j
2 7 2 1 1
例: G {S1, S2; A},其中 A 2
3
2 5
3 4
4 2 4 3
2 2 1 6 1
3746
由
max i
min j
aij
min j
max i
aij
a31
3 则VG
3 ,G 的解
9 2 6 -3
理智行为:从各自最不利情形中选择最有利 I:最大最小原则 II:最小最大原则
平衡局势:双方均可接受,且对双方都是最稳妥的结果。 (α2 ,β2),局中人I和II的最优纯策略。
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定义 1:设 G {S1, S2; A}为矩阵对策,其中
S1 {1,2 ,,m} , S2 {1, 2 ,, n}, A {aij }mn ,
注:当Ⅰ取纯策略 k 时,等价于混合策略 x {x1, x2 ,, xm} S1*
其中 xi
1,i k 0,i k
。
矩阵对策的混合策略
2、最优混合策略 定理2:矩阵对策G在混合策略意义下有解的充要条件是:
存在 x* S1*, y* S2* ,使得对于任意 x S1*, y S2* ,有
当Ⅰ、Ⅱ分别选择纯策略i , j 时,形成了一个纯局势
(i , j ) S S1 S2 ,则对任一 (i , j ) S ,记Ⅰ的赢得 值为 ai j ,即Ⅱ赢得值为 ai j (i 1,2,, m; j 1,2,, n) .
矩阵对策的混合策略
2、混合局势
对每一个
x
S1*
和
y
S
* 2
分别称为Ⅰ和Ⅱ的混合策
略(或策略)。 (x, y) 称为一个混合局势(或局势)。
3、赢得期望
对每一个混合局势 (x, y) ,用
mn
E(x, y) xT Ay
aij xi y j
i1 j1
表示局中人 I 在混合局势(x, y)的赢得期望值。
为3, 1分别是局中人Ⅰ、Ⅱ的最优纯策略。
事实:对策 G 的值VG ai* j* 是 A a 中 i* j* 所在的行的最小
元素,又是所在列的最大元素,即
a ij
*
ai* j*
ai* j 。
矩阵对策的纯策略
4、矩阵对策的鞍点与解
对于一个对策G={S1, S2, A}, 若
有
max i
1)+ 2
9 2
取 x* {1 ,3}, y* {1 ,1}
44
22
则 E(x*, y*) 9 ,E(x*, y) E(x, y*) 9 ,即 E(x, y*) E(x*, y*) E(x*, y)
2
2
故 x* {1 ,3}, y* {1 ,1} 分别为局中人 I 和局中人 II 的最优混合策略,
第六章 对策论
基本概念
对策论又称博弈论,研究冲突对抗条件下最优决策问题
的理论。
策略形势:不完全竞争条件下的对抗行为,各方收益由
自身行为和其他方行为共同决定。
基本要素
局中人(I ):有权决定自己行动方案的对策参加者,理性人 策略集(S ):供局中人选择的实际可行完整行动方案的集合,
一局对策中,各局中人选定策略的集合,称局势
赢得函数( H(s) ):对于任一局势,局中人的赢得值。支付函数
严格占优策略/严格劣势策略 上策均衡/纳什均衡
典型案例和重要结论
囚徒困境 智猪博弈
结论1:不要选择严格劣势策略。 结论2:个人理性选择导致非最优。 结论3:学会换位思考。 求解方法:删除严格劣势策略
矩阵对策的基本理论
x* ( 3 , 8 )T 11 11
由图可见局中人II的混合策 略只有β2和β3组成。
如
果
max i
min j
aij
min j
max i
aij
ai* j*
成立,记 VG
ห้องสมุดไป่ตู้ai* j*
,则
称VG ai* j* 为矩阵对策 G 的值.
相应的纯局势 (i* , j* ) 为 G 在纯策略下的解,i* 与 j*
分别称为局中人Ⅰ与Ⅱ的最优纯策略。
从上例看出,矩阵A中平衡局势(α2 ,β2)对应的元素
44
22
对策的值(局中人
I
的赢得期望值)VG
9 2
。
矩阵对策的解法
图解法
仅适用于赢得矩阵为2×n或m×2阶的矩阵对策问题。
例:求解矩阵对策G={S1 , S2 ; A} ,其中
A
解:(1)不存在鞍点,为混合策略求解问题。
2 7
3 5
11
2
(2)图解法求解
设局中人I的混合策略为(x, 1-x)T,x [0,1] 。
{S1*
,
S
* 2
;
E}
是矩阵对策
G
{S1, S2; A}的混合扩充。
如果
max min
xS1* yS2*
E(x,
y)
min
yS2*
max
xS1*
E(x,
y)
,其值为 VG
,则称
VG 为
对策 G* 的值,相应的混合局势 (x*, y*) 称为在混合策略意义下的
解, x* , y* 分别称为局中人Ⅰ和Ⅱ的最优混合策略(最优策略)。
例:田忌赛马
局中人:田忌(I)、齐王(II) S1 ={(上、中、下),(上、下、中),(中、上、下),
(中、下、上),(下、中、上),(下、上、中)}= S2
3 1 1 1 1 1
1
3
1
1
1
1
1 1 3 1 1 1
A 1 1
1
3
1
1
1 1 1 1 3 1
对策/博弈分类
局中人个数:二个,多个 策略集中的个数:有限,无限 支付/赢得代数和:零和,非零和 局中人是否合作:非合作,合作 局中人行动时间:静态,动态 局中人对他者信息了解程度:完全信息,非完全信息 对策次数:单次,重复
课程目标
理解并掌握矩阵对策的纯策略 理解并掌握矩阵对策的混合策略 掌握矩阵对策的求解方法
,,
yn}
S
* 2
是局中人Ⅱ的一个混合策略;
局中人Ⅰ选取
x S1* 使得保证赢得不少于 v1
max min
xS1* yS2*
E(x,
y) ,
局中人Ⅱ力争保证自己的所失至多 v2
min max E(x, y) 。
yS2* xS1*
矩阵对策的混合策略
5、最优混合策略
定义 4:设 G*
据定义 1,不存在纯策略意义下的解。 无鞍点
例:
G
{S1,
S2;
A} ,其中
A
3 5
63 44
56
局中人Ⅰ和Ⅱ在策略集 S1 和 S 2 中采取每一策略都有一
定的可能性,即有一定的概率,则构成了混合策略。
矩阵对策的混合策略
1、混合策略
定义 2:设矩阵对策 G {S1, S2; A},其中 S1 {1,2,,m} ,
矩阵对策的策略
纯策略:确定的选择某策略 混合策略:以某一概率分布选择各策略。
矩阵对策的纯策略
1、矩阵对策的一般表达
设用Ⅰ、Ⅱ分别表示两局中人,Ⅰ有 m 个纯策略
1,2 ,,m ,Ⅱ有 n 个纯策略 1, 2 ,, n ,则
Ⅰ的策略集为: S1 {1,2 , i , ,m},
1 1 1 1 1 3
矩阵对策的纯策略
2、矩阵对策解的引例
例: 设 G {S1, S2; A} ,
其中 S1 {1,2,3,4} , S2 {1, 2, 3},
6
A
3
9
3
1 2 1 0
8 -8
4
2
10 -
6
10
ai1j1 = ai2j2
性质2:可交换性
若(αi1 ,βj1)和(αi2,βj2)是对策G的两个解,则(αi1 ,βj2) 和(αi2,βj1)也是对策G的两个解。
矩阵对策的值唯一。即当一个局中人选择了最
优纯策略后,他的赢得值不依赖于对方的纯策略。
作业
P385 习题 • 12.2 • 12.3 • 12.4
I
II
11
7
5
B2
2 B1
0 I
B3
3
B4 2
1 II
2 3 11
A 7 5
2
④ 求解方程组可得最优混合策 略和矩阵对策的值。
联立过B2点两条直线的方程组 为
3x 5(1 x) VG 11x 2(1 x) VG
可解得
3
49
x 11,VG 11
则,局中人I 的最优策略为
I
II ① 数轴上坐标为0和1的两点分
11 别做两条垂线I-I和II-II。
7
② 画出局中人II的不同策略下 局中人I的赢得线段。
5
3
β1: v11 = 2x+7(1-x)
2
2
β2 : v12 = 3x+5(1-x)
0
1
β3 : v13 = 11x+2(1-x)
I
II
图解法
③由于局中人II理性,局中人 I从最少可能收入中选择最大 的一个,为局中人I的最优对 策。B2
min j
aij
min j
max i
aij
ai* j*
则称局势(αi*, βj*)为对策G的
鞍点,V = a i*j*为对策G的值。
注:在矩阵中,一个数在所在行中是最大值,在所 在列中是最小值,则被称为鞍点。
矩阵对策的纯策略
4、矩阵对策的鞍点与解 多鞍点与无鞍点对策 例: 设有一矩阵对策如下,求它的解。
4、混合策略对策模型
一个新的对策 G*
{S1*
,
S
* 2
;
E}
,则称
G
*
为
G
的混合扩充。
矩阵对策的混合策略
5、最优混合策略
设
G*
{S1*
,
S
* 2
;
E}
,是矩阵对策
G
{S1,
S2;
A}
的混合扩充。
x {x1, x2 ,, xm} S1* 是局中人Ⅰ的一个混合策略;
y
{ y1 ,
y2
a22既是其所在行的最小元素,也是其所在列的最大元素,
即有 ai2≤a22 ≤ a2j i=1,2,3,4 j=1,2,3
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定理 1: 矩阵对策 G {S1, S2; A}在纯策略意义下有解的充要条
件是:存在纯局势
( i
*
,
j*
)
使得对一切
i
1,2,, m;
6 5 6 5
A 1 4 2 1 8 5 7 5
0 2 6
2
局势(α1, β2),(α1, β4),(α3, β2)(α3, β4) 均构成鞍点,此对策有多个解。
矩阵对策的纯策略
5、矩阵对策纯策略的性质
性质1:无差别性
若(αi1 ,βj1)和(αi2,βj2)是对策G的两个解,则
S2 {1, 2 ,, n}, A {aij }mn ,记
m
S1* {x E m | xi 0,1 i m, xi 1} i 1
n
S
* 2
{y En
|
yj
0,1
j
n,
y j 1},
j 1
则称
S1*
和
S
* 2
分别为局中人Ⅰ和Ⅱ的混合策略集或策略集。
E(x, y*) E(x*, y*) E(x*, y)
E(x, y*) xT Ay* E(x*, y*) (x*)T Ay* E(x*, y) (x*)T Ay
矩阵对策的混合策略
3、最优混合策略解的引例
例:对策
G
{S1,
S2;
A} ,其中
A
3 5
6 4
设 x (x1, x2 ) 为局中人 I 的混合策略, y ( y1, y2 ) 为局中人 II 的混合策略,则
矩阵对策的混合策略
1、混合策略
对于 G {S1, S2; A}
局中人Ⅰ有把握的赢得至少为 v1
max min
i
j
aij
局中人Ⅱ有把握的支付至多为 v2
min j
max i
aij
一般为 v1 v2 ,特别地当 v1 v2 时,则称对策 G 在
纯策略意义下的解,即VG v1 v2 。实际多 v1 v2 ,根
a11 a12 a1n
记
A
a21
a22
a2n
am1
am2
amn
Ⅰ的赢得矩阵 或Ⅱ的支付矩阵
Ⅱ的赢得矩阵为-A 。
矩阵对策的纯策略
1、矩阵对策的一般表达
如果局中人Ⅰ、Ⅱ的策略集为 S1, S2 ,局中人Ⅰ的赢得矩阵
为 A,则矩阵对策的模型为
G {, ; S1, S2; A} 或 G {S1, S2; A}
S1* {(x1, x2 ) | x1, x2 0, x1 x2 1}, S2* {( y1, y2 ) | y1, y2 0, y1 y2 1}
局中人 I 的赢得期望值
E(x,
y)
3x1 y1
6x1y2
5x2 y1
4x2 y2
4(x1
1 4
)(
y1
j
1,2,, n
均有
a ij
*
ai* j*
ai* j
2 7 2 1 1
例: G {S1, S2; A},其中 A 2
3
2 5
3 4
4 2 4 3
2 2 1 6 1
3746
由
max i
min j
aij
min j
max i
aij
a31
3 则VG
3 ,G 的解
9 2 6 -3
理智行为:从各自最不利情形中选择最有利 I:最大最小原则 II:最小最大原则
平衡局势:双方均可接受,且对双方都是最稳妥的结果。 (α2 ,β2),局中人I和II的最优纯策略。
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定义 1:设 G {S1, S2; A}为矩阵对策,其中
S1 {1,2 ,,m} , S2 {1, 2 ,, n}, A {aij }mn ,
注:当Ⅰ取纯策略 k 时,等价于混合策略 x {x1, x2 ,, xm} S1*
其中 xi
1,i k 0,i k
。
矩阵对策的混合策略
2、最优混合策略 定理2:矩阵对策G在混合策略意义下有解的充要条件是:
存在 x* S1*, y* S2* ,使得对于任意 x S1*, y S2* ,有