混合策略线性规划解法(汇总).ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
建立对G′={S1,S2,A′}中求甲方最佳策略的线性规划如下: Min x1+x2+x3+x4+x5+x6
约束条件: 5x1+3x2+3x3+x4+3x5+3x6 ≥1 3x1+5x2+x3+3x4+3x5+3x6 ≥1 3x1+3x2+5x3+3x4+3x5+x6 ≥1 3x1+3x2+3x3+5x4+x5+3x6 ≥1 x1+3x2+3x3+3x4+5x5+3x6 ≥1 3x1+x2+3x3+3x4+3x5+5x6 ≥1 xi ≥ 0,i=1,2,…,6
G’= { S1, S2, A’} 与 G ={ S1, S2, A }
解相同,但VG = VG’ – k。
例1:求解“齐王赛马”问题。 已知齐王的赢得矩阵A
3 1 1 1 1 1
1
3
1
1
1 1
1 1 3 1 1 1
A 1 1
1
3
1
1
求得
1 1 1 1 3 1
1 1 1 1 1 3
返回原问题:
Y1’= Y1V = 1/2
Y2’= Y2V = 1/2
于是乙的最优混合策略为:
以 ½ 的概率选1;以 ½ 的概率选2 ,最优值 V=7。
当赢得矩阵中有非正元素时,V0 的条件不一定成 立,可以作下列变换: 选一正数 k,令矩阵中每一元素 加上 k 得到新的正矩阵A’,其对应的矩阵对策
返回原问题: X1’= X1V= 0.336
X2’= X2V= 0.664
于是甲的最优混合策略为:
以0.336的概率选1策略, 以0.664的概率选2策略,简 记为X﹡=(0.336,0.664)T , 最优值V=6.993。
同样可求乙的最优混合策略:
设乙使用策略1的概率为Y1′ Y1′+Y2′=1 设乙使用策略2的概率为Y2′ Y1′,Y2′0
可解得解为:x1=x4=x5=0, x2=x3=x6=0.111, v′=3, x1′=x4′=x5′= 0, x2′=x3′=x6′=1/3, 即X′* =(0,1/3,1/3,0,0,1/3)T,所以甲的最优策略为作 出策略2、3、6的概率都为0.333,而作出1、4、5 的概率为0,此时 V′G=V′=3。
所以田忌的最优混合策略为作出策略1、4、5的概率都为1/3,而作
出2,3,6的概率为0,此时VG=VG′-k=1。
齐王赛马问题的对策最优解可简记为 X*=(0,1/3,1/3,0,0,1/3)T,
Y*=(1/3,0,0,1/3,1/3,0)T,对策值 VG=1。
例 2 两个局中人进行对策,规则是两人互相独立的各自 从1、2、3这三个数字中任意选写一个数字。如果两人所 写的数字之和为偶数,则局中人乙支付给局中人甲以数量 为此和数的报酬;如果两人所写数字之和为奇数,则局中 人甲付给局中人乙以数量为此和数的报酬。试求出其最优 策略。
例:设甲使用策略1的概率为X1′,使用策略2的概率 为X2′ ,并设在最坏的情况下,甲赢得的平均值为V(未 知)。
59
A= 86
STEP 1 1)
X1′+X2′=1
X1′, X2′0
2)无论乙取何策略,甲的平均赢得应不少于V:
注意
对乙取1: 5X1’+ 8X2’ V 对乙取2: 9X1’+ 6X2’ V V>0,因为A各元素为正。
§3 矩阵对策的混合策略
若不存在va=v=vb,则局中人甲、乙两 方没有最优纯策略,就要考虑如何 随机地使用自己的策略,使对方捉 摸不到自己使用何种策略。即使用 混合策略。
设矩阵对策 G = { S1, S2, A }。当
max
wenku.baidu.com
min
ai ij
min
j
max j
aij
i
时,不存在最优纯策略。 例:设一个赢得矩阵如下:
STEP 2
作变换: X1= X1’/V ; 得到上述关系式变为:
X2= X2’/V
X1+ X2=1/V 5X1+ 8X21 9X1+ 6X21
X1, X20
(V愈大愈好)待定
建立线性模型:
min X1+X2 s.t. 5X1+8X21
9X1+6X21 X1, X20
X1= 0.048 X2= 0.095 所以,V=6.993
同样可以建立对策G′={S1,S2,A′}中求乙方最佳策略的线性规划如下: Min y1+y2+y3+y4+y5+y6
约束条件: 5y1+3y2+3y3+3y4+y5+3y6 ≤1 3y1+5y2+3y3+3y4+3y5+y6 ≤1 3y1+y2+5y3+3y4+3y5+3y6 ≤1 y1+3y2+3y3+5y4+3y5+3y6 ≤1 3y1+3y2+3y3+y4+5y5+3y6 ≤1 3y1+3y2+y3+3y4+3y5+5y6 ≤1 yi≥0,i=1,2,…,6 可解得解为: y1=y4=y5=0.111, y2=y3=y6=0, v′=3, y1′=y4′=y5′= 1/3, y2′=y3′=y6′=0,即Y′* =(1/3,0,0,1/3,1/3,0)T。
因是甲和乙没有执行上述原则的共同基础,即 max min
aij min max aij 。
ij
ji
一个自然的想法:对甲(乙)给出一个选取不同策
略的概率分布,以使甲(乙)在各种情况下的平均赢得
(损失)最多(最少)-----即混合策略。
求解混合策略的问题有图解法、迭代法、线性方程法和
线性规划法等,我们这里只介绍线性规划法,其他方法略。
min
59 5 A=
86 6
max 6
i
策略2
max 8 9
min 8
j
策略1
当甲取策略2 ,乙取策略1时,甲实际赢得8比预 期的多2,乙当然不满意。考虑到甲可能取策略2这一点, 乙采取策略2。若甲也分析到乙可能采取策略2这一点, 取策略1,则赢得更多为9 … 。此时,对两个局中人甲、 乙来说,没有一个双方均可接受的平衡局势,其主要原
mia故xm不jin存aij 在纯1 策mjin略m问iax题aij 下3的解,可求其混合策略。
A中有负元素,可以取k=2,在A的每个元素上加2得到
A’如下:
5 3 3 3 1 3
3 5 3 3 3 1
3 1 5 3 3 3 A' 1 3 3 5 3 3
3 3 3 1 5 3
3 3 1 3 3 5
设在最坏的情况下,甲赢得的平均值为V。这也是乙损
失的平均值,越小越好。
作变换: Y1= Y1’/V , Y2= Y2’/V 建立线性模型:
max Y1+Y2 s.t. 5Y1+9Y21
8Y1+6Y21 Y1, Y20
Y1= 1/14 Y2= 1/14 1/V= Y1+Y2=1/7 所以,V=6.993