管理运筹学第六—第八章

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5 20
35 10
对于局中人Ⅰ而言,若局中人Ⅱ选取β 1,β 2,则局中 人Ⅰ的支付期望值分别为 β1 5x1+20(1-x1)=20-15x1≥V β 2 35x1+10(1-x1)=25x1+10≥V
V
20 10 E 0
D
1/4
局中人Ⅰ用“最大最小”原则选 取自己的策略,即 max{ min (20-15x1 ,25x1+10)} 0≤x1≤1 从图中可知: min (20-15x1 ,25x1+10) 0≤x1 ≤1 为折线EDF,D为所求的极值点, 其坐标:(1/4,161/4) 所以 F 5 X*=(x1* ,1-x1*)=(1/4,3/4) 1/4 V =16 X G* 1 1 35
以下定义一套与纯策略解完全平行的混合策略的解。
定义2:如果存在X*∈S*1,Y*∈S*2;对任意的X∈S*1, 及Y∈S*2均满足: E(X,Y*)≤E(X*,Y*)≤E(X*,Y) 则称混合局势(X*,Y*)为G在混合策略中的解(混合 解);而X*,Y*分别为局中人Ⅰ、Ⅱ的最优混合策略 ;E(X*,Y*)称为矩阵对策G的对策值,通常记为: VG*= E(X*,Y*)
β1 β2 β3 α1 -6 2 -7 A = α2 5 3 6 α3 18 0 -8 α4 -2 -12 7 局中人Ⅰ 局中人Ⅱ: α1 min{-6,2,-7} = -7 β 1 max{-6,5,18,-2}=18 α2 min{ 5,3,6 } = 3 β 2 max{2,3,0,-12} = 3 α3 min{18,0,-8} = -8 β 3 max{-7,6,-8,7} = 7 α4 min{-2,-12,7}=-12 最好结果: 最好结果: min max {18,3,7}=3 max min {-7,3,-8,-12}=3 α 2,β 2分别为局中人Ⅰ、Ⅱ的最优策略; {α 2,β 2}为对策解 (鞍点) 而 a22=3称为对策值。
则称纯局势{α i*,β j*}为G在纯策略中的解(鞍点解); 而α i*,β j*分别为局中人Ⅰ、Ⅱ的最优纯策略;ai*j*称 为矩阵对策G的值(对策值)。
定理 1: 矩阵对策 G={ S1,S2,A} 存在最优纯策略的 充分必要条件为: max min aij = min max aij 例3:已知矩阵对策G={ S1,S2,A}
零和对策
二人对策 非零和对策 有限对策
零和对策
n人对策 非零和对策 对策 零和对策 二人对策 非零和对策
无限对策
零和对策 n人对策 非零和对策 有限二人零和对策也称为矩阵对策.
6.3矩阵对策的概念及模型
一般形式: 局中人Ⅰ策略集合: S1={α 1,α 2,…,α m} 局中人Ⅱ策略集合: S2={β 1,β 2,…,β n} 其中 α i,β j 分别为局中人Ⅰ、Ⅱ的纯策略,策略偶 {α i,β j}称为纯局势; 若局中人Ⅰ在{α i,β j}下的支付为aij则 A =
第六章矩阵对策
6.1 对策问题 6.2 对策论的基本概念 6.3 矩阵对策的概念及模型 6.4 矩阵对策的纯策略解(鞍点解) 6.5 矩阵对策的混合策略解 6.6 矩阵对策的解
第六章矩阵对策
6.1对策问题
6.2对策论的基本概念 6.2.1局中人 一场竞争或斗争称为一局对策,一局对策中的决策者 称为该局对策的局中人(只有两个局中人,称为两人 对策;两人以上称为多人对策)。 6.2.2策略与策略集合 指导局中人自始至终如何行动的一个实际可行的完 整的行动方案称为策略。 局中人所有策略构成的集合称为策略集合。 有限策略 有限对策 无限策略 无限对策
局中人Ⅰ策略集合: S1={α 1,α 2,…,α m} 局中人Ⅱ策略集合: S2={β 1,β 2,…,β n} {α i,β j}称为局势 6.2.3支付与支付函数 当局中人选定某一策略后,得到的收益或损失称为 局中人的支付;不同的策略导致不同的支付,因此支付 是策略的函数. 6.2.4零和对策 若在一局对策中,全体局中人的支付总和为0,则将 该对策称为零和对策,否则称为非零和对策. 6.2.5对策分类
对于局中人Ⅱ而言,若局中人Ⅰ选取 α 1,α 2,则局 中 人Ⅱ的支付期望值分别为 α1 5y1+35(1-y1)=35-30y1 ≤V 局中人Ⅱ用“最小最大”原则选取 α2 20y1+10(1-y1) =10+10y1 ≤V V 自 35 己的策略,即 F min { max (35-30y1 , 10+10y1)} 0≤y1≤1 从图中可知 20 max (35-30y1 , 10+10y1) H 0≤y1≤1 G 为折线FGH,G为所求的极值点 10 其坐标:(5/8,161/4) 所以 5 Y*=(y1* ,1-y1*)=(5/8,3/8) 1/4 V =16 0 Y G* 1 1
a11 a12 … a1n a21 a22 … a2n …………... am1 am2 … amn
称为局中人Ⅰ的支付矩阵,矩阵对策模型可记为: G={ S1,S2,A} 局中人Ⅱ的支付矩阵为:-A
例1:包、剪、锤游戏中 矩阵对策模型:G={ S1,S2,A} 其中 甲:S1={α 1(包),α 2(剪),α 3(锤)} 乙:S2={β 1(包),β 2(剪),β 3(锤)}
β β β β
1
2
3 4
2x1+4(1-x1)=4-2x1 3x1+(1-x1)=1+2x1 x1+6(1-x1)=6-5x1 5x1 =5x1
≥ V ≥ V ≥ V ≥ V
(1) (2) (3) (4)
X2 6
从图中可知:min (4-2x1,1+2x1,6-5x1,5x1) 0≤x1≤1
6
5
4 3 2 1 A B
5
4 3 2 C 1
为折线OABC,B为 所求的极值点 其坐标: (5/7,17/7), 所以 X*=(x1* ,1-x1*) =(5/7,2/7) VG*=17/7
0
5/7
1
X1
对于局中人Ⅱ而言,若局中人Ⅰ选取α 1,α 2,则的支 付期望值分别为 α1 2y1+3y2+y3+5y4 ≤V α2 4y1+y2+6y3 ≤V 无法作图,应用定理3求出局中人Ⅱ的最优混合策略, x1* =5/7 2y1*+3y2*+y3*+5y4* =V x2* =2/7 4y1*+y2*+6y3* =V 将x1* =5/7,x2* =2/7 ,V=17/7 代入下列约束: 推出:
j=1 j=1
n
n
yj≥0 (j=1,2,…,n)
定理 3 :若( X*,Y*)是对策 G 的最优混合策略,则对 某一个i或j来说: (1)若yj*≠0 则 Σ aijxi*=V (2)若xi*≠0 则 Σ aijyj*=V (3)若Σ aijxi* >V 则yj*=0 (4)若Σ aijyj* <V 则xi*=0
max min aij = min max aij=6 对策值: ai*j*=a12= a14= a32= a34= 6 对策解(鞍点): (α i*,β j*)=(α 1,β 2)=(α 1,β 4) =(α 3 ,β 2 )=(α 3 ,β 4 ) α 1,α 3为局中人Ⅰ的最优纯策略 β 2,β 4为局中人Ⅱ的最优纯策略 由此可见对策解不是唯一的,但对策值是唯一的。 两条重要性质: (1)无差别性:若(α i1 ,β j1 )与(α i2 ,β j2 ) 是G的两个解,则ai1 j1 = ai2 j2 (2)可交换性:若(α i1 ,β j1 )与(α i2 ,β j2 ) 是G的两个解,则(α i1 ,β j2 )与(α i2 ,β j1 ) 也是G的两个解。
β j* a11… a1j* … a1n ……………... A= α i*, ai*1… ai*j* … ai*n ……………... am1 … amj* … amn 定义1 矩阵对策 G={ S1,S2,A},如果存在纯局势 {α i*,β j*}使得对于任意j=1,2,…,n;i=1,2,…,m有: aij*≤ai*j*≤ai*j 列 行
6.5矩阵对策的混合策略解
6.5.1混合策略与混合扩充 6.5.1.1混合策略 局中人Ⅰ以概率xi(i=1,2,…,m)选取纯策略α 局中人Ⅱ以概率yj(j=1,2,…,n)选取纯策略β 其中: Σ xi =1 (0≤xi≤1)
i=1 n m
i
j
Σ yj =1 (0≤yj≤1)
j=1
则向量X=(x1,x2,…,xm),Y=(y1,y2,…,yn)分别称为局中 人Ⅰ、Ⅱ混合策略;(X,Y)称为一个混合局势 显然:纯策略是混合策略的特例。
2x1+4(1-x1)=4-2x1 ≥V 4-2x1* 3x1+(1-x1) =1+2x1 ≥V 1+2x1* x1+6(1-x1)=6-5x1 ≥V 6-5x1* 5x1 =5x1 ≥V 5x1 * 代入下列方程组: =18/7 =17/7 =17/7 =25/7 > = = >
甲的支付矩阵:
A α1 = α2 α3
β 0 1 -1
1
β2β3 -1 1 0 -1 1 0
乙的支付矩阵: -A
6.4 矩阵对策的纯策略解(鞍点解)
模型确定以后,各局中人面临的问题就是如何选取对自 己最为有利的纯策略,以谋求最大的赢得(或最少的损失). 例2:设矩阵对策G={ S1,S2,A}, 其中: S1={α 1,α 2,α 3,α 4 };S2={β 1,β 2,β 3}
这两个基本定理为求解矩阵对策奠定了理论基础。
6.6 矩阵对策的解
6.6.1图解法 适用于:至少有一个局中人,只有两种可供选择的 策略的矩阵对策。即: A2 ×n 、Am ×2 、A2 ×2 例4:矩阵对策G={ S1,S2,A} 其中: S1={α 1,α 2},S2={β 1,β 2} A = 解:作混合扩充: S*1={x1 ,1-x1},S*2={y1 ,1-y1}
α A = α α α β1 8 1 9 -3 β2 6 3 6 1 β
3
β
4
1
2
3 4
8 6 4 -3 7 6 10 3
min 6 -3 6 -3
max
9
6
10
6
局中人Ⅰ最好结果: max min aij =max {6,-3,6,-3}=6 局中人Ⅱ最好结果: min max aij = min {9,6,10,6}=6
6.5.2 解基本定理 定理2:任意一个矩阵对策G={ S1,S2,A}, 其中:S1={α 1α 2,…,α m} S2={β 1β 2,…,β n} A = (aij)m×n 一定有解(混合策略解),且如果G的对策值是V,则 以下两组不等式的解就是局中人Ⅰ、Ⅱ的最优混合策 略:
x1 a11… a1j … a1n
A= xi
y1 … yj … yn
yj Σ aijxi≥V (j=1,2,…,n) Σ xi=1
i=1 i=1
m
m
xm
……………... ai1… aij … ain ……………... am1 … amj … amn
xi≥0 (i=1,2,…,m)
xi Biblioteka Baidu aijyj≤V (i=1,2,…,m) Σ yj=1
例5:矩阵对策G={ S1,S2,A} 其中: S1={α 1,α 2}, S2={β 1,β 2,β 3,β 4}
2 A = 4
3 1
1 6
5 0
解:作混合扩充: S*1={x1 ,1-x1},S*2={y1 ,y2 ,y3,y4} 对于局中人Ⅰ而言,若局中人Ⅱ选取β 1,β 2,β 3, β 4则局中人Ⅰ的支付期望值分别为: β1 2x1+4(1-x1)=4-2x1 ≥V (1) β2 3x1+(1-x1)=1+2x1 ≥V (2) β3 x1+6(1-x1)=6-5x1 ≥V (3) β4 5x1 =5x1 ≥V (4) 局中人Ⅰ用“最大最小”原则选取自己的策略,即 max {min (4-2x1,1+2x1,6-5x1,5x1)} 0≤x1 ≤1
6.5.1.2 混合扩充 在混合策略中,局势(α i ,β 因此局中人Ⅰ的支付期望为:
n m j=1 i=1
j
)出现的概率为xiyj ,
E(X,Y)=Σ Σ aijxiyj 令: 局中人Ⅰ的混合策略集合为 S*1={X=(x1,x2,…,xm)| 0≤xi≤1,Σ xi=1} 局中人Ⅱ的混合策略集合为 S*2={Y=(y1,y2,…,yn)| 0≤yj≤1,Σ yj=1} 则称:G*={ S*1,S*2,E(X,Y)}为对策G的混合扩充。
相关文档
最新文档