运筹与优化--对策论
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
y∈S2*为局中人I和Ⅱ的混合策略,(x,y)为混合局势,
局中人I的赢得函数为 E(x,y)xTAy aix jiyj
称G* ={S1*,S2*,E}为对策G的混合扩充. i j
A
12
设 mm ax E i(x n ,y)mE i(x n *,y)
x S 1 * y S2 *
y S2 *
mm inE a(x,x y)mE a(x,x y*)
注意:G在纯策略下解存在时,定义4中的
VG ;Gai在j 混合策略意义下的解(x*,y*)
存在时,VG=E(x*,y*).
例4. 解矩阵对策 中
3 G6={S1 ,S2 ;A },其
A
5
4
A
14
局中人I取纯策略αi时,其赢得函数为 E(i,y)=∑aijyj ,
局中人Ⅱ取纯策略βj时,其赢得函数为 E(x,j)=∑aijxi .
人I以概率xi≥0取纯策略αi,局中人Ⅱ以概率yj≥0取
纯策略βj ,且
m
xi
1.记,
n
yj 1
i1
j1
m
S 1 {x(x1,x2, ,xm ) E mxi0 , xi1 }
i 1
n
S2 {y(y1,y2, ,yn) E nyj0, yj1 }
j 1
则S1* ,S2*分别称为局中人I和Ⅱ的混合策略集.称x∈S1*,
A
24
推论.如果纯策略α1被纯策略α2 , … αm的凸线 性组合所优超,则定理10的结论仍成立.
由上两式得
E(x,y)=∑E(i,y)xi
(5)
E(x,y)=∑E(x,j)yj . (6)
定理3.设x∈S1*,y∈S2*,则(x*,y*)是G的解的充要条 件是: 对任意i=1,2,…,m 和 j=1,2,…,n,有
E(i,y*)≤E(x*,y*)≤E(x*,j) (7)
A
15
定理3.设x∈S1*,y∈S2*,则(x*,y*)是G的解的充要条 件是: 对任意i=1,2,…,m 和 j=1,2,…,n,有 E(i,y*)≤E(x*,y*)≤E(x*,j) (7) 证明:设(x*,y*)是G的解,则由定理2,有
是对策G的两个解,则 akr =apq.
事实上,由 aij ,有aij aij
apq≤ apr≤ akr ≤ akq ≤ apq
因此 akr =apq.
6 5
2
1
7 5
6
2
A
10
性质2(可交换性).若(αk,βr)和 (αp,βq) 是对策G的两个解,则(αk,βq)和 (αp,βr) 也是对策G的解.
成立,记 VG ,则aij称 VG为对策G的值,称使(1) 成立的纯局势 (i ,为jG) 在纯策略下的解 (或平衡局势、双赢局势).
定理1.矩阵对策G={S1 , S2 ;A }在纯策略
中有解的充要条件是:存在纯局势 (i使,j得 )
aij aij aij(2)
(i=1,2,…,m, j=1,2,…,n). 既是其a 所i j 在
A
16
定理4.设x*∈S1*, y*∈S2*,则(x*,y*)是G的解 的充要条件是: 存在数v,使得x*,y*分别是不等
式组
m
i 1 m
i1
aij xi xi 1,
v
j 1,2,
xi(8) 0
,n
n
aij y j v
i 1,2, , m
j1
n j 1
yj
1,
(9)
yj 0
A
22
定理8. 设矩阵对策G1={S1,S2;A}的解集为 T(G1),G2 ={S1,S2;αA}(α∈R+)的解集
为T(G2). 则 (1). VG2=αVG1 ; (2). T(G1)=T(G2). 定理9.设矩阵对策G={S1,S2;A},且A=-AT. 则 (1).VG=0 ; (2). T1(G)=T2(G). 其中T1(G)和T2(G)分别为局中人Ⅰ和局中人Ⅱ 的最优策略集.
定理7—定理9的证明:
利用鞍点的概念和定理3.
A
23
定义5. 设矩阵对策G={S1,S2;A}, 其中 A=(aij) , S1 ={α1 ,α2 , … αm }, S2 ={β1 ,β2 , … βn}
若对 j=1~n,都有 akj≥atj , 则称局中人I的纯策略αk 优超于αt; 若对 i=1~m, 都有 aip≤aiq , 则称局中人 Ⅱ的纯策略βp优超于βq .
j
(4).若
,a则ijxyij*=v0 .
证明: 由定义有
v=maxE(ix,y*),x∈S1* ,故
vj a iy j j m x S 1 E (a x ,y x ) E (i,y ) 0
A
21
又因 x i (v a iy j j) v a ix ji y j 0 , x i 0
行的最小元素,又是其所在列的最大元素.
A
8
定义2.设实函数f(x,y)定义在x∈A, y∈B上,
若存在x*∈A, y*∈B,使得对x∈A, y∈B,有
f(x, y*)≤f(x* , y*)≤f(x* , y) (3)
则称(x* , y*)为f(x,y)的一个鞍点.
矩阵对策G在纯策略意义下有解,且 VG aij 的充要条件是: a是i j矩 阵A的一个鞍点. 例3. 确定p和q的取值范围,使矩阵
或 G={S1,S2;A}.
A
5
例1.“齐王赛马”中,齐王的赢得矩阵为:
田忌 齐王
α1 (上中下) α2 (上下中) α3 (中上下) α4 (中下上) α5 (下中上) α6 (下上中)
β1
β2
β3
β4
β5
β6
(上中下) (上下中) (中上下) (中下上) (下中上) (下上中)
3 1 1 1 1 -1
x S 1 y S 2
y S 2 x S 1
记其值为VG ,则称VG为对策G*的值,使(3)成立
的混合局势(x*,y*)为G在混合策略意义下的解.
A
13
定理2.矩阵对策G={S1 ,S2;A }在混合策略 中有解的充要条件是: (x*,y*)为E(x,y)的
一个鞍点,即对一切 x∈S1*,y∈S2*,有 E(x,y*)≤E(x*,y*)≤E(x*,y) (4)
故 v=E(x*,y*)=VG .
A
18
定理5. 任意矩阵对策G={S1,S2;A}一定存在混 合策略意义下的解.
证明:由定理4,只要证明存在数v*和x*∈S1*,
y*∈S2*,使得
n
m
j1ai(j1y0j)
v
i1
aijxi
为此,考虑下列两个线性规划问题:
maxw
(P)
s.t.
m
aijxi
w
由 aiq ≤ apq= akr ≤ akq≤ apq = akr ≤ akj 得aiq≤akq≤ akj ,即akq是鞍点. 故(αk,βq)是解.同理,(αp,βr)是解. 性质1、2表明,矩阵对策的值是唯一的.
例5.P385例题.
A
11
定义3.设矩阵对策G={S1,S2;A}, A=(aij)m×n.若局中
A在(α2,β2)处存在鞍点.其中
∵q≤a22≤p ,∴p≥5,q≤5
1 q 6
A
p
5
10
6 2 3
A
9
例4.设矩阵对策G={S1,S2;A},其中
S1={α1,α2,α3,α4}, S2={β1,β2,β3},
6 5
A
1
4
试求双方的最优策略和赢得.
8 5
0
2
性质1(无差别性).若(αk,βr)和 (αp,βq)
因此(P)和(D)皆存在最优解x*∈S1*,y*∈S2*, 且最优值 v*=w定理6.设(x*,y*)是矩阵对策G的解,v=VG,那么
(1).若xi*>0,则
; aijyj v
(2).若yj*>0,则
j
; aijxi v
(3).若
,则aijyxj i*=v0i;
E(x,y*)≤E(x*,y*)≤E(x*,y) (4)
由于纯策略是混合策略的特例,故(7)式成立. 反之,设(7)式成立,由(5)、(6)有 E(x,y*)=∑E(i,y*)xi≤E(x*,y*)∑xi=E(x*,y*) E(x*,y)=∑E(x*,j)yj≥E(x*,y*)∑yj=E(x*,y*)可知(4)式 成立,故(x*,y*)是G的解
运筹与优化
第十四章 对策论
A
1
对策论
对策论的基本概念 对策论的基本定理 矩阵对策的解法
A
2
第一节 对策论的基本概念
对策论亦称竞赛论或博奕论,是研究具有斗 争或竞争性质的数学理论和方法.
具有竞争或对抗性质的行为称为对策行为. 对策论是研究对策行为中竞争各方是否存在 最合理的行动方案,以及如何找到最合理方案的 数学理论和方法. 具有对策行为的模型称为对策模型,或对策.
的解,且v=VG .
A
17
定理4.证明:“ ”因G有解,(7)式成立.取 v=E(x*,y*)就有(8),(9).
“ ”因对任意 x∈S1*, y∈S2*, 有 E(x,y*)=∑E(i,y*)xi≤∑vxi=v E(x*,y)=∑E(x*,j)yj≥∑vyj=v
于是 E(x,y*)≤ v ≤E(x*,y) . 特别有 E(x*,y*)≤ v ≤E(x*,y*).
y S2 * x S 1 *
x S 1 *
则有 mE (ix * n ,y ) E (x * ,y * ) mE (a x ,y x * ) 定义y 4S .2 *设G*={S1*,S2*;E}是矩x 阵 S 1 * 对策
G={S1,S2;A}的混合扩充,若
m a x m in E ( x ,y ) m in m a x E ( x ,y ) ( 3 )
1 3 1 1 -1 1
1 -1 3 1 1 1
-1 1 1 3 1 1
1 1 -1 1 3 1
1 1 1 -1 1 3
A
6
最优策略:有利于自己获得最大赢得(或最少损 失)的策略.
选择最优策略的原则:牢记对方总是以最
不利于你的行动方案来对付你.
例2.设矩阵对策G={S1,S2;A},其中
S1={α1,α2,α3,α4}, S2={β1,β2,β3},
6 1 8
A
3
2
4
9 1 10
试求双方的最优策略和赢得.
3
0
6
理智行为:双方各按最不利于自己的情形
中选择最为利己的结果作为决策的依据.
A
7
定义1.设矩阵对策G={S1 ,S2 ;A },若等式 m 1 i m 1 m a j na x iij n 1 m j n (m 1 1 i)i m n a iaj a x ij
j 1,2, ,n
(11)
i1
m
xi 1 xi 0
i1
A
19
minv
(D)
s.t.
n
aij yj
v
i 1,2, ,m
(12)
j1
n yj 1 yj 0 j1
易知(P)和(D)互为对偶,x=(1,0,…,0)T∈Em ,
w=min a1j 是(P)的可行解, y=(1,0,…,0)T∈En , v=maxai1 是(D)的可行解.
A
3
对策三要素
局中人:在一个对策行为中,有权决定自己行动 方案的对策者.n个局中人的集合I={1,2,…,n}.
理智的决策者:不存在侥幸心理者. 策略集:可供局中人i选择的一个实际可行的完 整的行动方案称为一个策略si,策略集Si.
局势:在对策中,各局中人所选定的策略构成的 策略组s=(s1, s2,… sn).全体局势S=S1×S2×…×Sn 赢得函数:局势s的函数Hi(s). 矩阵对策:二人有限零和对策.
定理10.设矩阵对策G={S1,S2;A}, 如果纯策略α1被 纯策略α2 , … , αm中之一所优超,由G可得新的矩阵 对策G’={S1’,S2’; A’} ,于是有
(1).VG’=VG ; (2). T2(G’)包含于T2(G)中; (3).若(x2,…,xm)T∈T1(G’),则
(0,x2,…,xm)T∈T1(G).
所以i,当 xi*>0,必有 i j ; aijyj v
当 aij,y必j 有v xi*=0 .
j
故j (1),(3)得证.同理可证(2),(4).
定理7.设矩阵对策G1={S1,S2;A1}的解集T(G1), G2 ={S1,S2;A2}的解集为T(G2).其中A1=(aij), A2=(aij+p),p∈R.则 (1).VG2=VG1+p ; (2). T(G1)=T(G2).
A
4
第二节 对策论的基本定理
局中人I的纯策略集 S1 ={α1 ,α2 , … αm};局中人 Ⅱ的纯策略集S2 ={β1 ,β2 , … βn}; 对任一纯局 势(αi,βj) (共m×n个),局中
人I的赢得值为aij ,赢得矩阵为A=(aij)m×n . 局中人Ⅱ的赢得矩阵为-A. 矩阵对策记为 G={Ⅰ,Ⅱ,S1,S2;A}