运筹学--对策论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
max min aij= min max aij = a33 = -2000
I j j i
该最优策略为(3, 3),即秋季购煤20 吨。
练习:“二指莫拉问题”,甲乙两人游戏,每人出一个或 两 个手指头,同时又把猜测对方所出的手指数叫出来,若只 有一个人猜测正确,则他所赢得数为二人所出手指之和,
当盟军获悉此情报后,盟军统帅麦克阿 梭命令太平洋战区空军司令肯尼将军组织空 中打击。 日本统帅山本五十六大将心里很明白:
在日本舰队穿过俾斯麦海的三天航行中,不 可能躲开盟军的空中打击,他要策划的是尽 可能减少损失。
日美双方的指挥官及参谋人员都进行了 冷静的思考与全面的谋划。
自然条件对于双方 都是已知的。基本情况如下: 从蜡包尔出发开往莱城的海上航线有南北两条。通过时 间均为3天。
定理14-1:矩阵对策
G = S1,S2;A
在纯策略意义下有解的充分必要条 件是: 存在一个局势( *i*, *j *),使 得对一切 i=1,2,… m, j=1, 2…n 均有
aij*<=ai*j*<= ai*j
定理14-1表明矩阵对策
G = S1,S2;A
有解的充分必要条件是在A中存在元
同样,局中人II有n个策略:1、 2。。。 n ;用S2表示这些策略的集合:
S2= 1、 2… n 局中人I的赢得矩阵是:
a11
a21
a12 …… a1n
a22 …… a2n
A= …… …… ……
a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对策记为G: G= S1,S2;A
气象预报表明:未来3天中,北线阴雨,能见度差; 而南线天气晴好,能见度好。 肯尼将军的轰炸机布置在南线的机场,侦察机全天 候进行侦察,但有一定的搜索半径。 日军 盟军 北线 南线 北线 2天 1天 南线 2天 3天
(阴,能见度差) (晴,能见度好)
经测算,双方均可得到如下估计:
局势1: 盟军的侦察机重点搜索北线,日本舰队也恰好走 北线。由于气候恶劣,能见度差,盟军只能实施两天的 轰炸。 局势2:盟军的侦察机重点搜索北线,日本舰队走南线。 由于发现晚,尽管盟军的轰炸机群在南线,但有效轰炸 也只有两天。 日军 盟军 北线 南线 北线 2天 1天 南线 2天 3天
证明:必要性:因为纯策略是混合策略的特例,故成立
充分性:当局中人取纯策略 i 时,
E ( i , y ) E ( i , y ) ( 0 , ,1, 0 , 0 )( a ij )( y1 , , y n )
否则,重新开始。写出该对策各局中人的策略集合及甲的
赢得矩阵,并回答局中人是否存在某种出法比其他出法更 为有利。
解:( i , j ) 表示自己出 i 个手指,猜测对方出 j 个手指。
乙的策略 甲的赢得 甲的策略
(1,1) (1,2) (2,1) (2,2) (1,1) (1,2) (2,1) (2,2)
北线 1 南线2 (盟军)北线 1 南线2 2 1 2 3 =A
在矩阵中,盟军的最大赢得是3,而要得到3, 必须选择策略 2,而日军的目的是使盟军的赢得尽 量的小,必须选择策略1 ,使盟军的赢得只有1。 在局中人I设法使自己的赢得尽可能大的同时, 局中人II也设法使局中人I的赢得尽可能小。 日军 盟军 北线1 南线2 北线1 2天 1天 南线2 2天 3天
max min aij= min max aij
i j j i
上式蕴涵的思想是朴素自然的,可以概 括为:“从最坏处着想,去争取最好的 结果”
定义14-1:对给定的矩阵对策
G =
i j
S1,S2;A
j i
若等式
max min aij= min max aij 成立,则称这个公共值为对策G的值, 记为VG,而达到的局势( i, j ) 称为对策G在纯策略意义下的解,记 为( I*, j *)而I*和 j *分别称 为局中人I和局中人II的最优纯策略。
2 0 0 -3
-3 0 0 4
0 3 -4 0
0 2 赢得矩阵为 A 3 0
2 0 0 3
3 0 0 4
0 3 4 0
14.2
矩阵对策的混合策略
G = Ⅰ,Ⅱ;S1,S2;A
定义:对给定的矩阵对策
其中 S1= 1, 2…m S2= 1 , 2… n A=(aij)mn 把纯策略集合对应的概率向量 X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
第十四章 对策论
对策论概论
对策论(The Game Theory)也称竞赛论或博
弈论,是研究具有竞争、对抗、利益分配等方面
的数量化方法,并提供寻求最优策略的途径。
20世纪40年代形成并发展。1944年以来,对策
论在投资分析、价格制定、费用分摊、财政转移 支付、投标与拍卖、对抗与追踪、国际冲突、双 边贸易谈判、劳资关系以及动物行为进化等领域 得到广泛应用。
练习:“二指莫拉问 题”,甲乙两人游戏, 每人出一个或两个手 指头,同时又把猜测 对方所出的手指数叫 出来,若只有一个人 猜测正确,则他所赢 得数为二人所出手指 之和,否则,重新开 始。写出该对策各局 中人的策略集合及甲 的赢得矩阵,并回答 局中人是否存在某种 出法比其他出法更为 有利。
0 -2 3 0
日军 盟军 北线 南线
北线 2天 1天
南线 2天 3天
(阴,能见度差) (晴,能见度好)
这场海空遭遇与对抗一定会发生, 双方的统帅如何决策呢?历史的实际 情况是:局势1成为现实。肯尼将军命 令盟军的侦察机重点搜索北线;而山 本五十六大将命令日本舰队取道北线 航行。由于气候恶劣,能见度差,盟 军飞机在一天后发现了日本舰队,基 地在南线的盟军轰炸机群远程航行, 实施了两天的有效轰炸,重创了日本 舰队,但未能全歼。
鞍点是z=f(x,0)
的极小值点
例14-3:对给定的矩阵对策 G = S1,S2;A
S1= 1,2 ,3 , 4
S2= 1 , 2 , 3 ,4
min
6 A= 1 8 0 max 8
Fra Baidu bibliotek
5 4 5 2 5*
6 2 7 6 7
5 -1 5 2 5*
5* -1 5* 0
max
max
min
显然 ai2 a12 a1j
min
ai2 a32 a3j
对 i=1,2,3,4 j=1,2,3,4 都成立: a12 = a32 =5由定理5-1,对策 值=5,对策的解( 1 , 2 ),( 3 , 2 ),( 1 , 4 ),( 3 , 4 )
例14-4:某单位采购员在秋天时要决定
冬天取暖用煤的采购量。已知在正常气 温条件下需要用煤15吨,在较暖和较冷 气温条件下需要用煤10吨和20吨。假定 冬季的煤价随着天气寒冷的程度而变化, 在较暖、正常、较冷气温条件下每吨煤 价为100元、150元、200元。又秋季每吨 煤价为100元。在没有关于当年冬季气温 情况下,秋季应购多少吨煤,能使总支 出最少?
定义14-4:设G*= S1*,S2*;E 是对策G 混合扩充,如果有 max min E(X,Y)= min max E(X,Y)
X S1* Y S2* Y S2* X S1*
则称这个公共值为对策G在混合意义 下的值,记为V*G,而达到V*G 的混 合局势(X*,Y*)称为对策G在混合 策略意义下的解,而X*和Y*分别称 为局中人I,II的最优混合策略。
素 ai*j*是其所在行中最小的同时又 是其所在列中最大的。这时ai*j*即 是对策值,因此ai*j*也称为“鞍 点”,而( *i*, *j *),为对策 的解。
Z
鞍点
Y
X
马鞍面z=f(x,y)
Z
Y
在X=0的平面上
z=f(0,y)
鞍点是z=f(0,y)
的极大值点
Z
z=f(x,0)
X
在Y=0的平面上
定义14-3:对给定的矩阵对策
G = S1,S2;A
则对策G*= S1*,S2*;E
称为对策G混合扩充。
纯策略是混合策略的一个特例。例如:局中人Ⅰ的纯策 略 k 等价于混合策略
x ( x1 , x 2 , , x m ) S 1 ,
T *
其中,
1, i k xi 0, i k
解: 局中人I(采购员)有三个策略:
策略1: 10吨,策略2: 15吨,策略3 :20吨。
局中人II(环境): 策略1 较暖 ,策略2 正常,策略3较冷 现把该单位冬天取暖用煤全部费 用(秋季购煤费用与冬天不够时再补购 煤费用)作为采购员的赢得矩阵。
1较暖
1(10) -1000
2正常
对策的三要素:
局中人:有权决定自己行为方案的对 局参加者称为局中人。案例中,美日 双方的决策者为局中人。当对局中局 中人只有两人时,称为二人对策。
策略:对局中一个实际可行的方案称 为一个策略。案例中,美日双方各有 二个策略。
赢得矩阵(支付):当每个局中人 在确定了所采取的策略后,他们就 会获得相应的收益或损失,此收益 或损失的值称为赢得(支付)。赢 得与策略之间的对应关系称为赢得 (支付)函数。 案例中,肯尼将军与山本五十六大 将的赢得(支付)函数都可以用矩 阵A、B表示。
定理14-2:矩阵对策 G = S1,S2;A
在混合策略意义下有解的充分必要条件是: 存在混合局势( X*,Y*),使得对一切 X S1* Y S2*均有
E(X,Y*) E(X*,Y*) E(X*,Y)
定理14-3:对给定的矩阵对策 G = S1,S2;A 设X* S1* Y* S2*则混合局势( X*,Y*)是G的解且 V=VG*的充分必要条件是: 对一切 i,j均有 E( i, Y*) V E(X*, j )
(日军)
北线 南线
(盟军)北线
南线
2
1
2
3
=A
(盟军)
北线 南线
(日军)北线
南线
-2
-1
-2
-3
=B
在本例中的每一个对局,双方的 赢得的代数之和为零,这样的对 策称为“有限零和二人对策” 设两个局中人为I,II,局中人I有 m 个策略:1、 2… m ;用S1表 示这些策略的集合: S1= 1、 2…… m
14-1矩阵对策的基本概念
案例:俾斯麦海的海空对抗 1943年2月,第二次世界大战中的日本, 在太平洋战区已经处于劣势。为扭转局势,
日本统帅山本五十六大将统率下的一支舰队
策划了一次军事行动:由集结地——南太平 洋的新不列颠群岛的蜡包尔出发,穿过俾斯 麦海,开往新几内亚的莱城,支援困守在那 里的日军。
(阴,能见度差) (晴,能见度好)
局势3:盟军的侦察机重点搜索南线,而日本舰队走北 线。由于发现晚、盟军的轰炸机群在南线,以及北线气 候恶劣,故有效轰炸只有一天。
局势4:盟军的侦察机重点搜索南线,日本舰队也恰好 走南线。此时日本舰队迅速被发现,盟军的轰炸机群所 需航程很短,加上天气晴好,有效轰炸时间三天。
3较冷
-1750 -3000
2 (15)
3 (20)
-1500
-2000
-1500 -2500
-2000 -2000
已知在正常气温条件下需要 用煤15吨,在较暖和较冷气 温条件下需要用煤10吨和20 吨。在较暖、正常、较冷气 温条件下每吨煤价为100元、 150元、200元。又秋季每吨 煤价为100元。
(阴,能见度差) (晴,能见度好)
所以局中人I应首先考虑用 所能赢 得的最小,然后在这些最小赢得中 选择最大。局中人I可以保证赢得
max min aij
i j
同样,局中人II可以保证局中人I的 赢得不超过 min max aij
j i
案例中局中人I(盟军)应当选择 (北线)策略1,这样能保证赢得2。局 中人II(日军)应当选择(北线)策略1 使盟军赢得不超过2。实际上,在( 1, 1)局势下,有
分别称为局中人I和局中人II的混合策略。
如果局中人I选取的策略为
X=(x1, x2 … xm)
局中人II选取的策略为
Y=(y1 , y2 … yn ),则期望值 E(X,Y)= xi aij yj=XAYT 称为局中人I期望赢得,而局势(X,Y) 称为“混合局势”,局中人I,II的混合 策略集合记为S1*, S2*。