矩阵对策论
矩阵对策
max aij 对局中人 II,求 min j i
若 max min aij min max aij a i
i j j i
*
j*
策略 i , j 为I,II 的最优策略
这一对策 的值为 V a i
j
几个术语
局势 对策的解
最优纯策略
对策的值 鞍点 e. g. 2 (续)求解取暖购煤问题
两人零和对策
对抗对策(antagonistic game)
矩阵对策(matrix game)
二.实际问题中的矩阵对策模型
e. g. 1 扩大销售模型
公司I,公司II 的同一产品竞争市场份额,各有三种办 法扩大销售额(由于市场需求一定,一家扩大,意味 另一家缩减),三种方法比如:①改进包装;②广告; ③降价.公司I 的三种策略表示为 1 , 2 , 3 ,公司II 的三种策略为 1 , 2 , 3 ,在不同策略下销售量增长百 分比不同.下表中表示公司I 的增长率,而公司II 的即 为相反数
e. g. 6 (续)求最优策略与值
作业
P206,
Ex 6. 3:1,2
1=急转 2 =不转
1
给急转弯者以1 分,不转弯者以5 分 局中人II 局中人I 局 =急转 1 中 人 2=不转 II
3 5
1 =急转 2=不转
1 0
0
II 的支付矩阵
此对策中,若两者都想得5 分,则发生惨祸, 全部玩完.实际上两人最好的做法是同时停车 或转弯,各得3 分. Remark 此例已不是 2 人有限零和对策问题(因为在 每个对局中,双方支付的代数和不为零), 称为双矩阵对策.
e. g. 2 取暖购煤问题 某公司在秋末需决定冬季取暖用煤问题.根据气温 情况,用煤量和煤价均不同,可用下表表示: 正常气温 较冷气温 较暖气温 需求量15 吨 需求量20 吨 需求量10 吨 200元/吨 250元/吨 150元/吨
运筹学12-2对策论
3.矩阵对策的混合策略(续)
-- 优超原则:当局中人甲方的策略t被其它 策略所优超时,可在其赢得矩阵A中划去第t 行(同理,当局中人乙方的策略t被其它策 略所优超时,可在矩阵A中划去第t列)。 如此得到阶数较小的赢得矩阵A’,其对
应的矩阵对策
G’= { S1,S2,A’}与 G ={ S1,S2,A } 等价,即解相同。
17
再讨论“齐王赛马”
• “齐王赛马”的赢得矩阵A有 max min aij=-1 min max aij=3
i j j i
故需求混合策略,由于A中有非正元素, 可选k=2,令矩阵中每一元素加上k得到新的 正矩阵A’:
5 3 3 1 3 3 3 5 1 3 3 3 3 3 5 3 3 1 3 3 3 5 1 3 1 3 3 3 5 3 3 1 3 3 3 5
19
再讨论“齐王赛马”(续)
• 求乙方(田忌)最优策略的线性规划模型:
min Y1+Y2 +Y3 +Y4 +Y5 +Y6 s.t. 5Y1+3Y2 +3Y3 +3Y4 + Y5 +3Y6 1 3Y1+5Y2 +3Y3 +3Y4 +3Y5 + Y6 1 3Y1+ Y2 +5Y3 +3Y4 +3Y5 +3Y6 1 Y1+3Y2 +3Y3 +5Y4 +3Y5 +3Y6 1 3Y1+3Y2 +3Y3 + Y4 +5Y5 +3Y6 1 3Y1+3Y2 + Y3 +3Y4 +3Y5 +5Y6 1 Y1,Y2,Y3,Y4,Y5,Y6 0 可得两组解:(1/9,0,0,1/9,1/9,0)T, (1/18,1/18,1/18,1/18,1/18,1/18)T ,V’=3 于是,Y’=(1/3,0,0,1/3,1/3,0)T, Y’=(1/6,1/6,1/6,1/6,1/6,1/6)T V = V’-2 = 1 即田忌的最优混合策略值是输1千金
第1章 矩阵对策
此时局中人 1 和 2 是同时并且独立地进行选择.因此局中人 1 获得支付 aij ,局中人 2 获得支
( ) 付 −aij .如果支付是一个负数, 那么可以认为是局中人的实际损失.
记具有支付矩阵 A 的对策 Γ 为 ΓA ,并且根据矩阵的维数,称之为 (m × n) 对策.如果
果它被隐藏在那里)的概率为 0 < βi ≤ 1 ,i = 1, 2, , n .如果找到目标,局中人 1 获得收益 为α .在其中隐藏和搜索物体的坑的编号是局中人的策略,局中人 1 的支付等于期望收益与
寻找目标时所付出的努力之差.隐藏和搜索目标的问题可以转化为矩阵对策,其支付矩阵为
⎡αβ1 −τ1 −τ1 −τ1
选择进行攻击的目标(局中人 1)和防卫目标(局中人 2)的问题可以转化为矩阵对策,
其支付矩阵为
⎡β1τ1 τ1
A
=
⎢ ⎢
τ2
β2τ 2
⎢
⎢ ⎣
τn
τn
τ1 ⎤
τ2
⎥ ⎥
⎥
β
nτ
n
⎥ ⎦
例 1.1.5 (离散型搜索对策)有 n 个坑,局中人 2 在 n 个坑中之一隐藏物体,局中人
1 希望找到它.在寻找第 i 个坑时局中人 1 付出的努力为τi > 0 ,在第 i 个坑中找到目标(如
m −1 > n ,则 a10 = n +1+1 = n + 2 , a11 = n −1+1 = n , a1 j = n − j +1−1−1 = n − j −1,
2 ≤ j ≤ n .一般情况下(对任意的 m 和 n )元素 aij , i = 0, m , j = 0, n 以及支付矩阵可以
第八讲 矩阵对策概要
矩阵G的一般解法
1)取每行的最小值:
min gij i 1, 2, , m
j
i
maxmin gij i 1, 2, , m 2)从上述值中选最大值: j
j
3)取每列的最大值: max gij j 1,
i
2, , n
max gij j 1, 2, , n 4)从3)项中选最大值:min j
E X ,Y E X ,Y
那么: X
x和y EX ,Y
都成立时
局中人P1的最优策略; 局中人P2的最优策略; 对策的值; 对策的解;
Y
E X ,Y
X
,Y
最优策略的解法
假设策略的值是V,最优策略及策略的解可 通过下式求得。
m
E X , j g ij xi V
Y , , 5) 13 13 13 25 V 13
E 1, Y 3 y1 y2 y3 V E 2, Y y1 y2 5 y3 V E 3, Y y1 4 y2 y3 V y1 y2 y3 1
i
min gij min max gij gi* j* 时, 5)若 max j j i i
ai* →P1的最优纯策略; b * →P2的最优纯策略; j
a , b 对策的解; V
i* j*
g i* j* 对策 a * , b * 的值。 i j
例3
某耕地根据种植划以及自然条件,规划 与收益存在如下表所示的关系。 试求出最佳规划方案。
矩阵对策问题及其解法
矩阵对策问题及其解法背景对策论研究具有竞争性质的现象。
有权决定⾃⾝⾏为的对策参加者称为局中⼈,所有局中⼈构成集合I,在⼀局对策中可供剧中⼈选择的⼀个实际可⾏的完整的⾏动⽅案成为策略,对于任意剧中⼈i∈I,都有⾃⼰的策略集S i。
⼀局对策中由各剧中⼈选定的策略构成的策略组称为局势s=(s1,...,s n),⽽全体局势集合S=S1×...×S n。
局势决定了对策的结果,对局势s∈S,局中⼈i可以得到收益H i(s),也称为局中⼈i的赢得函数。
矩阵对策即⼆⼈有限零和对策,是⼀类较为简单的对策模型。
矩阵对策基础我们假设,局中⼈ I 有纯策略α1,...,αm,局中⼈ II 有纯策略β1,...,βn,⼆者各选择⼀个纯策略则构成m×n个纯局势 (αi,βj),将 (αi,βj)下 I 的赢得值记为a i,j,设矩阵A=[a i,j],称为 I 的赢得矩阵或 II 的⽀付矩阵。
局中⼈ II 的赢得矩阵就是 −A T。
最优纯策略若纯局势 (a i∗,b j∗) 满⾜max i minj a i,j=minjmaxi a i,j=a i∗,j∗则称为矩阵对策 {S1,S2;A} 的最优纯策略。
显然,最有纯策略在赢得矩阵中对应的元素⼀定满⾜,其是所在⾏的最⼩元素,也是所在列的最⼤元素,即矩阵的鞍点。
混合策略当纯策略不存在时,我们希望给出⼀个选取不同策略的概率分布。
我们记 I,II 的概率分布向量分别为x,y,所有概率分布向量构成的集合为S1,S2,则局中⼈ I 的赢得函数为E(x,y)=x T Ay。
纯策略是混合策略的特例。
若混合局势 (x∗,y∗) 满⾜max x miny E(x,y)=minymaxx E(x,y)=E(x∗,y∗)则称为矩阵对策 {S1,S2;A} 的最优混合策略。
同样,混合策略 (x∗,y∗) 是最有混合策略的充要条件也是 (x∗,y∗) 是函数E(x,y) 的鞍点。
对策论例题
策略 1 1 A 2 3 3 0 2
39; 3
把此对策问题表示成一个线性规划模型,并用单纯 形法求解此对策。 解 由 max min aij 0, min max aij 2, 知v>0 j j i i ' ' ' 先求B的最优策略,设B的策略为 ( y1 , y2 , y3 ), 对策值
* 1 * 2 * 3
例3 已知矩阵对策 , 局中人为A与B,A的赢的矩阵为
0 3 1 1 1 2 2 1 1 1 3 0
求对策的最优混合策略与对策的值。 解 由max min aij 2, min max aij 0, 知-2<V<0. 将上面的赢得矩阵中各元素都加上3, 得新的赢得
3 2 0 4
y y y 为v,并令 y1 , y2 , y3 , v v v
则B规划的线性规划模型为表5。1 初始表
max W y1 y2 y3,
3 y1 2 y2 s.t. 2 y y 1 2 y1 , y2 , 2 y3 4 y3 y3 0 1 1 1
的最优解为 2 或 4 , 最优解 V
5.
注: 此例说明,对策的解可以不惟一,但值是唯一的.
2。无鞍点的混合策划问题 (1)线性规划法求解
例 2 某小城市有两家超级市场相互竞争,超级市场
A有三个广告策略,超级高级B也有三个广告策略, 已经算出当双方采取不同的广告策略时,A方所占市 场 份额增加的百分数如下:
0
0
1
0
-1/3
1/3
YB
b
y1
y2
y3
s1
s2
s3
《运筹学教程》胡云权第五版运筹学-6对策论-矩阵对策
矩阵对策的基本原理
矩阵对策的基本原理是将决策问题抽象为一个决策矩阵,其中行表示决策方 案,列表示决策因素。通过对矩阵进行分析和计算,找到最优的决策方案。
矩阵对策的应用领域
矩阵对策可以应用于各种决策问题,包括但不限于供应链管理、投资组合优化、资源分配、人力资源管理等领 域。
矩阵对策的解决方法
矩阵对策可以通过数学方法和算法来求解,例如线性规划、整数规划、动态规划等。不同的决策问题可能需要 不同的解决方法。
案例分析:矩阵对策在实际问题中的应用
本节将通过案例分析展示矩阵对策在实际问题中的应用。我们将介绍一个具体的决策问题,并演示如何使用矩 阵对学习,你已经了解了矩阵对策的基本原理、应用领域和解决方法。希望本节内容对你在运筹学领域 的学习和应用有所帮助。
《运筹学教程》胡云权第 五版运筹学-6对策论-矩 阵对策
本节将介绍运筹学中的矩阵对策,包括其概述、基本原理、应用领域、解决 方法以及在实际问题中的应用。
运筹学简介
运筹学是一门研究在资源有限的情况下如何做出最佳决策的学科。它应用数学方法和模型来协助管理者进行决 策和优化。
矩阵对策概述
矩阵对策是一种运筹学方法,通过构建决策矩阵来帮助管理者进行决策。它 可以同时考虑多个决策因素和多种决策方案,从而找到最佳决策。
对策论(Theory of Games)
定义
并不是所有的对策都存在鞍点,如 A为齐王的赢得矩阵 3 1 1 1 1 -1 1 3 1 1 -1 1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 -1 1 3 1 1 1 1 -1 1 3 max(min aij)= -1 min (max aij)=3 i j j i
例如:
• 给定矩阵对策
6 5 6 A 1 4 2 8 5 7
对策的最优值为5,对策的解有两个,分 别为局势 , 和 , 。
1 2 3 2
(三)矩阵对策的混合策略
1、矩阵对策的混合策略的定义
2、原则:坏中求好的原则。 3、解的存在:一定有解 4、混合策略求解:利用期望转化成 线性规划问题求解。
三、矩阵对策模型
(一)矩阵对策的概念 (二)矩阵对策的最优纯策略 (三)矩阵对策的混合策略 (四)矩阵对策的解法
(一)矩阵对策的概念 1、矩阵对策的定义 2、建立矩阵对策模型
1、矩阵对策的定义 局中人只有两个,对策中各方只能从有限 的策略集中确定性的选择一种,且对策双 方的支付之和为零的对策称为两人零和纯 策略对策。
表2
齐 王 上中 下 田忌 上中下 3 上下 中上 中 下 1 1 中下 上 -1 下中 上 1 下上 中 1
上下中 1 中上下 1
中下上 1 下中上 1
3 1
1 -1
-1 3
1 1
1 1
3 1
1 -1
1 3
1 1
-1 1
下上中 -1
1
1
1
1
3
引例3
有两个儿童A和B在一起玩“石头-剪子布”游戏。我们规定胜者得1分,负者得 -1分,平手时各得0分。双方选定的各种 出法及相应的结果可由下表列出。双方 应取何种策略?
第15章对策论
(4) (i,j )为 矩 阵A或 对 策G的 鞍 点 .
3. 纯策略意义下有解的充要条件
矩阵对G策{S1,S2, A}在纯策略意义下有解
存在纯局(势 i,j),使得对 i, j,都有
aij aij aij
8
二、有鞍点的矩阵对策及其最优纯策略
12
LOGO
Thank You !
2. 混合扩充
将局中人P1, P2各自的所有混合策略的集合分别记为 S1* ={XEm}, S2* ={YEn}. 称期望函数
为局中人P1的赢得函数, 称G*={S1* , S2* ,E}为对策G的混合扩充.
11
三、无鞍点的矩阵对策及其最优混合策略
运筹学
3. 最优混合策略与混合策略意义下的解
设G*={S1* , S2* ,E}为矩阵对策G ={S1, S2, A}的混合扩充,若
运筹学
运筹学
运筹学
运筹学
运筹学
§15.2 矩阵对策
运筹学
二、有鞍点的矩阵对策及其最优纯策略
1. 悲观准则(最大最小赢得准则与最小最大付出准则)
2. 最优纯策略与鞍点
设 矩 阵 对G策{S1, S2, A},其 中S1 {1m},S2 {1n}.
若有等式
miaxmjinaij
minma
j
i
则
(1) 称使上式成立的混合策略X*, Y*分别为局中人P1, P2的最优 混合策略.
(2) 称混合局势(X*, Y*)为对策G在混合策略意义下的解(或平衡 (3) 局势). (4) (3) 称上式的值为对策G在混合策略意义下的值, 记作VG*
4. 混合策略意义下解的存在性
8.1对策问题的提出8.2对策论模型8.3矩阵对策的解法知识归纳习题
合作… 对策模型… 零和 二人 有限 非零和 完全信息 静态 多人…… 无限…… 非合作 不完全信息…… 完全信息 动态 不完全信息……
(2)策略 在一局对策中,可供局中人选择的一个实际可行的自始至终通盘筹划的完整行动 方案称为这个局中人的一个“策略”。参加对策的局中人i(i∈I)的所有可供选择的 策略的全体所构成的集合叫做局中人i的“策略集”,简记作Si。 (3)赢得函数 一局对策结束之后,对每个局中人来说,不外乎是胜利或失败,名次的前后, 以及其他物质的收入或支出等,这些可以统称为“得失”或“益损”。 在齐王与田 忌赛马的例子中,最后田忌赢得一千金,而齐王损失一千金,即为这局对策(结局时) 双方的“得失”。 实际上,每个局中人在一局对策结束时的得失,与局中人所选定的策略有关。 例如,上述赛马的例子中,当齐王出策略“上、中、下”,田忌出策略“下、上、中” 时,田忌得千金;而如果与田忌都出策略“上、中、下”时,田忌就得付出三千金了。 因此,在一局对策中,当局势给定以后,对策的结果也就确定了。 一局对策结束时,每个局中人的“得失”是全体局中人所决定的一组策略即 “局势”的函数,我们称之为“赢得函数”。 在最终局势ω下,局中人i∈I的赢得函数记作:H(i,ω)。 在一局对策中,如果在任一“局势”中,全体局中人的“得失”相加总和为零, 就称该对策为“零和对策”,否则,就称为“非零和对策”。上述齐王与田忌赛马的 例子中,不论比赛双方的策略如何,比赛的结果,一方的所得必为另一方的所失,因 此该对策就是一个零和对策。 一般来说,当上述三个基本要素确定以后,一个对策模型就确定了。
(3)发展阶段 20世纪60至80年代是博弈论体系的发展壮大时期。一方面,研究的领域从军事 战略战术问题推广应用到经济领域;另一方面,研究的内容也不断发展出新。合作博 弈理论继续得到充实和丰富,而非合作博弈理论更是发展迅速,成为博弈论研究和应 用的主流。 (4)成熟阶段 纪80年代至今是博弈论的完善和应用期。此间博弈论本身发展成为了一个 相对完善、内容丰富的理论体系,羽翼已丰的非合作博弈理论在理论研究和实践应用 中都占据了主导地位。更重要的是,博弈理论在各种经济学科中都得到了深入的应用, 在政治学、生物学、计算机科学、道德哲学、社会学等领域内也产生了重要影响。 1994年,纳什、泽尔腾、海萨尼三人因博弈论及其在经济应用方面的突出贡献而荣 获诺贝尔经济学奖,1996年诺贝尔经济学奖再度授予了在博弈论研究方面作出突出 贡献的维克里和莫里斯。由此,吸引了更多的学者投入到博弈论的研究当中,使得博 弈论成为世界范围内的研究热点,博弈论也逐步趋于完善和成熟。2001年,研究博 弈论的学者再一次获得诺贝尔经济学奖。美国教授乔治· 阿克尔洛夫、迈克尔· 斯彭斯 和约瑟夫· 斯蒂格利茨在20世纪70年代奠定了对充满不对称信息市场进行分析的理论 基础,正是由于他们在“对充满不对称信息市场进行分析”领域所做出的重要贡献, 而分享了2001年诺贝尔经济学奖。
运筹学--对策论
max min E(X,Y)= min max E(X,Y)
X S1* Y S2*
Y S2* X S1*
则称这个公共值为对策G在混合意义 下的值,记为V*G,而达到V*G 的混 合局势(X*,Y*)称为对策G在混合 策略意义下的解,而X*和Y*分别称 为局中人I,II的最优混合策略。
定理14-2:矩阵对策 G = S1,S2;A
0 2 3 0
赢得矩阵为 A 2 0 3 0
0
3
0 4
0
3
4
0
14.2 矩阵对策的混合策略
定义:对给定的矩阵对策
G = Ⅰ,Ⅱ;S1,S2;A
其中 S1= 1, 2…m
S2= 1 , 2… n
A=(aij)mn
把纯策略集合对应的概率向量
X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
分别称为局中人I和局中人II的混合策略。
如果局中人I选取的策略为
X=(x1, x2 … xm) 局中人II选取的策略为
Y=(y1 , y2 … yn ),则期望值 E(X,Y)= xi aij yj=XAYT 称为局中人I期望赢得,而局势(X,Y) 称为“混合局势”,局中人I,II的混合 策略集合记为S1*, S2*。
S1= 1、 2…… m
同样,局中人II有n个策略:1、 2。。。 n ;用S2表示这些策略的集合: S2= 1、 2… n 局中人I的赢得矩阵是:
a11 a12 …… a1n a21 a22 …… a2n A= …… …… …… a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对策记为G: G= S1,S2;A
对策论的基本概念
对策论的基本概念引言对策论是一种重要的决策理论,它在多个领域,包括经济学、政治学、管理学等方面都有广泛的应用。
本文将介绍对策论的基本概念,包括对策、对策矩阵、纳什均衡等内容。
对策的定义对策是指在决策过程中,一方的行动将受到另一方行动的影响,从而引发一系列后续行动的反应。
对策是一种针对不确定性情况下的最佳决策方法,通过预测对手的可能行动并制定相应的应对策略来实现最优效果。
对策通常涉及两个或多个决策者之间的互动。
在对策中,每个决策者都试图通过选择最优的行动来达到自己的目标,同时也要考虑到对手的行动。
对策矩阵是对策论分析的基本工具之一,用于描述对策者在不同行动下的收益情况。
对策矩阵通常以表格形式呈现,横轴代表一个决策者的行动,纵轴代表另一个决策者的行动,每个单元格中的数值表示在特定行动组合下各方的收益。
例如,考虑两个决策者A和B在某个游戏中的对策矩阵如下:行动1 行动2 行动3行动1 2, 2 0, 3 1, 1行动2 1, 0 3, 2 2, 1行动3 1, 1 2, 2 0, 3在这个对策矩阵中,每个单元格表示A和B在特定行动组合下的收益情况。
例如,当A选择行动1,B选择行动2时,A的收益为0,B 的收益为3。
纳什均衡是对策论中的一个重要概念,指的是在对策矩阵中,各方在给定对手行动的情况下,选择能够最大化自己收益的行动组合。
在对策矩阵中,如果不存在更好的选择来取代当前的行动组合,那么该组合就是一个纳什均衡。
在纳什均衡下,每个决策者都无法通过改变自己的行动来获得更好的结果。
以前面的对策矩阵为例,在该矩阵中,行动组合(行动1, 行动2)是一个纳什均衡,因为在这种情况下,A选择行动1,B选择行动2时,双方的收益已经达到最大化。
结论对策论是一种重要的决策理论,可以应用于各种领域,帮助我们理解和分析决策者之间的互动和冲突。
本文介绍了对策的基本概念,包括对策、对策矩阵和纳什均衡。
了解对策论的基本概念将有助于我们更好地理解和解决复杂的决策问题。
《运筹学教程》胡云权 第五版 运筹学--6对策论--矩阵对策
13
矩阵对策的纯策略
4、矩阵对策的鞍点与解 多鞍点与无鞍点对策 例: 设有一矩阵对策如下,求它的解。
6 5 6 5
A 1 4 2 1 8 5 7 5
0 2 6
2
局势(α1, β2),(α1, β4),(α3, 均构成鞍点,此对策有多个解。
β2)(α3,
β4) 14
矩阵对策的纯策略
5、矩阵对策纯策略的性质
作业
P385 习题 • 12.2 • 12.3 • 12.4
16
矩阵对策的混合策略
1、混合策略
对于 G {S1, S2; A}
局中人Ⅰ有把握的赢得至少为 v1
max i
min j
aij
局中人Ⅱ有把握的支付至多为 v2
min max
j
i
aij
一般为 v1 v2 ,特别地当 v1 v2 时,则称对策 G 在
yS
* 2
xS1*
20
矩阵对策的混合策略
5、最优混合策略
定义 4:设 G* {S1*, S2*; E} 是矩阵对策 G {S1, S2; A}的混合扩充。
如果
maxmin E(x,
xS1* yS2*
y)
m in m ax E ( x,
yS2* xS1*
y)
,其值为 VG
,则称
VG 为
对策 G* 的值,相应的混合局势 (x*, y*) 称为在混合策略意义下的
44
22
23
对策的值(局中人
I
的赢得期望值)VG
9 2
。
矩阵对策的解法
24
图解法
仅适用于赢得矩阵为2×n或m×2阶的矩阵对策问题。
矩阵对策的基本理论
A
a21
a22
a2n
am1 am2 amn
(12-3)
为局中人Ⅰ的赢得 矩阵。由于对策为零和的,故局中人 Ⅱ的赢得矩阵为-A。
当局中人Ⅰ、Ⅱ的策略集 S1, S2 及局中人Ⅰ的赢得矩阵 A 确定后,一个矩阵对策就给定
了。因此将矩阵对策表示为 G S1,S2;A.
矩阵对策的最优纯策略
x E m
x
x , x ,, x
12
m
T
,
x i
0, i
1,,
m,
m
x i
i 1
1
S 2
y
E
n
y
y , y ,, y
12
n
T,
y j
0,
j
1,
n,
n
j 1
y j
1
S 和S 1
2
分别称为局中人Ⅰ和Ⅱ的混合策略集;
x
S
1
和y
S
2
分别称为局中人Ⅰ和Ⅱ
的混合策略;当
x
S 1
和y
S
2
其中, T G1
和T G 2
分别为局中人 I 和 II 的策略集。
运筹学
使自己的赢得尽可能的小,理性的选择就应该是从各自可能出现的最不利的情形中争取尽可
能好的结果。
对策论第2,3节 矩阵对策的基本定理与解法
存在前提:
max min aij = min max aij= v
i
j
ji
ห้องสมุดไป่ตู้
又称( 2 ,3 )为对策G={s1,s2,A}的鞍点。值 V为G的值。
定义9-1:对给定的矩阵对策
G = S1,S2;A 若等式
max min aij= min max aij
i
j
j
i
成立,则称这个公共值为对策G的值,记 为VG,而达到的局势( i, j )称为对 策G在纯策略意义下的解,记为( I*, j *)而I*和 j *分别称为局中人I和局中 人II的最优纯策略。
第2,3节 矩阵对策理论与求解方法
一、矩阵对策的最优纯策略
•在甲方赢得矩阵A=[aij]m*n中: aij代表甲方取策略i,乙方取策略j, 这一局势
下甲方的益损值,此时乙方的益损值为-aij(零 和性质)。 •在讨论各方采用的策略是必须注意一个前提就 是对方是理智的。这就是要从最有把握取得的 益损值情况考虑。
显然 ai2 a12 a1j ai2 a32 a3j 对 I=1,2,3 j=1,2,3 都成立: a12 = a32 =5 由定理5-1,对策值=5,对策的解:( 1 , 2 ) 和( 3 , 2 )
例3:某单位采购员在秋天时要决定冬天取暖 用煤的采购量。已知在正常气温条件下需要用 煤15吨,在较暖和较冷气温条件下需要用煤10 吨和20吨。假定冬季的煤价随着天气寒冷的程 度而变化,在较暖、正常、较冷气温条件下每 吨煤价为100元、150元、200元。又秋季每 吨煤价为100元。在没有关于当年冬季气温情 况下,秋季应购多少吨煤,能使总支出最少?
E(X,Y)= xi aij yj=XAYT 称为局中人I期望赢得,而局势(X,Y)称为“混合 局势”,局中人I,II的混合策略集合记为S1*, S2*。
对策论
§4.2 矩阵对策的基本理论(续)三 混合策略与混合扩充 1. 基本概念在上面的最优纯策略中,能够有最优纯策略的决策问题中存在一个鞍点,也就是必须有max(min )ij jia =)(max min iij ja如果 max(min )ij jia ≠)(max min iij ja那末,对策中双方没有最优纯策略,也就是没有在纯策略中的解,我们把这种对策称为无鞍点的对策。
比如:给定矩阵对策G :G={S 1,S 2,A},其中S 1={a 1, a 2 },S 2={β1,β2},1342A ⎛⎫= ⎪⎝⎭可知 )min (max ij jia =2 )(max min iij ja =3所以 )min (max ij jia ≠)(max min iij ja注:在齐王塞马的例子中也是没有鞍点。
在这种情况下,局中人应如何选择纯策略参加对策呢?这就需要估计选取各个策略可能性的大小来进行对策,或者说,用多大概率选取各个纯策略。
我们把每一个局中人用一定的概率选取纯策略来参加的对策称为混合策略。
例如上面的例子:假定:局中人甲以概率x 选取纯策略a 1;以概率1—x 选取纯策略a 2 局中人乙以概率y 选取纯策略β1;以概率1—y 选取纯策略β2⎪⎪⎭⎫⎝⎛--2431)1()()1()(2121x a x a y y ββ于是对局中人甲来说,他的期望赢得便是E (x , y ) =)1)(1(2)1(4)1(3y x y x y x xy --+-+-+ =224+++-y x xy=2/5)4/1)(2/1(4+---y x由此可见:当x =1/2时,即局中人甲以50% 的概率选纯策略a 1参加对策,他的赢得期望至少是5/2,但它不能保证超过5/2,因为当局中人乙取y =1/4时,会控制局中人甲不超过5/2。
因此5/2是局中人甲赢得的期望值。
同样,局中人乙取y =1/4时,才能保证他的支出不多于5/2.。
10-矩阵对策
(X*,Y*) —— 对策G在混合策略意义下的解 E(X*,Y*) —— 对策G的值,记为 v* ,即 v*= max min E(X,Y) = min max E(X,Y) = E(X*,Y*)
X Y Y X
这样,对策在纯策略意义下的解(α* , β*)就成为(X*, Y*) 的一种特殊情况。
20
24
第10章
矩阵对策
6
第10章
矩阵对策
10.1 基本概念
则 S1 与 S2 构成 m×n 个局势 令 (αi , βj ) ,
i = 1, 2, · · · , m; j = 1, 2, · · ·, n
aij ——甲方关于局势 (αi , βj ) 的赢得 则所有 aij 构成一个矩阵 A = ( aij )m×n 称为甲方的赢得矩阵。 由于甲、乙双方得失总和恒为零,所以A还可称为 乙方的损失矩阵,而 –A 即乙方的赢得矩阵。
19
第10章
矩阵对策
10.1 基本概念
(4) 若有X*∈S1*, Y*∈S2*, 使 E(X*,Y*) = max min E(X, Y) = min max E(X, Y)
X Y Y X
则
X* —— 甲方的最优混合策略 Y* —— 乙方的最优混合策略 简称最优策略;而
如例2 : X*= (0, 1, 0)T α 2 Y*= (0, 0, 1, 0)Tβ 3
5
第10章
矩阵对策
10.1 基本概念
三、矩阵对策的基本模型
在二人有限零和对策中,设以甲方、乙方表示两个
局中人, 以 S1 = {α1,α2 , · · · , αm } S2 = {β1,β2 , · · · , βn } 分别表示甲方、乙方的策略集,
第10章 第2节 矩阵对策的基本原理
v 2 min max E(x, y) * *
yS2 xS1
20
设
max min E(x, y) min E(x , y) E(x , y ) * * *
xS1 yS2 yS2 * * * min max E(x, y) max E(x, y ) E(x , y ) * * * yS2 xS1 xS1 * * *
实际中出现的更多情形是v1< v2,根据定义1, 对策不存在纯策略意义下的解。例如:赢得 矩阵为
3 A 5
6 4
16
v1 max min aij 4,
i j
i 2
*
v 2 min max aij 5,
j i
j 1
*
v 2 5 4 v1
想法:是否可以给出一个选取不同策略的 概率分布?
a12 a22 amቤተ መጻሕፍቲ ባይዱ2
a1n a2 n amn
2
为局中人I的赢得矩阵(或局中人II的支付矩阵)。由 于假定对策为零和的,故局中人II的赢得矩阵就是 -A。通常,将一个矩阵对策记成 G={I,II;S1,S2;A} 或 G={S1,S2;A}
例:齐王赛马
赢得矩阵为:
3 1 1 1 1 1 1 3 1 1 1 1 1 1 3 1 1 1 A 1 1 1 3 1 1 1 1 1 1 3 1 1 1 1 1 1 3
5
当矩阵对策模型给定后,各局中人面临的问题便是 如何选取对自己最有利的纯策略,以谋取最大的赢 得(或最少损失)。
1
S1 1 , 2 ,, m
S2 1 , 2 ,, n
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
局中人II的赢得矩阵是 局中人II的赢得矩阵是 -A 把一个对策记为G 把一个对策记为G: G= S1,S2;A
北线 β1 南线β2 (盟军)北线 α1 盟军) 南线α2 2 1 2 3 =A
在矩阵中,盟军的最大赢得是3 在矩阵中,盟军的最大赢得是3, 而要得到3 必须选择策略α 而要得到3,必须选择策略α 2,而 日军的目的是使盟军的赢得尽量的 必须选择策略β 小,必须选择策略β1 ,使盟军的赢 得只有1 得只有1。 在局中人I 在局中人I设法使自己的赢得 尽可能大的同时,局中人II也设法 尽可能大的同时,局中人II也设法 使局中人I的赢得尽可能小。 使局中人I的赢得尽可能小。
有解的充分必要条件是在A 有解的充分必要条件是在A中存在元 素 ai*j*是其所在行中最小的同时又 是其所在列中最大的。这时ai*j*即 是其所在列中最大的。 是对策值,因此ai*j*也称为“鞍 也称为“ 对策值, ),为对策 点”,而( α*i*, β*j *),为对策 的解。 的解。
Z
鞍点
Y
X
经测算,双方均可得到如下估计: 经测算,双方均可得到如下估计: 局势1 盟军的侦察机重点搜索北线, 局势1: 盟军的侦察机重点搜索北线, 日本舰队也恰好走北线。 日本舰队也恰好走北线。由于气候恶 能见度差, 劣,能见度差,盟军只能实施两天的 轰炸。 轰炸。 局势2 盟军的侦察机重点搜索北线, 局势2:盟军的侦察机重点搜索北线, 日本舰队走南线。由于发现晚, 日本舰队走南线。由于发现晚,尽管 盟军的轰炸机群在南线, 盟军的轰炸机群在南线,但有效轰炸 也只有两天。 也只有两天。
马鞍面z=f(x,y) 马鞍面z=f(x,y)
Z
Y
在X=0的平面上 X=0的平面上
z=f(0,y)
鞍点是 鞍点是z=f(0,y)
的极大值点
Z
z=f(x,0)
X
在Y=0的平面上 Y=0的平面上
鞍点是 鞍点是z=f(x,0)
的极小值点
例14-3:对给定的矩阵对策 G = S1,S2;A 14S1= α1,α2 ,α3 6 A= 1 8 显然 S2= β1 , β2 , β3 5 4 5 6 2 7 ai2 ≤ a32 ≤ a3j
β1 α1 α2 α3 由 -1000 -1500 -2000
β2 -1750 -1500 -2000
β3 -3000 -2500 -2000
max min aij= min max aij = a33 = -2000
I j j i
该最优策略为( ),即秋季购煤 即秋季购煤20 该最优策略为(α3, β3),即秋季购煤20 吨。
(日军) 日军) 北线 (盟军)北线 盟军) 南线 2 1 (日军) 日军) 北线 (盟军)北线 盟军) 南线 -2 -1 南线 -2 -3 =B 南线 2 3 =A
在本例中的每一个对局,双方的 在本例中的每一个对局, 赢得的代数之和为零, 赢得的代数之和为零,这样的对 策称为“有限零和二人对策” 策称为“有限零和二人对策” 设两个局中人为I II,局中人I 设两个局中人为I,II,局中人I有 m 个策略:α1、 α2… α m ;用S1表 个策略: 示这些策略的集合: 示这些策略的集合: S1= α1、 α2……α m ……α
赢得矩阵(支付): ):当每个局中人 赢得矩阵(支付):当每个局中人 在确定了所采取的策略后, 在确定了所采取的策略后,他们就 会获得相应的收益或损失, 会获得相应的收益或损失,此收益 或损失的值称为赢得(支付)。 )。赢 或损失的值称为赢得(支付)。赢 得与策略之间的对应关系称为赢得 支付)函数。 (支付)函数。 案例中, 案例中,肯尼将军与山本五十六大 将的赢得(支付) 将的赢得(支付)函数都可以用矩 表示。 阵A、B表示。
当盟军获悉此情报后,盟军统帅 当盟军获悉此情报后, 麦克阿梭命令太平洋战区空军司令肯 尼将军组织空中打击。 尼将军组织空中打击。 日本统帅山本五十六大将心里很 明白: 明白: 在日本舰队穿过俾斯麦海的三 天航行中, 天航行中,不可能躲开盟军的空中打 他要策划的是尽可能减少损失。 击,他要策划的是尽可能减少损失。 日美双方的指挥官及参谋人员都 进行了冷静的思考与全面的谋划。
j i
案例中局中人I 盟军) 案例中局中人I(盟军)应当选 择(北线)策略α1,这样能保证赢 北线)策略α 这样能保证赢 局中人II(日军) 得2。局中人II(日军)应当选择 北线)策略β 盟军赢得不超过2 (北线)策略β1使盟军赢得不超过2。 实际上, 局势下, 实际上,在( α1, β1)局势下,有 max min aij= min max aij
这场海空遭遇与对抗一定会发生, 这场海空遭遇与对抗一定会发生, 双方的统帅如何决策呢? 双方的统帅如何决策呢?历史的实际 情况是:局势1成为现实。 情况是:局势1成为现实。肯尼将军命 令盟军的侦察机重点搜索北线; 令盟军的侦察机重点搜索北线;而山 本五十六大将命令日本舰队取道北线 航行。由于气候恶劣,能见度差, 航行。由于气候恶劣,能见度差,盟 军飞机在一天后发现了日本舰队, 军飞机在一天后发现了日本舰队,基 地在南线的盟军轰炸机群远程航行, 地在南线的盟军轰炸机群远程航行, 实施了两天的有效轰炸, 实施了两天的有效轰炸,重创了日本 舰队,但未能全歼。 舰队,但未能全歼。
ai2 ≤ a12 ≤ a1j
对 I=1,2,3 j=1,2,3 都成立: a12 = a32 =5 都成立: 由定理5 由定理5-1,对策值=5,对策的解:( α1 , β2 ) 对策值=5,对策的解:( 和 ( α3 , β 2 )
例14-4:某单位采购员在秋天时要决定 14冬天取暖用煤的采购量。 冬天取暖用煤的采购量。已知在正常气 温条件下需要用煤15吨 温条件下需要用煤15吨,在较暖和较冷 气温条件下需要用煤10吨和 吨 吨和20 气温条件下需要用煤10吨和20吨。假定 冬季的煤价随着天气寒冷的程度而变化, 冬季的煤价随着天气寒冷的程度而变化, 在较暖、正常、 在较暖、正常、较冷气温条件下每吨煤 价为100元 150元 200元 价为100元、150元、200元。又秋季每吨 煤价为100元 煤价为100元。在没有关于当年冬季气温 情况下,秋季应购多少吨煤, 情况下,秋季应购多少吨煤,能使总支 出最少? 出最少?
对策的三要素: 对策的三要素: 局中人: 局中人:有权决定自己行为方案的对 局参加者称为局中人。案例中, 局参加者称为局中人。案例中,美日 双方的决策者为局中人。 双方的决策者为局中人。当对局中局 中人只有两人时,称为二人对策。 中人只有两人时,称为二人对策。 策略: 策略:对局中一个实际可行的方案称 为一个策略。案例中, 为一个策略。案例中,美日双方各有 二个策略。
第十四章 对策论
对策论概论
对策论(The Game Theory)也称竞赛 Theory)也称竞赛 对策论( 论或博弈论,是研究具有竞争、对抗、 论或博弈论,是研究具有竞争、对抗、利益 分配等方面的数量化方法, 分配等方面的数量化方法,并提供寻求最优 策略的途径。 策略的途径。 1944年以来,对策论在投资分析、价格制定、 1944年以来,对策论在投资分析、价格制定、 年以来 费用分摊、财政转移支付、投标与拍卖、 费用分摊、财政转移支付、投标与拍卖、对 抗与追踪、国际冲突、双边贸易谈判、 抗与追踪、国际冲突、双边贸易谈判、劳资 关系以及动物行为进化等领域得到广泛应用。 关系以及动物行为进化等领域得到广泛应用。
同样,局中人II有 个策略: 同样,局中人II有n个策略:β1、 β2。。。 表示这些策略的集合: β n ;用S2表示这些策略的集合: S2= β1、 β2… β n 局中人I的赢得矩阵是: 局中人I的赢得矩阵是: a11 a21 a12 …… a1n a22 …… a2n
A= …… …… …… a m1 a m2 … a mn
1414-1矩阵对策的基本概念
案例: 案例:俾斯麦海的海空对抗 1943年 1943年2月,第二次世界大战中的 日本,在太平洋战区已经处于劣势。 日本,在太平洋战区已经处于劣势。 为扭转局势, 为扭转局势,日本统帅山本五十六大 将统率下的一支舰队策划了一次军事 行动:由集结地——南太平洋的新不 行动:由集结地——南太平洋的新不 列颠群岛的蜡包尔出发, 列颠群岛的蜡包尔出发,穿过俾斯麦 开往新几内亚的莱城, 海,开往新几内亚的莱城,支援困守 在那里的日军。 在那里的日军。
解: 局中人I 采购员)有三个策略: 局中人I(采购员)有三个策略: 策略α 10吨 策略α 15吨 策略α 20吨 策略α1: 10吨,策略α2: 15吨,策略α3 :20吨。 局中人II(环境): 局中人II(环境): 策略β 策略β1 较暖 ,策略β2 正常,策略β3较冷 策略β 正常,策略β 现把该单位冬天取暖用煤全部费 用(秋季购煤费用与冬天不够时再补购 煤费用)作为采购员的赢得矩阵。 煤费用)作为采购员的赢得矩阵。
所以局中人I应首先考虑用α 所以局中人I应首先考虑用α 所能赢 得的最小, 得的最小,然后在这些最小赢得中 选择最大。局中人I 选择最大。局中人I可以保证赢得 max min aij
i j
同样,局中人II可以保证局中人 可以保证局中人I 同样,局中人II可以保证局中人I的 赢得不超过 min max aij
i j j i
上式蕴涵的思想是朴素自然的, 上式蕴涵的思想是朴素自然的,可 以概括为: 从最坏处着想, 以概括为:“从最坏处着想,去争 取最好的结果” 取最好的结果”
定义14定义14-1:对给定的矩阵对策 G =
i j
S1,S2;A
j i
若等式
max min aij= min max aij 成立,则称这个公共值为对策G的值, 成立,则称这个公共值为对策G的值, 记为V 而达到的局势( 记为VG,而达到的局势( αi, β j ) 称为对策G在纯策略意义下的解, 称为对策G在纯策略意义下的解,记 为( αI*, β j *)而αI*和β j *分别称 为局中人I和局中人II的最优纯策略 的最优纯策略。 为局中人I和局中人II的最优纯策略。