第十三讲 对策矩阵解法
矩阵对策
max aij 对局中人 II,求 min j i
若 max min aij min max aij a i
i j j i
*
j*
策略 i , j 为I,II 的最优策略
这一对策 的值为 V a i
j
几个术语
局势 对策的解
最优纯策略
对策的值 鞍点 e. g. 2 (续)求解取暖购煤问题
两人零和对策
对抗对策(antagonistic game)
矩阵对策(matrix game)
二.实际问题中的矩阵对策模型
e. g. 1 扩大销售模型
公司I,公司II 的同一产品竞争市场份额,各有三种办 法扩大销售额(由于市场需求一定,一家扩大,意味 另一家缩减),三种方法比如:①改进包装;②广告; ③降价.公司I 的三种策略表示为 1 , 2 , 3 ,公司II 的三种策略为 1 , 2 , 3 ,在不同策略下销售量增长百 分比不同.下表中表示公司I 的增长率,而公司II 的即 为相反数
e. g. 6 (续)求最优策略与值
作业
P206,
Ex 6. 3:1,2
1=急转 2 =不转
1
给急转弯者以1 分,不转弯者以5 分 局中人II 局中人I 局 =急转 1 中 人 2=不转 II
3 5
1 =急转 2=不转
1 0
0
II 的支付矩阵
此对策中,若两者都想得5 分,则发生惨祸, 全部玩完.实际上两人最好的做法是同时停车 或转弯,各得3 分. Remark 此例已不是 2 人有限零和对策问题(因为在 每个对局中,双方支付的代数和不为零), 称为双矩阵对策.
e. g. 2 取暖购煤问题 某公司在秋末需决定冬季取暖用煤问题.根据气温 情况,用煤量和煤价均不同,可用下表表示: 正常气温 较冷气温 较暖气温 需求量15 吨 需求量20 吨 需求量10 吨 200元/吨 250元/吨 150元/吨
对策问题的提出对策论模型矩阵对策的解法◎知识归纳
(1)萌芽阶段 从19世纪末到20世纪30年代可以说是博弈论的萌芽期,表现为学者们对社会经
济理论和现实的一些思考,研究者以数学家为主。 (2)产生阶段 20世纪四五十年代可说是博弈论的体系建立时期。1944年诺依曼和摩根斯坦的
(2)物流仓储优化策略 【例8.2】一仓储供应中心为其下游的一家生产企业供应某种原料。生产企业根 据产品订单情况对原料的需求进行分析,分别有淡季、旺季和正常三种情况,在正 常情况下需要原料15吨,在淡季和旺季情况下分别需要原料10吨和20吨;而原料的 价格与原料市场的需求有关,在淡季、正常、旺季三种情况下,每吨原料的价格分 别为100元、150元和200元,已知此时每吨原料的价格为100元。问在生产企业对原 料的需求没有确定预知的条件下,此时应采购多少吨原料才能使仓储供应中心的总 成本最少(不计存储费用)? 这个问题可看成一个博弈问题。即仓储供应中心针对可能出现的三种不同的原
巨著《博弈论和经济行为》的出版,标志着博弈论作为一门学科的建立,也被视为 数理经济学学科建立的里程碑。巨著出版前后的若干年中,合作博弈理论的研究得 到了迅速的发展,提出了各种概念,并在20世纪50年代达到了研究的高峰。不久, 库克于1950年定义了“囚徒的困境”,纳什在1950年和1951年发表了两篇关于非合 作博弈的重要文章,这两位学者的研究工作,特别是纳什的研究工作奠定了非合作 博弈论的基础,所提出的纳什均衡概念,在非合作博弈论中起着核心作用。
8 对策论
8.1 对策问题的提出 8.2 对策论模型 8.3 矩阵对策的解法 ◎ 知识归纳 ◎ 习题与思考题
8.1 对策问题的提出
对策问题的提出对策论模型矩阵对策的解法◎知识归纳
(1)局中人 在一个对策行为中,有权决定自己行动方案的对策参加者被称为局中人。局中 人除了理解为个人外还可以理解为集体,如球队、交战国、企业公司等,也可以把大 自然理解为局中人(因为人类经常处于和大自然斗争的状态中);另外,还假定局中 人都是聪明的,有理智的和利己的。同时,为使所研究的问题更加清晰,把那些利益 完全一致的参加者们看做一个局中人,因为他们利害一致,必使他们齐心合力,相互 配合行动如一个人。例如,桥牌游戏中,东西双方利益一致,南北两方得失相当,所 以虽有四人参加,只能算有两个局中人。 一个对策中一般要求至少有两个局中人。每个局中人用i表示,局中人的集合用 字母I表示,则I={1,2,…,n}。我们称只有两个局中人的对策现象为“两人对 策”,如象棋、桥牌等,显然上述齐王赛马中局中人也是两人,即I={1,2}。而 多于两个局中人的对策称为“多人对策”。另外根据局中人之间是否允许进行合作, 还可有“结盟对策”和“不结盟对策”,或称为“合作博弈”和“非合作博弈”。
(2)物流仓储优化策略 【例8.2】一仓储供应中心为其下游的一家生产企业供应某种原料。生产企业根 据产品订单情况对原料的需求进行分析,分别有淡季、旺季和正常三种情况,在正 常情况下需要原料15吨,在淡季和旺季情况下分别需要原料10吨和20吨;而原料的 价格与原料市场的需求有关,在淡季、正常、旺季三种情况下,每吨原料的价格分 别为100元、150元和200元,已知此时每吨原料的价格为100元。问在生产企业对原 料的需求没有确定预知的条件下,此时应采购多少吨原料才能使仓储供应中心的总 成本最少(不计存储费用)? 这个问题可看成一个博弈问题。即仓储供应中心针对可能出现的三种不同的原
8.1.2 对策论在现代物流管理中的运用
在现代物流管理实践中,决策者们为了谋求自身的不断发展,保持自身的竞争 优势,必须不断地审时度势、不停地进行选择和作出决定,以保证最大限度地降低 物流成本、提高物流效率及服务水平。他们的选择和决定会影响到竞争对手的决策 结果,同样竞争对手的选择和决定也直接影响着他们的决策结果。也就是说,决策 者在决策时必须要考虑到对手的策略,因此,博弈论的思想已完全融入到现代物流 管理的每一个环节中。博弈论在现代物流管理中的运用主要有物流项目投资、物流 市场竞争对策、物流服务价格策略、物流中心选址、物流运输规划、物流仓储优化 等内容。以下仅就本书涉及到的有关博弈论中矩阵对策的例子作简要介绍。
矩阵对策问题及其解法
矩阵对策问题及其解法背景对策论研究具有竞争性质的现象。
有权决定⾃⾝⾏为的对策参加者称为局中⼈,所有局中⼈构成集合I,在⼀局对策中可供剧中⼈选择的⼀个实际可⾏的完整的⾏动⽅案成为策略,对于任意剧中⼈i∈I,都有⾃⼰的策略集S i。
⼀局对策中由各剧中⼈选定的策略构成的策略组称为局势s=(s1,...,s n),⽽全体局势集合S=S1×...×S n。
局势决定了对策的结果,对局势s∈S,局中⼈i可以得到收益H i(s),也称为局中⼈i的赢得函数。
矩阵对策即⼆⼈有限零和对策,是⼀类较为简单的对策模型。
矩阵对策基础我们假设,局中⼈ I 有纯策略α1,...,αm,局中⼈ II 有纯策略β1,...,βn,⼆者各选择⼀个纯策略则构成m×n个纯局势 (αi,βj),将 (αi,βj)下 I 的赢得值记为a i,j,设矩阵A=[a i,j],称为 I 的赢得矩阵或 II 的⽀付矩阵。
局中⼈ II 的赢得矩阵就是 −A T。
最优纯策略若纯局势 (a i∗,b j∗) 满⾜max i minj a i,j=minjmaxi a i,j=a i∗,j∗则称为矩阵对策 {S1,S2;A} 的最优纯策略。
显然,最有纯策略在赢得矩阵中对应的元素⼀定满⾜,其是所在⾏的最⼩元素,也是所在列的最⼤元素,即矩阵的鞍点。
混合策略当纯策略不存在时,我们希望给出⼀个选取不同策略的概率分布。
我们记 I,II 的概率分布向量分别为x,y,所有概率分布向量构成的集合为S1,S2,则局中⼈ I 的赢得函数为E(x,y)=x T Ay。
纯策略是混合策略的特例。
若混合局势 (x∗,y∗) 满⾜max x miny E(x,y)=minymaxx E(x,y)=E(x∗,y∗)则称为矩阵对策 {S1,S2;A} 的最优混合策略。
同样,混合策略 (x∗,y∗) 是最有混合策略的充要条件也是 (x∗,y∗) 是函数E(x,y) 的鞍点。
矩阵分解的常用方法(全文)
矩阵分解的常用方法一、矩阵的三角分解定义:如果方阵可分解成一个下三角形矩阵L和上三角形矩阵U的的乘积,则称可作三角分解或LU分解。
定理1:高斯消元过程能够进行到底的充分必要条件是的前n-1个顺序主子式都不为零,即k ≠0,k=1,2,…,n-1。
(1)当条件(1)满足时,有L(n-1)…L(2)L(1)=U。
其中U为上三角形矩阵L(k)=lik=,i=k+1,…,n。
容易得出,detL(k)≠0(k=1,2,…,n-1),故矩阵L(k)可逆,于是有=(L(1))-1(L(2))-1…(L(N-1))-1U。
由于(L(K))-1是下三角形矩阵,故它们的连乘积仍然是下三角矩阵。
令L=(L(1))-1(L(2))-1…(L(N-1))-1=则得=LU。
即分解成一个单位下三角形矩阵L和一个上三角形矩阵U的的乘积。
二、矩阵的QR(正交三角)分解定义:如果实(复)非奇异矩阵能化成正交(酉)矩阵Q 与实(复)非奇异上三角矩阵R的乘积,即=QR,则称上式为的QR分解。
定理2:任何实的非奇异n阶矩阵可以分解成正交矩阵Q 和上三角形矩阵R的乘积,且除去相差一个对角线元素之绝对值等于1的对角矩阵D外,分解成=QR是唯一的。
矩阵QR的分解具体做法如下:令的各列向量依次为α1,α2,…,αn,由于是非奇异的,所以α1,α2,…,αn线性无关,按照施密特正交法正交化得到个标准的正交向量β1,β2,…,βn,且β=bαβ=bα+b22α2β=bα+b2nα2+…+bnnαn这里bij都是常数,且由正交化过程知bii≠0(i=1,2,…,n)写成矩阵形式有(β1,β2,…,βn)=(α1,α2,…,αn)β,即Q=B。
其中B=是上三角矩阵(bii≠0,i=1,2,…,n)。
显然B可逆,而且B=R-1也是上三角矩阵,由于Q的各列标准正交,所以Q 正交矩阵,从而有=QR。
三、矩阵的奇异值分解定理3 (奇异之分解定理)设是一个m×n的矩阵,且r ()=r,则存在m阶酉矩阵U和n阶酉矩阵V,使得UHV=(2),其中?撞=dig(1…r),且1≥2≥…≥r≥0。
矩阵对策的最优纯策略
,m α,
,
,n β;则分别为
},m α和},n β。
当局中人Ⅰ选定纯策略i α和局中人Ⅱ选定纯策略后,就形成了一个纯局)j ,这样的纯局势共有m n ⨯个。
对任一纯局势赢得值为ij a ,称
12122
212n n m m mn a a a a a ⎤⎥⎥⎥⎥⎦
为局中人Ⅰ的赢得矩阵。
局中人Ⅱ的赢得矩阵就是当局中人Ⅰ,Ⅱ的策略集12,S S 及局中人Ⅰ的赢得矩阵对策也就给定了,记为{}12,,G S S A =。
在齐王赛马的例子中,齐王的赢得矩阵
},
,m α,
},n β,max )
成立,记其值为)成立的纯局势()
,i j αβ**
在纯策略意义下的解(或鞍点)
},m α,},n S β,
1,2,
,,m x ∑1,2,
,,n y ∑分别称为局中人Ⅰ和Ⅱ的混合策略集分别称为局中人Ⅰ和Ⅱ的混合策略(或策略),对
),m x 可设想成当两个局中人多次重复进行对策
12,,
,m ααα的频率。
若只进行一次时对策,混合
对策可设想成局中人Ⅰ对各纯策略的偏爱程度。
求解混合策略的问题有图解法,迭代法、线性方程组法和线性规划法,在。
矩阵方程的解法
矩阵方程的解法本文首先介绍了行对称矩阵的定义及性质,利用矩阵的广义逆,奇异值分解,给出了矩阵方程AX=B有行对称解的充分必要条件及有解时通解的表达式;并给出了矩阵方程解集合中与给定矩阵的最佳逼近解的表达式。
最后利用奇异值分解给出了矩阵方程有行对称解的充分必要条件及有解时通解的表达式。
矩阵方程问题是指在满足一定条件的矩阵集合中求矩阵方程的解的问题。
不同的约束条件,不同的矩阵方程,就导致了不同的约束矩阵方程问题。
约束矩阵方程问题在结构设计,参数识别,主成分分析,勘测,遥感,生物学,电学,固体力学,结构动力学,分子光谱学,自动控制理论,振动理论,循环理论等领域都有重要应用。
约束矩阵方程问题的内容非常广泛、约束矩阵方程问题又分为线性约束矩阵方程问题和非线性约束矩阵方程问题、有关线性约束矩阵方程问题的研究成果相当丰富、其中最简单的矩阵方程AX = B是研究最透彻的一类问题、求解线性矩阵方程一般会遇到两种情况:一是当矩阵方程有解时,如何求它的解及最佳逼近;二是当矩阵方程无解时,如何求它的最小二乘解。
对于本文所研究的AX=B、这两类简单矩阵方程,国内外学者已经作了大量研究。
都在相应的文献中对其进行了大量的研究,解决了求此方程的一些约束解和最小二乘解的问题。
自从针对工程应用领域提出了行对称矩阵概念之后,这方面研究已经取得了一些成果,如对行对称矩阵的一些性质,行对称矩阵的QR分解。
本文先对行对称矩阵进行介绍,再将行对称矩阵与约束矩阵方程结合起来,先研究了矩阵方程AX=B有行对称实矩阵解的充要条件,有解时,用奇异值分解及广义逆求出解及最佳逼近。
再对矩阵方程有行对称实矩阵解的充要条件进行了研究,利用奇异值分解得出了有解时的充要条件及解的表达式。
设表示全体n*m阶实矩阵集合,rank(A)表示矩阵A的秩,表示次对角线上元素全为1,其余元素全为0的方阵,即=,显然有成立。
表示n阶正交矩阵全体。
本文要讨论以下问题:问题1 给定矩阵A,B,求实行对称方阵X,使得AX=B。
对策论矩阵求解
• 目前讨论 A 为支付矩阵旳对策 旳解。为此先 解方程组
•和
• 上述不等式组无解,根据计算下面两个不 等式组
二、线性规划措施
• 例2.6.3 用线性规划措施求解例
• 解:先将A旳每个元素加3,得到每个元素都是整 数旳支付矩阵
6 1 4
A1
局中人Ⅰ在这三局中合计赢得至少。后来各局均照此方 式对策下去,直到迭代旳成果到达一定旳满意程度为止。
近似解: 若设在N局对策中局中人Ⅰ出α1,α2, …,αm旳次数 为k1,k2, …,km ,局中人Ⅱ出β 1, β 2, …, β n旳次数 为l 1, l 2, …, l n ,xN=(k1 /N ,k2 /N, …,km /N), yN=(l1/N ,l2/N, …,lm /N), 则(xN, yN )就是所求近似解。
2
7
5
5 5 6
• 转而讨论以A1为支付矩阵旳矩阵对策 ,为此求
解两个互为对偶旳线性规划问题
1
1
三、迭代法
迭代法是求矩阵对策旳一种近似措施。
基本思想:
假设两个局中人反复进行对策屡次,在每 一局中各局中人都从自己旳策略集中选用 一种使对方取得最不利成果旳策略,即第t 局对策纯策略旳选择欲使对手在前t-1局中 合计所得(或合计所失)至少(或最多)
• 注:假如上述两个方程组旳分别存在非负解
x*,y*,则求得了 旳一种解(x*,y*)和对策值;
•
假如x*,y*中有负旳分量,则将方程组
(2.6.1),(2.6.2)中旳某些等式改为不等式试算。
例2.6.1 求解矩阵对策----田忌赛马问题。 解:已知田忌赛马问题中旳支付矩阵
• 对策 没有鞍点。为了使A中元素尽量多旳变为0,
矩阵对策
2 3 1 1 2 3 3 1 2
第三部分
二人有限非零和对策
一、非零和对策的一般表达 1、局中人集合:i = 1, 2 ,…,n 2、每个局中人的策略集:Si (i = 1,…,n) 3、每个局中人的赢得函数:ui (s1, …, s i , … sn)
对策的一般表达:G={S1, … Sn ; u1, … un }
1
1 3 1
1
1 1 3
4、优超原理
定义: 若A中第i, k 行有aij akj , j 1 n 称 i 优超于 k 。 记 i k 若A中第j, l列有aij ail , i 1 m 称 j 优超于l 记 j l 。
例: A
1 0 2 2 3 1
称为i的劣策略(Dominated strategy)。
' i
'' i
例: B1 Ⅰ A1 A2 1, 0 0, 3
Ⅱ
B2 1, 2 0, 1 B3 0, 1 2, 0
劣策略
可按如下思路寻找均衡解: 首先找出某个局中人的劣策略(如果存在),剔除该劣 策略,得到新的博弈;再剔除该新博弈中的某个中人的 劣策略。重复进行,直至只剩下唯一的策略组合为止, 这个剩下的策略称为重复剔除的占优均衡(Iterated dominance equilibrium)。
对策值V=1
(2) 多鞍点与无鞍点对策
例 设有一矩阵对策如下,求它的解。
6 1 A 8 0 5 4 5 2 6 2 7 6 5 - 1 5 2
局势 ( s1 , d 2 ) ( s1 , d 4 ) ( s3 , d 2 ) ( s3 , d 4 ) 均构成鞍点, 此对策有多个解。
管理运筹学课件第13章-对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。
(优选)矩阵对策的解法详解.
3.1 公式法、图解法和方程组法
1. 2×2 对策的公式法
2×2 对策是指局中人Ⅰ的赢得矩阵为2×2 阶的, 即
A
a11 a21
a12
a22
如果 A 有鞍点, 则很快可求出各局中人的最优纯策略; 如果
A 没有鞍点,则可证明各局中人最优混合策略中的 xi* , yj* 均 大于零。于是, 由定理 6 可知, 为求最优混合策略可求下列
(5)确定经过点 P 的两相交直线,根据两相交直线列出对应方程 组,求出 y*.
(6)根据定理6的结论计算 x* 的值。
2020/7/19
10
例14
用图解法求解矩阵对策 G = { S1 , S2 ; A} , 其中
2 7
A
6
6
11 2
2020/7/19
11
2020/7/19
12
例 15
求解赢得矩阵A 的矩阵对策
A 4 1
8
3 5
4 5
2 7
2020/7/19
13
2020/7/19
14
3. 线性方程组方法
根据定理4 , 求解矩阵对策解( x*, y* ) 的问题等价于求解不 等式组,又根据定理5 和定理6 , 如果假设最优策略中的 xi* 和 yj* 均不为零, 即可将上述两个不等式组的求解问题转化 成求解下面两个方程组的问题:
(1) i
i
aij xi v, j 1,2,...,n
xi 1
(2)
j j
aij y j v,i 1,2,...,m yj 1
2020/7/19
15
3. 线性方程组方法
例16
求解矩阵对策——“齐王赛马”
数学建模案例分析--对策与决策方法建模2矩阵对策模型
§2 矩阵对策模型具有竞争或对抗性质的现象称为对策行为。
在对策行为中,各方面要达到自己的目标,必须考虑对手的各种可能行动方案,从而选出对自己的最有利的策略。
在一个对策行为中,有权决定自己的行动方案的对策参加者称为局中人。
一般在一个对策中至少有两个局中人,我们把只有两个局中人的对策称为二人对策,而多于两个局中人的对策称为多人对策。
策略是指在一个对策中,可供局中人采用的实际可行的完整方案。
每个局中人策略的全体集合称为策略集。
每个局中人从自己的策略集中选择一个策略,便构成一个局势。
当局势确定了,则对策的结果就确定了。
对每个局中人而言,就是或胜或负、名次的前或后、财物的收入或支出等等。
这些结果可以用数字来表示,于是我们得到在全部局势集合上的一个实值函数,用它来描述每个局势完结后局中人的得失,这个函数称为赢得函数。
在任一局势中,全体局中人的赢得函数值和等于零时,称为零和对策。
其实,如果每种对策组合的结果是一个和具体对策组合无关的常数,也都可以作为零和对策。
一般二人有限零和对策的赢得函数可用表格形式表示出来,这个表格又可用矩阵A 来表示。
在对策模型G 中,设甲、乙为两个局中人,甲和乙的策略集分别为},,,{211m S ααα =和},,,{212n S βββ =,当甲选定策略i α,而乙选定策略j β时,就有了局势),(j i βα,对此局势局中人甲的赢得函数值为ij a ,我们称n m ij a A ⨯=)(为局中人甲的赢得矩阵。
因此也称G 为一个矩阵对策,记为};,{21A S S G =。
为了不和后面的有关概念混淆,以后称策略为纯策略,称局势为纯局势。
对于一个矩阵对策,在什么情况下,对策双方才能选出对自己的最有利的策略?即存在最优纯策略的条件是什么?下面通过一个例子加以阐述。
如果两家电视台可能播放的节目分别为四个、三个、甲台节目收视率(%)如下表所示:表1 甲台节目收视率(%)为获得最大收视率,他们各自会采取什么样的对策呢?分析情况可以用通过下表表示。
矩阵对策的基本理论
A
a21
a22
a2n
am1 am2 amn
(12-3)
为局中人Ⅰ的赢得 矩阵。由于对策为零和的,故局中人 Ⅱ的赢得矩阵为-A。
当局中人Ⅰ、Ⅱ的策略集 S1, S2 及局中人Ⅰ的赢得矩阵 A 确定后,一个矩阵对策就给定
了。因此将矩阵对策表示为 G S1,S2;A.
矩阵对策的最优纯策略
x E m
x
x , x ,, x
12
m
T
,
x i
0, i
1,,
m,
m
x i
i 1
1
S 2
y
E
n
y
y , y ,, y
12
n
T,
y j
0,
j
1,
n,
n
j 1
y j
1
S 和S 1
2
分别称为局中人Ⅰ和Ⅱ的混合策略集;
x
S
1
和y
S
2
分别称为局中人Ⅰ和Ⅱ
的混合策略;当
x
S 1
和y
S
2
其中, T G1
和T G 2
分别为局中人 I 和 II 的策略集。
运筹学
使自己的赢得尽可能的小,理性的选择就应该是从各自可能出现的最不利的情形中争取尽可
能好的结果。
矩阵对策的基本原理
f ( x, y ) f ( x , y ) f ( x , y)
* * * *
(10 5)
则称(x*, y*)为函数f 的一个鞍点。
10
例8 求对策的解。设矩阵对策 G={S1,S2;A} 为矩阵对策,其中 S1 1 , 2 ,, m , S2 1 , 2 ,, n ,赢 得矩阵为
* * ( , (10-1)式成立的纯局势 i j )为G在纯策略 * * 的解(或平衡局势), i 与 j 分别称为局中 人 I、II的最优纯策略。
成立,记VG=ai*j*。则称VG为对策G的值,称使
7
例7 求解矩阵对策 G={S1,S2;A},其中
7 1 8 3 2 4 A 16 1 3 5 3 0
a12 a22 am 2
a1n a2 n amn
1
为局中人I的赢得矩阵(或局中人II的支付矩阵)。由 于假定对策为零和的,故局中人II的赢得矩阵就是 -A。通常,将一个矩阵对策记成 G={I,II;S1,S2;A} 或 G={S1,S2;A}
例:齐王赛马
1 1
2
2
1
2
2
1
12
例9 某单位采购员在秋天要决定冬季取暖用 煤的储量问题。已知在正常的冬季气温条件下 要消耗15吨煤,在较暖与较冷的气温条件下要 消耗10吨和20吨。假定冬季时的煤价随天气寒 冷程度而有所变化,在较暖、正常、较冷的气 候条件下每吨煤价分别为100元,150元和200 元,又设秋季时煤价为每吨100元。在没有关 于当年秋季准确的气象预报的条件下,秋季储 煤多少吨能使单位的支出最少?
6 1 A 8 0
5 4 5 2
管理运筹学课件第13章 对策论
2020/1/23
课件
6
13.1.2 对策问题的分类
局中人之
间是否允 许合作?
策略选择
是否与时 间有关?
合作对策 对 策 论
非合作对策
静态对策 动态对策
二人对策 多人对策
2020/1/23
局中人多 寡?
课件
零和对策 常和对策 变和对策
赢得值代 数和是否 为0?
7
13.1.2 对策问题的分类
本章主要内容
13.1 对策论的基本概念 13.1.1 对策模型的基本要素 13.1.2 对策问题的分类 13.2 矩阵对策的纯策略 13.2.1优超原则 13.2.2最大最小原则 13.3 矩阵对策的混合策略 13.3.1 混合策略的概念 13.3.2 图解法 13.3.3 线性规划法 13.4 纳什均衡 13.4.1 纯策略纳什均衡的划线法 13.4.2 混合策略纳什均衡的LP方法 13.4 应用举例 案例13-1 市场竞争策略 案例13-2 对抗赛项目确定 本章小结
课件
13
13.3.1 混合策略的概念
设甲出正面(α1)的概率x,出反面(α2)的概率1-x;乙猜正面(β1)的概率y,猜反 面(β2)的概率1-y。则乙两个策略的期望值分别为:
E 1 1 x ( 1 )(1 x) 2 x 1 E 2 ( 1 ) x 1 (1 x ) 1 2 x
局中人采用不同策略对策时,各方总是有得或有失,统称赢得(payoff)或
得益。
1
2
3
4
5
6
(上中下) (上下中) (中上下) (中下上) (下上中) (下中上)
(1 上中下) (2 上下中) (3 中上下) (4 中下上) (5 下上中) (6 下中上)
矩阵对策的基本原理
xS1 yS2 yS2 xS1
(10 9)
记其值为VG。则称VG 为对策G*的值,称使 (10-9)式成立的混合局势(x*,y*)为G在混合 策略意义下的解(或简称解),x*和y*分别称 为局中人I和II的最优混合策略(或简称最优策 略)。
21
定理 2 矩阵对策G={S1,S2;A} 在混合策 * x S 略意义下有解的充要条件是:存在 1, y S* 2 ,使(x*,y*)为函数E(x,y)的一个鞍 * 点,即对 x S1 , ,有 y S* 2
6 1 A 8 0
5 4 5 2
6 2 7 6
5 - 1 5 2
11
性质 1 无差别性。即若( i1 , j1 ) 和 ( i , j ) 是对策G的两个解,则 ai1 j1 ai 2 j2 。
2 2
性质 2 可交换性。即若 ( i , j ) 和 ( i , j ) 是对策G的两个解,则 ( i , j ) 和 ( i , j ) 也是解。
0
0
31
n
x i 1 i 1
m
y j 1 j1
17
则S1*,S2*分别称为局中人I和II的混合策 * 略集(或策略集); x S1 和 y S* 2 分别称为 * x S 局中人I和II的混合策略(或策略);对 1 * y S2,称(x, y)为一个混合局势(或局势) , ,局中人I的赢得函数记成
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4
矩阵对策解法
• 矩阵对策模型给定后,各局中人面临的问 题:如何选取对自己最为有利的纯对策略, 以谋取最大的赢得?
5
矩阵对策的纯策略
例1:设有一矩阵对策G={S1, S2; A},其中
6 3 A 9 3 1 2 1 0 8 4 10 6
求最优纯策略?
取大则取2 max min aij= 2
i j
取小则取2 min max aij= 2
j
i
7
矩阵对策的纯策略
定义1 设G={S1, S2; A}为一矩阵对策,其中 S1={α1, …,αm},S2={β1, …,βn}, A=(aij)m×n。若
max min aij min max aij
7 1 8 3 2 4 A 16 1 3 3 0 5
9
答案
1
2
3
min ai j
j
α1 α2 α3
max ai j
i
-7 3 16 -3 16
1 2 -1 0 2*
-8 4 -3 5 5
-8 2* -3 -3
7 1 8 3 2 4 A 16 1 3 3 0 5
16
矩阵对策实例
这一储量问题可以看成是一个对策问题,把采购员当作局中人Ⅰ,他 有三个策略:在秋天时买10吨、15吨与20吨,分别记为 1 , 2 ,3 把大自然看作局中人Ⅱ(可以当作理智的局中人来处理),大自然(冬季 气温)有三种策略:出现较暖的、正常的与较冷的冬季,分别记为 1 , 2 ,3 把该单位冬季取暖用煤实际费用(即秋季购煤时的用费与冬季不够时 再补购的费用总和)作为局中人Ⅰ的赢得,得矩阵如下:
C, 30%
B, 30%
A, 40%
18
6
矩阵对策的纯策略
6 3 A 9 3 1 2 1 0 8 4 10 6
平衡局势(α2,β2),这个局势就是双方均可 接受的,且对双方来说都是一个最稳妥的 结果。因此,α2和β2应分别是局中人Ⅰ和 Ⅱ的最优纯策略。
Ⅰ:采取1至少得益-8 2 2 3 -10 4 -3 Ⅱ:采取1最多损失9 2 2 3 6
12
课堂练习
例3:求解矩阵对策G={S1,S2;A},其中
9 2 A 5 10
8 11 8 4 6 3 8 7 8 7 9 6
13
答案
9 2 A 5 10 8 11 8 4 6 3 8 7 8 7 9 6
解:
max min aij min max aij ai* j* 8
1 2
2
1
也是解。
15
矩阵对策实例
例4:某单位采购员在秋天要决定冬季取暖用煤的储量问题。 已知在正常的冬季气温条件下要消耗15吨煤,在较暖与较冷 的气温条件下要消耗10吨和20吨。假定冬季时的煤价随天气 寒冷程度而有所变化,在较暖、正常、较冷的气候条件下每 吨煤价分别为100元,150元和200元,又设秋季时煤价为每 吨100元。在没有关于当年冬季准确的气象预报的条件下,秋 季储煤多少吨能使单位的支出最少?
i j j i
成立,记其值为VG,则称VG为对策 的值,称使其成立的纯局势(αi*,βj*) 为G在纯策略意义下的解(或平衡局 势),称αi*和βj*分别为局中人Ⅰ和Ⅱ 的最优纯策略。 ※ 矩阵对策中两个局中人都采取最优纯策略 (如果最优纯策略存在)才是理智行动
8
课堂练习
例2:求解矩阵对策 G S1, S2 , A,其中
i j j i
i*=1,3
j*=2,4
故(α1,β2),(α1,β4),(α3,β2),(α3,β4) 都是对策的解,且VG=8
14
矩阵对策解的性质
矩阵对策的解的两个重要性质 性质1 无差别性。即若 (i , j ) 和 (i , j )
1 1
2 2
是对策G的两个解,则 ai1 j1 ai2 j2 性质2 可交换性。即若 (i1 , j1 )和 (i2 , j2 ) 是对策G的两个解,则 (i , j ) 和 (i , j )
1 (较暖) 2 (正常) 3 (较冷) 1 (10吨) 1000 1750 3000 2 (15吨) 1500 1500 2500 3 (20吨) 2000 2000 2000
max min ai j min max ai j a33 200
α4
max min ai j min max ai j a22 2
i j j i
对策的解为 (2 , 2 ) ,两个局中人的最优存策略分别为 2 和 2
10
矩阵对策解的充分必要条件
从例2可以看出,矩阵A的元素 a22 既是其所在行的最小元素,又是其所在列的最大元素, 即 ai 2 a22 a i 1 , 2, 3, 4; 1 ,j 2, 3 2 j 将这一事实推广到一般矩阵对策,可得如下定理。 定理1 矩阵对策 G S1, S2 ; A 在纯策略意义下有解的充分必要条件是:存在纯局势 ( i , j ) 使得对一切 i 1, , m, j 1, , n ,均有
第十三讲 矩阵对策解法初步
讲授:白丹宇
1
矩阵对策的数学模型
在矩阵对策中,一般用Ⅰ、Ⅱ分别表示两个局中人,并设局 中人Ⅰ有m个纯策略(以与后面的混合策略区别) 1 , 2 , , m 局中人Ⅱ有n个纯策略 1 , 2 , , n 则局中人Ⅰ、Ⅱ的策略集分别为
S1 1 , 2 , , m S 2 1 , 2 , , n
当局中人Ⅰ选定纯策Байду номын сангаас i
和局中人Ⅱ选定纯策略 j
后,就形成了一个纯局势 (i , j )
2
矩阵对策的数学模型
对任一纯局势 (i , j ) 记局中人Ⅰ的赢得值为 aij 称
a11 a A 21 am1 a1n a22 a2 n am 2 amn a12
为局中人Ⅰ的赢得矩阵(或为局中人Ⅱ的支付矩阵)。由 于假定对策为零和的,故局中人Ⅱ的赢得矩阵就是-A
3
矩阵对策的数学模型
当局中人Ⅰ、Ⅱ和策略集 S1 、S2
及局中人Ⅰ的赢得矩阵A确定后,一个矩阵对策也就给定 了。通常,将一个矩阵对策记成
G I, II; S1, S2 ; A
或
G S1, S2 , A
* *
aij* ai* j* ai* j
11
矩阵对策解的充分必要条件
定理1中式子的对策意义是: 一个平衡局势(αi*,βj*) 应具有这样的性质: 当局中人Ⅰ选择了纯策略αi* 后,局中人Ⅱ为了使其所失最少,只能选择纯策 略βj*,否则就可能失的更多; 反之,当局中人Ⅱ 选择了纯策略βj*后,局中人Ⅰ为了得到最大的赢 得也只能选择纯策略αi*,否则就会赢的更少,双 方的竞争在局势(αi*,βj*)下达到了一个平衡状态。
i j j i
3 ) ,即秋季储煤20吨合理。 故对策的解为 (3,
17
作业
• 三河城由汇合的三条河分割为三个区, 如图所示。城市居民40%住在A区, 30%住在B区,30%住在C区。目前,三 个区没有溜冰场,两家公司甲和乙都计 划要在城中修建溜冰场。公司甲打算修 建两个,公司乙只打算修建一个。每个 公司都知道如果在城市的某一个区内设 有两个溜冰场,那么这两个溜冰场将把 该区内的业务平分,如果某区只有一个 溜冰场,则该场独揽本区的全部业务, 如果在一个区内没有修建溜冰场,则该 区的业务将平均分散在城市的三个溜冰 场中,每个公司都想把溜冰场设在营业 额最多的地方。试分析两家公司的最优 策略;在双方都采取最优策略时,两家 公司占有多大的份额?