矩阵对策的最优纯策略
运筹学12-2对策论
3.矩阵对策的混合策略(续)
-- 优超原则:当局中人甲方的策略t被其它 策略所优超时,可在其赢得矩阵A中划去第t 行(同理,当局中人乙方的策略t被其它策 略所优超时,可在矩阵A中划去第t列)。 如此得到阶数较小的赢得矩阵A’,其对
应的矩阵对策
G’= { S1,S2,A’}与 G ={ S1,S2,A } 等价,即解相同。
17
再讨论“齐王赛马”
• “齐王赛马”的赢得矩阵A有 max min aij=-1 min max aij=3
i j j i
故需求混合策略,由于A中有非正元素, 可选k=2,令矩阵中每一元素加上k得到新的 正矩阵A’:
5 3 3 1 3 3 3 5 1 3 3 3 3 3 5 3 3 1 3 3 3 5 1 3 1 3 3 3 5 3 3 1 3 3 3 5
19
再讨论“齐王赛马”(续)
• 求乙方(田忌)最优策略的线性规划模型:
min Y1+Y2 +Y3 +Y4 +Y5 +Y6 s.t. 5Y1+3Y2 +3Y3 +3Y4 + Y5 +3Y6 1 3Y1+5Y2 +3Y3 +3Y4 +3Y5 + Y6 1 3Y1+ Y2 +5Y3 +3Y4 +3Y5 +3Y6 1 Y1+3Y2 +3Y3 +5Y4 +3Y5 +3Y6 1 3Y1+3Y2 +3Y3 + Y4 +5Y5 +3Y6 1 3Y1+3Y2 + Y3 +3Y4 +3Y5 +5Y6 1 Y1,Y2,Y3,Y4,Y5,Y6 0 可得两组解:(1/9,0,0,1/9,1/9,0)T, (1/18,1/18,1/18,1/18,1/18,1/18)T ,V’=3 于是,Y’=(1/3,0,0,1/3,1/3,0)T, Y’=(1/6,1/6,1/6,1/6,1/6,1/6)T V = V’-2 = 1 即田忌的最优混合策略值是输1千金
矩阵对策问题及其解法
矩阵对策问题及其解法背景对策论研究具有竞争性质的现象。
有权决定⾃⾝⾏为的对策参加者称为局中⼈,所有局中⼈构成集合I,在⼀局对策中可供剧中⼈选择的⼀个实际可⾏的完整的⾏动⽅案成为策略,对于任意剧中⼈i∈I,都有⾃⼰的策略集S i。
⼀局对策中由各剧中⼈选定的策略构成的策略组称为局势s=(s1,...,s n),⽽全体局势集合S=S1×...×S n。
局势决定了对策的结果,对局势s∈S,局中⼈i可以得到收益H i(s),也称为局中⼈i的赢得函数。
矩阵对策即⼆⼈有限零和对策,是⼀类较为简单的对策模型。
矩阵对策基础我们假设,局中⼈ I 有纯策略α1,...,αm,局中⼈ II 有纯策略β1,...,βn,⼆者各选择⼀个纯策略则构成m×n个纯局势 (αi,βj),将 (αi,βj)下 I 的赢得值记为a i,j,设矩阵A=[a i,j],称为 I 的赢得矩阵或 II 的⽀付矩阵。
局中⼈ II 的赢得矩阵就是 −A T。
最优纯策略若纯局势 (a i∗,b j∗) 满⾜max i minj a i,j=minjmaxi a i,j=a i∗,j∗则称为矩阵对策 {S1,S2;A} 的最优纯策略。
显然,最有纯策略在赢得矩阵中对应的元素⼀定满⾜,其是所在⾏的最⼩元素,也是所在列的最⼤元素,即矩阵的鞍点。
混合策略当纯策略不存在时,我们希望给出⼀个选取不同策略的概率分布。
我们记 I,II 的概率分布向量分别为x,y,所有概率分布向量构成的集合为S1,S2,则局中⼈ I 的赢得函数为E(x,y)=x T Ay。
纯策略是混合策略的特例。
若混合局势 (x∗,y∗) 满⾜max x miny E(x,y)=minymaxx E(x,y)=E(x∗,y∗)则称为矩阵对策 {S1,S2;A} 的最优混合策略。
同样,混合策略 (x∗,y∗) 是最有混合策略的充要条件也是 (x∗,y∗) 是函数E(x,y) 的鞍点。
对策论例题
策略 1 1 A 2 3 3 0 2
39; 3
把此对策问题表示成一个线性规划模型,并用单纯 形法求解此对策。 解 由 max min aij 0, min max aij 2, 知v>0 j j i i ' ' ' 先求B的最优策略,设B的策略为 ( y1 , y2 , y3 ), 对策值
* 1 * 2 * 3
例3 已知矩阵对策 , 局中人为A与B,A的赢的矩阵为
0 3 1 1 1 2 2 1 1 1 3 0
求对策的最优混合策略与对策的值。 解 由max min aij 2, min max aij 0, 知-2<V<0. 将上面的赢得矩阵中各元素都加上3, 得新的赢得
3 2 0 4
y y y 为v,并令 y1 , y2 , y3 , v v v
则B规划的线性规划模型为表5。1 初始表
max W y1 y2 y3,
3 y1 2 y2 s.t. 2 y y 1 2 y1 , y2 , 2 y3 4 y3 y3 0 1 1 1
的最优解为 2 或 4 , 最优解 V
5.
注: 此例说明,对策的解可以不惟一,但值是唯一的.
2。无鞍点的混合策划问题 (1)线性规划法求解
例 2 某小城市有两家超级市场相互竞争,超级市场
A有三个广告策略,超级高级B也有三个广告策略, 已经算出当双方采取不同的广告策略时,A方所占市 场 份额增加的百分数如下:
0
0
1
0
-1/3
1/3
YB
b
y1
y2
y3
s1
s2
s3
对策论(Theory of Games)
定义
并不是所有的对策都存在鞍点,如 A为齐王的赢得矩阵 3 1 1 1 1 -1 1 3 1 1 -1 1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 -1 1 3 1 1 1 1 -1 1 3 max(min aij)= -1 min (max aij)=3 i j j i
例如:
• 给定矩阵对策
6 5 6 A 1 4 2 8 5 7
对策的最优值为5,对策的解有两个,分 别为局势 , 和 , 。
1 2 3 2
(三)矩阵对策的混合策略
1、矩阵对策的混合策略的定义
2、原则:坏中求好的原则。 3、解的存在:一定有解 4、混合策略求解:利用期望转化成 线性规划问题求解。
三、矩阵对策模型
(一)矩阵对策的概念 (二)矩阵对策的最优纯策略 (三)矩阵对策的混合策略 (四)矩阵对策的解法
(一)矩阵对策的概念 1、矩阵对策的定义 2、建立矩阵对策模型
1、矩阵对策的定义 局中人只有两个,对策中各方只能从有限 的策略集中确定性的选择一种,且对策双 方的支付之和为零的对策称为两人零和纯 策略对策。
表2
齐 王 上中 下 田忌 上中下 3 上下 中上 中 下 1 1 中下 上 -1 下中 上 1 下上 中 1
上下中 1 中上下 1
中下上 1 下中上 1
3 1
1 -1
-1 3
1 1
1 1
3 1
1 -1
1 3
1 1
-1 1
下上中 -1
1
1
1
1
3
引例3
有两个儿童A和B在一起玩“石头-剪子布”游戏。我们规定胜者得1分,负者得 -1分,平手时各得0分。双方选定的各种 出法及相应的结果可由下表列出。双方 应取何种策略?
第15章对策论
(4) (i,j )为 矩 阵A或 对 策G的 鞍 点 .
3. 纯策略意义下有解的充要条件
矩阵对G策{S1,S2, A}在纯策略意义下有解
存在纯局(势 i,j),使得对 i, j,都有
aij aij aij
8
二、有鞍点的矩阵对策及其最优纯策略
12
LOGO
Thank You !
2. 混合扩充
将局中人P1, P2各自的所有混合策略的集合分别记为 S1* ={XEm}, S2* ={YEn}. 称期望函数
为局中人P1的赢得函数, 称G*={S1* , S2* ,E}为对策G的混合扩充.
11
三、无鞍点的矩阵对策及其最优混合策略
运筹学
3. 最优混合策略与混合策略意义下的解
设G*={S1* , S2* ,E}为矩阵对策G ={S1, S2, A}的混合扩充,若
运筹学
运筹学
运筹学
运筹学
运筹学
§15.2 矩阵对策
运筹学
二、有鞍点的矩阵对策及其最优纯策略
1. 悲观准则(最大最小赢得准则与最小最大付出准则)
2. 最优纯策略与鞍点
设 矩 阵 对G策{S1, S2, A},其 中S1 {1m},S2 {1n}.
若有等式
miaxmjinaij
minma
j
i
则
(1) 称使上式成立的混合策略X*, Y*分别为局中人P1, P2的最优 混合策略.
(2) 称混合局势(X*, Y*)为对策G在混合策略意义下的解(或平衡 (3) 局势). (4) (3) 称上式的值为对策G在混合策略意义下的值, 记作VG*
4. 混合策略意义下解的存在性
矩阵对策
2 3 1 1 2 3 3 1 2
第三部分
二人有限非零和对策
一、非零和对策的一般表达 1、局中人集合:i = 1, 2 ,…,n 2、每个局中人的策略集:Si (i = 1,…,n) 3、每个局中人的赢得函数:ui (s1, …, s i , … sn)
对策的一般表达:G={S1, … Sn ; u1, … un }
1
1 3 1
1
1 1 3
4、优超原理
定义: 若A中第i, k 行有aij akj , j 1 n 称 i 优超于 k 。 记 i k 若A中第j, l列有aij ail , i 1 m 称 j 优超于l 记 j l 。
例: A
1 0 2 2 3 1
称为i的劣策略(Dominated strategy)。
' i
'' i
例: B1 Ⅰ A1 A2 1, 0 0, 3
Ⅱ
B2 1, 2 0, 1 B3 0, 1 2, 0
劣策略
可按如下思路寻找均衡解: 首先找出某个局中人的劣策略(如果存在),剔除该劣 策略,得到新的博弈;再剔除该新博弈中的某个中人的 劣策略。重复进行,直至只剩下唯一的策略组合为止, 这个剩下的策略称为重复剔除的占优均衡(Iterated dominance equilibrium)。
对策值V=1
(2) 多鞍点与无鞍点对策
例 设有一矩阵对策如下,求它的解。
6 1 A 8 0 5 4 5 2 6 2 7 6 5 - 1 5 2
局势 ( s1 , d 2 ) ( s1 , d 4 ) ( s3 , d 2 ) ( s3 , d 4 ) 均构成鞍点, 此对策有多个解。
博士研究生入学考试《运筹学》大纲
博士研究生入学考试《运筹学》大纲
第一部分考试说明
一、考试性质
《运筹学》是工程管理专业、道路与交通工程专业博士生考试的专业课,是为检验应考者的决策优化管理知识和方法体系而设置的一门考试课程,是保证被录取者具有较好的管理理论基础的课程之一。
课程考试通过的评价标准是以对相关考试要点的深入理解和熟练掌握为尺度的。
二、考试形式与试卷结构
(一)答卷形式
闭卷笔试
(二)答题时间
180分钟
(三)题型比例
概念题10%~20%
计算题80%~90 %
第二部分考试要点
一、线性规划
1.线性规划问题及求解
2.对偶问题
3.灵敏度分析
4.运输问题
5.整数规划(解纯整数规划的割平面法、分枝定界法、0—1型整数规划、指派问题)二、目标规划
1.目标规划模型
2.确定目标的优先顺序
3.解目标规划的单纯形法
4.目标规划的灵敏度分析
三、动态规划
1.动态规划问题的基本概念和基本方法
2.动态规划问题的求解
四、图与网络分析
1.最短路问题
2.网络最大流问题
3.网络计划技术
五、决策论
1.不确定型决策
2.风险决策
3.决策树方法
5.效用与决策
六、对策论
1.矩阵对策的最优纯策略
2.矩阵对策的混合策略
3. 博弈论
七、层次分析法
八、系统评价方法
1.模糊评价法
2.数据包络分析
3.事故树分析法
4.神经网络。
矩阵对策纯策略意义下的解
此而来。通常把矩阵对策记为
G={Ⅰ,Ⅱ;S1,S2;A} 或
G={S1,S2;A}
例:G={S1,S2,A} S1={α1,α2,α3,α4} S2={β1,β2, β3}
-6 1 -8 A= 3 2 4
9 -1 -10 -3 0 6
对于G={S1,S2;A}, 若有等式
max min aij=min max aij=ai*j*
aij*≤ai*j*≤ai*j
例如
65 15 A= 8 5 02
65 2 -1 55 62
7.3 矩阵对策混合策略意义下的解
先看一个简单的例子: A= 3 6 54
一般地,设矩阵对策G={S1,S2;A},其中 S1={α1,α2,…,αm},S2={β1,β2,…,βn}, A=(aij)m×n
为各局中人的最优混合策略。例
(2)线性规划法
当对策的值大于0时,可利用
线性规划法求解矩阵对策。构造
两个线性规划问题
min z=∑xi i
∑i aijxi≥1 (j=1,2,…,n)
xi≥0
(i=1,2,…,m)
max w=∑j yj
∑j aijyj≤1 (i=1,2,…,m)
பைடு நூலகம்
yj≥0
(j=1,2,…,n)
7.2 矩阵对策纯策略意义下的解
矩阵对策就是二人有限零和对策。设两个局中人为Ⅰ、
Ⅱ,它们各自的策略集为
S1={α1,α2,…,αm} S2={β1,β2,…,βn} 当局中人Ⅰ选定纯策略αi,局中人Ⅱ选定纯策略βj后,就 形成了一个纯局势(αi,βj),这样的纯局势共有m·n个。
对任一纯局势(αi,βj),记局中人Ⅰ的赢得值为aij,则得 矩阵 A=(aij),称为矩阵人Ⅰ的赢得矩阵。由于是零和对 策,则矩阵人Ⅱ的赢得矩阵为-A。矩阵对策的名称正是由
(优选)矩阵对策的解法详解.
3.1 公式法、图解法和方程组法
1. 2×2 对策的公式法
2×2 对策是指局中人Ⅰ的赢得矩阵为2×2 阶的, 即
A
a11 a21
a12
a22
如果 A 有鞍点, 则很快可求出各局中人的最优纯策略; 如果
A 没有鞍点,则可证明各局中人最优混合策略中的 xi* , yj* 均 大于零。于是, 由定理 6 可知, 为求最优混合策略可求下列
(5)确定经过点 P 的两相交直线,根据两相交直线列出对应方程 组,求出 y*.
(6)根据定理6的结论计算 x* 的值。
2020/7/19
10
例14
用图解法求解矩阵对策 G = { S1 , S2 ; A} , 其中
2 7
A
6
6
11 2
2020/7/19
11
2020/7/19
12
例 15
求解赢得矩阵A 的矩阵对策
A 4 1
8
3 5
4 5
2 7
2020/7/19
13
2020/7/19
14
3. 线性方程组方法
根据定理4 , 求解矩阵对策解( x*, y* ) 的问题等价于求解不 等式组,又根据定理5 和定理6 , 如果假设最优策略中的 xi* 和 yj* 均不为零, 即可将上述两个不等式组的求解问题转化 成求解下面两个方程组的问题:
(1) i
i
aij xi v, j 1,2,...,n
xi 1
(2)
j j
aij y j v,i 1,2,...,m yj 1
2020/7/19
15
3. 线性方程组方法
例16
求解矩阵对策——“齐王赛马”
运筹学期末试卷A卷答案-01-23
运筹学 期末试卷(A 卷)系别: 工商管理学院 专业: 工商管理 考试日期: 年 月 日姓名: 学号: 成 绩:1.[12分]某公司正在制造两种产品:产品I 和产品II ,每天的产量分别为30个和120个,利润分别为500元/个和400元/个。
公司负责制造的副总经理希望了解是否可以通过改变这种产品的数量而提高公司的利润。
公司各个车间的加工能力和制造单位产品所需的加工工时如下表:(1) 假设生产的全部产品都能销售出去,试建立使公司获利最大的生产计划模型。
(2) 用图解法求出最优解。
P25 No72.[12分] 某超市实行24小时营业,各班次所需服务员和管理人员如下:何安排使得超市用人总数最少?(1) 建立线性规划模型(只建模不求具体解); (2) 写出基于Lindo 软件的源程序(代码)。
3.[10分]设xA ,xB 分别代表购买股票A 和股票B 的数量,f 代表投资风险指数,建立线性规划模型如下: 目标函数:Min f=8x A +3x B约束条件:投资总额120万元 投资回报至少6万购买量非负501001200000A B x x +≤,0A B x x ≥100300000B x ≥5460000A B x x +≥股票B 投资不少于30万元利用教材附带软件进行求解,结果如下:**********************最优解如下************************* 目标函数最优值为 : 62000变量 最优解 相差值 ------- -------- -------- x1 4000 0 x2 10000 0约束 松弛/剩余变量 对偶价格 ------- ------------- -------- 1 0 .057 2 0 -2.167 3 700000 0 目标函数系数范围 :变量 下限 当前值 上限 ------- -------- -------- -------- x1 3.75 8 无上限 x2 无下限 3 6.4 常数项数范围 :约束 下限 当前值 上限------- -------- -------- -------- 1 780000 1200000 1500000 2 48000 60000 102000 3 无下限 300000 1000000试回答下列问题:(1) 在这个最优解中,购买股票A 和股票B 的数量各为多少?这时投资风险是多少?(2) 上述求解结果中松弛/剩余变量的含义是什么?(3) 当目标函数系数在什么范围内变化时,最优购买计划不变?(4) 请对右端常数项范围的上、下限给予具体解释,应如何应用这些数据?(5) 当每单位股票A 的风险指数从8降为6,而每单位股票B 的风险指数从3升为5时,用百分一百法则能否断定其最优解是否发生变化?为什么? 4.[6分]设有矩阵对策},,{21A S S G =,其中,{}112345,,,,S ααααα=,{}212345,,,,S βββββ=2343564132421457346454126A --⎛⎫ ⎪- ⎪ ⎪=-- ⎪-- ⎪ ⎪⎝⎭求矩阵对策的最优纯策略(要求图示)。
《运筹学教程》胡云权 第五版 运筹学--6对策论--矩阵对策
13
矩阵对策的纯策略
4、矩阵对策的鞍点与解 多鞍点与无鞍点对策 例: 设有一矩阵对策如下,求它的解。
6 5 6 5
A 1 4 2 1 8 5 7 5
0 2 6
2
局势(α1, β2),(α1, β4),(α3, 均构成鞍点,此对策有多个解。
β2)(α3,
β4) 14
矩阵对策的纯策略
5、矩阵对策纯策略的性质
作业
P385 习题 • 12.2 • 12.3 • 12.4
16
矩阵对策的混合策略
1、混合策略
对于 G {S1, S2; A}
局中人Ⅰ有把握的赢得至少为 v1
max i
min j
aij
局中人Ⅱ有把握的支付至多为 v2
min max
j
i
aij
一般为 v1 v2 ,特别地当 v1 v2 时,则称对策 G 在
yS
* 2
xS1*
20
矩阵对策的混合策略
5、最优混合策略
定义 4:设 G* {S1*, S2*; E} 是矩阵对策 G {S1, S2; A}的混合扩充。
如果
maxmin E(x,
xS1* yS2*
y)
m in m ax E ( x,
yS2* xS1*
y)
,其值为 VG
,则称
VG 为
对策 G* 的值,相应的混合局势 (x*, y*) 称为在混合策略意义下的
44
22
23
对策的值(局中人
I
的赢得期望值)VG
9 2
。
矩阵对策的解法
24
图解法
仅适用于赢得矩阵为2×n或m×2阶的矩阵对策问题。
第三节矩阵对策
(8.3.17)
y
j
0
精品课程《运筹学》
第三节 矩阵对策
此处不证明的介绍矩阵对策的基本定理:
定理8.3.5 任一矩阵对策G S1, S2 ; A ,一定
存在混合意义下的解。
下面是矩阵对策及其纳什均衡的若干性质.
定理8.3.6 设(x* , y* )是矩阵对策G 的纳什
均衡,V VG ,则
(1)若 (2)若
第三节 矩阵对策
§3.5 优超及矩阵对策的求解
定义8.3.5设有矩阵对策G S1, S2; A ,其中
A S1 ={ 1,2,,m },S2={1, 2 ,, n},
=
(aij
)
。
mn
若对
j 1,2,n
有 ai1 j ai2 j
则称局中人I的纯策略 i2 优于纯策略 i1 ;同样
地,若对 i 1,2,m 有 aij1 aij2
精品课程《运筹学》
第三节 矩阵对策
或等于1/2倍的2、3列之和,划去第一列,又将
第一行划去得2
x*
(0,0,
4 5
,
1 5
),
y*
2矩阵
(0,0,
3 5
,
2 5
4
)0
2 8
,即求最优解 。
2. 2 n
和
e
m2
矩阵对策的图解法
Q
1a
f
B'
c
3
d
o
A' P 2 b
x
1 x
图8.3.1
精品课程《运筹学》
对策的两个解,则( 为最优解。
i1
,
j2
)与(
i2
矩阵对策的基本理论
A
a21
a22
a2n
am1 am2 amn
(12-3)
为局中人Ⅰ的赢得 矩阵。由于对策为零和的,故局中人 Ⅱ的赢得矩阵为-A。
当局中人Ⅰ、Ⅱ的策略集 S1, S2 及局中人Ⅰ的赢得矩阵 A 确定后,一个矩阵对策就给定
了。因此将矩阵对策表示为 G S1,S2;A.
矩阵对策的最优纯策略
x E m
x
x , x ,, x
12
m
T
,
x i
0, i
1,,
m,
m
x i
i 1
1
S 2
y
E
n
y
y , y ,, y
12
n
T,
y j
0,
j
1,
n,
n
j 1
y j
1
S 和S 1
2
分别称为局中人Ⅰ和Ⅱ的混合策略集;
x
S
1
和y
S
2
分别称为局中人Ⅰ和Ⅱ
的混合策略;当
x
S 1
和y
S
2
其中, T G1
和T G 2
分别为局中人 I 和 II 的策略集。
运筹学
使自己的赢得尽可能的小,理性的选择就应该是从各自可能出现的最不利的情形中争取尽可
能好的结果。
第十二章-对策论(运筹学讲义)课件
局中人2 出1指
5 -5
出2指 -5 5
局中人1从局中人2该如何选择策略,已获得利益?
-
3
例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在 不同的屋子里审讯。警察告诉他们: 如果两人都坦白,各 判刑8年;如果两人都抵赖,由于证据不充分,两人将各 判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者 立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯 都有两种策略: 坦白或抵赖。可以用一个矩阵表示两个嫌 疑犯的策略的损益
3.一局势对策的益损值: 局中人各自使用一个对策就形成了一 个局势,一个局势决定了各局中人的对策结果(量化)称 为该局势对策的益损值。
赢得函数(payoff function): 定义在局势上,取值为相应益 损值的函数
4. 纳什均衡: 纳什均衡指所有局中人最优策略组成的一种局势,
既在给定其他局中人策略的情况下,没有任何局中人有积
A
1
4
3
2
解因
m i a x m j in a ij 2 , m j in m i a x a ij 3
m a ixm jina ij m jinm a ixa ij
不符合鞍点条件, 故G的鞍点不存在。
例6 求解矩阵对策,其中: 解 容易得到
A 11
0 1
1 1
v a i * j * 1i * 1 ,2 ;j * 3
A
a
2
1
a22
a1m
a2
m
a
m
1
am2
amn
aij为局中人甲在局势
( i , j )下的赢得 -
9
“齐王赛马”是一个矩阵策略。
其中: 齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 },
对策论第2,3节 矩阵对策的基本定理与解法
存在前提:
max min aij = min max aij= v
i
j
ji
ห้องสมุดไป่ตู้
又称( 2 ,3 )为对策G={s1,s2,A}的鞍点。值 V为G的值。
定义9-1:对给定的矩阵对策
G = S1,S2;A 若等式
max min aij= min max aij
i
j
j
i
成立,则称这个公共值为对策G的值,记 为VG,而达到的局势( i, j )称为对 策G在纯策略意义下的解,记为( I*, j *)而I*和 j *分别称为局中人I和局中 人II的最优纯策略。
第2,3节 矩阵对策理论与求解方法
一、矩阵对策的最优纯策略
•在甲方赢得矩阵A=[aij]m*n中: aij代表甲方取策略i,乙方取策略j, 这一局势
下甲方的益损值,此时乙方的益损值为-aij(零 和性质)。 •在讨论各方采用的策略是必须注意一个前提就 是对方是理智的。这就是要从最有把握取得的 益损值情况考虑。
显然 ai2 a12 a1j ai2 a32 a3j 对 I=1,2,3 j=1,2,3 都成立: a12 = a32 =5 由定理5-1,对策值=5,对策的解:( 1 , 2 ) 和( 3 , 2 )
例3:某单位采购员在秋天时要决定冬天取暖 用煤的采购量。已知在正常气温条件下需要用 煤15吨,在较暖和较冷气温条件下需要用煤10 吨和20吨。假定冬季的煤价随着天气寒冷的程 度而变化,在较暖、正常、较冷气温条件下每 吨煤价为100元、150元、200元。又秋季每 吨煤价为100元。在没有关于当年冬季气温情 况下,秋季应购多少吨煤,能使总支出最少?
E(X,Y)= xi aij yj=XAYT 称为局中人I期望赢得,而局势(X,Y)称为“混合 局势”,局中人I,II的混合策略集合记为S1*, S2*。
对策论
§4.2 矩阵对策的基本理论(续)三 混合策略与混合扩充 1. 基本概念在上面的最优纯策略中,能够有最优纯策略的决策问题中存在一个鞍点,也就是必须有max(min )ij jia =)(max min iij ja如果 max(min )ij jia ≠)(max min iij ja那末,对策中双方没有最优纯策略,也就是没有在纯策略中的解,我们把这种对策称为无鞍点的对策。
比如:给定矩阵对策G :G={S 1,S 2,A},其中S 1={a 1, a 2 },S 2={β1,β2},1342A ⎛⎫= ⎪⎝⎭可知 )min (max ij jia =2 )(max min iij ja =3所以 )min (max ij jia ≠)(max min iij ja注:在齐王塞马的例子中也是没有鞍点。
在这种情况下,局中人应如何选择纯策略参加对策呢?这就需要估计选取各个策略可能性的大小来进行对策,或者说,用多大概率选取各个纯策略。
我们把每一个局中人用一定的概率选取纯策略来参加的对策称为混合策略。
例如上面的例子:假定:局中人甲以概率x 选取纯策略a 1;以概率1—x 选取纯策略a 2 局中人乙以概率y 选取纯策略β1;以概率1—y 选取纯策略β2⎪⎪⎭⎫⎝⎛--2431)1()()1()(2121x a x a y y ββ于是对局中人甲来说,他的期望赢得便是E (x , y ) =)1)(1(2)1(4)1(3y x y x y x xy --+-+-+ =224+++-y x xy=2/5)4/1)(2/1(4+---y x由此可见:当x =1/2时,即局中人甲以50% 的概率选纯策略a 1参加对策,他的赢得期望至少是5/2,但它不能保证超过5/2,因为当局中人乙取y =1/4时,会控制局中人甲不超过5/2。
因此5/2是局中人甲赢得的期望值。
同样,局中人乙取y =1/4时,才能保证他的支出不多于5/2.。
《管理运筹学》课程教学大纲
《管理运筹学》课程教学大纲【课程编码】181****0016【课程类别】专业必修课程【学时学分】36学时,2学分【适用专业】物流管理专业一、课程性质和目标课程性质:本课程是为物流管理专业本科生开设的专业必修课程。
管理运筹学是管理科学的重要分支。
主要内容包括线性规划、整数规划、运输问题、图论、网络计划技术、存储论、对策论、决策分析等内容。
课程目标:通过本课程的教学达成如下教学目的:1.使学生系统掌握若干运筹学的重要模型和基本分析方法,并理解它们所包含的优化决策思想。
2.使学生了解管理工作中使用运筹学模型和数量分析方法对于解决实际问题和提高效益所起的作用。
3.能初步运用运筹学方法分析和解决实际问题,培养和提高学生解决实际问题的能力。
其中,课程目标1.达成《物流管理专业人才培养方案》中的基本规格1.2.3;课程目标2达成《物流管理专业人才培养方案》中的基本规格4.5;课程目标3达成《物流管理专业人才培养方案》中的基本规格6.二、教学内容、要求和学时分配(一)第一章绪论2学时(理论讲授)教学内容:1.运筹学2.管理决策与管理运筹学教学要求:1.了解运筹学的产生和发展2.了解运筹学的主要内容3.了解运筹学在管理中的应用重点:运筹学的主要内容难点:运筹学在管理中的应用其它教学环节:结合课后习题讲解,进一步了解运筹学、管理决策及管理运筹学的应用。
(二)第二章线性规划3学时(理论讲授)教学内容:1线性规划概述2.线性规划的数学模型3.线性规划问题的图解法4.图解法的灵敏度分析教学要求:1掌握线性规划的数学模型5.掌握线性规划问题的图解方法6.掌握图解法的灵敏度分析方法重点:1线性规划的数学模型7.线性规划问题的图解方法难点:线性规划的图解法的灵敏度分析其它教学环节:结合课后习题讲解,进一步理解掌握线性规划的数学模型及其图解方法(三)第三章线性规划问题的单纯形法3学时(理论讲授)教学内容:1.一般最大值问题的求解法2.一般最小值问题的求解法3.线性规划应用示例教学要求:1.掌握一般最大值问题的求解法2.掌握一般最小值问题的求解法重点:一般最大值问题、最小值问题的求解法难点:线性规划应用其它教学环节:结合课后习题讲解,进一步理解掌握线性规划问题的单纯形法(四)第四章整数规划4学时(理论讲授)教学内容:1.整数规划的图解法2.整数规划的分枝定界法3.整数规划的应用教学要求:1理解整数规划的分枝定界法4.掌握整数规划的图解法重点:整数规划的图解法难点:如何用整数规划的图解法和分枝定界法求解实际问题其它教学环节:结合课后习题讲解,进一步理解掌握整体规划的方法(五)第五章运输问题4学时(理论讲授)教学内容:1.运输模型2.运输问题的表上作业法3.运输问题的应用教学要求:1.理解运输问题模型2.理解掌握表上作业法重点:表上作业法难点:利用运输问题解决一些实际问题其它教学环节:结合课后习题讲解,进一步理解掌握整体规划的方法(六)第六章图论4学时(理论讲授)教学内容:1.图的基本概念2.图在管理实践中的应用教学要求:1.理解图的基本概念2.理解图在管理实践中的应用重点:图的概念,中国邮路问题,求图的最小生成树的方法,用标号算法求最大流难点:理解反向弧的概念,寻找流量可增链,会用求最小生成树的方法解决相应的实际问题其它教学环节:结合课后习题讲解,进一步理解掌握图论有关概念和应用(七)第七章网络计划技术4学时(理论讲授)教学内容:1.网络计划技术概述2.网络图的绘制3.网络图时间值的计算4.网络计划优化教学要求:4.了解网络计划技术的概念5.掌握网络图的绘制方法3.理解掌握网络图时间值的计算4.掌握网络计划优化的方法重点:网络图时间值的计算难点:网络计划优化其它教学环节:结合课后习题讲解,进一步理解掌握网络计划技术有关概念和应用(八)第八章存储论4学时(理论讲授)教学内容:1存储2.确定型存储模型3.随机型存储模型教学要求:1.理解存储有关概念2.理解掌握确定型存储模型3.理解掌握随机型存储模型重点:确定型存储模型难点:随机型存储模型其它教学环节:结合课后习题讲解,进一步理解掌握存储论有关概念和应用(九)第九章对策论4学时(理论讲授)教学内容:1对策论的基本概念2.矩阵对策的最优纯策略3.矩阵对策的混合策略教学要求:1了解决策轮的基本概念4.理解矩阵对策的最优纯策略5.掌握矩阵对策的混合策略重点:矩阵对策的最优纯对策难点:矩阵对策的混合策略其它教学环节:结合课后习题讲解,进一步理解掌握对策论有关概念和应用。
引入风险的矩阵对策最优策略研究
作 者 简 介 : 向 飞 (9 4 ) 男 , 开 大 学 经 济 学 院 博 士 研 究 生 , 事 博 弈 论 、 融 数 学 与 金 融 尹 17 一 , 南 从 金 工 程 研 究 ; 柳 钦 (9 9 ) 男 , 津 社 会 科 学 院城 市经 济研 究 所 教 授 , 事 产 业 经 济 与 金 融 陈 16 一 。 天 从
矩阵, 那么局 中人 Ⅱ的支付矩阵为. 记 A,
行为 , 在该竞争行为 中, 两人 的支付 之和为零 , 并且两人 的策略有限 , 例如 田忌赛马等 , 这些博 弈我们称之为二人有限策略式零和博弈。在二 人有限策略式零和博弈 中 , 人们常采用矩阵对 策 来描 述 和分 析 , 以求 得 到 最优 策 略 。学 者 已
i= 1 J
. { f 0=2n ” s y ’ ,1…, : 2 2 ∈ , ∑ 小…( = - )
= 1
策略的情况下 . 我们能否优中选优?针对这一 问题 , 本文将风险这一概念引入矩阵对策 , 对最
优策略优中选优进行研究 。
一
则. ,2 s |. 。 s分别称为局中人 I Ⅱ的混合策略集 、 ( 或策略集 ) S 分 别称 为局 中人 I、 ; 。Y∈ z ∈ , Ⅱ的混合策略, 称为一个混合局势 , 在该混合局 势中, 中人 I 局 的支付期望为 :
…
s yS v: 咕t ; m  ̄ 训i n
威
…) ( 4
付的方差 , 又是局 中人I I 的支付的相反数 ( 即为 局中人I 的支付) 的方差 , 即局 中人 Ⅱ的支付 的 方差 , 因此 为 o( y局 中人 I、 r ,) Ⅱ共 同 面 临 的
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
,m α,
,
,n β;则分别为
},m α和},n β。
当局中人Ⅰ选定纯策略i α和局中人Ⅱ选定纯策略后,就形成了一个纯局)j ,这样的纯局势共有m n ⨯个。
对任一纯局势赢得值为ij a ,称
12122
212n n m m mn a a a a a ⎤⎥⎥⎥⎥⎦
为局中人Ⅰ的赢得矩阵。
局中人Ⅱ的赢得矩阵就是当局中人Ⅰ,Ⅱ的策略集12,S S 及局中人Ⅰ的赢得矩阵对策也就给定了,记为{}12,,G S S A =。
在齐王赛马的例子中,齐王的赢得矩阵
},
,m α,
},n β,max )
成立,记其值为)成立的纯局势()
,i j αβ**
在纯策略意义下的解(或鞍点)
},m α,},n S β,
1,2,
,,m x ∑1,2,
,,n y ∑分别称为局中人Ⅰ和Ⅱ的混合策略集分别称为局中人Ⅰ和Ⅱ的混合策略(或策略),对
),m x 可设想成当两个局中人多次重复进行对策
12,,
,m ααα的频率。
若只进行一次时对策,混合
对策可设想成局中人Ⅰ对各纯策略的偏爱程度。
求解混合策略的问题有图解法,迭代法、线性方程组法和线性规划法,在。