运筹学 第十章1

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

P7 P3
本阶段最优终点 (最优决策)
C1
B1 B2 B3 B4
2+12=14 4+12=16 4+12=16 7+12=19
1+11=12 7+11=18 8+11=19 5+11=16
6+11=17 2+11=13 3+11=14 1+11=12
12 13 14 12
C2 C3 C3 C3
第一阶段:
2
例1.如图9-1,给定一个运输网络,两点之间连线上的数字表示 两点间的距离,试求一条从A到E的运输线路,使总距离为最短. B1 2 1 6 4 B2 7 2 4 8 B3 3 75 B4 1
4 A 3 3 2
C1
8 6
7 C2 5 1 C3 6
D1 10
6 D2 E
图9-1
3
P5 P6
4 A 3 3 2
第十章 动态规划
动态规划(Dynamic progroming)是运筹学的一个重要分支, 是解决多阶段决策过程最优化的一种量化方法.这种方法把困难 的多阶段决策问题变换成一系列互相联系较容易的单阶段问题, 是由美国学者贝尔曼(R.Bellman)所建立的. 动态规划的成功之处在于, 它可以把一个n维决策问题转化 为n个一维最优化问题,一个一个的解.另外动态规划还能求出全 局极大和极小. 用动态规划可以解决管理中的最短路问题、装载问题、库 存问题、资源分配问题、生产过程最优化问题。
阶段: 第一阶段: 以A点为始点,而以距离A点正好一个弧远的点(B1,B2, B3,B4)为终点; 第二阶段: 以距离A点正好一个弧远的点(B1,B2,B3,B4)为始点,以 距离A点正好两个弧远的点(C1,C2,C3)为终点; 第三阶段: 以距离A点两个弧远的点(C1,C2,C3)为始点,以距离A点 三个弧远的点(D1,D2)为终点; 第四阶段: 以距离A点三个弧远的点(D1,D2)为始点,以距离A点
s k 1 Tk s k , x k .
13
5.正确写出指ห้องสมุดไป่ตู้函数.
一.资源分配问题 例2.某公司拟将某种设备5台,分配给所属的甲、乙、丙三个 工厂,各工厂获得此设备后,预测可以创造的利润如表9-5所示,问 这5台设备应如何分配给这3个工厂,使得所创造的总利润为最大? 表9-5 盈利 设备台数 0 1 2 3 4 5 0 3 7 9 12 13 0 5 10 11 11 11 0 4 6 11 12 12 工厂
4 14 A 3 3 2
12 B1 2 1 13 6 4 B2 7 2 14 4 8 B3 3 12 7 5 B4 1
12 C1
11 7 C2 5 11 1 C3 6
8 6
10 D1 10
6 D2 6 0 E
7
P9
P13
P5 P6
§2.基本概念、基本方程和最优化原理
4 第 3 一 A 3 阶 2 段 B1 2 1 6 8 4 第 C1 第 B2 7 6 2 二 7三 4 阶 C2 5 8 阶 B3 3 1 段 75 C3 6段 B4 1
甲 厂
乙 厂
丙 厂
14
P18 P17 P16
解: 将问题按工厂分为三个阶段,甲、乙、丙三厂分别编号为 1、2、3厂。并设
sk 分配给第k个工厂至第3个工厂的设备的台数k 1,2,3). ( xk 分配给第k个工厂的设备台的数k 1,2,3). (
显然:s1 5.
s 2 T1 s1 , x1 s1 x1 ,
10
P6
6.状态转移方程 已知第k+1阶段的状态是由第k阶段的状态和第k阶段的决策 所决定的,将这种关系用方程的形式表示为 在sk的状态下,在所有做出的各种 决策xk中,取一个第k阶段的指标值 s k 1 Tk s k , x k rk(sk,xk)与k+1子过程的最优指标 如: s 3 C 1 T2 B2 , C 1 . 二.基本方程 k子过程与k+1子过程最优指标函数有如下递推关系:
本阶段始点 (状态) C1 C2 C3
本阶段各终点(决策) D1 D2 8+10=18 6+6=12 7+10=17 5+6=11 1+10=11 6+6=12
到E的 本阶段最优终点 (最优决策) 最短距离 12 D2 11 D2 11 D1 5
第二阶段:
阶段2 本阶段始 点(状态) 本阶段各终点(决策) C2 C3 到E的最 短距离
0 x 2 s 2 0 x 2 s 2
s 2 0,1,2,3,4,5;
s3 s2 x2 ,
表9-7
x2 s2
0 1 2 3 4 0 0+0 0+4 0+6 0+11 0+12
r2 s 2 , x 2 f 3 s 2 x 2
1 — 5+0 5+4 5+6 5+11 2 — — 10+0 10+4 10+6 3 — — — 11+0 11+4 4 — — — — 11+0 5 — — — — —
f 2 s 2
0 5 10 14 16
x2
0 1 2 2 1,2
5
0+12
5+12
10+11
11+6
11+4
11+0
21
2
17
P14
第一阶段: s1 5; s2 s1 x1 5 x1 ,
0 x1 s1
f 1 s1 max r1 s1 , x1 f 2 s 2 max r1 5, x1 f 2 5 x1
9
P7
5.指标函数
指标函数是衡量全过程策略或k子过程策略优劣的数量指标, 最优指标函数: 指标函数的最优值.记作 f 1 s1 或f k s k . 全过程最优指标函数.
k子过程最优指标函数. 例 1中的指标指的是从某点到终点的距离, 最优指标是从某 点到终点的最短距离.
f k s k
f 1 s1
如:
f 1 s1 f 1 A 14; f 2 B2 13; f 2 B4 12;
f 3 C 3 11.
阶段指标函数(阶段效益) rk s k , x k : 表示在第k阶段的sk状态下 做出xk决策的指标值.
如: r1 A, B1 4; r2 B3 , C 2 8; r4 D1 , E 10.
11
对于求指标函数最大的动态规划问题的基本方程, 把min改 为max即可. 三.最优化原理 作为整个过程的最优策略具有如下性质:不管在此最优策略 上的某个状态以前的状态和决策如何,对该状态来说,以后的所有 决策必定构成最优子策略. 对于最短路来说: 从最短路上的任一点到终点的部分道路 (最短路上的子路)也一定是该点到终点的最短路(最短子路).
s 3 T2 s 2 , x 2 s 2 x 2 .
而且,有 s 3 x 3 .
f k s k max rk s k , x k f k 1 s k 1 , k 3,2,1. xk 边界条件 : f 4 s 4 0.
1
§1.多阶段决策过程最优化问题举例
最优化原理 作为整个过程的最优策略应具有这样的性质,即无论 过去的状态和决策如何,对于前面的决策所形成的状态而言, 余下 的诸决策必须构成最优策略. 最短路径问题:
最优化原理在最短路上的应用可阐述如下: 从最短路上的每一点到终点的部分道路,也一定是从该点到 终点的最短路.
r3 s 3 , x 3
2 — — 6 — 3 — — — 11 4 — — — — 5 — — — —
f 3 s 3
0 4 6 11
x3
0 1 2 3
4 5
— —
— —
— —
— —
12 —
— 12
12 12
4 5
16
P14
第二阶段:
f 2 s 2 max r2 s 2 , x 2 f 3 s 3 max r2 s 2 , x 2 f 3 s 2 x 2
B1 2 1 6 4 B2 7 2 4 8 B3 3 75 B4 1
四阶段决策过程最优化问题 C1 7 C2 5 1 C3 6 8 6 D1 10
D2
6
E
四个弧远的点(E)为终点.
4
逆序解法:(P187中) 第四阶段: 阶段4
P7 P3
本阶段始点 本阶段各终点(决策) 到E的最短 本阶段最优终点 (最优决策) 距离 E (状态) D1 10 10 E D2 6 6 E 第三阶段: 阶段3
函数值之和中的最小值.
f k s k min rk s k , x k f k 1 s k 1 , k n, n 1,,2,1 边界条件 : f n1 s n1 0. r2 B1 , C 1 f 3 C 1 f 2 B1 min r2 B1 , x 2 f 3 s 3 min r2 B1 , C 2 f 3 C 2 如: r B , C f C 3 3 2 1 3 2 12 14 min 1 11 min 12 12. 6 11 17
p1,4 s1 x1 A B4 ; x2 B4 C3 ; x3 C3 D1; x4 D1 E
k子过程策略:从第k阶段开始到最后阶段的决策组成的决策 序列称为k子过程策略,简称k子策略.记为 pk ,n sk . 如:
p2,4 s1 x2 B2 C1; x3 C1 D1; x4 D1 E
阶段1 本阶段始 点(状态) A 本阶段各终点(决策) B2 B3 3+13=16 3+14=17 到E的 本阶段最优 终点 最短 距离 (最优决策) 14 B4
6
B1 4+12=16
B4 2+12=14
此问题的最短路:
A
B4
C3
D1
E
P10
这段路的长度为: 14 . 利用动态规划的方法,不仅求出了全过程的最短路,还求出了图 上任意一点到E的最短路.
一.基本概念 1.阶段
第 D1 10 四 6 阶 D2 段
E
用动态规划解问题时, 要将问题的全过程适当地分成若干个 相互联系的阶段. 一般是根据时间和空间的自然特征去划分阶段. 2.状态与状态变量 状态是指每个阶段开始时所处的自然状况或客观条件. 状态变量: 用来描述状态的变量. 记作 s k . 状态集合 第二阶段有4个状态: s2 B1 , B2 , B3 , B4 .
8
3.决策和决策变量 决策是某一阶段内的抉择, 与该阶段的状态有关, 同时这个决 择又决定了下一阶段的状态. 决策变量: 用来描述决策的变量.记为 x k s k . 如: x2 B2 C1 ; x2 B2 C 2 ; x3 C 3 D1 ; x4 D1 E ,等. 4.策略 由所有各阶段的决策组成的决策函数序列称为全过程策略, 简称策略. 记为 p1,n s1 . 如: p1,4 s1 x1 A B2 ; x2 B2 C1; x3 C1 D1; x4 D1 E 最优策略: 能够达到总体最优的策略.
12
§3.动态规划应用
建立动态规划模型必须做到一下几点: 1. 根据时间或空间的自然特性将实际问题恰当地划分为若干个 阶段,即把问题的过程转化为多阶段决策过程. 2.正确的选择状态变量sk,使它既能描述过程的演变特征,又要 满足无后效性(到达这个状态前的决策将不影响到该状态以后的 决策). P7 3.确定决策变量xk. 4.正确写出状态转移方程
15
第三阶段:
f 3 s 3 max r3 s 3 , x 3 f 4 s4 max r3 s 3 , x 3 .
x 3 s3 x 3 s3
s 3 0,1,2,3,4,5;
表9-6
x3 s3
0 1 2 3 0 0 — — — 1 — 4 — —
0 x1 5
表9-8
x1 s1
5 0 0+21 1 3+16
r1 5, x1 f 2 s1 x1
2 7+14 3 9+10 4 12+5 5 13+0
相关文档
最新文档