第六章 动态规划[46页]
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
状态表示每个阶段开始所处的自然状况和客观条件,它描述了研究问题 过程的状况,是动态规划中最关键的一个参数。状态是动态规划问题各 阶段信息的传递点和结合点,既反映前面各阶段决策的结局,又是本阶 段作出决策的出发点和依据。随着每个阶段决策的选择,状态就会发生 转移。描述状态的变量称为状态变量,常用sk表示,它的取值可以是一 个数、一个数组或一个向量。状态变量所有可能的取值构成的集合称为 允许状态集,用Sk表示。
) )
3 4 min 2 7
7
对应的路线为:
B2C1D1E;
d(B2 ,C3 ) f (C3 )
6 5
f (B3 )
min
dd((BB33
, C1 ,C2
) )
f f
(C1 (C2
) )
5 4 min 1 7
8
对应的路线为:
B3C2D2E;
d(B3 , C3 ) f (C3 )
9 5
0 8 5 6
D
6 7 9
0 9 7
8 0 8
5
5 0
5
整数规划
第一节 动态规划的数学模型
一、多阶段决策问题
例 4—1 (装载问题)有一辆卡车的最大载重量为b 吨,现有n 种货物可供装载。 设第j 种货物每件重吨,每件的装载费用为 元 (j=1,…n)。问应该采用怎样的装 载方案才能使卡车一次装载货物的收入最大?
第六章 动态规划
动态规划问题的数学模型 动态规划问题的求解方法 动态规划的软件求解方法 动态规划的应用案例分析
1
整数规划
第一节 动态规划的数学模型
一、多阶段决策问题
动态规划是一种用于处理多阶段决策问题的数学方法。所谓多阶段决策 问题是指这样一类问题:它可以分成若干个相互联系而且性质相同的阶 段,在每个阶段都需要做出决策,这个决策不仅决定这一阶段的效益, 而且决定下一阶段的初始状态。当每个阶段的决策确定以后,把各个阶 段的决策综合起来构成的决策序列就是解决整个问题的一个方案,称为 一个策略。不同的策略会产生不同的效果(效果可以用数值来衡量), 多阶段决策问题就是在所有可行的策略中选择一个在给定标准下能达到 最好效果的最优策略。
8
整数规划
第一节 动态规划的数学模型
4.四个阶段联合考虑时从A到E的最优选择。
f ( A)
min
d( d (
A, A,
B1 B2
) )
f f
( (
B1 B2
) )
2 11
min
4
7
11
d( A, B3 ) f (B3 )
6 8
对应的路线为:AB2C1D1E;
9
整数规划
第一节 动态规划的数学模型
1.考虑一个阶段的选择。
f (D1) d (D1, E) 2 D1 E
f (D2 ) d (D2 , E) 4 D2 E
2.联合考虑两个阶段的最优选择。
f
(C1
)
min
dd((CC11,,
D1 D2
) )
f f
( (
D1 D2
) )
min
2 1
2
4
4对应的路线为C1D1E;
f (C2 )
10
整数规划
第一节 动态规划的数学模型
三、动态规划的基本概念
3.决策和决策变量
当过程处于某一阶段的某一状态时,决策者在面临的若干种不同方案中
作出选择,这种选择称为决策。描述决策的变量称为决策变量,用xk(sk) 表示第k阶段状态下的决策变量。第k阶段状态为时决策变量允许的取值
3.再联合起来考虑三个阶段的最优选择。
f (B1 )
min
dd((BB11,,CC21
) )
f f
(C1 (C2
) )
7 4 min 5 7
11对应的路线为:
B1C1D1E;
d(B1,C3 ) f (C3 )
8 5
f
(B2 )
min
dd((BB22
, C1 ,C2
) )
f f
(C1 (C2
后能继续使用的完好机器数占年初投入量的a倍 (0 a 1) ,若用于低负荷生 产,一年后能继续使用的完好机器数占年初投入量的b倍 (0 b 1) ,即下一 年初能继续用于生产的机器数为 sk1 axk b(sk xk )。设第一年初完好的机器
数为 s1 ,问在连续三年内,每年应如何分配在两种负荷下进行生产的完好
2
整数规划
第一节 动态规划的数学模型
一、多阶段决策问题
例6—1 最短路径问题。设有一个旅行者从图中的A点出发,途中要经过B、C、 D等处,最后到达终点E。从A到E有很多条路可以选择,各点之间的距离如 图所示,问该旅行者应该选择哪一条路线,使从A到E的总路程最短。
3
整数规划
第一节 动态规划的数学模型
一、多阶段决策问题
例6—2 机器负荷分配问题。 设有某种机器设备,可以在高低两种不同的负 荷下进行生产,若第k年初完好机器的数量为sk,若以数量xk用于高负荷生产,
余下的sk-xk用于低负荷生产,则该年的产量为 g(xk ) h(sk x,k )其中g(xk ) 和 h(sk xk )是已知函数,并且g(0) h(0) 0。设机器用于高负荷生产时,一年
解:设 x j为卡车装载第j 种货物的件数(j=1,2,…,,n), z表示卡车一次装载的收
入,则该问题的数学模型为:
max z c1x1 c2 x2 ... cn xn
s.t.
a1x1 a2 x2 ... an
x
j
0, 且为整数
xn
b
6
整数规划
第一节 动态规划的数学模型
二、动态规划问题的解题思路
三、动态规划的基本概念
1. 阶段与阶段变量
阶段是指一个问题需要做出决策的步数。动态规划是求解多阶段决策问题的,首 先要根据问题需要作出决策的步数,把问题恰当地分成若干相互联系的阶段,以 便按次序求解。阶段一般是根据时间和空间的自然特征来划分的。描述阶段的变 量称为阶段变量,常用k表示。
2.状态与状态变量
min
dd((CC22
, ,
D1 D2
) )
f f
( (
D1 D2
) )
min
7 3
2 4
7 对应的路线为:C2D2E;
f
(C3
)
min
dd((CC33
, ,
D1 D2
) )
f f
Hale Waihona Puke Baidu
( (
D1 D2
) )
3 2 min 2 4
5
对应的路线为:为C3D1E;
7
整数规划
第一节 动态规划的数学模型
机器数,使三年的总产量达到最大。
4
整数规划
第一节 动态规划的数学模型
一、多阶段决策问题
例6—3 旅行售货员问题。设某人想到城市1、2、3、4去旅游,四个城市之间 的距离可以用如下距离矩阵D=(dij)表示,其中dij表示从城市i到城市j之间的距 离,问此人从城市1出发经过其它城市依次且仅一次然后回到城市1如何走才 能使得距离最短。
) )
3 4 min 2 7
7
对应的路线为:
B2C1D1E;
d(B2 ,C3 ) f (C3 )
6 5
f (B3 )
min
dd((BB33
, C1 ,C2
) )
f f
(C1 (C2
) )
5 4 min 1 7
8
对应的路线为:
B3C2D2E;
d(B3 , C3 ) f (C3 )
9 5
0 8 5 6
D
6 7 9
0 9 7
8 0 8
5
5 0
5
整数规划
第一节 动态规划的数学模型
一、多阶段决策问题
例 4—1 (装载问题)有一辆卡车的最大载重量为b 吨,现有n 种货物可供装载。 设第j 种货物每件重吨,每件的装载费用为 元 (j=1,…n)。问应该采用怎样的装 载方案才能使卡车一次装载货物的收入最大?
第六章 动态规划
动态规划问题的数学模型 动态规划问题的求解方法 动态规划的软件求解方法 动态规划的应用案例分析
1
整数规划
第一节 动态规划的数学模型
一、多阶段决策问题
动态规划是一种用于处理多阶段决策问题的数学方法。所谓多阶段决策 问题是指这样一类问题:它可以分成若干个相互联系而且性质相同的阶 段,在每个阶段都需要做出决策,这个决策不仅决定这一阶段的效益, 而且决定下一阶段的初始状态。当每个阶段的决策确定以后,把各个阶 段的决策综合起来构成的决策序列就是解决整个问题的一个方案,称为 一个策略。不同的策略会产生不同的效果(效果可以用数值来衡量), 多阶段决策问题就是在所有可行的策略中选择一个在给定标准下能达到 最好效果的最优策略。
8
整数规划
第一节 动态规划的数学模型
4.四个阶段联合考虑时从A到E的最优选择。
f ( A)
min
d( d (
A, A,
B1 B2
) )
f f
( (
B1 B2
) )
2 11
min
4
7
11
d( A, B3 ) f (B3 )
6 8
对应的路线为:AB2C1D1E;
9
整数规划
第一节 动态规划的数学模型
1.考虑一个阶段的选择。
f (D1) d (D1, E) 2 D1 E
f (D2 ) d (D2 , E) 4 D2 E
2.联合考虑两个阶段的最优选择。
f
(C1
)
min
dd((CC11,,
D1 D2
) )
f f
( (
D1 D2
) )
min
2 1
2
4
4对应的路线为C1D1E;
f (C2 )
10
整数规划
第一节 动态规划的数学模型
三、动态规划的基本概念
3.决策和决策变量
当过程处于某一阶段的某一状态时,决策者在面临的若干种不同方案中
作出选择,这种选择称为决策。描述决策的变量称为决策变量,用xk(sk) 表示第k阶段状态下的决策变量。第k阶段状态为时决策变量允许的取值
3.再联合起来考虑三个阶段的最优选择。
f (B1 )
min
dd((BB11,,CC21
) )
f f
(C1 (C2
) )
7 4 min 5 7
11对应的路线为:
B1C1D1E;
d(B1,C3 ) f (C3 )
8 5
f
(B2 )
min
dd((BB22
, C1 ,C2
) )
f f
(C1 (C2
后能继续使用的完好机器数占年初投入量的a倍 (0 a 1) ,若用于低负荷生 产,一年后能继续使用的完好机器数占年初投入量的b倍 (0 b 1) ,即下一 年初能继续用于生产的机器数为 sk1 axk b(sk xk )。设第一年初完好的机器
数为 s1 ,问在连续三年内,每年应如何分配在两种负荷下进行生产的完好
2
整数规划
第一节 动态规划的数学模型
一、多阶段决策问题
例6—1 最短路径问题。设有一个旅行者从图中的A点出发,途中要经过B、C、 D等处,最后到达终点E。从A到E有很多条路可以选择,各点之间的距离如 图所示,问该旅行者应该选择哪一条路线,使从A到E的总路程最短。
3
整数规划
第一节 动态规划的数学模型
一、多阶段决策问题
例6—2 机器负荷分配问题。 设有某种机器设备,可以在高低两种不同的负 荷下进行生产,若第k年初完好机器的数量为sk,若以数量xk用于高负荷生产,
余下的sk-xk用于低负荷生产,则该年的产量为 g(xk ) h(sk x,k )其中g(xk ) 和 h(sk xk )是已知函数,并且g(0) h(0) 0。设机器用于高负荷生产时,一年
解:设 x j为卡车装载第j 种货物的件数(j=1,2,…,,n), z表示卡车一次装载的收
入,则该问题的数学模型为:
max z c1x1 c2 x2 ... cn xn
s.t.
a1x1 a2 x2 ... an
x
j
0, 且为整数
xn
b
6
整数规划
第一节 动态规划的数学模型
二、动态规划问题的解题思路
三、动态规划的基本概念
1. 阶段与阶段变量
阶段是指一个问题需要做出决策的步数。动态规划是求解多阶段决策问题的,首 先要根据问题需要作出决策的步数,把问题恰当地分成若干相互联系的阶段,以 便按次序求解。阶段一般是根据时间和空间的自然特征来划分的。描述阶段的变 量称为阶段变量,常用k表示。
2.状态与状态变量
min
dd((CC22
, ,
D1 D2
) )
f f
( (
D1 D2
) )
min
7 3
2 4
7 对应的路线为:C2D2E;
f
(C3
)
min
dd((CC33
, ,
D1 D2
) )
f f
Hale Waihona Puke Baidu
( (
D1 D2
) )
3 2 min 2 4
5
对应的路线为:为C3D1E;
7
整数规划
第一节 动态规划的数学模型
机器数,使三年的总产量达到最大。
4
整数规划
第一节 动态规划的数学模型
一、多阶段决策问题
例6—3 旅行售货员问题。设某人想到城市1、2、3、4去旅游,四个城市之间 的距离可以用如下距离矩阵D=(dij)表示,其中dij表示从城市i到城市j之间的距 离,问此人从城市1出发经过其它城市依次且仅一次然后回到城市1如何走才 能使得距离最短。