动态规划(理论部分)汇编

合集下载

相关主题

动态规划理论

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

以上面的例1来说明动态规划解决问题的思想。设：
Sk----第k阶段的起点（状态变量） dk(x, y) -----第k阶段的顶点 x 到顶点 y 的“距离”； fk(Sk) ------第k阶段从顶点Sk到终点的最短“路”长。
最短路线的重要特性就是：如果最短路线在第K站通过点Pk。则由点Pk 出发到达终点的这条路线，对于从点Pk 出发到达终点的所有可能选择的不同路经来说，必定也是最短路线。
B2 10
4 13
B3
12
11
C1
3
9
6
C2
5 8
C3
10
f4(D1)=5
D1
5 f5(E)=0
E
D2
2
f4 (D1) d (D1, E) f5 (E) 5 0 5
2
A5
1
B1 12 14 10 6
B2 10
4 13
12
B3 11
C1
3
9
6
C2
5 8
C3
10
f4(D1)=5
D1
5 f5(E)=0
D1
5 f5(E)=0
E
D2
2
f4(D2)=2
f3(C3)=12
f
3
(C3
)
min
((CC33,,
D1 D2
) )
f f
4 4
( (
D1 D2
) )
min
85 10 2
min
13 12
12
最优决策C3 D2
K=2时：
A
f2(B1)=20
B1 12 14
2
10
6
5
B2 10
4
1
13
B3
((CC11,,
D1 D2
) )
f fBaidu Nhomakorabea
4 4
( (
D1 ) D2 )
min
3 9
5 2
min
8 11
8
最优决策C1 D1
2
A5
1
B1 12 14 10 6
B2 10
4 13
B3
12 11
f3(C1)=8
C1
3
9
f3(C2)=7
6
C2
5 8
C3
10
f4(D1)=5
D1
5 f5(E)=0
而各阶段之间又有密切的联系，某一个阶段的不同决策，将会对其它阶段的决策产生重大的影响，某个阶段局部的较优方案，未必是整个问题的最好方案，某个阶段局部的不好方案，也未必是整个问题的不好方案。
我们要寻找的是整个问题，也就是所有阶段总体的一个最优方案，这就是动态规划所要讨论的问题。
一、多阶段决策问题
所谓多阶段决策问题是有这样一类决策过程，它可以划分为若干个相互联系的阶段，在任一阶段都有若干种方案可供选择，选择哪一种方案需要作出决策，这样就形成一个决策序列，通常称为一种策略。不同的策略就产生不同的效果，在所有可能的策略当中，选择一个效果最好的最优策略，就是解决多阶段决策问题的主要目的。下面举几个例子来说明。
行进方向
起点
终点
动态规划寻优途径
下面按上述思想，将例1从最后一段开始计算，由后向前逐步推移至A点。
设想有k ＝5 时， f5(E)＝ 0 。
2
A5
1
B1
12 14
10
6
B2 10
4 13
B3
12 11
C1
3
9
6
C2
5 8
C3
10
D1
5 f5(E)=0
E
D2
2
K=4时：
2
A5
1
B1 12 14 10 6
E
D2
2
f4(D2)=2
f4 (D2 ) d (D2, E) f5 (E) 2 0 2
K=3时：
2
A5
1
B1 12 14 10 6
B2 10
4 13
B3
12 11
f3(C1)=8
C1
3
9
6
C2
5 8
C3
10
f4(D1)=5
D1
5 f5(E)=0
E
D2
2
f4(D2)=2
f3 (C1)
min
E
D2
2
f4(D2)=2
f3
(C2
)
min
((CC22,,DD21
) )
f f
4 4
( (
D1 D2
) )
min
6 5
5 2
min
11
7
7
最优决策C2 D2
f3(C1)=8
2
A5
1
B1
12 14
10
6
B2 10
4 13
B3
12 11
C1
3
9
f3(C2)=7
6
C2
5 8
C3
10
f4(D1)=5
12 11
f3(C1)=8
C1
3
9
f3(C2)=7
6
C2
5
8
C3
10
f4(D1)=5
D1
5 f5(E)=0
E
D2 2
f4(D2)=2
f3(C3)=12
f2 (B1)
min
((BB11,,CC21
) )
f3 f3
(C1) (C2 )
min
12 8
14
7
min
20 21
20
(B1,C3) f3(C3)
10 12
22
最优决策 :B1 C1
f2(B1)=21
例1：（最短路程问题）设从A地到E地要铺设一条管道，其中要经过若干个中间点(如图)。图中两点之间连线上的数字表示两地间的距离。现在要选择一条铺设管道的路线，使总长度最短。
2
A5
1
B1
12 14
10
6
B2 10
4 13
B3
12 11
C1
3
9
6
C2
5
8
C3 10
D1 5
E
D2 2
在这个问题中，从A到B 1 ，B2 ， B3中的哪一个点要作出一项决策，从B 1 ，B2 ， B3某点到 C 1，C2，C3 中的哪一个点又要作出一项决策等等。所以总共要作出四个决策。因此，我们可以把整个路程分为A，B ( 包括B 1 ，B2 ， B3) ，C ( 包括C 1，C2 ， C3 ， ) ，D (包括D1和D2)，E 五个阶段。这就是一个多阶段的决策问题。
二、动态规划的基本思想
用动态规划求解多阶段决策问题，是把整个问题划分为若干阶段后，依次地为每一个阶段作出最优决策，而每个阶段的最优决策应该是包含本阶段和所有以前各阶段在内的最优决策，也就是到本阶段为止，包含以前各阶段在内的最优总决策。因此，在确定了最后一个阶段的决策之后，整个问题的最优决策序列也就随之产生。这就是用动态规划解多阶段决策问题的基本思想。
动态规划
第四章
动态规划
动态规划是解决多阶段决策过程最优化问题的一种方法。在二十世纪五十年代由美国数学家理查德.贝尔曼(Richard．Ba11man) 首先提出的。它可以把一个 n 维最优化问题转化为 n 个一维最优化问题来求解。
一个决策问题，往往可以分解成若干个相互联系，又相对独立的阶段，对于每一个阶段，存在着很多方案可供选择，我们要对每个阶段作出一个决策。
例如，在最短路线问题中，如果找到了A到E的最短路：
A B1 C2 D1 E
则 C2 D1 E 应该是由C2 出发到E点的所有可能不同线路中的最短路线
最短路线这一特性，启发我们找最短路线的方法：那就是从最后一段开始，用由后向前逐步递推的方法，求出各点到E点的最短路线，最后求得由A点到E点的最短路线。所以，动态规划的常用的方法是从终点逐段向始点方向寻找“最短路线” 。如图所示：