数学建模动态规划
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
,决策点为D2
,决策点为D1
7
B1
2
6 3 2
7 4
C1 C2
3 4 6 3
D1
3
A
3
4
B2
4 6
E
4
3
2 5
D2
B3 A B
C3 C
3
D
E
f1
f2
f3
f4
8
第二阶段(B
C) ,由Bj到Cj分别均有三种选择,即:
B 1 C 1 f 3 C 1 7 6 f 2 B1 min B1C 2 f 3 C 2 min 4 7 * 11 B 1 C 3 f 3 C 3 66
16
状态 状态变量和状态集合 : S k 表示第k阶段的状态变量, 也表示第k阶段具体的 常用 阶段:阶段变量k=1,2,3,4
某一状态。第k阶段的状态就是该阶段所有始点的集合
S 1 A , S 2 B1 , B 2 , B 3 , S 3 C1 , C 2 , C 3 , S 4 D1 , D 2
f 3 C 2 min C 2 D 2 f 4 D 2 7
f 4 D 2 min[ D 2 E f 5 ( E )] 4 f5 (E ) 0
11
11
6
6 3 2 7 4
B1
12 A
2 4 3
C1
7 C2 6 C3
3
4 6 3 3 3
9 B2 9 B3
24
二、动态规划的基本思想与最优化原理
1、基本思想:动态规划方法的关键在于正确地写出基 本方程,因此首先必须将问题的过程划分为多个相互联系 的多阶段决策过程,恰当地选取状态变量和决策变量及定 义最优指标函数,从而把问题化成一族同类型的子问题。 然后从边界条件开始,逆过程行进方向,逐段递推寻优。 在每个子问题求解时,均利用它前面已求出的子问题的最 优化结果依次进行,最后一个子问题所得的最优解,就是 整个问题的最优解。
f1(A)=12说明从A到E的最短距离为12,最短路线的确 定可按计算顺序反推而得。即 A→B3→C2→D2→E 上述最短路线问题的计算过程,也可借助于图形直观的 表示出来:
10
f 1 A min AB 3 f 2 B 3 12
f 2 B 3 min B 3 C 2 f 3 C 2 9
f 3 C 2 min C 2 D 2 f 4 D 2 7
f 2 B 3 min B 3 C 2 f 3 C 2 9
f 1 A min AB 3 f 2 B 3 12
21
11 B1 12 A
2 4 3 6 3 2 4 6 2 5
19
4、阶段指标、指标函数和最优指标函数 (1)衡量某阶段决策效益优劣的数量指标,称为阶段指标 ,用vk(Sk,dk)表示第k阶段的阶段指标。 在不同的问题中,其含义不同。它可以是距离、利润、成本 等 。在 引 例中 , vk(Sk,dk) =dk 表示在 第 k阶段由 点 Sk 到点
Sk+1=dk(Sk)距离。如d2(B3,C1)=6。
本方程是策略最优性的充要条件。由此可见,基本方程是 动态规划理论与方法的基础。
动态规划模型的建立与求解
一、构成动态规划模型的条件
26
应用动态规划解决问题时必须首先建立动态规划模型, 再用逆序或顺序算法求解。写一个问题的动态规划模型一 般包含以下6个步骤:
6
7 4
C1
7 C2 6 C3
3
4 6
9 B2 9 B3
3 D1
3
3
3 3
E
4 D2
4
22
5、基本方程(递推关系式) 从引例求A到E的最短路的计算过程中可以看出,在求解 的各个阶段,我们利用了k阶段与k+1阶段之间的递推关系
f k s k min v k s k , d k f k 1 s k 1 d k s k D k S k , k 4 ,3 , 2 ,1 f 5 s 5 0
,决策点为D1
C 2 D 1 f 4 D 1 63 f 3 C 2 min min 7 3 4 * C 2 D 2 f 4 D 2
C 3 D 1 f 4 D 1 3 3 * f 3 C 3 min min 6 3 4 C 3 D 2 f 4 D 2
1
• 动态规划方法是现代企业管理中的一种重 要决策方法。如果一个问题可将其过程划 分为若干个相互联系的阶段问题,且它的 每一阶段都需进行决策,则这类问题均可 用动态规划方法进行求解。 • 根据多阶段决策过程的时序和决策过程 的演变,动态规划方法有以下四种类型: 离散确定型、离散随机型、连续确定型和 连续随机型。
j k
n
则有
f k ( s k ) OPt v k ( s k , d k ) f k 1 ( s k 1 ) , d k D k ( s k ) k n , n 1, 1 f n 1 ( s n 1 ) 0 ( 边界条件 )
决策点为C2
B 2 C 1 f 3 C 1 3 6 * 决策点 * 9 f 2 B 2 min B 2 C 2 f 3 C 2 min 2 7 为C1或C2 B 3 C 3 f 3 C 3 46
7
6 3 2 7 4
B1
0 A
2 4 3
C1 5 C2 8 C3
3 4 6 3 3 3
4 B2 3 B3
4 6
10 D1
8 D2
3
E
4
12
2 5
13
•
各阶段选取的决策,一般与“时序”有 关,决策依赖于当前的状态,又随即引起 状态的转移,整个决策序列就是在变化的 状态中产生出来,故有“动态”含义。因 此,把这种方法称为动态规划方法。
将该问题划分为4个阶段的决策问题,即第一阶段为从A 到Bj(j=1,2,3),有三种决策方案可供选择;第二阶段 为从Bj 到Cj (j=1,2,3),也有三种方案可供选择;第三阶 段为从Cj 到Dj(j=1,2),有两种方案可供选择;第四阶段为 从Dj 到E,只有一种方案选择。如果用完全枚举法,则可 供选择的路线有3×3×2×1=18(条),将其一一比较才 可找出最短路线: A→B1→C2→D3→E 其长度为12。
4
• 显然,这种方法是不经济的,特别是当阶 段数很多,各阶段可供的选择也很多时。 • 由于我们考虑的是从全局上解决求A到E 的最短路问题,而不是就某一阶段解决最 短路线,因此可考虑 • 从最后一阶段开始计算,由后向前逐步 推至A点:
5
B1
2
6 3 2
7 4
C1 C2
3 4 6 3
D1
3
A
3
4
B2
B 3 C 1 f 3 C 1 6 6 f 2 B 3 min B 3 C 2 f 3 C 2 min 2 7 * 9 B 3 C 3 f 3 C 3 56
决策点为C2
7 4
B1
2
C1 C2
3 4 6 3
6 3 2
D1
3
A
3
4
B2
4 6
E
4
3
2 5
D2
B3
C3
3
17
11 B1
6
6 3 2 7 4
C1
3 4 6 3 3 3
3
12 A
2 4 3
9 B2
9 B3
4 6
7 C2
6 C3
D1
4 D2
3
E
4
2
5
18
动态规划方法就是要从允许策略集中找出 最优策略。 所谓策略:就是一个决策序列的集合
f 1 A min AB 3 f 2 B 3 12
f 2 B 3 min B 3 C 2 f 3 C 2 9
f 3 C 2 min C 2 D 2 f 4 D 2 7
f 4 D 2 min[ D 2 E f 5 ( E )] 4 f5 (E ) 0
4 6
3 D1 4 D2
3
E
4
2 5
图中各点上方框的数,表示该点到E的最短距离。图中 红箭线表示从A到E的最短路线,并且找到了从各点到终点 的最短路线. 从引例的求解过程可以得到以下启示: ①对一个问题是否用上述方法求解,其关键在于能否将问 题转化为相互联系的决策过程相同的多个阶段决策问题。
12
2
2
动态规划的基本概念和最优化原理
一、引例(最短路问题) B1
2
6 3 2 4 6 7 4
C1 C2
3 4 6 3
D1
3
A
3பைடு நூலகம்
4
B2 B3
E
4
3
2 5
D2
C3
3
假如上图是一个线路网络,两点之间连线上的数字表示 两点间的距离(或费用),我们的问题是要将货物从A地运 往E地,中间通过B、C、D三个区域,在区域内有多条路径 可走,现求一条由A到E的线路,使总距离最短(或总费用 最小)。 3
25
2、最优化原理
动态规划方法基于R· Bellman等人提出的最优化原理:
作为整个过程的最优策略具有这样的性质,即无论过去的 状态和决策如何,对于先前的决策所形成的状态而言,余 下的诸决策必须构成最优策略。简言之,“一个最优策略 的子策略总是最优的”。
但是,最优化原理仅是策略最优性的必要条件,而基
•
14
B1
2
6 3 2
7 4
C1 C2
3 4 6 3
D1
3
A
3
4
B2
4 6
E
4
3
2 5
D2
B3 A 1 B
C3 2 C
3
3
D
4
E
15
动态规划的基本概念
一、动态规划的基本要素
1、阶段。阶段的划分,一般根据时序和空间的自然特征 来划分,但要便于把问题的过程能转化为阶段决策的过程。 描述阶段的变量称为阶段变量,常用自然数k表示。如引例 可划分为4个阶段求解,k=1,2,3,4。 2、状态与状态变量。状态就是阶段的起始位置。它既是 该阶段某支路的起点,又是前一阶段某支路的终点。
动态规划
(Dynamic Programming)
动态规划是1951年由美国数学家贝尔曼( Richard Bellman)提出,它是解决一类多阶段 决策问题的优化方法,也是考察问题的一种 途径,而不是一种算法(如LP单纯形法)。 因此它不象LP那样有一个标准的数学表达式 和明确定义的一组规则,而必须对具体问题 进行具体分析处理。
9
第一阶段,由A B,有三种选择,即:
AB 1 f 2 B1 2 11 f 1 A min AB 2 f 2 B 2 min 4 9 12 决策点为B3 AB 3 f 2 B 3 3 9 *
23
f k s k min v k s k , d k f k 1 s k 1 d k s k D k S k , k 4 ,3 , 2 ,1 f 5 s 5 0
一般地,若
V k ,n v j S j , d j ,
11 B1 6
6 3 2 4 6 7 4
C1
3 4 6 3 3 3
3
12 A
2 4 3
9 B2
9 B3
7 C2
6 C3
D1
4 D2
3
E
4
2
5
20
11
6
6 3 2 7 4
B1
12 A
2 4 3
C1 7 C2 6 C3
3 4 6 3 3 3
9 B2 9 B3
4 6
3 D1
4 D2
3
E
4
2 5
f 4 D 2 min[ D 2 E f 5 ( E )] 4 , f 5 ( E ) 0
4 6
E
4
3
2 5
D2
B3 A B
C3 C
3
D
E
f1
f2
f3
f4
6
第四阶段(D E),由D1到E只有一条路线,其长度f4(D1) =3,同理f4(D2)=4。 第三阶段(C D), 由Cj到Di分别均有两种选择,即
3 3 C 1 D 1 f 4 D 1 f 3 C 1 min 6 min 44 C 1 D 2 f 4 D 2