运筹学第八章_动态规划a管理精品资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

i 1
n
问如何分割使其乘积 c i 最大?
i1
n
max
z
i1
c
i
s
.t
n i1
ci
c
c i 0 , (i 1,2 ... n )
第二节 最优化原理与动态规划数学模型 2.1 基本思想
将多阶段问题转化为单阶段问题,按着目 标要求和递推关系求出最优结果。 (用逆序解法解例1)
[例1] 最短路线问题。 设有一个旅行者从图8-1中的A点出发,
5. 状态转移方程: 从sk的某一状态(值) 出发,当决策变量xk(sk)的取值决定后,下 一阶段状态变量sk+1 (的取值)也就随之确 定。这种从上一阶段的某一状态(值)到下 一阶段某一状态(值)的转移规律称为状态 转移率,也称状态转移方程。记为:
s k 1 T ( s k , x k ( s k ) )或 简 记 为 s k 1 T ( s k , x k )
min4134min844 f3(C2)min((C C22,,D D21)) ff44((D D12))
最优决策C1D1
63 9 min34min77 f3(C3)min((C C33,,D D21)) ff44((D D12))
最优决策C2D2
min33 43min766 最优决策C3D1
f2(B1)min ((B B11,,C C21)) ff3 3((C C12)) min 7 5 7 4 min 1 12 1 11
显然,决策不同,过程的策略也不同。对应
于每一个策略,都有一个确定的效果(值)。一 般情况下,策略不同,效果也不同。
多阶段决策的目的就是在所有可采取的策略
中选取一个最优策略,使在一定条件下取得最优 的效果。
例之三和:将n c一i 个c数c,(且cc>i0>)0(分i=为1n,个2部,分…c,1,nc)2,…, ,cn
从A到E的最短路径为11,路线为A→B3→C2 →D2 →E 。
f 4 ( D 1 ) d ( D 1 E ) f 5 ( E ) 3 0 3 f 4 ( D 2 ) d ( D 2 E ) f 5 ( E ) 4 0 4
f3(C1)min((C C11,,D D21)) ff44((D D12))
状态可以是一个数或一组数,也可能不是数;
可以使离散的,也可以是连续的;可以是确定的, 也可以是随机的。(维数障碍)
3. 决策: 当某阶段的状态给定以后,从 该状态演变到下一阶段某种状态的选择。
决策变量xk(sk)表示第k阶段状态为sk时 对方案的选择。显然,它是状态的函数。
决策变量的取值要受到一定的限制 (约束条件),用Dk(sk)表示k阶段状态为 sk时的决策变量允许取值范围,称为允许 决策集合,因而有 xk(sk) ∈Dk(sk) 。
(B3,C3)f3(C3)
56
11
最 优 决 策 B3C2
f1(A)min ((A A,,B B21)) ff2 2((B B12)) min 25 171 min 1 12 3 11
(A,B3)f2(B3)
38
11
最 优 决 策 AB3
2.2 动态规划的基本概念 阶段: 问题需要做出决策的步数。阶段用k 表示。通常, k=1,2,…,n。 (逆序编号与顺序编号)。
2. 状态:系统某阶段的出发位置或特征、状况。 通常一个阶段包含有若干个(设r个)状态。
每一阶段所有状态的集合称为状态变量集合。用 Sk={ ski} i=1,2,…,r表示。
第k阶段的状态变量Sk应包含该阶段之前决 策过程的全部信息,做到从该阶段后做出的决策
只与该状态有关,与这之前的状态和决策相互独 立。(无后效性)
1 4 6
f4(D1)=3
D1
3 f5(E)=0
E
4
3
5
3
3
D2
4
1
B3 5
C3
3
f4(D2)=4
f2(B3)=8
f3(C3)=6
状态 最优决策 状态 最优决策 状态 最优决策 状态 最优决策 状态
A,( A,B3), B3 ,(B3,C2),C2,(C2,D2), D2,(D2,E), E
从A到E的最短路径为11,路线为A→B3→C2 →D2 →E 。
A
B1 7 5
2
6
f2(B2)=7 3
5
B2 2
C1
f3(C2)=7
C2
1 4 6
f4(D1)=3
D1
3 f5(E)=0
E
4
3
5
3
3
D2
4
1
B3 5
C3
3
f4(D2)=4
f2(B3)=8
f3(C3)=6
状态 最优决策 状态 最优决策 状态 最优决策 状态 最优决策 状态
A,( A,B3), B3 ,(B3,C2),C2,(C2,D2), D2,(D2,E), E
途中要经过B、C、D等处,最后到达终点E。 从A到E有很多条路线可以选择,各点之间的 距离如图中所示,问该旅行者应选择哪一条 路线,使从A到达E的总路程为最短。
2
A
5
3
7
B1
5 6
3
B2 2
4 5
1
B3
5
C1
1
4
6
C2
3 3
C3
3
D1 3 E
D2
4
f2(B1)=11
f3(Cቤተ መጻሕፍቲ ባይዱ)=4
f1(A)=11
(B1,C3)f3(C3)
66
12
最 优 决 策 B1C1
f2(B2)min ((B B22,,C C21)) ff3 3((C C12)) min 2 3 4 7 min 9 7 7
(B2,C3)f3(C3)
46
10
最 优 决 策 B2C1
f2(B3)min ((B B33,,C C21)) ff3 3((C C12)) min 1 5 74 min 8 9 8
作业:P215 8.1 8.2
第八章 动态规划
第一节 多阶段决策问题 动态规划是用来求解多阶段决策问题的。
多阶段决策问题:可将问题分为若干个相互联系 的阶段,在每一阶段分别对应着若干个可以选择 的决策,当每个阶段的决策选定之后,也就确定 了问题的一个决策过程。将各阶段的决策综合起 来,就构成了一个决策序列,称为问题的一个策 略。
4. 策略和子策略: 策略:动态规划问题各阶段决策组成的序 列总体。
子策略:从某一阶段开始到过程最终的决 策序列称为问题的子过程策略。
使问题达到最优效果的策略称为最优 策略。
f2(B1)=11
f3(C1)=4
f1(A)=11
A
B1 7 5
2
6
f2(B2)=7 3
5
B2 2
C1
f3(C2)=7
C2
相关文档
最新文档