管理运筹学讲义动态规划优秀课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
∴ f3 (A) = min
d(A, B1 )+ f2 ( B1 ) d(A, B2 )+ f2 ( B2 )
= min{6,7}=6
(最短路线为A→B1→C1 →D)
3
C1
2 B1 3
1
A
1 2
3
C2
3
D
4 B2 1
4
C3
最短路线为 A→B1→C1 →D 路长为 6
第一节 多阶段决策问题
二、动态规划的标号法
• 每个阶段选取的路线不同,对应从Q到T就有一系列不同 的运输路线:
▪ 从始点Q到终点T共有3×3×2×1=18条不同路线 ▪ 现在的问题是如何选择一条费用最小的路线?
二、最短路径问题
例一、从A 地到D 地要铺设一条煤气管道,其中需经过 两级中间站,两点之间的连线上的数字表示距离,如 图所示。问应该选择什么路线,使总距离最短?
3
C1
2 B1 3
1
A
1 2
3
C2
3
D
4 B2 1
4
C3
3
C1
2 B1 3
1
A
1 2
3
C2
3
D
4 B2 1
4
C3
解:整个计算过程分三个阶段,从最后一个阶段开始。 第一阶段(C →D): C 有三条路线到终点D 。
显然有 f1 (C1 ) = 1 ; f1(C2 ) = 3 ; f1 (C3 ) = 4
4 C1
城 市
某 公 司
阶段1
阶段2
阶段3
阶段4
• 从生产厂Q到某公司T选择那条路线,使总运费最低(路程最短)?
第一节 多阶段决策问题
• 这是一个多阶段决策问题,它可分为四个阶段:
▪ 第一阶段:从Q(制造厂)到A(出口港); ▪ 第二阶段:从A(出口港)到B(进口港); ▪ 第三阶段:从B(进口港)到C(城市); ▪ 第四阶段:从C(城市)到T(某公司)。
第一节 多阶段决策问题
一、 问题的提出
• 多阶段决策:
▪ 经济管理决策中,有些管理决策问题可以按时序或空间演 变划分成多个阶段 ,呈现出明显的阶段性;
▪ 于是可把这类决策问题分解成几个相互联系的阶段,每个 阶段即为一个子问题;
▪ 原有问题的求解就化为逐个求解几个简单的阶段子问题; ▪ 每个阶段的决策一旦确定,整个决策过程也随之确定,此
• 最短路的基本特征
▪ 从始点Q到终点T 的最短路径:Q→ A3→ B1→ C1→T,则 从中点A3 到终点T 的最短路径必为: A3→ B1→ C1→T, 从中点B1 到终点T 的最短路径必为:B1→ C1→T,…。
▪ 推广:从始点Q到终点T 的最短路径: Q → S1→ S2→ … → Sk→ Sk+1→ … → Sn→T,则 从中点Sk 到终点T 的最短路径必为: Sk→ Sk+1→ … → Sn→T。
管理运筹学讲义动 态规划
第七章 动态规划
• 动态规划Dynamic Programming
▪ 研究多阶段决策的最优化问题的方法。 ▪ 多阶段决策问题含有一个描述过程时序或空间演变的阶段
变量,将复杂问题划分成若干阶段,根据“最优性原理”, 逐段解决而最终实现全局最优。 ▪ 经济、管理、工业生产、工程技术等领域,许多问题可归 结为多阶段决策问题。 ▪ 一些用线性规划、非线性规划处理有困难的问题,往往可 以用动态规划方便地求解。 ▪ 动态规划是美国运筹学家贝尔曼(R.Bellman)等人1959年提 出的。
类问题称为多阶段决策问题。
• 例如:
▪ 企业生产物流:可分为物料供应、生产制造、分销零售等 阶段。
▪ 最短路问题:可以按空间顺序划分阶段。
第一节 多阶段决策问题
• 最短路问题
2 Q4
3
生 产 商
A1 7 4
6 4 A2 2 4
4 2
A3 5
出 口 港
B1 1 4
6 B2
3
3 B3 3 进 口 港
C1 3 T
= min 6 = 4
5
(最短路线为B1→C1 →D)
3
C1
2 B1 3
1
A
1 2
3
C2
3
D
4 B2 1
4
C3
d( B2,C1 ) + f1 (C1 ) f2 ( B2 ) = min d( B2,C2 ) + f1 (C2 )
d( B2,C3 ) + f1 (C3 ) 3
2+1 = min 3+3
1+4
= min 6 = 3 (最短路线为B2→C1 →D) 5
3
C1
2 B1 3
1
A
1 2
3
C2
3
D
4 B2 1
4
C3
第三阶段( A → B ): A 到B 有二条路线。
f3(A)1 = d(A, B1 )+ f2 ( B1 ) =2+4=6 f3 (A)2 = d(A, B2 )+ f2 ( B2 ) =4+3=7
3
C1
2 B1 3
1
A
1 2
3
C2
3
D
4 B2 1
4
C3
第二阶段(B →C): B 到C 有六条路线。
d( B1,C1 ) + f1 (C1 ) f2 ( B1 ) = min d( B1,C2 ) + f1 (C2 )
d( B1,C3 ) + f1 (C3 ) 4
3+1 = min 3+3
1+4
第二节 动态规划原理
一、动态规划的基本概念
• 阶段(stage)
▪ 处理多阶段决策,需将全过程划为若干阶段,每个阶段进 行一次抉择。
▪ 各阶段按一定顺序联接在一起组成统一的整体。 ▪ 用k表示阶段变量。 ▪ 阶段编号
• 顺序编号 • 逆序编号
第二节 动态规划原理
• 状态(state)
▪ 状态表示过程发展中某阶段的起始状况。 ▪ 过程的发展可以通过各阶段状态的演变来描述。 ▪ 状态可用一个变量来描述,称为状态变量,用Sk表示。 ▪ 选取的状态变量必须满足无后效性。
▪ 决策变量的取值被限制在某一范围内,此范围称为允许决 策集合Xk(sk)
• 某阶段的状态给定后,则过程未来发展不受该阶段以前 各阶段状态的影响。
▪ 第 k 阶段可能有若干状态,用Sk 表示阶段k的状态集合,
▪ sk(i)表示第k阶段的第 i 个状态。
第二节 动态规划原理
• 决策(decision)
▪ 从上一阶段某状态演变到下一阶段某状态要作一次选择, 称为决策。
▪ 用变量xk(sk)表示第k阶段状态为sk时的决策,称为决策变 量,简记xk
11,B1 ,B2
4,C1
A1 7
B1 1
3,T
11,A3 2 Q4
4
8,B1
6 4
A2 2
4 7,C2
6 B2
C1 3
0
ຫໍສະໝຸດ Baidu
T
3
4
3
8,B1 4 2
6,C1 3
4,T 4
C2
A3 5
B3 3
阶段1
阶段2
阶段3
阶段4
• 最短路径:Q→ A3→ B1→ C1→T
第一节 多阶段决策问题
三、 多阶段决策的基本特征