运筹学04动态规划

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例 设备更新问题
企业在使用设备时都要考虑设 备的更新问题,因为设备越陈旧 所需的维修费用越多,但购买新 设备则要一次性支出较大的费用。
多阶段决策问题
(Multi-Stage decision process)
多阶段决策过程特点:
决策d1
决策d2
决策dk
决策dn
状态 s1
阶段1 状态 s2
阶段2 状态...状态
例 生产与存储问题
某工厂每月需供应市场一定数量 的产品。供应需求所剩余产品应存 入仓库,一般地说,某月适当增加 产量可降低生产成本,但超产部分 存入仓库会增加库存费用,要确定 一个每月的生产计划,在满足需求 条件下,使一年的生产与存储费用 之和最小。
例 投资决策问题
某公司现有资金Q亿元,在今后 5年内考虑给A、B、C、D四个项目 投资,这些项目的投资期限、回报 率均不相同,问应如何确定这些项 目每年的投资额,使到第五年末拥 有资金的本利总额最大。
例从A城市到E城市的阶段数,少则一 个(例从A城市直达E城市),多则无 限(例从A城市通过其他B、C、D三 城市循环到E城市)。为避免循环,加 上约束条件:每个城市至多经过一次。
于是从A城市到达E城市的阶段数有 下列四种情形:
1.从A城市直达E城市,一个阶段。
2.从A城市通过其他B、C、D三城市之 一到E城市,二个阶段。 3.从A城市通过其他B、C、D三城市之 二到E城市,三个阶段。 4.从A城市通过其他B、C、D三城市各 一次到E城市,四个阶段。
4 状态转移方程
动态规划中本阶段的状态往往 是上一阶段的决策结果。如果给 定了第k段的状态Sk ,本阶段决 策为xk(Sk) ,则第k+1段的状态 Sk+1由公式: Sk+1=Tk( Sk, xk)
确定,称为状态转移方程。
5 指标函数
用于衡量所选定策略优劣的数量指 标称为指标函数v(Sk,xk(Sk))。 对不同问题,指标函数可以是诸如费用、 成本、产值、利润、产量、耗量、距离、 时间、效用,等等。
4 1 C3
B2
2
2
C2 3
5 B1 4
3 C1 3
D3 5
E2
3
2
D2
4
F
4
2 E1
D1
A
B
C
D
E
F
4 A3
4 1 C3
B2
2
2
C2 3
5 B1 4
3 C1 3
D3 5
E2
3
2
D2
4
F
4
2 E1
D1
A
B
C
D
E
例2(一定阶段最短路问题)
W先生每天驾车去公司上班。如图,W先生的住所位于A,公 司位于F,图中的直线段代表公路,交叉点代表路口,直线段 上的数字代表两路口之间的平均行驶时间。现在W先生的问题 是要确定一条最省时的上班路线。
C3 4 D3
5 E2
2F
1
2
3
4
B2 2 C2 3 D2
E1
4
5
3
2
A3wk.baidu.com
k子过程指标函数Vk,n
最优指标函数fk(Sk)
动态规划的基本思想:
从过程的最后一段开始,用 逆序递推方法求解,逐步求出 各段各点到终点E最短路线, 最后求出A点到E点的最短路线。
4 A3
4 1 C3
B2
2
2
C2 3
5 B1 4
3 C1 3
D3 5
E2
3
2
D2
4
F
4
2 E1
D1
A
B
C
D
E
F
4 A3
本章内容重点
多阶段决策过程的最优化 动态规划的基本概念和基本原理 动态规划方法的基本步骤 动态规划方法应用举例
动态规划是解决多阶段决策过程 最优化问题的一种方法。由美国数 学家贝尔曼(Bellman)等人在20 世纪50年代提出。他们针对多阶段 决策问题的特点,提出了解决这类 问题的“最优化原理”,并成功地 解决了生产管理 、 工程技术等方 面的许多实际问题。
s3
sk
阶段k 状态...状态 阶段n
sk+1
sn
状态 sn+1
g1
g2
gk
gn
例1(不定阶段最短路线问题)
如图是一个五座城市的及其相连道路的交通图, 线上的数字是对应的路长。问:应如何选择行驶 路线,才能使从A、B、C、D各城市到E城市的行 驶路程最短?
E
2
3
A
2
D
7
5
6
5
5
1
B
0.5
C
从图中可以看出,任意两座城市之间 都有道路相通。我们把从一座城市直 达另一座城市作为一个阶段。
B1 4 C1 3
D1
动态规划的基本概念 阶段; 状态; 决策和策略; 状态转移; 指标函数。
1 阶段(Stage)
将所给问题的过程,按时间或 空间特征分解成若干个相互联系的 阶段,以便按次序去求每阶段的解。 用以描述阶段的变量叫作阶段变量, 一般以k表示阶段变量。
2 状态(State)
各阶段开始时的客观条件叫做状 态。描述各阶段状态的变量称为状 态变量,常用sk表示第k阶段的状 态变量,状态变量的取值集合称为 状态集合,用Sk表示。状态集合可 以是一离散取值的集合,也可以为 一连续的取值区间,视具体问题而 定。
按照过程进行的先后,每个阶段的状 态可分为初始状态和终止状态,或称
输入状态和输出状态,阶段k的初始 状态记作sk,终止状态记为sk+1。但
为了清楚起见,通常定义阶段的状态 即指其初始状态。
动态规划中的状态具有如下性质:
当某阶段状态给定以后,在这阶 段以后的过程的发展不受这段以前 各段状态的影响。即:过程的过去 历史只能通过当前状态去影响它未 来的发展,这称为无后效性。如果 所选定的变量不具备无后效性,就 不能作为状态变量来构造动态规划 模型。
3 决策和策略
(Decision and Policy)
当各段的状态确定以后,就可 以做出不同的决定(或选择),从 而确定下一阶段的状态,这种决定 称为决策。决策变量用xk(Sk)表示, 允许决策集合用Dk(Sk)表示。
各个阶段决策确定后,整个问 题的决策序列就构成一个策略,用 p1,n(x1,x2,…xn)表示。对每个实际 问题,可供选择的策略有一定的范 围,称为允许策略集合,用P表示。 使整个问题达到最优效果的策略就 是最优策略。
动态规划是现代企业管理中 的一种重要决策方法,可用于 最优路径问题、资源分配问题、 生产计划和库存问题、投资问 题、装载问题、排序问题及生 产过程的最优控制等。
动态规划的基本原理
多阶段决策过程最优化
多阶段决策过程是指这样一类特 殊的活动过程,他们可以按时间顺 序分解成若干相互联系的阶段,在 每个阶段都要做出决策,全部过程 的决策是一个决策序列,所以多阶 段决策问题也称为序贯决策问题。
相关文档
最新文档