线性规划数学模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
动态规划方法与“时间”关系很密切,随着时间过程 的发展而决定各时段的决策,产生一个决策序列,这就是 “动态”的意思。然而它也可以处理与时间无关的静态问 题,只要在问题中人为地引入“时段”因素,就可以将其 转化为一个多阶段决策问题。在本章中将介绍这种处理方 法。
动态规划
所谓多阶段决策问题是指这样的决策问题:其过程可分 为若干个相互联的阶段,每一阶段都对应着一组可供选择 的决策,每一决策的选定即依赖于当前面临的状态,又影 响以后总体的效果。当每一阶段的决策选定以后,就构成 一个决策序列,称为一个策略,它对应着一个确定的效果。 多阶段决策问题就是寻找使此效果最好的策略。
动态规划求解的特点
通常多阶段决策过程的发展是通过状态的一系列变换来 实现的。 一般情况下,系统在某个阶段的状态转移除与本 阶段的状态和决策有关外,还可能与系统过去经历的 状态和决策有关。
适合于用动态规划方法求解的只是一类特殊的多阶段决 策问题,即具有“无后效性”的多阶段决策过程。 无后效性(又称马尔柯夫性)是指系统从某个阶段往 后的发展,仅由本阶段所处的状态及其往后的决策所 决定,与系统以前经历的状态和决策(历史)无关。
动态规划的基本概念
4.策略 一个按顺序排列的决策组成的集合。由过程的
第K阶段开始到终止阶段为止的过程称为问题的后 部子过程。由每段的决策按顺序排列组成的决策 函数序列{uk(sk),…,un(sn)}称为K子过程策略,简称 子策略,记为pk,n(sk)。
动态规划问题实例
例6-1 给定一个线路网络,要从A向F铺设一条输油管,
各点间连线上的数字表示距离,问应选择什么路线,可
使总距离最短?
C1 6
5
1
B1 3
6
8ຫໍສະໝຸດ Baidu
3
C2 5
2
D1
2
E1 3
5
F1 4
5
A
3
3
8 7
C3 3
1
D2
2
E2 2
6
G
3
F2
B2 6
8 4
C4
3
D3 3
6
E3
动态规划
C1 6
5
1
B1 3
动态规划的基本概念
2.状态、状态变量与可能状态集 描述事物(或系统)在某特定的时间与空间域中所处
位置及运动特征的量,称为状态。反映状态变化的量叫 做状态变量。状态变量包含在给定的阶段上确定全部允 许决策所需要的信息。
每个阶段的状态可分为初始状态和终止状态,或称 输入状态和输出状态,阶段k的初始状态记作sk,终止状 态记为sk+1。通常定义阶段的状态即指其初始状态。
动态规划
本章内容重点 多阶段决策过程的最优化 动态规划的基本概念和基本原理 动态规划方法的基本步骤 动态规划方法应用举例
动态规划
动态规划是解决多阶段决策过程最优化的一种数学方 法。1951年美国数学家贝尔曼等人根据一类多阶段决策问 题的特点,把多阶段决策问题变换为一系列互相联系的单 阶段问题,然后逐个加以解决。贝尔曼的《动态规划》于 1957年出版。
5
A
3
3
87
C3 3
1
D2
2
E2 2
6
G
3
F2
B2 6
8 4
C4
3
D3 3
6
E3
第1阶段 第2阶段 第3阶段
第4阶段 第5阶段 第6阶段
动态规划的基本概念
3.决策 当一阶段的状态确定后,可以作出不同的选择从而
演变到下一阶段的某个状态,这种选择手段称为决策。 在最优控制问题中也称为控制。
描述决策的变量,称为决策变量。决策变量的允许 取值的范围称为允许决策集合。决策变量是状态变量的 函数。用uk(sk)表示第K阶段处于状态sk时的决策变量; Dk(sk)表示sk的允许决策集合。
一般状态变量的取值有一定的范围或允许集合,称 为可能状态集,或可达状态集。可能状态集实际上是关 于状态的约束条件。通常可能状态集用相应阶段状态sk 的大写字母Sk表示,sk∈Sk,。
动态规划问题实例
状态1
状态2
状态3
状态4
状态5
状态6 状态7
C1 6
5
1
B1 3
6
8
3
C2 5
D1 2
2
E1 3
5
F1 4
决策u1
决策u2
决策uk
决策un
状态 阶段1 状态 阶段2 状态...状态 阶段k 状态...状态 阶段n 状态
x1
x2
x3 xk
xk+1 xn
xn+1
T1
T2
Tk
Tn
多阶段决策问题
工厂生产过程:由于市场需求是一随着时间而变化的因素, 因此,为了取得全年最佳经济效益,就要在全年的生产过 程中,逐月或者逐季度地根据库存和需求情况决定生产计 划安排。 设备更新问题:一般企业用于生产活动的设备,刚买来时故 障少,经济效益高,即使进行转让,处理价值也高,随着 使用年限的增加,就会逐渐变为故障多,维修费用增加, 可正常使用的工时减少,加工质量下降,经济效益差,并 且,使用的年限越长、处理价值也越低,自然,如果卖去 旧的买新的,还需要付出更新费.因此就需要综合权衡决 定设备的使用年限,使总的经济效益最好。
动态规划问题实例
状态1
状态2
u2(B2)=C2
D2(B2)={C2,C3,C4}
1
B1 3
5
6
A
3
87
B2 6
状态3
C1 6
8 3
C2 5
3
C3 3
8 4
C4
状态4
D1 2
2 1
D2
2 3
D3 3
状态5
状态6 状态7
E1 3
5
5
E2 2
6 6
E3
F1 4
G
3
F2
第1阶段 第2阶段 第3阶段
第4阶段 第5阶段 第6阶段
6
8
3
C2 5
2
D1
2
E1 3
5
F1 4
5
A
3
3
8 7
C3 3
1
D2
2
E2 2
6
G
3
F2
B2 6
8 4
C4
3
D3 3
6
E3
动态规划的基本概念
1.阶段与阶段变量 为了便于求解和表示决策及过程的发展顺序,
而把所给问题恰当地划分为若干个相互联系又有 区别的子问题,称为多段决策问题的阶段。
描述阶段的变量称为阶段变量,常用k表示。 阶段的划分,一般是根据时间和空间的自然特征 来进行的,但要便于问题转化为多阶段决策。
多阶段决策问题
连续生产过程的控制问题:一般化工生产过程中,常包含一 系列完成生产过程的设备,前一工序设备的输出则是后一 工序设备的输入,因此应该如何根据各工序的运行工况, 控制生产过程中各设备的输入和输出,以使总产量最大。 资源分配问题:资源分配问题属于静态问题。如某工业部门 或公司,拟对其所属企业进行稀缺资源分配,为此需要制 定出收益最大的资源分配方案。这种问题原本要求一次确 定出对各企业的资源分配量,它与时间因素无关,不属动 态决策,但是,我们可以人为地规定一个资源分配的阶段 和顺序,从而使其变成一个多阶段决策问题。
相关文档
最新文档