第21讲_动态规划(投资分配问题)
动态规划
=MIN(3+12,4+10)=14
最短路线: A—— B2 ——C2——D2——E2——F 最优解: d1*(A)= B2,最短用时14
1
B2
C3
4 2
D3
5
E2
4
A
2
C2
3 3 3
D2
2
F
3
B1
5 4
C1
4
2
E1
最优解: d2*(B1)= C1
1
B2
C3
4 2
D3
5
E2
4
A
2
C2
3 3 3
D2
2
F
3
B1
5 4
C1
4
2
E1
4
3
D1
A
B
C
D
E
F
如果S2=B2,则下一步能取C2或C3,故
f2(B2)=MIN r(B2,C2)+ f3(C2)
r(B2,C3)+ f3(C3) =MIN(2+8,1+11)=10
最短路线: B2 ——C2——D2——E2——F
1
B2
C3
4 2
D3
5
E2
4
A
2
C2
3 3 3
D2
2
F
3
B1
5 4
C1
4
2
E1
4
3
D1
A
B
C
D
E
F
如果S4=D3,则下一步只能取E2,故
第21讲动态规划(投资分配问题)-PPT精选文档
xi a i1 x 0 i 1 .2 . .n i
投资分配问题
f1(x) = g1(x)
(因为只给一个工厂)
当1<k≤n 时,其递推关系如下: 设:y 为分给第k 个工厂的资金(其中 0≤y ≤ x ),此时还剩 x - y (万元)的资金需要分配给前 k-1 个工厂,如果采取最优策略,则得到的最大 利润为fk-1(x-y) ,因此总的利润为: gk(y) + fk-1(x-y)
y 0 , 1 0 , 2 0 , 3 0
最优策略为(20,10),此时最大利润为70万元。
河南理工大学ACM-ICPC培训
投资分配问题
f ( 2 0 ) m a x g ( yf ) ( 2 0) y 5 0 2 2 1
y 0 , 1 0 , 2 0
最优策略为(20,0),此时最大利润为50万元。
最优策略为(40,20),此时最大利润为120万元。 同理可求得其它 f2(x) 的值。
河南理工大学ACM-ICPC培训
投资分配问题
f 2 (5 0 ) m ax g2 ( y) ,5 0 f 1 (5 0 y )
y 0 ,1 0 ,
g 2 (0 ) f 1 (5 0 ) g (1 0 ) f ( 4 0 ) 1 2 g 2 ( 2 0 ) f 1 (3 0 ) 105 g 2 (3 0 ) f 1 ( 2 0 ) g 2 ( 4 0 ) f 1 (1 0 ) g 2 (5 0 ) f 1 (0 )
g2 (0) f1 (60) 0 85 g (10) f (50) 20 85 1 2 g2 (20) f1 (40) 40 80 max g2 (30) f1 (30) max50 65 120 g (40) f (20) 55 50 1 2 g2 (50) f1 (10) 60 20 65 0 g2 (60) f1 (0)
动态规划在资源配置中的应用研究
动态规划在资源配置中的应用研究在当今复杂多变的社会和经济环境中,资源的有效配置成为了各个领域追求高效发展的关键。
而动态规划作为一种强大的数学优化方法,在资源配置问题中发挥着至关重要的作用。
动态规划的核心思想在于将一个复杂的问题分解为一系列相互关联的子问题,并通过对这些子问题的求解来逐步得出原问题的最优解。
这种方法的优势在于它能够充分考虑到问题的动态性和阶段性,从而更加贴合实际情况。
资源配置问题通常涉及到多个因素的权衡和决策。
例如,在企业生产中,需要决定如何分配有限的人力、物力和财力资源,以实现最大的产出和利润;在项目管理中,要合理安排任务的顺序和资源的投入,确保项目按时完成且成本最低;在交通运输领域,需要优化车辆的调度和路线规划,以提高运输效率和降低运营成本。
以生产企业为例,假设一家工厂有多种产品可以生产,每种产品的生产需要消耗不同数量的原材料、工时和设备使用时间,同时每种产品在市场上的售价也不同。
为了实现利润最大化,企业需要决定每种产品的生产数量。
这就是一个典型的资源配置问题。
如果使用传统的方法来解决这个问题,可能会面临计算复杂、难以考虑所有可能情况等困难。
而动态规划则为我们提供了一种有效的解决方案。
首先,我们可以将生产计划划分为多个阶段,每个阶段对应一个决策点,即决定是否生产某种产品以及生产多少。
然后,我们定义状态变量,例如在某个阶段剩余的原材料、工时和设备可用时间等。
接着,通过建立递推关系式,计算在每个阶段不同决策下的收益,并选择最优的决策。
动态规划在资源配置中的应用具有以下几个显著的优点:一是能够处理大规模的问题。
随着问题规模的增大,传统方法的计算量往往呈指数级增长,而动态规划通过巧妙的分解和递推,可以有效地降低计算复杂度。
二是能够考虑到问题的动态变化。
在实际的资源配置中,各种因素可能会随着时间而发生变化,例如原材料价格的波动、市场需求的变化等。
动态规划可以根据这些变化及时调整策略,保证资源配置的最优性。
【高项第四版教材第21章】项目管理科学基础(运筹学计算)
3 最小生成树 如:改造路线最小长度方案 熟练掌握
4 匈牙利法 如:每人只能做一项任务,如何进行任务的分配 熟练掌握
5
最短(长)路径如:计算网络图最短路径;路径上最少花费;复杂图里计 问题 算最长路径、关键路径
6 网络与最大流量 如:最大运力计算 掌握
7 不确定决型策决论策:如乐等观可主能义、、后悲悔观值主准义则、等折;灵中敏主度义分、析
0.5
(1-2)联立,得X=3/0.11,66题的选项,排除。 (1-3)联立,得X=1140/45.5,67题的选项,排除。 (2-3)联立,得X=15 , Y=30
答案:66-A,67-C
假设从甲采购X吨,乙采购Y吨;则
( 1) ( 2)
( 3)
而所花费总价格(含运费)为 Z=2000x+2900y(万元),画出可行域, 此时,当直线过B(15,30)时,总费用最少,故每季度应从A处采购15万 吨,从B处采购30万吨,总费用为11700万元。
将X=2 , Y=0代入(300X+200Y)得最低成本为600万,第二问选择C选项。
方法2:公司需要研发2个A,4个B。因为甲可支持1个A和两个B,所以2个甲可以满足要求。成本600元。
四个成本选项600下面还有个400,400的组成只有两个乙,但是两个乙不满足要求。所以选甲乙分别为
2,0,成本是600。
题型2【动态规划】投资收益最大的问题
【例5-11下】某公司现有400 万元用于投资甲、乙、丙三个项目,投资额以百元为单 位, 知甲、乙、丙三项投资的可能方案及相应获得的收益如下表所示:
项目-收益-投资额
1
甲
4
乙
3
丙
5
2
3
4
动态规划习题详解
动态规划动态规划是运筹学的一个分支,它是解决多阶段决策过程最优化问题的一种方法。
该方法是由美国数学家贝尔曼(R.Bellman)等人在本世纪50年代初提出的。
他们针对多阶段决策问题的特点,提出了解决这类问题的“最优化原理”,并成功地解决了生产管理、工程技术等方面的许多实际问题,从而建立了运筹学的一个新分支——动态规划。
他的名著《动态规划》于1957年出版,该书是动态规划的第一本著作。
动态规划是现代企业管理中的一种重要决策方法,在工程技术、经济管理、工农业生产及军事及其它部们都有广泛的应用,并且获得了显著的效果。
动态规划可用于解决最优路径问题、资源分配问题、生产计划与库存问题、投资分配问题、装载问题、设备更新与维修问题、排序问题及生产过程的最优控制等。
由于它所具有独特的解题思路,在处理某些优化问题时,常常比线性规划或非线性规划方法更有效。
第一节动态规划的基本方法多阶段决策的实际问题很多,下面通过具体例子,说明什么是动态规划模型及其求解方法。
例1:最短路线问题某工厂需要把一批货物从城市A运到城市E,中间可经过B1 、B2、B3、C1、C2、C3、D1、D2等城市,各城市之间的交通线和距离如下图所示,问应该选择一条什么路线,使得从A到E的距离最短?下面引进几个动态规划的基本概念和相关符号。
(1)阶段(Stage)把所给问题的过程,按时间和空间特征划分成若干个相互联系的阶段,以便按次序去求每个阶段的解,阶段总数一般用字母n表示,用字母k表示阶段变量。
如例l中 (最短路线问题)可看作是n=4阶段的动态规划问题,k=2表示处于第二阶段。
(2)状态(State)状态表示每个阶段开始时系统所处的自然状况或客观条件,它描述了研究问题过程状况。
描述各阶段状态的变量称为状态变量,常用字母sk表示第k阶段的状态变量,状态变量的取值范围称为状态集,用Sk表示。
如例l中,第一阶段的状态为A(即出发位置)。
第二阶段有三个状态:B1 、B2、B3,状态变量s2=B2表示第2阶段系统所处的位置是B2。
动态规划方案解决资源分配问题的策略
动态规划方案解决资源分配问题的策略在幼儿教育事业中,资源分配问题是一项至关重要的任务。
如何合理、高效地分配教育资源,以满足幼儿的需求和发展,成为幼儿工作者们关注的焦点。
针对这一问题,我们引入动态规划这一优化算法,提出一套解决方案,以期为我国幼儿教育事业的发展提供有力支持。
一、背景及问题阐述随着我国经济社会的快速发展,幼儿教育事业逐渐受到广泛关注。
然而,在资源分配方面,幼儿教育仍面临诸多问题。
一方面,资源分配不均,城乡、地区之间差距较大,部分幼儿无法享受到优质的教育资源;另一方面,资源利用效率低下,导致教育成本上升,加剧了教育资源供需矛盾。
为解决这一问题,我们需要对教育资源进行合理分配,提高资源利用效率。
动态规划作为一种优化算法,具有实现全局最优、求解效率高等特点,适用于解决资源分配问题。
本文将以幼儿教育资源分配为背景,探讨动态规划在解决资源分配问题方面的应用。
二、动态规划基本原理动态规划(DynamicProgramming,DP)是一种求解最优化问题的方法,它将复杂问题分解为多个子问题,并通过求解子问题来实现全局最优。
动态规划的核心思想是“记住已经解决过的子问题的最优解”,从而避免重复计算。
1.确定状态:将问题分解为若干个子问题,并用状态变量表示这些子问题。
2.建立状态转移方程:找出子问题之间的关系,建立状态转移方程,表示当前状态如何通过前一个状态得到。
3.确定边界条件:设定初始状态和边界条件,为递推过程提供基础。
4.计算最优解:根据状态转移方程,从初始状态开始递推,得到问题的最优解。
5.构造最优解:根据最优解的递推过程,构造出问题的最优解。
三、动态规划解决资源分配问题的策略1.状态定义我们将资源分配问题分为两个状态:当前状态和子状态。
当前状态表示在某一时间点或某一阶段,已分配的资源总量;子状态表示在分配过程中,某一特定资源类型的分配情况。
2.状态转移方程状态转移方程是动态规划的核心,它描述了当前状态如何由子状态得到。
运筹学动态规划
特别注意:动态规划是求解某类问题的一种 方法,是考察问题的一种途径,而不是一种算法 (如线性规划是一种算法)。
因而,动态规划没有标准的数学表达式和明 确定义的一组规则,而必须对具体问题进行具体 分析处理.
动态规划
8.1 多阶段决策过程及实例 8.2 动态规划的基本概念和
基本方程 8.3 动态规划的最优性定理 8.4 动态规划与静态规划关系
综述
动态规划是运筹学的一个分支,是解决多 阶段决策过程最优化问题的一种数学方法。
该方法是由美国数学家贝尔曼(R.Bellman)等 人在本世纪50年代初提出的。
他们针对多阶段决策问题的特点,把多阶段 决策问题变换为一系列互相联系单阶段问题,然 后逐个加以解决。
1
2
3
始点
5
B1
6 3
A
4 B2 4 6
2
5
B3 6
C1
1 2
2
C2 2
3
C3
3
4 终点
D1 2
D2 3
E
4
D3
2、状态
5
B1
6 3
A 4 B246
25
B3 6
C1
1 2
2
C2 2
C3 3 3
D1 2
D2 3 E 4
D3
各个阶段开始时所处的自然状况和客观条件称为
状态,描述了研究问题过程的状况(称不可控因素).
一些与时间没有关系的静态规划(如线性 规划,非线性规划)问题,只要人为地引进 “时间”因素,也可把它视为多阶段决策问题, 用动态规划方法去处理。
《最优化方法》动态规划
之能最省燃料和完成飞行任务(如软着陆)。
2019/7/30
最优化方法
5
多阶段决策过程的特点
• 根据过程的特性可以将过程按空间、时间等标志分为
若干个互相联系又互相区别的阶段。
• 在每一个阶段都需要做出决策,从而使整个过程达到
最好的效果。
• 各个阶段决策的选取不是任意确定的,它依赖于当前
面临的状态,又影响以后的发展。
润为:
gk(y) + fk-1(x-y)
2019/7/30
最优化方法
23
所以,根据动态规划的最优化原理,有下式:
fk
(
x)
max
0 y x
gk
(
y)
fk 1( x
y)
其中k 2.3..n
如果a 是以万元为资金分配单位,则式中的y 只取非负整数0,1,2,…,x。上式可变为:
具有这种性质的状态称为无后效性(即马尔科夫性) 状态。
动态规划方法只适用于求解具有无后效性状态的多阶 段决策问题。
2019/7/30
最优化方法
21
投资分配问题
现有数量为a(万元)的资金,计划分配给n 个工厂,用
于扩大再生产。
假设:xi 为分配给第i 个工厂的资金数量(万元); gi(xi)为第i 个工厂得到资金后提供的利润值(万元)。
• 当各个阶段的决策确定后,就组成了一个决策序列,
因而也就决定了整个过程的一条活动路线,这样的一 个前后关联具有链状结构的多阶段过程就称为多阶段 决策问题。
2019/7/30
最优化方法
6
针对多阶段决策过程的最优化问题,美国数学家Bellman等 人在20世纪50年代初提出了著名的最优化原理,把多阶段 决策问题转化为一系列单阶段最优化问题,从而逐个求解,
动态规划在投资分配问题中的应用
一
()gx) x: 一 ( fx = a gz+kx—) k ) 。 x{( f z ( m k) _ ( )
—
() 1 () 2
、
动 态规 划 的 基 本原 理
的一 个 重 要 分 支在 工 程 技 术 、 济 管 理 、 业生 产 、 通运 输 等 等 众 多 股 票 ) 的 最优 分 配 方 案 , 经 工 交 时 以及所 提 供 的最 大 利 润 : K个 阶段 是 把 资 第 领 域 都 有 广 泛 的应 用 。动 态 规 划 的 独 到 之 处 是 , 把 多 变 量 的 复 杂 的 金 分 配 给前 K 只股 票 时 的 最 优 分 配方 案 以及 提 供 的 最 大利 润 。 据 动 它 根 决 策 问题 进 行分 阶 段 决 策 , 成 了求 解 多 个 单 变 量 的 决 策 问题 , 在 态 规 划 的最 优 化 原 理 , 们 得 到 : 变 故 我
明 。根 据 最 短 路 径 的这 一 重 要 性 质 , 们 给 出 动 态 规 划 中 的 一 个 重 要 我 定理 。
(= ,, n k 23 …,)
这 里 假设 : 只股 票 之 间 进 行投 资 分 配 时 可 以确 定 投 资 额 的 最 小 各 分配单位 , 这个 最 小 单 位 可 以 根 据 实 际情 况 来 确定 。例 如 以万 元 为 分 配 单 位 , 以 百 万元 为 分 配 单 位 。而 x 是 按 这 个 单位 计 量 的 。这 时 z 或 就 仅 取 非 负 整 数 , 0 12 … X 即 , , , 。而 () 可 以 写 为 : 2式 fx= { ) k — ) k ) m x g( f ( a z x z)
动态规划资源分配问题
小组成员:黄秀梅 罗燕雯 杨俊 李彩霞 林琳 (女) 吴晶莹 邓桂兰 罗碧辉
可编辑ppt
1
资源分配问题:只有一种资源有待于分配到 若干个活动,其目标是如何最有效地在各 个活动中分配这种资源。在建立任何效益 分配问题的DP(Dynamic Programming )模型 时,阶段对应于活动,每个阶段的决策对 应于分配到该活动的资源数量;任何状态 的当前状态总是等于留待当前阶段和以后 阶段分配的资源数量,即总资源量减去前 面各阶段已分配的资源量。
可编辑ppt
3
课程 1 学分 复习天数
234
1
4 35 2
2
54 5 6
3
4
4
5 68 7
8 7 88
可编辑ppt
4
解:这个问题要求作出4个相应关联的决策,即应分配多 少天给每门考试科目。因此,即使这里没有固定的次序, 这四门考试科目可以看成动态规划模型中的四个阶段。 阶段:k=1,2,3,4。考试科目 决策变量:x(k k=1,2,3,4)是分配到阶段(考试科目) k的天数; 状态变量:sk是仍待分配的天数(即前面阶段未分配完的天数)
4
f(k
s
,
k
x
)=
k
P(k
x
)+
k
max
{
Pi ( x i )}
ik 1
f
பைடு நூலகம்
(*
k
sk
)
max{
f k ( s k , x k )}
x k 1,2 ,3 ..., s k
4
xi sk
ik
x i大于等于 1且为整数
将递推关系写出即是
动态规划
3 2 A 4 B2 B1 1 2 3 1 3
C1 C2 4 C3 3
1 D
第三阶段( A → B ): A 到B 有二条路线。 有二条路线。 第三阶段( f3(A)1 = d(A, B1 )+ f2 ( B1 ) =2+4=6 + + = f3 (A)2 = d(A, B2 )+ f2 ( B2 ) =4+3=7 + + = + ∴ f3 (A) = min d(A, B1 )+ f2 ( B1 ) = min{6,7}=6 { } d(A, B2 )+ f2 ( B2 ) + (最短路线为 最短路线为A→B1→C1 →D) 最短路线为
3 2 A 4 B2 B1 1 2 3 1 C3 C2 4 3 3 C1
1 D
3 2 A 4 B2 B1 1 2 3 1 3
C1 C2 4 C3 3
1 D
整个计算过程分三个阶段,从最后一个阶段开始。 解:整个计算过程分三个阶段,从最后一个阶段开始。 第一阶段( 第一阶段(C →D): C 有三条路线到终点 。 ): 有三条路线到终点D 显然有 f1 (C1 ) = 1 ; f1(C2 ) = 3 ; f1 (C3 ) = 4
动 态 规 划
(Dynamic programming)
动态规划的基本思想 最短路径问题 投资分配问题 背包问题
动态规划是用来解决多阶段决策过程最优 化的一种数量方法。其特点在于, 化的一种数量方法。其特点在于,它可以把一 维决策问题变换为几个一维最优化问题, 个n 维决策问题变换为几个一维最优化问题,从 而一个一个地去解决。 而一个一个地去解决。 需指出:动态规划是求解某类问题的一种 需指出: 方法,是考察问题的一种途径, 方法,是考察问题的一种途径,而不是一种算 必须对具体问题进行具体分析, 法。必须对具体问题进行具体分析,运用动态 规划的原理和方法,建立相应的模型, 规划的原理和方法,建立相应的模型,然后再 用动态规划方法去求解。 用动态规划方法去求解。
数学建模动态规划问题
个阶段的决策过程有 个状态变量, 表示 演变的结果。在例1中 取 ,或定义为 ,即 。
根据过程演变的具体情况,状态变量可以是离散的或连续的。为了计算的方便有时将连续变量离散化;为了分析的方便有时又将离散变量视为连续的。
状态变量简称为状态。
2.1.3决策
当一个阶段的状态确定后,可以作出各种选择从而演变到下一阶段的某个状态,这种选择手段称为决策(decision),在最优控制问题中也称为控制(control)。
.
决策 Байду номын сангаас允许集合为
.
状态转移方程和阶段指标应对 的每个取值 和 的每个取值 计算,即 , 。最优值函数应对 的每个取值 计算。基本方程可以表为
(4)
按照(3),(4)逆向计算出 ,为全过程的最优值。记状态 的最优决策为 ,由 和 按照状态转移方程计算出最优状态,记作 。并得到相应的最优决策,记作 。于是最优策略为 。
描述决策的变量称决策变量(decision variable),变量允许取值的范围称允许决策集合(set of admissible decisions)。用 表示第 阶段处于状态 时的决策变量,它是 的函数,用 表示 的允许决策集合。在例1中 可取 或 ,可记作 ,而 。
决策变量简称决策。
2.1.4策略
( )写出基本方程即最优值函数满足的递归方程,以及端点条件。
lzy动态规划OK
5 . 最短路问题:给定一个交通网络图如下,其 最短路问题:给定一个交通网络图如下, 中两点之间的数字表示距离(或花费),试求从A点 ),试求从 中两点之间的数字表示距离(或花费),试求从 点 点的最短距离( 到G点的最短距离(总费用最小)。 点的最短距离 总费用最小)。
1 5 A 3 B2 B1 6 8 7 6 C3 8 C4 1 2 3 4 5 6 3 C2 C1 3 5 3 3 4 D3 D2 3 3 E3 1 2 6 8 D1 2 2 5 E2 6 6 2 F2 E1 3 5
F1
4 G 3
一、动态规划的基本思想
(一)、基本概念 )、基本概念
1、阶段: 、阶段: 把一个问题的过程, 把一个问题的过程,恰当地分为若干个相互联系的 阶段,以便于按一定的次序去求解。 阶段,以便于按一定的次序去求解。 描述阶段的变量称为阶段变量。阶段的划分,一般 描述阶段的变量称为阶段变量。阶段的划分, 阶段变量 是根据时间和空间的自然特征来进行的, 是根据时间和空间的自然特征来进行的,但要便于问题 一个数、 一个数、 转化为多阶段决策。 年、月、 转化为多阶段决策。、 一组数、 一组数
运筹学动态规划PPT
动态决策问题的特点: 系统所处的状态和时刻是进行决策的重要因素; 即在系统发展的不同时刻(或阶段)根据系统 所处的状态,不断地做出决策; 找到不同时刻的最优决策以及整个过程的最优策略。
多阶段决策问题: 是动态决策问题的一种特殊形式; 在多阶段决策过程中,系统的动态过程可以按照时间 进程分为状态相互联系而又相互区别的各个阶段; 每个阶段都要进行决策,目的是使整个过程的决策 达到最优效果。
3 2 A 4 B2 B1 2 3 1 3 1
C1 C2 4 3
1 D
C3
最短路线为
A→B1→C1 →D
3 1
解:整个计算过程分三个阶段,从最后一个阶段开始。
第一阶段(C →D): C 有三条路线到终点D 。
显然有 f1 (C1 ) = 1 ; f1(C2 ) = 3 ; f1 (C3 ) = 4
3
2 A 4 B2 B1 2 1 3
C1
C2 4 C3 3
1 D
3 1
第二阶段(B →C): B 到C 有六条路线。
4、确定状态转移方程
根据k 阶段状态变量和决策变量,写出k+1阶段状态变 量,状态转移方程应当具有递推关系。
5、确定阶段指标函数和最优指标函数,建立动态规 划基本方程
阶段指标函数是指第k 阶段的收益,最优指标函数是 指从第k 阶段状态出发到第n 阶段末所获得收益的最优 值,最后写出动态规划基本方程。 以上五步是建立动态规划数学模型的一般步骤。由于动 态规划模型与线性规划模型不同,动态规划模型没有统一 的模式,建模时必须根据具体问题具体分析,只有通过不 断实践总结,才能较好掌握建模方法与技巧。
2、在多阶段决策过程中,动态规划方法是既把当前 一段和未来一段分开,又把当前效益和未来效益结合 起来考虑的一种最优化方法。因此,每段决策的选取 是从全局来考虑的,与该段的最优选择答案一般是不 同的. 3、在求整个问题的最优策略时,由于初始状态是 已知的,而每段的决策都是该段状态的函数,故最优 策略所经过的各段状态便可逐段变换得到,从而确定 了最优路线。 最优化原理:作为整个过程的最优策略具有这样的 性质:无论过去的状态和决策如何,相对于前面的决 策所形成的状态而言,余下的决策序列必然构成最优 子策略。”也就是说,一个最优策略的子策略也是最 优的。
程蓓-动态规划
动态规划Dynamic ProgrammingChapter 1 基本概念、性质 §1.1 动态规划简介● 对于一个多阶段策略问题,各个阶段所采取的策略一般来说是与时间有关的,决策依赖于当前的状态,又随即引起状态的转移,一个决策序列就是在变化中产生的,故有“动态”的含义。
● 但是一些与时间没有关系的静态规划(如线性规划、非线性规划等)问题,只要人为的引进充当“时间”的因素,也可以将其视为多阶段决策问题,用动态规划的方法来处理。
● 动态规划大约产生于上世纪50年代,由美国数学家R.Bellman 等人提出。
● 动态规划作为求解某类问题的一种方法,是考察问题的一种途径,而不是一种特殊的算法。
● 动态规划模型的分类,根据多阶段决策过程的时间参量是离散的还是连续的变量,过程分为离散决策过程和连续决策过程。
根据决策过程的演变是确定性的还是随机性的,过程又可以分为确定性决策过程和随机性决策过程,组合起来就有离散确定性、离散随机性、连续确定性、连续随机性四种决策过程模型。
§1.2引例例1.1 最短路径问题图1.1表示从起点A 到终点E 之间各点的距离。
求A 到E 的最短路径。
决策● 用穷举法如果从A 到C 的站点有k 个,则总共有3k-1×2条路径。
用穷举法求最短路径总共要进行(k+1)3k-1×2次加法,3k-1×2-1次比较。
当k 的值增加时,需要进行的加法和比较的次数将迅速增加。
例如当k=10时,加法次数为433026次,比较39365次。
● 将以上求从A 到E 的最短路径问题,转化为三个性质完全相同,但规模较小的子问题,即分别从B 1、B 2、B 3到E 的最短路径问题。
最终结果示意图: 以上过程,仅用了18次加法,11次比较,计算效率远高于穷举法。
图1.1图1.2§1.3 动态规划的基本概念、性质最短路径问题●动态规划问题具有以下基本特征:1、问题具有多阶段决策的特征。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10 20 20 25
20 50 40 60
30 65 50 85
40 80 55 100
50 85 60 110
60 85 65 115
g1(x) g2(x) g3(x)
g4(x)
0
25
40
50
60
65
70
依据题意,是要求 f4(60) 。
河南理工大学ACM-ICPC培训
投资分配问题
按顺序解法计算。 第一阶段:求 f1(x)。显然有 f1(x) = g1(x),得到下表
f k ( x ) max
y 0 ,1, 2 ,, x
g
k
( y ) f k 1 ( x y )
河南理工大学ACM-ICPC培训
投资分配问题
设国家拨给60万元投资,供四个工厂扩建使用,每个工厂扩建后的利润与投资 额的大小有关,投资后的利润函数如下表所示。 投资 利润
0 0 0 0
40 90
(20,20)
50 105
60 120
利润
f2(x) 最优策略
(30,20) (40,20)
第三阶段:求 f3(x)。此时需考虑第一、第二及第三个工厂如何进行投资分 配,以取得最大的总利润。
f3 ( 60 )
g3 ( y ) y 0 , 10 ,, 60
max
f2 ( 60 y )
y 0,10,
最优策略为(10,0)或( 0 , 10 ) ,此时最大利润为20万元。
f2(0) =0。最优策略为(0,0),最大利润为0万元。 得到下表
河南理工大学ACM-ICPC培训
投资分配问题
投资
0 0 (0,0)
10 20
(10,0) ()
30 70
(20,10)
据此,有下式:
m ax z g i ( xi )
i 1
n
n xi a i 1 x 0 i 1.2..n i
河南理工大学ACM-ICPC培训
m ax z
n
g (x )
i i i 1
n
令:fk(x) 表示以数量为x 的资金分配给前k 个工厂,所得到的最大利润值。
ACM-ICPC培训
第21讲 动态规划
投资分配问题
ACM算法设计与分析——王建芳
ACM-ICPC培训
投资分配问题
现有数量为a(万元)的资金,计划分配给n 个工厂,用于 扩大再生产。 假设:xi 为分配给第i 个工厂的资金数量(万元);gi(xi) 为第i 个工厂得到资金后提供的利润值(万元)。 问题:如何确定各工厂的资金数,使得总的利润为最大。
第四阶段:求 f4(60)。即问题的最优策略。
f 4 (60 )
g4 ( y) y 0 ,10 ,, 60
max
f 3 (60 y )
河南理工大学ACM-ICPC培训
投资分配问题
g 4 (0) f 3 (60) 0 155 g (10) f (50) 25 135 3 4 g 4 (20) f 3 (40) 40 110 max g 4 (30) f 3 (30) max50 85 160 g (40) f (20) 60 60 3 4 g 4 (50) f 3 (10) 65 25 70 0 g 4 (60) f 3 (0)
河南理工大学ACM-ICPC培训
投资分配问题
所以,根据动态规划的最优化原理,有下式:
f k ( x ) maxg k ( y ) f k 1 ( x y )
0 y x
其中k 2.3. .n
如果a 是以万元为资金分配单位,则式中的y 只取非负整数0,1,2,…,x。 上式可变为:
最优策略为(40,20),此时最大利润为120万元。 同理可求得其它 f2(x) 的值。
河南理工大学ACM-ICPC培训
投资分配问题
f 2 (50) max g2 ( y) ,50 f1 (50 y )
y 0,10,
g 2 (0) f1 (50) g (10) f (40) 1 2 g 2 (20) f1 (30) 105 g 2 (30) f1 (20) g 2 (40) f1 (10) g 2 (50) f1 (0)
最优策略为(20,0,30,10),最大利润为160万元。
河南理工大学ACM-ICPC培训
THANKS
河南理工大学ACM-ICPC培训
最优策略为(20,10,30),最大利润为155万元。 同理可求得其它 f3(x) 的值。得到下表
河南理工大学ACM-ICPC培训
投资分配问题
投资 利润
0 0
10 25
20 60
30 85
40 110
50 135
60 155
f3(x) 最优 策略
(0,0,0 (0,0,10 (0,0,20 (0,0,30 (20,0,20 (20,0,30 (20,10,30 ) ) ) ) ) ) )
河南理工大学ACM-ICPC培训
投资分配问题
g3 ( 0) f2 ( 60) 0 120 25 105 g ( 10 ) f ( 50 ) 2 3 g3 ( 20) f2 ( 40) 60 90 m ax g3 ( 30) f2 ( 30) m ax85 70 155 g ( 40) f ( 20) 100 50 2 3 g3 ( 50) f2 (10) 110 20 115 0 g3 ( 60) f2 ( 0)
投资 利润
0
10
20
30
40
50
60
f1(x) = g1(x)
0
0
20
10
50
20
65
30
80
40
85
50
85
60
最优策略
第二阶段:求 f2(x)。此时需考虑第一、第二个工厂如何进行投资分配,以取得 最大的总利润。
f2 ( 60 )
河南理工大学ACM-ICPC培训
g2 ( y) y 0 , 10 ,, 60
最优策略为(30,20),此时最大利润为105万元。
河南理工大学ACM-ICPC培训
投资分配问题
f 2 (40) max g2 ( y) ,40 f1 (40 y ) 90
y 0,10,
最优策略为(20,20),此时最大利润为90万元。
f 2 (30)
g 2 ( y) y 0,10,20,30 max
max
f1 ( 60 y )
投资分配问题
f2 ( 60 )
g2 ( y) y 0 , 10 ,, 60
max
f1 ( 60 y )
g 2 (0) f1 (60) 0 85 g (10) f (50) 20 85 1 2 g 2 (20) f1 (40) 40 80 max g 2 (30) f1 (30) max50 65 120 g (40) f (20) 55 50 1 2 g 2 (50) f1 (10) 60 20 65 0 g 2 (60) f1 (0)
用动态规划求解,就是求 fn(a) 的问题。 当 k=1 时,
xi a i 1 x 0 i 1 .2 . . n i
投资分配问题
f1(x) = g1(x)
(因为只给一个工厂)
当1<k≤n 时,其递推关系如下: 设:y 为分给第k 个工厂的资金(其中 0≤y ≤ x ),此时还剩 x - y (万元)的资金需要分配给前 k-1 个工厂,如果采取最优策略,则得到的最大 利润为fk-1(x-y) ,因此总的利润为: gk(y) + fk-1(x-y)
f1 (30 y) 70
最优策略为(20,10),此时最大利润为70万元。
河南理工大学ACM-ICPC培训
投资分配问题
f 2 (20) max
y 0,10,20
g2 ( y)
f1 (20 y ) 50
最优策略为(20,0),此时最大利润为50万元。
f 2 (10) max g 2 ( y ) f1 (10 y ) 20