逆序解法与顺序解法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
f f
k 0
sk s0
xk
0
min
Dk sk
pk
k
xk 1, 2,3
f
k
1
sk
1
当 k=1 时,(s0=9)
x1 s1
2
p1( x1) 3
4
f1 (s1) x1*
5
10
10 4
6
14
14 3
7
18
18 2
8
当 k=2 时
x2 s2
p2( x2) + f1 (s1)
2
3
4
f2 (s2) x2*
• 决策变量 xk:表示第 k 阶段派出巡逻队数 • 状态变量 sk:表示第 k 阶段派出巡逻队后,剩余的
巡逻队数 • 状态转移方程: sk-1 = sk + xk • 阶段指标 pk(xk) :表示第 k 阶段派出巡逻队xk时,
该阶段的预期损失值
7
p205 例4 巡逻队问题(续)
• 递推关系式:
种产品的原料数量;
5
(3) 决策变量: xk 表示分配给生产第 k 种产品的原料数,
允许决策集:Dk (sk ) xk 0 ≤ xk ≤ sk ;
(4) 状态转移方程: sk1 sk xk ;
(5) 阶段指标:vk (sk , dk (sk )) vk (sk , xk ) gk (xk ) ;
从本质上讲, 顺序解法和逆序解法原理(除去其方向因 素外)是相同的,在具体的求解过程中,都是将原问题转化 为一系列单个问题的求解。 但是,两种方法各有优势,前向 法求解下面例8.3时,有明显的优势。一般地,当初始状态给 定时,用逆推法比较方便;当终止状态给定时,用顺推法比 较方便。 后向法求出了各点到目标地的最短路线;而前向法 求出了起点到各目的地的最短路线。
3
8.3.1 资源分配问题
所谓资源分配问题,就是将数量一定的一种或若干 种资源(如资金、原材料、机器设备、劳动力等)恰当的 分配给若干个使用者,从而使得总的经济效益最大。
一种资源分配问题可叙述如下:设有数量为 a 的某 种资源,用于生产 n 种产品,若以数量为 xi 的资源投 入第 i 种产品的生产,其收益相应的为 gi (xi),问如何 分配这种资源,才能使得生产 n 种产品的总收入最大?
这里,fk sk 为从初始阶段出发到第 k 阶段状态 sk 止采取最
优子策略或最优策略所获得的最优指标函数值。
Vk sk , dk sk 为系统在第 k 阶段状态 sk 时采取决策 dk sk
的阶段指标。状态变量 sk 则描述该阶段结束时的系统状况。
状态转移方程: sk1 Tk sk , dk sk
2
- 35+10 31+14 45 3或4
3 38+10 35+14 31+18 48 2
4 38+14 35+18 -
52 2
当 k=3 时
x3 s3
p3( x3) + f2 (s2)
Fra Baidu bibliotek
2
3
4
f23(s3) x3*
0 24+45 22+48 21+52 69 2
结果
9
p205 例4 巡逻队问题
解(逆序解法)
11
当 k=2 时
x2
p2( x2) + f3 (s3)
s2
2
3
4
5 38+22 35+24
f2 (s2) x2* 59 3
6 38+21 35+22 31+24 55 4
7
35+21 31+22 53 4
当 k=1 时
x1 s1
p1( x1) + f2 (s2)
2
3
4
f1(s1) x1*
9 18+53 14+55 10+59 69 3或4
1
例8.3
【 例 8.3 】 图 8.3 所 示 为 一 水 利 网 络 , A 为 水 库 , 分B1,别B2,为B3不; C同1,C的2 ,C供3;水D1目, D的2 地,试找出给各供水目的地供水 的最短路线。
2
A
3
1
B1
1 3
2
B2 1
4
B3 2
C1
3
2
D1
C2 4
2
D2
C3
1
图8.3
2
8.3 动态规划应用举例 动态规划和静态规划
(6) 递推关系式:
fk (sk )
max
xk Dk (Sk
){gk
(
xk
)
fk 1(sk 1)}
fn1(sn1) 0
k n, n 1,L ,1
注:利用动态规划进行逐段计算,最后求得即为所求问题 的最大总收入。
6
p205 例4 巡逻队问题
解(顺序解法)
• 阶段变量 k:把9只巡逻队往三个部位派遣依次分成 三个阶段( k =1, 2, 3 )
• 阶段变量 k:把9只巡逻队往三个部位派遣依次分成 三个阶段( k =1, 2, 3 )
• 决策变量 xk:表示第 k 阶段派出巡逻队数 • 状态变量 sk:表示第 k 阶段初可派遣的巡逻队数 • 状态转移方程: sk+1 = sk - xk • 阶段指标 pk(xk) :表示第 k 阶段派出巡逻队xk时,
4
其静态规划的数学模型的形式一般为:
n
max f gi (xi ) i 1 n
s.t. i1 xi a xi 0, i 1, 2, , n
转化成动态规划模型为: (1) 阶段变量:k n,n 1,L ,1,这里把资源分配给一个
或者几个使用者的过程作为一个阶段。 (2) 状 态 变 量 :sk 表示分配用于生产第 k 种产品至第 n
线性规划和非线性规划所研究的问题,通常都是与时间 无关的,故又可以称为静态规划;
静态规划与动态规划在很多情况下(原则上)是可以相 互转换的 。动态规划可以看作是求 d1, d2,…, dn 使得指标函
数 v1n(d1, d2,…, dn ) 达到最优的极值问题,状态转移方程,
起始条件以及允许状态集,允许决策集等是约束条件,原则 上它可以用线性规划或非线性规划方法求解;反过来,一些 静态规划只要适当引入阶段变量、状态、决策变量等要素就 可以用动态规划方法来求解。
结果
12
回溯得,x1*=3, x2*=4 , x3*=2 或 x1*=4 , x2*=3, x3*=2 总的预期损失为69
13
类似练习如p215-8.1
【例】 某公司拥有三家连锁商店,拟将新招聘的5名员工 分配给甲、乙、丙三个商店,各商店得到新员工后,每年 盈利情况如表8-2所示。问分配给各商店各多少员工,才能 使得公司的总盈利最大?(单位:千元)
该阶段的预期损失值
10
p205 例4 巡逻队问题(续)
• 递推关系式:
fk sk f4 s4
min
xk Dk sk
pk
xk
0 k 3,2,1
fk1 sk1
当 k=3 时,(s4=0)
x3 s3
2
p3( x3) 3
4
f3 (s3) x3*
2
24
24 2
3
22
22 3
4
21
21 4