5.3确定性的定期多阶段决策问题

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

经过的点集合。在状态(vi ,V)的决策集合中，取决策
vj∈V ，获得的效益是vi到vj的距离，转入下一个状态 (vj ,V \{vj}) ，现在用最优化原理来找递推公式。
旅行售货员问题
用fk(vi ,V) 表示从点vi出发，经过V中的点各一次，
最后回到点v0的最短路程，V是一个顶点集合，
|V|=k, dij是vi到vj的弧长，则
返v1的最短路线和最短路径。
解答
例5.3.1解答
解：可以用一个矩阵表示 vi 到 vj 的距离。
f3 (v1,v2 , v3 , v4) 表示从 v1 出发，经过 v2, v3, v4 各一次又回到 v1 的最短路程。则：
f3 (v1,v2 , v3 , v4) min d12 f2 (v2 ,v3 , v4), d13 f2 (v3 ,v2 , v4), d14 f2 (v4 ,v2 , v3)
第三节确定性的定期多阶段决策问题
• 旅行售货员问题
• 百度文库阶段资源分配
• 可靠性问题
1. 旅行售货员问题
旅行售货员问题是图论中一个著名问题，就是在网络 N上找一条从v0点出发，经过v1v2 …vn各一次最后返回v0的最短路线和最短路程。现把它看成一个多阶段
决策问题。从v0出发，经过n个阶段，每个阶段的决策是选择下一个点。如果用所在的位置来表示状态，那么状态与阶段数就不能完全决定决策集合了，因为走过的点不需要再走，所以决策集合与以前选的决策有关。用(vi ,V) 表示状态，vi是所处的点，V是还没有
加法和比较运算的次数都是 n 的指数函数，而不是多项式函数算法．但还是比穷举法要好．
多阶段资源分配问题
下面讨论有限资源分配问题，它的递推公式是：
f k ( x) max{g ( y ) h( x y ) f k 1 (ay b( x y ))}, k 2 0 y x f1 ( x) max{g ( y ) h( x y )} 0 y x
i 1
n
这个问题的非线形规划形式为
n max p pi ( zi ) i 1 n s.t. ci zi c i 1 zi 0, 整数, i 1,2,, n
这类问题也可以用最优化原理找它的递推公式。
用 fk(x) 表示有 k 个部件总费用不超过 x 的最优
f3(x) = max{max{-2cx+x2 + (b2+1)a2x2-c(b+1)ax,
-cx+x2+ (b2+1)b2x2-c(b+1)bx} = max{max{-c[(1+b)a+2]x+[(b2+1)a2+1]x2, -c[(1+b)b+1]x+[(b2+1)b2+1]x2} = (b4+b2+1)x2 –c(b2+b+1)x
f ( v , V ) min{ d f ( v , V \{ v })}, k 1, 2, , n k i ij k 1 j j v j V f0 (vi , ) di 0
旅行售货员问题-例题
例5.3.1 对图5.3.1求从v1出发经过v2, v3, v4, 又返又
f2 ( x) max g ( y) h( x y) f1 (ay b( x y)) max h( x) f1 (bx), g ( x) f1(ax)
0 y x
f 2 ( x) 也是 x 的凸函数，用归纳法可得：
fn (x) maxh(x) fn1(bx), g(x) fn1(ax)
同样 f2 (v2 ,v3 , v4) min d23 f1(v3 ,v4), d24 f1(v4 ,v3) ，现在从最后一个阶段解起：
f0 (v2 , ) d21 6 f0 (v3 , ) d31 7 f0 (v4 , ) d41 9
用动态规划方法找旅行售货员问题的算法复杂性
一般情况下， g(y)， h(y)是很复杂的函数时，这个问题的解不容易找。当 g(y)，h(y)为凸函数，且 g(0)=h(0)=0 时，可以证明在每个阶段上 y 的最优决策总是取其端点的值。
多阶段资源分配问题续
引理 5.3.1 设 g ( x), g ( y) 是凸函数，则对任何固定的 x， F ( y) g ( y) h( x y) 是 y 的凸函数。引理 5.3.2 设 F1 ( x), F2 ( x) 是 x 的凸函数，则
证明
定理5.3.1证明
证明：因为， f1 ( x) max g ( y) h( x y) .
0 y x
由引理 5.3.1 知对固定的 x 为凸函数，其极大值一定在 y=0 或 y=x 点上达到，所以， f1 ( x) max g( x) h( x y), g(0) h( x 0) max g(x), h( x) 由引理 5.3.2 可知， f1 ( x) 是 x 的凸函数，易证 f1 (ay b( x y)) 也是 y 的凸函数，所以
F ( x) max F1 ( x) F2 ( x)
也是 x 的凸函数。
多阶段资源分配问题续
定理 5.3.1 设 g(y)， h(y)是凸函数，且 h(0)=g(0)=0，则 n 阶段资源分配问题的最优策略 y 在每个阶段总取 0yx 的端点的值，并且
f k ( x) max{h( x) f k 1 (bx), g ( x) f k 1 (ax)} f1 ( x) max{h( x), g ( x)}
多阶段资源分配问题-例题
例 5.3.2 在有限资源分配问题中，
g ( x) 2cx x , h( x) cx x
2 2
(0 x c), 0 a, b 1 而且 0 b a 1 b 。
求 f k ( x)
解答
例5.3.2 解答
解：显然，和都是凸函数．
可靠性问题
某种机器的工作系统由n个部件组成，如图，这些部件是串联关系，一个部件失灵，整个系统就不能工作．部件1 → 部件2 → …→ 部件n
假设部件i (i=1,2, …,n)上装有zi个备用元件，它正常
工作的概率为pi(zi), 于是系统正常工作的概率为
p pi ( zi )
假设部件 i 上装一个备用元件的费用为ci ，要求总费用不得超过 c, 求使 p 达到最大的 zi 的选取方法
f1(x) = max{max{-2cx+x2, -cx+x2}= -cx+x2 f2(x) = max{max{-2cx+x2-cax+a2x2, -cx+x2-cbx+b2x2}
= max{(a2+1)x2–c(a+2)x, (b2+1)x2–c(b+1)x} = (b2+1)x2–c(b+1)x
可靠性，则
f k ( x) max pk ( zk ) f k 1 ( x ck zk ) k 2,3,, n x 0 z k ck f ( x) p ( x ) 1 1 ck