5.3确定性的定期多阶段决策问题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
经过的点集合。在状态(vi ,V)的决策集合中,取决策
vj∈V ,获得的效益是vi到vj的距离,转入下一个状态 (vj ,V \{vj}) ,现在用最优化原理来找递推公式。
旅行售货员问题
用fk(vi ,V) 表示从点vi出发,经过V中的点各一次,
最后回到点v0的最短路程,V是一个顶点集合,
|V|=k, dij是vi到vj的弧长,则
返v1的最短路线和最短路径。
解答
例5.3.1解答
解:可以用一个矩阵表示 vi 到 vj 的距离。
f3 (v1,v2 , v3 , v4) 表示从 v1 出发,经过 v2, v3, v4 各一次又回到 v1 的最短路程。则:
f3 (v1,v2 , v3 , v4) min d12 f2 (v2 ,v3 , v4), d13 f2 (v3 ,v2 , v4), d14 f2 (v4 ,v2 , v3)
第三节 确定性的定期多阶段决策问题
• 旅行售货员问题
• 百度文库阶段资源分配
• 可靠性问题
1. 旅行售货员问题
旅行售货员问题是图论中一个著名问题,就是在网络 N上找一条从v0点出发,经过v1v2 …vn各一次最后返 回v0的最短路线和最短路程。现把它看成一个多阶段
决策问题。从v0出发,经过n个阶段,每个阶段的决 策是选择下一个点。如果用所在的位置来表示状态, 那么状态与阶段数就不能完全决定决策集合了,因为 走过的点不需要再走,所以决策集合与以前选的决策 有关。用(vi ,V) 表示状态,vi是所处的点,V是还没有
加法和比较运算的次数都是 n 的指数函数,而不 是多项式函数算法.但还是比穷举法要好.
多阶段资源分配问题
下面讨论有限资源分配问题,它的递推公式是:
f k ( x) max{g ( y ) h( x y ) f k 1 (ay b( x y ))}, k 2 0 y x f1 ( x) max{g ( y ) h( x y )} 0 y x
i 1
n
这个问题的非线形规划形式为
n max p pi ( zi ) i 1 n s.t. ci zi c i 1 zi 0, 整数, i 1,2,, n
这类问题也可以用最优化原理找它的递推公式。
用 fk(x) 表示有 k 个部件总费用不超过 x 的最优
f3(x) = max{max{-2cx+x2 + (b2+1)a2x2-c(b+1)ax,
-cx+x2+ (b2+1)b2x2-c(b+1)bx} = max{max{-c[(1+b)a+2]x+[(b2+1)a2+1]x2, -c[(1+b)b+1]x+[(b2+1)b2+1]x2} = (b4+b2+1)x2 –c(b2+b+1)x
f ( v , V ) min{ d f ( v , V \{ v })}, k 1, 2, , n k i ij k 1 j j v j V f0 (vi , ) di 0
旅行售货员问题-例题
例5.3.1 对图5.3.1求从v1出发经过v2, v3, v4, 又返又
f2 ( x) max g ( y) h( x y) f1 (ay b( x y)) max h( x) f1 (bx), g ( x) f1(ax)
0 y x
f 2 ( x) 也是 x 的凸函数,用归纳法可得:
fn (x) maxh(x) fn1(bx), g(x) fn1(ax)
同样 f2 (v2 ,v3 , v4) min d23 f1(v3 ,v4), d24 f1(v4 ,v3) , 现在从最后一个阶段解起:
f0 (v2 , ) d21 6 f0 (v3 , ) d31 7 f0 (v4 , ) d41 9
用动态规划方法找旅行售货员问题的 算法复杂性
一般情况下, g(y), h(y)是很复杂的函数时, 这个问题的解不容易找。 当 g(y),h(y)为凸函数,且 g(0)=h(0)=0 时,可以证明在每个阶段 上 y 的最优决策总是取其端点的值。
多阶段资源分配问题续
引理 5.3.1 设 g ( x), g ( y) 是凸函数, 则对任何固定 的 x, F ( y) g ( y) h( x y) 是 y 的凸函数。 引理 5.3.2 设 F1 ( x), F2 ( x) 是 x 的凸函数,则
证明
定理5.3.1证明
证明:因为, f1 ( x) max g ( y) h( x y) .
0 y x
由引理 5.3.1 知对固定的 x 为凸函数,其极大值一定在 y=0 或 y=x 点上达到, 所以, f1 ( x) max g( x) h( x y), g(0) h( x 0) max g(x), h( x) 由引理 5.3.2 可知, f1 ( x) 是 x 的凸函数,易证 f1 (ay b( x y)) 也是 y 的凸函 数,所以
F ( x) max F1 ( x) F2 ( x)
也是 x 的凸函数。
多阶段资源分配问题续
定理 5.3.1 设 g(y), h(y)是凸函数, 且 h(0)=g(0)=0, 则 n 阶段资源分配问题的最优策略 y 在每个阶 段总取 0yx 的端点的值,并且
f k ( x) max{h( x) f k 1 (bx), g ( x) f k 1 (ax)} f1 ( x) max{h( x), g ( x)}
多阶段资源分配问题-例题
例 5.3.2 在有限资源分配问题中,
g ( x) 2cx x , h( x) cx x
2 2
(0 x c), 0 a, b 1 而且 0 b a 1 b 。
求 f k ( x)
解答
例5.3.2 解答
解:显然,和都是凸函数.
可靠性问题
某种机器的工作系统由n个部件组成,如图,这些部件 是串联关系,一个部件失灵,整个系统就不能工作. 部件1 → 部件2 → …→ 部件n
假设部件i (i=1,2, …,n)上装有zi个备用元件,它正常
工作的概率为pi(zi), 于是系统正常工作的概率为
p pi ( zi )
假设部件 i 上装一个备用元件的费用为ci ,要求总费用 不得超过 c, 求使 p 达到最大的 zi 的选取方法
f1(x) = max{max{-2cx+x2, -cx+x2}= -cx+x2 f2(x) = max{max{-2cx+x2-cax+a2x2, -cx+x2-cbx+b2x2}
= max{(a2+1)x2–c(a+2)x, (b2+1)x2–c(b+1)x} = (b2+1)x2–c(b+1)x
可靠性,则
f k ( x) max pk ( zk ) f k 1 ( x ck zk ) k 2,3,, n x 0 z k ck f ( x) p ( x ) 1 1 ck
相关文档
最新文档