4-流水作业调度

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

流水作业调度问题（不能直接使用动态规划法的例子）流水作业调度的定义：
设有n个作业，每一个作业i均被分解为m项任务: T i1, T i2, ┅, T im(1≤i≤n，故共有n m个任务)，
要把这些任务安排到m台机器上进行加工。

如果任务的安排满足下列3个条件，
则称该安排为流水作业调度：
1. 每个作业i的第j项任务T ij (1≤i≤n, 1≤j≤m)
只能安排在机器P j上进行加工；
2. 作业i的第j项任务T ij(1≤i≤n, 2≤j≤m)的开始加工时间均安排在第j-1项任务T i,j-1加工完毕之后；
(任何一个作业的任务必须依次完成，
前一项任务完成之后才能开始着手下一项任务)
3. 任何一台机器在任何一个时刻最多只能承担
一项任务。

最优流水作业调度：
设任务T ij在机器P j上进行加工需要的时间为t ij。

如果所有的t ij (1≤i≤n, 1≤j≤m)均已给出，
要找出一种安排任务的方法，
使得完成这n个作业的加工时间为最少。

这个安排称之为最优流水作业调度。

完成n个作业的加工时间：
从安排的第一个任务开始加工,
到最后一个任务加工完毕，其间所需要的时间。

优先调度：
允许优先级较低的任务在执行过程中被中断，转而去执行优先级较高的任务。

非优先调度：
任何任务一旦开始加工，就不允许被中断，
直到该任务被完成。

流水作业调度一般均指的是非优先调度。

非优先调度可看成是特殊的优先调度：
所有任务的优先级均相同。

7 5 8
e.g. （t ij）= 2 2 6
0 7 4
注意：t ij为0表示作业i无须在机器P j上进行加工、即该道工序可以省略。

已经证明，当机器数(或称工序数)m≥3时，
流水作业调度问题是一个NP-hard问题
（e.g分布式任务调度）。

（粗糙地说，即该问题至少在目前
基本上没有可能找到多项式时间的精确最优算法。

）∴目前仅当m=2时，该问题可有多项式时间的算法。

为方便起见，记t i1为a i（作业i在P1上加工所需时间），
t i2为b i（作业i在P2上加工所需时间）。

当机器P1为空闲即未安排任何加工任务时，
则任何一个作业的第一个任务（第一道工序）
都可以立即在P1上执行，无须任何先决条件。

因此易知：
必有一个最优调度使得在P1上的加工是无间断的。

证明：设π是一个最优调度，
且π在P1上安排的加工是有间断的。

则我们可以把所有在P1上出现间断处的任务的
开始加工时间提前，使得在P1上的加工是无间断的；
而在P2上仍按π原先的安排。

把这样调整之后的调度记作为π’。

由于在调度π’下，任何一个任务在P1上加工的结束时间不晚于在调度π下的结束时间，故调度π’不会
影响在P2上进行加工的任何一个任务的开始时间。

由于调度π’在P1上的结束时间不晚于调度π，
在P2上的结束时间与调度π相同，而π又是最优调度，所以π’也是最优调度。

由此我们得到：
一定有一个最优调度使得在P1上的加工是无间断的。

另外，也一定有一个最优调度使得在P2上的
加工空闲时间（从0时刻起算）为最小，
同时还满足在P1上的加工是无间断的。

（证明留作作业）
因此，如果我们的目标是只需找出一个最优调度，我们可以考虑找：在P1上的加工是无间断的、
同时使P2的空闲时间为最小的最优调度。

（根据上述分析，这样的最优调度一定存在。

）
此外可以证明，若在P2上的加工次序与在P1上的加工次序不同，则只可能增加加工时间
（在最好情况下，增加的时间为0）。

（证明留作作业）
也就是说，在P1上的加工次序已确定的情况下，
至少有一个最优调度，其在P1上的加工次序
与在P2上的加工次序是完全相同的
（注意：这一点对m≥3不成立）。

因此，当只需找到一个最优调度时，我们
仅需要考虑在P1和P2上加工次序完全相同的调度。

以下的讨论均以此为前提。

为简化起见，我们假定所有a i≠0。

因为如果有a i=0的作业，
我们可以先对所有a i≠0的作业进行调度，
然后把所有a i=0的作业放到最前面执行即可
（可按任意次序）。

最优调度具有如下性质：
在所确定的最优调度的排列中去掉第一个执行作业后，剩下的作业排列仍然还是一个最优调度，
即该问题具有最优子结构的性质。

而且，在计算规模为n的作业集合的最优调度时，
需多次使用该作业集合的子集合的最优调度，
即该问题亦具有高度重复性。

这就引导我们考虑用动态规划法求解。

然而，正如下面将会看到的，
虽然使用动态规划法可以得到一些有用的结果，但如果不加以某种改进，完全照搬动态规划法
会使得算法的时间复杂度成为指数量级。

问题求解的思路如下。

设N={1，2，┅，n}是全部作业的集合，
作业集S是N的子集合即有S N。

在我们对S中的第一个作业开始进行加工时，
机器P2上加工的其它作业可能还尚未完成，
不能立即用来对S中的作业进行加工。

假设对机器P2需等待t个时间单位以后才可以
用于S中的作业加工（t也可以为0即无须等待），并记g(S,t)为在此情况下完成S中全部作业的最短时间，则可用下述递归表达式来表出g(S,t)：
g(S,t)=min i∈S{a i + g(S-{i},b i+max{t-a i,0})} （*）说明：当选定作业i为S中第一个加工作业之后，在机器P2上开始对S-{i}中的作业进行加工之前，所需要的等待时间为b i+max{t-a i,0}。

这是因为，若P2在开始加工S中的作业之前
需等待t个时间单位且t > a i，
则作业i在P1上加工完毕（需时a i）之后，
还要再等t-a i个时间单位才能开始在P2上加工；
若t≤a i，则作业i在P1上加工完毕之后，
立即可以在P2上加工，等待时间为0。

故P2在开始对S-{i}中的作业进行加工之前，
所需要的等待时间为b i+max{t-a i,0}。

（b i是作业i在P2上加工所需的时间）。

当S=N即全部作业开始加工时，
由于P2上尚无任何正在加工的作业，
故此时等待时间t=0。

于是有：g(N,0)=min1≤i≤n{a i+ g(N-{i},b i)}
虽然根据（*）式我们可以编写出计算g(N,0)的程序，但该算法的时间复杂度为指数量级，因为
算法中对N的每一个非空子集都要进行一次计算，而N的非空子集共有2n-1个。

因此，我们不能直接使用动态规划法来求解该问题，而需要对算法作一定的改进。

设π是作业子集S的某一个调度，
该调度首先安排作业i，其次安排作业j，
P2需等待t个时间单位以后才可以用于S中的
作业加工。

记t’= b i+max{t-a i,0}，
则由（*）式调度π的g(S,t)可写为g(S,t)=
a i+g(S-{i}, t’)=a i+a j+g(S-{i,j},
b j+max{t’-a j,0})。

由于x+ max{y1, y2,…,y n}= max{x+y1,x+y2,…,x+y n}、t’= b i+max{t-a i,0}，所以
b j+max{t’-a j,0}
= b j + max{b i+max{t-a i,0}-a j, 0}
= b j + b i - a j + max{max{t-a i,0},a j-b i}
= b j + b i - a j + max{t-a i, 0, a j-b i}
= b j+ b i - a j - a i + max{t, a i, a i+a j-b i}。

记t ij= b j+ b i - a j - a i +max{t, a i, a i+a j-b i}
（= b j+max{t’-a j,0}），
则调度π的g(S,t)=a i+a j+g(S-{i,j}, t ij)。

将调度π中的作业i与j的加工次序交换
（其它加工次序不变）所得调度记为π’，
则调度π’的最早完工时间g’(S,t)=a i+a j+g(S-{i,j}, t ji)。

比较g(S,t)与g’(S,t)两式，显然，若t ij ≤ t ji，
则有g(S,t) ≤ g’(S,t)即i在前j在后的安排用时较少；反之，若t ij>t ji，则j在前i在后的安排用时较少。

因此，需要找出能判断t ij与t ji之间大小关系的表达式。

由于t ij= b j+ b i - a j - a i +max{t, a i, a i+a j-b i}，
t ji= b j+ b i - a j - a i + max{t, a j, a i+a j-b j}，
故t ij-t ji= max{t, a i, a i+a j-b i} - max{t, a j, a i+a j-b j}，
因此我们只要比较max{t, a i, a i+a j-b i}与
max{t, a j, a i+a j-b j}的大小就可以了,
即t ij ≤ t ji当且仅当
max{t, a i, a i+a j-b i} ≤ max{t, a j, a i+a j-b j}。

由于max{t, a i, a i+a j-b i} ≤ max{t, a j, a i+a j-b j}
对任何t ≥ 0成立，当且仅当
max{a i, a i+a j-b i} ≤ max{a j, a i+a j-b j}成立，当且仅当
a i+a j+max{-a j, -
b i}≤a i+a j+max{-a i, -b j}成立，当且仅当
max{-a j, -b i} ≤ max{-a i, -b j}成立，当且仅当
min{a j, b i} ≥ min{a i, b j}成立
（此式称为Johnson不等式）。

当min{ a i , a j , b i , b j}为a i或者b j时，
即Johnson不等式成立时，有t ij ≤ t ji，
此时把i排在前j排在后的调度用时较少；
反之，若min{ a i , a j , b i , b j}为a j或者b i时，
则j排在前i排在后的调度用时较少。

将此情况推广到一般。

当min{ a1, a2,┅, a n , b1, b2,┅, b n }=a k时，
则对任何i≠k，都有min{a i, b k} ≥ min{a k, b i}成立，故此时应将作业k安排在最前面，
作为最优调度的第一个执行的作业；
当min{ a1, a2,┅, a n , b1, b2,┅, b n }= b k时，
则对任何i≠k，也都有min{a k, b i}≥min{a i, b k}成立，故此时应将作业k安排在最后面，
作为最优调度的最后一个执行的作业。

n个作业中首先开工（或最后开工）的作业确定之后，对剩下的n-1个作业采用相同方法可再确定
其中的一个作业,
作为n-1个作业中最先或最后执行的作业；
反复使用这个方法直到最后只剩一个作业为止，
最优调度就确定了。

e.g. n=4, (a1, a2, a3, a4)=(5,12,4,8),
(b1, b2, b3, b4)=(6,2,14,7)。

(a1, a2, a3, a4)与(b1, b2, b3, b4)合起来排序的结果
为(2,4,5,6,7,8,12,14)=(b2,a3,a1,b1,b4,a4,a2, b3)。

最小数是b2，故作业2应安排为最后一个作业：
π(4)←2。

次小数是a3，故作业3应安排为第一个作业：π(1)←3。

第3小数是a1，故作业1安排为第二个作业：π(2)←1。

第4小数是b1，因作业1已安排过，故转看下一个数。

第5小数是b4，故作业4应安排为倒数第二个作业：π(3)←4。

至此，所有作业均已安排完毕。

根据上述，很容易给出本例的调度图解。

求解该问题的算法如下。

1. 建立长为2n的数组C，
将a1, a2,┅, a n依次放入C[1]~ C[n]中，
b1, b2,┅, b n依次放入C[n+1]~ C[2n]中。

/* O(n), 下面将对这2n个数进行排序*/ 2. 对长为2n的数组D进行初始化：
D[1]~D[n]中依次放1,2,┅,n，
D[n+1]~D[2n]中依次放-1,-2,┅,-n。

/* O(n), */ /*分别对应于a1, a2,┅, a n和b1, b2,┅, b n的下标*/ 3. 对数组C进行排序，
D[k]始终保持与C[k]的对应关系。

（若C[i]与C[j]对换，则D[i]也与D[j]对换。

或将C，D放在同一结构体中。

）
当a1, a2,┅, a n及b1, b2,┅, b n按从小到大排好序之后，D[1]~ D[2n]也就按从小到大的次序记录了这些a i和b j 的下标即作业号（b j的下标前有一负号以区别于a i））。

/*O(n log n)*/
4. 将E[1]~ E[n]全部置为“No”。

/* O(n)，表示所有任务均尚未被安排*/ 5. 下标变量初始化：i←1；j←n；k←1；/*O(1)，*/
/*i指向当前最左空位F[i]，*/
/*放当前应最先安排的作业号;*/
/* j指向当前最右空位F[j]，*/
/*放当前应最后安排的作业号;*/ /* k从1开始逐次增1，D[k]（或-D[k]）*/ /*按a i和b j从小到大的次序依次给出作业号。

*/ 6. while i j do
{ /* 作业尚未安排完毕，i从小到大, j从大到小*/ if D[k]>0 then/*D[k]>0即D[k]中放的是a i下标*/ {if E[D[k]]为“No”then /*作业D[k]尚未安排*/ {F[i]←D[k]; i增1; E[D[k]] 置为“Yes”}
/*作业D[k]放在当前最左空位*/ } else/*D[k]<0，则–D[k]是b j下标*/
{if E[–D[k]]为“No”then /*作业–D[k]尚未安排*/ {F[j]←–D[k]; j减1; E[–D[k]] 置为“Yes”} } /*作业–D[k]放在当前最右空位*/
k增1; /*准备检查下一个D[k]以便后续作业安排*/ } /*注意while循环每轮执行只需要O(1)时间*/ 算法分析：
第1，2，4句的初始化均只需要O(n)时间，
第3句的排序需要O(n log n)时间，
第5句的下标变量初始化只需要O(1)时间，
第6句的循环，关键是“if D[k]>0”的执行次数。

由于D[1]~ D[2n]中放的是1,2,┅,n, -1,-2,┅,-n
共2n个数（注意C数组排序后次序已经打乱），
且循环每执行一次k均增1，故或早或迟
D数组中任一m或-m（m=1,2,┅,n）至少有一个
会被“if D[k]>0”语句检查过。

若m先遇到，则使得i增1；
若-m先遇到，则使得j减1，
执行到第2n-1次时，每一对数至少有一个检查过，即对m=1,2,┅,n，i增1、j减1必执行其一，
故最多执行2n-1次，必然出现i > j，
使得循环中止，故while执行时间是O(n)。

∴算法的时间复杂度为O(n log n)。

小结：
满足1）高度重复性2）最优子结构性质时，一般采用动态规划法，但偶尔也可能得不到高效的算法。

若问题本身不是NP-hard问题，
那么进一步分析后就有可能获得效率较高的算法。

若问题本身就是NP-hard问题，
那么与其它的精确算法相比，
动态规划法性能一般不算太坏，
但有时也需要对动态规划法作进一步的加工。

e.g. 0-1背包问题。