带准备时间和截止期约束的云服务工作流调度算法
分阶段的云计算工作流系统的优化调度算法
分阶段的云计算工作流系统的优化调度算法梁丽勤; 王岩【期刊名称】《《计算机工程与设计》》【年(卷),期】2019(040)012【总页数】9页(P3505-3513)【关键词】云计算; 工作流; 调度策略; 粒子群优化算法; 负载【作者】梁丽勤; 王岩【作者单位】东北大学秦皇岛分校实验教育中心河北秦皇岛066004; 东北大学计算机科学与工程学院辽宁沈阳110169; 东北大学秦皇岛分校计算中心河北秦皇岛066004【正文语种】中文【中图分类】TP393.020 引言科学工作流是一种新的协调分布式、异构的软件和服务,可以提高科学实验阶段的自动化水平。
云计算以其独特的海量数据存储功能,提供给科学工作流一种新的工作方式,更新了科学研究、企业发展中的资源部署、数据执行中的研究内容和发展方向。
由于云计算中数据中心的异构性,多数据中心环境中具有不同数量、类型和价格的资源,并且要处理的任务量大且分散,所以任务在不同数据中心的迁移会产生大量的能量消耗。
本文研究了单数据中心工作流,即多数据中心工作流的前期工作。
随着云计算的不断发展,如何在保持进而提高服务质量QoS(quality of service)的前提下,压缩服务运行时的成本,使收益最大化是云计算应用亟需解决的问题。
因此,本文将云计算与工作流结合,考虑针对实例密集型应用,利用工作流在资源调度方面的优势,解决云计算应用所面临的如何进行资源优化调度、提高服务质量等问题。
1 研究现状随着云计算技术研究的不断深入与发展,网格工作流的分布式工作流系统逐步发展为应用于云计算环境中的工作流系统。
虽然业务工作流和网格工作流已经广泛应用于实际,但对于云计算这个特殊的环境,工作流系统要综合考虑工作流和云计算二者的特点,以更好提高系统的效率。
现阶段,工作流系统主要分为工业工作流、网格工作流和云工作流3种,各工作流对比见表1。
例如:采用DAG模型的工作流,可克服网格工作流在资源和作业调度管理方面存在的不足。
多云环境下带截止日期约束的科学工作流调度策略
多云环境下带截止日期约束的科学工作流调度策略林兵;郭文忠;陈国龙【摘要】In view of the deadline-constrained scientific workflow scheduling on multi-cloud,an adaptive discrete particle swarm optimization with genetic algorithm (ADPSOGA) was proposed,which aimed to minimize the execution cost of workflow while meeting its deadline constrains.Firstly,the data transfer cost,the shutdown and boot time of virtual machines,and the bandwidth fluctuations among different cloud providers were considered by this method.Secondly,in order to avoid the premature convergence of traditional particle swarm optimization (PSO),the randomly two-point crossover operator and randomly one-point mutation operator of the genetic algorithm (GA) was introduced.It could effectively improve the diversity of the population in the process of evolution.Finally,a cost-driven strategy for the deadline-constrained workflow was designed.It both considered the data transfer cost and the computing cost.Experimental resuits show that the ADPSOGA has better performance in terms of deadline and cost reducing in the fluctuant environment.%针对多云环境下带截止日期约束的科学工作流调度问题,提出一种基于遗传算法操作的自适应离散粒子群优化算法(ADPSOGA),目的是在尽可能满足工作流截止日期前提下,减少其执行代价.该方法考虑多云之间的通信代价、虚拟机的启动和关闭时间以及多云之间不同的带宽通信波动;为了避免传统粒子群优化算法(PSO,particle swarm optimization)存在的过早收敛问题,引入遗传算法的随机两点交叉操作和随机单点变异操作,有效提高种群进化过程中的多样性;在充分考虑数据通信代价和任务计算代价的情况下,设计一种基于工作流截止日期约束的代价驱动调度策略.实验结果表明,ADPSOGA在波动因素存在情况下,对工作流截止日期满足和执行代价控制方面具有良好的性能表现.【期刊名称】《通信学报》【年(卷),期】2018(039)001【总页数】14页(P56-69)【关键词】云计算;截止日期约束;工作流调度;波动性【作者】林兵;郭文忠;陈国龙【作者单位】福建师范大学物理与能源学院,福建福州350117;福建省网络计算与智能信息处理重点实验室(福州大学),福建福州350116;空间数据挖掘与信息共享教育部重点实验室,福建福州350003;福建省网络计算与智能信息处理重点实验室(福州大学),福建福州350116;空间数据挖掘与信息共享教育部重点实验室,福建福州350003;福州大学数学与计算机科学学院,福建福州350116;福建省网络计算与智能信息处理重点实验室(福州大学),福建福州350116;空间数据挖掘与信息共享教育部重点实验室,福建福州350003【正文语种】中文【中图分类】TP338随着云计算技术[1]的不断发展,当前云市场上出现多个云服务提供商共存的“多云”局面[2]。
满足双QoS约束的两阶段云工作流调度算法
满足双QoS约束的两阶段云工作流调度算法武丽芬;严学勇【摘要】为提高多QoS约束下的工作流调度成功率,提出满足截止时间和预算双QoS约束的调度算法DBWS.为寻找调度可行解,将工作流调度划分为两个阶段:任务选择和资源选择.任务选择阶段中,利用任务在工作流结构中的自顶向下分级值为任务分配优先级,得到调度初始排序;资源选择阶段中,将截止时间根据任务深度进行子划分,设计时间质量和代价质量两个均衡因素,通过综合考虑两种因素计算资源质量,获得任务执行的最优资源.实验结果表明,该算法在调度成功率与同步满足两种QoS约束上较同类算法更优.【期刊名称】《计算机工程与设计》【年(卷),期】2018(039)007【总页数】7页(P1904-1910)【关键词】云计算;工作流调度;多QoS约束;任务分级;资源选择【作者】武丽芬;严学勇【作者单位】晋中学院信息技术与工程系,山西晋中030600;中国联通晋中分公司信息支撑中心,山西晋中030600【正文语种】中文【中图分类】TP3930 引言云计算环境中,资源可根据应用需求动态地分配至用户任务,而用户对资源的支付方式是即付即用的,这极大地区别于传统的网格等分布式计算环境。
这种特有的使用特征使得云计算提供了对科学工作流调度的最好支持。
每一种大规模的工作流应用均可建模为有向无循环图DAG结构,其中包含大量相互依赖和相互独立的任务,有些可同步执行,有些则需按照先后次序执行。
为了满足用户应用的QoS需求,云工作流调度需要寻找有效的调度方案,实现任务与多资源间的映射与执行。
目前,云资源的使用特征导致已有调度算法拥有以下不足:①资源使用时间固定。
本文中资源只要在空闲状态即可释放,资源获取是任意的,这样可节省资源使用代价;②资源定价未使用账单模型。
本文应用Amazon EC2的资源账单定价模型,在已付账单中,先前任务的空闲时间片可被下一任务继续利用,以节省代价;③涉及多QoS参数时,已有搜索或元启发式算法复杂度过高。
一种云计算环境下的工作流双向调度方法
时,数据传输时间忽略不计。用 TT(vi,vj)来 表示任务 vi 和任务 vj 之间的传输时间,用 D 表示工作流 W 的截止时间 deadline。
与双向调度算法有关的定义如下。
定义 1.工作流最迟结束时间 LFT(latest
finish time ): LFT(vexit)=D , LFT(vc)= min
$4.3
3
High-CPU types
Medium(C_M) Extra Large(C_EL)
由表 1 可知,云供应商所提供的虚拟机
有多种类型。云供应商所提供的虚拟机按小
时进行收费,不同类型的虚拟机收费标准也
不相同,不同云供应商收费也不同。表 1 中
分 Normal type 、 High-memory type 、
表 2 图 1 中任务的执行时间以及执行成本
v1
v2
v3
v4
v5
v6
v7
Time(m) Cost($) Time(m) Cost($) Time(m) Cost($) Time(m) Cost($) Time(m) Cost($) Time(m) Cost($) Time(m) Cost($)
138 0.14 86 0.09 91 0.09 208 0.21 61 0.06 135 0.14 171 0.17 69 0.17 43 0.11 45 0.11 104 0.26 30 0.08 61 0.15 85 0.21 34 0.20 21 0.13 22 0.14 52 0.31 15 0.09 30 0.18 42 0.25 17 0.26 10 0.15 11 0.16 26 0.39 7 0.11 15 0.23 21 0.32 21 0.28 13 0.17 14 0.18 32 0.43 9 0.12 18 0.24 26 0.35 10 0.32 6 0.19 7 0.22 16 0.51 4 0.13 9 0.29 13 0.41 5 0.36 3 0.22 4 0.25 8 0.57 2 0.14 4 0.29 6 0.43 27 0.07 21 0.05 17 0.04 83 0.20 14 0.03 135 0.33 42 0.10 6 0.09 5 0.07 5 0.06 20 0.29 3 0.04 32 0.46 10 0.15
云环境下科学工作流的调度算法
云环境下科学工作流的调度算法FENG Fu-Jian【摘要】提出一种云环境下科学工作流的调度算法.针对已有的调度算法和松弛时间资源分配策略均未考虑\"或\"控制结构的不足,给出了关键活动优先级(Critical Activity Priority,CAP)的概念;定义了活动的服务效益比(Service Benefit Ratio,SBR);提出了活动松弛时间分配策略;并从流程定义和实例运行两个层次,给出了活动截止期限的分配算法.该项研究成果为解决科学工作流调度过程中的时间-成本优化问题提供了更合适的解决方案.【期刊名称】《计算机系统应用》【年(卷),期】2019(028)007【总页数】6页(P127-132)【关键词】科学工作流;调度;云;服务效益比【作者】FENG Fu-Jian【作者单位】【正文语种】中文近年来随着科学研究越来越依赖于海量数据集的分析和分布式资源的使用,科学工作流[1-3]得到了巨大的发展.通过管理分析的复杂性、在分布式资源上执行必要的计算、收集分析结果的信息以及记录和再现科学分析等手段,科学工作流管理系统提供了一个辅助科学发现过程的环境,加速了科学进步的步伐.商业云因其高弹性、专用软硬件基础设施和按需付费的成本模型等特性[4-6],已经成为进行大规模科学分析的支撑平台.通过各种云服务,可以促进工作流的执行.其执行过程中,需要考虑一个或多个QoS 约束,常见的为时间-成本优化.工作流调度的时间-成本优化是一个难题,国内外学者已从不同方面展开了研究并取得了丰富的成果[7-15].一些综述文章[16-18]对其进行了较完整的阐述,这里就不再一一回顾.为了简洁起见,仅描述本文解决的问题.现有的科学工作流调度算法多基于有向无环图(Directed Acyclic Graph,DAG)建模,仅对工作流结构中的顺序和“与”结构适用,并不支持“或”结构.这限制了算法的使用范围和性能.文献[12]提出,可以将“或”结构转换成“与”结构进行处理.这是不合理的,违背了工作流语义.对于“或”结构中的支路每个流程实例只会选择其中一条,而“与”结构的所有支路都是同时执行的,两者是不可以直接转换的.正因为未考虑“或”结构,现有的算法存在以下不足:(1) 同一层活动分配相同的截止期限不合理逆向分层调度算法[12](Deadline Bottom Level,DBL)以及基于此而改进的算法中,认为同一层的所有活动具有相同的截止期限.图1为一个简单的基于逆向分层的工作流实例,图中活动节点的上方数字表示选择最快执行服务所需要消耗的时间.活动1 完成后,根据输出条件选择执行支路{2,3,4}或者支路{5}.依据DBL 算法求得每个活动的时间区间如表1.活动5 的时间区间为[4,27],所以可选服务的耗时范围为[7,23],假定其执行最慢的服务耗时23 个单位时间.基于满足截止期限的前提下选择最低成本的原则,工作流在实例执行过程中若选择支路{5}将会调用执行时间最长的服务,因此将消耗掉额外16 个单位的时间.由此带来两个问题:图1 一个简单的工作流实例表1 DBL 活动时间区间活动编号开始时间结束时间(截止期限)1 0 4 2 4 10 3 10 19 4 19 27 5 4 27 6 27 32① 活动5 本可以在时间点11 时刻即可结束,则活动6 将提前16 个单位时间开始,在不改变后续活动既定调度方案的情况下,将使得整个工作流提前16 个单位时间结束;② 将额外消耗的16 个单位时间分配给后续未开始的活动,从而获得更优的执行方案.当这两种情况下带来的效益远远大于单个活动5 优化带来的效益时,DBL 对截止期限的分配存在弊端.(2) 松弛时间优化未同时考虑活动控制结构和服务效益当给定的工作流截止期限大于算法计算得出的截止期限时,工作流存在松弛时间.为了提高效益,需要将这部分时间资源合理地分配给能够带来费用优化的活动.表2为图1工作流实例中部分活动对应的候选服务列表.表2 候选服务列表活动编号服务时间服务成本1 4 6 2 6 10 3 9 7 4 8 8 5 7 10 5 9 8 6 5 12 6 7 11假设现有2 个单位的工作流松弛时间,由于只有活动{5,6}有多个候选的服务,因此只需要对这两个活动进行优化.根据文献[13]提出的宽裕时间有效分配算法(Slack-time Effective Allocation,SEA),活动5,6 的邻服务级差性价比分别为1 和0.5,因此将松弛时间全部分配给活动5.基于“或”结构的特性,若工作流实际执行过程中选择活动5 所在的支路是小概率事件,此时分配的松弛时间将不会带来费用优化,从而导致时间资源的浪费.(3) 其它问题文献12 中定理2 认为BLmin ≥LCT ,其中:BLmin 是按照逆向分组后求得的工作流最小完工时间,LCT 为最小关键路径法计算的完工时间.该定理不成立,因为BLmin 和 LCT均根据每个活动的最快服务求得,若BLmin >LCT表示同一工作流在活动执行者相同的条件下通过两种不同方法得到不同的完工时间,这是不合理的.为了解决以上的不足,本文提出一种新的调度算法,充分考虑工作流控制结构中的顺序、“与”和“或”结构,并分别从静态调度和动态监控两个阶段对截止期限的分配进行讨论.1 模型和相关概念1.1 工作流模型定义1.工作流的DAG 模型是一个二元组〈 N,E〉,其中:N={1,2,3,4,···,n|n ∈N∗}表示所有的活动集;是活动之间的逻辑关系.为了讨论方便,下面给出一些变量的定义及其数学表达式:(1) S (i):活动i 的候选服务集合,其大小为L (i).(2) S (i)j :活动i 的第 j 个候选服务.(3) T (i)j:S (i)j 所需的处理时间和数据传输时间之和.(4) C (i)j:S (i)j 对应的服务费用和数据传输成本之和.(5) D (i):活动i 的截止期限.(6) TS(i) :活动i 的松弛时间,当选定S (i)j后有:D(i)=T(i)j+TS(i).(7) pred(i)/succ(i):活动i 的前驱/后继.为了排除网络等其它客观环境的影响,假设云服务供应商能够提供无限数量的实例访问,且不同存储服务之间的带宽基本相同.1.2 关键活动优先级为了叙述方便,下面给出一些符号的语义:(1) CP:工作流的最长执行路径,即关键路径.(2) CP(i) :活动i 是关键活动.(3) CPs(i)/CPand(i)/CPor(i):关键活动.i.处于顺序支路/“与”支路/“或”支路,同步活动为关键活动,且在顺序支路上.定义2.关键活动优先级(Critical Activity Priority,CAP),反应活动时间-成本优化对整个流程性能提升的影响程度.优先级越高,表示活动的优化带来的影响越大,反之越小.关键活动按照其所处控制结构的不同,相应的优先级不同.下面分别对3 种拓扑结构进行阐述.(1) “与”支路“与”控制结构中的每条支路需要在同步活动处等待,当关键活动获得额外的时间资源后,将延长所在支路的执行时间,进而影响整个控制块中每条支路的运行.因此,“与”支路上单个关键活动的优化将会提升整个“与”控制结构的性能. (2) 顺序支路顺序支路上的关键活动,对其分配额外的时间资源只会优化该活动本身,并不会波及其它活动.(3) “或”支路由于“或”结构在实例运行之前无法确定选择哪条支路,因此,对“或”支路上的关键活动分配额外的时间资源有可能无法带来效益.综上所述,可以得到关键活动的优先级为:CAP(CPand(i))>CAP(CPs(i))>CAP(CPor(i)).2 调度算法本文按照如下步骤解决调度问题:步骤1 寻找工作流的最小关键路径.步骤2 查询可用时隙,根据每个任务的局部最优解生成最优调度计划.步骤3 实时监控流程实例的运行状态.接下来详细陈述步骤2-3,关键路径的寻找通过文献[19]提出的方法实现.2.1 松弛时间分配策略定义3.服务效益比(Service Benefit Ratio,SBR),衡量服务替换所带来效益的大小,其计算公式为:式(1)中的 m、n分别表示第 m、n个候选服务.对优先级相同的活动集合 A,基于服务效益比的松弛时间分配算法(Slack Time Allocation Based on SBR,STABSBR)如下:算法1.STABSBR 算法输入:A ,∀i∈A 具有相同的活动优先级;松弛时间TS;输出:{TS(i)};Begin 1 计算 A 中每个活动i 的下一个候选服务(S (i)按照成本降序排列)与当前选择服务的Δ C(i)m,n,Δ T(i)m,n,SBR(i)m,n;2 while(A ≠∅)3 {4从 A 中去除所有Δ T(i)m,n>TS 的活动,并按照SBR(i)m,n降序、ΔT(i)m,n 升序排列得到B ;5 if (B≠∅)6 {7 TS(B(0))=ΔT(B(0)),TS=TS-TS(B(0));8 将活动 B (0)移出A;9 }10 }End该算法能够将全局额外的时间资源合理的在活动之间进行分配,从而产生最优的调度方案.假设现有顺序串联的两个活动1 和2,其候选服务集分别为S(1)={(T,C)}={(5,9),(8,8)},S(2)={(T,C)}={(6,10),(8,8)},且根据工作流执行时间下界求得其松弛时间为TS(WF)=3.从前面的分析可以知道,因此,给活动2 分配两个单位的松弛时间,即选择第2 个候选服务作为执行服务.剩余的1 个单位时间资源由于无法提供给活动1 以满足其最低的时间增量,将不再继续优化.2.2 静态调度静态调度需要考虑活动的拓扑结构,由关键活动优先级可知对于顺序和“或”结构松弛时间的再分配只影响单个活动,而“与”结构会影响到整个控制块.因此,需要对“与”结构进行单独说明.图2 “与”控制结构以图2所示的“与”控制结构为例,branch(1),branch(2)...branch(i)分别表示每条支路,假设branch(i)是子关键路径.现根据松弛时间分配策略为某个关键活动m 分配了ΔT的松弛时间,则可求得“与”控制块新的截止期限为(D(branch(i))+ΔT),因此其他非关键路径支路获得的松弛时间为(D(branch(i))+ΔT-D(branch(n))),1 ≤n ≤i-1.此时,可在每条支路内部按照松弛时间分配策略再对调度进行调整.考虑工作流控制结构的静态调度算法(Static Scheduling Considering Workflow Control Structure,SSCWCS)如下:算法2.SSCWCS 算法输入:〈 N,E〉,D (WF);输出:D (i);Begin 1 为每个活动选择执行最快的服务,以此求得工作流的关键路径CP,并计算其执行时间下界D (CP)min;2 if (D (WF)<D(CP)min )3 {4 提醒管理者需要修改 D (WF);5 }6 else if(D (WF)>D(CP)min)7 {8 计算工作流的松弛时间TS=D(WF)-D(CP)min;9 将关键活动按照拓扑结构分类,分别求得;for(i=0;i<4;i++)B=[{CPand(i)},{CPs(i)},{CPor(i)},{N-({CPand(i)}∪{CPs(i)}∪{CPor(i)})}]10 11 {12 将分别代入算法1 进行优化;13 }B(0)≠∅A=B(i),TS 14 if ()15 {16 计算“与”关键支路新的截止期限D (branch(CPand))′并将其作为整个控制块新的截止期限;for(i=0;i<length(and);i++)17 18 {19 if ()20 {21TS(branch(i))=D(branch(CPand))′-D(branch(i)),按照算法1 对该支路进行调优;22 }23 }24 }25 }Endbranch(i)≠branch(CPand)2.3 动态监控由于“或”结构在流程定义阶段无法确定实际运行过程中所选择的支路,因此静态调度并未对非关键路径支路和关键路径支路设置相同的截止期限.这就需要在执行过程中,为“或”结构设置监测点,根据选择的支路动态的为后续未执行的活动重新生成调度方案.通过为每个“或”分支活动设置监测点,进而监听该活动的结束事件,并根据输出条件判断后续所选择的支路.若选择的是关键路径支路,则不更改现有的调度方案,否则对其进行优化.“或”结构动态监控优化算法(OR Dynamic Monitoring,ORDM)如算法3.ORDM 算法输入:〈 N,E〉,D (WF);输出:D (i);Begin 1 找出所有的“或”控制结构,并设置“或”分支活动 ior_split为监测点;2 监听ior_split 的结束事件,记录其完成时间TF(ior_split),并根据输出条件判定后续选择的支路branch;3 if (branch=branch(CP))4 {5 按照静态调度方案对活动进行调度;6 }7 else 8 {9 根据当前的调度方案求得未完成活动的关键路径CP′及其需要消耗的时间D (CP′);10 D (WF)′=D(WF)-TF(ior_split);11 分别将CP=CP′,D (CP)min=D(CP′),D (WF)=D(WF)′代入算法2,对未完成的活动进行调优;12 }End算法3 动态监控“或”结构的执行情况,规避了为所有“或”分支分配相同截止期限而造成效益无法最大化的情况的出现.本文提出的动态监控思路同样适合于流程执行过程中出现的简单异常,如服务的延迟、异常导致服务不可用.此时,可以把异常节点至结束活动的拓扑当作是新的工作流,并按照算法3 中步骤8-12 重新调度.其它复杂的异常处理将是下一步研究的对象.3 实例本章对前文提出的调度方法进行实例应用.图3是虚拟科学分析过程的DAG 模型,表3是模型中每个活动对应的候选服务集合,时间单位为分钟(min),费用单位为人民币(¥).设定工作流的开始时间为0,截止期限为110.图3 工作流DAG 模型表3 活动候选服务集合活动编号 (T,候C)选/(m服in务,¥) 活动编号 (T,候 C)选/(m服in务,¥)1(4,9) 6 (20,18)1(6,8) 7 (20,30)2(8,8) 8 (5,12)2(10,7) 8(7,11)2(12,6) 9 (15,5)3(6,6) 10 (4,11)4(10,15) 10 (8,9)4(15,9) 11 (7,18)5(12,16) 11 (15,10)3.1 关键路径时间下界每个活动选择耗时最短的服务的条件下,按照如下步骤求得关键路径执行时间的下(1) “与”结构T(3,4)min=T(3)min+T(4)min=6+10=16,T(5)min=12,T(3,4)min >T(5)min,因此关键路径为活动3,4.(2) “或”结构T(8)min=5,T (9)min=15,T (9)min >T(8)min,所以关键支路为活动9.顺序活动处于关键路径上,因此整个工作流的关键路径由活动1,2,3,4,6,7,9,10,11 组成,其执行时间下界为D(CP)min=T(1)min+T(2)min+T(3,4)min+T(6)min+T(7)min+T(9)min+T(10)m in+T(11)min=94.3.2 松弛时间分配工作流的松弛时间TS(WF)=D(WF)-D(CP)min=110-94=16.将关键活动按照所处的控制结构分类得到 {CPand(i)}={3,4},{ CPs(i)}={1,2,6,7,10,11},{CPor(i)}={9}.根据算法2 分配松弛时间.(1) “与”关键活动活动3 只有一个候选服务,已经是最优方案;活动4 的ΔT =5 <16,所以其可以获得5 个单位的额外时间,此时工作流的剩余松弛时间TS(WF)=16-5=11.(2) 顺序关键活动同步活动6,7 只有单个候选服务,所以{ΔT}={ΔT(1),ΔT(2),ΔT(10),ΔT(11)}={2,2,4,8},{S BR}={0.5,0.5,0.5,1}.因此活动11 将优先获得8 个单位的时间资源,此时工作流剩余的松弛时间为3 个单位.活动1,2 的服务替换产生相同的效益,因此给活动1 分配2 个单位时间.经过上述的步骤,工作流剩余1 个单位的松弛时间,无法满足其它活动更换服务所需的最小时间变量,且又因为调整过后的“与”控制结构中活动5 没有可替换的服务,调优结束.工作流优化过后的调度方案如表4所示.表4 活动执行服务活动编号服务(T,C)/(min,¥) 活动编号服务(T,C)/(min,¥)1(6,8) 7 (20,30)2(8,8) 8 (5,12)3(6,6) 9 (15,5)4(15,9) 10 (4,11)5(12,16) 11(15,10)6(20,18)3.3 动态监控活动7 处设置监测点,TF(7)=T(1,2,3,4,6,7)=75,根据其输出条件判断活动8 所在的支路被选中,此时活动8,10,11 组成了新的工作流WF′.其松弛时间TS =D(WF)-TF(7)-T(8,10,11)=110-75-24=11,ΔT(8)=2,ΔT(10)=4,易知活动8,10 均可分得对应的额外时间资源,即选择成本最低的服务.4 结束语为了更好地解决云环境下科学工作流调度过程中的时间-成本优化问题,在DAG 模型中增加了对工作流“或”控制结构的支持,并提出了关键活动优先级的概念,此举弥补了现有基于DAG 的调度算法无法支持“或”结构的不足;同时,给出了活动的松弛时间分配策略,并基于此提出了云环境下科学工作流的调度算法,该方法由静态调度和动态监控组成.最后通过虚拟的科学分析过程对上述的算法进行了说明和应用.参考文献【相关文献】1 张卫民,刘灿灿,骆志刚.科学工作流技术研究综述.国防科技大学学报,2011,33(3):56-65.[doi:10.3969/j.issn.1001-2486.2011.03.013]2 Barker A,Van Hemert J.Scientific workflow:A survey and research directions.Proceedings of the 7th International Conference on Parallel Processing and AppliedMathematics.Gdansk,Poland.2007.746-753.3 Gil Y,Deelman E,Ellisman M,et al.Examining the challenges of scientificputer,2007,40(12):24-32.[doi:10.1109/MC.2007.421]4 Arabnejad V,Bubendorfer K,Ng B,et al.A deadline constrained critical path heuristic for cost-effectively scheduling workflows.Proceedings of the IEEE/ACM 8th International Conference on Utility and Cloud Computing.Limassol,Cyprus.2015.242-250.5 Arabnejad V,Bubendorfer K.Cost effective and deadline constrained scientific workflow scheduling for commercial clouds.Proceedings of the IEEE 14th International Symposium on Network Computing and Applications.Cambridge,MA,USA.2016.106-113.6 Arabnejad V,Bubendorfer K,Ng B.Deadline distribution strategies for scientific workflow scheduling in commercial clouds.Proceedings of the IEEE/ACM 9th International Conference on Utility and Cloud Computing.Shanghai,China.2017.70-78.7 Yu J,Buyya R,Tham CK.Cost-based scheduling of scientific workflow applications on utility grids.Proceedings of 1st International Conference on E-Science and Grid Computing.Melbourne,Australia.2005.140-147.8 Yuan YC,Li XP,Wang Q,et al.Deadline division-based heuristic for cost optimization in workflow rmation Sciences,2009,179(15):2562-2575.[doi:10.1016/j.ins.2009.01.035]9 Abrishami S,Naghibzadeh M,Epema DHJ.Deadlineconstrained workflow scheduling algorithms for infrastructure as a service clouds.Future Generation Computer Systems,2013,29(1):158-169.[doi:10.1016/j.future.2012.05.004]10 Topcuoglu H,Hariri S,Wu MY.Performance-effective and low-complexity task scheduling for heterogeneous computing.IEEE Transactions on Parallel and Distributed Systems,2002,13(3):260-274.[doi:10.1109/71.993206]11 Yu J,Buyya R.Scheduling scientific workflow applications with deadline and budget constraints using genetic algorithms.Scientific Programming,2006,14(3-4):217-230.[doi:10.1155/2006/271608]12 苑迎春,李小平,王茜,等.基于逆向分层的网格工作流调度算法.计算机学报,2008,31(2):282-290.[doi:10.3321/j.issn:0254-4164.2008.02.012]13 郑美光,胡志刚,杨柳,等.使用宽裕时间有效分配优化工作流逆向分层算法.小型微型计算机系统,2016,37(8):1639-1644.[doi:10.3969/j.issn.1000-1220.2016.08.002]14 龙浩,梁毅,邸瑞华.基于相对效费比的网格工作流调度算法.计算机集成制造系统,2010,16(3):589-597.15 彭佳,谭文安,孙勇,等.QoS 约束下的分层工作流调度算法.小型微型计算机系统,2015,36(7):1444-1448.[doi:10.3969/j.issn.1000-1220.2015.07.007]16 Xavier S,Lovesum SPJ.A survey of various workflow scheduling algorithms in cloud environment.International Journal of Scientific and Research Publication,2013,3(2):1-3. 17 Wu FH,Wu QB,Tan YS.Workflow scheduling in cloud:A survey.The Journal ofSupercomputing,2015,71(9):3373-3418.[doi:10.1007/s11227-015-1438-4]18 Arya LK,Verma A.Workflow scheduling algorithms in cloud environment - A survey.Proceedings of 2014 Recent Advances in Engineering and Computational Sciences.Chandigarh,India.2014.1-4.19 李慧芳,冯复剑.时间约束工作流的截止期限管理及其动态监控.北京理工大学学报,2011,31(8):937-943.。
带准备时间和截止期约束的云服务工作流调度算法
带准备时间和截止期约束的云服务工作流调度算法
沈虹;李小平
【期刊名称】《通信学报》
【年(卷),期】2015(036)006
【摘要】带准备时间和截止期约束的云服务工作流费用优化是一个新的云计算资源优化分配问题.分析该NP-hard问题特征,建立相应的整数规划数学模型.构建有效的变量取值概率模型和更新机制,提出高质量初始群体的启发式生成方法;提出混合的分布估计算法(HEDA),引入个体向全局最优解学习的策略,提高算法的全局搜索和局部优化能力.模拟实验结果表明此提出的方法在合理的CPU时间内可有效减少工作流费用.
【总页数】10页(P183-192)
【作者】沈虹;李小平
【作者单位】东南大学计算机科学与工程学院,江苏南京210096;南京审计学院金审学院,江苏南京210029;东南大学计算机科学与工程学院,江苏南京210096【正文语种】中文
【中图分类】TP393
【相关文献】
1.截止期限约束的实例密集型云服务流调度算法 [J], 刘炜;李陶深;黄汝维
2.有预算和截止期约束的网格作业调度算法 [J], 李荣胜;赵文峰;徐惠民
3.基于局部关键路径与截止期限分配的云工作流调度算法 [J], 蔡艳婧;王强;程实
4.云科学工作流截止期限约束代价优化调度算法* [J], 陈彦橦;裴树军;苗辉
5.截止期约束下QoS导向的网格任务调度算法 [J], 罗慧敏;阎朝坤;罗军伟
因版权原因,仅展示原文概要,查看原文内容请购买。
一种满足可靠性和能效的云工作流调度方法
第38卷第1期 2021年1月计算机应用与软件Computer Applications and SoftwareVol.38 No.1Jan. 2021一种满足可靠性和能效的云工作流调度方法殷越1隋丽娜21 (河南工业和信息化职业学院信息工程系河南焦作454003)2 (河北民族师范学院数学与计算机科学学院河北承德067000)摘要为了同步解决云工作流调度时的失效和高能耗问题,提出一种基于可靠性和能效的工作流调度算法。
算法为了在截止时间的QoS约束下最大化系统可靠性并最小化调度能耗,将工作流调度过程划分为四个阶段:计 算任务优先级、工作流任务聚簇、截止时间子分配和任务调度。
算法在满足执行次序的情况下对任务进行拓扑排 序,并以通信代价最小为目标对任务进行聚簇;将截止时间在任务间进行子分割;以合适的频率/电压等级对聚簇 后的任务进行调度,在确保可靠性的前提下最小化系统能耗。
通过随机任务图和高斯消除任务图进行综合仿真 测试,结果表明算法在降低总体能耗和提高工作流调度可靠性方面均优于对比算法。
关键词 云计算工作流调度截止时间任务聚簇任务调度能效中图分类号 TP393 文献标志码 A DOI:10.3969/j.issn.1000-386x.2021.01.003A CLOUD WORKFLOW SCHEDULING METHOD MEETINGRELIABILITY AND ENERGY EFFICIENTYin Yue1Sui Li’na21 {Information Engineering Department, Henan C ollege of Industry and Information Technology , Jiaozuo 454003 , Henan , China)2 (School of Mathematics and C omputer Science,Hebei Normal University For Nationalities , Chengde 067000 , Hebei , China)Abstract In order to solve the problem of failure and high energy consumption of cloud workflow scheduling synchronously,a workflow^scheduling algorithm based on reliability and energy efficiency is put forward in this paper.In order to maximize the system reliability and minimize the scheduling energy cons constraint,our algorithm divided the workflow^scheduling process into four stages:calculating task priority,workflow tasks clustering,deadline sub-distribution and tasks scheduling.It sorted the tasks topologically in the case of meet the execution order,and clustered tasks with minimizing communication cost;it divided the dea scheduled all tasks after clustered with the right frequency/voltage level,which could minimize the system power consumption while ensuring the reliability of tasks scheduling.Through the integrated simulation graph and Gaussian elimination t ask graph,the results show that our algorithm performs better than the baseline algorithms on reducing the total execution energy consumption and improving the workflow^ Keywords Cloud computing W orkflow^scheduling Deadline Tasks clustering Tasks scheduling Energy efficiency〇引言云计算[1]可以将分布于世界各地的互联网上的各 种i t资源(计算、存储、带宽等)进行有效的整合,然后 通过虚拟化技术以实时按需的形式提供给用户使用。
截止时间约束的工作流调度自适应进化方法
截止时间约束的工作流调度自适应进化方法党云龙;封筠;殷梦莹【摘要】工作流是云计算环境下任务的主要表现形式,工作流任务调度问题是一个典型的NPC问题,进化算法在解决这类问题方面具有明显优势.然而,传统的进化算法容易陷入局部最优,造成早熟结果.提出一种考虑截止时间约束条件下的自适应遗传进化方法,采用适应度修正均值来自适应计算交叉概率、变异概率,引入惩罚函数自适应修正适应度,以避免陷入局部最优.在WorkflowSim仿真环境上,选用具有代表性的Montage科学工作流,与5种算法的对比实验结果表明在4种不同截止时间约束下,所提方法的约束满足程度最高,且能够在贴近用户截止时间约束的执行时间下花费更小的成本.【期刊名称】《石家庄铁道大学学报(自然科学版)》【年(卷),期】2019(032)003【总页数】7页(P94-100)【关键词】工作流;任务调度;自适应进化;截止时间约束【作者】党云龙;封筠;殷梦莹【作者单位】石家庄铁道大学信息科学与技术学院,河北石家庄 050043;石家庄铁道大学信息科学与技术学院,河北石家庄 050043;石家庄铁道大学信息科学与技术学院,河北石家庄 050043【正文语种】中文【中图分类】TP301工作流通常是数据密集型和计算密集型应用,例如欧洲核子研究组织(CERN)在大型强子对撞器上进行的Compact_Muon_Solenoid的实验,产生了超过5PB数据需要进一步分析;美国航天局(NASA)设定的目标为在一天内处理24TB数据,同时面临着对这批数据进行可视化和分析的一系列后续任务。
这些工作流具有大量的数据和计算需求,需要一个高性能计算环境。
云计算环境基础设施为大规模科学工作流提供了一个合适的环境。
云计算环境将计算资源作为服务可根据用户的约束需求动态地提供,用户约束条件下的资源调度问题成为关键。
针对现有进化算法存在的不足,提出一种截止时间约束条件下的工作流调度自适应遗传进化方法,依据修正均值自适应调整交叉概率、变异概率以及选择概率,利用修正均值来改进适应度,引入惩罚函数自适应修正适应度,可避免进化方法陷入局部最优,防止早熟结果的产生。
截止期限约束的实例密集型云服务流调度算法
A Deadline-Constrained Scheduling Algorithm for
Intensive- Instance Serviceflows in Cloud
Environment
作者: 刘炜 李陶深 黄汝维
作者机构: 广西大学计算机与电子信息学院,南宁530004
出版物刊名: 电信科学
页码: 87-91页
年卷期: 2013年 第12期
主题词: 云计算 服务流调度 时间异常 截止期限
摘要:针对商业云计算中存在大量实例密集型服务流的问题.提出一种新的云环境下两阶段服务流调度算法。
该算法先将用户自定义的全局截止期限分配到系统中的每个实例,再将每个实例的截止期限分配到实例中的每个任务中,最后在服务流执行阶段,动态调整后续任务的截止期限,解决了任务可能存在的未能在其截止期限内完成的时间异常问题。
CloudSim仿真结果表明.与现有的算法相比,该算法能满足用户定义的截止期限,节约了执行成本,并减少了资源的竞争率,提高了调度的成功率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Abstract: Cost minimization with deadline constraints and setup time is a new resource allocation optimization problem in cloud computing. An integer programming model is constructed for this NP-hard problem. A novel probability model and updating mechanism is suggested for sampling the solution space. A heuristic method is investigated for generating good initial population. A hybrid estimation of distribution algorithm (HEDA) is proposed for the considered problem. The global best solution is adopted to balance the diversification and intensification of HEDA. Experimental results show that the proposed method is effective to optimize the workflow running cost within reasonable CPU time. Key words: cloud service; workflow scheduling; estimation of distribution algorithm
第 36 卷
f n1 ≤ n1 xik {0,1}, i V , k {1, 2,, mi }
tik I , i V , k {1, 2,, mi }
i 所 需 时 间 包 括 准 备 时 间 rik 和 执 行 时 间 tik 两 部
分,记 d ik rik tik ,所需费用为 cik 。各活动服务 费用 cik 递减的 池中的可选服务按照时间 d ik 递增、 顺序排序。 图 2 是一个具有 12 个活动的工作流实 例,0 号节点上方为初始化工作流的时间和费用, 其余节点上方为该活动的可选服务构成的服务池 {(d ik , cik )} 。 截止期约束具有准备时间的云服务工作流费 用优化问题可描述为:给定工作流的截止期 n1 , 为各活动选择合适的服务,使工作流费用最小化。 k {1,2,, mi } , i V , 定义布尔变量 xik {0,1} , 如果活动 i 选择服务池中的第 k 个服务来执行,则 xik 1 ;否则 xik 0 。用整数规划方法对本问题形 式化描述如下 Minimize
mi
2
带截止期和准备时间的云服务工作流优 化模型
云计算环境下的应用通常由多个活动相互协 作完成,活动及活动间的约束关系可模型化为有向 无环图 DAG 描述的工作流。 有向无循环图 DAG 记 作 G {V , E} , 其中节点集 V {0,1,2,, n, n 1} 表示 图中所有活动集合; E {(i, j ) i j} 是有向边集合, 表示活动间的偏序约束关系, 即对 (i, j ) E , 活动 j 在活动 i 执行完后才可开始执行。其中 0 号节点
(1. 东南大学 计算机科学与工程学院,江苏 南京 210096;2. 南京审计学院 金审学院,江苏 南京 210029)
摘
要: 带准备时间和截止期约束的云服务工作流费用优化是一个新的云计算资源优化分配问题。 分析该 NP-hard
问题特征,建立相应的整数规划数学模型。构建有效的变量取值概率模型和更新机制,提出高质量初始群体的启 发式生成方法;提出混合的分布估计算法(HEDA) ,引入个体向全局最优解学习的策略,提高算法的全局搜索和 局部优化能力。模拟实验结果表明此提出的方法在合理的 CPU 时间内可有效减少工作流费用。 关键词:云服务;工作流调度;分布估计算法 中图分类号:TP393 文献标识码:A
iV 1≤k ≤mi
xik cik
(1) (2)
s.t. xik 1, i V
k 1
mi
f j fi xik (ri k tik ) ≥ 0, (i, j ) A (3)
k 1
图 2 具有 12 个活动的工作流 DAG 图
2015125-3
通 信 学 报
2015125-1
ห้องสมุดไป่ตู้
通 信 学 报
第 36 卷
活动与资源的映射,使工作流调度目标最优化。不 同类型的资源具有不同租赁成本。通常情况下,计 算和存储性能高的资源具有更高的租赁费用,计算 和存储性能低的资源租赁费用则便宜些,即执行时 间短的服务一般具有更高的租赁费用[2]。该问题是 离散的时间费用优化问题,大部分情况下是 NP-hard 问题[3]。 离散的时间费用优化问题( DTCTP, discrete time-cost tradeoff problem)在项目管理领域已得到 广泛研究。已有研究成果多采用分支定界、动态规 划等精确方法求解, 文献[4]详细介绍了该问题的研 究现状。近 10 年,网格计算环境下的工作流调度 优化方法主要包括启发式方法和元启发式方法两 类。Yu 等[5]基于不同截止期/成本约束提出求解独 立任务调度的启发式算法 DTL。苑迎春等[6,7]提出 截止期约束的逆向分层调度算法 DBL, 该算法根据 各活动的逆向深度分层,将工作流截止期转化为活 动的时间区间,通过增大活动的时间区间以优化费 用。苑迎春等[8]利用 DAG 图中串行活动特征给出 串归约概念,基于分层算法对串归约组的时间窗口 重定义,并提出动态规划的求解策略实现组内费用 最优化。 Abrishami 等[9]提出基于部分关键路径的启
收稿日期:2014-05-21;修回日期:2014-10-12 基金项目:国家自然科学基金资助项目(61272377);教育部高等学校博士学科点专项科研基金资助项目(20120092110027) Foundation Items: The National Natural Science Foundation of China (61272377); The Research Fund for the Doctoral Program of Higher Education of China (20120092110027)
为开始节点标识用户向云平台提交工作流应用请 求。 n 1 号活动为虚节点标志工作流的结束,设 Ri 表示活动 i 的直接先驱活动集, 则 Ri 为直接先驱活 动个数;设 Qi 表示其直接后继活动集,则 Qi 为直 接后继活动个数。l i 表示活动 i 的开始执行时间,f i 表示活动 i 的完成时间。 工作流的每个活动 i ,有若干可选服务(如虚 拟机资源) 可完成该任务。 可选服务集称为活动 i 的 服务池 S i {S i1 , S i2 ,, S imi } 。每个服务 S ik 完成活动
发式方法,以截止期为工作流完工时间,采用后向 迭代方式为各活动查找部分关键路径,并为部分关 键路径上各活动设置子截止期;在子截止期的约束 下为各活动选择最便宜的服务。张晓东等[10]提出离 散的粒子群算法,引入粒子随机极值扰动、位置回 退、交叉繁殖等机制解决服务工作流调度优化。 Chen 等[11]用蚁群算法求解具有不同 QoS 约束的工 作流调度优化。Yu 等[12]用遗传算法解决截止期约 束的工作流费用优化和成本约束的工作流完工时 间最小化 2 个问题。 云计算环境下工作流调度与网格环境工作流 调度的本质区别在于:云计算环境的资源可认为是 无限的,用户可在任何时刻采用按需付费的方式租 用资源。现有文献对云计算环境的工作流调度问题 主要考虑截止期约束的工作流费用最小化问题,多 采用启发式的方法。Cai 等[13]提出基于关键路径的 迭代启发式方法,利用动态规划法优化关键路径上 活动的服务选择方案,最小化工作流费用。 Abrishami 等[14]用部分关键路径的启发式方法将工 作流截止期转化为各活动的子截止期,在满足活动 子截止期的情况下,为活动选择合适的服务以最小 化工作流租赁费用。Van den Bossche 等 [15]考虑公
图 1 云计算平台工作流调度框架结构
2015125-2
第 6 期
沈虹等:带准备时间和截止期约束的云服务工作流调度算法
有云和私有云混合环境下的截止期约束工作流费 用最小化问题。启发式方法具有执行时间短、优 化速度快等优点,但通常情况下得到问题的近似 最优解。 与已有研究不同,本文考虑云计算环境下截止 期约束具有准备时间的工作流费用最小化问题,即 实际云计算工作流活动在执行时具有不同的准备 时间(如初始化虚拟机、数据传输等) ,该问题是 [13~15] 对已有研究模型 的扩展,是 NP-hard 问题。分 [16] 布估计算法 (EDA, estimation of distribution algorithm)是一个基于概率统计的群智能优化算法, 已被成功地运用于项目调度优化[17],该算法在云服 务工作流调度领域尚无相关研究。本文结合问题特 征构造启发式方法生成高质量的初始解,提出混合 的分布估计算法(HEDA)进行求解,构建有效的 问题变量概率向量,将粒子群算法中个体向全局最 优解学习的思想引入 HEDA 中, 提出新的变量取值 统计方法以更新变量概率向量。实验结果表明本文 提出的混合分布估计算法能更好地平衡全局搜索 和局部优化过程。
1
引言
云计算是分布式计算、并行计算和网格计算的 商业化发展。通过虚拟化技术将分布在不同地理位 置的计算资源和存储资源封装成服务,向互联网应 用提供基础设施即服务 (IaaS) 、平台即服务 (PaaS) 和软件即服务(SaaS)的三大服务模式[1]。近年来, 基于云计算环境实现跨平台、跨部门、跨地区多任 务间的协同处理已成为热点科学问题。 云计算环境下的许多大型应用常被分解成若 干个彼此联系的活动(任务) ,活动及活动间的复