基于遗传禁忌搜索的网格资源选择算法

合集下载

基于遗传算法和禁忌搜索算法的排课系统研究

基于遗传算法和禁忌搜索算法的排课系统研究

基于遗传算法和禁忌搜索算法的排课系统研究作者:刘长彬来源:《软件导刊》2014年第10期摘要:排课是高校教务管理工作中的重要业务之一。

由于排课问题考虑的因素和约束条件很多,加上不同的学校情况不同,因此很难形成一个固定的排课模式。

分析了排课问题的实质及解决方案,主要采用遗传算法和禁忌搜索算法解决排课问题,通过对比和计算分析,取得了良好的效果。

关键词:排课系统;禁忌搜索算法;遗传算法DOIDOI:10.11907/rjdk.143311中图分类号:TP312文献标识码:A 文章编号文章编号:16727800(2014)010006803作者简介作者简介:刘长彬(1987-),男,四川成都人,成都理工大学信息科学与技术学院硕士研究生,研究方向为数据库技术。

0 引言排课是高校教学管理中十分重要而又复杂的管理工作之一,由于排课问题涉及的因素有时间、教师、教室、课程、班级等,因此排课问题是一个有约束条件、多目标、模糊性极强的组合优化问题[1]。

由于各学校资源差异较大,约束条件复杂,排课系统难以具有普遍适用性。

一般教务排课仍以手工为主,计算机为辅,效率低下。

研究灵活、高效、自动化程度高的排课系统需求迫切,具有现实意义。

国外很早就有人研究课表的编排问题,一般利用启发式函数,并且大多数启发式方法都是模拟手工排课的过程实现的。

国内对排课问题的研究较晚,并且大部分学者研究的排课系统都依赖于各个学校的教学体制,不具有普遍适用性[2]。

从实际使用情况看,国内研究的排课系统软件在性能上也达不到使用要求。

遗传算法是一种借鉴生物界自然选择和进化机制发展起来的高度并行、自适应的随机搜索算法;而禁忌搜索算法是对局部领域的一种扩展,是一种全局逐步寻优的搜索算法。

通过对比分析,遗传算法和禁忌搜索算法在解决复杂优化问题中有明显的优势,因而本文采用遗传算法和禁忌搜索算法来实现排课系统。

1 排课系统分析排课问题的主要任务是将班级、教师、课程安排在一周内某一不发生冲突的时间和教室中,保证课表在时间分配上符合一切共性和个性要求,使安排在各个目标上尽量达到最优。

基于离散粒子群和禁忌搜索的网格资源调度算法

基于离散粒子群和禁忌搜索的网格资源调度算法

0 引 言
网格 计 算 是 为解 决 大 规模 资 源密 集 型 问题 而 提 出的新一代计算平台, 是当前并行和分布处理技术 的 个发 展方 向。 网格 计算 具有 两大优 势 , 是 数据 处 一 理 能力 强 , 是 能够充 分利 用 网络 中闲置 的资 源 。要 二 实现这 两大 优 势 , 网格 环境 下 的资源 分配 和任 务调 度 是 关键 。然 而 一般 的网 格 资源 调 度 问题 已经 被 证 明
Ab t a t A a e o r e alc t n a d t s c e u ig ag r h b s d o n e ie ti p o o e sr c : g d r s u c l ai n a k s h d l lo t m a e n i tn g n s rp s d,b c u e t e g d rs u e s o o n i e a s h r e o r e i s h d i g i ic ee p o lm,t e d s rt a t l w r lag r h b s d o efa a t g i e i s a o td Ai n tte c e u n sa d s rt r b e l h ice e p ri e s a n lo t m a e n s l d p i n  ̄ a i d p e . mi g a h c i - n
rh i m.Atp o h s ,t e d s r t a t l wam g r h i p e e t d,i h ae tb e r h ag r h i u i g t c e r h t r p a e h ic ee p r ce s r a oi m r s n e i l t s n t el t u s a c o t m s sn l a s ac . a l i o ol An y u i g t e g i i lt n t os G i sm o l i,a gi i lt n s s m o x e me t s d v lp d E p rme tlr — d b sn r s h d mua i o l rd i T o kt rd s o mua i y t fre p r n si e eo e . x e o e i i na e

禁忌搜索算法

禁忌搜索算法
• 另外,为了避免对已搜索过的局部最优解的重复, 禁忌搜索算法使用禁忌表记录已搜索的局部最优 解的历史信息,这可在一定程度上使搜索过程避 开局部极值点,从而开辟新的搜索区域。
禁忌搜索算法的关键要素
➢ 就这些参数含义一般而言,设计一个禁忌搜索算法需要确 定以下环节:
• 初始解 • 邻域和移动 • 候选集 • 禁忌表及其长度 • 选择策略 • 破禁策略 • 停止规则 • 下面对这些环节的一般操作予以讨论。
• (5)判断候选解对应的各对象的禁忌属性,选择候选解 集中非禁忌对象对应的最佳状态为新的当前解,同时用与 之对应的禁忌对象替换最早进入禁忌表的禁忌对象元 素。
• (6)转到步骤(2)。
流程图
开始
设置参数,产生初 始解置空禁忌表
满足终止准则吗?
输出优解
结束
生成当前的邻域 解,选出候选解
满足藐视准则吗?
国内外研究现状
➢ Glover教授分别在

1989年和1990年发表
了两篇著名的标题为
Tabu search的论文,
提出了现在大家熟知
的禁忌搜索算法的大
部分原理。
其中一些原理在学术界长期没有突破。事实上, 在20世纪90年代前半叶,大部分工作局限在关于 禁忌搜索技术的非常有限区域,如禁忌表和基本 的藐视准则。
邻域和移动
• 邻域移动亦称邻域操作,邻域变换等;邻域移动是从一个 解产生另一个解的途径。它是保证产生好的解和算法搜索 速度的最重要因素之一。邻域移动定义的方法很多,对于 不同的问题应采用不同的定义方法。
• 通过移动,目标函数值将产生变化,移动前后的目标函数 值之差,称之为移动值。如果移动值是非负的,则称此移 动为改进移动;否则称作非改进移动。最好的移动不一定 是改进移动,也可能是非改进移动,这一点就保证搜索陷 入局部最优时,禁忌搜索算法能自动把它跳出局部最优。 邻域移动的涉及策略既要保证变化的有效性,还要保证变 化的平滑性,即产生的邻域解和当前解有不同,又不能差 异太大。不同会使搜索过程向前进行,不能差异太大保证 搜索是有序而非随机的搜索。[1]

基于禁忌搜索算法求解全光网路由和波长分配问题

基于禁忌搜索算法求解全光网路由和波长分配问题
摘 要 该文是基于禁忌搜索算法对一类全光网路由和波长分配 MAX2RWA 问题进行求解. 该文针对配置范围受 限波长转换器的全光网 ,强化了 MAX2RWA 问题的优化目标. 新的优化目标是保证连接数最多的情况下使用最少的 波长转换器 ,从而尽可能地减少波长转换器引入的信号失真 ;简化了文献 [ 7 ]中分层图的构造方法 ,并利用改进的 分层图给出了 MAX2RWA 问题的整数线性规划和禁忌搜索算法的设计. 仿真结果和理论上界的对比表明该文算法 是稳定 、有效的.
边的集合. 由于同一节点上可以放置多个波长转换 器 ,所以对波长转换器对应的边容量不加以限制.
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved.
关键词 禁忌搜索 ;分层图 ;路由和波长分配 ;波长转换器 中图法分类号 TP301
Routing and Wavelength Assignment in All2Optical Net work Using Tabu2Search Algorithm
ZHANG Shi QIN Hao LIU Zeng2Ji
路 ,在计算路由时 ,可以得到综合考虑路径选择和波 长分配的最短路由 ,从而将两个子问题合并成一个 单一的路由问题. 文献[ 7 ]中提出的扩展分层模型引 入了过多的额外节点 ,使得分层图的规模很大. 我们 在文献[ 7 ]的基础上 ,提出了适合本文问题的扩展分 层模型.
本文用以下定义描述图 1 (a) 所示的原始物理 网络 :
第 27 卷 第 3 期 2004 年 3 月
计 算 机 学 报 CHINESE JOURNAL OF COMPUTERS

禁忌搜索算法

禁忌搜索算法
NI=0 是
n<N
否 End
求得初始解 BS=初始解
初始解
Sequence The length of the route
132456
28
BS
Sequence The length of the route
132456
28
Start
Tabu list 初始化(清空) 设M,N的值
求得初始解 BS=初始解
找出下一个 次好的新解
更新tabulist NI=NI+1
NI=0 Intensification
n=n+1
否 NI=M?
是 Diversification
NI=0 是
n<N
否 End
更新当前解、最好解、tabu list 及相关参数
Sequence The length of the route
当前解 413256
30
候选解
143256
29
新生成相邻关系(14), is Tabu! Reject it
Start
Tabu list 初始化(清空) 设M,N的值
求得初始解 BS=初始解
n=0;NI=0
求得一系列候选解, 并按优劣排序

最好的新解比 是
BS好?

It’s in tabu?

接受新的解用新的 解替换当前解
假设记录生成相邻解的方法,Tabu list = {②, ③, ④},下一步采用②方法生成了迄今 为止最好的解,仍然接受这个,更新Tabu list={②, ③, ②},
分散搜索(Diversification)和 集中搜索(Intensification)策略

基于遗传和禁忌搜索算法的排课系统研究与实现的开题报告

基于遗传和禁忌搜索算法的排课系统研究与实现的开题报告

基于遗传和禁忌搜索算法的排课系统研究与实现的开题报告一、研究背景随着教育的发展,排课系统已经成为各大学校管理工作中不可或缺的一部分。

排课系统可以帮助学校方便、快捷地安排课表,提高教学效率和教学质量。

然而,由于诸多因素的影响,如老师的不同授课时间、课程的先修关系等,排课系统往往面临诸多挑战。

传统的排课方法已经无法满足学校的需求,因此需要采用新的方法来解决这些问题。

基于遗传和禁忌搜索算法的排课系统具有很高的效率和准确性。

遗传算法和禁忌搜索算法是两种常见的优化算法,可以用于解决排课中的复杂问题。

遗传算法是一种基于进化论的优化算法,通过遗传操作模拟自然界生物进化的过程,即通过选择、交叉和变异三个操作产生新的个体解,并通过不停地进化来寻找最优解。

禁忌搜索算法则是通过维护禁忌表来避免搜索陷入局部最优解,从而达到全局最优解的目的。

二、研究目的本研究旨在开发一种基于遗传和禁忌搜索算法的排课系统,通过建立数学模型,利用遗传和禁忌搜索算法生成最优的课表方案,优化学校的课程安排和教学资源的利用,提高教学效率和教学质量。

三、研究内容1.调研目前排课系统的现状和发展趋势,总结排课系统的应用现状、存在的问题以及发展方向。

2.研究遗传和禁忌搜索算法的原理和特点,建立基于遗传和禁忌搜索算法的数学模型,并对其进行评估和优化。

3.结合实际情况,设计和开发基于遗传和禁忌搜索算法的排课系统,实现自动排课、课表自动生成、冲突检测和冲突解决等功能。

4.评估和验证排课系统的性能,并与其他排课系统进行比较和分析。

四、研究方法本研究将采用文献调研、理论分析和实验研究等方法,通过调查和分析目前常用的排课方法和算法,研究遗传和禁忌搜索算法的原理和特点,并结合实际情况设计和开发基于遗传和禁忌搜索算法的排课系统。

同时,将从实验研究的角度考虑如何评估和优化算法的性能。

五、预期结果1.设计和开发一种基于遗传和禁忌搜索算法的排课系统,实现自动排课、课表自动生成、冲突检测和冲突解决等功能。

遗传算法与禁忌搜索算法的混合策略_李大卫

遗传算法与禁忌搜索算法的混合策略_李大卫

遗传算法与禁忌搜索算法的混合策略李大卫①(鞍山钢铁学院,鞍山114002) 王 莉(鞍山师范学院,鞍山114005) 王梦光(东北大学,沈阳110006) 摘要 遗传算法与禁忌搜索算法的出现为解决高维组合优化问题提供了强有力工具.二者既有共性,又有个性.通过对遗传算法与禁忌搜索算法的分析,提出了一种遗传算法与禁忌搜索算法的混合策略,把禁忌搜索算法独有的记忆思想引入到遗传算法的搜索过程中,构造了新的重组算子,并把禁忌搜索算法作为遗传算法的变异算子,对旅行商问题的求解表明:混合策略在许多方面优于遗传算法.关键词:遗传算法,禁忌搜索,混合策略,旅行商问题分类号:N94GENETIC ALGORITHM AND TABU SEARC H:A HYBRID STRATEGYLi Dawei(Anshan Institute of Iron and Steel Techno logy,Anshan114002)Wang Li(Anshan Normal College,Ansha n114005)Wang Mengguang(No rtheastern Univ ersity,Shenya ng110006)Abstract The appearance of genetic alg orithm s and tabu sea rch prov ide pow erful tools fo r solving combina to rial o ptimizatio n problems in high dimen-sio ns.Th e two m ethods either hav e som e co mmo n bo nds,or sig nificant differ-ences.Through a nalysing,w e propose a hy brid strategy o f genetic algo rithm andtabu search.The m em ory function o f tabu search is introduced into procedure o fg enetic alg orithms.A new recombina tion o perator is co nstructed,w hile mutatio no perator is replaced by tabu sea rch.Genetic alg orithm and hybrid stra tegy a reused separately to solv e trav eling salesma n problem.The experiment resultssho w that the hybrid strateg y is superio r to the standard g enetic alg orithm inm any aspects.Key words:g enetic algo rithm,tabu search,hy brid strategy0 引 言在过去的20年里,由美国学者H o lland和他的同事、学生们提出的遗传算法(genetic alg orithms,GA)成为求解任意函数优化问题的强有力的工具[1].GA是一种进化搜索算法,它的基本思想是基于Da rw in的进化论和M endel的遗传学说.其中重组和变异算子是GA 1998年9月 J O U RN AL O F SY ST EM S EN G IN EERIN G Sep.1998①36岁,男,博士,讲师.36,male,Dr.,lectur er.本文1997年4月11日收到.的两个最重要的组成部分,它们被重复地应用到对问题的解进行编码而构成的染色体上.在许多优化问题和工业实际应用上,G A 已经得到了成功的应用[2].禁忌搜索(Tabu Sea rch,T S)是另一个著名的启发式搜索算法,最早由Glov er 提出[3].具有记忆功能是T S 独创的特点之一.许多研究人员对TS 的理论和应用作了研究,使得TS 在调度领域,运输问题,专家系统和神经网络等方面得到了广泛的应用[5].GA 开创了在解空间中从多出发点搜索问题最优解的先河,而TS 是在搜索过程中使用记忆功能的先驱者.它们在解决各种实际应用问题所取得的成功表明,使用二者解决复杂的问题是有价值的.尽管GA 和TS 的适用范围很广,但由于某些条件约束,所以GA 和TS 并不是对所有的问题都是万能的算法,或多或少存在着某些缺陷.因此有必要对GA 和TS 作进一步的研究.本文对此作些尝试性的工作,在对GA 与T S 算法进行分析的基础上,提出了一种G A 与T S 的混合策略(GAT S),把TS 独有的记忆功能引入到GA 搜索过程之中,构造了新的重组算子,并把TS 作为GA 的变异算子.1 GA 与TS 的比较1.1 GA 简介GA 可用如下的五维向量组形式描述 GA =(N pop ,N gen ,K ,f eval ,f sel )其中N pop 为群体规模;N gen 为迭代代数;K 为遗传算子(重组和变异)及它们的概率集合;f eval 为评价函数,或称作适应值;f sel 表示再生选择规则.这里并不关心染色体的具体编码的形式,因此假设GA 和TS 可以使用同样的编码.GA 的特点可以概括成下面的4点[2]:1)利用变量的编码方式,而不使用变量本身;2)在解空间中从多出发点搜索问题的解,而不像某些传统的搜索方法从一点出发搜索问题的解;3)直接利用目标函数的函数值信息,而不使用函数的导数或其它的辅助信息;4)使用概率转移规则,而不采用确定性的转移规则.GA 的求解过程如图1所示:beg in t =0;initialize P (t ); ev aluate structures in P (t ); while terminatio n co ndition not satisfied do t =t +1; select P (t )fro m P (t -1); recombine structures in P (t ); ev aluate structures in P (t );end(其中P (t )表示第t 代群体)图1 G A 的求解过程1.2 TS 简介类似地,TS 也可用五维向量组的形式描述·29·1998年9月 李大卫等:遗传算法与禁忌搜索算法的混合策略 TS =(N pop ,N gen ,Λ,f move ,tabu list)其中N p op 表示一个初始解;N gen 为迭代代数;Λ表示移动的构成方式;f move 为移动值;tabu list 是长度为T 的禁忌表,其中T 可以是定长的,也可以是变长的.TS 求解过程可以表示成如图2的形式:beg in t =0;g enerate N pop ;set T ; set the best and present solutions x =x 0=N pop ; while terminatio n co ndition not satisfied do t =t +1; m ov e x to x ′; update (x ;x 0;tabu list);end 图2 T S 的求解过程T S 也是一种迭代搜索算法.由于TS 使用了记忆功能,在搜索过程中可以接受劣解,所以TS 具有强的“爬山”能力(相对于全局最小值问题),这样使得TS 在搜索过程中能够跳出局部最优解,进而转向其它区域进行搜索,从而获得更好的解或全局最优解的概率也大大增加.2 GA 的局限性和T S 的缺陷2.1 GA 的局限性尽管GA 能够胜任任意函数,高维空间的组合优化问题,但是对于像优化大规模神经元网络的权系数,优化网络的结构等超大规模的优化问题,GA 的应用就受到了限制.究其原因,主要在于GA 在进化搜索过程中,每代总是要维持一个较大的群体规模,从而使计算次数呈非多项式时间增加,限制了GA 的使用.GA 的另一个不足之处是“早熟”.造成这种成熟前收敛的原因,一方面是GA 中最重要的遗传算子——交叉算子使群体中的染色体具有局部相似性,从而使搜索停滞不前;另一方面是变异概率又太小,以至于不能使搜索转向其它的解空间进行搜索.此外,GA 还有爬山能力差的弱点.这也是由于变异概率低造成的.因此,如何提高GA 的爬山能力成为一个重要的研究方向,为了提高GA 的爬山能力,Ackley 开发了一个具有随机爬山功能的称作SIGH 的算法[6].他的分析表明,随机爬山能够促进GA 的搜索速度和解的准确性.2.2 TS 的缺陷T S 的搜索速度比GA 的搜索速度快,但TS 对于初始解具有较强的依赖性.一个较好的初始解可使T S 在解空间中搜索到更好的解,而一个较差的初始解则会降低TS 的收敛速度.为此人们往往使用启发式算法来获得一个较好的初始解,提高TS 的性能.T S 的另一缺陷是在搜索过程中初始解只能有一个,在每代也只是把一个解移动到另一解,而不像GA 那样每代都是对解集(群体)进行操作.·30·系 统 工 程 学 报 第13卷 第3期3 GA 与TS 的混合策略GA TS开发混合算法的目的是使原算法的优点被保持,弱点被克服或者被削弱,提高算法的力度.M ǜhlenbein 最早把记忆功能引入到GA 中[6],而TS 的创始人Glov er 对混合GA 与TS 的必要性和可行性进行了理论上的分析和论述[7],被公认为混合GA 与TS 的理论基础.通过上面对GA 和TS 的分析,在Glov er 理论的基础上,本文提出一种GA 与TS 的混合策略GATS.把TS 独有的记忆功能引入到GA 进化搜索过程之中,构造了新的重组算子TSR,针对GA 爬山能力差的缺陷,利用T S 爬山能力强的优点,使用TS 算法改进GA 的爬山能力,即把TS 作为GA 的变异算子TSM.GAT S 综合了GA 具有多出发点和T S 的记忆功能和爬山能力强的特点,克服了GA 爬山能力差的弱点,并保持了GA 具有多出发点的优势.设x 是一个解(染色体),则T SM 的操作过程如图3所示:beg in t =0;set the best so lution x 0=x ;set T ; w hile termina tion conditio n no t sa tisfied do t =t +1; mov e x to x ′; upda te(x ;x 0;tabu list);end图3 T SM 的操作过程T SM 与标准变异算子极为类似.首先,T SM 把一个解(染色体)作为输入(初始解),经T SM 作用,返回一个解作为输出.不同之处在于TSM 是一个搜索过程,因此需要调用评价函数来确定移动值,并根据移动值和禁忌表决定接受哪个移动(输出).同样由于T SM 是一个TS 搜索过程,在搜索过程中可以接受劣解,因此T SM 具有强于其它变异算子(例如倒位和部分倒位变异算子)的爬山能力.T SR 算子作为重组算子,使用一个长度为T 的禁忌表,表中记录染色体的适应值,渴望水平取作父代群体适应值的平均值.进行TSR 操作时,首先把子代的适应值同渴望水平相比较,如果比渴望水平好,则破禁,即这个子代染色体进入到下一代之中;如果子代比渴望水平差,但不属于禁忌,也接受这个子代;若是属于禁忌,则选择最好的那个父代进入到下一代中,具体过程如图4所示:beg in if fitness of x >av erage value o f po pulatio n,then accept x else if offspring x is not in tabu list accept x else choose the better of tw o parents to the nex t g eneratio n; upda te tabu list;end 图4 T SR 的重组过程·31·1998年9月 李大卫等:遗传算法与禁忌搜索算法的混合策略从TSR 的重组过程可以看出,具有高适应值的子代进入到下一代的机会是很大的,但是并不是所有的高适应值的子代一定都进入到下一代,因为TSR 使用了禁忌表,它可以限制适应值相同的子代出现的次数,因此可使群体中尽可能保持染色体结构的多样性,从而避免算法早熟.下面给出GA 与T S 的混合策略GATS :GATS 的求解步骤:Step 0参数设置(最大代数N gen ,群体规模N pop ,重组概率p c ,变异概率p m )Step 1令t =0;生成初始群体;Step 2计算当前代群体中染色体的适应值;Step 3选择:按滚轮方式选出N pop 个染色体,放入交配池中;Step 4重组 step 4.1生成0,1之间的随机数r i ,i =1,2,…,N pop ;如果r i <p c ,则交配池中第i 个染色体作为交叉的父代,产生均值为p c *N pop 个父代染色体; step 4.2对每对双亲进行交叉操作,产生两个子代; step 4.3调用TSR 对交叉后得到的子代进行重组;Stpe 5变异 step 5.1生成0,1之间的随机数r i ,i =1,2,…,N pop ;如果有r i <p m ,则调用T SM 对交配池中第i 个染色体进行变异操作; step 5.2t =t +1;如果t <N gen ,转Step 2;否则输出最优解,终止算法.4 GATS 的性能分析在这一节中,分别用GA 及GATS 算法求解具体的TSP 问题,对n =10,67的T SP 问题分别进行求解,所用的数据分别来自文[8,9].为了比较两个算法的性能,使用本单位独自开发的求解线性规划的软件包求得最优解.此外,关心引入TSM /T SR 算子是否能提高GA 的性能,所以并不是让GA 和GATS 都收敛.相反,算法在一个预先给定的代数上停止.4.1染色体的编码应用GA 解决TSP 问题时,通常使用自然数编码构造染色体,而不使用二进制编码[2].使用自然数编码的优点在于染色体比较直观,并且无论是进行交叉操作还是进行变异操作,染色体总是能够满足T SP 问题的约束条件,即总保持染色体对应的解是可行解.因此也使用自然数对染色体进行编码.例如: P ={8,2,4,6,1,5,7,3}P 为一个染色体,表示访问顺序依次为8,2,4,…,3,8.需要注意的是,因为访问路径是一个闭合的回路,所以两个不同染色体所表示的路径可能是相等的,因此适应值也应相等.例如: Q ={2,4,6,1,5,7,3,8}尽管Q 与P 是完全不同的染色体,但是两者所表示的是相同的路径,故P 与Q 的适应值也是相等的.4.2适应值T SP 问题是求最短路径,故染色体P 的适应值f (P )定义为:·32·系 统 工 程 学 报 第13卷 第3期 f (P )=C max -问题的目标值其中C max 是一个较大的正数,它保证适应值非负.4.3遗传算子在标准GA 中,交叉算子分别取PMX,CX 和OX 算子[2],变异算子为部分倒位操作,在GATS 中,利用TSR 进行重组,其中交叉算子也分别取PMX,CX 和OX 算子,变异算子为T SM.4.4初始群体采用随机生成的办法,随机地排列自然数1,2,…,n N pop 次,构成初始群体.在实验中,GA 及GATS 使用的参数为:群体规模取为30,交叉概率和变异概率分别为0.8和0.03.对于n =10,算法在搜索100代后停止.对于n =67,算法在搜索1000代终止.表1和表2给出了实验结果,图5和图6给出了使用PM X 时GA 和GAT S 的搜索过程.表1 10个城市T SP 问题的实验结果(单位:km )GA GATS 交叉算子PM X CX OX PM X CX OX 最好值839580737373最优值73表2 67个城市T SP 问题的实验结果(单位:km )GAGATS 交叉算子PM X CX OX PM X CX OX 最好值175317951780165316791672最优值1615图5 10个城市T SP 问题的G A 和GA T S 的搜索过程(PM X ) 图5中的目标值指的是每代群体中染色体对应目标值的平均值.从图5可以看出,GA 在40代之后才达到稳态,而GAT S 在6到10代为平稳的搜索过程,从第11代开始爬山,并在13代搜索到最优解. 对于67个城市TSP 问题,GA在400代搜索到的解为2875,600代为2217,800代为1753,而GAT S 图6 67个城市T SP 问题的GA 和G A T S 的搜索过程(PM X )在400代的解为1737,600代为1653,这个值与最优解比较接近.下面讨论不使用TSR 作为重组算子时对GAT S 算法(即在GA 中只使用TSM 作为变异算子)的影响.图7是对于67个城市的TSP 问题的搜索过程. 在这种情况下,GATS 的搜索曲线变化不大,仍然能够搜索到接近最优解的近优解,但是在700代之后才搜索到,因此可以说明TSR 的引入的确能够改善GATS 的搜索效率.·33·1998年9月 李大卫等:遗传算法与禁忌搜索算法的混合策略图7 未使用T SR 的G A T S 搜索过程(PM X)最后再讨论GATS 的计算量问题.GATS 的计算量由GA 和TS 的计算量构成.当群体规模为N 时,GA 的计算量是O (N 3)[2].但在实验中发现在相同代数下GATS 的执行时间略大于GA 的执行时间.如对67城市的TSP 问题,GATS 所用的时间约是GA 所用时间的1.2倍.多出的部分主要是因为在GAT S 中变异算子TSM 是一个搜索过程,所以要占用一部分时间.5 结 论用重组算子TSR 和变异算子TSM 取代标准GA 中的重组算子和变异算子,提出了GA 算法与TS 算法的混合策略GATS,使得GATS 混合策略在许多方面优于标准GA 算法.通过求解TSP 问题,可以看出GATS 既保持了GA 具有多个解(染色体)的优点,又提高了GA 的爬山能力.参考文献1 Holland J .Adaption in na tural and ar tificia l systems .The U niv er sity of Michig an Press ,Ann Arbo r ,19752 Goldberg D.Genetic a lg orithm in search,optimizatio n and machine lea rning.Addiso n-W esley Publish-ing ,19893 Glov er F .Future Paths fo r intege r prog ra mming a nd links to ar tificial intellige nce .Co mpute rs OpsRes.,1986;5:533~5494 Glov er F,Laguna M.Tabu sear ch.In M oder n Heuristic Techniques for Com bina torial Pro blems(Edit-ed by C.Reev es),O xfo rd :Blackw ell Scientific,19935 Ackley D .Stochastic iter ated genetic hillclimbing .Ph .D .Diss .,Dept .Co mp .Sci .CM U -CS -87-107,Ca rnegie M ello n U niv er sity ,M a rch 19876 M ǜh lenbein H .Para llel g ene tic algo rithms in combinato rial optimiza tio n.Co mpute r Science a nd Opera-tio ns Resear ch (Edited by Osman Ba lci ),O x for d:Per gamo n Pr ess ,19957 Glov er F ,Kelly J ,Lag una M .Gene tic algo rithms a nd ta bu sea rch :hy brids fo r optimizatio ns .Co mput-ers Ops.Res.,1995,22(1):111~1348 Fo ulds L.Co mbinato rial fo r under g radua tes.Spring -V erlag N ew Yo rk Inc.,19849 Nemhanser G ,W olsey L .Integ er and com bina torial optimiza tio n .Wiley -Inter Science ,1986·34·系 统 工 程 学 报 第13卷 第3期。

基于禁忌搜索算法的网格任务调度

基于禁忌搜索算法的网格任务调度

基于禁忌搜索算法的网格任务调度陈锋1,刘宗田1,石振国1,2,王莉11上海大学计算机工程与科学学院,上海 2000722南通大学计算机学院江苏 226007摘要:网格任务调度就是按照一定的规则,将用户提交给网格环境中的任务分配给资源中的各个节点的过程。

合理的任务调度算法可以在很大程度上提高网格系统的有效利用率。

在网格环境中,用户希望自己的任务尽可能快的得到完成,而网格环境则希望尽可能充分的利用所有节点。

针对这种情况,本文提出了基于禁忌搜索算法的网格任务调度。

具有较小的时间复杂度和良好的调度性能。

通过实验证明了其正确性和实用性。

关键字:网格任务调度禁忌搜索算法the Grid Task Scheduling Base on TabuSearch AlgorithmChen Feng, Liu Zong-tian, Shi Zhen-guo, Wang Li(School of Computer Engineering and Science, Shanghai University, Shanghai, China, 200072)Abstract: Task scheduling in grid environment is assigning the tasks which is submitted to the grid environment to some resources, according to some rules. A good task scheduling algorithm can improve the usage of the grid environment dramatically. In the grid environment, the users hope their task be completed as quickly as possible, but the environment wishes the resources be employed as more as possible. For this situation, the essay propose the tabu search algorithm which has less time complexity and better performance. The experiment proves it is correct and useful.Keywords: grid, task scheduling, tabu search algorithm1 引言网格是基于互联网的分布式计算环境。

遗传算法与禁忌搜索算法的融合策略与实施指南

遗传算法与禁忌搜索算法的融合策略与实施指南

遗传算法与禁忌搜索算法的融合策略与实施指南引言:在解决复杂问题的过程中,计算机算法起着至关重要的作用。

遗传算法和禁忌搜索算法是两种常用的优化算法,它们分别从生物进化和搜索空间中的禁忌区域的角度出发,具有独特的优势。

本文将探讨如何将这两种算法进行融合,以提高问题求解的效率和准确性。

一、遗传算法概述与优势遗传算法是模拟生物进化过程的一种算法,通过模拟自然选择、交叉和突变等过程,逐步优化问题的解。

其基本步骤包括初始化种群、选择操作、交叉操作和变异操作。

遗传算法具有以下几个优势:1. 并行性:遗传算法可以同时处理多个个体,加速了问题求解的过程。

2. 全局搜索能力:由于遗传算法采用随机的方式进行搜索,可以避免陷入局部最优解,从而更有可能找到全局最优解。

3. 适应性:遗传算法可以根据问题的具体情况进行调整,以适应不同的求解需求。

二、禁忌搜索算法概述与优势禁忌搜索算法是一种基于局部搜索的优化算法,通过设置禁忌表来避免搜索过程中陷入局部最优解。

其基本步骤包括初始化禁忌表、定义邻域操作、选择最优解和更新禁忌表。

禁忌搜索算法具有以下几个优势:1. 局部搜索能力:禁忌搜索算法通过定义邻域操作,可以在局部搜索空间中进行精确的搜索,从而更有可能找到局部最优解。

2. 禁忌策略:通过设置禁忌表,禁忌搜索算法可以避免陷入局部最优解,从而有更大的机会找到全局最优解。

3. 灵活性:禁忌搜索算法可以根据问题的具体情况进行调整,以适应不同的求解需求。

三、遗传算法与禁忌搜索算法的融合策略将遗传算法与禁忌搜索算法进行融合,可以充分发挥两者的优势,提高问题求解的效率和准确性。

以下是一些常用的融合策略:1. 初始解生成策略:可以采用遗传算法生成一组初始解,然后使用禁忌搜索算法进行局部搜索,以找到更优的解。

2. 禁忌表的设计:可以根据问题的特点,设置合适的禁忌表长度和禁忌期限,以平衡全局搜索和局部搜索的效果。

3. 交叉和变异操作的调整:可以通过调整交叉和变异操作的概率,以控制遗传算法的全局搜索能力,从而更好地与禁忌搜索算法进行融合。

基于禁忌搜索和遗传算法的智能化双聚类方法

基于禁忌搜索和遗传算法的智能化双聚类方法

第27卷第3期2009年5月应用科学学报JOURNAL OF APPLIED SCIENCES—Electronics and Information EngineeringVol.27No.3May2009文章编号:0255-8297(2009)03-0282-06基于禁忌搜索和遗传算法的智能化双聚类方法吕玉龙1,沈青松1,石铁流2,王翼飞11.上海大学数学系,上海2004442.中国科学院上海生命科学研究院,上海200031摘要:在基因表达数据中寻找重要双聚簇的难度随数据规模的增长而增长.该文讨论一种智能化的双聚类方法,充分利用禁忌搜索和遗传算法自身的爬山能力,很好地平衡了区域搜索和全局搜索的关系,并使输出结果不依赖于预先设定的阈值.实验表明,该方法具有很好的收敛性,并可发现比传统方法更好的双聚簇.关键词:遗传算法;禁忌搜索;双聚类;基因表达数据中图分类号:O235文献标志码:AIntelligentized Biclustering Based on Tabu Search andGenetic AlgorithmLÜYu-long1,SHEN Qing-song1,SHI Tie-liu2,WANG Yi-fei11.Department of Mathematics,Shanghai University,Shanghai200444,China2.Shanghai Institutes for Biological Sciences,Chinese Academy of Sciences,Shanghai200031,ChinaAbstract:The degree of difficulty infinding significant biclusters in gene expression data grows with the increase of the size of the dataset.This paper presents an intelligent biclustering method which makes full use of the climbing ability of tabu search and genetic algorithm,balances relation between regional search and global search,and makes the results independent of a pre-defined threshold.Experiments show that the method has a better convergence property and can discover better biclusters than traditional methods.Keywords:genetic algorithm,tabu search,biclustering,gene expression data基因芯片,又称DNA芯片(DNA chip)或DNA微阵列(DNA microarray),可广泛应用于基因序列分析、基因突变分析、多态性分析和疾病的基因诊断等领域[1-2].基因芯片的信息挖掘已成为生物信息学研究的热点之一,特别是高密度的DNA微阵列,由于其载荷了成千上万个DNA片段,可用于高通量的生物学检测.通常,基因芯片检测的结果是一个N×M的表达矩阵A,其中N行对应基因,M列对应不同的试验条件(如不同的时间点、不同的细胞组织等).通常情况下,表达矩阵A代表的是由DNA芯片得到的杂交信号经对数转换和标准化后的强度值.矩阵A中的元素a ij表示基因i在条件j下的表达水平,而矩阵的第i行被称为基因i的表达谱.基因表达实验产生的表达谱是一个规模巨大的数据集合,通常涉及数以千万计的基因以及上百个样本,因此具有数据量大、维数高的特点.同时,由于生物体本身的复杂性,各基因的表达水平可能相差极大,也可能具有高度的相似性,呈现分散而无序的状态.在这些数据背后隐藏着丰富的信息,因此需要通过细致的数据挖掘工作来揭示这些信息,以得到有用的结果,最终目标是将生物检测数据转化为人们能直接理解的生物信息.聚类分析是非常重要的分析方法,其基本思想是在多元变量间定义距离或相似系数,用距离或相似系数来收稿日期:2008-10-29;修订日期:2009-02-26基金项目:国家自然科学基金(No.30871341);国家“863”高技术研究发展计划基金(No.2006AA02Z190);上海市教委重点学科建设基金(No.J50101);上海市重点学科基金(No.S30104)资助项目通信作者:王翼飞,教授,博导,研究方向:生物信息学、计算分子生物学、数据挖掘,E-mail:yifei_wang@staff第3期吕玉龙等:基于禁忌搜索和遗传算法的智能化双聚类方法283确定各个多元变量的关系,也就是分类情况[2-3].在基因表达谱分析中,这个多元变量就是基因向量(表达矩阵中的行)和样本向量(表达矩阵中的列).通过基因聚类可以得到一组或多组共表达的基因,每组基因的表达谱非常类似,具有相似的表达模式.另外,通过样本聚类,可以发现样本间的类型关系,或者发现新的样本类型,有助于确定和发现新的肿瘤类型,从而采取相应的诊断、治疗和预防措施.从生物学角度讲,聚类分析方法隐含的生物学意义或基本假设是:如果组内基因的表达谱相似,则它们可能具有相似的生物功能.大量功能相关的基因的确在相关的一组条件下有非常相似的表达谱,特别是被共同的转录因子共调控的基因,或者产物构成同一个蛋白复合体,或者参与相同的调控路径.因此可以对相似表达谱的基因进行聚类,从而得到未知基因的功能.常用的聚类方法主要有层次聚类、K-means聚类、自组织图(self-organizing map,SOM)聚类等.聚类分析得到的类要求类内基因在全部的样本下表达谱相似.但是,随着基因表达数据规模的增长,特别是样本数目的增长,要求基因表达谱在所有样本下都具有高相似性就变得不切实际了.另外,聚类分析得到的结果是互异的,即一个基因(试验条件)存在且仅存在于一个类中.显然,一个基因仅在一个生物进程中显现活性也是不符合实际的.为了发现部分试验条件下有高相似性的基因集合,同时一个基因又不局限于一个结果中,Cheng和Church提出了双聚类(biclustering)方法,得到的一个结果称为双聚簇(bicluster).相对于基因表达数据矩阵A,一个双聚簇就是矩阵A的一个子矩阵[4-5].第1次使用双聚类方法分析基因表达数据的是Cheng和Church[5].分析基因表达数据时,双聚类的搜索空间为2m+n,其中m和n分别为数据的行数和列数.Cheng和Church证明了寻找所有的双聚簇方阵是一个NP难题.因此,为了得到全局解,一些贪婪算法被应用到双聚类上.Cheng和Church提出了一种贪婪式的点删除算法(以下称为CC方法)来寻找一个双聚簇,并定义均方残差值H来衡量一个双聚簇的重要性.CC方法从整个表达矩阵A开始,逐步删除使H值减小最快的行和列,当矩阵的H值低于一个预设值δ后,再随机地添加被删除的行和列,同时保证添加后的子矩阵的H值不大于δ.由于CC方法“机械式”地删除点和添加点,所以在得到一个双聚簇后,需要利用随机数覆盖技术覆盖当前双聚簇对应的矩阵A中的元素,再运行CC方法得到下一个结果.后来的研究表明贪婪搜索算法容易陷入局部最优解,并且全局最优解或者最大的双聚簇很难被发现[6].另外,很难预先确定一个合适的δ值.于是人们希望应用随机搜索技术得到比贪婪搜索更好的结果.Stanfan等人[7]于2004年给出了基因表达数据双聚类分析的进化算法(evolutionary algorithm,EA)框架. 2005年Kenneth Bryan等人[8]将模拟退火算法(simulated annealing,SA)应用于双聚类分析并得到较好的结果,但是他们同样使用了CC方法中的随机数覆盖技术,容易丢失一些有意义的双聚簇.同年,A.Chakraborty和H. Maka[9]提出了基于遗传算法(genetic algorithm,GA)的双聚类算法,虽然避免了使用覆盖技术,但是标准的遗传算法收敛速度较慢,并且对δ值的依赖性较大.本文提出了一种基于禁忌搜索(tabu search, TS)和遗传算法的双聚类方法,称为TSGA(tabu search genetic algorithm)算法.TSGA算法基于Cheng 和Church提出的均方残差概念,利用禁忌搜索接受劣解的优点和遗传算法“适者生存”的思想,以随机初始解为初始种群,一次性产生符合需求数目的双聚簇.TSGA算法有以下3个特点:1)TSGA算法没有引入阈值δ,因此最终结果不受δ值的影响.而在CC算法、SA方法、GA方法中都引入了阈值δ.2)TSGA算法使用遗传算法的进化原则,绕开CC算法和SA方法中使用的随机数覆盖技术,避免了覆盖对下一步搜索产生的不利影响.3)TSGA算法可以同时得到满足需求数目的双聚簇,而CC算法一次只能产生一个双聚簇.1双聚类模型设X表示所有基因集合,Y表示所有条件集合,表达矩阵A的元素a ij表示第i个基因在第j个条件下的表达水平,二元数组B(I,J)表示一个子矩阵A IJ,其中I⊆X,J⊆Y.则子矩阵A IJ的均方残差H(I,J)为H(I,J)=1I Ji∈I,j∈J(a ij−a Ij−a iJ+a IJ)2其中,a Ij=1Ii∈Ia ij,a iJ=1Jj∈Ja ij,a IJ=1I Ji∈I,j∈Ja ij矩阵的均方残差H衡量了矩阵中数据相似性的高低. H越大,表明数据的相似性越低;H越小,表明数据的相似性越高.当H值为0时,此类数据的相似性最高,如常数矩阵.假设一个矩阵中的数据平均分布在[a,b]区间,则它的H值大约为(b−a)2/12.如果矩阵的实际H值小于估计值,说明该矩阵含有数据相似的子矩阵[5].下面给出双聚簇大小的概念.284应用科学学报第27卷定义1一个双聚簇的大小定义为S= I · J .其中 I (或 J )表示集合I(或J)包含的元素数目.接下来需要处理的问题就是如何寻找这些具有较低H值和较大S的子矩阵,希望获得的双聚簇中含有的基因数越多越好,H值越小越好.2遗传算法和禁忌搜索算法[1-2,10]生物在自然界中的生存繁衍,显示了生物体适应自然环境的优异能力.遗传算法所借鉴的生物学基础就是生物的进化和遗传.遗传算法是根据问题的目标函数构造一个适应值函数,对一个由多个解(每个解对应一条染色体)构成的种群进行评估、遗传操作、选择,经多代繁殖,获得适应值最好的(满足需求的)个体作为问题的最优解.禁忌搜索算法模仿人类的记忆功能,使用禁忌表来封锁刚搜索过的区域以达到避免迂回搜索的目的,同时赦免禁忌区域中的一些优良状态来保证搜索的多样性,从而达到全局优化.禁忌搜索算法采用邻域选优的搜索方法.为了逃离局部最优解,算法必须能够接受劣解,也就是每次迭代得到的解不必一定优于原来的解.但是,一旦接受了劣解,迭代可能陷入循环.为了避免循环,算法将最近接受的一些解放在禁忌表中,在以后的迭代中加以限制.即只有不在禁忌表中的较好的解才被接受为下一次迭代的初始解.经过一定次数的迭代后,最早进入禁忌表的解从禁忌表中解禁退出.简单地讲,禁忌搜索算法以禁忌表来记录最近搜索过的一些状态.对于当前邻域中的一个比较好的解,如果不在禁忌表中,那么选择它作为下一步迭代的初始解,否则宁愿接受一个比较差的但是不在禁忌表中的解;而如果某个解或者状态足够好,则不论是否在禁忌表中,都接受这个解.如此迭代,直至满足停止规则.同传统的优化算法相比,禁忌搜索算法具有如下优点:1)禁忌搜索算法能接受劣解,具有较好的爬山能力.2)禁忌搜索算法较好地平衡了区域集中搜索和全局分散搜索.相对于遗传算法,禁忌搜索有较快的收敛速度,并且禁忌搜索算法的局部搜索能力较强,具有较好的爬山能力.TSGA算法综合了遗传算法的进化思想和禁忌搜索方法的“禁忌”和“特赦”思想,不但可以实现遗传算法的“适者生存”策略,加速收敛速度,而且具有记忆功能,限制个体替换和交叉的频率.3TSGA算法TSGA算法以随机产生的解为初始解,通过二进制编码,以父代平均H值为适应值函数,采取选优策略保存较优的父代直接进入下一代,将禁忌搜索算法嵌入遗传算法的交叉和变异运算中,得到新的交叉算子TSR(tabu search recombination)算子和变异算子TSM(tabu search mutation)算子.TSGA算法的目标在于寻找H越小越好,S越大越好的最优解.TSGA的具体过程如下:1)编码方式:TSGA算法用一个二进制串编码一个双聚簇.二进制串的长度为N+M,即基因数N与试验条件数M的和.前面N个位点编码基因,后面M个位点编码条件.如果相对应的基因或条件在双聚簇中,则该位点的值为1,否则为0.2)初始种群:随机产生个数为种群数P的初始解.3)选择策略:TSGA算法采用两种选择策略.一种选择策略是选择当代种群中最好的P(1−r)个染色体直接进入下一代,这样保证了“选优”;另一种选择策略是以一定的概率随机选择P r/2对染色体进行交叉运算.其中,参数r的范围为0<r<1.4)禁忌表:使用一个短期禁忌表T1和一个中期禁忌表T2,禁忌对象为适值函数.T1记录交叉运算中父代的平均H值,作用是加速局部搜索;T2记录当代染色体的H值,目的是保证搜索结果的多样性,从而扩大搜索区域,达到全局搜索.显然中期表的长度为种群数P.5)特赦原则:在遗传运算中,父代产生的子代有以下几种情况:①H降低,S减小;②H降低,S增大;③H增大,S增大;④H增大,S减小.显然,最理想的结果是②,最坏的结果是④.本文将③作为特赦对象.TSGA算法的过程描述如图1所示.4实例分析本文用TSGA算法来分析CC方法中使用过的酵母基因表达数据,并对所得结果作进一步分析,得到了有统计学意义的结果.酵母的基因表达数据含2884个基因和17个试验条件[5].经对数变换后的数据分布于[0,600],缺失值用−1表示.该数据的H值大约为30000.本文的TSGA 算法中停止准则为最大迭代次数100,种群数为100,交叉率为0.7,突变率为0.1.每次循环时间约为1.5s.在TSGA得到的10次结果中,平均基因数分布在[70, 230],约98%的H值分布在[200,1000].图2显示的是运行TSGA算法10次,平均H的变化情况.由图2可以看出,TSGA具有很好的收敛性和稳定性.图3显示了6个双聚簇的表达谱分布情况.它们对应的类号、H值、基因数、条件数分别为:(bic3,381.81,88,5),(bic17,370.66,76,5),(bic30, 425.89,73,7),(bic60,620.44,84,9),(bic70,566.14,70, 11),(bic95,460.41,91,5).在这个结果中,双聚簇包含的基因数分布在[60,194],98%的双聚簇的H值分布在第3期吕玉龙等:基于禁忌搜索和遗传算法的智能化双聚类方法285[320,1000],平均H 值约为614.在Tavazoie 等人[11]应用聚类方法分析酵母数据得到的30个类中,H 值分布在[261,996],说明H 值分布在这个区间的双聚簇可能是有意义的.这也说明主观限制H 值会丢失一些有意义的双聚簇.另外,聚类结果包含的基因数目分布在[49,186].根据双聚类的特性,得到的双聚簇含有的基因数应该接近这个范围.而在Cheng 和Church 公布的100个双聚簇中,有近31%的双聚簇包含的基因数目小于10,有25%的双聚簇包含的基因数超过250个,即得到的双聚簇包含的基因数目两极分化比较厉害.TSGA 算法得到的双聚簇包含的基因数分布较合理,H 值分布也比较合理.出现这种情况的原因可能是CC 方法限制δ值为300,而过低的δ值可能会导致31%结果包含的基因数小于10,这也说明主观预先确定一个合适的δ值是很困难的.TSGA 算法没有引入δ,而是利用进化和特赦思想来达到收敛的目的,这也可能是结果的H 均大于300的原因.下面将说明TSGA 算法得到的结果具有很好的统计学意义.图1TSGA 算法流程图Figure 1Flowchart of TSGA4505005506006507007508008509000102030405060708090100iteration numbera v e r a g e H s c o r e图2TSGA 的10次不同运行过程Figure 210different computing processes of TSGA首先将TSGA 算法和CC 方法得到的双聚簇与酵母的通路数据库作p 值计算.表1列出了两种方法的p 值分布情况.其中,TSGA 算法的统计数是10次结果的平均值.p 值为0的可能原因是舍入误差.由表1可以看出,TSGA 方法得到的结果有89%介于10−5和10−3之间,而CC 方法只有49%,并且CC 方法中无效的p 值为17%,而TSGA 算法为0.这说明TSGA 的结果具有较好的统计学意义.基因的表达在很大程度上受到一些转录调控元件的控制.这类转录调控元件本质上就是一些比较短的DNA 片段(在生物信息学中也称为模体或motif).这些motif 一般都处在受调控基因的上游区域,特异性DNA 结合蛋白(即转录因子)识别这些调控元件,并286应用科学学报第27卷与之结合,调节基因的转录和表达;或者由RNA 结合蛋白识别,并与之结合,影响RNA 的修饰、定位、翻译和降解.因此,分析和识别motif 以及了解它们的功能是理解和解释整个基因组行为的重要步骤.双聚簇中的基因是共表达的(co-expressed),因此可以分析这些共表达基因的启动子上游区域,以揭示具有高度代表性的序列模体的存在.表1TSGA 和CC 算法的p 值分布Table 1The p _value distribution of TSGA and CC %method name NA 010−510−410−3TSGA 08.8 3.326.459.3CC1734122512-2002000400600-2002000400600-2002000400600-2002000400600-2002000400600-2002000400600e x p r e s s i o n l e v e le x p r e s s i o n l e v e le x p r e s s i o n l e v e le x p r e s s i o n l e v e le x p r e s s i o n l e v e le x p r e s s i o n l e v e lbic3bic60bic70bic95bic17bic30204050601005010005010050100050100图36个双聚簇的表达谱Figure 3Expression profile of 6biclusters为说明TSGA 算法得到的结果具有很好的统计学意义和生物学意义,进一步分析一个通路(pathway)中共表达基因的motif.经统计,110个酵母通路的两两组合包含的共同基因数大部分低于4个.因此,只分析一个通路中的共表达基因.分析步骤如下:1)挑选p 值量级低于10−4的双聚簇,并求出该双聚簇与对应通路包含的共同基因,得到通路中共表达的基因.2)通过酵母转录因子数据库SCPD 获取基因的上游1000bp 的序列[12].3)对每组基因,使用工具BioProspector 寻找出匹配最好的motif.4)对这些motif ,使用工具Stamp 在酵母数据库Maclsaac 中搜索最相似的转录因子结合位点(trans-cription factor binding sites,TFbs).如果一个motif 有符合要求的TFbs ,说明在一个通路中共表达的基因同时受到该转录因子的调控.如果一个motif 没有搜索到匹配的TFbs ,但是p 值又非常小,则在统计学上可以预测这些基因同时受到该motif 的调控.表2列示了部分双聚簇中基因的motif 的相关信息.其中E 值的量级上限为10−4.由表2可以看出,虽然TSGA 算法得到双聚簇的H 值超过CC 方法的阈值300,但是在统计学上仍能得到有意义的结果.特别是bic61和bic89,虽然两个双聚簇的H 值分别为619.06和894.93,远超过其他方法中的阈值300,但是仍位于区间[261,996]内,并且二者的p 值和E 值都很小,说明两个通路中共表达的这些基因很有可能分别受到转录因子SEP1和AZF1的调控.另外,在bic19和bic89中,尽管是两个不同的通路,但是这两个通路中的9个基因都受到同一个转录因子AZF1的调控,这也说明了转录因子调控的网络性和复杂性.表2也再次说明了主观预先设定阈值δ会丢失一些有意义的双聚簇.第3期吕玉龙等:基于禁忌搜索和遗传算法的智能化双聚类方法287表2Motif分析结果Table2Results of motif analysisbic#H pathway ID common genes best motif p_value motif matche E_value19390.38sce00780YDL141W,YGR286C,GTAAACGAATTAC1.18E-08AZF1 6.32E-05YNR058W/GTAATTCGTTTACYHR018C,YJL071W,GCCGATGATACAGG41799.37sce00220YJL088W,YLR146C,/CCTGTATCATCGGC 3.00E-04CHA47.78E-04YPR069C61619.06sce00710YLR089C,YOL126C,ATATATGTGT2.22E-64SFP1 1.53E-07YOR347C/ACACATATATYDL182W,YIR031C,TTTTTTTTTTTCTTTTTTTTCTT89894.93sce00620YKL029C,YOL126C,/AAGAAAAAAAAGAAAAAAAAAAA3.64E-09AZF17.12E-14 YOR347C,YOR374W5结语基因表达数据的分析是生物信息学的研究热点和难点之一.转化为数学问题,基因表达数据分析的任务就是从表达数据矩阵中找出显著性结构,包括全局模式和局部模式.通常的聚类分析,如层次聚类、K均值聚类和自组织图聚类等,得到的结果是全局模式,并且结果之间是互异的.双聚类方法得到的结果是局部模式与全局模式的混合模式,其中大部分结果为局部模式,并且解决了互异性的问题.本文介绍了一种基于禁忌搜索(TS)和遗传算法(GA)的双聚类方法——TSGA算法.TSGA算法是一种智能化的双聚类方法,它将禁忌搜索的“禁忌”和“特赦”思想嵌入到遗传算法的遗传操作中,很好地平衡了区域集中搜索和全局搜索的关系,避免了由于阈值的主观设定而造成有意义结果的丢失,具有很好的收敛效果.另外,随着数据规模或输出结果数量的增长,TSGA算法将会花费较长的运行时间.通过实例分析,TSGA方法能够得到更好的具有统计学意义的结果,进一步说明了δ值的主观设定容易丢失一些有意义的结果.参考文献:[1]王翼飞,史定华.生物信息学——智能化算法及其应用[M].北京:化学工业出版社,2006:211-243.W ang Yifei,S hi Dinghua.Bioinformatics—intelligent algorithms and application[M].Beijing:Chemical In-dustry Press,2006:211-243.(in Chinese)[2]李瑶.基因芯片数据处理与分析[M].北京:化学工业出版社,2004,9:162-180.L i Yao.Gene microarray data analysis and process-ing[M].Beijing:Chemical Industry Press,2004,9:162-180.(in Chinese)[3]J iang Daxin,T ang Chun,Z hang Aidong.Clusteranalysis for gene expression data:a survey[J].IEEETransactions on Knowledge and Data Engineering, 2004,16(11):1370-1386.[4]M adeira S C,O liveira A L.Biclustering algorithmsfor biological data analysis:a survey[J].IEEE/ACM Transactions on Computational Biology and Bioinfor-matics,2004,02:24-25.[5]C heng Y,C hurch G M.Biclustering of expressiondata[C]//Proceeding Intelligent Systems for Molecular Biology’00.[S.l.]:AAAI Press,2000:93-103.[6]Y ang Jiong,W ang Haixun,W ang Wei,Y u Philip.Enhanced biclustering on expression data[C]//IEEE Third Symposium on Bioinformatics and Bioengineer-ing,2003.[7]B leuler S,P relic A,Z itzler E.An EA frameworkfor biclustering of gene expression data[C]//Congress on Evolutionary Computation,2004:166-173.[8]B ryan K,C unningham P,B olshakova N.Biclus-tering of expression data using simulated anneal-ing[C]//Proceedings of the18th IEEE Symposium on Computer-Based Medical Systems(CBMS’05),IEEE, 2005,05:1063-7125.[9]C hakraborty A,M aka H.Biclustering of gene expres-sion data using genetic algorithm[J].IEEE,Computa-tional Intelligence in Bioinformatics and Computational Biology,2005:1-8.[10]汪定伟.智能优化方法[M].北京:高等教育出版社,2007,4:81-113.W ang Dingwei.Intelligent optimization methods[M].Beijing:Higher Education Press,2007,4:81-113.(in Chinese)[11]T avazoie S,H ughes J D,C ampbell M J,C ho R J,C hurch G M.Systematic determination of genetic net-work architecture[J].Nature Genetics,1999,22:281-285.[12]Z hu Jian,Z hang Michael.SCPD:a promoter databaseof the yeast Saccha-romyces cerevisiae[J].Bioinformat-ics,1999,15:563-577.(编辑:欧阳丽霞)。

禁忌搜索算法用于解决网络路由问题

禁忌搜索算法用于解决网络路由问题

传输 时 延 求 解 从 某 一 个 路 由器 出 发 到 达 另 一 个路 由器 的 最
,
,

禁 忌 约 束 有 一 些 限 制 条件 使 得 某 些 移 动 是 被 禁 止 的
,

,
短 时 延 这 就 是 路 由选 择 问 题 从 数 学 的 角度 可 简 化 为 在 由
,

这 些 被 禁 止 的 移 动 被 称 为 被禁 忌 的 被 禁 忌 的 移 动 被放 在 一
,
简称为服 务 器 执 行 在该 类 系统 中 的 任务分 配 策略 对服务 质
量起着决 定 性 作 用


性能评价标 准 定义 延迟
间隔时 间

任务 从 进 入 系 统 到 正 式 被 处 理 的 任务 延 迟 与其 处 理 时 间 需 在指定 服 务 器 完成任 务 的
系统 内所有 任 务 的延 迟 比 均

计 算 机 仿真
在 本 节 中我 们 通 过 两 个 例 子 来说 明所 提 出 的 算 法 的 有效 图
具有
个节 点 的 网 络 图
,
性 为 了 便 于 比 较 我 们 也对 同样 的 例 子 用 求解

,
,
算法进 行

网 络 图 由 图 所 示 它 是 一 个具 有
,
网 络 图 由图 所 示


的 路 由 替 换 掉 初 始 向 量 解 中原 来 从
, ,

,
的部 分 做 为
,
,
一 个 备 选 解 反 复 次 找 出 个 备选 解 在具 体 设 计 的 邻 域 算
法 中 我们 要 考 虑 如 何 防 止 找 到 的 从 到

基于禁忌搜索算法的网格任务调度

基于禁忌搜索算法的网格任务调度
A o d t s c e u i g ag rt m a mpr v e u a e o e g o k sh d l lo i a n h C i n o e t s g ft h h d e v r n n r m ai a l . n t e g i n io e t s r o e t e rts e n io me td a tc l I rd e v r n n ,u e s h p i a k b y h m h
[ s atT s h d l gi g devrn n sintetss u mie eg de vrn etosme eo re,codn merls Ab t c]aks e ui r n i metsoas k b t dt t r n i m n r c n ni o it g h a s t oh i o t o sucsac rigt s e. r oo u
CHEN n , U n -i n S he g o WANG Fe g LI Zo g t , HIZ n- u , a Li ( c o l f o ue n ie r ga dS i c , h g a U ies y S a g a 2 0 7 ) S h o mp tr gn e n n ce e S a h i nv ri , h h i 0 0 2 oC E i n n t n 、
c mp e e s q i k y a os i l , u e e v r nme twih st e r s u c sb m p o e s mo e a o sbl F rt s st to , e p p rp o os s o lt d a u c l sp sb e b t n i h t o n s e e o r e e e l y d a r sp s i e. o i i n t a r p e h hi ua h o h t e tbu s a c l o t m i h h sl s m ec a e r h ag rh wh c a st omp e iy a d b t r e f r n c . ee p rme t r v si i c r e ta d u e u . i e i l xt n e e ro ma e Th x e p i n o e s o r c s f 1 p t n

基于禁忌搜索的启发式任务路径规划算法

基于禁忌搜索的启发式任务路径规划算法

第17卷增刊V ol.17Suppl. 控 制 与 决 策 Control and Decision 2002年11月 N ov.2002 文章编号:1001-0920(2002)0S-0773-04基于禁忌搜索的启发式任务路径规划算法夏 洁,高金源,余舟毅(北京航空航天大学自动化科学与电气工程学院,北京100083)摘 要:基于启发式搜索和禁忌搜索技术,提出一种用于解决有限资源、不同重要性要求的任务路径规划问题的有效算法,通过对不同重要程度的任务进行分层调度,得到较为满意的决策结果。

该算法具有搜索空间小、求解速度快的优点。

仿真结果验证了算法的有效性。

关键词:任务调度;组合规划;禁忌搜索算法;启发式算法中图分类号:T P301 文献标识码:AHeuristics decision algorithm for missionpath planning based on tabu searchX I A J ie,GA O J in-y uan,YU Zhou-y i(Inst itute o f Auto mation Science and Electr ical Eng ineering,BeijingU niver sity of A er onautics and A str onautics,Beijing100083,China)Abstract:A method is presented based o n heurist ics and tabu sear ch alg or ithms,w hich can solve scheduling pr oblem o f mission path planning with differ ent pr io rit y and limit r esource.Sat isfying result can acquire by dividing t he missio ns in differ ent lay ers acco rding to their pr io rit y and scheduling in these lay ers.T he scheduling algo rithm has the advantag e o f small sear ching space and hig h so lv ing speed.T he simulation r esults sho w the efficiency o f the alg or ithm.Key words:scheduling;co mbinatio n;tabu search algo rithm;heuristics alg or it hm1 引 言 已知任务领域空间分布有多个任务点,这些任务点均具有不同的重要程度,任务执行者需要从某个给定的点出发,利用给定的有限资源,执行任务集合中的某些任务,最后要到达某个给定点。

关于遗传_蚁群_禁忌搜索算法的比较

关于遗传_蚁群_禁忌搜索算法的比较
1 基本思想
组合优化问题是遗传算法、蚁群算法、禁忌搜索算法共 同应用的领域,组合优化问题实质上是建立问题的目标函数, 求目标函数的最优解,因而问题转化为函数优化问题。
(1)
- 18 -
SOFTWARE DEVELOPMENT AND DESIGN
软件开发与设计
(1) 式中
── 被优化的目标函数; ci、
出的一种新型的模拟进化算法,称为蚁群系统 (ant colony sys-
tem)。采用该方法求解旅行商问题 (TSP)、任务分配问题
(assignment problem)、job shop 调度问题,取得了一系列较好
的实验结果。受其影响,蚁群系统模型逐渐引起了其他研究
者的注意,并用该算法来解决一些实际问题。虽然对此方法
问题进行了研究,并结合模式定理得出一系列实验结果。他
们的工作为 GA 在这一领域的应用奠定了基础,但是传统 GA
解决实际问题也存在较大的缺点,如算法的收敛性。为此,
人们在应用时,常常在传统 GA 的基础上进行修改,并与其他
技术相结合,这样就出现了很多改进的遗传算法。一般的遗
传算法由 4 个部分组成:编码机制、控制参数、适应度函数、
遗传算子。主要步骤如下:
(1) 初始化 设置进化代数计数器 t←0,设置最大迭代数
T,随机生成 M 个个体作为初始群体,P (0)。
(2) 个体评价 计算群体,P ()t 中各个个体的适应度;
(3) 选择运算 将选择算子作用于群体;
(4) 交叉运算 将交叉算子作用于群体;
(5) 变异运算 将变异算 子 作 用 于 群 体 。 这 样 群 体 ,
最优解,这样就构成一个解序列,
选取其
中最小者,即为所要寻找的最优解。主要步骤如下:

基于遗传禁忌算法的贝叶斯网边定向方法

基于遗传禁忌算法的贝叶斯网边定向方法

Edge-oriented Approach of Bayesian Networks Based on Tabu Genetic Algorithm
LI Wei-wei1, WANG Jian-dong1, FANG Li-ming1, DING Jian-li2
(1. College of Information Science & Technology, Nanjing University of Aeronautics & Astronautics, Nanjing 210016; 2. College of Computer Science & Technology, Civil Aviation University of China, Tianjin 300300) 【Abstract】Aiming at the problems in process of orienting edges of Bayesian networks, a novel edge-oriented approach of Bayesian networks based on tabu Genetic Algorithm(GA) is proposed, which introduces the diversification of Tabu Search(TS) into the cross arithmetic operators and the variation arithmetic operators, and is applied into orienting edges of flight departure delay skeleton. Simulation experimental results show this approach is effective and feasible. 【Key words】Bayesian networks; Genetic Algorithm(GA); structural learning

遗传-禁忌搜索优化的Amorphous定位算法

遗传-禁忌搜索优化的Amorphous定位算法

遗传-禁忌搜索优化的Amorphous定位算法胡伟;袁三男【摘要】在无线传感网络WSN(Wireless Sensor Networks)定位算法领域内,Amorphous定位算法存在节点定位误差大的问题.为提高传统Amorphous算法对未知节点的定位精度,该文提出基于Amorphous定位算法的遗传禁忌搜索算法IAmorphous-GATS(Improved Amorphous Genetic-Algorithm Tabu-Search Location).首先通过Amorphous算法得到未知节点位置的初始解;然后利用遗传禁忌搜索算法优化初始解,从而可以得到未知节点的最优位置.为验证该算法能否提高传统定位方法的定位精度,该文使用MATLAB进行了仿真实验.仿真结果表明,优化后未知节点的定位精度得到了很大的提高.【期刊名称】《传感技术学报》【年(卷),期】2019(032)006【总页数】6页(P940-944,949)【关键词】无线传感网络;非测距定位;节点定位;Amorphous算法;遗传禁忌搜索【作者】胡伟;袁三男【作者单位】上海电力学院电子与信息工程学院,上海200082;上海电力学院电子与信息工程学院,上海200082【正文语种】中文【中图分类】TP273随着近距离、低功耗无线通信技术的发展,无线传感器网络WSN(Wireless Sensor Networks)技术在现代社会中扮演着越来越重要的作用[1]。

定位技术不仅是无线传感器网络技术中重要组成部分,也被人们广泛应用到生活中的各个领域[2]。

在对未知节点定位的过程中,根据是否对已知节点进行实际测量,可以把定位算法分为测量距离定位算法和无距离测量定位算法[3-5]。

基于距离测量的定位算法通常有基于到达时间的ToA测距、基于到达时间差的TDoA测距、基于到达角度的AoA测距和基于接收信号强度的RSSI测距等;无需测距的常见算法有质心算法、DV-Hop算法、APIT算法和Amorphous算法等。

基于融合小生境遗传禁忌算法的多目标网格任务调度研究的开题报告

基于融合小生境遗传禁忌算法的多目标网格任务调度研究的开题报告

基于融合小生境遗传禁忌算法的多目标网格任务调度研究的开题报告一、课题背景及研究意义多目标网格任务调度在云计算、集群计算等大规模计算中起着重要作用,旨在实现任务的高效调度和资源的优化利用。

然而,随着任务规模的增大和复杂性的增加,传统的调度算法面临着许多挑战,如调度时间长、调度效率低、资源利用率低等问题。

目前,有许多学者和工程师致力于解决这些问题,其中融合小生境遗传禁忌算法被认为是一种高效的多目标优化算法,可以有效地解决多目标网格任务调度问题。

融合小生境遗传禁忌算法是将小生境算法与遗传禁忌算法相结合,通过对因子种群的优化和约束条件的限制,以提高遗传算法的搜索精度和禁忌搜索算法的全局搜索能力。

这种综合算法的研究可以在多目标网格任务调度中发挥重要作用,提高调度效率和资源利用率。

二、研究内容本文旨在研究基于融合小生境遗传禁忌算法的多目标网格任务调度问题。

具体包括以下内容:1. 多目标网格任务调度的研究现状和存在的问题进行分析和总结。

2. 综合考虑多个任务的调度和资源利用率等多个约束条件,构建多目标优化模型。

3. 针对多目标优化模型,设计融合小生境遗传禁忌算法,提高优化算法的搜索精度和全局搜索能力。

4. 在现有网格系统中进行仿真实验,对比不同算法在多目标网格任务调度中的效果,并进行实验分析。

5. 进一步优化算法,提高调度效率和资源利用率。

三、研究方法本研究采用实验研究和仿真实验相结合的方法,通过实验对比不同算法在多目标网格任务调度中的效果,并进行实验分析,从而得出结论。

在具体研究方法上,主要包括以下步骤:1. 对多目标网格任务调度的研究现状和存在的问题进行分析和总结。

2. 构建多目标优化模型,综合考虑多个任务的调度和资源利用率等多个约束条件。

3. 针对多目标优化模型,设计融合小生境遗传禁忌算法,提高优化算法的搜索精度和全局搜索能力。

4. 在现有网格系统中进行仿真实验,对比不同算法在多目标网格任务调度中的效果,并进行实验分析。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
维普资讯
第 2 卷 第 3 8 期
Vo . 1 28 N O. 3
计 算 机 工 程 与 设 计
Co mp t rE g n e n n sg u e n i e r g a d De i n i
20 年 2 07 月
Fe b.2 0 0 7
基于遗传禁忌搜索的网格资源选择算法
胡 洁 , 郭 绍 忠 , 陈 海 勇
( 解放 军信 息 工程 大 学 信 息工程 学院 ,河 南 郑 州 4 0 0 ) 50 2
摘 要 : 源 是 网格 的 主 体 , 立 网 格 的 目的 就 是 要 管 理 好 的 各 种 网 格 资 源 , 大程 度 地 实现 资 源 共 享 。 把 网 格 上 的 资 源 和 资 建 最
法 相 比 , 效 地 提 高 了搜分 散 的资 源 集 合 起 来 , 网格 用 户 不 需 要 了解 网 格 使
上 资 源 的 具 体 细 节 , 可 以 使 用 自 己 需要 的 资 源 。在 网 格 环 就 境 下 , 源 的地 理 分 布 以及 异 构 性 都 对 资源 调 度 产 生 一 定 影 资 响 , 满 足 作 业 要 求 的 计 算 资源 组 合 可 能 不 只 一 个 , 择 不 同 且 选 的资 源 , 代 价 和 性 能 也 不 相 同 。 网格 资 源 选 择 的 目的 就 是 其 为 用 户 提 交 的作 业 选 择 一 个 最 优 的 资 源 组 合 ,以最 小 的 代 价 获 得 满 意 的性 能… 在 近 年 的 资源 选 择 算 法 研 究 中 , 为 常 见 。 较
中图法分 类号 : P 0 . T 31 6
文献标 识码 : A
文章 编号 :0 072 2 0 ) 30 1-3 10 .0 4(07 0-520
Grdr s u c ee t n ag r h b s do a u s a c n e ei i o r es lci l o i m a e n T b e r h a d g n t e o t c
A src:R suc i jc e r .T e ol f s bi met f d saig o d n gmet fh sucs c i i b tat eores n betn h i h ao et lh n 鲥 kn o ae n te eo e,ahe n ima o it g d g a s o it g ma o r r vg rsuc . eo re Ma h g e e t i t n鲥 drsuc duesd mad dsp ligal e eo c, ihues a s, r oe at o c n b we o e sr e n s pyn lt su e e r a n ’ n a u r r whc sr C ue ecr r f h n a p s 鲥 d n ae n. o a z r n suc lco  ̄grh a d ae n lao e a e a oi m eetd T e d atg s ma g met T l e ur teo e eet n o tm, sd lb v, w g rh ip sne . v a e n a y c e r r s i i n b o a n l t sr h a n
o t b a c l o t m dg n t l o t m ec mb n d Ut i i gt b s t mi h b d z f e e i l o t m d e c p et g f u s r h ag r h a e e i ag r h a o a e i n c i r ie . i z u l t o l t y r ieo g n t ag r h a s a eg t n ln a i i i c i n i i t c l e c . F n l , n w l o i m s o a e e ei l o i n ol a a h o sr i al y e ag rt i c mp d t g n t ag rt . h r o c m h Ke r s g i ; r s u c e e to ; g n tcag r h ; T b e c ; g o u y wo d : r d e o e s lc i n r e e i l o i t m a usa h r lb s
用 户请求进 行 匹配 , 把合 适 的可用 资源提供 给用 户使用是 网格 管理 的核心 内容 。分析 了 目前 常用的 资源选择 算法 ,并在 此 基础 上 , 出了一种新 的算 法。该 算法结合 了遗传 算法和 禁 忌搜 索算法 的优 点 ,利用 禁忌搜 索 中的禁忌 列表 来对 遗传 算法 提 中交换进行 有效 的限制 , 避免 进入局部 搜 索。最后 通过试验 将新 算 法与遗传 算法进 行 比较 。 关键 词 : 网格 ; 资源选择 ; 遗传 算法; 禁 忌搜 索;开放 网格 项 目

0 引 言
网格 是 继 万 维 网之 后 出 现 的 新 型 网 络 计 算 平 台 , 把 地 它
起 ,提 出 了 基 于 遗 传 禁 忌 搜 索 的 网格 资 源 选 择 算 法 。 随 后
采 用 典 型 应 用 进 行 仿 真 。 仿 真 结 果 表 明 :新 的算 法 与 遗 传 算
HU i, GUO h o z o g CHEN i o g Je S a —h n , Ha— n y
( ol e fnoma o n ier g P A Ifr ao n ier g nv rt,Z egh u4 0 0 , h a C lg fr t nE gne n , L o t nE gne n iesy h n zo 5 0 2 C i ) e oI i i n m i i U i n
相关文档
最新文档