遗传算法导论(论文翻译)

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

遗传算法导论(论文翻译)
a遗传算法导论
潜在的能量是估计有多少序列的物理阻力将形成,如果要被迫合成为一个想要得到的
最优结构――耗费最小能量和最优适应性。

当然了,也有时候我们不想得到在形成物种中
最理想化的遗传物质结构(序列)结果的物理阻力。

评估它的存在性――如果不可能的话,这样是很困难的。

给定一个所需结果和理想结构(并且知道一些有关生物物理学的东西),我们就能通过计算氨基酸间彼此的相关作用力,而估计这种潜在的能量,因此,整个最优
规则将是可以计算的。

这些例子指出对于候选染色体在两种不同环境里的为实现独一无二能作为标记的抽象
编码序列的编码问题,而且在这种编码规则下的剩余空间有最优适度功能。

一个遗传算法
就是寻求一种最优适度序列的方法。

遗传算法
这个简单的遗传算法模型涉及到三种算法:选择、交叉(单向),还有变异。

选择:这种算法通过选择种群中的染色体而再造种群,染色体装配工,很多时候就像
被选择性地再生产。

交叉:这种算法任意地选择一个点,然后交换结果,在两个染色体创造出两个后代的
序列节点前前后后,例如,序列为10000100和11111111能在它们每三次创造出两个子代
之后实现交叉,交叉就能粗糙地在两个被称为单倍体的有机体间发生交叉或者生物物理重组。

变异:这种算法是随机抛出染色体上的一些序列,例如序列号为0000100将在第二个
序列点上产生01000100序列,变异也能以一个很小的概率值(0.001)发生子啊同一个序
列的同意位点上。

1.6一个简单的遗传算法
我们给定了一个清晰的已定义好的问题去解决,并且一些序列表现是为了一个候补解
决方案,一个遗传算法按如下的步骤进行:
1. 初始化一个有n*l长的染色体随机子代(问题的候选解决方案);
2. 计算种群
每条X染色体的最优序列函数f(x); 3. 重复以下步骤直到第n群子代被创造出来;
a.在当前种群中选择一双父代染色体,这可能会受到不变增长变化着的最优动能影响,选
择是在“无可替代”的条件下为完成的,意味着,一些相同的染色体可以被多次选择
直到它们成为父代。

b.以Pc的可能性(交叉概率)下,以随机选择节点的方式开始交叉(带着均衡概
念被选
中)会形成两个子代,如果交叉没有发生,形成的两个子代简单地为各自父代染色体
的复制,这里的概率定义为两个单倍体父代染色体交叉的可能性,同时人工智能是关于
“交叉点”的,交叉率定义为两条父代染色体发生交叉位置处的一个序列号。

c.产生
突变的两个子代在这个序列号处的发生概率为Pm(突变率),并且在新的子代中标
记产生变异的染色体序列号。

如果n为奇数,新的子代将被随机地抛弃掉。

4. 用新的种群取代当前一代; 5. 开
始步骤2;
这个步骤的每一次迭代被称为一代,人工智能算法典型的迭代次数为50――500次甚
至更多次。

一个完整的种群形成称之为一个周期,在周期最后,种群中会产生一个或者多
个高适度的染色体。

自从随机性在每个周期里扮演者一个大角色,两个循环里带着不同概
率的变异体将很普遍地产生不同的复杂表现。

遗传算法研究者通常报告数据(例如一个循
环中最优适度的寻找和一代种群中最优适应的每个个体将被发现)去平均遗传中相
关类似问题的许多不同代的情况。

这个简单的步骤被描述为GA的多种应用之基础,有很多细节还有待补充,例如种群
的大小,还有发生交叉变异的概率,一个算法的成功通常在很大程度上取决于这些细节,
同样也有一些复杂的GA版本(例如:GA在序列的表示函数f(x)和染色体的变异行为,如
交叉、突变等上也有很多种版本)。

这些例子将在接下来的章节里一一给出。

作为一个
简单的人工智能算法假设l(序列长)为8,序列函数f(x)等于X染色体一小部分序列的
编码数字(一个极端简单的适应功能,在这里仅仅是说明的功能),n(种群的大小)为4,Pc=0.7,Pm=0.001,(像自适应功能,l跟n取值仅仅是为简化问题而选择下来)许多典型的(n值在50―1000之间变动),给出的Pc,Pm的值也是一种对平均水平的估值。

最初的(任意的生成)的种群看起来像下表这样:
染色体 A B C D 序列编码 00000110 11101110 00100000 00110100 突变位点 2 6 1 3 一个关于GA的寻常选择方法是给予自适应性成比例选择,也在这很多次个体被期待去
再造,相当于它们在种群中自适性平均水平下所区分的自适应能力。

(这等同于生物学家
所说的“生殖能力”)。

第一部分遗传算法概述
一个实现自适应性成比例选择的简单方法是――“转盘循环取样法”(犹太老板1989),她在概念上等同于给予每个个体在它们的自适应区域里一部分循环取样能力,随
着转盘旋转,小球形成一种楔形薄片的聚集形状,并且那些一致水平的个体被选择。


n=4这个例子上面,转盘旋转4次,第一次两次旋转将选择B、C染色体作为父代,第二个
两次旋转选择B、D两条染色体做父代(事实上A染色体不能被旋转仅仅是由于抽签这种
游戏的侥幸可能性造成,如果转盘旋转多次,通常的结果是将接近理想值)。

一旦一对
父代被选择后,以Pc的可能性他们将杂交形成两个后代,如果它们不交叉,后代将是父
代双方的简单复制。

假若在上述的例子里,B和D第一次杂交得到的后代染色体序列为
E=10110110和F=01101110,B和C父代不杂交,取而代之将形成B和C的序列副本,接下来,每个后代将被概率为Pm的突变控制影响,每个后代。

假设后代E在第二个序列点出
突变为E=1011000,后代F和C没有发生交叉,那么后代B将形成B=01101110,这个序列
发生交叉处的节点在新一代种群中将遵循如下规则:染色体 E F C B
记在新一代中,尽管最优序列(6号位变异)丢失了,整体的自适应度从12/4降为
14/4,这种迭代程序将最终造成在每个序列里发生。

1.7遗传算法和传统的搜索方法
在之前的第一节里,我们用“搜索”这个词去描述GA的工作原理,这在其他在计算
机科学里的“搜索”这一意思形成对比。

关于“搜索”至少有三个意思
序列编码 10110000 01101110 00100000 01101110 突变位点 3 5 1 5 存储数据的检索:有一个问题是存在计算机内存里面的高级信息检索,假如你有一个特定顺序下建立的
关于“姓名”跟“住址”的大数据库,什么样的方法将是排好序的按“姓”这一关键字搜
索的最佳方式呢?“Binary式搜索”是查询出想要得到记录的一种有效方法。

Knuth (1973)描述和分析了许多这样的检索方法。

基于目标的最优路径搜索:有个问题是找到一种算法能在动态给定“出发点”下到目
的地的最佳路径。

这种搜索模式是许多人工智能算法里面的核心步骤,一个简单的例
子――对于每个学过人工智能的人都熟悉的是“8号难题”,这个在图表1.2里面有阐明。

标号为数字1――8的标题被记在中央处,留下一块空白区域,把一个相邻的数字滑到空
白处叫一次“移动”,图表1.2a阐明了一个寻找一种从起点区域移动到标题中给定方位
区域的算法问题。

一个关于符合该问题的“检索树”算法,在图表1.2b中有所阐明,“根”节点代表最初的起点,节点上的枝干指出它在此区域里所有可能移动方案下的结果,下面的树枝干含义类似。

这种搜索算法讨论了在人工智能环境下高效搜索出从起点到终点
的最佳(这里指最短)路径生成树。

典型的算法有“深度优先树”、“广度优先树”还有“A+平衡树”。

5 3 2 8
1 2 3 8 4 7 6 5 (a) 1 2 3 8
4 7 6
5 4 1 7
6 1 2 3 5 6
7
8 4 2 2 4 . . (b)
图表1.2:8号难题。

(a)问题是找到一种移动方案能从给定起始点到标题里指出的
区域(目标区域)。

(b)一个基于“8号难题”的部分搜索树。


解决方案的搜索:这是一种相对于“最优路径搜索”的更为综合的搜索法。

办法是在一个大区域候选结局方案里面通过“洪范式”遍历而找到一个该问题的最佳方案。

这其中也有
遗传算法里面所用到的检索方法。

这里,很明显在第一种和第二章方案里面有个很明显的区别。

第一种方案涉及到一个在有序存储的信息库里面找到一条记录(如:一条电话号码)的问题。

第二种方案里,需要检索的信息没有明确的存储法则,而且后续方案在每步搜索结束后才能开始确定,例如解决“8号难题”的人工智能检索法只有在一颗完整的检索树在其所有节点都存储完毕后才开始,最有趣的问题是一棵树里面有很多种不同的节点需要全部存储。

当然了,搜索树是基于一种特定的算法下一步步去形成的复杂结构,其目标是找到一种最好的或者高质量的解决方案,在只检查该搜索树的一小部分的情况下。

同样地,当用遗传算法检索一个候选方案空间时,不是所有可能的候选方案都能一次性地找到并代入计算;当然了,遗传算法里寻找一个最理想或最佳解决方案时只能检查一小部分可能的候选方案。

“解决方案的搜索”包含“基于给定终点的最优路径搜索”,当一种搜索树里的路径能被作为候选方案而编码时。

对于“8号难题”来说,候选方案可能只是从当前起点移动到一些其他区域的方案列表(只有终端节点是问题中所说的“终点”时才是最终的正确方案)。

然而,许多基于“最优路径搜索”问题都能被“AI搜索树”技术(这里的部分方案是可以评估)很好地得到解决,相比于遗传算法或者类似于遗传算法这样的技术(这里,所有的候选方案必须在其在评估前特有地构成)来说。

然而,标准的“AI搜索树”法(或者,更普遍的说法是构造图表检索法)不常用。

不是所有的问题都需基于路径搜索的。

感谢您的阅读,祝您生活愉快。

相关文档
最新文档