遗传算法简介及代码详解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
遗传算法简述及代码详解
声明:本文内容整理自网络,认为原作者同意转载,如有冒犯请联系我。
遗传算法基本内容
遗传算法为群体优化算法,也就是从多个初始解开始进行优化,每个解称为一个染色体,各染色体之间通过竞争、合作、单独变异,不断进化。
遗传学与遗传算法中的基础术语比较
染色体:又可以叫做基因型个体(individuals)
群体/种群(population):一定数量的个体组成,及一定数量的染色体组成,群体中个体的数
量叫做群体大小。
初始群体:若干染色体的集合,即解的规模,如30,50等,认为是随机选取的数据集合。适应度(fitness):各个个体对环境的适应程度
优化时先要将实际问题转换到遗传空间,就是把实际问题的解用染色体表示,称为编码,反过程为解码/译码,因为优化后要进行评价(此时得到的解是否较之前解优越),所以要返回问题空间,故要进行解码。SGA采用二进制编码,染色体就是二进制位串,每一位可称为一个基因;如果直接生成二进制初始种群,则不必有编码过程,但要求解码时将染色体解码到问题可行域内。
遗传算法的准备工作:
1) 数据转换操作,包括表现型到基因型的转换和基因型到表现型的转换。前者是把求解空间中的参数转化成遗传空间中的染色体或者个体(encoding),后者是它的逆操作(decoding)
2) 确定适应度计算函数,可以将个体值经过该函数转换为该个体的适应度,该适应度的高低要能充分反映该个体对于解得优秀程度。非常重要的过程。
遗传算法基本过程为:
1) 编码,创建初始群体
2) 群体中个体适应度计算
3) 评估适应度
4) 根据适应度选择个体
5) 被选择个体进行交叉繁殖
6) 在繁殖的过程中引入变异机制
7) 繁殖出新的群体,回到第二步
实例一:(建议先看实例二)
求 []30,0∈x 范围内的()2
10-=x y 的最小值 1) 编码算法选择为"将x 转化为2进制的串",串的长度为5位(串的长度根据解的精度设 定,串长度越长解得精度越高)。(等位基因的值为0 or 1)。
2) 计算适应度的方法是:先将个体串进行解码,转化为int 型的x 值,然后使用()210-=x y 作为其适应度计算合适(由于是最小值,所以结果越小,适应度也越好)。
需要说明,将原目标函数设置为适应度函数是一种选择,但未必是最贴切的方法。
3) 正式开始,先设置群体大小为4,然后初始化群体 => (在[0,31]范围内随机选取4个整 数就可以编码)
4) 计算适应度Fi(由于是求解最小值,可以选取一个大的基准线1000
()2
101000--=x Fi ) 5) 计算每个个体的选择概率,选择概率要能够反映个体的优秀程度。这里用一个很简单的 方法来确定选择概率
)(/Fi TOTAL Fi p =
6) 选择
根据所有个体的选择概率进行淘汰选择。这里使用的是一个赌轮的方式进行淘汰选择。先按照每个个体的选择概率创建一个赌轮,然后选取4次,每次先产生一个0-1的随机小数,然后判断该随机数落在那个段内就选取相对应的个体。这个过程中,选取概率p 高的个体将可能被多次选择,而概率低的就可能被淘汰。
下面是一个简单的赌轮的例子
13% 35% 15% 37%
----------|----------------------------|------------------|---------------------------------|
个体1 个体2 个体3 ^0.67 个体4
随机数为0.67落在了个体4的端内,本次选择了个体4。
被选中的个体将进入配对库(mating pool ,配对群体)准备开始繁殖。
7) 简单交叉
先对配对库中的个体进行随机配对,然后在配对的2个个体中设置交叉点,交换2个个体的信息后产生下一代。
比如( | 代表简单串的交叉位置)
( 0110|1,1100|0 ) --交叉--> (01100,11001)
( 01|000,11|011 ) --交叉--> (01011,11000)
2个父代的个体在交叉后繁殖出了下一代的同样数量的个体.
复杂的交叉在交叉的位置,交叉的方法,双亲的数量上都可以选择.其目的都在于尽可能的培育出更优秀的后代
8) 变异
变异操作时按照基因座来的,比如说每计算2万个基因座就发生一个变异(我们现在的每个个体有5个基因座。也就是说要进化1000代后才会在其中的某个基因座发生一次变异)变异的结果是基因座上的等位基因发生了变化。我们这里的例子就是把0变成1或则1变成0。 至此,我们已经产生了一个新的(下一代)群体,然后回到第4步,周而复始,生生不息下去。
实例二:
为了便于理解,手工计算来简单地模拟遗传算法的各个主要执行步骤:
(1)个体编码 遗传算法的运算对象是表示个体的符号串,所以必须把变量 x1, x2 编码为一种符号串。本题中,用无符号二进制整数(编码方式较多)来表示。
因 x1, x2 为 0 ~ 7之间的整数,所以分别用3位无符号二进制整数来表示,将它们连接在一起所组成的6位无符号二进制数就形成了个体的基因型,表示一个可行解。
例如,基因型 X =101110 所对应的表现型是:x =[ 5,6 ]。
个体的表现型x 和基因型X 之间可通过编码和解码程序相互转换。
(2) 初始群体的产生
遗传算法是对群体进行的进化操作,需要给其淮备一些表示起始搜索点的初始群体数据。
本例中,群体规模的大小(随机选取)取为4,即群体由4个个体组成,每个个体可通过随机方法产生。
如:011101,101011,011100,111001
(3) 适应度汁算
遗传算法中以个体适应度的大小来评定各个个体的优劣程度,从而决定其遗传机会的大小。
本例中,目标函数总取非负值,并且是以求函数最大值为优化目标,故可直接利用目标函数值作为个体的适应度(适应度函数可以有许多)。
(4) 选择运算
选择运算(或称为复制运算)把当前群体中适应度较高的个体按某种规则或模型遗传到下一代群体中。一般要求适应度较高的个体将有更多的机会遗传到下一代群体中。
本例中,我们采用与适应度成正比的概率来确定各个个体复制到下一代群体中的数量。其具体操作过程是:
• 先计算出群体中所有个体的适应度的总和 ∑===
M i M i fi FI 1),,1( ; • 其次计算出每个个体的相对适应度的大小),,1(/M i FI fi =,它即为每 个个体被遗传到下一代群体中的概率;
• 每个概率值组成一个区域,全部概率值之和为1;
• 最后再产生一个0到1之间的随机数,依据该随机数出现在上述哪一个概率 区域内来确定各个个体被选中的次数。(详见下图)