分布式估计算法讲解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

● 赌轮选择法
s4 0.31
s30.06
s1 0.14 s2 0.49
20
在算法中赌轮选择法可用下面的子过程来模拟: ① 在[0, 1]区间内产生一个均匀分布的随机 ② 若r≤q1,则染色体x1被选中。 ③ 若qk-1<r≤qk(2≤k≤N), 则染色体xk被选中。 其 中的qi称为染色体xi (i=1, 2, …, n)的积累概率 其 积累概率, 积累概率 计算公式为 数r。
3
2. 适应度与适应度函数 适应度与适应度函数 ● 适应度(fitness)就是借鉴生物个体对环境的 适应程度,而对问题中的个体对象所设计的 表征其优劣的一种测度。 ● 适应度函数(fitness function) (fitness function)就是问题中的 全体个体与其适应度之间的一个对应关系。 它一般是一个实值函数。该函数就是遗传算 法中指导搜索的评价函数。
P(xi ) = f (xi )
N
∑ f (x )
j =1 j
7
交叉 就是互换两个染色体某些位上的基因。 例如, 设染色体 s1=01001011, s2=10010101, 交换其后4位基因, 即
s1′=01000101, s2′=10011011 可以看做是原染色体s1和s2的子代染色体。
8
变异 就是改变染色体某个(些) 位上的基因。 例如, 设染色体 s=11001101 将其第三位上的0变为1, 即 s=11001101 →11101101= s′。 s′也可以看做是原染色体s的子 代染色体。
68
69
70
71
72
贝叶斯信念网络
73
74
75
76
77
5、分布式估计算法的理论基础
略!
78
29
根据概率模型的复杂程度以及不同的采样方 法,分布式估计算法发展了很多不同的具体 实现方法,但是都可以归纳为下面两个主要 步骤: 1)、构建描述解空间的概率模型。通过对种 群的评估,选择优秀的个体集合,然后采样 统计学习等手段构造一个描述当前解集的概 率模型 2)、由概率模型随机采样产生新的种群。一 般的,采用蒙特卡罗方法,对概率模型采样 得到新的种群。
11
步5 按选择概率P(xi)所决定的选 中机会,每次从S中随机选定1个个体并 将其染色体复制,共做N次,然后将复 制所得的N个染色体组成群体S1; 步6 按交叉率Pc所决定的参加交 叉的染色体数c,从S1中随机确定c个染 色体,配对进行交叉操作,并用产生的 新染色体代替原染色体,得群体S2;
12
4
3. 染色体与基因 染色体(chromosome)就是问题中个体的 某种字符串形式的编码表示。字符串中的字符 也就称为基因(gene)。 例如: 个体 9 ---染色体 1001
(2,5,6)---- 010 101 110
5
遗传操作 4. 遗传操作 亦称遗传算子(genetic operator),就是关 于染色体的运算。遗传算法中有三种遗传操作:
算法设计与分析 分布式估计算法
主要知识点:
1 、传统遗传算法 2 、分布式估计算法与传统遗传算法的区别 3 、分布式估计算法应用举例 4、分布式估计算法的分类 5、分布式估计算法的理论基础
2
1、传统遗传算法
1. 个体与种群 个体与种群 ● 个体就是模拟生物个体而对问题中的对象 (一般就是问题的解)的一种称呼,一个个 体也就是搜索空间中的一个点。 ● 种群(population)就是模拟生物种群而由若 (population) 干个体组成的群体, 它一般是整个搜索空间 的一个很小的子集。
● 选择-复制(selection-reproduction) ● 交叉(crossover,亦称交换、交配或杂交) ● 变异(mutation,亦称突变)
6
选择-复制
通常做法是:对于一个规模为N
的种群S,按每个染色体xi∈S的选择概率P(xi)所决 定的选中机会, 分N次从S中随机选定N个染色体, 并进行复制。 这里的选择概率P(xi)的计算公式为
16
(3) 计算各代种群中的各个体的适应度, 并 对其染色体进行遗传操作,直到适应度最高的个 体(即31(11111))出现为止。
17
首先计算种群S1中各个体 s1= 13(01101), s2= 24(11000) s3= 8(01000), s4= 19(10011) 的适应度f (si) 。 容易求得 f (s1) = f(13) = 132 = 169 f (s2) = f(24) = 242 = 576 f (s3) = f(8) = 82 = 64 f (s4) = f(19) = 192 = 361
22
于是,经复制得群体: s1’ =11000(24), s2’ =01101(13) s3’ =11000(24), s4’ =10011(19)
23
交叉 设交叉率pc=100%,即S1 中的全体染色体都 参加交叉运算。 设s1’与s2’配对,s3’与s4’配对。分别交换后 两位基因,得新染色体: s1’’=11001(25), s2’’=01100(12) s3’’=11011(27), s4’’=10000(16)
24
变异 设变异率pm=0.001。 这样,群体S1中共有 5×4×0.001=0.02 位基因可以变异。 0.02位显然不足1位,所以本轮遗传操作不 做变异。
25
于是,得到第二代种群S2: s1=11001(25), s2=01100(12) s3=11011(27), s4=10000(16)
15
解 (1) 设定种群规模,编码染色体,产生初始 种群。 将种群规模设定为4;用5位二进制数编码 染色体;取下列个体组成初始种群S1: s1= 13 (01101), s2= 24 (11000) s3= 8 (01000), s4= 19 (10011) (2) 定义适应度函数, 取适应度函数:f (x)=x2
45
46
应用例子
47
48
49
50
51
52
53
54
55
56
请同学们继续!
57
cGA
与UMDA、PBIL不同也在于概率向量的更 新算法,并且种群规模很小,只产生两个个 体,算法描述如下:
58
59
4.2双变量相关的分布式估计算法
这类算法,概率模型可以表示至多两个变量 之间的关系。 主要有MIMIC(Mutual information maximization for input clustering)、COMIT、 BMDA
26Hale Waihona Puke Baidu
第二代种群S 第二代种群 2中各染色体的情况 染色体 适应度 选择概率 积累概率 估计的 选中次数 1 0 2 1
s1=11001 s2=01100 s3=11011 s4=10000
625 144 729 256
0.36 0.08 0.41 0.15
0.36 0.44 0.85 1.00
27
30
3 、分布式估计算法应用举例
下面通过一个简单的EDA算例,介绍该方法 独特的进化操作,使读者对EDA方法有一个 直观的认识.
31
32
33
34
35
36
37
分布式估计和传统遗传算法的对比
38
4、分布式估计算法的分类
变量无关 双变量相关 多变量相关
39
4.1、变量无关的分布式估计算法
步7 按变异率Pm所决定的变异次数m,从S2 中随机确定m个染色体,分别进行变异操作,并 用产生的新染色体代替原染色体,得群体S3; 步8 将群体S3作为新一代种群,即用S3代替 S,t = t+1,转步3;
13
1.3 遗传算法应用举例
例 1 利用遗传算法求解区间[0,31]上的二 次函数y=x2的最大值,x为整数。
Y
y=x2
31
X
14
分析 原问题可转化为在区间[0, 31]中搜 索能使y取最大值的点a的问题。那么, 0, 31 x , f(x) [0, 31] 中的点x就是个体, 函数值f(x)恰 好就可以作为x的适应度,区间[0, 31] 就是一个(解)空间 。这样, 只要能给出个 体x的适当染色体编码, 该问题就可以用 遗传算法来解决。
40
PBIL方法
41
42
算法伪代码
43
应用例子
旅行推销员问题(又称为旅行商问题、TSP 问题)是一个多局部最优的最优化问题:有n 个城市,一个推销员要从其中某一个城市出 发,唯一走遍所有的城市,再回到他出发的 城市,求最短的路线。 工作调度问题。 函数优化问题。
44
UMDA
UMDA与PBIL唯一不同在于概率向量的更 新算法,前面的例子实际就是UMDA算法! 算法描述如下:
60
MIMIC
解空间描述模型为(假设):
61
衡量两个分布之间的距离,可以采用K-L距离, 定义如下:
实际上是信息理论中的相对熵,它是非对称 的。
62
简单学习一下熵理论:
熵:
63
条件熵:
64
h(p)是p分布的熵,是固定值,
^

随排列变化而变化,我们希望最小化:
65
66
67
多变量相关分布式估计算法
qi = ∑P(xj )
j =1
21
i
选择-复制 设从区间[0, 1]中产生4个随机数如下: r1 = 0.450126, r2 = 0.110347 r3 = 0.572496, r4 = 0.98503
染色体 s1=01101 s2=11000 s3=01000 s4=10011 适应度 169 576 64 361 选择概率 0.14 0.49 0.06 0.31 积累概率 0.14 0.63 0.69 1.00 选中次数 1 2 0 1
18
再计算种群S1中各个体的选择概率。
选择概率的计算公式为
P(xi ) = f (xi )
N
∑ f (x )
由此可求得
j =1 j
P(s1) = P(13) = 0.14 P(s2) = P(24) = 0.49 P(s3) = P(8) = 0.06 P(s4) = P(19) = 0.31
19
9
1.2 基本遗传算法
生成初始种群 计算适应度 终止 ? 选择-复制 交叉 变异 结束
遗传算法基本流程框图
生成新一代种群
10
基本遗传算法 步1 在搜索空间U上定义一个适应度函数 f(x),给定种群规模N,交叉率Pc和变异率Pm, 代数T; 步2 随机产生U中的N个个体s1, s2, …, sN, 组成初始种群S={s1, s2, …, sN},置代数计数 器t=1; 步3 计算S中每个个体的适应度f() ; 步4 若终止条件满足,则取S中适应度最 大的个体作为所求结果,算法结束。
如此不断进化,直到种群中出现适应度最高的 染色体s1=11111。于是,遗传操作终止,将染 色体“11111”作为最终结果输出。 然后,将染色体“11111”解码为表现型, 即得所求的最优解:31。 将31代入函数y=x2中,即得原问题的解,即 函数y=x2的最大值为961。
28
2、分布式估计算法与传统遗传算法的区别
最简单,假设各变量之间是独立的,那么任 意解的概率可以表示为:
比较有代表性的算法有如下几种: PBIL(Population based Incremental Algorithm) UMDA(Univariate Marginal Distribution Algorithm) cGA(compact Genetic Algorithm)
分布式估计算法是一种全新的进化模式,没有传统 遗传算法的交叉和变异操作,取而代之的是概率模 型的学习和采样。 分布式估计算法通过一个概率模型描述候选解在空 间的分布,采用统计学习的手段从宏观上建立一个 描述解分布的概率模型,然后对概率模型进行随机 采样产生新的种群,如此反复进行,实现种群的进 化,直到终止条件。
相关文档
最新文档