智能控制导论大作业1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
智能控制导论
姓名********
学院自动化与电气工程学院
专业控制科学与工程
班级***************
学号*********
指导老师********
二〇一六年六月十八
故障诊断中基于神经网络的特征提取方法研究
摘要:对文章《故障诊断中基于神经网络的特征提取方法研究》进行总结概括,分析了BP 神经网络的优缺点,针对BP 神经网络不足,提出了一种新的特征提取方法,即分形维数-免疫克隆选择特征提取算法,并对该算法进行阐述和分析。
关键词:特征提取;BP 神经网络;免疫克隆选择算法
1 对附录文章的概括总结
1.1基于神经网络的特征评价
附录文章是以电路检测与故障诊断为背景,提取重要的特征参数,对电路的工作状态进行定量描述。为满足工程需要,附录文章利用神经网络进行特征选择时主要以
特征参数的灵敏度作为其评价指标。学习误差为E=2
11
)(.21∑∑==-p k n
i ik ik x y N ,定义E 为评价特征提取的准则函数,则当E 满足要求时, B P 网络第1 隐层的输出值即为提取 得到的新特征。学习误差公式实现了新特征空间到原始特征空间的反映射, 给出该反映射后产生的误差大小。
1.2基于BP 网络的特征提取
1.2.1 特征提取的概念
特征提取是利用已有的特征参数构造 1 个较低维数的特征空间, 将原始特征中蕴含的有用信息映射到少数几个特征上, 忽略多数的不相干信息。从数学意义上讲,就是1 个n 维向量x =[]T n x x x ....,2,1进行降维变换至低维向量Y =[]T m y y y ...,2,1,m < n 。其中Y 确实含有向量X 的主要特性。
1.2.2 BP 神经网络
BP 神经网络是1986年由Rumelhart 和McCelland 为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP 神经网络能学习和存贮大量的输入—输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP 神经网络模型拓扑结构包括输入层、隐层和输出层。
1.2.3 基于BP神经网络特征提取的步骤
(1)对原始特征值进行归一化处理;
(2)选择B P 网络模型结构参数, 输入和输出单元数等于原始特征参数的维数, 第l 隐层单元数等于新特征参数的维数, 一般选隐层数为1;
(3)选择合适的神经网络学习参数, 以保证较高的收敛精度;
(4)利用误差反传法训练B P 网络, 通常满足系统特征提取性能下误差所需的精度即可;
(5)将原始特征参数的所有样本输入训练好的B P网络, 进行前向计算, 求出B P 网络第1 隐层各单元的输出值,即得到所提取的特征参数。
1.2.4 BP神经网络的优点
(1)网络实质上实现了一个从输入到输出的映射功能,而数学理论已经证明它具有实现任何复杂非线性映射的功能。这使得它特别适合于求解内部机制复杂的问题;(2)网络能通过学习带动正确答案的实例集自动提取合理的求解规则,即具有自学习能力;
(3)网络具有一定的推广、概况能力。
1.2.5 BP神经网络的缺点
(1)由于学习速率是固定的,因此网络的收敛速度慢,需要较长的训练时间。对于一些复杂问题,BP算法需要的训练时间可能非常长,这主要是由于学习速率太小造成的,可采用变化的学习速率或自适应的学习速率加以改进。
(2)BP算法可以使权值收敛到某个值,但并不保证其为误差平面的全局最小值,这是因为采用梯度下降法可能产生一个局部最小值。对于这个问题,可以采用附加动量法来解决。
(3)网络隐含层的层数和单元数的选择尚无理论上的指导,一般是根据经验或者通过反复实验确定。因此,网络往往存在很大的冗余性,在一定程度上也增加了网络学习的负担。
(4)网络的学习和记忆具有不稳定性。也就是说,如果增加了学习样本,训练好的网络就需要从头开始训练,对于以前的权值和阈值是没有记忆的。但是可以将预测、
分类或聚类做的比较好的权值保存。
2对附录文章算法的改进想法
2.1 分形维数-免疫克隆选择特征提取算法
分形维数(FractalDimension )定义:是一个用以描述分形特征的重要参数,其重要性在于分形维数能够用数据描述,更重要的是分形维数能通过实验手段近似地得出,比如:如果将正方形每条边长放大3倍,那么就得到一个相当于932=个原来的正方形;若将正方体每边长放大3倍,那么就会得到一个相当于2733=个原来的正方体。依次推广,对于一个d 维几何形态将其每个独立方向都增加为原来度量的c 倍,那么就会得到相当于了N c d =个原来的几何形态。对于上面的关系取对数后有以下形式:
c N
d ln ln =
如果按同样方式将一个对象缩小,ε为缩小倍数,则有以下形式:
)
/1ln(ln εN d = (1) 上式中的d 对于一般分形而言,其结果往往不是整数,则d 被称为分形维数D 。
分形维数的计算一般是利用最小二乘拟合方法,来对曲线数据点进行拟合,求得其斜率,那么就是原始数据集的分形维数。
2.1.2分形维数-免疫克隆选择特征提取算法思想
如果设置原始数据集的分形维数为2D ,要对数据集进行特征选择,也就是说要得到原始数据集所有D 个特征中选出的d 个特征组合的最优属性子集,使得它的分形维数与原始数据集的分形维数差值是最小的,如果属性子集包含的属性个数为d ,而该子集的分形维数记为[]2D ,同时引入免疫克隆算法进行特征选择,则有如下结果: (l)免疫克隆算法搜索的目标为寻找出最优属性子集;
(2)在该算法解的构造中,一般随机设置N 个抗体,其中每个抗体i a 是表示一种特征组合,并采用二进制编码方式,它的基因串长为特征向量长度D ,其编码为()vn v v a a a ...,2,1,每个基因位vi a 的取值为: