故障特征提取的方法研究(1)解析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
故障特征提取的方法研究(1)
摘要:针对常规特征提取方法存在
着问题不足,提出了基于BP神经网络和基于互信息熵的特征提取方法,并通过特征提取实例加以说明。结果表明这两种方法是可行和有效的。
关键词:特征提取故障诊断神经网络互信息熵
随着科学技术的发展,现代设备的结构日趋复杂,其故障类型越来越多,反映故障的状态、特征也相应增加。在实际故障诊断过程中,为了使诊断准确可靠,总要采集尽可能多的样本,以获得足够的故障信息。但样本太多,会占用大量的存储空间和计算时间,太多的特征输入也会引起训练过程耗时费工,甚至妨碍训练网络的收敛,最终影响分类精度。因此要从样本中提取对诊断故障贡献大的有用信息。这一工作就是特征提取。
特征提取就是利用已有特征参数构造一个较低维数的特征空间,将原始特征中蕴含的有用信息映射到少数几个特征上,忽略多余的不相干信息。从数学意义上讲,就是对一个n维向量X=[x1,x2,…,xn]T进行降维,变换为低维向量Y=[y1,y2,…,ym]T,m 特征提取的方法有很多,常用的方法主要有欧式距离法、概率距离法、统计直方图法、散度准则法等。本文针对现有方法的局限性,研究基于BP神经网络的特征提取方法和基于互信息熵的特征提取方法。 1 基于BP神经网络的特征提取方法 要从N个特征中挑选出对诊断贡献较大的n个特征参数(n εij=|(аYi)/(аXj)| 采用三层BP网络,输入层n个单元对应n个特征参数,输出层m个单元对应m 种模式分类,取中间隐层单元数为q,用W B iq表示输入层单元i与隐层单元q之间的连接权;用w O qj表示隐层单元q与输出层单元j之间的连接权,则隐层第q单元的输出Oq,为: 输出层第j个单元输出yj为: 式中j=1,2,…,m;εj为阈值。 则特征参数xi对模式类别yj的灵敏度为: 代入(1)式,则特征参数Xi的灵敏度εij和特征参数Xk的灵敏度εkj之差可整理为: 大量的试验和研究表明,当网络收敛后有:a1≈a2≈…≈aq。 从上式可以看出,如果: 则必有:εij>εki 即特征参数Xi对第j类故障的分类能力比特征参数Xk强。 将特征参数X和分类模式分类结果y组成的样本集作为BP网络的学习样本,对网络进行训练。设Wiq和Wkq分别为与特征参数Xi和Xk对应输入单元与隐层单元q之间的连接权系数,记: │Wεi│=│Wi1│+|Wi2|+…+|Wiq| │Wεk│=│Wk1│+|Wk2|+…+|Wkq| 如果│Wεi│>│Wεk│,则可以认为Xi的特征灵敏度εi比特征参数Xk的灵敏度εk大。这样可知特征参数Xi的分类能力比特征参数Xk的分类能力强。 2 基于互信息熵的特征提取方法 由信息特征可知,当某特征获得最大互信息熵,该特征就可获得最大识别熵增量和最小误识别概率,因而具有最优特性。特征提取过程就是在由给定的n个特征集X二{XI~X2,…,zn)所构成的初始特征集合情况下,寻找一个具有最大互信息熵的集合:X={X1,X2,…,Xk},k 在一定的初始特征集合下,识别样本的后验熵是一定的。在实现特征优化过程中,随着特征的删除,会有信息的损失,使得后验熵趋于增加。因此后验熵增值大小反应了删除特征向量引起的信息损失的情况。当删除不同特征及删除特征数逐步递增时,会对应有不同的后验熵。按后验熵由小到大排列,可获得对应的特征删除序列。其过程可描述为: (1)初始化:设原始特征集合F={N个特征},令初始优化特征集合S=[K个特征,K=N]; (2)计算后验熵; (3)实现递减:S=[K-1个特征],并计算相应的后验