一种改进一维卷积神经网络的轴承故障诊断方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第 22卷第 4期2023年 4月
Vol.22 No.4
Apr.2023软件导刊
Software Guide
一种改进一维卷积神经网络的轴承故障
诊断方法
潘琳鑫,巩永旺,晏生莲
(盐城工学院信息工程学院,江苏盐城 224051)
摘要:经典一维卷积神经网络模型诊断准确率不高且模型存在过拟合问题,难以满足轴承故障诊断时效性和准确
率要求。

鉴于此,提出一种基于改进一维卷积神经网络的轴承故障诊断方法,在卷积层之后加入批量归一化层的方
法以增加模型泛化能力,并采用Dropout的方法解决模型过拟合问题。

基于凯斯西储大学轴承故障数据集的实验结
果显示,相比经典一维卷积神经网络,该方法可显著提升故障诊断准确率,故障诊断准确率可达99.79%,并且整个诊
断过程无需手动特征提取,从而减少了特征提取过程中的损失,实现端到端的检测,具有较好的通用性。

关键词:故障诊断;卷积神经网络;深度学习;Dropout方法
DOI:10.11907/rjdk.221570开放科学(资源服务)标识码(OSID):
中图分类号:TP183 文献标识码:A文章编号:1672-7800(2023)004-0038-05
A Bearing Fault Diagnosis Method Based on Improved One-dimensional
Convolutional Neural Network
PAN Lin-xin, GONG Yong-wang, YAN Sheng-lian
(School of Information Engineering,Yancheng institute of Technology, Yancheng 224051, China)
Abstract:Aiming at solving the problems of low diagnostic accuracy and over fitting of the classical one-dimensional convolutional neural net‐work model, a bearing fault diagnosis method based on improved one-dimensional convolutional neural network is proposed. The normaliza‐tion method is used to increase the generalization ability of the model. For the problem of model over fitting, the dropout method is adopted. Fi‐nally, the proposed method is applied to the experimental data of rolling bearing failure of Case Western Reserve University. The experimental results show that compared with the classical convolutional neural network, the proposed method can improve greatly the diagnostic accuracy (as high as 99.79%). Moreover, the entire diagnosis process does not require any manual feature extraction, which can reduce the loss in the feature extraction process, and the method can realize end-to-end detection and has better versatility.
Key Words:fault diagnosis; convolutional neural network; deep learning; Dropout method
0 引言
滚动轴承是旋转机械设备中最重要的零部件之一,在维持运动精度和提高机械效率上发挥重要作用,在复杂机械装备中有着广泛应用[1]。

轴承故障诊断方法研究是维护机械设备正常运作的关键,传统的故障诊断方法包括噪声分析[2]、油样分析[3]和振动信号分析[4]等。

然而,随着科技的进步,机械设备检测的精度大幅度提升,采集到的数据变得越来越复杂和抽象[5],传统故障诊断方法已不能满足人们对于故障诊断时效性和准确率的要求。

因此,高效的故障诊断方法愈来愈受到研究人员的重视。

近些年,深度学习具有突出的特征提取能力,并被普遍应用于轴承故障诊断,如卷积神经网络(Convolutional
Neural Network,CNN)、深度置信网络和堆栈自编码网络等深度学习方法在故障诊断方面取得一系列研究成果[6]。

收稿日期:2022-05-25
基金项目:国家自然科学基金面上项目(62076215);教育部人文社会科学研究项目(21YJAZH025)
作者简介:潘琳鑫(1996-),男,盐城工学院信息工程学院硕士研究生,研究方向为人工智能、深度学习、机械故障诊断;巩永旺(1976-),男,博士,盐城工学院信息工程学院教授、硕士生导师,研究方向为人工智能、复杂网络与信息安全;晏生莲(1997-),女,盐城工学院信息工程学院硕士研究生,研究方向为智能算法、神经网络、机械故障诊断。

第 4 期潘琳鑫,巩永旺,晏生莲:一种改进一维卷积神经网络的轴承故障诊断方法Gao等[7]提出一种新的优化自适应深度置信网络,通过分
析滚动轴承的振动信号,验证了所提方法在故障诊断方面
具有较高的诊断精度和较好的收敛性。

师诗[8]提出一种
改进的深度堆栈自编码神经网络的故障诊断模型,在滚动
轴承数据集上进行试验,验证了所提方法在故障分类方面
具有较高的准确率,并且在损失值方面有较大提升。

卷积神经网络作为深度学习的重要方法之一,以其局部连接和全局共享等特点,同样在故障诊断方面有着广泛应用[9]。

例如,赵小强等[10]提出一种改进卷积神经网络的滚动轴承故障诊断方法,通过引入注意力机制,使得模型在诊断准确率方面有所提升。

陈仁祥等[11]将卷积神经网络模型和小波变换相结合,分别对故障的类别、缺陷大小和不同工况进行测试,验证了所提方案的可行性。

高佳豪等[12]将去除噪声的方法和卷积神经网络相结合,并基于齿轮箱的数据集进行试验,提升了故障诊断准确率。

张弛等[13]将支持向量机和卷积神经网络的优势联系起来,利用支持向量机分类,利用卷积神经网络提取特征,提高了网络模型识别准确率。

徐卫鹏等[14]建立了一种由池化层和多级交替卷积层组成的轴承故障诊断模型,利用一维卷积神经网络模型直接读取振动信号进行故障识别试验。

以上基于卷积神经网络的轴承故障诊断模型和方法在一定程度上提高了诊断准确率,但存在模型训练准确率不高和过拟合问题。

基于此,本文提出一种基于改进一维卷积神经网络的轴承故障诊断方法。

该方法将批量归一化用于数据处理,采用Dropout的方法抑制数据过拟合问题,通过调节模型参数提升卷积神经网络模型准确率和泛化能力,该方法不需要人工提取特征,模型直接对输入信号进行训练,可以发挥卷积神经网络的特征学习能力,提高模型通用性。

1 相关理论
1.1 经典一维卷积神经网络
卷积神经网络是一种具有卷积结构的深度神经网络,是深度学习的代表算法之一,被普遍使用于计算机视觉和语言处理等多个领域[15]。

在经典卷积神经网络中,其卷积核是二维的,主要是将特征图中的宽和高两个方向同时进行滑窗操作,常用于计算机视觉和图像处理领域。

一维卷积神经网络与二维卷积神经网络类似,其输入的是一维数据,卷积和池化操作后的输出也是一维的,主要应用于序列模型和自然语言处理领域。

一维卷积神经网络相比于二维卷积神经网络,具有更少的参数量,可以降低二维卷积神经网络对于大规模数据集的依赖。

一维卷积神经网络主要由输入层、卷积层、池化层、全连接层和输出层组成[16],其结构如图1所示。

卷积层是卷积神经网络的核心,主要作用是提取输入的特征信息,由卷积单元组成,通过感受野对有规律的移动输入信息,并提取对应区域的特征。

低卷积层只能提取到低级特征,深卷积层能够提取深层的特征[17]。

在卷积层中,卷积核对前一层的输出进行卷积运算,并输出卷积结果,其数学模型为[18]
y l+1i(j)=K l i∗x l(j)+b l i(1)
其中,y l+1
i(j
)表示输入l+1层的卷积;K l i表示l层处的第i个卷积核的权重;∗表示卷积运算;x l(j)表示l层处的第j个区域;b l i表示l层处的第i个卷积核的偏差。

激活层主要是对卷积层的结果做非线性映射。

常用的激活函数是Sigmoid函数,其表达式为:
Sigmoid(x)=11+e-x(2)池化层的作用是降维,减少参数量,提高模型容错率,主要采用最大池化法,其函数为:
P
i,m=max q i,()m-1S+n(3)
其中,P i,m表示第m层中第i个特征图; q i,()
m-1S+n
表示第i个特征图中第(m-1)S+n个单元的值,S为相邻采样窗口重叠部分的大小[19]。

全连接层的主要功能是将池化层中展开的一维向量输入,将前一层和该层的神经单元相连,从而获取全局信息。

输出层是通过使用Soft M ax分类器来实现分类问题,其公式为:
S i=e a∑k=1T e a(4)1.2 批量归一化方法
批量归一化(Batch Normalization,BN)[20]类似于一种对数据标准化操作,其主要是利用小批量数据,取其均值和标准差,通过不断调整神经网络中的输出,从而使得整个网络输出的数值更加稳定。

在卷积神经网络中添加BN 层的目的是提升训练速度,以提高网络性能。

因为将网络中某一层的输入进行归一化处理,会影响到本层网络所学习到的特征,因此引入可学习的参数γ和β,通过变换重构,可以恢复到本层学习的特征。

BN算法过程分为正向传播和反向传播,其正向传播的过程分为5个步骤,如图2所示。

其中,对数据进行标准化的公式为:
Fig. 1 1D convolutional neural network architecture

1 一维卷积神经网络结构
Fig. 2 BN forward propagation process
图2 BN正向传播过程
·
·39
2023 年
软件导刊x i =
x i -μB
σ2B +ε
;(5)
训练参数γ、β的公式为:
γx i +β≡BN γ,β(x i )

(6)
在反向传播过程中,采用链式求导求γ、β及其他权值,γ为尺度系数,β为移动因子。

1.3 Dropout 方法
Dropout 方法是指在卷积神经网络中,按照一定的随机概率(比如r ()l j
∼Bernoulli (p )
)临时丢弃神经元,由于是
随机丢弃策略,因此每一次都是对不同的网络进行训练,可抑制模型过拟合问题。

图3为使用Dropout 方法前后的神经网络对比示意图,黑圈代表被临时丢弃的神经单元。

Dropout 方法工作流程为:首先以一定的概率随机临
时删除神经网络中的神经单元,然后在没有被删除的神经
元上依照随机梯度下降法更新参数,接着重复这一过程,恢复被删除掉的神经单元,再按照随机概率临时删除神经单元,利用梯度下降更新参数。

2 改进的一维卷积神经网络模型
为增加经典一维卷积神经网模型的泛化能力和解决模型的过拟合问题,在模型中嵌入批量归一化法和神经网络Dropout 的方法,提出一个改进的一维卷积神经网络模型。

模型采用Google 的Tensorflow 和Keras 工具箱搭建,其结构如图4所示。

该模型包括输入层、特征提取层、全连接层和输出层。

其中,特征提取层包含卷积子层、批量归一化子层、Sigmoid 激活子层和最大值池化子层等。

改进的一维卷积神经网络模型的工作流程如图5所
示。

首先直接输入原始的振动信号,在特征提取层中,卷积层共6层,第一层卷积核采用大卷积核,可以获得更大的感受野,降低噪声影响;之后5层采用小卷积核,减少参数量,降低计算时间;在卷积操作后,加入批量归一化层,增强模型泛化能力,再在全连接层中采用Dropout 方法,以抑制过拟合现象和增强模型泛化能力;最后采用Adam 优化器更新权重,增加模型的运算能力。

3 实验与结果分析
3.1 实验数据集
实验数据采用美国凯斯西储大学轴承数据中心的4
组数据集(记为A-D )[21]
,分别对应在0、1、2和3马力电机
负载工况条件下记录的轴承振动加速度信号,轴承的运行状态包括正常状态,内圈故障,外圈故障和滚动体故障,且每种故障类型又分为3种损伤直径:0.007inch ,0.014inch 和0.021inch 。

因此,每组数据集共有9种损伤状态和1种正常状态等10种状态,其标签分别为0~9,实验数据集的具体描述如表1所示。

实验时首先将每组实验数据集混合并打乱顺序,然后将数据集按照7:2:1的比例划分为训练集、验证集和测试集;接着对数据进行批量归一化操作,最后进行卷积神经网络训练,并将训练和测试的结果进行对比分析,验证本文方法的有效性和优越性。

3.2 实验结果分析
在训练卷积神经网络模型的过程中,由于输入的振动
Fig. 5 Improved 1D convolutional neural network process
图5 改进的一维卷积神经网络流程
(a) (b) Fig. 3 Neural network comparison before and after using Dropout
method
图3 使用Dropout
方法前后的神经网络对比
Fig. 4 Improved 1D convolutional neural network model
图4 改进的一维卷积神经网络模型
Table 1 Experimental data set description
表1 实验数据集描述
故障类型正常状态内圈故障外圈故障滚动体故障
损伤直径/inch
(0.007/0.014/0.021)(0.007/0.014/0.021)(0.007/0.014/0.021)
样本个数1 000
1 000/1 000/1 0001 000/1 000/1 0001 000/1 000/1 000
标签0
1/2/34/5/67/8/9··40
第 4 期潘琳鑫,巩永旺,晏生莲:一种改进一维卷积神经网络的轴承故障诊断方法
信号有噪声,并且训练数据不足,会出现过拟合情况。


文采用Dropout的方法抑制过拟合,在选取Dropout参数
时,做了3组实验,参数分别取0.2、0.3、0.5,迭代次数为50
次,训练集准确率如图6所示。

从图6可以看出,在Dropout=0.2和0.3时,训练集准确
率均在99%以上,而Dropout=0.5时,训练集准确率只有
94%左右。

但相比于Dropout=0.2时,Dropout=0.3时的准确
率数值波动较小,因此Dropout的参数选用0.3。

在训练时,增加网络层数,可以提升特征学习能力。

本实验采用了6层卷积层和池化层。

利用Adam算法更新
参数,批次设置为512,迭代200次,学习率为0.001。

模型参数取值如表2所示。

在训练卷积神经网络模型后,观测准确率与损失函数值大小,准确率能够度量模型效果,准确率越高,说明模型训练效果越好,损失函数主要描述模型训练误差,当准确率逐渐增长,损失函数值逐渐减小,说明该模型拟合越好。

实验训练结果和验证结果分别如图7和图8所示。

当迭代次数达70次,模型基本收敛,训练集平均准确率保持在99%以上,验证集平均准确率达99.5%,说明改进后的一维卷积神经网络模型具有很好的诊断效果。

一维卷积神经网络模型改进前后在4组不同数据上的轴承故障诊断准确率比较如表3所示。

测试集样本为
1 000个,样本长度为1 024。

从表3可以看出,在4种不同的数据集上,本文方法模型测试的准确率均高于经典的一维卷积神经网络模型,且本文方法在不同数据集上测试集的准确率差别小于经典一维卷积神经网络方法。

由此可见,改进后的模型在轴承故障诊断性能上优于经典的一维卷积神经网络,且模型的稳定性和泛化能力更好。

为了进一步验证所提方法的故障诊断效果,将本文方法与其他基于卷积神经网络的故障诊断方法进行比较,故障诊断准确率如图9所示。

可以看出,本文方法准确率高于其他模型准确率,具有更好的诊断效果。

Table 3 Comparison of fault diagnosis accuracy under different data
sets
表3 不同数据集下故障诊断的准确率比较
方法
1D-CNN
本文方法
准确率/%
数据集A
95.70
99.95
数据集B
97.00
99.97
数据集C
88.10
99.30
数据集D
98.40
99.76
Fig. 8 Model validation results
图8 模型验证结果
Fig. 6 Diagnostic accuracy of the training set
图6 训练集的诊断准确率
Table 2 1D convolutional neural network model parameters 表2 一维卷积神经网络模型参数
参数名称
卷积层数
池化层数
第一层卷积核大小其它层卷积核大小
池化尺寸
优化器
优化器学习率Dropout比率/%
全连接
Softmax Batchsize
迭代次数参数值
6
6
64×1
3×1
2×1
Adam
0.001
30
100
10
512
200
Fig. 7 Model training results
图7
 模型训练结果



(
%
)
方法
Fig. 9 Fault identification accuracy of each method
图9 各方法故障识别准确率
·
·41
2023 年软件导刊
4 结语
本文针对经典一维卷积神经网络故障诊断准确率不高和泛化能力较差的情况,提出了改进一维卷积神经网络的轴承故障诊断方法。

该方法可以直接作用于原始的一维信号,不需要进行任何的人工特征提取,实现了端对端的检测,具有很好的实用性。

第一个卷积层采用大卷积核,可以得到更大的感受野,之后采用小卷积核,减少模型参数量和计算量。

利用批量归一化的方法处理数据,使得模型收敛速度变快,并减少运行时间。

在前向传播过程中,利用Dropout的方法,对模型中的神经元按照一定比例随机丢弃,可以有效抑制过拟合问题。

实验结果表明,该方法相较于改进前的一维卷积神经网络模型和其他故障诊断模型,可以达到更高的准确率。

但是本文方法由于网络模型较大,需要较大运行内存和较高硬件需求,因此运行效率略有下降。

下一步工作重点是优化模型流程与参数,在不影响故障准确率的情况下,提升模型效率。

参考文献:
[1] ZHAO L,ZHANG Y X,ZHU D C. A review of research on fault diagnosis and prediction methods for rolling bearings in complex equipment[J]. Chi‐
na Test, 2020,46(3):17-25.
赵磊,张永祥,朱丹宸.复杂装备滚动轴承的故障诊断与预测方法研究
综述[J].中国测试,2020,46(3):17-25.
[2] ZHANG Y,WANG F,WANG W C.Research on motor fault diagnosis method based on noise analysis[J].Micromotor, 2012,45(8):83-87.
张媛,王飞,王万成.基于噪声分析的电机故障诊断方法研究[J].微电
机,2012,45(8):83-87.
[3] CHEN G,CHEN L B,SONG L Q. A new method of wear fault fusion diag‐nosis and its application[J].Mechanical Science and Technology, 2009,28(9):1157-1161.
陈果,陈立波,宋兰琪.一种磨损故障融合诊断新方法及其应用[J].机
械科学与技术,2009,28(9):1157-1161.
[4] LIN J,ZHAO M. Review and prospect of dynamic signal analysis methods of mechanical equipment under variable speed[J].Science in China:Tech‐
nical Science, 2015,45(7):669-686.
林京,赵明.变转速下机械设备动态信号分析方法的回顾与展望[J].
中国科学:技术科学,2015,45(7):669-686.
[5] LI H,ZHANG Q,QIN X R, et al. Bearing fault diagnosis method based on short-time Fourier transform and convolutional neural network[J].Vibra‐
tion and Shock, 2018,37(19):124-131.
李恒,张氢,秦仙蓉,等.基于短时傅里叶变换和卷积神经网络的轴承
故障诊断方法[J].振动与冲击,2018,37(19):124-131.
[6] WEN L, LI X, GAO L. A transfer convolutional neural network for fault diagnosis based on ResNet-50[J].Neural Computing and Applications,2020, 32(10): 6111-6124.
[7] GAO S, XU L, ZHANG Y, et al. Rolling bearing fault diagnosis based on intelligent optimized self-adaptive deep belief network[J].Measurement Science and Technology, 2020,31(5): 055009.
[8] SHI S.Research on fault diagnosis method of rolling bearing based on deep self-encoding neural network[D]. Beijing: Beijing Jiaotong Univer‐
sity,2021.
师诗.基于深度自编码神经网络的滚动轴承故障诊断方法研究[D].
北京:北京交通大学,2021.
[9] ZHANG L,YUAN F N,ZHANG W R, et al. A review of research on fully convolutional neural networks [J].Computer Engineering and Applica‐
tions, 2020,56(1):25-37.
章琳,袁非牛,张文睿,等.全卷积神经网络研究综述[J].计算机工程
与应用,2020,56(1):25-37.
[10] ZHAO X Q,ZHANG Y Z. Fault diagnosis method of rolling bearing un‐der variable working conditions using improved convolutional neural net‐
work[J].Journal of Xi'an Jiaotong University, 2021,55(12):108-118.
赵小强,张亚洲.利用改进卷积神经网络的滚动轴承变工况故障诊断
方法[J].西安交通大学学报,2021,55(12):108-118.
[11] CHEN R X,HUANG X,YANG L X,et al.Fault diagnosis of rolling bearing based on convolutional neural network and discrete wavelet trans‐
form[J]. Journal of Vibration Engineering, 2018,31(5):883-891.
陈仁祥,黄鑫,杨黎霞,等.基于卷积神经网络和离散小波变换的滚动
轴承故障诊断[J].振动工程学报,2018,31(5):883-891.
[12] GAO J H,GUO Y,WU X. Fault diagnosis of gearbox bearing based on SANC and one-dimensional convolutional neural network[J].Vibration
and Shock, 2020,39(19):204-209,257.
高佳豪,郭瑜,伍星.基于SANC和一维卷积神经网络的齿轮箱轴承
故障诊断[J].振动与冲击,2020,39(19):204-209,257.
[13] ZHANG C.Fault diagnosis of rolling bearing based on CNN-SVM[J].
Combined Machine Tool and Automatic Machining Technology,2021
(11):114-116,124.
张弛.基于CNN-SVM的滚动轴承故障诊断[J].组合机床与自动化
加工技术,2021(11):114-116,124.
[14] XU W P,XU B. Research on bearing fault diagnosis based on convolu‐tional neural network[J].Journal of Shandong University of Science and
Technology(Natural Science Edition),2021,40(6):121-128.
徐卫鹏,徐冰.基于卷积神经网络的轴承故障诊断研究[J].山东科技
大学学报(自然科学版),2021,40(6):121-128.
[15] ZHOU J H,ZHENG P,WANG S X,et al.Fault diagnosis method of planetary gearbox based on wavelet time-frequency map and convolution‐
al neural network[J].Mechanical Transmission,2022,46(1):156-163.
周建华,郑攀,王帅星,等.基于小波时频图和卷积神经网络的行星齿
轮箱故障诊断方法[J].机械传动,2022,46(1):156-163.
[16] SHAO H, JIANG H, LIN Y, et al. A novel method for intelligent fault diagnosis of rolling bearings using ensemble deep auto-encoders[J]. Me‐
chanical Systems and Signal Processing, 2018, 102: 278-297.
[17] LI B Z,LIU K,GU J J, et al. A survey of convolutional neural network re‐search[J].Computer Age, 2021(4):8-12,17.
李炳臻,刘克,顾佼佼,等.卷积神经网络研究综述[J].计算机时代,
2021(4):8-12,17.
[18] ZHANG W, PENG G, LI C, et al. A new deep learning model for fault diagnosis with good anti-noise and domain adaptation ability on raw vibra‐
tion signals[J]. Sensors, 2017, 17(2): 425.
[19] YE Z,YU J B. Gearbox fault diagnosis method based on multi-channel one-dimensional convolutional neural network feature learning [J].Vi‐
bration and Shock,2020,39(20):55-66.
叶壮,余建波.基于多通道一维卷积神经网络特征学习的齿轮箱故障
诊断方法[J].振动与冲击,2020,39(20):55-66.
[20] WANG Q,DENG L F,ZHAO R Z.Rolling bearing fault identification based on improved one-dimensional convolutional neural network[J].
Vibration and Shock,2022,41(3):216-223.
王琦,邓林峰,赵荣珍.基于改进一维卷积神经网络的滚动轴承故障
识别[J].振动与冲击,2022,41(3):216-223.
[21] LI X, YANG Y, PAN H, et al. A novel deep stacking least squares sup‐port vector machine for rolling bearing fault diagnosis[J]. Computers in
Industry, 2019, 110: 36-47.
(责任编辑:孙娟)
··42。

相关文档
最新文档