深度学习在故障诊断领域中的研究现状与挑战
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
深度学习的基本模型框架包括深度置信网络(DBN)、卷积神经网络(CNN)、堆叠自动编码机(SAE)、递归神经网络(RNN)。
1、深度置信网络(DBN)的故障诊断研究现状
DBN是一种典型的深度学习方法, 可以通过组合底层特征形成更加抽象的高层表示,发现数据的分布式特征,其动机在于建立模型模拟人类大脑的神经网络连接结构,通过多个非线性运算隐含层的多层感知器对输入数据进行分布式表征,并且能够在样本集有限的情况下实现学习数据集的本质特征,达到实现量测数据从低级到高级的特征表示与提取。
优势:
1.在于能够摆脱对大量信号处理技术与诊断经验的依赖,完成故障特征的自适应提取与健康状态的智能诊断;
2.该方法对时域信号没有周期性要求,具有较强的通用性和适应性;
3.其具有处理高维、非线性数据的能力,且可有效地避免发生维数灾难和诊断能力不足等问题.从此角度看,深度置信网络非常适合处理新时期工业“大数据”的故障诊断难题.
此文是将DBN用于实现传感器健康状态特征的分类, 而没有实现基于DBN的特征表达与提取, 需要进一步深入研究, 但确实为实现基于DBN故障诊断方法迈出了一大步.
用法: 一种用DBN 作分类器, 另一种用DBN作特征表达、提取与识别.
2、卷积神经网络(CNN)的故障诊断研究现状
CNN是一个典型的前馈神经网络, 其实质是构建多个能够提取输入数据特征的滤波器, 通过这些滤波器对输入数据进行逐层卷积及池化, 逐级提取隐藏在数据之中的拓扑结构特征,随着网络结构层层深入, 提取的特征也逐渐变得抽象, 最终获得输入数据的平移、旋转及缩放不变的特征表示.其主要特征是结合稀疏连接、权重共享、空间或时间上的降采样.
优势:CNN无需将这些输入数据进行矢量化.
用法:1.是将CNN作为特征提取与识别的方法,2.将CNN作为分类器使用。现有的研究, CNN仅仅用于实现视觉理解、图像特征提取等, 很少用于实现基于信号的特征提取与识别. 一种可能的解释是CNN输入需要2D特征图谱,即输入数据必须满足2D结构特征
CNN 非常适合处理海量数据, 学习海量数据中的特征,识别出海量数据中蕴含的信息. 因此,基于CNN 的故障诊断是未来基于深度学习故障诊断算法发展的一个方向.
3、堆叠自动编码机(SAE)的故障诊断研究现状
堆叠自动编码机(SAE) 能有效地提取数据低维特征,其基本单元是自动编码器(AE),由多个AE堆叠而成. 每个AE可以视为一个单隐层的人工神经网络,通过寻求最优参数使得输出尽可能地重构输入,此时隐层输出可看作是输入降维后的低维特征。自动编码机(AE)依然采用梯度下降算法训练网络参数, 使损失函数最小化.
作用:是降噪滤波和特征提取两大功能,
优势:用SAE实现故障诊断从其开始就用于实现特征提取与故障分类. 一个可能的解释是无论是编码器还是解码器均可用于整合特征提取算法与分类识别算法. 换句话说, SAE的训练需要少量的样本数据,再加上适当的分类识别技术即可实现较高性能的故障诊断效果,充分展现了其强大的特征提取能力以及该方法的鲁棒性.
4、递归神经网络(RNN)的故障诊断研究现状
RNN的本质特征是其处理单元之间既有内部的反馈连接又有前馈连接,其内部反馈连接可以为网络保留隐层节点的状态和提供记忆方式,网络的输出不仅取决于当前的输入,而且与以前的网络内部状态有关,体现出了较好的动态特性。
优势:充分考虑了样本之间的关联关系
优势:RNN提高了故障诊断效率, 改善了现有神经网络故障诊断方法,适用于复杂设备或系统的实时故障诊断, 且具有良好的扩展性. 递归神经网络具有收敛速度快、精度高、稳定性好、扩展性好等优势,此外RNN在预测方面具有其他算法不可比拟的优势。
深度学习故障诊断的挑战性问题
深度学习的目的就是试图通过寻求可量测的特征向量来判断系统处于何种状态,进而实现工业系统的故障检测、诊断与识别匹配等
1、一个可能的研究思路是构建实验仿真分析平台, 注入不同类型的故障, 得到不同故障对应的仿真
信号, 利用RNN实现每个故障特征信号的预测, 进而与现有量测到的系统状态信号作残差, 通过设定阈值实现故障检测,以此实现特征提取与故障机理的映射或许是一个可行的研究思路.
2、目前针对此复杂性故障有效的解决方案就是增加传感器,力求通过增加监测手段实现该类复杂性故障的检测与诊断。一种可能的基于深度学习的故障诊断方法是将量测数据组合为2维数据图谱或者特征图谱. 而CNN 非常适合处理海量数据, 学习海量数据中的特征, 实现多层次、非线性的复杂特征提取, 捕捉到不明显、特征信息微弱的征兆, 以建立多维和多参数复杂系统模型, 而后从系统的整体性和系统的关联性出发, 研究系统内部各组分之间的动力学特性、相互作用和依赖关系, 探索出系统故障的根源。
3、在模型构建过程中模型参数的动态优化调整也将是其发展的一大挑战. 目前深度学习网络的深度确定方法并没有统一方法,本文认为, 对于模型参数优化, 可能的方法是利用小样本故障数据,构建重构误差、分类误差、输入输出误差等实现模型参数训练的优化性约束性调整.
4、如何建立基于深度学习的分布式故障诊断算法自然而然地成为了一大挑战性问题。实现分布式深度学习故障诊断模型就是将RBM、AE等分布于各个子系统子设备中, 实现初级故障特征提取等, 将深度学习神经网络融合于现有复杂工业系统中, 通过系统结构来确定分布式深度学习网络的拓扑结构, 采用量测数据驱动整个深度学习网络, 通过实际目标监测参数值与网络输出值进行对比, 进行实现整个系统的故障诊断
5、随着信息化技术的发展, 现代复杂工业系统涌现了海量的数据, 如何设计出一个适用于多源输入数据,同时具有较好功能的特征提取模型来解决复杂工业系统“大数据”难题,实现复杂工业系统故障诊断也是其中的一个挑战。海量的正常运行数据与小样本的故障状态数据是工业大数据的一个典型特点, 而深度学习又需要大量的样本进行训练, 二者之间的矛盾似乎不可调和。本文认为, 可以采用另一种思路, 即采用正常运行状态下的数据训练深度学习模型, 当故障发生时,该网络输出值与正常值具有较大偏差,如此,异常运行状态的检测便可以实现了. 而对于故障诊断, 则需要结合其他方法进行,或者开发出其他类型深度学习网络以适应工业大数据的故障诊断,
6、如何针对不同模型的特点,取长补短、优势互补, 实现不同模型相互融合与协同, 对复杂工业系统的故障诊断工作而言是非常关键的。,AE可不可以是与神经网络功能类似的其他方法,进行组合成为具有优异性能的混合深度学习模型,以实现不同模型间相互融合与协调,
7、在模型层数定量确定后,小样本模型训练等也是一个极具挑战的问题。从重构误差、分类误差、损失函数最小化等角度, 以及从最大化提取特征数量、识别精确度等最大化来实现有监督的模型训练,将网络训练成为一个非线性优化问题不失为一种可行的解决思路
8、如何将深度学习与现有训练数据相结合, 构建易于训练, 可自适应协调多源海量数据也是一个值得研究的方向. 构建不同类型的、各自独立的子网络来处理不同类型的数据,通过平移、旋转、缩放不变以及转码等方式, 将数据转化为统一的数据类型, 而后再构建一个深度学习网络从这些数据中提取有用的特征, 以实现训练数据样本的统一, 以及解决海量数据的处理问题不失为一种可行的思路。