一种基于多维数据融合的设备状态预测方法及系统[发明专利]

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202011441603.7
(22)申请日 2020.12.08
(71)申请人上海交通大学烟台信息技术研究院
地址 264000 山东省烟台市高新区科技大
道69号创业大厦西塔23层
申请人上海交通大学
(72)发明人陈彩莲　尹宝莹　朱培源　徐磊　
许齐敏　张景龙　
(74)专利代理机构上海旭诚知识产权代理有限
公司 31220
代理人郑立
(51)Int.Cl.
G06Q 10/04(2012.01)
G06K 9/00(2006.01)
G06K 9/62(2006.01)
(54)发明名称
一种基于多维数据融合的设备状态预测方
法及系统
(57)摘要
本发明公开了一种基于多维数据融合的设
备状态预测方法和系统，包括：对设备运行全生
命周期的状态监测信号进行采集和预处理，利用
小波包分析对状态监测信号进行降噪处理，对原
始状态监测信号和本征模态分量进行时域、频域
和时频域的特征提取，使用排列熵和信息熵进行
特征筛选，对已经筛选过的特征进行设备工况的
无监督识别，在云中心端进行模型训练，并保存
至边缘端进行设备运行状态及其剩余寿命的预
测。

本发明利用多任务学习方法挖掘相似工况中
的有用多维数据信息以提升设备状态及其剩余
寿命预测模型的回归性能，采用云边结合的系统
架构节省通信开销，
增加计算效率。

权利要求书2页说明书6页附图2页CN 112613646 A 2021.04.06
C N 112613646
A
1.一种基于多维数据融合的设备状态预测方法，其特征在于，所述方法包括以下步骤：
步骤1、通过边缘端对设备运行全生命周期的状态监测信号进行采集和预处理，为状态监测信号打上时间戳和剩余寿命标签，得到包括状态监测信号序列和设备工作状态信号的训练集；
步骤2、利用小波包分析对状态监测信号进行降噪处理；
步骤3、将降噪过的状态监测信号分解为多个本征模态函数，得到原始状态监测信号在多个时间尺度下的局部特征信息，根据场景使用特点选用适当的分解阶数，对每一个时间段的信号进行并行经验模态分解；
步骤4、对原始状态监测信号和本征模态分量进行时域、频域和时频域的特征提取，并根据对应特征的计算方式对原始状态监测信号和本征模态分量进行并行计算；
步骤5、使用排列熵和信息熵进行特征筛选，采用节点分裂次数作为特征重要性分数，将筛选过后的特征进行基于分离森林的异常样本处理和基于最大最小归一化的数据标准化；
步骤6、使用最小批k‑means++聚类算法对已经筛选过的特征进行设备工况的无监督识别，为每一个样本都打上其对应聚类簇的簇标签，依据每个样本所属工况的簇标签对全部数据进行分割；
步骤7、使用设备不同工作状态下的对应状态的特征信息值及其剩余寿命值在云中心端进行设备状态预测模型训练，进而将训练好的设备状态预测模型保存至边缘端进行设备运行状态及其剩余寿命的预测；
步骤8、当云中心端更新完对应工况的设备状态预测模型后，通过云中心端将模型参数和工况识别系统下发到边缘端用于在线预测，通过边缘端采集实时运行的设备状态监测信号，并行生成已选重要特征后使用工况识别系统判断当前所属工况，使用该工况下对应的模型参数完成设备实时运行状态及其剩余寿命预测。

2.如权利要求1所述的基于多维数据融合的设备状态预测方法，其特征在于，所述步骤1中的所述预处理具体包括：
步骤1.1、进行缺失值识别补全以及删除由于传感器丢包造成的极大或极小异常信号值；
步骤1.2、结合控制器信号和原始状态监测信号的时域均值对原始状态监测信号进行了停机识别和筛选。

3.如权利要求1所述的基于多维数据融合的设备状态预测方法，其特征在于，所述步骤2中的所述利用小波包分析为利用小波软阈值法滤除能量分散且幅值小于阈值的噪声。

4.如权利要求1所述的基于多维数据融合的设备状态预测方法，其特征在于，所述步骤4中的所述特征提取具体为以控制器信号为划分标签，对原始状态监测信号和本征模态分量进行并行计算，并保存所有计算过后的特征值。

5.如权利要求4所述的基于多维数据融合的设备状态预测方法，其特征在于，所述特征值包括均值、峰值、快速傅里叶变换的质心、方差。

6.如权利要求1所述的基于多维数据融合的设备状态预测方法，其特征在于，所述步骤5中的所述特征筛选包括粗筛和精筛，其中，所述粗筛利用信息增益删除随机性大于阈值的特征，所述精筛通过使用集成决策树和训练集中的设备状态标签信息找出关键特征。

7.如权利要求1所述的基于多维数据融合的设备状态预测方法，其特征在于，所述步骤6中的所述无监督识别具体为利用设备运行负载和特征筛选后的重要特征进行无监督聚类，并且为每一个样本打上其对应聚类簇的簇标签，依据每个设备全生命周期样本按照所属工况标签进行分割。

8.如权利要求1所述的基于多维数据融合的设备状态预测方法，其特征在于，所述步骤7中状态预测模型采用基于鲁棒估计器的自适应多任务学习算法。

9.一种基于多维数据融合的设备状态预测系统，其特征在于，包括多维数据处理模块、特征处理模块和状态训练预测模块，所述多维数据处理模块用于设备原始状态监测信号的采集与预处理，所述特征处理模块用于在预处理好的设备状态监测信号中进行特征提取，所述状态训练预测模块用于对具有重要特征和工况分隔符的数据集进行设备状态预测模型训练与剩余寿命值预测。

10.如权利要求9所述的基于多维数据融合的设备状态预测系统，其特征在于，所述预处理包括异常值和缺失值的处理、停机状态的识别、基于小波分析的信号降噪；所述特征提取包括经验模态分解、基于信息增益的特征粗筛选、基于集成决策树的特征精筛、特征标准化和工况识别。

一种基于多维数据融合的设备状态预测方法及系统
技术领域
[0001]本发明涉及设备状态预测技术领域，尤其涉及一种基于多维数据融合的设备状态预测方法及系统。

背景技术
[0002]工业现场设备的安全可靠性运行不仅是保障企业经济和社会效益稳定提高的前提，也是保证操作人员生命安全的稳定基础，故工业设备的预测性维护成为工业生产中或不可缺的组成部分，而设备的运行状态信息及其寿命信息是设备维护所主要关注的对象，精准预测设备的未来状态及其失效时间可以降低相应生产工件的坏品率，提高整个工业流程的周转效率，进而提高生产效率。

但是若采取过度的保护策略又会造成设备剩余寿命的浪费以及不必要的设备停机时间浪费。

因此，如果能够基于多维历史数据和当前实时数据精准预测设备的状态信息及其剩余寿命，将有效地优化工作排程且降低设备采购成本。

[0003]但由于工业现场设备的机械结构特点和工业流程设计，设备的磨损趋势会因为多种工况的不同具有较大的区别，其设备的多样性使得基于物理模型预测的方法难以直接在高度耦合的复杂工业现场使用，例如数控机床、刀具以及工件设备就具有不同的物理模型，当面临真实运行的设备状态预测场景时，多个物理模型会以时变的状态产生复杂耦合，由于缺乏专家经验和高精密建模仪器，此类方法往往难以对设备及其工况快速精确建模。

[0004]而基于单任务思路的机器学习方法取决于特征构建方法和数据集的规模，并且对样本同分布要求极高，在设备运行过程中，预测主体映射会随着运行过程的变化而变化，进而导致不同工况的样本属于不同的分布等欠拟合现象，故使用单任务的机器学习方法不能在多工况条件下提供解释性更强的回归预测。

基于机器学习与物理模型相结合的方法需要以数据驱动物理模型的更新，受限于设备运行状态信号会受不同工件加工流程的影响和数据更新的时延，此类方法在多工况异构设备场景中同样会面临物理模型难以精准建模等问题，导致模型预测性能较差。

现有的设备状态预测方法大都只考虑了相似工况下的预测函数建模，当面临多工况异构设备状态预测场景时，现有方法往往会出现欠拟合的现象，导致预测性能大幅下降。

同时当对全新设备进行冷启动预测时，缺少训练数据和标签数据等问题也会导致现有方法的预测结果难以直接使用。

[0005]申请号为202010281572.7的名为“云‑边协同下电网设备运行状态预测方法及系统”的中国发明专利提出一种应对电网设备部署偏远场景下的云‑边协同预测方法，云平台实现预测模型分布式计算和云端数据存储，而边缘端负责电网设备实时数据的采集，二者相互协作实现设备状态的实时预测，但设备之间的异构性以及工况的多样性使得数字孪生深度学习模型难以应用在复杂工况场景中。

申请号为201710947637.5的名为“一种工业机械设备健康状态分析与预测方法及其系统”的中国发明专利综合运用统计学习及数据挖掘相关理论和技术，对工业设备的监测数据进行预处理和特征提取，进而进行工业设备性能的退化趋势分析，但是多工况场景下对应不同的映射函数主体，向量回归模型容易出现过拟合情况，导致预测性能变差。

申请号为201910782945.6的名为“一种基于LSTM+CNN的机床
刀具剩余寿命预测方法”的中国发明专利使用LSTM+CNN的方法挖掘信号中时序信息和邻近突出信息，但忽略了信号领域的专家经验，并且由于加工工序的不同，会导致刀具状态监测信号的时序性较为紊乱，难以直接加以利用。

[0006]因此，本领域的技术人员致力于开发一种基于多维数据融合的设备状态预测方法及系统，可解决多工况场景下的设备状态和剩余寿命预测问题和新设备冷启动预测不准的问题。

发明内容
[0007]有鉴于现有技术的上述缺陷，本发明所要解决的技术问题是如何有效挖掘大量设备运行状态监测信号中的有用敏感特征来表征设备运行的实时状态及其剩余寿命信息；在复杂工况场景下对异构设备进行有效的工况识别并判断相似工况和不相似工况，以实现具有相似工况的样本聚合；利用相似工况中的有用信息构建设备运行状态预测模型以提供更为精确的实时状态信息与失效时间预测。

[0008]为实现上述目的，本发明提供了一种基于多维数据融合的设备状态预测方法，所述方法包括以下步骤：
[0009]步骤1、通过边缘端对设备运行全生命周期的状态监测信号进行采集和预处理，为状态监测信号打上时间戳和剩余寿命标签，得到包括状态监测信号序列和设备工作状态信号的训练集；
[0010]步骤2、利用小波包分析对状态监测信号进行降噪处理；
[0011]步骤3、将降噪过的状态监测信号分解为多个本征模态函数，得到原始状态监测信号在多个时间尺度下的局部特征信息，根据场景使用特点选用适当的分解阶数，对每一个时间段的信号进行并行经验模态分解；
[0012]步骤4、对原始状态监测信号和本征模态分量进行时域、频域和时频域的特征提取，并根据对应特征的计算方式对原始状态监测信号和本征模态分量进行并行计算；[0013]步骤5、使用排列熵和信息熵进行特征筛选，采用节点分裂次数作为特征重要性分数，将筛选过后的特征进行基于分离森林的异常样本处理和基于最大最小归一化的数据标准化；
[0014]步骤6、使用最小批k‑means++聚类算法对已经筛选过的特征进行设备工况的无监督识别，为每一个样本都打上其对应聚类簇的簇标签，依据每个样本所属工况的簇标签对全部数据进行分割；
[0015]步骤7、使用设备不同工作状态下的对应状态的特征信息值及其剩余寿命值在云中心端进行设备状态预测模型训练，进而将训练好的设备状态预测模型保存至边缘端进行设备运行状态及其剩余寿命的预测；
[0016]步骤8、当云中心端更新完对应工况的设备状态预测模型后，通过云中心端将模型参数和工况识别系统下发到边缘端用于在线预测，通过边缘端采集实时运行的设备状态监测信号，并行生成已选重要特征后使用工况识别系统判断当前所属工况，使用该工况下对应的模型参数完成设备实时运行状态及其剩余寿命预测。

[0017]进一步地，所述步骤1中的所述预处理具体包括：
[0018]步骤1.1、进行缺失值识别补全以及删除由于传感器丢包造成的极大或极小异常
信号值；
[0019]步骤1.2、结合控制器信号和原始状态监测信号的时域均值对原始状态监测信号进行了停机识别和筛选。

[0020]进一步地，所述步骤2中的所述利用小波包分析为利用小波软阈值法滤除能量分散且幅值小于阈值的噪声。

[0021]进一步地，所述步骤4中的所述特征提取具体为以控制器信号为划分标签，对原始状态监测信号和本征模态分量进行并行计算，并保存所有计算过后的特征值。

[0022]进一步地，所述特征值包括均值、峰值、快速傅里叶变换的质心、方差。

[0023]进一步地，所述步骤5中的所述特征筛选包括粗筛和精筛，其中，所述粗筛利用信息增益删除随机性大于阈值的特征，所述精筛通过使用集成决策树和训练集中的设备状态标签信息找出关键特征。

[0024]进一步地，所述步骤6中的所述无监督识别具体为利用设备运行负载和特征筛选后的重要特征进行无监督聚类，并且为每一个样本打上其对应聚类簇的簇标签，依据每个设备全生命周期样本按照所属工况标签进行分割。

[0025]进一步地，所述步骤7中状态预测模型采用基于鲁棒估计器的自适应多任务学习算法。

[0026]本发明还提供了一种基于多维数据融合的设备状态预测系统，包括多维数据处理模块、特征处理模块和状态训练预测模块，所述多维数据处理模块用于设备原始状态监测信号的采集与预处理，所述特征处理模块用于在预处理好的设备状态监测信号中进行特征提取，所述状态训练预测模块用于对具有重要特征和工况分隔符的数据集进行设备状态预测模型训练与剩余寿命值预测。

[0027]进一步地，所述预处理包括异常值和缺失值的处理、停机状态的识别、基于小波分析的信号降噪；所述特征提取包括经验模态分解、基于信息增益的特征粗筛选、基于集成决策树的特征精筛、特征标准化和工况识别。

[0028]本发明的优点在于：
[0029]1、采用小波降噪与经验模态分解的方法提取原始信号中的敏感特征；
[0030]2、设计信息增益法和集成决策树法相结合的方式进行特征筛选；
[0031]3、采用设备控制器信号和振动信号特征等加工要素以识别设备实时工况；[0032]4、利用多任务学习方法挖掘相似工况中的有用多维数据信息以提升设备状态及其剩余寿命预测模型的回归性能；
[0033]5、采用云中心‑边缘计算中心结合的系统架构节省通信开销，增加计算效率。

附图说明
[0034]图1是本发明的一个较佳实施例的设备状态预测系统架构图；
[0035]图2是本发明的一个较佳实施例的设备状态预测系统算法架构图；
[0036]图3是本发明的一个较佳实施例的设备状态预测系统算法流程图。

具体实施方式
[0037]以下参考说明书附图介绍本发明的优选实施例，使其技术内容更加清楚和便于理
解。

本发明可以通过许多不同形式的实施例来得以体现，本发明的保护范围并非仅限于文中提到的实施例。

[0038]在本文中，“剩余寿命”(Remaining Useful Life,RUL)指的是例如当前刀具工作时刻至刀具损坏时刻之间的时间长度。

“样本”指的是在一个时刻内的信号序列，通过特征提取后可以转换为一个向量。

“特征”指的是利用多种特征生成方法计算原始输入数据，得到样本向量的某一个元素即为特征，计算方式包含有具体的物理含义。

“参数”指的是预测模型的参数，多元线性回归方法通过与样本向量值相乘得到剩余寿命率。

“多任务学习”指的是该类算法利用工况识别系统判断相似工况，并挖掘相似工况的共享信息使模型参数的求解效果更好，提升模型的预测精度。

“工况识别系统”指的是将多个样本根据其所属工况进行识别和数据分割，相似工况的样本属于同一输入矩阵。

“边缘计算单元”(边缘端)指的是与传感器通过有线连接的计算模块，具有较低的通信时延和较高的计算速度，可以进行刀具实时状态的计算与采集。

“云中心计算单元”(云中心端)指的是与多个边缘计算单元相连的中心计算机，具有较高的计算速度、较多的计算核心和较大的存储空间，适合大计算任务的处理。

[0039]本申请提供了一种基于多维数据融合的设备状态预测系统，系统整体由边缘端和工业云中心端组成，在工业云中心端进行模型学习和特征处理，在边缘端进行信号采集和数据处理，最大程度节省通信开销，提高预测系统性能。

[0040]系统包含：多维数据处理模块、特征处理模块和状态训练预测模块。

其中，数据处理模块主要负责设备原始数据的采集与处理，包括异常值和缺失值的处理、停机状态的识别、基于小波分析的信号降噪等子模块；特征处理模块主要负责在处理好的设备监控信号中提取出有用特征，包括经验模态分解(Empirical Mode Decomposition,EMD)、基于信息增益的特征粗筛选、基于集成决策树的特征精筛、特征标准化和工况识别等子模块；状态训练预测模块主要负责具有重要特征和工况分隔符的数据集训练与预测。

[0041]本申请还提供了一种基于多维数据融合的设备状态预测方法，包含以下步骤：[0042]第一步、采集设备全生命周期的传感器和控制器数据，进行缺失值识别补全，并且删除由于传感器丢包等问题造成的极大或极小异常信号值。

按照控制器信号的采样周期为振动信号加上时间戳，并进行信号分割，得到一个控制器信号对应多个振动传感器信号的信号序列。

并且考虑到设备运行过程存在整机停机和部分停机这两种停机状态，结合控制器信号和原始信号的时域均值对原始信号进行了停机识别和筛选，停机的原则是设备停止运行和振动幅度阶梯式降低。

考虑到不同工况和不同设备的状态及其剩余寿命值域区间不同，将数据中的状态及其剩余寿命标签进行了重构，设置整体预测标签为剩余寿命率，使所有剩余寿命率的标签值都对应设备工作状态信号。

[0043]第二步、考虑到原始信号是非平稳非线性信号，利用小波包分析对振动信号进行降噪处理，选用小波软阈值法滤除能量分散且幅值较小的噪声，提高信噪比并保留原有信号的基础特性。

使用经验模态分解将原始信号分解为多个本征模态函数，可得到原始信号在多个时间尺度下的局部特征信息，该方法可以克服基函数无自适应性的问题，具有良好的时频信息聚焦特性。

根据场景使用特点选用适当的分解阶数，采取每一个时间段的信号进行并行经验模态分解的方法，可以加快整体信号的分解速度，并适合于实际预测场景。

[0044]第三步、对原始信号和本征模态分量进行时域、频域和时频域的特征提取，提取的
特征包括了均值、峰值、快速傅里叶变换的质心、方差等。

提取方法是根据对应特征的计算方式，以1个控制器信号为划分标签，对其中振动信号和模态分量进行并行计算，并保存所有计算过后的特征值，提取后的原始特征包含了近百个特征。

[0045]第四步、利用特征粗筛模块对此类特征首先使用排列熵和信息熵进行快速无监督筛选，删除随机性较大的特征。

接着使用集成决策树和训练集中的剩余寿命标签信息对特征进行精筛，采用节点分裂次数作为特征重要性分数，根据该分数最终选定精筛过后的特征。

将筛选过后的特征进行基于分离森林的异常样本处理和基于最大最小归一化的数据标准化，并将有用特征的信息上传至云中心。

在实际使用该系统时，边缘侧结点可结合已经筛选出的有用特征直接在边缘侧进行特征并行生成。

[0046]第五步、使用最小批k‑means++聚类算法，对控制器信号中的设备运行负载、转矩、扭矩和已经筛选后的传感器信号重要特征进行设备工况的无监督识别，选取轮廓系数和CN index值都较大的聚类个数作为最终工况识别的个数，并且为每一个样本都打上其对应聚类簇的簇标签，依据每个样本所属工况簇标签对全部数据进行分割。

在边缘侧数据实时处理时，进行实时数据和保存的簇中心的距离计算，并将数据依据k‑means++聚类算法分配给最近的簇中心，并为其分配相应的簇中心标签。

[0047]第六步、使用设备不同工作状态下的对应剩余寿命值进行模型训练。

使用基于鲁棒估计器的自适应多任务学习算法，在线性回归优化过程中对相似工况进行判别，并利用鲁棒正则化项的重下降特性，使相似工况的任务参数靠近，不相似工况之间的参数互相不影响。

将具有相同工况标签的数据进行聚合，输入至多任务学习算法模块中进行训练，得到训练好的预测模型保存至边缘侧进行设备运行状态及其剩余寿命的预测。

[0048]第七步、参数下发与边缘端在线预测。

云中心端更新完对应工况的模型后，将模型参数和工况识别系统下发到边缘端。

并在边缘端采集实时运行的设备状态监测信号，并行生成已选重要特征后使用工况识别系统判断当前所属工况，使用该工况下对应的模型参数完成设备实时运行状态及其剩余寿命预测，并根据设备状态预测比例和历史设备状态等信息计算出设备当前状态及其剩余寿命预测值，根据此预测值调整生产策略。

[0049]实施例
[0050]本实例采用的设备是切削加工领域中的数控机床及其刀具，整个系统架构图如图1所示，在工业云中心计算单元进行模型学习和特征处理，在边缘计算单元进行信号采集和数据处理，最大程度节省通信开销，提高预测系统性能。

基于多维数据融合的设备(数控机床及其刀具)状态及其剩余寿命预测系统算法架构如图2所示，对应的预测系统算法流程图如图3所示。

[0051]设备状态及其剩余寿命预测方法具体步骤如下：
[0052]第一步、训练数据采集
[0053]步骤1.1、设定振动传感器和控制器PLC的采样频率，将振动传感器置于刀具主轴端面，开启数控机床铣削刀具对某工件的加工流程。

[0054]步骤1.2、通过OPC‑UA的通信传输链路，将刀具全生命周期的状态监测信号采集至边缘计算单元，保存振动传感器信号和控制器信号，其中控制器信号包括了走刀路径和控制器采样时间。

[0055]步骤1.3、运行刀具直至损坏，记录总运行时长。

重复上述步骤，采集多个不同工况。