基于多源信息融合与HMM 的剩余寿命预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第44卷 第5期系统工程与电子技术
Vol.44 No.5
2022年5月SystemsEngineeringa
ndElectronicsMay 2
022文章编号:1001 506X(2022)05 1747 10 网址:www.sy
s ele.com收稿日期:20210220;修回日期:20210606;网络优先出版日期:20210827。

网络优先出版地址:http:
∥kns.cnki.net/kcms/detail/11.2422.TN.20210827.1726.014.html基金项目:国家自然科学基金(71871218,72071208)资助课题 通讯作者.
引用格式:黄林,龚立,姜伟,等.基于多源信息融合与HMM的剩余寿命预测[J].系统工程与电子技术,2022,44(5):1747 1756.犚犲犳犲狉犲狀犮犲犳狅狉犿犪狋:HUANGL,GONGL,JIANGW,etal.Remainingu
sefullifepredictionbasedonmulti sourceinformationfusionandHMM[J].SystemsEngineeringa
ndElectronics,2022,44(5):1747 1756.基于多源信息融合与犎犕犕的剩余寿命预测
黄 林,龚 立 ,姜 伟,王康勃
(海军工程大学舰船综合试验训练基地,湖北武汉430033)
摘 要:针对设备剩余使用寿命预测问题,
提出一种基于多源信息融合与隐马尔可夫模型的预测方法。

首先,针对发动机结构复杂、监控数据参数多等问题,提出一种基于传感器信噪比和主成分分析(princip
alcompo nentanaly
sis,PCA)降维的多源传感器数据融合方法。

在此基础上,利用样本数据训练高斯混合隐马尔可夫模型,
同时为降低模型偏差并避免过拟合风险,提出一种“定制”策略训练方法,训练后的模型可用于系统健康状态识别和剩余使用寿命预测。

最后,
通过美国国家航空航天局公开的航空发动机仿真数据集对所提方法进行了验证,并与几种具有代表性且预测精度较高的文献方法进行了比较分析,验证了方法的有效性。

关键词:多源信息融合;隐马尔可夫模型;剩余使用寿命;模型训练
中图分类号:V239 文献标志码:A 犇犗犐:10.12305/j.
issn.1001 506X.2022.05.38犚犲犿犪犻狀犻狀犵狌
狊犲犳狌犾犾犻犳犲狆狉犲犱犻犮狋犻狅狀犫犪狊犲犱狅狀犿狌犾狋犻 狊狅狌狉犮犲犻狀犳狅狉犿犪狋犻狅狀犳狌狊犻狅狀犪狀犱犎犕犕
HUANGLin,GONGLi ,JIANGWei,WANGKang
bo(犛犺犻狆犆狅犿狆狉犲犺犲狀狊犻狏犲犜犲狊狋犪狀犱犜狉犪犻狀犻狀犵犅犪狊犲,犖犪狏狔犝狀犻狏犲狉狊犻狋狔狅犳犈狀犵
犻狀犲犲狉犻狀犵,犠狌犺犪狀430033,犆犺犻狀犪) 犃犫狊狋狉犪犮狋:Aimingattheproblemofequipmentremainingu
sefullifeprediction,apredictionmethodbasedonmulti sourceinformationfusionandhiddenMarkovmodelisproposed.Firstly,amu
lti sourcesensordatafusionmethodbasedonsignal to noiseratioofsensorandprincipalcomponentanalysis(PCA)dimensionality
reductionisproposedtosolvetheproblemsofcomplexenginestructureandmultiplemonitoringdatap
arameters.Onthisbasis,theGaussianmixturehiddenMarkovmodelistrainedusingthesampledata.Atthesametime,inordertoreducethedeviationofmodelandavoidtheriskofoverfitting,a“customized”strategytrainingmethodisproposed.Thetrainedmodelcanbeusedforsystemhealthstatusrecognitionandremainingusefullifeprediction.Finally,theeffectivenessoftheproposedmethodisverifiedbytheaeroeng
inesimulationdatasetpublishedbyNationalAeronauticsandSp
aceAdministration,andcomparedwithseveralrepresentativeliteraturemethodswithhighpredictionaccuracy.犓犲狔狑狅
狉犱狊:multi sourceinformationfusion;hiddenMarkovmodel;remainingusefullife;modeltraining0 引 言在故障预测与健康监测(prog
nosticsandhealthman agement,PHM)领域中,对设备性能退化的实时预测非常重要,是基于状态维修(condition basedmaintenance,CBM)策略制定的重要依据。

但是在大多数情况下,监控系统测量的数据无法跟踪系统每个组件的退化状态,因此CBM需要一个能够基于监测数据预测其系统性能退化状态的模型
或者是一个可以量化的指标,例如系统健康指数(healthindex,HI)、剩余使用寿命(remainingu
sefullife,RUL)等。

RUL是指设备失效前能够运行的次数或者时间。

准确的RUL预测在实施CBM策略中起着关键作用,因为其
 ·1
748 ·系统工程与电子技术第44卷 可以为维修人员在系统故障之前提供足够的时间,使用者能够及时评估设备的健康状况,并针对设备状态规划和制定未来的维护保养计划。

目前常采取的做法是,利用系统传感器采集大量的实时数据,将这些数据存储在历史数据集中,并通过建立基于数据驱动模型(data drivenmodel,DDM)
来预测精确的组件衰减状态和RUL。

在关于PHM和CBM的文献中,基于物理模型、统计学理论和数据驱动等诸多方法被提出来解决RUL预测问题。

近年来,由于机器学习方法能够在不了解设备退化机制的情况下,仅依靠历史数据对设备运行状态进行学习和预测,不需要过多的领域知识,因此受到了越来越多的关注[1],其中常用的方法包括支持向量机(supportvectormachine,SVM)[2]、隐马尔可夫模型(hiddenMarkovmodel,HMM)[3]、卡尔曼滤波[4]、深度学习方法[56]等。

HMM最早被应用于语音识别[7],是一个双重嵌入的随机过程,其一般随机过程是不可观测的(设备的状态是隐藏的),只能通过产生观测序列(即传感器信号)的另一组随机过程来观测,适用于动态过程时间序列信号分析和平稳随机信号的建模,在语音识别、手势识别、目标跟踪[8]等许多应用领域都显示出其优越的性能。

HMM同样也被广泛应用于故障诊断和故障预测领域[9],故障预测是PHM核心课题之一,HMM可根据测量信号检测和识别系统健康状态,并对未来一段时间内的健康状态进行估计,从而实现系统RUL预测。

Zhu等[10]针对动态工业过程中的故障分类问题,提出了一种HMM驱动的鲁棒隐变量模型,将概率结构发展为一种分类器形式,以便在模型获取过程中融合各种类型的过程信息。

Yiako p
oulos等[11]利用分段聚合近似和符号聚合近似时间序列数据挖掘表示方法,
结合HMM应用于过程变量监控数据,并与过程缺陷相关联,从而捕捉隐藏在观测数据中的有意义的信息,识别特定异常情况。

Galagedarage等[12]采用HMM 贝叶斯网络混合系统,对田纳西伊斯曼过程中的10个已识别故障进行预测和隔离,并成功地预测了所选的10个过程故障,并对其中的8个进行了准确隔离。

Wang等[13]提出了一种基于HMM的多模态过渡过程故障检测方法,以一种隐状态概率集成策略将局部监测结果以概率方式组合
成两个全局指标,并采用贝叶斯信息准则进行模型评估,后采用负对数似然概率指标进行过渡过程故障检测。

Du等[14]以HMM建立润滑油降解的状态演化过程,利用最大化期望(exp
ectationmaximization,EM)算法估计HMM的未知参数,并以后验概率的形式通过条件可靠度函数和平均剩余寿命函数来进行预测。

Soualhi等[15]提出了两种基于HMM故障预测的概率方法,将故障预测不仅限于对RUL的估计,
而且还扩展到对未来可能出现故障的风险的估计。

Le等[16]针对系统可能存在多个性能退化机制的情
况,提出了一个多分支建模框架,通过CBM环境中的状态监测信息,证明了多分支HMM在RUL估计方面的性能。

上述文献证明了HMM在RUL预测应用中的有效
性,并且与许多其他RUL预测方法相比,HMM的一个显
著优点是具有比较强的可解释性。

但是,标准HMM的最基础的假设是马尔可夫链,即系统下一时刻的状态仅由当前状态决定,
不依赖于以往的任何状态,并以此计算所有变量的联合概率分布。

这样将导致在利用建立好的HMM进行预测时,因为没有考虑预测对象的全寿命过程退化轨迹,HMM将产生较大的偏差,从而导致预测结果不够理想。

针对上述问题,提出了一种基于多源信息融合的HMM建模方法,首先定义经验信噪比(empiricalsignaltonoiseratio,eSNR)选取主要信号,随后基于主成分分析(principalcomponentanaly
sis,PCA)方法将多维发动机监控数据进行信息融合,将监控数据从多维降至一维,通过对
降维后的数据进行分析和比较,得到每台发动机的HI,再将测试数据集中的发动机性能HI与训练数据集遍历比较,通过相似性分析得到若干个与之最为接近的训练发动机HI,再将相应的发动机数据进行HMM建模,针对测试数据集中的每个发动机分别建立一个与之相对应的高斯混合
隐马尔可夫模型(GaussianmixtureHMM,GM HMM)
,再对其进行隐状态分析,
通过EM算法,得到后验概率最大的模型后,
采用维特比算法估计当前发动机的退化状态,再利用蒙特卡罗模拟,通过生成从当前健康状态到故障状态的路径,估计发动机的RUL。

相比于直接利用所有的数据训练一个HMM,该方法在分析发动机退化轨迹的基础上,针对每一个测试发动机分别得到一个HMM,充分考虑了发动机的历史退化轨迹的影响,提高了模型的准确度。

同时,为了避免可能出现的过拟合风险,相比于直接挑选一个最相似的退化轨迹,利用相似度原理分析选出了若干个最相似轨迹,再对其进行HMM建模。

最后通过对NASA公开的航空发动机的案例进行研究,证明了所提预测方法的有效性。

1 基于犲犛犖犚和犘犆犃的传感器信号融合方法1.1 基于犲犛犖犚的传感器特征提取
特征提取是模式识别和机器学习的重要课题,数据中如果包含大量冗余变量或噪声信号,会对模型性能产生非
常大的影响,
导致模型过拟合或精度差等问题。

在RUL预测的应用中,
特征提取等价于选择合适的传感器信号,其目的是降低数据之间的冗余并尽量提高其相关性。

常用的传感器选择方法包括观察传感器数据变化趋势[17]、
基于信息熵理论的传感器选择[18],
上述方法简单直观,操作性强,但缺乏理论基础,基于主观判断的信号特征使预测结果不
稳定。

为提取有用的传感器信号,并同时达到降噪的目的,本文提出了一种基于信噪比分析的传感器特征提取方法。

首先对信号进行归一化处理,在此基础上分析各传感器数据
 第5期
黄林等:基于多源信息融合与HMM的剩余寿命预测·1749 · 的信噪比,再采用sigmo
id函数将信噪比转化至0~1区间后,
将归一化的传感器信号乘以对应的信噪比函数,对信号进行加权后,同时考虑传感器信号的变化趋势和不同信号之间的相关性,采用核PCA方法对数据进行降维,根据主成分方差占比提取信号作为最终的预测信号。

令{狊犻}为1维时间序列的原始传感器信号,{狊犻_狊}为经过PCA降维和数据平滑后的时间序列,定义eSNR为eSNR(狊)=var{狊犻—狊})/var{狊犻}
(1)传感器信号的权重将根据其对应的eSNR而定,具体为珘狔狀=狔狀·eSNR(狔狀)(2)式中:狔狀为传感器信号;珘狔狀为修正后的传感器信号,通过eSNR修正后,
能够充分降低传感器信号中杂讯的影响,起到滤波的作用,从而提取更加可靠的系统HI。

1.2 基于犘犆犃数据降维与信息融合PCA是一种数据压缩和特征提取的多变量统计分析技术,能够有效去除数据间的相关性,目的就是在保证数据损失尽可能小的前提下,经过线性变换舍弃小部分信息,以少数新的综合变量取代原始变量,因此要求主成分能够充分反映原始变量的信息,同时又互不相关,从而进行样本评价。

在许多情况下可以通过PCA来降低特征向量的维数,将系统众多的传感器信号转换为较少数量的主成分,同时PCA可以消除变量间的线性相关性,并通过融合多个变量来抑制噪声。

传感器信号之间可能存在关联,且其相关性可能会破坏RUL预测模型,使预测结果产生偏差。

PCA是一种将潜在相关变量转换为少量不相关变量的常用技术。

数据集犡=(狓1,狓2,…,狓犾,…,狓犔)包含犔个样本,每个样本为犖维变量,则犡的经验均值为狌=(μ1,μ2,…,μ犖)T(3)μ狀=1犔∑犔犾=1
犡[狀,犾](4)样本的协方差矩阵为犆=1犔-1(犡-狌犺)(犡-狌犺)T(5)式中:犺为全为1的犔维向量。

对协方差矩阵犆进行特征向量分解,并选取前犕个特征向量,特征向量数犕的选择取决于希望保留的数据方差,例如80%,即有:犕=min犿=1,2,…,犖
犿∑犿狀=1λ狀≥80%∑犖狀=1λ烅烄烆狀(6)因此,可以对数据集犡进行降维处理,并保留系统80%方差:犣=犞T犕·犢=犞T犕(
犡-狌犺)(7)式中:犞犕=(狏1,狏2,…,狏犕)
为由犕个特征向量组成的犖×犕矩阵,犢为犕×犔矩阵且每列为犡中对应列向量的一个主分量向量。

1.3 犎犐构建本文对比了目前使用较为广泛的用于数据平滑从而构建系统HI的两种算法,分别是核岭回归(kernelridg
ere gression,KRR)[19]和支持向量回归(supportvectorregre ssion,
SVR)模型[20]。

算法对经过eSNR特征选择和PCA降维后的多维系统监测数据进行拟合平滑处理,提取系统性能退化特征曲线,从而构建系统HI。

1.3.1 KRR
KRR是岭回归(ridgeregression,RR)的扩展,而RR的本质是在线性回归的基础上增加L2正则化,RR的最小化代价函数为犔(犠)=1狀∑狀犻=1
狔犻-犠π狓犻2F+λ‖犠‖2F(8)式中:
λ为正则化参数;‖·‖F表示F范数;犠∈犚狆×犱是变化矩阵;狓犻为第犻个样本;狔犻为第犻个样本的真实值。

即求解
argm
in犔(犠)=(犣T犣+λ犐狆)-1犣T犢(9)式中:犣∈犚狀×狆,犢∈犚狀×狆为训练数据特征向量矩阵和因变量矩阵;犐狆∈犚狆×狆为恒等矩阵。

通过核变换可以将此方法进行扩展,将数据映射到某一个核空间,使得数据在该核空间线性可分,从而能够处理非线性数据,则回归函数结果可表示为
犳(
狓)=犢T(犓+λ犐狀)-1犽(狓)(10)式中:犓为Gram矩阵,犓犻犼=犽(狓犻,狓犼)(犻=1,2,…,狀),狀为训练样本的数量。

本文使用高斯核函数:
犓犻犼=犽(狓犻,狓犼)=exp烄烆烌烎(11)式中:σ为核函数宽度,通常采用交叉验证的方式选取合适的宽度参数。

1.3.2 SVR
SVR是SVM在分类应用方面的推广,SVR假设模型输出犳(狓犻)
与真实值狔犻之间最多有ε的误差,即仅当与之间的误差绝对值小于ε就算预测正确。

于是,SVR问题写成:min狑,犫12‖狑‖2+犅∑犿犻=1犾ε(犳(狓犻)-狔犻)(12)式中:狑为样本空间中超平面的法向量;犅为正则化常数;犾ε
为ε的不敏感损失函数:犾ε(狕)=0,|狕|<ε|狕|-ε,烅烄烆其他(13)更多关于SVM的原理建议参看文献[21]。

1.3.3 对比分析
图1为两种方法对论文拟采用的数据集中某一训练样本进行拟合的情况,直接采用经过PCA降维后的散点
 ·1
750 ·系统工程与电子技术第44卷 作为系统HI不能很好地反应系统性能随使用时间增加而
导致的性能退化情况,因此需要进行曲线拟合,提取系统退化特征,作为系统HI。

图1分别为KRR和SVR对数据的平滑效果以及相应的误差变化趋势。

可以看出,采用KRR提取的性能退化轨迹更加平滑,更能反应系统性能退化的真实状态,SVR曲线起伏波动较大,与实际情况有所差别,因此采用本文所提的KRR进行系统性能退化轨迹提取。

图1 KRR与SVR拟合效果对比Fig.1 ComparisonoffittingeffectbetweenKRRandSVR2 基于犌犕
犎犕犕的犚犝犔预测2.1 犌犕 犎犕犕基本原理HMM是一种基于动态贝叶斯网(dynamicBay
esiann
etwork,DBN)的统计概率模型。

HMM假定系统状态不可观测,
并由有限个隐状态和一组观测变量构成,每个隐状态对应两种概率:
状态转移概率和输出观测概率,且在任一时刻,观测变量的取值仅依赖于隐状态。

在本文所关心的状态监测和故障诊断等领域的应用中,
系统的健康状态(故障参数、RUL、HI等)
即为HMM模型假定的隐状态。

HMM变量分两组:①隐状态{狇1,狇2,…,狇犖},狇狋为模
型在狋时刻的隐状态,假定马尔可夫隐状态空间犛={犛1,犛2,…,犛犖}
,其中犖为马尔可夫链隐状态数目,则显然有狇狋∈犛;②观测变量{
狓1,狓2,…,狓犖},狓狋为狋时刻的观测值。

若观测变量为离散值,并假定取值空间为χ={狅1,狅2,…,狅犕}
,则有狓犖∈χ。

若HMM应用于RUL预测中,观测变量通常为系统一组可量化的监测变量,
通常为连续型,因此取值空间可为无限维。

一个标准的HMM可由以下3组参数确定。

(1)模型在各状态之间的转移概率犃=[犪犻犼]犖×犖,其中犪犻犼=犘(狇狋+1=犛犼狘狇狋=犛犻)∑犼犪犻犼=烅烄烆1,1≤犻,犼≤犖(14)(2)初始状态概率π=[π1,π2,…,π犖]
,其中π犻=犘{狇1=犛犻}∑犻
π犻=烅烄烆1,1≤犻≤犖(15)(3)输出观测概率犅=[犫犻犼]犖×犕,
其中犫犻犼=犘(狓狋=狅犼|狇狋=犛犻)
,1≤犻≤犖;1≤犼≤犕(16)通过指定状态空间、观测空间和上述3组参数即可确定一个HMM,并可简化表示为
λ=(犃,犅,π)
在RUL预测中,系统性能逐渐退化直至失效(RUL为0)的过程通常是不可逆的,因此左右连续型HMM(left
rig
htcontinuousHMM)是描述退化过程的合适选择,其失效概率将随着时间推移而增加,状态转移概率矩阵形式如下:
犃=犪11犪120…000犪22犪23…00
000…犪(犖-1)(犖-1)犪(犖-1)犖
000…熿
燀燄燅0
1(17)
另外,在实际应用中,由于观测变量往往是连续变化的,因此采用混合高斯函数拟合各个隐状态的对应输出分布,则式(16)
可改写为犫犼(犗)=∑犓犽=1犮犼犽犫犼犽(犗)=∑犓犽=1
犮犼犽犖(犗,μ犼犽,犝犼犽)(18)
 第5期
黄林等:基于多源信息融合与HMM的剩余寿命预测·1751 · 式中:犗为观测序列;犓为高斯元数目;μ犼犽为状态犼对应的权重;犝犼犽为第犽个高斯元函数。

因此,GM HMM可表示为
λ′=(π,犃,犮犼犽,μ犻犽,
犝犼犽)(19)并且有:
犮犼犽≥0,1≤犼≤犖;1≤犽≤犓(20)
∑犓
犽=1
犮犼犽=1,1≤犼≤犖(21)2.2 系统状态识别
HMM主要用于解决3个基本问题[2122],
分别是:①评估模型与观测序列之间的匹配程度;②根据观测序列推断出隐藏的模型状态;③训练模型使其能更好地描述观测数据。

本文主要利用GM HMM解决后面两个问题。

针对本文的实际需求,首先采用Baum Welch算法,基于充足的训练样本数据,对GM HMM模型参数进行训练,通过极大似
然估计可得到观测序列下概率最大的模型,以该模型作为最终的模型,即上文中提到的问题③。

得到HMM模型后,
运用维特比算法,对测试数据进行分析处理,从而推断系统当前的健康状态,即HMM模型的隐状态,从而实现对设备当前健康状态的有效识别,对应上文提到的问题②,具体流程如图2所示。

图2 HMM健康状态预测流程Fig.2 HealthstatuspredictionbasedonHMM2.
3 基于蒙特卡罗模拟的犚犝犔预测通过训练数据对GM HMM模型进行训练后,即可得到系统的转移矩阵,
转移矩阵以概率的形式,描述了系统健康状态在每一个循环过程的演变信息,从而可以有效地对
系统当前的健康状态进行预测,
系统RUL预测流程如图3所示。

图3 RUL预测流程Fig.
3 RULpredictionprocess 本文采用蒙特卡罗模拟[23],
基于GM HMM转移矩阵计算系统RUL,
具体过程为:①基于训练后的GM HMM模型,对当前测试样本进行狀次模拟,在这狀次模拟中,设备将逐步从健康状态演变至失效状态。

根据GM HMM转移概率生成0~1之间的均匀分布随机数,从而估计下一时刻系统健康状态;②将计算出的下一个状态视为当前状
态,重复此过程直到达到系统失效状态;③系统从健康状
态运行至失效前的运行次数可作为RUL预测值,
通过狀次模拟,可以得到狀个RUL预测值,直至完成所有样本模拟。

根据蒙特卡罗模拟方法的思想,系统到达失效状态的平均步数可作为RUL预测值:
steps =1狀∑狀犻=1
RUL犻(22)
 ·1
752 ·系统工程与电子技术
第44卷
3 实验研究
为验证本文方法的有效性,采用美国国家航空航天局
(NationalAeronauticsandSpaceAdministration,NASA)公布的基于C MAPSS的航空发动机性能退化仿真数据集[24],对基于GM HMM和蒙特卡罗方法的RUL预测算法进行验证。

3.1 实验数据分析图4为基于C MAPSS构造的航空发动机结构简图,包含风扇、燃烧室、高低压压气机、透平、喷嘴等部件。

图4 C MAPSS航空发动机简图
Fig.4 C MAPSSaeroenginediag
ramNASA公布了5组数据集,每组数据集包含了上百台
发动机单元,
每台发动机初始为健康运行状态。

在发动机运行过程中,随机注入不同的故障来模拟系统性能退化过程,每个发动机状态记录总共有24个变量,其中3个是操作设置,21个为监测值,包括工作循环数、工作环境参数、每个工作循环的监控数据等,如表1所示[24],监测数据加入了高斯白噪声干扰模拟实际传感器噪声影响,数据能够逼真地模拟真实系统,具有非常高的可信度。

表1 发动机传感器数据描述
犜犪犫犾犲1 犈狀犵犻狀犲狊犲狀狊狅狉犱犪狋犪犱犲狊犮狉犻狆
狋犻狅狀序号变量描述
1T2
/℃风扇入口总温2T24
/℃低压压气机出口总温3T30
/℃高压压气机出口总温4T50
/℃低压涡轮出口总温5P2/kPa
风扇入口压力6P15/kPa
外涵总压7P30/kPa
高压压气机出口总压8Nf/rpm
风扇物理转速9Nc/rpm
核心机物理转速10ep
r发动机压比(P50/P2)11
Ps30/kPa
高压压气机出口静压续表1
犆狅狀狋犻狀狌犲犱犜犪犫犾犲1序号
符号描述
12Phi燃油流量与P30比值13NRf/rpm
风扇换算转速14NRc/rpm
核心机换算转速15BPR
涵道比16farB
燃烧室燃气比17htBleed
引气焓值18Nf_dmd/rpm
设定风扇转速19PCNfR_dmd/rpm
设定核心机换算转速20W31/(kg
/s)高压涡轮冷却引气流量21
W32/(kg
/s)低压涡轮冷却引气流量以NASA公布的5组数据集中的第一组为例进行方法
验证。

数据集FD001分为训练集和测试集,训练集即历史数据库样本,包含100组从正常运行状态至系统失效的全寿命数据,测试集即测试样本,包含样本发动机从完好状态运行至失效前一段时间的数据。

3.2 预测结果评价指标
常用的RUL预测结果评价指标有平均绝对误差、均方根误差、百分比误差、平均绝对百分比误差(meanabsolute
percentag
eerror,MAPE)等,为方便比较和分析,本文采用MAPE作为评价指标之一,
其计算式为MAPE=1犖狊∑犖狊
犼=1
狘R^UL犼-RUL犼RUL犼狘(23)式中:R^
UL犼和RUL犼分别为第犼个测试样本点的RUL预测值和实际值。

MAPE值越低表示模型预测值与实际值越接近。

另一方面,在实际应用中,RUL预测值偏大比RUL预测值偏小造成的损害大,因此除了MAPE之外,还采用文献[25]提出的分段惩罚系数的方法,其表达式如下:
Score犻,犼=e-犱犻,犼/犪1-1,犱犻,犼<0e犱犻,犼/犪2-1,犱犻,犼≥烅烄烆
0(24)Score=∑犻∑犼
Score犻,犼
(25)式中:犱犻,犼=R^UL犼-RUL犼表示第犻(犻=1,2,…,犖)个测试样本在犼时刻RUL预测值与真实值的偏差。

Score越小RUL预测越准确。

除此之外,还采用假阳性率(falsepositiverate,FPR)
、假阴性率(falsenegativerate,FNR)和准确度犃[26]来进行评价,其中
FPR=Num狆100×100%(26)FNR=Num狀100×10
0%(27)
 第5期
黄林等:基于多源信息融合与HMM的剩余寿命预测
·1753 · 犃=100犖∑犖
犻=1犐(e
rror犻)(28)式中:Num狆为error犻<-10的个数;Num狀为error犻>13的个数。

犐(error犻)=1,-10≤error犻≤130,error犻<-10或error犻>烅烄烆
133.3 发动机犎犐特征提取
首先对训练集中的发动机历史数据进行分析,通过观
察数据分布可以看出,部分传感器信号为常值,不随发动机运行发生变化,例如狊1、狊5、狊6、狊10、狊16、狊18、狊19,
去除这些数据后,为降低数据之间的线性相关性,同时为达到降噪的目
的,首先对传感器信号的趋势进行观察和分析,再基于eS NR和PCA进行降维处理,作为后续系统HI提取的数据来源。

图5为id为1的发动机的14个传感器信号在生命周期的变化趋势,需要注意的是,所有数据在分析之前已经进行了归一化处理,因此变化范围都在0~1之间。

从图5中可以看出,航空发动机的14个传感器信号在生命周期内都具有单调性,可以被用来提取系统性能退化轨迹。

图5 样本发动机监控数据变化趋势
Fig.5 Trendofsampleenginemonitoringd
ata 为了降低数据维度以及数据之间的相关性,同时为了起到一定的数据降噪作用,对14维监控数据进行PCA降维处理。

基于同样的训练参数,对测试集中的所有发动机监控数据做同样的处理,可以得到测试样本从正常运行状
态到当前状态的性能退化曲线。

图6(a)和图6(b)分别为
样本库中100台发动机经过PCA降维和KRR处理后,基于eSNR进行特征提取得到的训练样本HI和经过降维和平滑处理后的状态。

 ·1
754 ·系统工程与电子技术
第44卷
图6 系统HIFig.6 SystemHI3.4 犚犝犔预测结果分析构建系统HI后,需要确定系统性能退化隐状态数目。

部分文献直接通过经验确定隐状态数目,例如假设系统退化经历4个状态[17]:正常状态、初步退化状态、严重退化状态和实效状态。

直接通过经验确定HMM隐状态数目的方式包含部分不确定性,本文采用基于贝叶斯信息标准(Bayesianinformationcriterion,BIC)
的方法确定隐状态数目[27],并有:BIC=犔·ln犜-2ln犘(犗|λ)(29)式中:犔为隐状态数目;犜为样本时间步长;犘(犗|λ)为观测概率。

使得BIC最小的犔值为最佳隐状态数目。

图7为基于训练样本数据进行BIC分析的结果。

显然,假设系统经历4个退化状态取得的效果最好。

2 750
3 2503 750
4 2504 750
5 2505 750
6 250
1234
5*
: spherical;: tied;
: diag;
: full
B I C
图7 BIC分析结果
Fig.7 BICanalysisresults图8
为基于4
个退化状态建立的高斯混合模型,
4个高斯
混合模型(G
aussianmixturemodel,GMM)
分别对应系统4个退化状态,从图8中可以看出GM HMM可以较好地对系统退化状态进行模拟。

图8 4个组件对应的GMM模型Fig.
8 GMMmodeloffourcomponents基于提取的系统性能指数和GM HMM模型,将训练样本数据输入模型中进行训练,并假定系统初始状态转移概率为
犃=0.90.10000.90.10000.90.1熿燀燄燅0001(30)需要注意的一点是,将所有训练数据全部用于训练一个
HMM并将该HMM模型应用于所有测试样本进行RUL
预测,这种方式将会产生非常大的偏差。

为了避免这种偏差,同时又尽可能地降低过拟合风险,本文提出并采用了一种“定制”策略,具体为:针对每一组测试数据,根据HI退化情况,基于最小欧式距离,从所有训练样本中选取5个性能最相近的发动机样本,以这些样本数据为每一组测试发动机训练一个HMM模型,即总共训练得到100个HMM。

以样本库中1号发动机HMM模型训练为例,经过训练后的状态转移概率为犃=0.98730.01270
000.98260.01740000.95620.0438熿燀燄燅0001(31)图9为训练样本健康状态,即模型隐状态变化趋势。

图9 系统隐状态变化趋势
Fig.9 Changetrendofsy
stemhiddenstate。

相关文档
最新文档