核主元分析在故障诊断中的研究与应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
核主元分析在故障诊断中的研究与应用
摘要
化工在工业生产中占有举足轻重的地位,它几乎涉及到人们生活的各个方面,近年来,随着科学技术,尤其是计算机技术的飞速发展,化工过程生产装置的规模越来越大,工艺越来越复杂,自动化水平越来越高,因此化工过程的安全性和可靠性就显得特别重要。
采用故障诊断技术来提高化工过程的安全性和可靠性是一种有效而重要的方法,因此对化工过程进行故障诊断研究具有极其重要的价值。
本文介绍了主元分析法和核主元分析法在故障诊断的研究应用,并在化工过程中进行了仿真应用研究,针对主元分析法(PCA)应用于复杂非线性的化工过程故障检测时存在性能差的问题。
我们提出利用核主元分析法(KPCA)来进行故障检测的思想,从而将输入空间中复杂的非线性问题转化为特征空间中的线性问题,在特征空间中采用T2和SPE 的贡献率检测出系统的故障。
TE过程的研究应用验证了算法的可行性,达到了预期的效果。
关键词:故障检测主元分析核主元分析TE过程
I
kernel principal component analysis in failure diagnosis research and
application
Abstract
Chemical industry plays a very important role in industrial production, it involves almost all aspects of people,s lives. In recent years, along with the development of scienee and technology, especially computer technology, production units of chemieal industry become bigger and bigger. Technological processes beeome more complex, automatic level becomes higher and higher. Therefore, the security and reliability of chemieal proeess is more important. There is are many methods to improve system’s, fault diagnosis technology is avery effeetive and important method to improve the security and reliability of chemical proeess. So research on fault diagnosis has vitally important value for chemical industry process.
The thesis introduces the methods of principal component analysis and kernel principal component analysis are analyzed for fault diagnosis, and simulations are applied to Tennessee Eastman chemical proeess. For complex and nonlinear chemical industry processes, the performance of fault detection is very poor when principal component analysis (PCA) is used. Thus the concept of using kernel principal component analysis (KPCA) to conduct fault detection is proposed, which will make the complex nonlinear problem in input space convert into linear problem in feature space, according to calculate the contribution of each original variable for Hotelling T2 and SPE to research on fault detection. The application study of Tennessee Eastman chemical process proves the feasibility of the proposed methods, and achieves the expected results.
Key Words:fault detection; principal component analysis; kernel principal component; Tennessee Eastman process
II
目录
摘要 (I)
Abstract (II)
第一章绪论 (1)
1.1课题背景 (1)
1.2 故障诊断方法 (1)
1.2.1 依赖于模型的故障诊断方法 (1)
1.2.2 不依赖于模型的故障诊断方法 (2)
1.3 仿真技术 (3)
1.4 动态系统仿真工具Matlab/Simulink简介 (3)
1.5 本论文主要研究工作 (3)
第二章基于特征样本核主元分析的过程故障检测方法 (4)
2.1 主元分析方法介绍 (4)
2.2 应用PCA的前提条件 (4)
2.3 PCA基本原理及PCA算法 (4)
2.4 主元分析故障检测的基本方法 (5)
2.5 核主元分析研究背景 (6)
2.6 核主元分析 (6)
2.6.1 核主元算法 (6)
2.6.2 特征样本提取 (8)
2.7 核主元在线故障监测方法 (9)
2.7.1 基于T2和SPE的在线故障检测方法 (9)
2.7.2 核主元的故障监测步骤 (10)
2.8 主元分析法和核主元分析法的比较 (11)
第三章TE过程描述 (13)
3.1 TE模型实验系统的概述 (13)
3.2 数据的生成 (15)
3.3 TE仿真模型 (15)
第四章仿真过程的建立与结果 (18)
4.1 数据来源 (18)
4.2 故障检测分析 (19)
III
第五章总结 (27)
参考文献 (28)
致谢 (30)
附录 (I)
IV
南京工业大学本科毕业设计(论文)
第一章绪论
1.1课题背景
目前,故障诊断技术已成为一个十分活跃的研究领域。
所谓故障,广义的讲,可以理解为任何系统的异常现象,使系统表现出所不期望的特性。
故障诊断技术主要包含三方面的内容:故障检测、故障隔离、故障辨识。
所谓故障检测是判断系统中是否发生了故障及检测出故障发生的时刻;故障隔离就是在检测出故障后确定故障的位置和类型;故障辨识是指在分离出故障后确定故障的大小和时变特性。
从本质上讲,故障诊断技术是一个模式分类与识别问题,即把系统的运行状态分为正常和异常两类,而异常的信号样本究竟又属于哪种故障,这又属于一个模式识别的问题。
现在一套大型乙烯装置上就有成百上千的控制回路整套装置的投资一般都在数十亿人民币以上。
某些微小故障若不能及时排除就有可能造成巨大的灾难。
美国挑战者号航天飞机的失事,原苏联切尔诺贝利核电站的泄漏事故中国运载火箭的连续数次失事就说明了这一点。
因此在这种情况下系统的安全性就显得极其重要。
提高系统可靠性和安全性的方法有多种其中一个重要的方法就是采用故障诊断技术。
我们通常所说的故障是指系统所出现的一些异常现象。
根据故障发生的部位可以把故障化分成被控过程的元器件故障、执行果我们可以对故障做到早期诊断就有可能采取必要的措施避免故障的进一步传播,使得被控过程在某些故障发生时仍可以有效地运行。
近三十年的理论研究表明和实际应用表明,故障诊断技术的出现,为提高系统的可靠性和安全性开辟了一条新的途径;它的出现与兴起,是实际应用需求与多学科理论发展两个方面交替作用的结果。
从实际应用方面来看,随着现代自动化水平的不断提高,各类生产系统的复杂性大大增加,系统的安全性受到工程界的高度重视。
目前现代控制理论,信号处理,模式识别等方法为故障诊断问题提供了有力的理论基础。
为了有效地及时处理可能发生的故障在线故障诊断技术是必需的。
我国对故障诊断技术非常重视。
故障诊断技术被公认为起源于上世纪处,经过多年的发展,基本的故障诊断方法可分为记下几种。
1.2 故障诊断方法
1.2.1 依赖于模型的故障诊断方法
该方法一现代控制理论和现代化方法为指导,一系统的数学模型为基础,然后通过构造观测器估计出系统输出,再与系统输出的实际测量值作比较得到残差信号[1]。
残差
1
第一章绪论
信号中包含着丰富的故障信息,经过故障方向辨识,可以从中隔离出故障的部位,从而达到故障诊断的目的,根据残差的产生方式可细分为状态估计诊断法和参数估计诊断法[2]。
(1) 基于状态估计的方法
基于状态估计的方法首先要构造状态观测器对系统的状态进行估计,用来得到系统输出的估计值,然后用输出的估计值和实际测量值之间的偏差信号作为残差信号来判断系统中是否发生了故障,最后对故障作进一步的分离、估计和决策。
基于状态估计的故障诊断方法依然是人们研究的一个热点。
在故障诊断机构中,对故障信号检测的敏感性和故障诊断机构对系统参数摄动的鲁棒性是始终存在着的矛盾体,如何协调二者之间的矛盾以便能达到各自指标的最优化是人们都在努力解决的问题。
实际应用中所面临的一些问题也有待于人们去进一步探讨。
(2)基于参数估计的方法
当故障有参数的显著故障变化来描述时,可以利用已有的参数估计方法来检测故障信息,根据参数的估计值与正常值之间的偏差来判断系统的故障情况[3]。
我们这篇论文所要介绍的核主元分析方法就是依于参数估计方法。
1.2.2 不依赖于模型的故障诊断方法
当前的控制系统变得越来越复杂,不少情况下要想获得系统的数学模型是非常困难的。
不依赖于模型的故障诊断方法因此受到了人们的高度重视。
而基于知识的方法不需要精确的数学模型,也因此具有很好的发展前景[4]。
(1) 基于症状的方法
(2) 基于直接可测信号的故障诊断方法
这种方法根据直接可测的输入、输出信号和它们的变化趋势来进行故障诊断。
在正常情况下,输入、输出信号的变化范围和变化趋势总是在一定的范围之内,当超出规定的范围时,就说明系统中有故障发生[5]。
(3) 基于信号处理技术的故障诊断方法
①变换类方法
②谱分析方法
(4) 基于知识的方法
目前,基于知识的方法不需要精确的数学模型,是人们研究的一个热点问题。
主要包括基于神经网络的方法、基于模糊逻辑的方法和各种智能控制的结合方法。
2
南京工业大学本科毕业设计(论文)
1.3 仿真技术
仿真技术综合集成了计算机、网络技术、图形图像技术、多媒体、软件工程、信息处理、自动控制等多个高新技术领域的知识,它是以相似原理、信息技术、系统技术及其应用领域有关的专业技术为基础,以计算机和各种物理效应设备为工具,利用系统模型对实际或设想的系统进行实验研究的一门综合性技术[6]。
近十几年来,在计算机技术进步的带动下,仿真技术在很多领域都取得了巨大的发展,得到了广泛的应用,成为科研、生产、研究和设计实验的重要工具,并成为一种培训技术人员的有利手段。
仿真技术的应用已不仅仅限于产品或系统生产集成后的性能测试实验,仿真技术已扩大为可应用于产品研制的全过程,包括方案论证、技术指计分析、生产制造、实验、维护、训练等各个阶段[7]。
仿真技术不仅仅的单个系统,也应用于由多个系统综合构成的复杂系统。
1.4 动态系统仿真工具Matlab/Simulink简介
MATLAB是一个高级的数学分析和计算软件,其强大的科学计算与可视化功能、简单易用的开放式可扩展环境以及多达30多个面向不同领域而扩展的工具箱支持,集计算机辅助设计、分析与仿真于一体,使得MATLAB在许多学科领域中成为科学研究和应用开发的基本工具和首选平台[8]。
Simulink是运行在MATLAB环境下,用于建模、仿真和分析动态系统的软件包,它支持连续、离散以及两者混合的线性和非线性系统。
而且Simulink完全集成于MATLAB,它可以利用MATLAB的所有资源,使用Simulink可以很容易地创建一个新的模型,或者是修改一个旧的模型[9]。
它的建模与仿真过程是可视化和交互式的,可以随时修改参数,并且能立即看到仿真的结果。
1.5 本论文主要研究工作
本文将介绍核主元分析的基本概念和原理,然后提出核主元分析方法在过程监测中的具体应用;熟悉TE模型原理并能够使用TE模型导出数据,在此基础上通过核主元的算法来检测出TE模型中的故障,通过本论文研究结果表明基于核主元的非线性过程监测方法是有效的,且相比于PCA具有更高的监视性能,在实际的非线性过程监视中具有良好的应用前景。
3
第二章基于特征样本核主元分析的过程故障检测方法
第二章基于特征样本核主元分析的过程故障检测方法
2.1 主元分析方法介绍
在化工连续生产过程中,生产系统在长期运行和生产负荷中会不可避免地发生各种故障,影响生产质量,甚至引起重大的经济损失,而化工生产系统一般都具有过程精确、建模困难、过程变量众多且相互间具有强耦合,并且在实际中存在各种随机因素影响等特点。
这就使得基于机理模型的诊断方法的应用极为不便。
如主元分析(PCA)是一种不依赖于过程机理的建模方法,它只需通过过程数据的信息来进行统计建模,然后基于该模型实现对过程的监测。
所以主元分析是一种较为成熟的多元统计监测方法[10]。
2.2 应用PCA的前提条件
生产过程中每个传感器在主元分析中都用一个随机变量表示。
在把PCA引入生产过程的故障诊断中时,做了以下假设[11]:
1)生产过程中的各变量都服从相同的高斯正态分布,即要相互独立。
2)生产过程处于稳态,不存在序列相关。
3)相关变量之间是线性相关的。
4)生产过程中各参数是不随时间变化而变化的。
而实际生产过程中这些假定的前提条件一般是很难被满足的,针对这些前提条件的限制,可以对普通PCA方法进行一系列的改进,我们将在下面的内容中提到核主元分析法。
2.3 PCA基本原理及PCA算法
目前,它已成为数据分析的重要工具。
PCA的核心思想是降低由大量相关变量组成的数据集的维数,同时尽可能多地保留数据集的方差。
实际上,多元回归与差异分析方法也可实现数据降维,但是可能会造成主要维数的丢失[12]。
PCA力一法使用所有原始变量来获得由较少变量组成的数据集(即主成分,PC),这个数据集保留了原始数据特征,可用来逼近原始变量。
原始数据的相关性越强,主成分数越少。
主成分(PC)是不相关的,且应按顺序排列,使前面几个主元包含原始数据集绝大部分的方差[13]。
给定一个数据矩阵X,X代表m个变量x l,x2,…,x m的n组观测值。
PCA的第一步就是确定一个新变量y l,来解释m个变量x l,x2,…,x m的方差。
第一个主成分y l 由m个变量的线性组合给出,如下式所示[14]:
4
南京工业大学本科毕业设计(论文)
5 y l =w 11 x l +w 12x 2+…+w 1m x m (2-3-1) 其中,样本方差对于所有系数来说达到了最大值,将w ll ,w 2,…,w 1m 简写为向量w 1,w 2,w 12,…,w lm 必须满足系数平方和限制,即w 1,w 1应该是单位值。
第二主成分y 2由m 个变量的线性组合给出,形式如下:
y 2=w 21x 1+w 22x 2+…+w 2m x m (2-3-2) 相似的, 第j 个主成分也是一个线性组合
y j =w J x (2-3-3) 它保留了最大方差,需满足:
w j ,w j =l 且w i ,w j =0(i<j) (2-3-4)
为了找到定义第一主元的系数,应选择元素w 1,以最大化y 1的方差,满足w 1,w 1=1的限制。
y l 的方差由下式给出:
Var(y 1)=Var(w 1,x)=w 1,Sw 1l (2-3-5)
这里,S 是原始变量的协方差矩阵。
使y 1方差最大化的w 1=(w ll ,w 12,…,w lm )的解是与最大特征值对应的S 的特征向量。
S 的特征值是以下等式的特征根:
0=-I S λ (2-3-6)
设特征值为入1,入2,…,入m ,然后将其从大到小排列。
前几个特征向量是能捕捉大多数原始数据方差的主元(PC),余下的主元主要代表数据噪声。
PCA 依赖于尺度,在PCA 分析前,必须使用一些方法进行标准化,以消除变量单位和测量范围的影响。
最常见的归一化方法是去均值,且将每个变量都划归至单位方差的尺度上。
公式如下:
),...,1;,...,1(,,m j n i s x x x j j
j i j i ==-= (2-3-7)
其中,i 为样本序号,j 为变量序号,j x 为变量j x ,的均值,而j s 是变量j x 的标准差。
2.4 主元分析故障检测的基本方法
在过去的十几年里,人们对它作了大量的研究,并在化工系统中进行了大量的应用。
主元分析法进行故障检测的基本思想是:根据系统在正常工作情况下得到的数据,按照一定的标准,利用统计的方法找出能够表达正常工作情况下过程各变量之间的因果关系的低维主元成分,即主元模型,一旦过程的实时测量数据与建立的主元模型不符,就可以判断过程中己有故障发生[15],再通过对测量数据中各变量变化对主元模型的方差贡献
第二章 基于特征样本核主元分析的过程故障检测方法
6 率的分析,来进行故障检测。
2.5 核主元分析研究背景
利用PCA 故障诊断模型能够抽取原始数据空间的主要变化信息,在保证数据信息丢失最少的情况下,大大降低原始数据空间的维数,消除变量间的非线性关联,降低噪声影响。
通过在实际生产运行中的试验与应用表明,多变量统计过程控制能够对过程的变化作出反应,也能够相当正确地找出发生变化的原因以及相应的流程环节[16]。
随着DCS 、智能仪表以及现场总线技术的广泛应用,化工过程中大量的过程数据被采集并存储下来。
通过分析过程数据来判断系统的运行状态的统计过程监控方法受到广泛的关注。
在解决过程变量非线性的问题时,Schlkopf 等提出一种新方法,即核主成分分析方法(KPCA)[17]。
它的基本思想是首先将低维输入空间中各变量之间的非线性关系通过非线性映射映射到高维特征空间中,然后在高维特征空间中进行线性分析。
其中非线性映射的具体形式并不需要求取,只需得到特征空间中的内积,而内积可以由一维的非线性函数表示。
KPCA 方法本质上是在高维特征空间实现线性PCA ,因此很容易理解和应用于过程监控。
一些学者的研究已经显示了KPCA 方法在故障检测方面的作用[18]。
2.6 核主元分析
2.6.1 核主元算法
核主元的基本思想是首先通过非线性映射将原输入空间(x 1,x 2,...,x N m
R ∈)映
射到一个高维的特征空间F ( 即φm R ∈→F ),然后在这个高维的特征空间F 内,进行主元分析[19],从而把输入空间中的非线性问题转化为特征空间中的线性问题。
特征空间F 的协方差矩阵可以用下式表示[20]
()()11N T F
i i i c X X N ϕϕ==∑ (2-6-1) 这里假定1()0N
k k X φ==∑,且(.)φ表示输入空间到特征空间的非线性映射函数。
在
特征空间F ,为了对角化协方差矩阵,首先要解决在特征空间的特征值问题:
1111(()())(),)()T N N F i i i
i i i V C X X V X V X N N λϕϕϕϕ=====∑∑ (2-6-2)
这里<x ,y>表示x 与 y 的点积,由式(2-6-2)得到的最大λ值对应的v 是特征空间
南京工业大学本科毕业设计(论文)
的第一个主元,而最小的λ值对应的v 就是最后一个主元。
所以F
V C λ=等价于:
(),(),F k k X V X C V
λϕ= ,k =1,。
,N (2-6-3)
且存在系数
(1,...,)i i N α=使得
1
()
N
i i i v x αφ==∑, (2-6-4)
结合(2-6-3)和(2-6-4)可以得到
1
1
1
1
(),()(),()(),()
N
N
N
i k i i
k j j i i i j X X X X X X N λαϕϕα
ϕϕϕϕ====
∑∑∑ k=1,。
,N (2-6-5)
式(2-6-5)中的特征值问题只引入了特征空间的映射向量的点积。
定义矩阵
*N N K R ∈,令
[]K (),()
ij i j ij K X X ϕϕ==
,然后式(2-6-5)的左边可以表示为
,1
1
(),()N
N
i k i i k j i i X X K K λαϕλαλα
====∑∑令k=1,。
,N (2-6-6)
式(2-6-5)的右边可以表示为
11111
1(),()(),()N
N
N
N
i k j j i i kj ji i j i j X X X X K K N
N αϕϕϕϕα=====∑∑∑∑k=1,。
,N (2-6-7)
结合式(2-6-6)和(2-6-7),可以得到下面的式子:
2
K K λαα=[]1,...,T
N ααα= (2-6-8)
在特征空间F 上进行主元分析之前,首先应作标准化处理,即用下式替代矩阵K
N N N N K K I K KI I KI =--+ (2-6-9) 这里
N
I 等于1/N 与一个 N*N 的单位矩阵 *N
N E R ∈相乘。
为了求解式(2-6-8),需要首先求解特征值问题
N K λαα=
[]
1,...,T
N ααα= (2-6-10)
故在特征空间进行主元分析,就等价于对式(2-6-10)求解特征值问题。
令其特征值为
12...N λλλ≥≥≥,对应的特征向量为:1,...,N αα。
主元数可以通过保留前p 主元矢量得到。
标准化特征矢量
1,...,p
αα使得特征空间F 相应的矢量 v k 满足:
,,1
k k v v =,令k=1,。
,N (2-6-11)
第二章 基于特征样本核主元分析的过程故障检测方法
1
11
1(),()(),()
N N
N N
k k k k i
i
j
j
i j i j i j
i j X X
X X αϕαϕααϕϕ====
=∑∑∑∑
11
,,N N
k
k i
j ij k k k k k
i j K K αα
ααλαα====∑∑ (2-6-12)
这样,测试向量x 的主元成分t 通过在F 空 间 将 映 射()X Φ 到特征向量(1,...,)
k V k p =而提取出来:
1
1
,()(),()(,)
N
N
k
k k k i i i i i i t V X X X k x X ϕαϕα=====∑∑ (2-6-13)
为了解决式(2-6-10)的特征值问题,并利用式(2-6-13)直接从输入空间计算F 空间的主元向量,这里在特征空间中引入点积形式的核函数
(,)(),()
k x y x v φφ=,避免直接
计算非线性映射。
核函数的选择完全决定映射(.)Φ和特征空间F 。
常用的具有代表性的核函数有:多项式核函数
(,),d
k x y x y
=;符号核函数
01(,)tanh(,)
k x y x y ββ=+;径向
基核函数
2
(,)exp()x y
k x y σ
--=;这里 d , 0β,1β和 α需提前指定。
2.6.2 特征样本提取
建立基于特征样本的核主元模型分两步进行[21]:首先进行特征样本的提取,然后对特征样本进行核函数主元分析建立正常工况模型。
采用上述的特征样本提取方法,选取中间样本作为第一个特征样本,从全体500个样本中提取5个特征样本(样本1、样本80、样本120,样本225和样本350),建立核主元模型。
由于这5个样本的代表性已经大于98%,即 Js >98%,保证了利用特征样本建立的核主元模型和利用全体样本的建立核主元模型故得一致性,但前者只用5个样本建立主元模型,在线实时监控时只有5个模型样本参与运算,因此核矩阵的计算量较全样本的计算量被大大减少。
对于复杂大系统,在核主元建模和实时监控过程中,需要计算核矩阵*N
N K R
∈[22],由于其维数等于样
本数量,会出现核矩阵K 计算困难。
这里采用特征样本提取方法优化核主元算法,解决了核矩阵K 计算速度问题。
特征样本提取方法就是指在高维空间F 中,在保证样本分布结构基本不变的条件下,选取尽量少的特征样本来表示整个样本集,从而保证特征样本的核主元模型与用全样本建立的主元模型基本一致[23]。
如果从N 个样本中选取的特征样本为Xs={x s1,。
,x sL },其映射为
{}
1,...s s sL ϕϕϕ=,
南京工业大学本科毕业设计(论文)
则其它样本在高维空间F
的映射可用特征样本的映射近似估计为:,i s i
ϕϕα∧
=,其中
s
ϕ为 F 空间的特征矢量矩阵
[]
1,...,T
i i IL ααα=为使得i ϕ∧
与
i ϕ差异最小的矢量系数矩阵。
i ϕ∧
与
i ϕ的差异可以用欧式距离表示为:2
2
i i
i i
ϕϕδϕ∧
-=。
由文献可将i ϕ∧
与
i ϕ最小差 异满足
下列表达式:
1
1min i T si ss si
ii
K K K K α-=- (2-6-14)
若定义2
12
T i
si ss si
si ii i
K K K J K ϕ
ϕ∧-==
,则式(2-6-14)可表示为
()
max s
s
J ,其中
1
i s si
x X
J J
M
∈=
∑
特征样本提取算法是一个迭代循环过程,首先提取样本集的中间样本,计算S 的代表性
s
J 和
si
J ,并将最小的
si
J 对应的样本添加到特征样本集S 中,重新计算新的样本集
S 的代表性,直至s
J >98%为止[2]4。
2.7 核主元在线故障监测方法
2.7.1 基于T 2和SPE 的在线故障检测方法
基于Kernel PCA 的故障检测算法类似于PCA ,在特征空间中仍然采用Hotellin 的T 2统计和SPE 统计检测故障[25]。
T 2统计代表每个采样在变化趋势和幅值上偏离模型的程度。
T 2表征了模型内部变化的一种测度。
监视过程性能变化的另一个统计指标是平方预测误差SPE ,也称Q 统计,它表示每次采样在变化趋势上与统计模型之间的误差,是模型外部数据变化的一种测度。
T 2统计是主元向量的标准平方和[26],可以定义为:
211212[,...][,...]T
p p T t t t t t t -=Λ (2-7-1)
其中:从i t
可以得到,1
-Λ是主元成分的特征值构成对角阵的逆矩阵。
T 2统计的控制限可以通过F 分布求得:
第二章 基于特征样本核主元分析的过程故障检测方法
2
,,(1)
(,)
()p n p n T F p n p n n p αα--- (2-7-2)
这里为样本数目,p 为主元个数。
核主元算法结构示意图如下图所示。
由图中可以清楚地看出每个步骤:首先通过一个非线性映射(.)Φ将输入向量x 映射到一个高维特征空间F 。
然后在这个特征空间中应用线性的PCA ,可以在降维的p 维核主元空间得到得分值t k ,通过v k 将t k 映射到特征空
间中,得到重建的特征向量1()p
k k k x t v ϕ∧
==∑[27]。
定义
2
22
1
1
()()N P
p i i i i x x t t SPE φφ==-=-=∑∑ (2-7-3)
它的置信区域可以根据它的近似分布求的:
2
h
SPE
g χ (2-7-4)
其中 g ,h 是与SPE 的均值和方差相关常数,分别表示SPE 的权参数和自由度。
如果SPE 的均值和方差为a 和b 那么则g 和h 可以近似为:g=b /2a ,h=2a 2/b 。
图2-7 核主元分析结构示意图 2.7.2 核主元的故障监测步骤 1 建立模型[28]: 1) 获取正常数据,且标准化数据,使其均值为 0,方差为 1;
2) 对给定的 M 维正常数据,利用式 [K]ij =[k(x i, x j )],计算核矩阵*N N
k R
∈;
3) 在特征空间利用式N N N K K I K KI KI =-+对K 进行均值中心化处理;
南京工业大学本科毕业设计(论文)
4) 利用式N K λαα=计算特征值,且标准化k α,使得:,1k k k αλ= ;
5) 对正常数据 x ,利用式,1
1
()(),()(,)
N
N
k
k k k i i i i i i t v x x x k x x ϕαϕϕα=====∑∑在特征空
间计算主元成分t k ;
6) 分别利用式(2-7-1)和式(2-7-3)计算正常数据的T 2和SPE 统计量;
7) 分别利用式(2-7-2)和式(2-7-4)确定T 2和SPE 的控制限; 2. 构造核主元在线检测的主要步骤如下[29]:
1) 从采样中获得新的数据,按照正常条件下模型的均值和方差进行标准化; 2) 利用式N N N K K I K KI KI =-+对测试核向量 k t 进行均值中心化;
3) 对测试数据 x t ,式,1
1
()(),()(,)
N
N
k k k k i i i i i i t v x x x k x x ϕαϕϕα=====∑∑提取核主元成
分;
4) 计算测试数据的T 2和SPE 统计量;
5) 监视T 2和SPE 是否超过正常条件下建模时的T 2和SPE 控制限;
2.8 主元分析法和核主元分析法的比较
核主元分析是一种非线性主元分析方法,充分利用核函数来解决非线性映射问题,在高维特征空间中确定主元,具有很好的非线性逼近能力。
主元分析(PCA )是过程监测和故障诊断方法之一,依据系统变量数据的相关性进行分析。
然而,PCA 假设过程为线性系统,若将其应用于非线性系统时,较小的主元并不代表不重要的方差,反而可能包含重要的系统信息,导致主元模型误差增大。
由此,将PCA 应用于非线性过程的故障诊断是不合适的。
Jong 等人利用核主元分析(KPCA )进行非线性过程监测。
因此,本文利用schokopf 等人提出KPCA 方法来解决非线性问题故障检测思想。
KPCA 是一种很有效地非线性过程检测方法,具有类似线性PCA 的简单性,极具实用价值,其基本思想是首先通过非线性映射将原输入空间映射到一个高维的特征空间,然后再高维空间上进行主元分析,从而把输入空间的非线性问题转化为特征空间中的线性问题。
对于复杂非线性化工过程,传统的核主元分析(KPCA)方法在故障检测方面明显优越于普通的PCA 方法,但存在故障诊断效果差的问题。
为此,提出了一种改进的KPCA 的方法,它通过计算核函数的偏导数来求取KPCA 监控中每个原始变量对统计量产和SPE 的贡献率,根据每个变量对监控统计量贡献程度的不同,来诊断出故障源。
与线性PCA 类似,可以利用贡献。