改进PCA及其在过程监测与故障诊断中的应用
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
于是原来的 n 维过程数据空间被 k 维的主元空
间代替 , 而且过程变量之间的相关性被消除. 通过
对主元打分和残差的变化进行研究 , 就可以在低维
的主元空间中实现对多元统计过程监测. 具体就是
建立关于主元打分和残差的两个统计量 , Hotelling
T2 和 Q 统计量. 其中 T2 统计量定义为
∑ T 2= t
取. 各过程变量复相关系数定义如下.
定义 2 : 设 y = { t1 , …, tk } , ti ( m ×1) ∈ T( m ×k) 为 PCA 的前 k 个主元打分向量 , 则称
ρ( xi , y)
=
arg
max{ cov ( β
xi
,β y)
/
[var
xi ×var (βy) ]1/ 2}
t
T≤
k(m m-
1) k
Fk , ( m -
k)
,α
(3)
式中 t (1 ×k) ∈T , Fk , ( m - k) ,α表示 F 分布 Fk , m - k的
上侧α分位数.
用于残差监测的 Q 统计量定义为
Q = eeT = x ·( I - PPT) ·xT ≤ Qα
(4)
式中 e (1 ×n) ∈E , x (1 ×n) ∈X , Qα 为 Q 统计量的
Residuals) 统计量 ; 称其余的 ( n - s) 个被监测变量
为一般变量 ( Common Variable , CV) , 其残差构成
CVR 统计量. 其中
PVR = xs ( I - Ps Ps T) xs T (5)
CVR = xn- s ( I - Pn- s PTn- s) xTn- s
X1
X2
T1
T2
M1
M2
W1
W2
W s ,0
W s ,1
W s ,2
WF
t 1
0. 026 - 0. 098 0. 786 0. 857 - 0. 875 - 0. 637 - 0. 902 - 0. 770 - 0. 084 0. 649 0. 885 0. 052
t2
- 0. 900 - 0. 449 - 0. 353 - 0. 318 - 0. 185 - 0. 610 - 0. 070 - 0. 514 0. 109 - 0. 322 - 0. 246 - 0. 826
些过程变量分离出来 , 和 T2 统计量相配合 , 必将
改善 PCA 的上述不足. 因此本文提出如下定义.
定义 1 :
设过程变量集合
{
xi
}
n i=
1
中有
s
个与
主元显著相关的过程变量 ( Principal - component - re2
lated Variable , PV) , 称其所构成的残差为 PVR ( PV
= ( x1 , …, xn) 的前 k 个主元打分向量 , 则 xi 与 y 的复相关系数的平方为
k
∑ γi = ρ2 ( xi , y) = λj p2i , j
(7)
j =1
式中 pi , j ∈P ; λj 为相关矩阵 R 的特征值 , 由式
(2) 求出.
类似 Q 检验 , 下一步需要分别建立 PVR 和
然而 T2 图和 Q 图只能监测过程是否发生了变 化 , 不能直接提供引起这些变化的原因 , 即难以对 故障进行识别. 变量贡献图[1]和结构化残差[2]的方 法只部分地解决了 PCA 用于故障诊断的困难 , 尤 其是贡献图实际上给出的仍只是定性的信息. 另外 一种基于故障空间的几何方法[3] 则对 PCA 故障诊 断的各基本问题进行了详细的理论分析. 但该方法 只利用了 Q 统计量的信息 , 未能利用 T2 统计量一 起进行诊断 。本文提出将那些与主元显著相关的过 程变量的预测残差 , 构成一个新的统计量以取代传 统的 Q 统计量. 改进的 PCA 能够提供更详细的过 程变化信息 , 提高对故障原因的识别能力.
(9)
复相关系数的另一个意义就是它的平方反映了某个
变量被主元概括了多少信息[5] , 故式 (9) 中的权重
w
和
PVR
wCVR取为
n
∑ / ∑ wPVR = 1 -
γi
γi
i ∈PV
i =1
n
∑ / ∑ wCVR = 1 -
γi
γi = 1 - wPVR
i ∈CV
i =1
(10)
至此 T2 检验 、PVR 和 CVR 检验共同构成改进
(6)
为第 i 个过程变量 xi ( m ×1) ∈X( m ×n) 与 k 个主元的
复相关系数. 其中 β为 k 维参数向量.
对于 PCA 模型可以用下面的定理直接计算过
程变量与主元之间的复相关系数 , 而不必按式 (6)
的定义计算.
定理[5 ] : 设 y = { t1 …, tk} 为过程数据 X( m ×n)
第 52 卷 第 6 期 化 工 学 报 Vo l. 52 №6
2001 年 6 月 Journal of Chemical Industry and Engineering (China)
t3
0. 265 0. 284 - 0. 483 - 0. 115 - 0. 370 - 0. 272 - 0. 297 - 0. 153 - 0. 228 - 0. 585 - 0. 149
0. 425
γ
0. 881 0. 292 0. 975 0. 849
0. 936
0. 852
0. 906
0. 883 0. 071
的 PCA , 用于过程的监测和故障诊断. 其中 T2 图
和 PVR 图反映的都是与主元显著相关的变量信息 ,
CVR 图则主要反映了与主元无明显相关的变量信
第 52 卷 第 6 期 王海清等 : 改进 PCA 及其在过程监测与故障诊断中的应用 · 4 73 ·
Table 1 Correlation coefficients and multiple correlation coefficients between PCs and process variables
通过对数据阵 Xm ×n (假设已标准化) 的相关系 数矩阵 R = XT X/ ( m - 1) 作奇值分解可得到载荷矩
阵 P 和打分矩阵 T
∑ R = P PT , T阵 ∑ = diag (λi ) 中的元素 λi ( i = 1 , …, k) ,即为 X在新的坐标系 P相应方向上的方差 .
感器故障) 发生 ; 当 T2 统计量发生了大的变化而 Q
未明显变化时 (即情况 (3) ) , 说明各变量之间的关
系仍得到 (近似) 满足 , 但过程发生了某种变化. 可
能是工况改变引起的 , 也有可能是过程故障发生 ,
只是未显著改变变量之间的关系. 为了说明问题 ,
本文提出的改进 PCA 方法将主要针对文献 [ 2 ]中未
α置信限[4 ] .
通过对新的测量数据进行 T2 和 Q 检验 , 即可
判断过程是否发生了变化 . 易见 T2 和 Q检验将出
· 47 2 · 化 工 学 报 2001 年 6 月
现 4 种结果 : (1) T2 和 Q 统计量均超过控制界限 ; (2) T2 统计量没有超过控制界限 , Q 统计量超过 ; (3) T2 统计量超过控制界限 , Q 统计量没有超过 ; (4) T2 和 Q 统计量均未超过控制界限. 文献[ 2 ]讨 论了情况 (1) 、(2) 和 (4) 下的过程监测和故障诊断 问题. 但是当 T2 图发生变化而 Q 图未变化时 , 该 几何方法不能识别是正常工况变化或是故障发生 , 因此该方法未对这种情况进行讨论 , 在分析中只利 用了 Q 统计量.
0. 867
0. 866
0. 865
息. 可见 Q 图反映的信息被划分成了更细致的两 部分 , 使得改进的 PCA 能充分地刻画过程的变化 , 增强了 PCA 的故障诊断能力.
xi , j的预测值. 可见 Q 统计量值正好被分成了 PVR
和 CVR 两部分 ,故 PVR 和 CVR 统计量的控制限可
以不采用文献 [ 4 ] 给出的类似计算 Qα 的方法重新
求取 , 而用下式直接估计
式中
Qα = PVRα + CVRα = wPVR Qα + wCVR Qα
wPVR + wCVR = 1
June 2001
研究论文
改进 PCA 及其在过程监测与故障诊断中的应用
王海清 宋执环 李 平
(浙江大学工业控制技术国家重点实验室 、工业控制技术研究所 , 浙江 杭州 310027)
摘 要 提出一种改进的主元分析 (PCA) 方法 , 采用主元相关变量残差 ( PVR) 统计量代替通常的平方预测误差 Q 统计量 , 用于工业过程的监测与故障诊断 。改进 PCA 避免了 Q 统计量的保守性 , 能够提供更详细的过程变化信 息 , 从而有效识别正常工况改变与过程故障引起的 T2 图变化 。通过对双效蒸发过程的仿真监测 , 与普通 PCA 方 法进行了比较 , 表明了改进 PCA 方法的有效性 。 关键词 主元分析 统计过程监测 故障诊断 中图分类号 TP 277 文献标识码 A 文章编号 0438 - 1157 (2001) 06 - 0471 - 05
引 言
近年来主元分析 ( PCA) 在化工过程中得到了广 泛的 应 用[1 ,2] , PCA 及 其 各 种 扩 展 方 法 通 过 采 用 Hotelling T2 统计量和平方预测误差 Q 统计量 (或称 SPE 统计量) , 可以对过程进行统计监测和故障诊 断. 由于 PCA 方法具有不依赖于过程数学模型的 特点 , 故明显区别于基于数学模型或知识的其他故 障诊断方法.
式中 下标 s 和 n - s 分别表示数据矩阵 X 和载荷
矩阵 P 中对应于 PV 、CV 变量的取值.
PV 变量的选定可以采用显著相关的假设检验
方法 , 但结合 PCA 一种好的选择是计算主元与各
过程变量之间的复相关系数[5] , 同时兼顾考虑它们
之间的相关系数. 在具体进行统计建模时需折衷选
1 基于 PCA 的过程监测与故障诊断
首先取一段正常工况生产下的过程数据 Xm ×n ( m 为采样点数 , n为测量变量数) ,建立 PCA过程
1999 - 11 - 15 收到初稿 , 2000 - 10 - 11 收到修改稿. 联系人及第一作者 : 王海清 , 男 , 27 岁 , 博士. 基金项目 : 国家自然科学基金 (No. 20076040) 和国家 863/ CIMS 应用基础研究资助项目.
2 主元相关变量残差统计量
利用 PCA 建立的统计过程模型描述了正常工
况下变量之间的关系 , 包括物料平衡 、能量平衡以
及操作限制等关系. 但是 T2 和 Q 检验所代表的含
义是不同的 : 当 Q 统计量发生了大的变化时 (即情
况 (1) 、(2) ) , 说明 PCA 统计模型所代表的正常工
况下的变量之间的关系被破坏 , 有过程故障 (或传
统计模型
X = TPT + ~T ~P T = TPT + E
(1)
式中 T ∈ m ×k和 P ∈ n ×k分别为主元打分和载
荷矩阵 ,
~ k 为主元数 ( k < n) ; T ∈
m ×( n -
k) 和
~
P
∈ n ×( n - k) 分别为残差的打分和载荷矩阵 , E ∈
m ×n为预测残差矩阵.
CVR 统计量的控制限. 注意到
n
∑ ∑ Qi =
( xi , j - ^xi , j) 2 =
( xi , j - ^xi , j) 2 +
j =1
j ∈PV
∑( xi , j - ^xi , j) 2 = PRV( i) + CVR( i)
(8)
j ∈CV
式中 Qi 为第 i 次采样时的 Q 值 , ^xi , j ∈ TPT 为
讨论的第 (3) 种情况进行分析
PCA 统计过程模型虽能检测过程变化 , 却不能
有效识别变化发生的根源 , 主要原因之一是 T2 和
Q 检验所提供的信息并不是对应的. T2 统计量代
表的是与主元 ( PCs) 显著相关的那些过程变量的信
息 , 而 Q 统计量则代表的是所有被监测变量的 (误
差) 信息. 如果把 Q 统计量中与主元显著相关的那