求解股票期权定价问题的差分方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2003-04-29
基金项目:国家自然科学基金资助项目(50174021)・
作者简介:李 元(1964-),女,辽宁沈阳人,东北大学博士研究生,沈阳化工学院副教授;谢 植(1957-),男,江苏南京人,东北
大学教授,博士生导师・
第25卷第1期2004年1月
东北大学学报(自然科学版)Journal of Northeastern University (Natural Science )Vol .25,No .1Jan .2004
文章编号:1005-3026(2004)01-0020-04
基于故障重构的PCA 模型主元数的确定
李 元1
,谢 植1
,王 纲
2
(1.东北大学信息科学与工程学院,辽宁沈阳 110004;2.沈阳化工学院信息工程学院,辽宁沈阳 110142)
摘 要:基于故障重构理论研究了PCA 模型主元数的确定方法,应用累积方差贡献率以及复相关系数对主元模型性能进行分析・在基于PCA 理论进行故障诊断中,故障变量可根据故障的方向向量进行重构,未重构方差(VRE )可分别投影于主元子空间(PCS )和残差子空间(RS )・确定最优重构是使两空间的VRE 之和达到最小,与此相对应的主元数即为最优主元数(PCs )・应用累积方差贡献率以及复相关系数对主元模型性能进行评价,结果表明确定的PCA 模型PCs 保证了PCS 中的信息存量・对于工业PVC 聚合反应过程的故障诊断说明了上述方法的合理性与有效性・关 键 词:故障重构;PCA (主元分析);未重构方差(VRE );主元数(PCs );主元子空间(PCS );残差子空间(RS )中图分类号:T P 206
+
.3 文献标识码:A
PCA (principal component analysis )是一种常用的数据分析方法,在石油、化工、电子等各生产领域的数据处理、故障诊断中广泛应用[1~5]・PCA 建模和诊断的关键是采样数据和历史数据的压缩和信息的抽取,生成若干个新的正交变量・Wold 提出一
种随机计算模型PRESS (预测误差平方和)的方法[6]
・Joreskog 等探讨了一种确定最小主元数的标准[7]
・Cattell 提出了基于协方差矩阵特征值的分散测试方法[8]・Harmon 等提出一种基于得分向量自相关性测试的方法[9]
・Malinowski 归纳了若干确定
PCA 模型主元的方法[10]
・本文应用一种新的基于故障重构方差方法进行PCA 模型主元数的确定,并应用累积方差贡献率以及复相关系数对所确定的主元数进行性能分析与评价・
1 故障重构
1.1 PCA 模型
PCA 是一种数据矩阵的分析方法・设X 为m ×n 维数据矩阵,PCA 建模的过程即X 向潜隐模型空间和残差空间投影的过程,则原矩阵可分解成PCS 和RS 两部分・
X =t 1p T 1
+t 2p T 2
+…+t j p T j
+…+t r p T r
+E ・
(1)
其中,t j 为m ×1的得分向量,p j 为n ×1的负荷向量,r 为主元数・式(1)也可写成
X =TP T
+E ;(2)X 在PCS 投影
^X =XPP T
;
(3)X 在RS 投影
珟X =X (I -PP T )・
(4)
PCA 模型部分即为主元子空间部分R r 和残差子空间部分R p -r 之和・主元子空间主要反映正
常数据变化的测度,残差子空间主要反映非正常数据噪声变化的情况・1.2 故障重构
设X n
表示正常数据,X 表示采样故障数据,则
X =X n
+βΞi ・
(5)
其中,β表示故障的幅度,Ξi 表示故障发生的方向向量・数据重构的目的是沿故障的方向用故障数据构造正常数据・即
X i =X -βi Ξi ・
(6)
如果重构的X i 有最小的模型误差,与PCA 模型最具一致性,则重构值为
[11,12]
X i =
I -
珟Ξi 珟Ξ
T i
珟ΞT
i
珟Ξi
()
X ・
(7)
式(7)表示了故障数据沿故障方向向量重构所得到的重构值・
1.3 未重构方差
考虑重构数据误差为
X n-X i=(βi-β)Ξi,(8)则重构误差方差为[11,12]
u i≡var{ΞT i(X n-X i)}=var{βi}=
珘ΞT
i
R珘Ξi (珘
ΞT
i
珘Ξi)2・
(9)
其中R=E(XX T)是数据矩阵的协方差矩阵;u i 是用X i估计X n的重构误差的方差・则
u i=
珟ΞT
i
珟R Ξi
(珟
ΞT
i
珟
Ξi)2
=
‖珟ΞO
i
‖2
珟R
‖珟
Ξi‖2・
(10)
u i表示未重构方差・
2 基于故障重构的PCA模型主元数的确定
2.1 基于最优重构的PCA主元数[11,12]
如何使未重构方差尽可能小是确定最小主元数的条件・应用下列式子可以相对于p个变量,选出r个主元・
u i=珘u i+^u i・(11)其中,^u i=E{(^βi-β‖^Ξi‖)2},(12)珘u i=E{(珓βi-β‖珟Ξi‖)2}・(13)重构误差的总方差是故障数据重构误差的值在RS空间和PCS空间投影之和・相对于最小的主元数r,重构误差方差取得最小值・PCS空间的u i随r的增加而增加,即
^u i(r+1)≥^u i(r);(14)RS空间的u i随r的增加而减少,即
珘u i(r+1)≤珘u i(r)・(15)从式(16)可以取得相对于u i最小的PCA模型的主元r・
min
r
u i・(16)2.2 主元数的性能分析
(1)累积方差贡献率
衡量主元所包含的信息存量的性能,通常采用累积方差贡献率(CPV)・若式(2)中主元阵的主元向量方差分别为λ1,λ2,…,λn,则取前r个主元的累积方差为λ1+λ2+…+λr・
CPV=∑r
i=1
λi
∑n
j=1
λj
×100%・(17)
CPV的大小直接反映了所确定主元模型的
精度・CP V通常在85%以上表明主元模型的精
度可满足PCA的分析要求・
(2)复相关系数
将表示样本变量与主元的相关程度定义为复
相关系数ρ(x i,T):
ρ(x i,T)=∑
r
j=1
λj p2i,j
()1/2,(18)
则主元包含每一变量的信息程度可用ρ(x i,T)
衡量,同时此参数的变化情况反映了主元信息的
变化程度・因此用复相关系数可评价主元模型的
近似程度、信息量、以及基于PCA理论进行性能
监视及故障诊断的准确程度・
3 化工过程PVC聚合反应应用
3.1 基于故障重构的PCA主元数的确定
应用工业PVC聚合反应釜生产过程的10个
变量的数据,确定最优故障重构的PCA模型主元
数・采样数据分别为压力、流量、液位、温度等10
个参数指标,持续采样点数为3000
点・
图1 基于故障重构的主元数的确定
Fig.1 Determining PCs based on fault reconstruction
1—在残差子空间;2—在主元子空间;
3—在残差子空间和主元子空间的迭加・
若检测出第5个变量出现故障,故障方向矩
阵:
ΞT
5
=[0,0,0,0,1,0,0,0,0,0]・
由图1可以看出在主元数为3时,未重构方
差和最小・基于故障数据最优重构的PCA模型所
确定的主元数为3・
3.2 主元数的性能分析
依式(16),主元数为3,r=3,则CPV如表1
所示・
表1中,当CP V为88.28%时,主元数为3,
表明3个主元足以满足PCA中的信息量,因此图
1中所确定的主元数是有效的・
1
2
第1期 李 元等:基于故障重构的PCA模型主元数的确定