现代分析化学中的三线性成分模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

现代分析化学中的三线性成分模型
吴海龙,俞汝勤
(湖南大学化学化工学院,湖南长沙 410082)
摘 要:本文针对现代分析化学实际,有选择性地介绍了三相三道三线性成分模型,扼要地列举了其主要的三线性分解算法,讨论了立体阵的秩估计、三线性分解的唯一性等。

关键词:三线性成分分析;三道;三相;平行因子;PARAFAC;立体阵秩;三线性分解唯一性
化学计量学是当代化学与分析化学的重要发展前沿[1~2]。

能容易地获得大量化学量测数据的现代分析仪器的涌现以及对这些化学量测数据进行适当处理并从中最大限度地提取有用化学信息的需要是促进化学计量学进一步发展的推动力[3]。

针对现代分析仪器例如二维激发发射荧光仪(EX-EM)、带光二极管阵列检测器的高效液相色谱仪(HPLC-DAD)和毛细管电泳仪(CE-DAD)、色质联用仪(GC-MS和LC-MS)等所提供的矩阵类型以及立体阵类型等高维响应数据,开展三相三道数据分析(Three-Mode Three-Way Data Analysis)包括立体阵的秩估计和三线性分解等方法和算法的基础研究,较深入系统地发展以张量校正、张量标准加入法等为主的化学计量学新方法、新算法用于实际复杂分析体系的直接快速定性定量分析,可为构造新一代智能分析仪器提供理论和技术依据,尤其是可为构造在未知干扰物共存下直接进行待测多组分同时定性定量分析的新一代分析仪器提供依据。

它亦可为我国分析仪器工业中应用高新技术、发展具有创新性和中国特色的新产品系列作出贡献[3]。

1 三相三道三线性成分模型
多年来,化学计量学方法多系建立在二维数据阵列即矩阵的理论和双线性模型的基础之上,利用矩阵的特征值分解等方法,以矩阵因子分析、矩阵目标转换因子分析、主成分回归、偏最小二乘回归等形式,对分析仪器所产生的矩阵类响应数据进行分解、分辨、主成分数(秩)估计、多元校正等,但由于矩阵分解所存在的固有缺陷即分解的多样性因而难以得到具有物理意义的解。

在多元校正中,应用这类基于矩阵分解的方法必须满足这样一个基本前提,即校正(建模)阶段和预测阶段的量测体系必须一致。

若待测样品中存在未知干扰,则预测将产生严重偏差[4~5]。

这一缺陷实际上已妨碍了化学计量学常用方法在分析化学领域中的实际应用。

为此,美国华盛顿大学的K owalski小组曾先后提出可用于一个标样和一个未知样分析体系的广义秩消失因子分析法(G eneralized Rank Annihilation Method, GRAM)[6]和可推广至二个以上样品体系的直接三线性分解法(Direct Trilinear Decomposition, D TLD)[7],可惜后者在使用时常出现虚数解而导致失效,其原因可能是其算法中人为地规定样品维为2所致。

然而这样的系列研究可使人们推导出三相三道三线性成分模型(Three-Mode Three-Way Trilinear Component Model):
X
ijk
=∑
N
n=1
a in
b jn
c kn+e ijk(1) (i=1,2,…,I;j=1,2,…,J;k=1,2,…,K)
这里,X ijk是成分数为N的三道三线性数据阵即立体阵X(I×J×K)的元素,a in,b jn,c kn是大小分别为I ×N、J×N和K×N的分解所得的成分矩阵的元素,e ijk是残差立体阵E(I×J×K)的元素。

另一方面,早在60年代,心理计量学领域就出现了以L.R.Tucker为代表的三道数据分析(Three -Way Data Analysis)工作[8]。

心理计量学家们称之为三相因子分析(Three-Mode Factor Analysis),这里的Factor既代表成分又代表主成分,其含义相当广泛。

我们认为,它们的模型应称作三相主成分模型(Three-Mode Principal Component Model)更为合适,因为它们通过特征值分解得到的三个矩阵是正交矩阵。

70年代初,Carroll和Chang[9]以及Harshman[10]独立地提出了三线性成分模型,现在一般称之为CANDECOMP/PARAFAC模型。

由于化学计量学家推导出的三线性模型在后,现在在化学计量学领域也使用PARAFAC模型这一名称。

近几年,三道数据分析方法在现代分析化学领
域得到重视[11~12]。

由于心理学等领域不易得到三道三线性的实测数据而现代分析仪器能在极短时间内给出三道三线性响应值等原因,部分极其活跃的心理计量学家开始与分析化学家合作开展三道数据分析方法的基础研究。

而分析化学计量学家则积极吸收包括心理计量学在内的其他学科有关计量学方面的有用成果,针对现代分析仪器所产生的响应数据特性,开展对复杂分析体系的新应用研究。

但纵观已发表的文献,使人感觉到尚存在概念混乱、墨守以矩阵分析为研究方法、没有充分利用多道数据分解的优点等缺憾。

为此,作者等[13~15]曾提出了较规范的符号体系,对三线性成分模型的分解与表示等作了较系统的整理分类,提出了科学的交替三线性分解(Alternating Trilinear Decomposition ,A TLD )算法,并以此为基础发展了性能较好的张量校正和张量标准加入法,成功地将A TLD 用于干扰共存下多个有机物的同时定量分析。

作者等还提出了耦合向量分辨法[16]、交替耦合向量分辨法[17]等,实现了三线性成分模型的序贯分辨。

2 立体阵的秩估计
在三相三道三线性成分模型的建立过程中,传统的PARAFAC 算法对主要成分数N 的估计非常敏感[14]。

当N 估计过低时,则得不到有物理意义的解,若N 估计过高,则由于过拟合及算法不稳定等缺陷也难以得到有意义的解,因此,对立体阵数据进行三线性分解前,确定适当的主成分数就显得非常重要。

作者等[14]曾提出下式:
N ≥rank X =max{rank (X I P
),rank (X J P ),rank (X K P )}(2)
用于立体阵的秩估计和成分数的确定,已获得良好
结果。

实际上也可利用下式:
N ΕrankX =max{rank (∑I
i =1
X i..,rank (∑J
j =1
X .j.),rank (∑K
k =1
X ..k )}
(3)

N ≥rankX =max{rank (X I P (X I P )T ),rank (X J P (X J P )T ),rank (X K
P (X K P )T
)}
(4)
去估计立体阵的秩,这里,max{・}表示取极大值,
rank (・)表示对一个矩阵的求秩。

X i..、X .j.,X ..k 分别表示立体阵X 的第i 水平面矩阵(J ×K ),第j 侧
面矩阵(K ×I )和第k 正面矩阵(I ×J )。

X I P 、X J P 、X K
P 的定义见文献[14]。

3 三线性分解的唯一性
若将矩阵到立体阵的扩展看作是双线性模型向
三线性模型的扩展,则更容易理解三性线分解的唯一性特性[10]。

由于矩阵仅有其自身及其转置两种表示方式,因此,其表示相对较简单。

但对于立体阵来说,相数为3,可导致三种组合表示式。

幸运的是其所具有的对称性(Symmetry )和循环性(Cyclic Property ),使我们容易地掌握其精髓。

在三线性分解的迭代过程中,若对得到的A 、B 、C 进行适当的后处理,则A 、B 、C 的物理意义就更容
易被理解。

所谓三线性分解的唯一性,我们认为是指新的解A 3、B 3、C 3与它们最初的解A 、B 、C 有下列关系:
A 3=A ・D a ・P ,
B 3=B ・D b ・P ,
C 3=C ・
D c ・P (5)
这里P 是指置换矩阵,D a 、D b 、D c 是分别用于后乘于A 、B 、C 的对角矩阵且他们之间存在如下关系:
D T C
D a I D T b =I
(6)
这里I 是指大小为N ×N ×N ,其超对角元为1,其余元素为0的单位正方阵或称单位超对角阵。

显然,这样的一些不确定性并不会对三线性分解的解的解释有什么影响,也即三线性分解具有唯一性。

我们可以利用这个性质对解A 、B 、C 作适当后处理,使解的意义更明白、图示更直观。

我们应尽量避免给予成分矩阵以非负定或正交等约束,否则会破坏三线性分解的解的结构及物理意义。

惜至今这样的约束在心理计量学中经常被使用,不知这种局面还要持续多久?
4 展望
三线性成分模型是一种存在于实际量测数据中的具有清晰的物理意义的数学模型,它有别于三相
主成分模型,因为后者对分解所得的矩阵加了正交约束,而前者则无此约束。

立体阵的秩是可估计的,本文建议的三个式子可基本满足这一要求。

虽然三线性分解的算法有多种,但只要①所选的用于三线性分解的成分数N 不小于客观存在的成分数;②用于交替最二小乘计算的迭代步骤采用保秩运算,一般可得到有物理意义的解。

利用三线性分解的解的唯一性对结果数据进行适当后处理将有助于解的物理意义更明白、图示更直观。

总之,三线性成分分析方法作为一种立体阵数据的探索性分析方法,具有很好的应用前景,对于现代分析化学的立体阵量测数据的处理是一种有前途的化学计量学方法,特别是以“数学分离”部分代替“化学分离”时,显示出其
快速、通用的特点。

当将它们与现代分析仪器相结合时,可直接用于未知干扰共存下待测多组分的同时快速定性定量分析。

本文得到国家自然科学基金(批准号29735150及29975007)和教育部留学回国人员基金的资助,谨致谢忱。

参考文献:
[1] 国家自然科学基金委员会.自然科学发展战略调研报
告———分析化学.北京:科学出版社,1993.
[2] 汪尔康.21世纪的分析化学.北京:科学出版社,1999.
1222.
[3] 吴海龙,梁逸曾,俞汝勤.分析化学计量学(定期综述).
分析实验室,1999,18(6):942102.
[4] 俞汝勤.化学计量学导论,长沙:湖南教育出版社,
1991,67269.
[5] H.L.Wu,K.Oguma and R.Q.Yu,Simple multivari2
ate calibration method with an appropriate number of
principal components using singular value decomposition
and cross-validation procedures,Analytical Sciences,
1994,10,8752880.
[6] E.Sanchez and B.R.K owalski,G eneralized rank anni2
hilation method,Analytical Chemistry,1986,58,4962 499.
[7] E.Sanchez and B.R.K owalski,Tensorial resolution:A
direct trilinear decomposition,Journal of Chemometrics,
1990,4,29245.
[8] L.R.Tucker,S ome mathematical notes on three-mode
factor analysis,Psychometrika,1966,31,2792311.
[9] J. D.Carroll and J.J.Chang,Analysis of individual dif2
ferences in multidimensional scaling via an n-way gener2 alization of”Eckart-Y oung”decomposition,Psychome2 trika,1970,35,2832319.
[10] R. A.Harshman and M. E.Lundy,The PARAFAC
model for three-way factor analysis and multidimen2
sional scaling,In:Research methods for multimode data
analysis,w,C.W.Snyder,J. A.Hattie and
R.P.McDonald(Eds.),1984,New Y ork,Praeger,
1222215.
[11] P.G eladi,Analysis of multi-way(multi-mode)data,
Chemometrics and Intelligent Laboratory Systems,
1989,7,11230.
[12] R.Bro,PARAFAC.Tutorial and applications,Chemo2
metrics and Intelligent Laboratory Systems,1997,38,
1492171.
[13] H.L.Wu,Y.Q.Feng,M.Shibukawa and K.Ogu2
ma,Alternative algorithm for simultaneous determina2
tions of components poorly resolved by liquid chromato2
graphy with multiwave length detection,Analytical Sci2
ences,1997,13,992106.
[14] H.L.Wu,M.Shibukawa and K.Oguma,An alternat2
ing trilinear decomposition method with application to
calibration of HPLC-DAD for simultaneous determina2
tion of overlapped chlorinated aromatic hydrocarbons,
Journal of Chemometrics,1998,12,1226.
[15] H.L.Wu,R.Q.Yu,M.Shibukawa and K.Oguma,
Second-order standard addition method based on alter2
nating trilinear decomposition,Analytical Sciences,
2000,16,2172220.
[16] J.H.Jiang,H.L.Wu,Z.P.Chen and R.Q.Yu,
Coupled vectors resolution method for chemometric cali2
bration with three-way data,Analytical Chemistry,
1999,71,425424262.
[17] J.H.Jiang,H.L.Wu,Y.Li and R.Q.Yu,Alter2
nating Coupled vectors resolution(ACOV ER)method
for trilinear analysis of three-way data,Journal of
Chemometrics,1999,13,5572578.
T rilinear Component Model in Modern Analytical Chemistry
W U Hai2long,Y U R u2qi n
(College of Chemistry and Chemical Engineering,Hunan University,Changsha410082,China)
Abstract:The purpose of the paper is to present an overview of recent developments in three-mode three-way trilinear component model with its applications in modern analytical chemistry.Emphasis is placed on the rela2 tively new triadic algorithms which provide new ways to decompose the trilinear arrays,the rank estimation of three-way arrays and the uniqueness of the representations.
K eyw ords:trilinear component analysis;three-mode;three-way;PARAFAC;rank of three-way arrays;u2 niqueness。

相关文档
最新文档