一种基于目标因子分析的模型传递方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第25卷,第3期 光谱学与光谱分析Vol 125,No 13,pp398-401
2005年3月 Spectroscopy and Spectral Analysis
M ar ch,2005
一种基于目标因子分析的模型传递方法
王艳斌,袁洪福,陆婉珍
石油化工科学研究院,北京 100083
摘 要 在目标转换因子分析的基础上建立了一种新的模型传递方法,并将该方法与传统的分段直接标准化(PDS)方法进行比较。采用了两个样品集:虚拟样品集和配制样品(含苯,甲苯,二甲苯和异辛烷)的近红
外光谱集。结果表明:新方法的传递效果至少与P DS 方法的传递效果相同,对于谱图出现非线性变化的情况,新方法的传递效果更好。
主题词 模型传递;P DS;目标因子分析;多元校正过程
中图分类号:O439 文献标识码:A 文章编号:1000-0593(2005)03-0398-04
收稿日期:2003-09-06,修订日期:2003-12-16
基金项目:国家自然科学基金(20075035)资助项目
作者简介:王艳斌,女,1972年生,石油化工科学研究院高级工程师
引 言
随着化学计量学方法在光谱分析方法中的普遍应用,模型传递问题引起人们的广泛关注。由于仪器之间的响应信号有所差异,因此在一台仪器上建立的模型通常不能用于另一台仪器,甚至对同一台仪器而言,如果仪器老化或更换了关键部件,那么使用原来的模型进行预测也会带来较大的误差,因此对于不同的仪器或在仪器长时间使用或经过维修之后都需要重新进行建模以保证预测的准确性。然而,在许多应用领域中,建立模型是一项烦琐的工作,重复性的建模工作是对人力,物力等资源的巨大浪费,而且在有些情况下,样品可能是不易得到或不易保存的,这时重新建模变得更为困难。模型传递正是解决上述问题的方法之一。
所谓模型传递(也称仪器标准化)是指经过数学处理后,使一台仪器上的模型能够用于另一台仪器,从而减少重新建模所带来的巨大工作量,实现样品和数据资源的共享。关于
模型传递方法许多文献中都进行了详尽的介绍[1-3]
,本文不再赘述。目前应用最为普遍和最为成功的方法是分段直接标
准化(PDS)方法[4],PDS 作为具有局部性质的模型传递方法,能够校正因波长变化而带来的误差,同时所需的传递样品数较少。由于P DS 在许多领域中的成功应用,它也常常作为新方法的对比方法。其他一些新发展的方法,如利用小波进行模型传递、利用人工神经网络进行传递等都是在PDS 及直接标准化(DS)的基础上建立的[5,6]。尽管目前已经有了多种模型传递方法,但各种方法有各自的适应情况,还没有一种方法能处理所有的模型传递问题,因此有必要开发更多的模型传递方法解决不同的问题。另外,除了应用较为烦琐的人工神经网络模型传递方法外,还没有能够很好处理非线性变化的模型传递方法。本文在目标因子分析方法的基础上建
立了一种模型传递方法,这种方法本质上仍是一种直接标准化方法,但是它能很好地处理仪器之间的非线性关系,因此在某些情况下具有更好的传递效果。
1 原理及算法
111 模型传递基本过程
目前大多数的模型传递方法都是将光谱在仪器之间进行传递,这样可以不依赖样品的性质从而能更容易地实现传递过程。对大部分模型传递方法而言,在确定仪器间光谱关系时,需要在两台仪器上同时测定某些样品的光谱,我们称这些样品为传递样品。模型传递的基本过程是在两台需要传递的仪器上测定传递样品的光谱,通过这些样品的光谱计算传递矩阵,用传递矩阵计算其他样品的传递光谱。传递矩阵的计算过程是模型传递中的关键步骤。
为了方便讨论,将校正集所在的仪器称为主机,而将用于测定未知样品的仪器称为从机。模型传递过程有两个不同方向,一个方向是将校正集样品的光谱从主机传递到从机,用传递后的光谱建模,预测从机上测定的未知样品光谱,这种方法需要重新计算模型,但在预测时不需要经过传递步骤;另一个方向是将从机的光谱传递到主机,用主机的模型进行预测,这种方法不需要重新计算模型,但在预测时需要经过传递步骤。采用哪种方法需要依据用户的具体情况而定。本文将校正集的光谱从主机传递到从机,然后建模预测从机测定的验证集。
112 PDS 算法
P DS 算法是由Wang 和K owalski 在1991年提出的模型
传递算法[4]。其基本思想是将一台仪器上i 波长附近的i -k 到i +j 波长段(窗口)对应的吸光度与另一台仪器上i 波长对应的的吸光度关联起来,将窗口沿波长移动从而得到整个光谱的传递系数。关联的数学方法可以是主成分回归或偏最小二乘法。
由于PDS 是在谱图局部的一定范围进行关联,所以它能较好地校正仪器间波长的差别,所需的传递样品数也较少。113 基于目标因子分析的模型传递算法(TTFA )
目标因子分析(T arg et Factor Analysis)是20世纪60年代发展起来的特殊数学手段[7]
。所谓/目标0因子就是我们通过理论知识、实验知识或直观感觉获得的有关物理或化学参数,通过目标变换可以使经抽象因子分析得到的参数等于预期参数。
根据朗伯-比尔定律,混合物的光谱等于纯物质的光谱与其浓度的乘积
X m @n =S m @p @c p @n +E m @n
式中:X 为混合物的光谱矩阵,S 为纯化合物的光谱矩阵,c 为纯化合物的浓度矩阵,E 为误差矩阵,m 为光谱测量点数,n 为样品数,p 为纯化合物数。
对于组成已知的简单样品而言,由于在主机和从机测量时,物质的浓度不变,光谱的差异主要来源于纯物质光谱的不同,因此模型传递过程转化为纯物质光谱的变换过程。对于复杂样品而言,很难得到纯物质的光谱和浓度,因此我们假定样品由几种虚拟组分组成,通过主成分分析的方式得到虚拟组分的光谱和浓度
X m @n =A S m @p @A c p @n +E m @n
式中:A S 是虚拟组分的光谱,A c 是虚拟组分的浓度。但是对于不同仪器而言,通过主成分分析得到的A c 是不同的,这时可以使用目标变换的方法使从机的虚拟组分浓度等于主机的虚拟组分浓度,从而进一步将模型传递过程转化为虚拟光谱的变换过程。实际上在该过程中不需要进行虚拟光谱的变换,只需要通过目标转换的方式将主机和从机的光谱关联起来。
基于目标因子分析的模型传递算法(T T FA )的实际计算过程如下
(1)对主机的传递样品光谱进行主成分分析,得到载荷和得分:X M =A S M @A c M ;
(2)对从机的传递样品光谱进行主成分分析,得到载荷和得分:X S =A S S @A c S ;
(3)通过目标转换使二者的虚拟浓度相等,即A c M =T @A c S ,按照目标转换的算法,其变换矩阵T =A c M @A c T S @
(A c S @A c T S )
-1;(4)目标变换后从机的载荷为A S new S =A S S @T
+
,由于主机的得分可以通过下式A c M =
A S T M @X M 计算,同时由于
变换后从机的虚拟组分浓度等于主机的虚拟组分浓度A c new S =A c M ,所以从机的光谱可以表达为X S =A S new S
@A
c new S =
A S S @T +@A S T M @X M ,因而传递矩阵为FF =A S S @T
+@A S T M 。
在对主机和从机进行主成分分析时,由于存在非线性关
系等因素,用来表达主机和从机谱图的主因子数可能会有所不同,因此上述计算中的T 有可能不是方阵。
传递矩阵FF 可以用于传递两台仪器的光谱
X
new
=FF @X m
2 实验部分
211 样品集
为考察方法的性能,使用了两个样品集。第一个样品集是虚拟样品集,该样品集由4个虚拟组分组成,各虚拟组分的光谱用高斯曲线合成(见图1)。通过改变各虚拟组分的浓度,得到模拟主机的84个校正集光谱和48个验证集光谱,其中验证集浓度均匀分布在校正集浓度范围内。通过对这些拟合光谱作线性或非线性变换而得到模拟从机光谱,这些变换和相应的模拟从机名称见表1。最后在各谱图中加入一定量的随机误差以模拟谱图测量中的误差;各虚拟组分的浓度(百分含量)加入-013~013的正态分布误差以模拟性质测定误差。我们以组分1的浓度作为考察的性质参数。主机和从机的偏最小二乘校正结果见表2。从表2可以看出,S2的SEC 和SEV 大于主机和其他2个从机,这种误差是由非线性变化而产生的。
Fig 11 The spectra of pure components of simulated data set
Table 1 The variation made to slave instruments
模拟从机名称
变换
S1加入信号的10%以模拟强度的线性变化S2加入信号平方的30%以模拟非线性变化S3
构造一个二次函数,使数据点数两端移动10个单位,极值为-15,模拟波长的非线性变化
Table 2 The calibration result of simulated data set
M (主机)
S1S2S3主因子数3333SEC 0114011401230114S EV
0114
0114
0121
0114
第二个样品集是配制样品集,该样品集的组分为苯,甲
苯,二甲苯和异辛烷。在三台不同厂家的傅里叶近红外光谱仪(分别标记为M M ,SS1,SS2,其中M M 为主机,SS1和SS2为从机)上测定该样品集的近红外光谱,样品池厚度为5mm,分辨率都为4cm -1,以苯含量作为要考察的性质参数。
399
第3期 光谱学与光谱分析