光谱多元校正中的模型传递

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

测量标样的信号 。算法原理是采用有限脉冲响应滤波 , 其目 标光谱常以源机校正模型光谱阵的平均值 rm 代替 。 FIR 算法 的具体步骤为 (1) 对一目标机测得的未知样品光谱 run , 对应于 run , i ( ith wavelength) , 首先在 i 波长点左右选择窗口大小为 ( 2 p + 1) 的 光谱段 , 将 run , i 和 rm 按下式在 2 p + 1 大小的光谱段进行均值 中心化处理 r′ un , i = [ run , j r′ m = [ rm , i p
第 2 1 卷 , 第 6 期 光 谱 学 与 光 谱 分 析 2 0 0 1 年 1 2 月 Spectroscopy and Spectral Analysis
Vol 1 21 ,No 1 6 ,pp8812885
December ,2001
光谱多元校正中的模型传递
© 1995-2003 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
882
光谱学与光谱分析 第 21 卷
+ j + 1) 大小的光谱段 R ss , j + k +1 , 分别计算 Rms , i 与 R ss , i - j , R ss , i j +1
基金项目 : 国家自然基金资助课题 (No. 20075035) 作者简介 : 褚小立 ,1974 年生 ,石油化工科学研究院工程师
1 模型传递原理与算法
目前解决模型传递问题主要有两个途径 [6 ] ,一种途径是 提高校正模型的稳健性 ( Robustness) [7 ] , 另一种途径是增强校 正模型的适应性 (Adaptation) 。前一种途径主要是通过变量的 筛选 [8 ] 、 微分 [9 ] 、 小波变换 [10 ] 、 多元散射校正 ( MSC) [11 ] 、 标准 [12 ] 正交变量变换 ( SNV) 、 傅里叶变换 ( FT) [13 ] 、 正交信号校正 (OSC) [14 ] 等预处理方法 ,和使用温度 、 不同仪器测量条件扩充 校正模型以及采用稳健回归方法和 RPLS[15 ] 、 INV2PLS[16 ] 等方 法增强源机所建模型的选择能力 ( Selectivity) , 使其能用于目 标机所测的信号 。后一种途径则是通过数学方法建立源机和 目标机所测信号或预测结果之间的函数关系 , 由确定的函数 关系变换目标机所测信号或预测结果来实现模型传递 。由于 前种途径所用算法大都是常见的预处理方法和回归方法 , 本 文只对后种途径所涉及的典型算法做介绍 。 建立在不同仪器所测信号或预测结果间函数关系的算法 有两类 ,一类是有标样方法 。这类算法必须选择一定数量的 样品组成标样集 ,并在源机和目标机上分别测得其信号 ,从而 找出该函数关系 。这类算法又分为两种 ,一是基于预测结果 的校正 ,如 S/ B ( Slope/ Bias , 斜率/ 偏差 ) 算法 [17 ] , 二是基于仪 器所测光谱信号的校正 , 如 DS ( Direct Standardization , 直接校
2
(2) 吸光度校正 波长校正后 ,首先用插值的方法计算目标波长 i′ 的吸光
# # 度矩阵 Rss , i , 并采用线性公式 Rms , i = sai + sbi R ss , i 求出回归系 数 sai 和 sbi 。
对未知样品光谱 rs ,un , 用波长校正模型 i′= A + Bi + Ci2 对波长进行校正 , 然后用插值的方法计算 rs#,un , 最后由 rp s ,un =
111 S/ B 算法 S/ B 算法是建立源机与目标机所得预测结果间函数关系
, …, R ss , i + k - 1 , R ss , i + k 的相关系数 , 得到 Rms , l ( i - j <
l < i + k) 与 Rms , j 相关系数 rl 最大 , 说明在目标机上所测光 谱的波长 l 与源机所测光谱的波长 i 相同 。 为获得更加精确的 结果 , 选取波长 l - 1 , l , l + 1 与对应的相关系数 rl - 1 , rl , rl +1 建
的方法 。用在源机上建立的校正模型 K 和源机与目标机测 得的光谱阵 Rms , Rss 分别计算标样集浓度阵 cmp , csp , 假定 cmp 和 csp 存在 cmp = Bias + Slope ×csp 关系 , 用最小二乘法求出 Bias 和 Slope 。 在目标机上测得的未知样品光谱阵 R s ,un , 首先 用校正模型 K 计算 csp ,un , 再用公式 csp ,un = Bias + Slope ×csp ,un 计算最终浓度阵 。 符号说明 : Rms 2 在源机上测得的标样集光谱阵 , R ss 2 在 目标机上测得的标样集光谱阵 , cmp 2 在源机上预测的浓度阵 , csp 2 在目标机上预测的浓度阵 , csp ,un 2 模型传递前未知样品的 浓度阵 , csp ,un 2模型传递后未知样品的浓度阵 。
p p
立一元二次抛物线模型 , r = ai + bi i + ci i2 , 由抛物线模型在 目标机上得到与源机波长 i 相同的波长 i′ 。 b :循环 i , 求出所有对应的 i′ 。 c :用求得的 i 和 i′ 建立一元二次抛物线波长校正模型 , i′
= A + Bi + Ci .
sai + sbi rs ,un 得到转换结果 。
#
112 DS 算法 DS 算法是用转换矩阵 F 将目标机测得的未知样品光谱
rs ,un 转换为 rs ,un , 理论上 , rs ,un 与源机上测得的光谱 rm ,un 是一
p p
115 FIR 算法 FIR 算法是无标样算法 , 不需要在源机和目标机上同时
致的 。 转换矩阵 F 由 Rms = R ss ・F 通过最小二乘法计算得到 ,
F = R ss ・Rms , 式中 R ss 为 R ss 的逆矩阵 , F 为 m ×m 矩阵 ( m
+ +
为波长点数) 。 对在目标机上测得的未知样品光谱 rs ,un , 用公
p 式 rp s ,un = rs ,un F 进行转换得到与 rm ,un 相一致的光谱 rs ,un , 再 由源机建立的校正模型 K 计算最终结果 。 113 PDS 算法 PDS 算法与 DS 算法原理基本相同 ,所不同的是 ,在 DS 算 法中 , 由 目 标 机 标 样 光 谱 阵 Rss 的 全 波 长 数 据 Rss ,all ( all wavelengths) 来转换源机标样光谱阵 Rms 的每一个波长点数据
引 言
自 80 年代以来 ,随着计算机技术的迅速普及 , 数学和计 算机科学在分析化学中的应用日益广泛 , 化学计量学的方法 和内容得到不断的充实和扩展 , 使光谱结合化学计量学建立 的快速分析方法已成功地应用于农业 [1 ] 、 石化 [2 ] 、 药物 [3 ] 等行 业 。这些分析方法多为多元校正方法 ,即对训练集的自变量 和因变量进行关联建立数学模型 ( 或称两者之间的函数关 系) ,该过程称之为校正 ( Calibration) 。预测 ( Prediction) 过程则 是通过自变量数据和已建模型计算因变量数据 [4 ] 。 在多元校正方法实际应用中 ,经常遇到这样的情况 ,在某 一仪器 ( 称源机 ,Master) 上建立的一个多元校正模型 , 而该模 型在另一台与源机相同型号的仪器 ( 称目标机 ,Slaves) 上无法 使用 ,或者结果产生较大的偏差 。解决这类问题过程称之为 模型传递 (Model Transfer) ,也称仪器的标准化 ( Standardization of Spectrometric Instruments) [5 ] 。模型传递的本质是克服样品在不 同仪器上的量测信号 ( 或光谱) 间的不一致性 。模型传递的途 径首先是完善仪器加工的标准化 ,提高加工工艺水平 ,降低源 机和目标机在器件等方面存在的差异 , 使得同一样品在不同 仪器上量测的光谱尽可能一致 。然后再通过对在不同仪器上 的量测信号进行处理 ,消除这些信号间的差别 ,或者说 , 量测 信号是样品本征信号与仪器影响信号的复合 , 在不同仪器上 的量测信号间的主要差异是由仪器个体不一致性引起的 , 通 过信号处理以消除仪器对量测信号的影响 , 文献中常对这类 信号处理称之为模型传递 。 模型传递是近年来化学计量学研究的热点课题之一 , 该 课题不仅具有理论研究意义 ,而且也很具有应用价值 。因为 建立满足实际应用要求的多元校正模型往往花费大量人力和 物力 ,例如使用近红外光谱方法建立一个柴油十六烷值的分 收稿日期 :2000211230 ,修订日期 :2001201206
褚小立 , 袁洪福 , 陆婉珍
( 石油化工科学研究院 , 北京 100083)
摘 要 本文介绍了解决化学计量学多元校正中的模型传递问题的原理和一些常用算法 ,并对目前模型传 递的实际应用进行评述 ,为以后深入研究并完善模型传递理论与算法提供帮助 。 主题词 光谱 ; 化学计量学 ; 多元校正 ; 模型传递 ; 仪器标准化 中图分类号 :O4239 文献标识码 :A 文章编号 :100020593 (2001) 0620881205 析模型 ,其费用约十几万元 。对于使用毒性较大 、 不稳定 、 运 输较困难的样品所建立的模型 ,费用会更大 。如果所建立的 模型不能在仪器之间进行有效的传递 , 将直接影响着这项技 术的广泛应用 。模型传递问题在多元校正中是一个共性问 题 ,研究模型传递对于信号处理理论与方法发展具有重要意 义 。本文就光谱多元校正中的模型传递问题进行评述 , 以期 对模型传递问题有较全面的认识 , 为深入研究并完善模型传 递理论与算法提供帮助 。
- mean ( run) , run , i - mean ( rm) , rm , i i+p
p+1
- mean ( run) ,
…பைடு நூலகம் run , i + p - mean ( run) ]
p p+1
th Rms , i ( i wavelength) , 而在 PDS 算法中 , 用 i 波长点附近一窗口
正) 算法 [18 ] 、 PDS ( Piecewise Direct Standardization , 分 段 直 接 校 正) 算法 [18 ] 和 Shenk′ s 算法 [19 ] ; 另一类是无标样方法 , 使用这 类算法不需要任何标准样品 , 主要以 FIR ( Finite Impulse Re2 sponse ,有限脉冲响应) 算法 [20 ] 为代表 。
- mean ( rm) ,
为 j + k + 1 大小的光谱段 Rss , j + k +1 (from ( i - j) th to ( i + k ) th wavelengths) 代替 Rss ,all 来转换 Rms , i 。 这样一方面可以减少标 样数量 ( 在 DS 算法中 , 标量数量不能小于校正模型光谱阵的 秩) , 另一方面对于 R ss , j + k +1 , Rss ,all 两者与 Rms , i 之间的相关 性 ,可能后者更强 ,其具体步骤为 (1) 对应于 Rms , i , 在目标机标样光谱阵 Rss 选取窗口为 ( k + j + 1) 大小的光谱段 R ss , j + k +1 , 组成矩阵 X s , i = [ R ss , i - j , R ss , i - j +1 , …, R ss , i + k - 1 , R ss , i + k ] ; (2) 将 Rms , i 与 Xs , i 进行关联 , Rms , i = Xs , i bi , 转换系数 bi 可由 PCR 或 PLS 方法求出 。 (3) 循环 i , 求出所有的 bi , i = 1 , 2 , …, m ; (4) 对未知样品光谱 rs ,un , 经固定窗口分段 , 由转换系数
相关文档
最新文档