主成分分析在分析化学中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

主成分分析法在分析化学

中的应用

专业:应用化学

学号:200902030134

姓名:何德聪

日期:2012.06.23

主成分分析法在分析化学

中的应用

摘要:主成分分析法( Princ ipal Components Ana lysis)也称定量分析。由Ho telling 于1933 年首先提出,主要是利用降维思想,把多指标转化为少数几个综合指标的多元统计分析方法。这些指标是原指标的线性组合, 且彼此不相关, 它可以在力保原始数据丢失最少情况下, 对高维变量空间进行降维。随着计算机技术及其应用的发展, 作为化学计量学基础的主成分分析方法,在分析化学中应用越来越广泛。尤其在仪器分析中应用较为广泛,本文就主成分分析方法在化学分析及仪器分析中的具体应用进行综述。

关键词:主成分分析法分析化学仪器分析化学分析

1.主成分分析法

1.1主成分分析法介绍

主成分分析(principal component analysis) 是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法,又称主分量分析。由Ho telling 于1933 年首先提出, 主要是利用降维思想, 把多指标转化为少数几个综合指标的多元统计分析方法。这些指标是原指标的线性组合, 且彼此不相关, 它可以在力保原始数据丢失最少情况下, 对高维变量空间进行量降维[1]。由原始变量线性组合的主成分, 以揭示数据结构特征, 提取化学信息。在进行化学变量多元分析的时候,我们用多个变量去描述样本的性质,这些变量也可以称之为特征。对于复杂体系,特征数可能达到成百上千,计算量十分巨大,而且变量之间

可能存在关联,即存在冗余。使用主成分分析即可将彼此间具有关联的变量整合成少数几个综合型变量,新得到的变量间不存在关联。

1.2主成分分析的原理[2]

设P个进行综合评价的原始指标: x1, x2, ..., xp, 并假定这些指标在n 个单位之间的初始目标是将这些原始指标组合成新的相互独立的综合指标y1, y2, ..., yp, 这些综合指标表现为原始指标的线性函数:yi ∑Iijxj ( i = 1, 2, ...,p )式中, 指标yi互不相关。因为每个新指标yi 都是原始指标的线性组合。实际上, 主成分分析是将p 个原始指标的总方差分解为p 个不相关的的综合指标yi 的方差之和λ1 +λ 2 + ..., + λp, 而且使第一个综合

指标yi 的方差达到最大(贡献率最大) ;第二个综合指标y1, y2, ..., yr ( r < p ), 即包括总方差中的绝大部分信息。我们称它们为原始指标的第一, 第二, ..., 第r个主成分。即: 主成分分析法可以使原始指标的大部分方差“集中”于少数几个主成分上, 通过对这几个主成分的分析, 实现对总体的综合评价。

1.3主成分分析法分析的主要步骤

( 1) 列出指标数据矩阵X;

( 2) 计算X 的协方差矩阵S;

( 3) 计算协方差矩阵S (或相关矩阵R ) 的特征值和特征向量L (即指标X的系数) ; ( 4) 计算贡献率和累计贡献率, 并据以确定主成分(即综合指标y1 ) 的个数, 建立主成分方程;

( 5) 解释各主成分的意义, 并将各单位的原始数据代入方程中, 计算综合评价进行分析比较。2主成分分析在分析化学中的应用

2 .1主成分分析在仪器分析中的应用

2.1.1在色谱( 气相色谱和液相色谱) 分析中的应用

气相色谱在广泛应用于环境监测、农药残留量的分析、汽油、柴油等石油化工产品组成成分的分析。尤其是多维毛细管气相色谱和色谱-质谱法, 运用PCA 方法可降低快速气相色

谱-质谱法测量中低含量组分的噪音[3]。而对于汽油、柴油、农药残留量这样组成复杂的

样品分析, 鉴于分离手段和检测方法的有限, 最终得到的色谱峰中存在大量严重重叠的谱

峰难以识别。而化学计量学方法又不能适当地在复数范围内模拟从一个变量到另一个变量转换的信息, 使色谱-质谱法中保留时间的变化成为了化学计量学方法在色谱数据分析中应用的主要障碍。例如: KEVIN 采用一种化学计量学方法分析气相色谱数据保留时间校正-高速谱峰匹配运算法则, 通过保留化学选择性而减小色谱-质谱法中保留时间的变化, 以增加应用在柴油色谱中模式识别方法的效率, 得到了较好的结果[4]

AOAC在20世纪80年代就对大部分有机磷农药建立了气相色谱分析法,近年来,AOAC又对近半数的有机磷农药建立了HPLC检测法。我国食品卫生国家标准GB/T17331-1998才用的事气相色谱分析法检测有机磷农残。该法的适用范围是粮食、蔬菜中有机磷和氨基甲酸酯类农药残留的检测。基于这种方法,固定相和不同的流动相组分中, 根据理论塔板和对称因素值对色谱柱及其流出物进行分类和研究十分重要。毛细管柱的极性选择与待测物的极性相匹配。因此可以利用主成分分析方法进行评价。选择适合的分析条件。

2.1.2主成分分析方法的其他应用

随着计算机的发展及仪器制造技术的进步, 作为化学计量学基础的PCA 方法, 在各仪器分析中的应用越来越广泛, 除了在上述气液相色谱分析中的应用外, PCA 方法已逐渐被

推广到其他仪器分析的应用中。

在红外及近红外光谱中的应用,PCA 方法常被用来解析混合物的近红外光谱图[4]

从而提取所需的化学信息, 根据纯物质的物理化学性质预测混合物的物理化学性质, 鉴定官能团及分子结构PCA 方法也经常被用在傅里叶变换-红外光谱解析中。如: 研究人员将PCA 方法应用到傅里叶变换-红外光谱中, 分别测定了聚甲基丙烯酸丁酯LB(LangmuirBlodg ett) 膜玻璃化转变温度和牛的血清蛋白( BSA) 在极性溶液中的水合作用和二次结构发生转变的温度

PCA 方法是核磁共振光谱数据多变量分析中常用的运算法则, 它充分地减小了含大量相关

变量的数据的复杂性, 使计算机的效率最优化, 降低仪器噪音, 同时使小化学位移的变化

最小化, 预测复杂结构的核磁共振光谱参数, 从而分离复杂体系。PCA 方法可以同时对数据集中所有的谱进行分解,来获取它们的基本特征, 即主成分, 它不需要预先对波谱的形状等进行假定, 即不需要有关的先验知识;另一方面, MRS 数据集中, 各谱一般恰恰具有这种

相关文档
最新文档