化学计量学在分析化学中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
化学计量学在分析化学中的应用
摘要:化学计量学是化学量测的基础理论与方法学,运用数学、统计学、计算机科学以及其他相关学科的理论与方法,优化化学量测量过程,并从化学量测数据中最大限度地获取有用化学信息的科学。化学计量学很多研究内容都涉及分析化学基础性问题,如样品的采样理论、分析方法的灵敏度、检出限等。在本文主要从最优化方法、多元校正分析法、模式识别法、化学定量构效关系等方面对化学计量学在分析化学中的应用进行了综述。阐明了化学计量学在分析化学中的作用及广阔的应用前景。
关键词:化学计量学分析化学应用
1.引言
19世纪70年代,瑞典科学家S.Wold首次提出“化学计量学”,随后化学计量学在我国发展有二十余年,已然成为分析化学的一个重要分支。它主要运用数学、统计学、计算机科学以及其他相关学科的理论与方法,优化化学量测过程,并从化学量测数据中最大限度地提取有用的化学信息。
20世纪80年代,在分析测试或化学量测中,人们第一次发现,取得数据甚至大量数据已不是最困难的一步。最难解决的瓶颈问题是这些数据的解析及如何从中提取所需的有用化学信息[1]。计算机的出现推动了化学计量学的发展,化学家、分析化学家利用可在计算机上实现许多强有力的数学方法,包括一些相关学科发展的数据与信号处理新方法,从多维化学量测数据中提取有用的相关化学信息。
其方法贯穿了分析量测中“采样-测量-数据处理”的各个部分,包括采样理论、实验设计、选择和优化实验条件、单变量和多变量信号处理以及数据分析[2]。
2.化学计量学在分析化学中的应用
2.1最优化方法
在化学实验中,经常使用最优化方法,分为局部最优和全局最优。而在化学研究的实践中,很多目标函数非常复杂,采用简单的局部最优方法很难奏效[3]。常用的全局优化算法有模拟退火法、遗传算法、人工神经网络等。这里主要介绍人工神经网络。
现代生物学研究在不断研究人脑组织后,提出了人工神经网络这一概念。人工神经网络( Artificial Neural Network,简称ANN)是用模拟生物神经元的某些基本功能元件(即人工神经元) [5],按各种不同的联结方式组成的一个网络。人工神经网络是十分复杂的网络,它是由大量简单的处理单元连接而成的,并且可以模拟大脑的行为。人工神经网络(ANN)能够对数据模式进行有效地分类与解析,它比较适合处理结果与原因关系不确定的非线性测量数据,许多化学问题都是由于这种不确定性产生的,所以它成功地应用于很多化学领域[6]。人工神经网络由神经元模型构成,这种由许多神经元组成的信息处理网络具有并行分布和结构。每个神经元具有单一输出,并且能够与其他神经元连接;存在许多(多重)输出连接方法,每种连接方法对应一个权系数。
目前人工神经网络在谱图分析、药物分子药效预测和蛋白质结构预测方面的应用已有报道[7]。此外,ANN还促进了仪器联机与实验室自动化,并卓有成效地控制或指导生产,提高和保证了生产质量。
2.2多元校正分析法的应用
多元校正与分辨一直就是分析化学计量学研究的主要内容。随着多元分析不断开发和逐步崛起,研究目标及对象越来越复杂,要求分析工作者给出快速准确的定性、定量及结构分析的结果。
多元校正法则是对现代分析仪器所提供大量的量测数据进行解析的数学统计方法[8]。多元分析校正一直都是化学计量学的主体部分,主要研究如何从量测数据中提取化学体系的定性与定量分析信息,这一领域业已形成了化学计量学极
富特色与代表性的分支——分析化学计量学[9-11]。
现代分析化学的两大重要特征,即分析手段仪器化和化学体系复杂化促进了这一形成。分析手段仪器化这一特征指的是,近几十年来,在计算机技术的推动下,随着分析仪器不断进步和联用技术的采用,现代分析仪器都具有强大的数据产生能力。一般地,对单个样品通常可以产生得到多元乃至多阶量测数据信息。
经典分析化学的校正方法的基点以单点数据(标量),如某一物理或化学的信号与分析系统中某一待测物质存在某种对应的数量关系,借此可以对该化学物质进行定性或定量分析。目前多元校正是从几个响应测量点来求解的传统多分组同时测定的简单推广,从标量校正向矢量、矩阵,张量数据解析的概念性飞跃。
多元校正中常用的多变量建模的方法有主成份回归(principal component regression,PCR),偏最小二乘(partial least squares,PLS)[12]和人工神经网络[13]等。其中 PLS 和 PCR 是最常用的线性方法。PCR 可通过对量测信息矩阵进行特征提取来减少输入变量,并用所提取的特征变量作为回归分析的输入变量。在 PCR 算法中,主成份的提取仅仅考虑了化学量测信息,而并未纳入响应变量的信息,这样使得 PCR 算法在实际应用中受到了一定的限制。PLS最初由Wold 和 Martens在 1983 年引入到化学中来,由于它本身固有的优点:即适合于解决高维、共线性严重且样本个数少于变量个数的数据,而成为多元校正中很受欢迎的建模技术。然而它本身也存在一定的缺点,如难拟合强非线性关系、易引入过多的隐变量而导致过拟合、受奇异值及方差异质影响严重等,因此,它的改进也成了一系列研究的主题。
总之,多元校正方法的性能在很大程度上决定了分析化学工作者能否准确地解析数据、获取数据中蕴含的最大信息。多元校正方法的改善是化学计量学中非常活跃的领域,既丰富了多元校正的基础理论体系,又提升了多元校正在各个领域中的应用价值,为实际复杂多组分分析体系的直接快速定性定量分析的研究提
供了有力武器。
2.3模式识别法的应用
模式识别法是根据化学量测数据矩阵,将样本集按样本的某种性质进行分类及特征选取的方法。
解决模式识别的方法[14]很多,可分为两类,一类是统计模式识别,化学模式识别即属此范围;另一类是句法模式识别,它主要用于图像识别等方面。统计模式识别从计算机模式识别学习过程又可分为有监督方式和无监督方式,其中有监督方式的方法包括贝叶斯(Bayes)法和Fisher判别法等。
另一类无监督方式中重要的一种是聚类分析,它具有很大的实用价值,特别是当模式类数事先并不知道时更为有用。其它常用的方法还有:K-最近邻法、SMICA法(又称相似分析)、非线性映照法(NLM)、势函数法和最小生成树法等。另外,与模糊数学相结合建立在最大隶属度原则和择近原则基础上的模糊模式识别[15]近几年也日益受到重视,其中模糊聚类分析及模糊理论与神经网络结合产生的新算法[16]得到了广泛应用。
另外人工神经网络(ANN)法[17]也正受到化学计量学学者的极大重视,它是基于模仿生物大脑的结构和功能而构成的一种信息处理系统或计算机。其中Thomas等同时应用K-最邻近法和线性学习机从伏安波中区分重叠伏安响应信号,将K-邻近法[18]用于电位阶伏安波和微分电毛细管曲线的分类,可对有机化合物构效关系进行表征。SMICA法可用在食品鉴定[19]、加入赋形剂的药品近红外光谱识别以及环境等方面。
2.4定量构效关系
化学的一个基本准则就是,化合物的结构决定化合物的性质,化学结构与化学性质之间的关系一直是化学最基本的研究内容之一。定量构效关系(QSAR)就是研究化学结构的表征以及性质与结构之间关系的科学,它是化学计量学研究的一