基于卡尔曼滤波的近红外光谱特征波长变量优选方法
近红外 特征波长提取
近红外特征波长提取简介近红外光谱技术是一种非常重要的分析技术,可以应用于许多领域,如农业、食品安全、药物研发等。
在近红外光谱中,特征波长的提取是一项关键任务,它可以帮助我们识别和分析样本中的化学成分。
本文将介绍近红外特征波长提取的原理、方法和应用,并探讨其在实际应用中的意义和挑战。
原理近红外光谱是指波长范围在700纳米到2500纳米之间的光谱。
近红外光谱中的吸收峰与样本中的化学键振动和分子振动有关。
通过分析近红外光谱中的特征波长,我们可以了解样本中的化学成分和结构信息。
近红外光谱中的特征波长通常通过光谱预处理和特征选择来提取。
光谱预处理的目的是降低光谱中的噪声和干扰,常用的方法包括基线校正、光谱平滑和光谱标准化等。
特征选择的目的是从预处理后的光谱中选择最具代表性的波长,常用的方法包括相关系数法、变量重要性法和主成分分析法等。
方法近红外特征波长提取的方法有很多种,下面介绍几种常用的方法。
相关系数法相关系数法是一种简单有效的特征选择方法。
它通过计算光谱与样本属性之间的相关系数,选取相关系数较高的波长作为特征波长。
相关系数的计算可以使用皮尔逊相关系数或者斯皮尔曼相关系数。
变量重要性法变量重要性法是一种基于统计模型的特征选择方法。
它通过构建一个预测模型,然后计算模型中各个波长的重要性指标,选取重要性较高的波长作为特征波长。
常用的变量重要性指标包括信息增益、基尼系数和方差重要性等。
主成分分析法主成分分析法是一种降维技术,它可以将光谱数据转换为一组新的变量,这些新变量是原始变量的线性组合。
通过计算主成分的贡献率,我们可以选取贡献率较高的主成分作为特征波长。
应用近红外特征波长提取在许多领域都有广泛的应用。
农业近红外光谱技术可以应用于农业领域,用于农产品的质量检测和种类鉴别。
通过提取农产品中的特征波长,我们可以判断其成熟度、营养含量和污染物含量等。
食品安全近红外光谱技术可以应用于食品安全领域,用于检测食品中的有害物质和添加剂。
近红外分析中光谱波长选择方法进展与应用
★综述★近红外分析中光谱波长选择方法进展与应用3柳艳云1,2,胡昌勤1 33(1.中国药品生物制品检定所,北京100050;2.湖北省食品药品监督检验研究院,武汉430064)摘要:光谱波长选择方法在近红外光谱分析技术中相当重要。
在复杂的光谱信息中剔除冗余信息、提取有用信息,可以提高光谱分析定量校正模型的预测精度和建模效率,得到预测能力强、稳健性好的近红外校正模型。
本文综述了目前常用于偏最小二乘方法(P LS)建模的近红外波长选取方法及这一领域的最新进展,详细介绍遗传算法(G A)、间隔偏最小二乘方法(I P LS)等波长选取方法,并给出了这些方法的一些应用实例。
关键词:近红外光谱;化学计量学;波长选择;遗传算法;间隔偏最小二乘法中图分类号:R917 文献标识码:A 文章编号:0254-1793(2010)05-0968-08Progress and appli cati on of spectral wavelength selecti onmethods i n NI R analyti cal techn i que3L I U Yan-yun1,2,HU Chang-qin133(1.Nati onal I nstitute f or the Contr ol of Phar maceutical and B i ol ogical Pr oducts,Beijing100050,China;2.Hubei I nstitute f or Food and D rug Contr ol,W uhan430064,China)Abstract:I n the past decade,near infrared(N I R)s pectral analysis technique has been quickly devel oped and wide2 ly app lied in virtue of the devel opment of che mometrics,in which s pectral wavelength selecti on methods p lay an i m2 portant r ole.D iscarding irrelevant inf or mati on and extracting essential inf or mati on in comp lex s pectral inf or mati on can i m p r ove the s pectral analysis of quantitative calibrati on model p redicti on p recise and modeling efficiency,which is hel pful t o construct a good r obustness N I R calibrati on model with str ong forecasting capabilities.I n the paper,the typ ical and commonly used wavelength selecti on methods are described.Some ne wly devel oped methods in this field such as genetic algorith m(G A)and interval partial least squares(I P LS)methods are intr oduced in detail.The algo2 rithm s and app licati ons in N I R analysis of those methods are given and discussed.Key words:near-infrared s pectr oscopy;che mometrics;wavelength selecti on;genetic algorithm;interval partial least squares1 引言 近红外(N I R)光谱分析技术作为弱光谱分析技术,是令人瞩目的一门交叉技术,该项技术以其独特的优点,即不必对样品添加试剂,不必破坏样品,不污染环境,可实现快速测量和在线测量等,被称为“绿色分析技术”。
近红外光谱变量
近红外光谱变量
近红外光谱(NIRS)可被用于预测土壤和植物的多个属性。
在
NIRS中,相同的成分在不同的样品中产生不同的光谱响应。
因此,需
要采用变量选择方法来找到最具代表性的变量。
以下是NIRS变量选择的一些方法:
1. 反变量选择法(iPLS): iPLS是一种先将多个变量进行整合,再进行消除次要变量,最终提取关键变量的方法。
在NIRS应用上,iPLS能
够在维护样品数量同时,保证最佳的预测效果。
2. 互信息:使用互信息法能够剔除掉同一样品中高相关的变量,从而
保留选取到最具代表性的变量。
3. 可变性脉冲(VIP): VIP值可以解释模型与响应变量的关系贡献度。
VIP值高的变量对应土壤属性和植物品质的预测结果影响最大。
4. 方差膨胀因子(VIF):通过分析变量之间的多重共线性关系,能够
筛选出最相关的变量。
总之,NIRS变量选择方法的重点在于筛选出具有代表性的变量,可以
在预测土壤属性和植物品质时取得更好的效果。
基于卡尔曼滤波的近红外光谱特征波长变量优选方法
第34卷,第4期 光谱学与光谱分析Vol畅34,No畅4,pp958‐9612014年4月 SpectroscopyandSpectralAnalysisApril,2014 基于卡尔曼滤波的近红外光谱特征波长变量优选方法王立琦1,葛慧芳1,李贵滨1,于殿宇2,胡立志2,江连洲2倡1.哈尔滨商业大学计算机与信息工程学院,黑龙江哈尔滨 1500282.东北农业大学食品学院,黑龙江哈尔滨 150030摘 要 将经典的卡尔曼滤波器与近红外光谱分析技术相结合,提出了一种新的特征波长变量选择方法———卡尔曼滤波法。
分析了卡尔曼滤波器用于波长优选的原理,设计了波长选择算法并将其应用到大豆油脂酸价的近红外光谱检测中。
首先利用偏最小二乘法(PLS)对油脂不同吸收波段建模,初步筛选出4472~5000cm-1油脂酸价特征波段共132个波长点,然后进一步利用卡尔曼滤波器进行特征波长选择,从中优选出22个特征波长变量建立PLS校正模型,预测集决定系数R2、预测误差均方根RMSEP分别为0畅9708和0畅1254,与利用132个波长点建立的校正模型预测结果相当,而波长变量数减少到原来的16畅67%。
该波长变量选择算法是一种确定性的迭代过程,无复杂的参数设置和变量选择的随机性,物理意义明确。
优选出少数对模型影响较大的特征波长变量以代替全谱建模,在简化模型的同时提高了模型的稳健性,为开发专用油脂近红外光谱分析仪器提供了重要参考依据。
关键词 卡尔曼滤波;近红外光谱;油脂酸价;波长优选中图分类号:O657畅3 文献标识码:A DOI:10畅3964/j畅issn畅1000‐0593(2014)04‐0958‐04 收稿日期:2013‐07‐03,修订日期:2013‐10‐15 基金项目:国家自然科学基金项目(31271886),黑龙江省高校科技成果产业化前期研发培育项目(1253CGZH22),哈尔滨市科技创新人才研究专项资金项目(2012RFQXG082),黑龙江省教育厅科学技术研究项目(12531154),哈尔滨商业大学博士科研启动项目(12DL023)和食品安全与营养协同创新中心团队资助 作者简介:王立琦,女,1966年生,哈尔滨商业大学计算机与信息工程学院教授 e‐mail:hsdwlq@163.com倡通讯联系人 e‐mail:jlzname@163.com引 言 现代近红外光谱仪器的发展,使得人们可以获得包含几百甚至几千个波长变量的光谱数据。
近红外光谱的变量选择算法研究
近红外光谱的变量选择算法研究一、引言近红外光谱技术是一种非常重要的分析方法,在农业、食品加工、医药等领域有着广泛的应用。
近红外光谱图像中所包含的信息量十分丰富,但同时也存在着大量的冗余信息,这给光谱数据的处理和分析带来了挑战。
为了更好地利用近红外光谱数据,提高其分析的准确性和可靠性,变量选择算法成为了研究的热点之一。
二、变量选择算法的意义在近红外光谱分析中,变量选择算法的作用非常重要。
通过对光谱数据进行变量选择,可以减少冗余信息、提高分析的速度,同时还可以降低模型的复杂度,提高模型的泛化能力。
研究和应用高效、准确的变量选择算法对于近红外光谱分析具有重要的意义。
三、常见的变量选择算法1. 最小二乘光谱变量选择(PLS-VIP)PLS-VIP是一种基于偏最小二乘回归(PLS)的变量选择方法。
它首先利用PLS回归获取光谱与响应变量之间的关系,然后通过计算变量的重要性得分(VIP)来选择重要的变量。
相比于传统的变量选择方法,PLS-VIP更适合于处理多重共线性问题,具有更好的稳定性和鲁棒性。
2. 反向变量选择法(BVS)BVS是一种经典的变量选择方法,它通过反复拟合模型并排除对响应变量影响不显著的变量,最终得到一个较好的模型。
BVS方法简单易行,适用于处理大规模的光谱数据,但其计算复杂度较高,需要进行多次模型拟合,同时对初始模型的选择较为敏感。
3. 基于机器学习的变量选择方法随着机器学习技术的发展,越来越多的机器学习算法被应用于变量选择中。
如随机森林、支持向量机等算法,都可以用于光谱数据的特征选择。
这些算法通常能够更加准确地捕捉变量之间的复杂关系,对于非线性的光谱数据分析具有一定的优势。
四、对于近红外光谱的变量选择算法的个人观点在我看来,变量选择算法的研究不仅可以帮助我们更好地理解和利用近红外光谱数据,还能够推动近红外光谱技术的进一步发展。
在实际应用中,我们可以根据具体的问题和数据特点选择合适的变量选择算法,同时也可以结合不同的算法来获取更加准确和可靠的结果。
变量选择方法对近红外光谱校正模型优化极限的研究
第42 卷第 12 期2023 年12 月Vol.42 No.121659~1665分析测试学报FENXI CESHI XUEBAO(Journal of Instrumental Analysis)变量选择方法对近红外光谱校正模型优化极限的研究潘正豪1,王鹏2,陈昆燕2,李秋潼2,唐杰2,杨俊1,邵利民1*(1.中国科学技术大学化学与材料科学学院,安徽合肥230026;2.重庆中烟工业有限责任公司技术中心,重庆400060)摘要:变量选择经常被用于优化近红外光谱线性校正模型,消除冗余信息,提升回归的准确性和可解释性。
该文研究并设计了一种基于蒙特卡洛的方法,用于评估不同线性校正方法在变量选择的子空间中能达到的最优程度,寻找变量选择对线性校正模型的优化极限。
该方法通过获得验证指标——预测均方根误差(RM⁃SEP)的分布图,揭示变量选择方法在数据集上的优化效果与优化极限。
将该方法应用于3组样品的近红外光谱建模研究,结果表明:在烟草-果胶数据集上的可优化率约为24.98%,RMSEP降低了15.2%;在小麦-蛋白质数据集上的可优化率约为13.90%,RMSEP降低了9.5%;在玉米-淀粉数据集上的可优化率约为14.05%,RMSEP降低了57.1%。
应用该方法可以快速得到变量选择方法在模型上的优化极限,为变量选择方法的设计、应用和评估提供参考。
关键词:化学计量学;近红外光谱;化学校正;线性模型;变量选择;蒙特卡洛方法中图分类号:O657.3;TB9文献标识码:A文章编号:1004-4957(2023)12-1659-07Study on the Optimization Limit of Near-infrared Spectroscopy Cali⁃bration Model by Variable Selection MethodsPAN Zheng-hao1,WANG Peng2,CHEN Kun-yan2,LI Qiu-tong2,TANG Jie2,YANG Jun1,SHAO Li-min1*(1.School of Chemistry and Material Science,University of Science and Technology of China,Hefei 230026,China;2.Technical Center,China Tobacco Chongqing Industrial Co.,Ltd.,Chongqing 400060,China)Abstract:Variable selection is often used to optimize linear calibration models for NIR spectrosco⁃py,eliminating redundant information and improving the accuracy and interpretability of regression. In this paper,a Monte Carlo-based method is studied and designed to find the optimal limit of vari⁃able selection for linear calibration models,and can evaluate the optimal degree that different linear calibration methods(such as partial least squares regression PLSR)can achieve in the subspace of variable selection. In this study,the distribution plot of the root mean square error prediction(RM⁃SEP)of the validation metric is obtained,and the optimization effect and optimization limit of the variable selection methods on the dataset are revealed. The method was applied to the near-infrared spectroscopy modeling of three datasets,and the results showed that the optimizable rate on the to⁃bacco-pectin dataset was about 24.98%,and the prediction error RMSEP was reduced by 15.2%. The optimizable rate on the wheat-protein dataset is about 13.90%,and the prediction error RMSEP is reduced by 9.5%. The optimizable on the corn-starch dataset is about 14.05%,and the prediction error RMSEP is reduced by 57.1%. The application of this method can quickly obtain the optimiza⁃tion limit of the variable selection methods on the model,and provide reference for the design,appli⁃cation and evaluation of the variable selection methods.Key words:chemometrics;near-infrared spectroscopy;chemical calibration;linear model;vari⁃able selection;Monte Carlo method近红外光谱(Near-infrared spectroscopy,NIRS)是一种介于可见光和中红外之间的吸收光谱,主要包含C-H、N-H和O-H化学键的信息,几乎所有有机物和大部分含氢的分子都可以使用NIRS进行doi:10.19969/j.fxcsxb.23082802收稿日期:2023-07-14;修回日期:2023-08-21∗通讯作者:邵利民,博士,副教授,研究方向:化学计量学方法的研究和应用,E-mail:lshao@1660分析测试学报第 42 卷表征。
基于Lasso-Huber的近红外光谱特征波长选择方法及应用
基于Lasso-Huber的近红外光谱特征波长选择方法及应用郭拓;徐凤捷;马晋芳;肖环贤【期刊名称】《光谱学与光谱分析》【年(卷),期】2024(44)3【摘要】在近红外光谱(NIRS)波长筛选过程中,当变量数目远大于样本量时,特征波长的选择是一个极具挑战性的问题。
Lasso与Elastic Net算法虽被用于大维小样本数据的变量选择,但二者均以最小平方误差作为损失函数的度量方法来选择特征变量。
因此,当样本中含有异常点时,经两种算法建立的模型对异常点更加敏感,导致模型向异常点偏移,鲁棒性降低。
针对上述问题,采用Huber函数作为损失函数,提出了Lasso-Huber法进行近红外特征波长选择,结合偏最小二乘(PLS)方法建立安胎丸质控指标成分的定量校正模型,并与全波长建模、 Lasso与Elastic-Net方法波长选择后建模的模型性能进行对比。
本实验采集21批安胎丸的近红外光谱数据共116条,其中101条数据作为校正集,采用留一交叉验证法对模型进行内部验证,另外15条数据则作为验证集用于外部验证。
对于校正集中的异常光谱,使用基于主成分分析(PCA)的马氏距离法(MD)进行检测。
以安胎丸的质控指标成分之一阿魏酸为例,采用Lasso、 Elastic-Net和Lasso-Huber方法分别筛选了安胎丸样品无异常光谱中69、 155和87个特征波长。
其中Lasso-Huber法结合PLS建立的预测模型效果最佳,外部验证的RP2和SEP分别为0.953 1和0.058 7。
此外,通过对校正集中是否包含异常光谱的校正模型预测性能对比发现,Lasso-Huber法在包含异常光谱的建模中更具优势。
结果显示,Lasso-Huber算法优选出最佳波长点数为88,结合PLS建立的模型性能R_(v)^(2)为0.967 3,而Lasso方法的R_(v)^(2)为0.840 5, Elastic-Net方法的R_(v)^(2)为0.834 7,全波长建模的R_(v)^(2)为0.852 0。
基于Kalman滤波器的红外标志点快速识别与跟踪
基于Kalman滤波器的红外标志点快速识别与跟踪邢巧娜【摘要】在军事上,利用移动机器人跟踪前方的引导员,在野外复杂环境中完成后勤运输与救援任务有重要的意义.针对野外复杂环境这个应用背景,提出了一个基于红外标志点的视觉跟踪系统,该系统有效的解决了传统的视觉跟踪方法受周围环境影响而不能够准确的识别跟踪对象的缺陷;针对传统的标志点识别采用全局搜索的方法计算量大、实时性差的缺陷,提出了一种基于Kalman滤波器预测的红外标志点的识别方法,该方法较传统的标志点识别方法识别速度提高了93%.【期刊名称】《德州学院学报》【年(卷),期】2014(030)004【总页数】8页(P25-32)【关键词】红外标志点;Kalman滤波器;标志点识别【作者】邢巧娜【作者单位】德州学院物理与电子信息学院,山东德州 253023【正文语种】中文【中图分类】TP391.41在野外复杂环境下运输机器人通过跟踪前方的引导员将军队后勤保障物资顺利送达运输目的地在军事上有着重要的意义.实现移动机器人对引导员跟踪的方法有多种,但由于视觉传感器定位准确性高、适合本文3~5m量程范围、成本适中,所以本文选择视觉传感器对引导员进行跟踪定位.但由于传统的视觉跟踪方法存在受光照和背景变化影响较大的缺陷,本文提出一种基于红外标志点的视觉跟踪系统.针对传统的标志点识别方法采用全局搜索的识别方法不仅计算量大、实时性差,而且系统的抗干扰能力也较弱的缺陷,本文提出了一种基于Kalman滤波预测的红外标志点的快速识别方法,通过该方法来提高跟踪系统的实时性和在复杂环境下的抗干扰能力.目前,基于移动机器人对行人的视觉跟踪的方法主要有以下三大类.1)基于颜色信息的跟踪方法.此类方法一般利用跟踪对象所穿衣服的颜色[1,2]、皮肤[3]或人脸[4,5]等的颜色信息进行跟踪.但是在野外复杂环境下,随着时间和地点不断变化的光照将导致以上基于颜色信息对跟踪目标的识别很容易失败. 2)基于人体轮廓特征的跟踪方法.文献[6]中,利用跟踪目标的轮廓建立模板,然后利用图像序列中检测到的轮廓信息与已近建立好的轮廓模板进行匹配,从而识别出跟踪目标.但是,在野外复杂环境下,光照及背景随着时间和地点在不断的变化,这将很容易导致轮廓缺失或变形,使得识别的准确性降低.3)基于红外成像的跟踪方法[7,8].利用人体与周围环境辐射能量的差异,通过红外成像将人体与周围环境区分开来,从而达到识别与跟踪的目的.这种方法不受光照与复杂环境变化的影响,但是如果视野中同时出现两个或者两个以上的人,由于不同人体所成的红外图像没有太大差异,这将导致不能准确识别跟踪对象.针对以上传统的视觉跟踪方法受光照和背景变化影响较大的缺陷,本文提出一种基于红外标志点的视觉跟踪系统.所提出的跟踪系统一方面利用了红外成像跟踪方法的优势,不受光照和复杂环境的变化对跟踪目标识别准确性的影响,且可以全天候的工作;另一方面解决了人体红外成像跟踪方法受其他人干扰的缺陷,在野外复杂环境下用红外标志点的红外特征取代人体的红外特征,使得跟踪目标在环境中始终保持唯一性.本文提出的基于红外标志点的视觉跟踪系统的结构如图1所示.本文的跟踪系统主要由红外标志点生成单元、图像采集单元以及视觉测量单元三个部分组成.1)其中标志点生成单元包括4个红外发光二极管(LED)标志点、供电电池组和一个钢体板等.本文使用的红外标志点由四个波长为850nm、功率为1W的红外LED组成;将安装有红外标志点的钢体板贴在引导员的背部,使四个红外标志点在同一平面,且标志点之间的相对位置不随引导员移动而发生变化,为了便于后续摄像机位姿的计算,规定4个红外标志点的世界坐标按顺时针方向排列分别为(100,100,0)(100,100,0),(100,-100,0),(-100,-100,0),(-100,100,0),坐标单位为mm.;电池组用来对红外LED供电.图2为红外标志点单元的实物图.2)图像采集单元包括摄像机以及安装在摄像机透镜前端的红外窄带滤光片.为了消除可见光对系统成像的影响,在摄像机的镜头前安装了一块与红外LED对应的中心波长850nm带宽50nm的红外窄带滤光片,一方面阻止了环境中的可见光进入成像系统,另一方面只允许波长在850nm附近的红外光线透过.图像采集单元的实物图如图3所示.3)视觉测量单元主要完成算法处理工作,包括标志点的识别及摄像机的姿态计算. 红外标志点跟踪系统跟踪流程如图4所示,红外标志点的识别包括初始时刻红外标志点的识别和跟踪时刻红外标志点的识别.摄像机采集进来图像,首先判断是否是第一帧图像,如果是第一帧图像,则进入以下流程:(1)由于没有先验信息,需要采用全局搜索的方法对红外标志点进行识别;(2)计算摄像机的姿态一方面为跟踪标志点建立初始姿态,另一方面为控制系统反馈;(3)初始化Kalman参数并且预测标志点在下一帧图像可能出现的区域.如果不是第一帧图像,则进入以下流程:(1)在上一帧图像提供的预测区域,采用跟踪时刻局部搜索的方法对红外标志点进行识别;(2)计算摄像机的姿态,为控制系统提供反馈;(3)更新Kalman参数并且预测标志点在下一帧图像可能出现的区域.为了完成跟踪任务,通过红外标志点的二维图像维坐标与标志点的三维世界坐标来计算摄像机的位姿是必须的.标志点的三维世界坐标通过离线标定,红外标志点的二维图像坐标需要通过红外标志点的识别得到.1)初始时刻红外标志点的识别.初始时刻红外标志点识别流程如图5所示.(1)图像膨胀处理.为了使红外标志点区域相对于背景更明显,方便后续区域的分割,对图像进行膨胀处理.(2)红外标志点区域分割.区域分割一般包括阈值分割与连通域标记,而传统的方法每一步操作都需要对整幅图像进行逐像素遍历,从而造成系统耗时较长.为了提高系统的实时性,本文提出在图像自适应阈值分割的同时完成对图像中连通域的标记.自适应分割阈值计算公式如式(1)g(x,y)表示像素的灰度值,radius表示所选区域的半径,si表示每个区域的灰度平均值,threshold1表示分割阈值.为了从背景中分割出红外区域,对图像随机采样100个区域并将它们的灰度平均值作为分割的阈值,分割图像中的红外区域. 为了保证检测红外区域的完整性,采用图像4-邻域分析,实现红外连通区域的检测.逐个像素点扫描图像,如果当前像素的灰度值大于阈值,则说明该点为候选的红外标志点,对其进行编号标记(按连通域找到的先后顺序将连通域分别标记为1,2,3,4……),对已找到候选的红外标志点的像素灰度值标记为0,以避免后续重复的递归查找.然后在本像素的4领域内递归查找其它的点,直到查找完该连通域为止.如此遍历整幅图像,便可以找到所有候选的红外标志点的区域.如图6所示,(a)图是摄像机采集进来的第一帧原始图像,(b)图像是膨胀预处理之后的图像,(c)图是采用以上全局搜索的方法分割出红外区域之后的图像. 为了确保所分割的区域为红外标志点的成像区域,采用先验的信息对分割的候选红外区域进行验证,利用标志点在像平面面积的大小来去除候选区域中的干扰区域.(3)连通域重心的计算和编号标记.利用重心计算公式计算每一个红外区域的重心.为了实现4个红外标志点的图像坐标与给定的4个标志点的世界坐标一一对应,本文采用4个点距离图像4个定点的距离大小的方法对红外标志点的进行顺时针排序,从而完成初始时刻标志点的识别.2)跟踪时刻红外标志点的识别.使用Kalman滤波器估计出当前图像中4个标志点的定位区域,极大地减少了标志点的搜索区域,从而简化了标志点识别的过程.在保证红外标志点识别准确性的前提下,简化后的识别流程如下.(1)在4个Kalman预测区域对图像做膨胀处理.(2)标志点区域分割.跟踪时刻分割阈值计算如公式(2).area表示Kalman滤波器预测的标志点预测区域,f(x,y)表示像素灰度值,number表示预测区域内像素个数,每一个红外区域分割阈值threshold2为预测区域的灰度平均值.在预测区域内,如果当前像素的灰度值小于阈值,那么进行下一像素的扫描;如果当前像素的灰度值大于或等于阈值,则保留当前像素的横坐标和纵坐标并且记录每个预测区域中大于阈值的像素个数,为下一步计算标志点的重心提供依据.(3)连通域重心的计算.对保留下来的像素的横坐标和纵坐标及像素个数,利用重心计算公式计算红外标志点的重心,完成跟踪时刻标志点的识别.如图7所示,(a)图是摄像机采集的原始图像,(b)图是跟踪时刻红外区域分割之后的图像.完成标志点识别之后,计算当前摄像机姿态并且预测下一采样时刻的姿态,一方面可以为机器人控制系统提供更多的反馈信息,另一方面可以通过反投影预测下一帧图像4个标志点的定位区域.1)计算摄像机姿态.使用针孔摄像机模型可以推导出图像坐标与世界坐标的对应关系,如公式(3)所示摄像机内参矩阵K可通过摄像机标定得到,R是3×3的旋转矩阵,T是3×1的平移向量,λ是尺度因子.式(3)左边3×1的矩阵是标志点图像坐标,可经过上述标志点的识别得到.式(3)右边4×1的矩阵是标志点世界坐标,可通过离线标定.因此利用式(3)可以求解摄像机的姿态R、T.为了提高标志点的识别速度和抗干扰能力,增加后续控制系统的预见性,提出了使用Kalman滤波器对红外标志点下一时刻可能出现的区域进行预测.2)Kalman滤波器.针对传统的标志点识别采用全局搜索的方法计算量大、实时性差、抗干扰能力较差的问题,本文提出了使用Kalman滤波器预测4个红外标志点在下一帧图像可能出现的区域,然后在较小的预测区域中进行标志点的搜索,可以极大地减少非目标区域的干扰,简化标志点识别过程,从而提高标志点识别的速度.(1)Kalman滤波原理.Kalman滤波器是由Rudolph E.Kalman在1960年提出的一种线性滤波器,可以有效地去除采样序列中的噪声,利用上一时刻的状态值递归计算出当前的状态值.卡尔曼滤波器的模型[9]为状态方程卡尔曼滤波器的工作流程如图8所示.在时间更新方程中,Xk/k-1表示k时刻的先验状态估计,Xk-1表示k-1时刻的后验状态估计,A表示状态转移矩阵,Pk/k-1表示k时刻的先验估计误差协方差,Pk-1表示k-1时刻的后验估计误差协方差,Q表示状态转移噪声Wk的协方差;在测量更新方程中,Kk表示卡尔曼增益,H 表示观测矩阵,R为观测噪声Vk的协方差,Xk表示k时刻的后验状态估计,zk表示k时刻的观测变量,Pk表示k时刻后验估计误差协方差矩阵,I是单位矩阵.时间更新方程负责及时向前推算当前状态变量和误差协方差估计值,以便为下一个时刻状态构造先验估计.测量更新方程负责反馈,它将先验估计和新的观测变量结合以构造改进的后验估计.时间更新方程也可视为预估方程,测量更新方程可视为校正方程.(2)基于Kalman滤波的标志点运动模型的建立.Kalman滤波的参数需要根据实际应用情况来决定.系统是一个负反馈系统,求解出的摄像机姿态作为反馈值传送给机器人控制系统,实现机器人的跟踪,所以直接对摄像机姿态进行Kalman滤波,一方面可以为控制子系统提供更多的反馈信息,另一方面根据序列图像的连续性,结合红外标志点的世界坐标和摄像机的内参将红外标志点反投影到图像坐标,可以得到标志点在下一帧图像的定位区域.由于Kalman滤波只能应用于线性系统,因此要求滤波模型必须是线性模型.本文把图像相邻采样时刻T内摄像机的运动分解为6个运动:围绕X轴的转动、围绕Y轴的转动、围绕Z轴的转动、沿X轴的平移、沿Y轴的平移、沿Z轴的平移.相邻采样时刻内的转动看作匀角加速度的圆周运动,平移看作匀加速度的直线运动.本系统6个方向运动的观测向量为(φ,θ,φ,tx,ty,tz)T ,状态向量为[φ(k)φv(k)φa(k)θ(k)θv(k)θa(k)φ(k)φv(k)φa(k)tx(k)txv(k)txa(k)ty(k)tyv(k)tya(k)tz(k)tzv(k)tza(k)tza(k)]T,建立状态方程如公式(6).方程中T是采样周期.建立系统的观测方程如式(7).3)基于Kalman滤波器的红外标志点区域预测.本文中Kalman滤波器实现红外标志点区域预测的流程如图9所示.Kalman滤波器实现红外标志点区域预测的步骤.(1)Kalman参数初始化.启动Kalman滤波器需要初始化协方差矩阵p0和状态向量x0,本系统中初始时刻误差协方差矩阵p0为的单位矩阵,初始时刻状态向量x0为初始时刻摄像机的位姿(第一帧图像采用全局搜索的方法识别标志点,计算得到的位姿).系统状态转移噪声Q为主对角线元素为1.5其他元素都为0的18×18的矩阵,系统观测噪声R为主对角线元素为0.9其他元素都为0的18×18的矩阵,状态转移矩阵A和观测矩阵H 分别赋值如式(6)和(7).(2)更新先验状态 Xk/k-1 和先验误差协方差Pk/k-1.结合 Kalman参数的初始值,利用图8中时间更新方程更新先验先验状态Xk/k-1和先验误差协方差Pk/k-1,即 Kalman滤波器通过当前帧图像的摄像机位姿及状态方程预测下一帧图像的先验的摄像机位姿,为后续预测红外标志点下一帧图像可能出现的区域提供依据.(3)利用反投影来预测下一帧图像中红外标志点可能出现的区域.利用先验状态Xk/k-1即先验位姿,并结合4个红外标志点的世界坐标和摄像机的内参,将4个红外标志点反投影到二维图像坐标系,得到下一帧图像中预测的4个红外标志点的二维图像坐标,然后分别以4个预测的红外标志点的二维图像坐标为中心建立4个方形预测区域.红外标志点的预测区域如图10所示,图中的4个黑色方框所包含的区域表示Kalman预测的下一帧图像中4个标志点可能出现的区域. (4)跟踪时刻红外标志点的识别.在预测的4个方形区域中利用跟踪时刻红外标志点的识别方法对红外标志点进行识别.(5)摄像机位姿的计算.(6)更新后验后验状态Xk-1和后验误差协方差Pk-1.利用图8中测量更新方程更新后验后验状态Xk-1和后验误差协方差Pk-1,为后续时间更新提供依据. (7)重复执行步骤(2)-(6).为了验证Kalman滤波器预测区域的正确性,本文做了测试实验,测试本文提出的Kalman滤波器预测红外标志点区域的效果,图11为2014年6月5日13:23分左右,光照度大概为107lx的环境下,所做实验的部分Kalman滤波器预测红外标志点区域的效果图.在图11中,4个绿色区域为Kalman滤波器预测的4个红外标志点的定位区域,红色区域为标志点实际所在的区域,4个红色矩方形区域的中心是红外标志点的重心.由实验结果可以看出,在Kalman滤波器预测的红外标志点区域中进行红外标志点的搜索可以完成红外标志点的识别.为了验证Kalman滤波器预测的准确性,本文通过测试实验,得到预测偏差统计图如图12,图12给出了4个红外标志点的预测区域中心的二位图像坐标与标志点的实际重心的二位图像坐标之间的偏差散列图.(a)(b)(c)(d)四幅图中,4个横坐标轴分别表示4个标志点预测区域中心的二维图像横坐标与4个标志点的实际重心的二维图像横坐标之间的偏差量,4个纵坐标轴分别表示4个标点预测区域中心的二维图像纵坐标与4个标志点的实际重心的二维图像纵坐标之间的偏差量.由实验结果可以看出,无论在X、Y方向Kalman滤波器预测的偏差量基本都在10个像素以内,说明在预测区域内进行红外标志点的搜索,完全可以完成红外标志点识别的任务.本文实验在配置为主频3.10GHz,内存为4.00G的PC机上进行.跟踪时刻红外标志点识别耗时如图13所示.由图13中第一帧图像的识别耗时可知,初始时刻采用传统的全局图像搜索的方法识别红外标志点耗时15ms左右.而采用基于Kalman滤波器的红外标志点的识别方法完成标志点识别耗时不到1ms.通过实验数据对比可以看出,基于Kalman滤波器的红外标志点的识别方法较传统的标志点识别方法的识别速度提高了93%,不仅使得本文系统更好的满足运输机器人平台对跟踪系统的实时性要求,而且使跟踪系统极大地减少了非目标区域的干扰.设计了一个基于红外标志点的跟踪系统.该系统采用了红外标志点,既可消除可见光光照的影响,又保证了所跟踪目标特征的唯一性,大大增强了跟踪系统对环境的适应能力.在红外标志点的识别过程中,提出了基于Kalman滤波器的快速识别方法.实验结果表明本文提出的方法显著的提高了标志点的识别速度,增强了系统的实时性.【相关文献】[1]C.Schlegel,J.Illmann,H.Jaberg,et al.Vision based person tracking with a mobile robot[J].In Proceedings of the Ninth British Machine Vision Conference(BMVC),pages 418–427,1998.[2]Keita Itoh,Takashi Kikuchi,Hiroshi Takemura,et al.HiroshiMizoguchi.Development of a Person Following Mobile Robot in Complicated Background by Using Distance and Color Information[J].IEEE Industrial Electronics,IECON 2006-32nd Annual Conference,2006,pages 3839-3844.[3]S.Feyrer,A.Zell.Detection,tracking,and pursuit of humans with an autonomous mobile robot[J].In Proc.of the IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS),pages 864–869,1999.[4]J.Barreto,P.Menezes,J.Dias.Human-robot interaction based on haar-like features and eigenfaces[J].In Proc.2004IEEE Int.Conf.on Robotic and Automation,pages 1888–1893,New Orleans,LA,USA,2004.[5]L.Brethes,P.Menezes,F.Lerasle,et al.Face tracking and hand gesture recognition for human-robot interaction[J].In Proc.of the 2004IEEE International Conference on Robotic and Automation,pages 1901–1906,New Orleans,LA,,USA,2004.[6]P.Menezes,L.Brthes,F.Lerasle,et al.Visual tracking of silhouettes for human-robot interaction[J].In Proceedings of the 11th International Conference on Advanced Robotics(ICAR),volume 2,pages 971–976,2003.[7]H.Nanda,L.Davis.Probabilistic Template based Pedestrian Detection in Infrared Videos[J].In IEEE Intelligent Vehicle Symposium,pages 1901 – 1906,Versailles,France,2002.[8]U.Meis,W.Ritter,H.Neumann.Detection and classification of obstacles in night vision traffic scenes based on infrared image[J].In Proc.IEEE Intelligent Transportation Systems,pages 1140 – 1144,Shanghai,China,2003.[9]G.Welch,G.Bishop.An introduction to the Kalman filter[J]put.Sci.Univ.North Carolina,Chapel Hill,Tech.Rep.TR95041,2000.。
基于卡尔曼滤波的红外图像增强算法
基于卡尔曼滤波的红外图像增强算法刘涛;赵巨峰;徐之海;冯华君;陈慧芳【期刊名称】《浙江大学学报(工学版)》【年(卷),期】2012(046)008【摘要】针对红外图像中的非均匀性噪声的去除问题,提出基于卡尔曼滤波的红外图像去噪及增强算法.在Bayesian-MAP框架下分析卡尔曼滤波器对去噪问题的适用性.由于成像电路内部温度上升和参数的细微变化,每个像元的固定模式噪声(FPN)在帧间缓慢变化.基于此点,建立暗帧的噪声模型.将卡尔曼滤波器作用于红外暗帧序列,估计出暗帧中每个像元的FPN水平.引入噪声影响因子(NIF)来评估FPN噪声对像元输出信号的影响.根据NIF自适应地选取每个像元的FPN噪声权重.实际带噪图像减去加权FPN噪声,即得到增强图像.将该算法应用于实拍红外图像,用平均灰度梯度(GMG)评估算法的性能.在目标区域,GMG下降了5.1%,说明算法在去噪的同时很好地保留了目标的边缘.而在平滑区域,GMG下降了85.5%.结果表明,该算法在去除非均匀性噪声,提高图像的对比度方面,取得较好的效果.【总页数】6页(P1534-1539)【作者】刘涛;赵巨峰;徐之海;冯华君;陈慧芳【作者单位】浙江大学现代光学仪器国家重点实验室,浙江杭州310027;中国计量学院光电分院,浙江杭州310018;浙江大学现代光学仪器国家重点实验室,浙江杭州310027;浙江大学现代光学仪器国家重点实验室,浙江杭州310027;浙江大学现代光学仪器国家重点实验室,浙江杭州310027;中国计量学院光电分院,浙江杭州310018【正文语种】中文【中图分类】TN21【相关文献】1.基于迭代深度网络的红外图像增强算法 [J], 陈世红;陈荣军2.基于小波变换的红外图像增强算法研究 [J], 郭晓川3.基于先验信息的地雷目标红外图像增强算法 [J], 程曦;杨力;季茂荣;王宏伟4.基于红外图像增强算法的混凝土内部缺陷检测研究 [J], 郑丹;谭帅帅5.基于改进量子粒子群的红外图像增强算法 [J], 宋蕊;李宇新因版权原因,仅展示原文概要,查看原文内容请购买。
基于卡尔曼滤波算法的光谱共焦测量精度的提升方法
基于卡尔曼滤波算法的光谱共焦测量精度的提升方法作者:赵斌毛肖肖田申诚曹焱董祥美高秀敏来源:《光学仪器》2023年第05期摘要:為减少待测物体位置变化时光谱系统受到的噪声干扰以及峰值定位误差,基于卡尔曼滤波算法原理,提出一种将 Voigt 寻峰定位的结果作为观测误差并进行最优估计来提升共焦系统测量精度的方法。
先进行标定实验,确定光谱共焦系统的测量范围及精度;再依次对比中值滤波、Savitzky-Golay 滤波以及快速傅里叶变换滤波等对光谱信号去噪的处理情况,并选用高斯、洛伦兹以及 Voigt拟合等方法寻峰定位。
同时,分析了 Voigt拟合中的峰值提取、高斯宽度、洛伦兹宽度以及幅值误差对拟合精度的影响。
实验结果表明,系统的测量范围可达3 mm ,中心光斑半径增大了近1.79倍,采用卡尔曼滤波算法能够降低系统中的噪声引起的定位误差且系统精度能够提升11倍,满足高精度的测量需求。
关键词:光谱共聚焦系统;卡尔曼滤波;Voigt 拟合;误差函数中图分类号: O 433.1 文献标志码: AMethod to improve the accuracy of spectral confocalmeasurement based on Kalman filtering algorithmZHAO Bin,MAO Xiaoxiao ,TIAN Shencheng ,CAO Yan,DONG Xiangmei ,GAO Xiumin(School of Optical-Electrical and Computer Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China)Abstract: To reduce the noise interference and peak positioning error of the spectral system when the position of the object to be measured changes, based on the principle of Kalman filtering algorithm, a method is proposed to improve the measurement accuracy of the confocal system by taking the results of Voigt peak-finding and positioning as the observation error and making the optimal estimation. In this work, calibration experiments are carried out to determine the measurement range and accuracy of the spectral confocal system. Then, the denoising processing of spectral signals such as median filtering, Savitzky-Golay filtering, and fast Fourier transform filtering is compared in turn, and Gaussian, Lorentz, and Voigt fitting methods are used to find peaks. At the same time, the effects of peak extraction, Gaussian width, Lorentz width, and amplitude error on fitting accuracy in Voigt fitting are analyzed. The experimental results show that the measurement range of the system can reach 3 mm, and the radius of the central spot changes by nearly 1.79 times, The Kalman filtering algorithm can reduce the positioning error caused by noise in the system, and the system accuracy can be improved by 11 times to meet the requirements of high-precision measurement.Keywords: spectral confocal system;Kalman filtering;Voigt fitting ;error function 引言光学无损测量是工业上首选,位移检测技术作为几何参量精密测量的基础逐步趋于实时、无损方向发展[1]。
基于Kalman滤波与DBN的油脂中TFAs含量近红外光谱分析
第41卷,第3期2021年3月光谱学与光谱分析SpectroscopyandSpectralAnalysisVol.41,No.3,pp848-852March%2021基于Kalman滤波与DBN的油脂中TFAs含量近红外光谱分析王立琦X陈颖淑X刘雨琪X宋旸2!于殿宇S张娜2*1.哈尔滨商业大学计算机与信息工程学院/黑龙江省电子商务与信息处理重点实验室,黑龙江哈尔滨1500282.哈尔滨商业大学食品工程学院%黑龙江哈尔滨1500763.东北农业大学食品学院%黑龙江哈尔滨150030摘要针对油脂脱臭过程中的反式脂肪酸(TFAs)含量控制问题%提出一种基于近红外光谱分析的油脂中TFAs含量快速检测方法*制备含不同TFAs的大豆油脂样本100个%利用气相色谱(GC)法精确测定其TFAs含量%扫描样本近红外光谱%然后利用不同方法对光谱数据进行降噪处理%发现多元散射校正的去噪效果最佳*为了探讨TFAs在近红外区域的吸收特性%采用多种iPLS方法对比分析%筛选出7258〜7443/ 6502〜6691/6120〜6309cm1TFAs的特征波段%再利用Kalman滤波算法进行特征波长变量的选择%优选出27个TFAs的特征波长变量;采用深度信念网络(DBN)建立校正模型%通过多次对比发现%当隐含层层数为3并且隐含层节点数为50-35-90时%DBN模型性能最佳*最后将DBN模型与PLS方法建立的反式脂肪酸含量回归模型进行对比分析%结果表明:对降噪后的全谱进行建模%DBN模型的预测效果优于PLS% DBN模型预测集3为0.8794+RMSEP为0.0603+RSD为2.18%;对筛选出的特征波段建模%PLS模型的预测效果优于DBN模型;对优选出来的27个特征波长变量建模%DBN的预测效果较好%3为0.9584、RMSEP为0.0350+RSD为1.31%,说明DBN模型的泛化能力更好%并且利用少量的波长变量就能达到较好的预测效果%能够满足实际检测需求%为实现油脂加工过程中TFAs含量的在线检测和调控%生产低/零TFAs油脂产品提供技术支撑*关键词油脂;反式脂肪酸;近红外光谱;卡尔曼滤波;深度信念网络中图分类号:O657.3文献标识码:A DOI:10.3964/j.issn.1000-0593(2021)03-0848-05引言近年来%食用油脂中反式脂肪酸(trans fa t y acids% TFAs)含量超标问题已经引起了社会各界的广泛关注*研究表明%TFAs能促进动脉硬化;促成+型糖尿病等多种疾病*1994年%世界卫生组织发表声明%提出食品中TFAs含量应控制在4%范围内自2006年开始%美国食品药品监督管理局规定食品中的TFAs含量必须做出标注;纽约市政府通过法案%决定从2007年起逐步禁用直至全面封杀餐饮业使用TFA s;世界卫生组织已给出建议%认为食品中TFAs 含量应在2%以下#$*油脂高温脱臭过程中%随着温度上升、时间延长%TFAs 含量呈上升趋势⑷*测定油脂中TFAs含量的方法主要有色谱法、红外光谱法、毛细管电泳法等#5$%但上述方法只适用于实验室检测%近红外光谱(near-infared spectroscopy% NIR)分析技术能够弥补以上检测方法的缺陷%成为一种快速、高效、适合在线分析的有利工具#$*莫欣欣等利用NIR技术对超市中的几种食用植物油(菜籽油、玉米油、葵花籽油、花生油、大豆油、山茶油、稻米油、橄榄油以及调和油)中TFAs含量进行了快速定量检测*有研究利用近红外漫反射实现了食品中反式脂肪酸的快速测定%并利用SVM% KNN%PLSDA和SIMCA等方法建立了TFAs的识别模型%最终发现PLSDA效果最佳*本文针对大豆油脂加工脱臭过程中TFAs的产生和控制问题%提出一种基于Kalman滤波和深度信念网络(deep believe net%DBN)的油脂中TFAs含量检测方法%以期生产出低/零反式脂肪酸油脂产品*收稿日期:2020-02-04,修订日期:2020-06-13基金项目:国家自然科学基金面上项目(2072259)%黑龙江省自然科学基金项目(LH2020C061)资助作者简介:王立琦%1966年生%哈尔滨商业大学计算机与信息工程学院教授e-mail:**************通讯作者#-mail'*******************第3期光谱学与光谱分析8491实验部分1.1材料与仪器脂肪酸甲酯标准品:9t-C18:1%9c-C18:1,9t,12 t-C18:2,9c,12t-C18:2,9t,12c-C18:2,9c,12c-C 18:2;KOH-甲醇溶液(2mol・―1);异辛烷,色谱纯);其他试剂为分析纯;配备InGaAs检测器的FT-NIR 仪,光源为25W卤素灯。
python近红外光谱特征波段筛选
在Python中进行近红外光谱特征波段的筛选通常涉及数据处理和分析。
以下是一些常见的方法和库,可用于特征波段的筛选:1. **数据加载和预处理**:首先,您需要加载近红外光谱数据,并进行必要的预处理,例如数据清洗、去噪、均一化等。
2. **特征选择方法**:有许多方法可以用来选择最重要的特征波段,其中一些包括:- **相关性分析**:通过计算每个波段与目标变量之间的相关性,选择与目标相关性高的波段。
- **方差分析**:使用方差分析(ANOVA)来评估不同波段之间的差异,选择方差较大的波段。
- **互信息**:计算每个波段与目标变量之间的互信息,选择互信息高的波段。
- **特征重要性**:使用机器学习模型(例如随机森林或梯度提升树)来评估每个波段的重要性,选择重要性高的波段。
3. **特征选择库**:Python中有一些库可以帮助进行特征选择,包括scikit-learn、XGBoost、LightGBM等。
这些库提供了许多特征选择方法的实现。
下面是一个使用scikit-learn库进行特征选择的示例代码:```pythonfrom sklearn.feature_selection import SelectKBest, f_regression# 假设X是特征矩阵,y是目标变量# 创建SelectKBest对象,选择k个最重要的特征selector = SelectKBest(score_func=f_regression, k=5)# 对数据进行拟合和变换X_new = selector.fit_transform(X, y)# 获取所选特征的索引selected_features = selector.get_support(indices=True)# 输出所选特征的索引print(selected_features)```在上述示例中,我们使用了f_regression作为评分函数,选择与目标变量的线性相关性较高的5个最重要的特征波段。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3 第4期 光 谱 学 与 光 谱 分 析 4卷 , 2014 年 4 月 S e c t r o s c o n dS e c t r a lA n a l s i s p p ya p y
9 5 8 9 6 1 V o l . 3 4, N o . 4, p p , A r i l 2 0 1 4 p
( )对向量 ( / 4 犫 狊 犱) 狀×1 中的全部 元 素 ,按 绝 对 值 从 大 到 小 排序 ; ( )确定变量的最佳个数 。按 从 前 到 后 的 顺 序 依 次 选 择 5 若干变量建模 ,并使 用 该 模 型 预 测 化 合 物 的 未 知 性 质 数 据 , 直到达到满意的结果为止 。
基于卡尔曼滤波的近红外光谱特征波长变量优选方法
王立琦1,葛慧芳1,李贵滨1,于殿宇2,胡立志2,江连洲2
1.哈尔滨商业大学计算机与信息工程学院 ,黑龙江 哈尔滨 1 5 0 0 2 8 5 0 0 3 0 2.东北农业大学食品学院 ,黑龙江 哈尔滨 1
摘 要 将经典的 卡 尔 曼 滤 波 器 与 近 红 外 光 谱 分 析 技 术 相 结 合 ,提 出 了 一 种 新 的 特 征 波 长 变 量 选 择 方 — — 卡尔曼滤波法 。分析了卡尔曼滤波器用 于 波 长 优 选 的 原 理 ,设 计 了 波 长 选 择 算 法 并 将 其 应 用 到 大 豆 法— ) 油脂酸价的近红外光谱检测中 。首先利用偏最小二 乘 法 ( 对 油 脂 不 同 吸 收 波 段 建 模 ,初 步 筛 选 出 44 P L S 7 2 0 0c m-1 油脂酸价特征波段共 1 3 2 个波长点 ,然后进一步利用卡尔曼滤波器进行特征波长选择 ,从中优 ~50 2 、预 测 误 差 均 方 根 RM 选出 2 2 个特征波长变量建立 P L S 校正模型 ,预测集决定系数 犚 S E P分别为0 . 9 7 08 和0 . 1 2 54,与利用 1 3 2 个波长点建立的校正模型预测结果相当 ,而波长变量数减少到原来的 1 6 . 6 7% 。该波 长变量选择算法是一种确定性的迭代过程 ,无复杂的参数设置和变量选择的随机性 ,物理意义明确 。优选出 少数对模型影响较大的特征波长变量以代替全 谱 建 模 ,在 简 化 模 型 的 同 时 提 高 了 模 型 的 稳 健 性 ,为 开 发 专 用油脂近红外光谱分析仪器提供了重要参考依据 。 关键词 卡尔曼滤波 ;近红外光谱 ;油脂酸价 ;波长优选 : / ( ) 中图分类号 : . i s s n . 1 0 0 0 0 5 9 3 O 6 5 7 . 3 文献标识码 :A 犇 犗 犐 1 0 . 3 9 6 4 2 0 1 4 0 4 0 9 5 8 0 4 j 中应用最多的是遗传算法 。
1 - 犓 犘犽 犆T ( 犆 犘犽 犆T +犛 犽 =犃 狕)
择方法 ,如连续投影算法 、模拟 退 火 法 、遗 传 算 法 等
2 0 1 3 0 7 0 3,修订日期 : 2 0 1 3 1 0 1 5 收稿日期 :
[ 4 9]
,其
( ) 1
) ,黑龙江省高校科技成果产业化前期研发培育项目 ( ) ,哈尔滨市科技创新人才研 3 1 2 7 1 8 8 6 1 2 5 3 C G Z H 2 2 基金项目 :国家自然科学基金项目 ( ,黑 龙 江 省 教 育 厅 科 学 技 术 研 究 项 目 ( ,哈 尔 滨 商 业 大 学 博 士 科 研 启 动 项 目 究专项资金 项 目 ( 2 0 1 2 R F Q X G 0 8 2) 1 2 5 3 1 1 5 4) ( ) 和食品安全与营养协同创新中心团队资助 1 2 D L 0 2 3 : 1 9 6 6 年生 ,哈尔滨商业大学计算机与信息工程学院教授 e m a i l h s d w l 6 3. c o m 作者简介 :王立琦 ,女 , @1 q : m a i l l z n a m e 6 3. c o m 通讯联系人 e @1 j
第 4 期 光谱学与光谱分析
9 5 9
^ ^ ^ 狓 狓犽 +犅 狓犽 ) 犃 狌 +犓 犽 1 = ( 犽) 犽( 犽 1 -犆 狔 + + 犘 犘犽 犃 +犛 犘犽 犆犛 犆 犘犽 犃 犽 1 =犃 狑 -犃 +
T T 1 - 狕 T
( ) 2 ( ) 3
[ 1 1] ) 测定油脂酸价 ,测得 5 5 5 3 0—8 5 0 个油脂样品酸价值分布 -1 范围为 0 油。 . 4 7 3~3 . 0 0 5m K OH·g g
犫 犽 1 =犫 犽 +狑 犽 +
输出方程
( ) 5
然后利用美国 T h e r m oN i c o l e t公 司 A n t a r i s傅 里 叶 变 换 近红外 光 谱 仪 对 油 脂 样 本 进 行 透 射 光 谱 扫 描 , 扫 描 范 围 40 0 0~1 20 0 0c m-1 ,分 辨 率 4c m-1 ,样 品 池 采 用 直 径 为 8 mm 的透明玻璃 管 ,以 空 气 作 参 比 ,扫 描 次 数 6 4 次 ,为 减 小 光谱数据的测量误差 ,每个最终的光谱值 ,其谱图如图 1 所示 。
1 - ( 犓 犡T ( 犽) 犡( 犽) 犘 犡T ( 犽) +犛 犽 =犘 犽 犽 狕) ^ ^ ^ ) 犫 犫 犽+1 犽 1 =犫 犽 +犓 犽( 犽 1 - 犡( 犽) 狔 + +
( ) 7 ( ) 8
1 - ) ) ( ) 犘 犡T ( 犽+1 犛 犽+1 犘 9 犽 1 =犘 犽 +犛 狑 -犘 犽 狕 犡( 犽 + 以上方法可 求 出 模 型 参 数 犅 的 估 计 值 及 其 估 计 误 差 协
狀 式中 , 犃, 犅 和犆 为状态变换矩阵 ; 犽 是时间索引 ; 狓 犽 ∈犚 称 犿 为系统状态变 量 ; 是系统输 狌 犽 是 已 知 的 系 统 输 入; 犽 ∈犚 狔
出; 犛 狑 和犛 狕 分别为过程 噪 声 协 方 差 和 观 测 噪 声 协 方 差 ;字 母上的 ∧ 表示估计值 ;矩阵 犓 称为卡尔曼增益 ;矩 阵 犘 称 为 估计误差协方差 ,它表示估计误差的大小 。 1 2 系统方程的建立和滤波方法 近红外光谱分 析 中 ,ML R,P C R和P L S三种建模方法 有一个共同点 就 在 于 它 们 都 是 采 用 了 线 性 最 小 二 乘 拟 合 技 光谱数据 ) 和因变量 犢 ( 浓度或类别标签) 之 术 ,在自变量 犡( 间建立线性模型 ,方程如下 ( ) 犢 =犡 犅 +E r r o r 4 式中, 犡犿×狀 为样本的光谱数据 ,包括 犿 个样本 、 狀 个自变量 ; 犢犿×狆 为样本的性质数据 ,包 括 犿 个 样 本 、 犅 狀×狆 狆 个 因 变 量; 为模型的系数矩阵 ,为一 个 待 求 的 未 知 量 。 犅 的求解方法有 很多 ,这里利用卡尔曼滤波器不断优化模型系数矩阵 犅 狀×狆 及 其协方差矩阵 犘 狀×狀 ,直至满足要求 为 止 。描 述 优 化 过 程 所 用 系统方程如下 状态方程
方差犘。化合物的性质数据和光 谱 数 据 依 次 进 入 卡 尔 曼 滤 波 ^犽+1 ;估 计 值 的 估 计 误 ) 器 ,用式 ( 计算 犫 8 犽 的 下 一 个 估 计 值犫 ) 差协方差用式 ( 计 算 ,依 据 是 当 前 时 刻 的 光 谱 数 据 和 前 一 9 时刻的估计误差 协 方 差 ; 犓 犽 决定了当前时刻的观测数据对 当前时刻的系统状态估计值的影响程度 。 1 3 波长变量选择算法设计 / 这里所用的特征波长变量 选 择 的 准 则 是 犅 犘 ,即 模 型 槡 参数的估计值 犅 与其估 计 误 差 标 准 差 槡 犘 的 比 值 ,这 个 比 值 代表了波长变量对于构建模型的重要程 度 。一 个 比 值 对 应 一 个变量 ,若比值大则表示其对 应 的 波 长 变 量 对 模 型 重 要 ,应 该保留 ;否则 ,应该剔 除 。算 法 只 能 给 出 波 长 变 量 重 要 程 度 的排序 ,至于减少到何种程度 最 佳 ,则 要 根 据 模 型 的 校 验 结 果来确定最终参与建模的波长变量个数 。 算法的步骤如下 ( )计算 犅 和 犘 ; 1 ( )计算 犅 的估计误差标准差 ( 2 狊 犱) 犘; 狀×1 ,即计算 槡 )计算 ( / ( 3 犫 狊 犱) 狀×1 ; 由于选择不同波段建模结果可能有 所 不 同 ,为 了 建 立 稳 定 、可靠的校正模型 ,对样品信 息 较 强 的 光 谱 区 域 进 行 选 择 是十分必要 的 。这 里 选 取 几 个 不 同 特 征 吸 收 波 段 分 别 建 立
2 油脂酸价近红外光谱波长变量优选
2 1 油脂酸价近红外光谱分析 油脂酸价又称油脂酸值 ,是检验油脂 中 游 离 脂 肪 酸 含 量 多少的一项指标 ,以中和l g 油脂中的游离脂肪酸所需氢氧化 钾的毫克数表示 。通过测定油 脂 酸 价 ,可 以 评 定 食 用 油 脂 品 质的优劣 ,可以为油脂精炼提 供 所 需 加 碱 量 的 计 算 依 据 ,可 以判断油脂储藏期间品质变化情况 。利用 近 红 外 光 谱 分 析 技 术快速检测油脂酸价 ,对于实 现 油 脂 脱 酸 工 段 自 动 监 控 ,提 高产品质量 ,降低生产消耗和成本具有重要意义 。 本研究所用油脂样本均来自于油脂 加 工 企 业 ,直 接 从 油 脂脱酸生 产 线 上 采 集 大 豆 油 脂 样 本 5 0 个 ,按 国 标 法 ( G B