应用CARS和SPA算法对草莓SSC含量NIR光谱预测模型中变量及样本筛选

合集下载

CARS_SPA算法结合高光谱检测马铃薯还原糖含量_姜微

CARS_SPA算法结合高光谱检测马铃薯还原糖含量_姜微
高光谱成像技术可获取被测对象光谱信息和 波长图像信息。该技术检测马铃薯内外部品质研究 已有报道。Dacal-Nieto 等应用高光谱成像技术无损 检测马铃薯空心病[3]。Rady 等提出高光谱成像技术 快速检测马铃薯含糖量可行[4]。Jiang 等基于高光谱 成像技术检测马铃薯中淀粉含量,效果良好[5]。周竹 等应用高光谱图像系统、透射光谱系统和傅立叶变 换近红外光谱仪检测马铃薯黑心病,表明光谱检 测马铃薯黑心病,高光谱成像系统高于傅立叶变 换成像[6]。苏文浩等应用高光谱技术结合图像处理 方法检测马铃薯外部缺陷,表明正确识别率达 82.5% 。 [7] 周竹等应用高光谱技术检测马铃薯干物 质含量[8]。吴辰等应用高光谱成像技术快速检测马 铃薯淀粉含量取得较好效果,验证模型相关系数 和均方根误差分别为 0.982 和 0.249[9]。金瑞等基于 高光谱图像和光谱信息融合技术可同时识别马铃薯 多种缺陷指标,混合识别率达 96.58%[10]。由于高光 谱具有较高分辨率,导致大量冗余信息存在于原始 光谱信息中。因此,利用高光谱数据定量分析前压 缩光谱信息尤为必要。
图像;Id-黑色图像。
1.4 数据预处理
为减弱或消除基线漂移、散射等非目标因素
对光谱影响,对高光谱成像仪采集光谱预处理 。 [13]
分别对原始光谱采用平滑 13 点、最大值归一化、基
线校正、正交信号校正和标准化等预处理,并依次
比较原始光谱和预处理后光谱对定标模型影响,以
系数最大、均方根误差最小原则,确定预处理方
共制备 238 个样本,比色法测定马铃薯还原糖含量,选择 190 个样本作校正集,48 个样本作验证集,与全光谱和经
典变量提取方法比较。结果表明,CARS-SPA 算法筛选波段效果最佳,相比于全谱建模其参与建模波长点由 203 个

基于近红外光谱结合波长优选检测单颗葡萄的SSC含量

基于近红外光谱结合波长优选检测单颗葡萄的SSC含量

基于近红外光谱结合波长优选检测单颗葡萄的SSC含量郭成;马月;梁梦醒;颜辉【摘要】采用无损检测测定单颗葡萄中可溶性固形物(SSC)含量,获得个体和群体信息,以期指导田间管理、葡萄储存条件设置及满足消费者对葡萄口味的不同需求.采用手持式NIR光谱仪在950~1 650 nm波长范围采集葡萄的近红外光谱,采用偏最小二乘(PLS)回归建立葡萄SSC预测模型.为了减少冗余无信息变量,增加模型的预测精度和稳定性,采用无信息变量消除法(UVE)、随机蛙算法(RF)筛选出与葡萄SSC含量相关的重要波长变量.结果表明:RF筛选建立的SSC预测模型优于全光谱PLS和UVE筛选建立的模型.RF-PLS模型的校正集、交叉验证及预测集的Rc2、Rcv2和Rp2分别为0.960 5,0.933 4,0.930 4,校正均方根误差(RMSEC),交叉验证均方根误差(RMSECV)和预测均方根误差(RMSEP)分别为0.638 2,0.829 9,0.868 8.表明通过波长优选后的,基于便携式近红外光谱在预测单颗葡萄SSC含量的应用上完全可行,有较高的预测精度.【期刊名称】《食品与机械》【年(卷),期】2016(032)009【总页数】5页(P39-43)【关键词】葡萄;可溶性固形物;近红外光谱;随机蛙算法;无信息变量消除法【作者】郭成;马月;梁梦醒;颜辉【作者单位】江苏科技大学生物技术学院,江苏镇江212000;江苏科技大学生物技术学院,江苏镇江212000;江苏科技大学生物技术学院,江苏镇江212000;江苏科技大学生物技术学院,江苏镇江212000【正文语种】中文据统计[1],2014年中国葡萄总产量达1 254.6 万t,如此多的产量,需要有效的田间与采后管理。

葡萄为葡萄科葡萄属木质藤本植物,是世界性的水果。

葡萄中的可溶性固形物含量(Soluble Solids Content,SSC)是衡量葡萄品质的重要指标之一。

近红外高光谱图像结合CA RS算法对鸭梨SSC含量定量测定

近红外高光谱图像结合CA RS算法对鸭梨SSC含量定量测定

近红外高光谱图像结合CA RS算法对鸭梨SSC含量定量测定李江波;彭彦昆;陈立平;黄文倩【期刊名称】《光谱学与光谱分析》【年(卷),期】2014(000)005【摘要】The present study proposed competitive adaptive reweighted sampling (CARS) algorithm to be used to select the key variables from near-infrared hyperspectral imaging data of “Ya” pear .The performance of the developed model was evaluated in terms of the coefficient of determination (r2 ) ,and the root mean square error of prediction (RMSEP) and the ratio (RPD) of standard deviation of the validation set to standard error of prediction were used to evaluate the performance of proposed model in the prediction process .The selected key variables were used to build the PLS model ,called CARS-PLS model .Comparing re-sults obtained from CARS-PLS model and results obtained from full spectra PLS ,it was found that the better results (r2pre =0.908 2 ,RMSEP=0.312 0 andRPD=3.300 5) were obtained by CARS-PLS model based on only 15.6% information of full spectra .Moreover ,performance of CARS-PLS model was also compared with PLS models built by using variables got by Monte Carlo-uninformative variable elimination (MC-UVE) and genetic algorithms (GA) method .The result found that CARS variable selection algorithm not only can remove the uninformative variables in spectra ,but also can reduce the collinear variables from in-formative variables .Therefore ,thismethod can be used to select the key variables of near-infrared hyperspectral imaging data . This study showed that near-infrared hyperspectral imaging technology combined with CARS-PLS model can quantitatively pre-dict the soluble solids content (SSC) in“Ya” pear .The results presented from this study can provide a reference for predicting other fruits quality by using the near-infrared hyperspectral imaging .%高光谱数据量大、维数高且原始光谱噪声明显、散射严重等特征导致光谱建模时关键波长变量提取困难。

基于CARS算法的脐橙可溶性固形物近红外在线检测

基于CARS算法的脐橙可溶性固形物近红外在线检测

基于CARS算法的脐橙可溶性固形物近红外在线检测刘燕德;施宇;蔡丽君;周延睿【摘要】采用可见/近红外光谱在线检测装置进行赣南脐橙可溶性固形物含量在线检测模型优化研究.样品以5个/s的速度运动,采集可见/近红外漫透射光谱.光谱经过预处理后,分别应用向后区间偏最小二乘法(BiPLS)、遗传算法(GA)和正自适应加权算法(CARS)筛选特征变量,并通过外部验证评价PLS模型预测能力.一阶微分处理后经CARS筛选特征变量建立的PLS模型预测结果最优,预测相关系数和预测均方根误差分别为0.94和0.42%.结果表明CARS算法可有效简化赣南脐橙可溶性固形物可见/近红外光谱在线检测模型并提高模型的预测精度.【期刊名称】《农业机械学报》【年(卷),期】2013(044)009【总页数】7页(P138-144)【关键词】赣南脐橙;近红外光谱;在线检测;CARS变量筛选法【作者】刘燕德;施宇;蔡丽君;周延睿【作者单位】华东交通大学机电工程学院,南昌330013;华东交通大学机电工程学院,南昌330013;华东交通大学机电工程学院,南昌330013;华东交通大学机电工程学院,南昌330013【正文语种】中文【中图分类】O657.33;S666.4引言可溶性固形物含量(Soluble solids content,SSC)是评价赣南脐橙品质的重要指标[1]。

近红外光谱技术因其无损、高效、样品无需前处理等优点,被广泛用于水果品质检测。

传统的破坏式可溶性固形物检测方法因制样繁琐、检测时间长等问题,难以满足大批量水果在线检测与分级的需求。

现代近红外光谱技术具有速度快、不破坏样品、操作简单、稳定性好、效率高等特点,适于水果品质的在线检测分析[2~5],国内外众多专家已开始利用近红外光谱进行水果的品质自动化在线分选技术研究[6~13]。

近红外光谱反映了被检测物的基本特征信息,但同时也受到许多非目标信息的干扰,导致近红外光谱建模受到无关变量的干扰,降低模型预测能力和稳定性。

基于CARS-PLS的食用油脂肪酸近红外定量分析模型优化

基于CARS-PLS的食用油脂肪酸近红外定量分析模型优化

基于CARS-PLS的食用油脂肪酸近红外定量分析模型优化吴静珠;徐云【期刊名称】《农业机械学报》【年(卷),期】2011(042)010【总页数】5页(P162-166)【作者】吴静珠;徐云【作者单位】;【正文语种】中文引言我国居民食用植物油主要有大豆油、菜籽油、花生油、葵花籽油、橄榄油和芝麻油等。

植物油中常见的高级脂肪酸主要有棕榈酸、硬脂酸、油酸和亚油酸等。

不同植物油的脂肪酸组成有很大差异,因此其功效和营养价值也随之不同。

随着营养学研究发展,人们对植物油中脂肪酸认识不断提高。

中国营养学会也推荐膳食中必需脂肪酸摄入理想比值,市场上也出现大量调和油,为了评估食用植物油营养价值,研究分析常用食用植物油中脂肪酸组成是很有必要的。

近红外分析技术是利用近红外谱区包含的物质信息,用于有机物质定性和定量分析的一种分析技术。

该方法具有快速、高效、无污染、无需前处理、无损分析及多组分同时测定等优点[1~2]。

国内外已有将近红外技术应用于油脂检测的研究报道[3~5]。

提高模型预测能力始终是近红外分析中的研究热点和难点问题。

有研究报道,有效地变量筛选不仅可以简化模型,更主要的是可以剔除不相关变量,建立更好的校正模型,从而加强模型预测能力与稳健性[6]。

目前,在近红外分析中,常用的波长变量选择方法主要有相关系数法、方差分析法、无信息变量消除法、遗传算法、移动窗口偏最小二乘回归法等[6~7]。

CARS(competitive adaptive reweighted sampling)是近年来提出的一种新的变量选择方法[8]。

此算法能够在一定程度上克服变量选择中的组合爆炸问题,筛选出优化的变量子集,提高模型的预测能力和降低预测方差[9]。

本文拟采用红外光谱技术,建立食用油中4种主要脂肪酸(棕榈酸、硬脂酸、油酸和亚油酸)定量分析模型,通过CARS挑选特征波长变量优化模型,提升脂肪酸近红外模型的预测能力。

1 CARS变量筛选法近红外光谱通常由大量数据点构成,建模时波长点数远大于样本数,且光谱的共线性非常严重。

LS-SVM和BP-ANN在草莓糖度NIR检测中的应用

LS-SVM和BP-ANN在草莓糖度NIR检测中的应用

以去 除无 用信 息 , 使用 P L S降 维 提 取 的潜 在 变量 ( L a —
t e n t V a r i a b l e s , L V s ) 作为 L S — S V M或 B P — A N N模 型 的 输 入 变量 , 已分 别 应 用 于 红 葡 萄 匀 浆 中 总 花 青 素 含 量、 油菜 叶 片蛋 白质 含量 及 猕 猴桃 中维 生 素 C含 量 的 近红 外 检测 中 , 并取 得 了较 好 的建模 结果 。 为观 察不 同算 法 对草 莓糖 度 近红 外检 测模 型性 能
1 实 验 材 料 和 方 法
1 . 1 实 验材 料
步 的改 善 , 以适 应 仪器 开 发 的精度 需 要 。
最 小二 乘支 持 向量 机 ( L e a s t S q u a r e s — S u p p o  ̄V e c —
为使 所 建模 型具 有 较 强 的实 用 性 和 扩 展 性 , 本 实
中图 分 类 号 :0 6 5 7 . 3 3; T S 2 0 7 . 31 8 8 X( 2 0 1 3) 0 5 — 0 2 0 4 — 0 4
0 引言
糖度( 即可 溶 性 固形 物 S o l u b l e S o l i d C o n t e n t , S S C ) 是 为消 费者 和食 品工业 所 公 认 的评 价 草 莓 风 味 和成 熟 程 度 的重要 品质 指 标 之 一 l 】 J 。 目前 , 检 测 草 莓 糖 度
检测 草 莓糖 度方 面确 实 存 在 很 大 的潜 力 , 但 研 究所 使 用 的建 模算 法 多 为传 统 的线 性 算 法 , 如偏 最 4 ' -  ̄乘 法
( P a r t i a l L e a s t S q u a r e s , P L S ) 等, 难 以 应 对 光 谱 和 浓 度 数据 的非线 性 情况 , 模 型 的精 度 和预 测 性 能 仍 需 进 一

基于最小二乘支持向量机的辣椒可溶性固形物和维生素C含量近红外光谱检测

基于最小二乘支持向量机的辣椒可溶性固形物和维生素C含量近红外光谱检测

基于最小二乘支持向量机的辣椒可溶性固形物和维生素C含量近红外光谱检测刘燕德;周延睿;潘圆媛【摘要】应用傅里叶变换近红外光谱技术实现了鲜辣椒中可溶性固形物(SSC)和维生素C(Vc)含量的快速无损检测.分别采用7种预处理方法对原始光谱进行处理后,建立了SSC和Vc预测的偏最小二乘法(PLS)模型.将利用最小二乘法(PLS)提取的主成分(PC)和蒙特卡罗无信息变量消除法(MC-UVE)提取的有效波长作为最小二乘支持向量机(LSSVM)的输入变量,分别建立了PC-LS-SVM和MC-UVE-LS-SVM模型,并与MC-UVE-PLS模型进行了比较.采用优化后的模型对27个预测集未知样品进行了预测.结果表明,对鲜辣椒中SSC含量预测最优的为MC-UVE-PLS模型,其预测集相关系数(rp)为0.971,预测集均方根误差(RMSEP)为0.382°Brix;对鲜辣椒中Vc 含量预测最优的为MCUVE-LS-SVM模型,其rp为0.899,RMSEP为21.022 mg 100 g.研究结果表明:鲜辣椒中SSC和Vc的含量与近红外光谱具有显著的相关性.【期刊名称】《光学精密工程》【年(卷),期】2014(022)002【总页数】8页(P281-288)【关键词】近红外光谱;最小二乘支持向量机;鲜辣椒;可溶性固形物;维生素C【作者】刘燕德;周延睿;潘圆媛【作者单位】华东交通大学机电工程学院,江西南昌330013;华东交通大学机电工程学院,江西南昌330013;华东交通大学机电工程学院,江西南昌330013【正文语种】中文【中图分类】O657.33;S1231 引言辣椒是我国仅次于大白菜的第二大蔬菜作物,它营养丰富,含有大量的辣椒素、辣椒红素、胡萝卜素、碳水化合物、矿物质等,尤其是维生素C(Vc)的含量更是高居各类蔬菜的榜首,既可鲜食、调味,也可入药,具有重要的经济价值和食疗保健作用[1-3]。

可溶性固形物(Soluble Solids Content,SSC)和维生素C(Vc)的含量测定是目前育种、农产品加工和食品营养研究中的基础问题之一。

随机森林算法的水果糖分近红外光谱测量

随机森林算法的水果糖分近红外光谱测量

随机森林算法的水果糖分近红外光谱测量李盛芳;贾敏智;董大明【摘要】近年来,有关水果糖分等内部品质的近红外光谱测量方法研究很多,并有部分商业化仪器问世.但由于近红外光谱复杂多变,模型的传递性较差,往往所建模型只能针对特定品种甚至特定产地的水果.随机森林(RF)是一种基于决策树的集成算法,通过对分类回归树(CART)模型的集成来提高预测精度.相对于偏最小二乘法(PLS),多元线型回归法(MLR)等方法,随机森林回归方法对非线性数据的解析能力较强.考虑到RF模型的随机性,通过调试决策树数量(ntree)和分裂变量数目(mtry)等变量来进行模型优选.尝试使用随机森林对不同种类的水果(苹果、梨)糖分进行预测.实验表明,对于同一种类的水果,随机森林和PLS的建模和预测结果均较好.但对于不同种类的水果,随机森林明显增加了模型的预测能力,将建模R2由PLS的0.878提高到了0.999,将建模的RMSEC由0.453降低到了0.015.经过独立的预测集样品对最优RF模型进行检验,预测R2由PLS的0.731提高到为0.888,预测RMSEP由1.148降低到0.334.随机森林在对多种水果糖分预测时,具有明显的优势.这一研究证明了随机森林有望应用于多种水果糖分的近红外光谱测定,进而解决模型的普适性和传递性问题.%In recent years ,many researchers have studied the measurement methods of fruit sugar and other internal quality by near-infrared (NIR) spectroscopy and some commercial instruments have been produced.However ,due to the complexity of the NIR spectra ,the transitivity of the models established with NIR is often poorly performed.The model is only built for a particu-lar species or even a certain variety.Random forest (RF) is an integrated algorithm based on decision tree ,which improves the prediction accuracy by integrating theclassification regression tree (CART) pared with partial least squares (PLS) , multiple linear regression (MLR) and other methods ,RF algorithm has the strong analytical ability of nonlinear data.Taking in-to account the randomness of the RF model ,the model is optimized by debugging the number of decision tree (ntree) and the number of split variables (mtry).In this study ,we used RF to predict the sugar content in different types of fruits (apple and pear).Experimental results showed that for the same kind of fruit ,the modeling and predicting results of RF and PLS were bet-ter.However ,for different types of fruits ,RF significantly increased the prediction ability of the model.The R2 of PLS model was 0.878 and the R2 of RF model was increased to 0.999.The RMSEC of PLS model and RF model were respectively 0.453 and 0.015.In addition ,the optimal RF model was tested by independent test set samples ,the R2 of PLS model was 0.731 and the R2 of RF model was increased to 0.888.The RMSEC of PLS model and RF model were respectively 1.148 and 0.334.RF showed a significant advantage in predicting a variety of fruit sugar.This research proved that the RF method could be applied to detect the sugar content in fruits by NIR spectroscopy ,thus solving the model problem of universality and transitivity.【期刊名称】《光谱学与光谱分析》【年(卷),期】2018(038)006【总页数】6页(P1766-1771)【关键词】近红外;随机森林;苹果糖分;快速检测【作者】李盛芳;贾敏智;董大明【作者单位】太原理工大学 ,山西太原 030024;北京农业智能装备技术研究中心 ,北京 100097;太原理工大学 ,山西太原 030024;北京农业智能装备技术研究中心 ,北京 100097;国家农业智能装备工程技术研究中心 ,北京 100097【正文语种】中文【中图分类】TP181引言苹果和梨是人们非常喜爱的水果,其糖分含量直接影响其口感。

LS-SVM和BP-ANN在草莓糖度NIR检测中的应用

LS-SVM和BP-ANN在草莓糖度NIR检测中的应用

LS-SVM和BP-ANN在草莓糖度NIR检测中的应用牛晓颖;赵志磊;张晓瑜【期刊名称】《农机化研究》【年(卷),期】2013(035)005【摘要】为了提高草莓糖度近红外光谱定量模型的性能,采用偏最小二乘法提取的潜在变量作为最小二乘-支持向量机和反向传播人工神经网络的输入变量,建立了草莓糖度的近红外定量模型,并与偏最小二乘模型结果进行了比较,建模所使用的光谱范围为6 000~9 000 cm-1.结果表明,所建立的最小二乘-支持向量机和反向传播人工神经网络定量模型的校正性能、预测性能和稳定性均优于偏最小二乘定量模型,最优模型为前10个潜在变量得分作为输入变量的最小二乘-支持向量机模型,其校正和预测相关系数分别为0.957和0.951,校正和预测均方根误差分别为0.279%和0.272%,剩余预测偏差为3.23,与以往研究文献相比,获得了较为理想的预测精度和稳定性能.【总页数】4页(P204-207)【作者】牛晓颖;赵志磊;张晓瑜【作者单位】河北大学质量技术监督学院,河北保定071002;河北大学质量技术监督学院,河北保定071002;河北大学质量技术监督学院,河北保定071002【正文语种】中文【中图分类】O657.33;TS207.3【相关文献】1.便携式糖度无损检测仪在甜瓜糖度检测中的应用 [J], 张立虎;李冠;张自强;王贤磊;宁雪飞;闫伟丽2.近红外光谱技术(NIRS)在检测牧草霉菌毒素中的应用 [J], 许庆方;韩建国;玉柱;岳文斌3.近红外光谱技术(NIRS)在干草品质检测中的研究与应用 [J], 丁武蓉;干友民;郭旭生;杨富裕4.NIRS技术无损检测组织氧含量在运动实践中的应用 [J], 马国东5.近红外光谱技术(NIRS)及其在牧草品质检测中的应用 [J], 胡超;白史且;张玉;陈智华因版权原因,仅展示原文概要,查看原文内容请购买。

应用近红外光谱和化学计量法测定甜玉米种子活力

应用近红外光谱和化学计量法测定甜玉米种子活力

应用近红外光谱和化学计量法测定甜玉米种子活力作者:赵冰,王爱文,赵华来源:《南方农业学报》2022年第07期摘要:【目的】建立一种利用近红外光谱和化学计量学检测甜玉米种子活力指数的方法,为种子批量无损筛选提供新方法。

【方法】在反射和透射模式下分别收集甜玉米种子的近红外光谱,采用主成分分析和蒙特卡罗交叉验证方法对异常值进行识别与剔除;选取最合适的预处理方法和变量选择方法,建立并选取最优偏最小二乘法预测模型。

【结果】对于漫反射活力指数定量分析模型,采用532份样品进行建模研究,其最佳预处理方法为多项式平滑导数(Savitzky-Golay derivative,SG)+均值中心化(Mean Center,MC),最佳变量选择方法为竞争自适应重加权抽样(Competitive adaptive reweighted sampling,CARS),其模型的性能参数校正相关系数(Rc)、交互验证相关系数(Rcv)、预测相关系数(Rp)、校正均方根误差(RMSEC)、交互验证均方根误差(RMSECV)和预测均方根误差(RMSEP)分别为0.826、0.783、0.663、0.137、0.151和0.199。

对于透射活力指数定量分析模型,采用415份样品进行研究,其最佳预处理方法为SG一阶导数平滑,最佳变量选择方法为相关系数法(Correlation coefficients,CC),模型的性能参数Rc、Rcv、Rp、RMSEC、RMSECV和RMSEP分别为0.783、0.680、0.728、0.121、0.142和0.133,该模型不存在过拟合现象,说明光谱采集的透射模型可能更适合测定种子活力指数。

【结论】透射光谱可获得更多有关甜玉米种子活力的信息,透射模块是光谱采集预测种子活力的较好方法。

关键词:甜玉米;种子活力;近红外光谱;化学计量学中图分类号: S513 文献标志码: A 文章编号:2095-1191(2022)07-1875-08Determination of sweet corn seed vigor by near infraredspectra and chemometricsZHAO Bing1,2, WANG Ai-wen3*, ZHAO Hua1*(1National S&T Innovation Center for Modern Agricultural Industry(Guangzhou)/Key Laboratory of South China Modern Biological Seed Industry, Ministry of Agriculture and Rural Affairs, Guangzhou, Guangdong 510520, China;2 School of Pharmaceutical Sciences, Shandong University, Jinan, Shandong 250012,China;3 Zhangye Academy of Agricultural Sciences, Zhangye, Gansu 734000,China)Abstract:【Objective】To develop a new method to measure sweet corn seed vigor by near infrared (NIR) spectroscopy and chemometrics,so as to provide a new method for seed screening in the seed industry. 【Method】Near infrared spectra of sweet corn seed under reflection and transmission modes were recorded. Then outliers were identified and eliminated by principal component analysis(PCA) and Monte Carlo cross validation methods. The proper preprocessing methods and variables selection methods were applied to establish and select the partial least squares (PLS) prediction model. 【Result】For the vitality index quantitative analysis model of diffuse reflection,a total of 532 samples were used for modeling study. The best preprocessing method was Savitzky-Golay derivative(SG)+Mean Center(MC),and the optimal variable selection method was competitive adaptive reweighted sampling(CARS). The correction correlation coefficient (Rc),cross validation correlation coefficient(Rcv),prediction correlation coefficient (Rp),root mean square error of correction(RMSEC),root mean square error of crossvalidation(RMSECV) and root mean square error of prediction(RMSEP) of the model were 0.826,0.783,0.663,0.137,0.151 and 0.199,respectively. For the vitality index quantitative analysis model of transmission,a total of 415 samples were used for modeling study. And the best preprocessing method was SG first derivative smoothing method, and the optimal variable selection method was correlation coefficients(CC). The model performance parameters Rc,Rcv,Rp,RMSEC,RMSECV and RMSEP were 0.783,0.680,0.728,0.121,0.142 and 0.133,respectively,there was no over-fitting in this model,indicating that the transmission model of spectral acquisition might be more suitable for the determination of seed vigor index. 【Conclusion】More information about sweet corn seed vigor can be obtained through transmission spectrum,and transmission module is a better method for spectral acquisition and prediction of seed vigor.Key words: sweet corn; seed vigor; near infrared spectroscopy; chemometricsFoundation items: Key Laboratory Project of Modern Biological Seed Industry in South China of Ministry of Agriculture and Rural Affairs(2105-000000-20-03-457451);Special Project of Guangdong Rural Revitalization Strategy(2021KJ382)0 引言【研究意义】甜玉米是普通玉米种子的淀粉合成基因突变形成的玉米变异类型,其种子活力普遍较低,但资源间存在明显的遗传变异,实现对育种材料种子活力进行快速、准确、简便、有效地检测,筛选高活力种质育种,可有效提高甜玉米育种效率(李武等,2018)。

冷藏过程中樱桃Vc含量的近红外检测朗农樱桃资料

冷藏过程中樱桃Vc含量的近红外检测朗农樱桃资料
摘 要:以沙蜜豆樱桃为材料,研究近红外光谱在樱桃冷藏过程中 Vc 模型建立等的相关问题。 实验在全光谱(408.8~2 492.8 nm) 范围内,采用 Vc 作为评价指标,对校正模型的不同预处理进行讨论。 研究发现,最优预处理是二阶导数下的改进偏最小二乘法 (MPLS)结合标准正常处理(SNV only)。 校正误差 SEC 为 0.2583,校正相关性系数 R2cv 为 0.8779,预测相对分析误差 RPD 为 3.3。 结 果表明,近红外光谱技术对樱桃冷藏过程中 Vc 含量的检测具有可行性。 关键词: Vc;樱桃;近红外光谱;冷藏
网络出版时间:2015-04-07 09:24 网络出版地址:/kcms/detail/11.1802.TS.20150407.0924.014.html
冷藏过程中樱桃 Vc 含量的近红外检测
罗枫1 鲁晓翔 1,* 张鹏 2 陈绍慧 2 李江阔 2
1(天津商业大学生物技术与食品科学学院,天津市食品生物技术重点实验室,天津 300134) 2(国家农产品保鲜工程技术研究中心,天津市农产品采后生理与贮藏保鲜重点实验室,天津 3
式中:C—测定用样液中Vc的含量(mg) V1—测定用样液体积(mL); W—样品质量(mg); V2—样液定容总体积(mL)。
1.4 数据的处理 利用近红外光谱进行某种成分含量的预测时,最主要的是在采集的样本光谱和测得的成分含量之间建立 相关模型。 将实验样本分成校正集和预测集两部分,随机选取校正集 90 个数据,验证集 30 个数据,进行处理。 利 用仪器自带的分析软件建立测定光谱与 Vc 含量之间的相关关系[12]。 预测模型通过 Vc 的实测值与预测值的相 关系数 R2cv、 校正误差(square error of calibration,SEC)及预测误差(square error of validation,SEP)进行定量评价。 一个好的模型应该具有较高的 R2cv 值,较低的 SEC 和 SEP 值,SEC 和 SEP 差异越小越好。 校正相对分析误差 RPD(RPD=SD/SECV),可用来检验模型的适用能力。 当 RPD 在 2~2.5 之间,可进行粗略的定量分析,当 RPD 值大 于 2.5 或 3.0 以上时,说明该模型具有很好的预测效果[13]。

草莓固体可溶物的近红外光谱信息统计分析

草莓固体可溶物的近红外光谱信息统计分析

草莓固体可溶物的近红外光谱信息统计分析本文旨在介绍草莓固体可溶性物质的近红外(NIR)光谱信息统计分析的研究进展。

首先,介绍了近红外光谱信息统计分析技术,特别是与草莓固体可溶性物质相关的研究。

其次,介绍了近几年在草莓固体可溶性物质的近红外光谱信息统计分析方面的最新研究进展,并对未来研究的发展前景做出了展望。

近红外光谱信息统计分析是利用近红外光谱技术对各种类型物质进行信息统计和分析的一项研究方法。

它基于电磁辐射在物质中的传播,采用多组仪器检测所研究物质的传播谱,并用计算机程序解析、分析和计算检测结果。

它可以提供准确的物质信息,并能够精准测定物质的成分和水分含量。

近年来,随着计算机技术的进步和近红外技术的发展,近红外光谱信息统计分析技术已成为一种广泛应用的分析技术。

草莓具有独特的果实风味,其固体可溶性物质具有多样性。

近红外光谱信息统计分析技术可以有效地监测草莓的各种固体可溶性物质的变化,从而更好地控制草莓的品质。

目前,已有多种研究以近红外光谱信息统计分析技术研究草莓的固体可溶性物质的变化,以更好地控制草莓的品质。

例如,繁殖者和研究者已经使用近红外光谱信息统计分析技术,比较不同品种草莓中不同成分的差异,实现品种鉴定;使用近红外光谱信息统计分析技术,分解草莓特征成分;更进一步,研究者可以利用近红外光谱信息统计分析技术,监测草莓固体可溶性物质,并且建立草莓品质评价模型,以此实现草莓品质的检测和预测。

随着大数据和人工智能技术的发展,对草莓固体可溶性物质的近红外光谱信息统计分析的研究也进一步深化和完善,并取得了良好的研究成果。

预计,在未来的研究中,近红外光谱技术将为草莓品质检测和预测提供更多可靠的信息支撑,从而为草莓生产管理提供强力技术支撑。

综上所述,在近几年中,草莓固体可溶性物质的近红外光谱信息统计分析已经有了一定的进展,并取得了积极的研究成果。

未来的研究将深入挖掘近红外光谱信息统计分析技术,进一步推动草莓品质检测和预测,从而为草莓生产提供技术支持。

资料_基于LS-SVM的草莓固酸比和可滴定酸近红外光谱定量模型

资料_基于LS-SVM的草莓固酸比和可滴定酸近红外光谱定量模型

第29卷增刊1农业工程学报V ol.29Supp.1 2013年4月Transactions of the Chinese Society of Agricultural Engineering Apr.2013270基于LS-SVM的草莓固酸比和可滴定酸近红外光谱定量模型牛晓颖1,周玉宏2,邵利敏2(1.河北大学质量技术监督学院,保定071002; 2.河北农业大学机电工程学院,保定071001)摘要:为提高草莓固酸比和可滴定酸近红外光谱定量模型的性能,该文采用偏最小二乘法提取的潜在变量作为最小二乘-支持向量机模型的输入变量,建立了两指标的近红外定量模型,并与偏最小二乘模型结果进行了比较,建模所使用的光谱范围为6000~12500cm-1。

结果表明,草莓可滴定酸和固酸比偏最小二乘模型校正相关系数、校正和预测均方根误差分别为0.430、0.096%、0.096%及0.688、0.926和1.190,而两指标的前10个潜在变量得分作为输入变量的最小二乘—支持向量机模型各项性能均远优于偏最小二乘模型,其校正和预测相关系数、校正和预测均方根误差以及剩余预测偏差分别为:可滴定酸0.965、0.967、0.028%、0.027%、3.881;固酸比0.980、0.973、0.258、0.373、3.111。

研究表明,潜在变量作为最小二乘支持向量机模型的输入变量可在较大程度上改善草莓可滴定酸和固酸比指标近红外定量模型的预测性能和稳定性。

关键词:近红外,模型,支持向量机,最小二乘法,草莓,固酸比,可滴定酸,潜在变量doi:10.3969/j.issn.1002-6819.2013.z1.042中图分类号:O657.33;TS207.3文献标志码:A文章编号:1002-6819(2013)-Supp.1-0270-05牛晓颖,周玉宏,邵利敏.基于LS-SVM的草莓固酸比和可滴定酸近红外光谱定量模型[J].农业工程学报,2013,29(增刊1):270-274.Niu Xiaoying,Zhou Yuhong,Shao Limin.Improved NIR quantitative model of soluble solids titratable acid ratio and titratable acidity in strawberry based on LS-SVM[J].Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE),2013,29(Supp.1):270-274.(in Chinese with English abstract)0引言水果中的酸含量对其风味有很大影响。

基于近红外特征变量筛选对火麻油掺杂的快速检测

基于近红外特征变量筛选对火麻油掺杂的快速检测

基于近红外特征变量筛选对火麻油掺杂的快速检测李颖;陈元胜;吕靓;汪少芸;王武;付才力【摘要】利用近红外光谱技术对掺杂了大豆油、花生油、葵花籽油和玉米油的火麻油进行鉴定,结合偏最小二乘法(PLS)和最小二乘支持向量机(LS-SVM)模型建立定量分析,并利用连续投影算法(SPA)和竞争自适应重加权采样算法(CARS)提取特征变量.结果表明:LS-SVM回归模型的准确度优于PLS模型,其预测相关系数R2p 分别达到0.950 4、0.905 8、0.857 4和0.767 3;SPA和CARS是两种有效的特征变量选择算法,能够提高模型的准确性,并且CARS效果优于SPA;其中,LS-SVM-CARS模型的R2p分别达到0.982 1、0.907 5、0.958 7和0.924 9.因此,在油脂掺杂快速检测中,LS-SVM-CARS是一个准确度高、变量数少、传递性较强的定量分析模型.【期刊名称】《福州大学学报(自然科学版)》【年(卷),期】2018(046)004【总页数】6页(P574-579)【关键词】近红外;特征变量;最小二乘支持向量机;连续投影法;竞争自适应重加权采样算法【作者】李颖;陈元胜;吕靓;汪少芸;王武;付才力【作者单位】福州大学生物科学与工程学院,福建福州350116;福州大学生物科学与工程学院,福建福州350116;福州大学生物科学与工程学院,福建福州350116;福州大学生物科学与工程学院,福建福州350116;福州大学电气工程与自动化学院,福建福州350116;福建省医疗器械和医药技术重点实验室,福建福州350002;福州大学生物科学与工程学院,福建福州350116【正文语种】中文【中图分类】O657.3;TP2160 引言火麻(Cannabis sativa L.)含有丰富的蛋白质、碳水化合物、油类以及各种矿物质, 其主要功能成分火麻油又称“长寿油”.火麻油中多不饱和脂肪酸含量高达76%~82%, 尤其是富含α-亚麻酸和γ-亚油酸,是昂贵的健康型食用油和高档化妆品基料[1-2].长期食用火麻油不仅补充人体所需的不饱和脂肪酸、卵磷脂、维生素及钙、铁矿物, 而且火麻油具有抗肿瘤、抗衰老和降低胆固醇和高血压等功效[3].目前, 市场上销售的食用油品质不一, 为降低生产成本、提高销售利润, 通过低附加值的油料以次充好是不良商贩获利的主要手段.常用的掺杂物质是价格较低的大豆油、花生油、玉米油以及葵花籽油等, 这不仅大大降低油脂的营养价值, 并且损害企业和消费者的权益.因此, 对高附加值油料的掺杂进行定量检测显得尤为重要.常用油脂掺假检测方法主要包括气相色谱法、高效液相色谱法、原子吸收光谱法和质谱法等, 测定准确度较高, 但存在样品需预处理、耗时长、操作复杂等不足.近红外光谱(near infrared spectrum, NIRs)主要检测有机物中含氢基团(—CH, —OH, —NH, —SH)在近红外光照射下分子振动组合频与倍频的吸收, 具有快速、高效、无损等优点.近年来, 近红外光谱已在鉴别食品掺杂问题上得到广泛应用, 如有效分析橄榄油、芝麻油、山茶油、核桃油等油品的掺假情况[4-6].由于近红外仪器的高分辨率, 光谱变量含有大量冗余信息, 不仅降低模型准确性和传递的稳定性, 而且增加仪器的成本.从近红外光谱中含有的大量光谱变量中提取特征变量, 有利于提高分析模型的传递性、稳定性、准确性, 更有利于近红外便携专用检测仪开发.本研究利用NIRs对掺杂大豆油、花生油、葵花籽油和玉米油的火麻油进行鉴定, 通过偏最小二乘法(PLS)回归模型和最小二乘支持向量机(LS-SVM)模型建立定量分析, 结合连续投影算法(SPA)和竞争自适应重加权采样算法(CARS)提取光谱的特征变量, 简化预测模型, 为油脂掺杂提供一种快速检测的定量分析模型.1 实验部分1.1 样品制备实验所用火麻油由江苏苏州八马饮品有限公司提供, 为鲜榨纯火麻油.玉米油、花油、大豆油和葵花籽油购于福州永辉超市.实验配制一系列掺有玉米油、大豆油、葵花籽油和花生油的火麻油样品, 总体积均为200 mL, 掺入各类油品的体积分别为5、 10、 15、 20、 25、 30、 35、 40、 45、 50、 55、 60、 65、 70、 75、80、 85、 90、 95、 100、 110、 120、 130、 140、 150、 160、 170、180、 190、 200 mL, 充分振荡摇匀.每个样品平行3次, 依次扫描光谱, 并随机划分校正集和预测集.1.2 光谱数据的采集采用配有高灵敏度InGaAs检测器、积分球采样系统以及内置自动金箔背景采集方式的ANTARISⅡ型傅里叶变换近红外光谱分析仪(德国Thermo公司)采集样品光谱集合.光谱分辨率为8 cm-1, 扫描波段范围为4 000~10 000 cm-1, 平均扫描次数为32次.以空白采集作为测量背景, 用一次性滴管取适量火麻油样品置于比色管中, 设置仪器流程参数, 在室温25 ℃、空气湿度60%条件下测定火麻油样品的近红外图谱.每个样品采集3条光谱, 运用Matlab程序(R2016a)对所得样品的近红外光谱数据集合进行分析处理.1.3 模型建立及特征变量筛选偏最小二乘(PLS)回归是最常用的定量分析方法, 通过主成分分析与多元线性分析的有机结合, 实现回归建模和数据结构简化[7].支持向量机(SVM)是一种有监督的学习模型, 主要根据统计学习理论中的VC维理论和结构风险最小原理构建, 通过利用有限的样本信息在模型复杂性和学习能力之间寻找最佳折中, 可适用于定性分类识别以及定量组分分析[8].最小二乘支持向量机(LS-SVM)是在PLS和SVM基础上构建的, 通过结合PLS和SVM的优势, 降低模型运行时的复杂程度, 同时提高LS-SVM 模型的泛化能力[9].在建模的过程中, 由于近红外光谱变量中含有大量冗余信息, 有效信息弱并且带有相关噪声, 不仅增加计算的复杂和模型的复杂度, 还影响模型的预测能力, 降低模型传递的准确性.当相关性不强的变量过多时, 从大量的光谱变量中提取出对建模有用的特征变量, 有利于增强模型的相关性, 提高分析模型的拟合效果以及模型的稳定性.研究分别采用连续投影算法(SPA)和竞争自适应重加权采样算法(CARS)提取近红外光谱的特征变量.SPA的原理是根据投影分析, 使光谱特征变量的共线性最小[10-11].CARS的原理是根据达尔文的适者生存, 将每个光谱变量作为一个个体, 根据自适应重加权采样技术搜寻最优变量组合, 算法具体流程参见文献[12-13].为更准确且直观地评价所建立的PLS回归模型的准确性、适用性以及稳定性, 采用校正均方根误差(root mean squared error of calibration, RMSEC)、预测均方根误差(root mean square errors of prediction, RMSEP)、校正相关系数(correlation coefficient of calibration, 预测相关系数(correlation coefficient of prediction, 作为模型的评价指标.2 结果与讨论2.1 光谱分析图1 火麻油样本的近红外光谱图Fig.1 NIR spectra of hemp seed oil采集掺杂大豆油、花生油、葵花籽油和玉米油的火麻油近红外光谱图, 如图1所示.其中, 脂肪烃C—H的一级倍频在5 800~6 000 cm-1附近, 二级倍频在8 200 cm-1附近, 脂肪酸O—H的一级倍频在6 800~7 050 cm-1附近[14], 从图1可以看出不同种类油品的原始光谱图相似度高.2.2 基于PLS模型的特征变量选择在原始光谱波段区间10 000~4 000 cm-1, 利用PLS建立模型, 采用留一交互检验法确定最佳因子数.掺杂大豆油、花生油、葵花籽油和玉米油的火麻油样品的最佳因子数分别是5、 5、 5和2, 在此基础上建立PLS模型, 如表1所示.从表1可以看出, 不同掺杂物的火麻油样品的回归精度不一样, 校正集精度普遍比预测集精度高, 其中掺杂大豆油的火麻油样品模型效果最佳,和RMSEP分别达到0.995 2、0.103 5、 0.926 7和0.356 1.但掺杂了花生油、葵花籽油和玉米油的火麻油样品的模型预测精度并不理想.为了消除冗余的特征变量, 提高模型的准确性, 利用SPA和CARS算法提取特征变量.表1 不同火麻油样品的PLS模型效果Tab.1 PLS model of hemp seed oil adulterated with different oil掺杂类型因子数校正集R2cRMSEC预测集R2pRMSEP大豆油50.99520.10350.92670.3561花生油50.97180.24390.73850.7331葵花籽油50.95550.30060.80090.5158玉米油20.77680.56620.62250.6498图2是大豆油样品利用SPA和CARS两种算法提取的特征变量, 从模型所含的变量数看, SPA和CARS提取的变量数目分别是29和5.其中, SPA-PLS模型提取的波数点分别是3 999、 4 003、 4 007、 4 011、 4 015、 4 018、 4 022、 4 026、 4 030、 4 034、 4 038、 4 045、 4 049、 4 057、 4 069、 4 076、 4 080、 4 084、 4 088、 4 099、 4 416、 4 427、 4 655、 5 272、 5 411、 5 689、 5 762、 5 816、 9 075 cm-1, CARS-PLS模型提取的波数点分别是4 015、4 153、 5 804、 5 839、 5 843 cm-1, 相比于原始光谱1 557个特征变量, 变量数均大大减少.并且, 从模型的精度上看(见表2), SPA-PLS模型和CARS-PLS模型的预测集和校正集精度均比原始的PLS模型高.同样的, 对于掺杂花生油、葵花籽油和玉米油的火麻油样品而言, 通过SPA和CARS算法提取特征变量后, 其模型精度有了显著提高, CARS-PLS模型的准确性高于SPA-PLS模型, 在该模型下, 花生油、葵花籽油和玉米油的和RMSEP分别达到0.953 3和0.338 5、 0.967 8和0.324 4、 0.910 0和0.388 7.图2 大豆油PLS回归模型提取的特征变量Fig.2 Selected variables for the PLS model of soybean oil表2 SPA和CARS特征提取火麻油样品的PLS模型效果Tab.2 PLS model of hemp seed oil based on SPA and CARS掺杂类型模型变量数校正集R2cRMSEC预测集R2pRMSEP大豆油PLS15570.99520.10350.92670.3561SPA-PLS290.99560.09960.95130.3004CARS-PLS50.99470.10830.97290.2425花生油PLS15570.97180.24390.73850.7331SPA-PLS290.93390.35770.90530.4309CARS-PLS70.94230.37710.95330.3385葵花籽油PLS15570.95550.30060.80090.5158SPA-PLS290.90700.41240.82460.6110CARS-PLS130.99720.07850.96780.3244玉米油PLS15570.77680.56620.62250.6498SPA-PLS290.91980.38810.90970.4785CARS-PLS50.93560.35370.91000.38872.3 基于LS-SVM模型的特征变量选择根据全区间10 000~4 000 cm-1近红外光谱建立的LS-SVM模型, 表3是掺杂大豆油、花生油、葵花籽油和玉米油的火麻油样品的LS-SVM模型效果.PLS模型的分别为0.926 7、 0.738 5、 0.800 9和0.622 5, LS-SVM模型的分别为0.950 4、 0.905 8、 0.857 4和值明显提高, 因而LS-SVM模型优于PLS模型.因光谱中干扰信息较多, 掺杂花生油、葵花籽油和玉米油的火麻油样品的模型精度并不理想.表3 不同火麻油样品的LS-SVM模型效果Tab.3 LS-SVM model of hemp seed oil adulterated with different oil掺杂类型校正集R2cRMSEC预测集R2pRMSEP大豆油0.98420.17250.95040.2921花生油0.97580.22740.90580.4080葵花籽油0.93940.31560.85740.4690玉米油0.92850.35730.76730.5396为提高模型的准确性, 利用SPA和CARS算法提取特征变量.以大豆油样品为例, 图3是大豆油利用上述两种算法提取的特征变量.从模型所含的变量数看, SPA和CARS提取的特征变量数目分别是29和8, 相比于原始光谱1 557个特征变量, 变量数大大减少.SPA-LS-SVM模型提取的波数点分别是3 999、 4 003、 4 007、4 011、 4 015、 4 018、 4 022、 4 026、 4 030、 4 034、 4 038、 4 045、4 049、 4 057、 4 069、 4 076、 4 080、 4 084、 4 088、 4 099、 4 416、4 427、 4 655、 5 272、 5 411、 5 689、 5 762、 5 816、 9 075 cm-1, CARS- LS-SVM模型提取的波数点分别是4 015、 4 022、 4 045、 4 103、 4 153、 5 804、 5 812和5 839 cm-1.从模型的精度上看(见表4), 大豆油样品的SPA-LS-SVM模型的精度略下降, 而CARS- LS-SVM模型的精度确有较大提高.对比这两者的特征变量数, CARS进一步降低SPA提取的特征变量数, 并引入新的特征变量, 建模效果优于SPA.对于其他掺杂的火麻油样品, 模型结果相似, 通过SPA和CARS提取光谱特征变量后, CARS-LS-SVM模型的准确性会高于SPA-LS-SVM模型和LS-SVM模型.在该模型下, 花生油、葵花籽油和玉米油的和RMSEP分别达到0.907 5和0.412 0、0.958 7和0.320 4、 0.924 9和0.384 5.图3 大豆油LS-SVM回归模型提取的特征变量 Fig.3 Selected variables for the LS-SVM model of soybean oil表4 SPA和CARS特征提取火麻油样品的LS-SVM模型效果Tab.4 LS-SVM model of hemp seed oil based on SPAand CARS掺杂类型模型变量数校正集R2cRMSEC预测集R2pRMSEP大豆油SVM15570.98420.17250.95040.2921SPA-SVM290.98790.15280.93570.3484CARS-SVM80.99490.10360.98210.1962花生油SVM15570.97580.22740.90580.4080SPA-SVM290.96670.24310.86160.4617CARS-SVM120.97610.22110.90750.4120葵花籽油SVM15570.93940.31560.85740.4690SPA-SVM290.95340.28260.85030.4681CARS-SVM460.99510.10210.95870.3204玉米油SVM15570.92850.35730.76730.5396SPA-SVM290.91630.37180.82930.4642CARS-SVM100.95790.28420.92490.3845 3 结语研究利用近红外光谱技术对掺杂了玉米油、大豆油、葵花籽油和花生油的火麻油进行鉴定, 建立PLS和LS-SVM定量分析模型, 并结合SPA和CARS提取特征变量.结果表明, LS-SVM模型的准确度优于PLS模型; SPA和CARS是两种有效的光谱特征变量选择算法, 能够提高模型的准确性, 并且CARS效果优于SPA; LS-SVM-CARS模型效果最佳, 分别达到0.982 1、 0.907 5、 0.958 7和0.924 9.因此, 在油脂掺杂中, LS-SVM-CARS模型是一个准确度高、变量数少、传递性较强的模型.该研究为近红外光谱技术在检测食品品质方面提供一种有益的思路, 并能在当前市场上油脂掺杂检测中产生一定的实用价值.参考文献:【相关文献】[1] 耿晶娟, 舒奕, 陶莎, 等.不同方法提取火麻籽油的品质分析[J].中国油脂, 2015, 40(5): 45-49.[2] 周凯琳, 舒奕, 陶莎, 等.火麻油乙酯化及其产物的分子蒸馏工艺研究[J].粮油食品科技, 2015(3): 26-31.[3] GIRGIH A T, ALASHI A, HE R, et al.Preventive and treatment effects of a hemp seed (Cannabis sativa L.) meal protein hydrolysate against high blood pressure in spontaneously hypertensive rats[J].European Journal of Nutrition, 2014, 53(5): 1237-1246.[4] YE M Q, GAO Z P, LI Z, et al.Rapid detection of volatile compounds in apple wines using FT-NIR spectroscopy[J].Food Chemistry, 2016, 190: 701-708.[5] PEI M, HUANG X.Determination of trace phenolic acids in fruit juice samples using multiple monolithic fiber solid-phase microextraction coupled with high-performance liquid chromatography[J].Analytical Methods, 2016, 8(18): 3831-3838.[6] KUCHERYAVSKIY S, LOMBORG C J.Monitoring of whey quality with NIR spectroscopy-a feasibility study[J].Food Chemistry, 2015, 176: 271-277.[7] CHATELIN Y M, TENENHAUS M, LAURO C, et al.PLS path modeling[J].Computational Statistics and Data Analysis, 2005, 48(1): 159-205.[8] BURGES C J C.A tutorial on support vector machines for pattern recognition[J].Data Mining and Knowledge Discovery, 1998, 2(2): 121-167.[9] VAN G T, SUYKENS J A, LANCKRIET G,et al.Bayesian framework for least-squares support vector machine classifiers, gaussian processes, and kernel Fisher discriminant analysis[J].Neural Computation, 2002, 14(5): 1115-1147.[10] ZHANG J K, BENOIT R, ROGGE D M.The successive projection algorithm (SPA), an algorithm with a spatial constraint for the automatic search of endmembers in hyperspectral data[J].Sensors, 2008, 8(2): 1321-1342.[11] GALVO R K H, ARAJO M C U, FRAGOSO W D, et al.A variable elimination method to improve the parsimony of MLR models using the successive projectionsalgorithm[J].Chemometrics and Intelligent Laboratory Systems, 2008, 92(1): 83-91. [12] LI H D, LIANG Y Z, XU Q S, et al.Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J].Analytica Chimica Acta, 2009, 648(1): 77.[13] TANG G, HUANG Y, TIAN K D, et al.A new spectral variable selection pattern using competitive adaptive reweighted sampling combined with successive projections algorithm[J].Analyst, 2014, 139(19): 4894.[14] 沃克曼, 文依.近红外光谱解析实用指南[M].褚小立, 许玉鹏, 田高友, 译.北京: 化学工业出版社, 2007.。

基于小波滤噪和iPLS的草莓近红外光谱糖度检测模型

基于小波滤噪和iPLS的草莓近红外光谱糖度检测模型

基于小波滤噪和iPLS 的草莓近红外光谱糖度检测模型石吉勇,邹小波,赵杰文,殷晓平(江苏大学食品与生物工程学院,江苏镇江212013)摘要 [目的]获得精度高、鲁棒性强的草莓近红外光谱糖度检测模型。

[方法]利用K -S (K enn a rd -S ton e)方法划分样本集,并用小波滤噪法对草莓1000~2500nm 近红外光谱进行预处理,最后用偏最小二乘法(P L S )和区间偏最小二乘法(iP L S)分别建立预测模型。

[结果]采用区间偏最小二乘法将光谱划分为20个子区间,利用其中的第16个子区间建立的糖度模型效果最佳,其校正时的相关系数R c 和校正均方根误差RM SEC 分别为0.9355和0.259,预测时的相关系数R p 和预测均方根误差RM SEP 分别为0.9202和0.305。

[结论]用小波滤噪和联合区间偏最小二乘法所建立的草莓糖度模型不仅能有效地减少建模所用的变量数,缩短运算时间,而且预测能力和精度均得到提高。

关键词 近红外光谱;草莓;糖度;区间偏最小二乘法中图分类号 O 657.7 文献标识码 A 文章编号 0517-6611(2009)12-05752-03T e s t in g M od e l o f Su ga r D e g re e in S traw b e rry by N e a r In fra re d Spe c trum B a se d o n W a v e le t D en o is in g an diPLS SH I J i-y o n g e t a l (C o llege o f F o od an d B io lo g ica l E n g in ee r in g ,J ian gsu U n ive rs ity ,Z h en jian g ,J ian gsu 212013)A b s tra c t [O b je ctive]T h e resea rch a i m ed to ob ta in th e te stin g m ode l o f su ga r con ten t o f n e ar in fra red spectrumin straw be r ry w ith h igh accu racy and s tron g robu stn ess .[M e th od]T h e K -S (K enn a rd -S ton e)m e th od w a s u sed to d iv ide th e sam p le se t an d th e w ave le t n o ise filte r in g m e th od w a s u sed to pre-trea t th e n e ar in fra red spectruma t 1000~2500nminstraw be rry ,a t la st th e pa r tia l lea st squ a re s(P L S )an d in terva l pa r tia l lea st squ a re s(iP L S )w e re u sed to se t u p th e p red iction m ode l re sp..[R esu lt]T h e spec trumw a s d iv ided to 20su b i n te rva l w ithth e i n te rva l par tia l lea st squ a re s an d th e e ffect o f su ga r con -ten t m ode l es tablish ed by th e ir 16sub in te rva l w a s op ti m um.T h e cor re la tion coe ffic ien t R c in co rrection an d roo t m e an squ a re e rro r o f co rrection RM SEC w e re 0.9355and 0.259re sp.an d th e co r re la tion co e fficien t R p in fo reca st and th e ro o t m e an squ a re e r ro r o f fo reca st w e re 0.9202an d 0.305re sp..[C on clu sion ]T h e straw be r ry su g ar con ten t m ode l e stab lish ed by w ave le t n o ise filter in g m e th od and in te rva l pa r tia l lea st squ a re s n o t on ly cou ld decrea se th e va r iab le num be r o f m ode lin g e ffectiv e ly an d sh o rten th e ope ra tion ti m e ,bu t a lso cou ld i m prov e th e p red iction ab ility an d p re cis ion.K e y w o rd s N IR spec tro scopy ;S traw be rry ;S u ga r de g re e ;in terva l pa r tia l leas t squ a re基金项目 国家863高科技项目(2008AA 10Z2);国家自然基金资助项目(30671199);江苏省自然科学基金资助项目(B K 2006707-1)。

CARS特征变量优选近红外光谱法测定初烤烟烟叶厚度

CARS特征变量优选近红外光谱法测定初烤烟烟叶厚度

CARS特征变量优选近红外光谱法测定初烤烟烟叶厚度胡巍耀;凌军;杨盼盼;杨式华;王玉;李伟;袁天军;李成斌【摘要】The thickness of tobacco is an important factor to measure the quality and grading of fluecured tobacco.The present study shows that it is feasibility to prediction thickness of tobacco by fourier transform near-infrared (FT-NIR) spectrometry.Two methods of screening spectrum range that calculated by competitive adaptive reweighted sampling method (CARS) and directly use the spectrum range (1000-2500 nm) had been combined with partial least squares (PLS) to establish the FTNIR model.The results show that the number of variables of the thickness of tobacco FT-NIR model also had reduced to 180 from 1543.The number of principal components also had reduced 6 from 10.The lower of standard error of calibration (SEC) and root mean square error of cross validation (RMSECV) was 0.0034 and 0.0103,respectively.Thirty samples had been used as external validation.The standard error of validation (SEV) and standard deviation of validation error (SDV) reduced to 0.0011 from0.0182.According NIR model of paired-t tests of measured and prediction value,the results have no significant variance at level of 0.05.The CARS-NIR model have smaller variance.The stability and forecasting accuracy of FT-NIR model had been developed improved by the CARS method to select the sensitive wavelengths.%烤烟烟叶厚度是烤烟烟叶分级和品质评价的重要指标之一,采用近红外光谱分析技术实现对烟叶厚度的快速测定具有一定的可行性.对比分析了采用竞争自适应重加权法(CARS)算法优选特征变量和采用全波长变量(1000 ~2500 nm)结合偏最小二乘法(PLS)建立初烤烟烟叶厚度近红外校正模型的效果.结果表明:模型的输入变量数由1543个降低到180个,决定系数由0.846提高到0.941;适宜主成分数由10降低到6,校正标准误差和交互验证均方根误差分别降低了0.0034和0.0103.采用30个外部样品对模型进一步进行验证,模型的验证标准误差和验证标准误差的偏差由0.0182降低到0.0011,在α=0.05显著水平,两个模型预测值与实测值间均不存在显著差异,采用CARS筛选特征变量近红外模型预测值与实测值间的差异性更小.CARS筛选特征变量提高了烟叶厚度近红外校正模型的稳定性和预测准确性.【期刊名称】《云南农业大学学报》【年(卷),期】2017(032)002【总页数】6页(P288-293)【关键词】初烤烟;厚度;近红外光谱法;模型集群分析;竞争自适应重加权法【作者】胡巍耀;凌军;杨盼盼;杨式华;王玉;李伟;袁天军;李成斌【作者单位】云南中烟工业有限责任公司技术中心,云南昆明650231;云南中烟工业有限责任公司技术中心,云南昆明650231;云南同创检测技术股份有限公司,云南昆明650106;云南同创检测技术股份有限公司,云南昆明650106;云南同创检测技术股份有限公司,云南昆明650106;云南同创检测技术股份有限公司,云南昆明650106;云南同创检测技术股份有限公司,云南昆明650106;云南瑞升烟草技术(集团)有限公司,云南昆明650106【正文语种】中文【中图分类】TS412烟叶厚度为烟叶表面在承受一定压力条件下两测量面间的距离[1],在一定程度上反映了烟叶的发育状况、成熟程度及打叶质量,是烤烟烟叶分级和品质评价的重要指标之一[2-3]。

基于近红外光谱无损检测的水果品质定量分析与预测

基于近红外光谱无损检测的水果品质定量分析与预测

基于近红外光谱无损检测的水果品质定量分析与预测马毅;汪西原【摘要】针对近红外光谱原理、检测技术及特点,利用近红外光谱检测漫反射技术在水果品质检测方法上的定量分析进行了深入系统研究.在光谱数据预处理上平滑和导数法最常见.建立模型以偏最小二乘法较常见.以遗传算法结合偏最小二乘法、小波分析结合偏最小二乘法等为代表的建模方法,其测量精度有所提高.模型优劣评价指标主要以相关系数(R)、校正集标准偏差(RMSEC)和预测集标准偏差(RMSEP)等参数决定.最后对相关研究进行展望.【期刊名称】《农业科学研究》【年(卷),期】2010(031)003【总页数】5页(P16-20)【关键词】近红外光谱;无损检测;水果;定量分析;漫反射;偏最小二乘法【作者】马毅;汪西原【作者单位】宁夏大学,物理电气信息学院,宁夏,银川,750021;宁夏大学,物理电气信息学院,宁夏,银川,750021【正文语种】中文【中图分类】O657水果品质检测技术多年来一直是农业工程领域的重要研究课题.随着计算机技术的迅速发展以及化学计量学方法研究的日益深入,近红外光谱技术在农产品品质检测领域得到较快发展.可溶性固形物含量、糖度、酸度和硬度等是评价果蔬品质的常规性状指标,对果蔬的定级和定价有着重要的影响[1].将近红外光谱技术应用于水果内部品质的检测,检测时间仅需数秒钟,而且可以同时检测多种成分,实现水果品质的快速分析,对水果分级、生产、加工质量控制具有十分重要的作用.本文就近红外光谱分析技术原理、特点及在水果定量检测方法上的应用做一些讨论.1 近红外光谱无损检测流程1.1 近红外光谱原理1800年近红外光谱区由 Herschel发现,是人类认识最早的非可见光光谱区[2].近红外光(Near Infrared,NIR)是介于可见光(VIS)和中红外光(MIR)之间的电磁波,按ASTM(美国试验和材料检测协会)定义是指波长为780~2526 nm(波数为12820~3959 cm-1)电磁波,近红外区划分为近红外短波(780~1100 nm)和近红外长波(1100~2526 nm)两个区域[3].由于NIR区的倍频和合频吸收弱,谱带复杂和重叠多,信息无法有效的分离和解析,限制了其应用.随着光学、电子技术、计算机技术和化学计量学的发展,多元信息处理的理论与技术得到发展,可以解决NIR谱区吸收弱和重叠的困难.有机物以及部分无机物分子中化学键结合的各种基团(如C=C,N=C,O=C,O=H,N=H)的运动(伸缩、振动、弯曲等)都有它固定的振动频率.当分子受到红外线照射时,被激发产生共振,同时光的能量一部分被吸收,测量其吸收光,可以得到极为复杂的图谱,这种图谱就表现为被测物质的特征.不同物质在近红外区域有丰富的吸收光谱,每种成分都有特定的吸收特征,这为近红外光谱定量分析提供了基础.1.2 近红外光谱无损检测技术、流程及特点目前常用的水果无损检测技术有:分光法检测技术(紫外光、可见光、近红外光)[4]、机器视觉检测技术、电磁特性检测技术、X线与激光分析法、力学特性检测技术、电子鼻与电子舌检测技术、超声波检测技术[5]、免疫学分析方法[6]等,其中应用最广泛、最成功的检测方法是光学方法.近红外光谱法是利用物质对光的吸收、散射、反射和透射等特性来确定其成分含量的一种非破坏性检测技术.近红外光谱检测水果样品中某种内部成分的具体过程为:①选择一定数量且具有代表性的水果样品(又称标准样品集).②用近红外光谱仪采集水果的近红外光谱.③用常规理化分析方法准确测定各个水果要预测的成分含量,并作为实测值.④应用化学计量学分析软件建立水果近红外光谱和成分分析值之间的数学模型.⑤利用已建立的定量数学模型对未知样品进行预测和精度分析.其流程见图1.图1 近红外光谱检测流程图近红外光谱技术用在水果品质检测上的优势是:①它属于非破坏性检测,可保留农产品完整外表而得其内在品质.②测试简单,无繁琐的前处理和化学反应过程.③测试速度快,大大缩短测试周期.④测试过程无污染,检测成本低.⑤近红外光谱包含了待测农产品的所有成分吸收信息,可同时检测多种内部成分.⑥对测试人员无专业化要求,且单人可完成多个化学指标的测试.⑦随模型中优秀数据的积累,模型不断优化,测试精度不断提高.⑧便于实现在线分析、远程控制.⑨测试范围可不断拓展.近红外光谱技术用在水果品质检测上的缺点和不足是:①近红外光谱容易受到样品温度、样品检测部位、样品状态以及检测参数等因素的影响,导致以系统误差为主的光谱信息存在差异性和光谱数据的不稳定性.因此,减少外界干扰,获得稳定光谱有待于研究.②目前研究中很少考虑水果的个体差异.同一品种水果由于产地、气候、采摘时间和储藏时间等条件不同,内部品质会有差异,这会导致水果对模型的适应性不同,模型对水果的预测度也有所不同.③近红外光谱技术依赖于采用化学计量学方法建立的数学模型,不同的建模方法存在差异.由于受使用条件、仪器稳定性等因素的影响,建立的数学模型的适应性也有所变化,而且每一种模型只能适应一定的时间和空间范围,因此需要不断对模型进行维护.2 近红外光谱水果品质无损检测方法与评价指标2.1 近红外光谱分析检测方法近红外光谱对水果分析可分为定量分析和定性分析,定性分析常用于水果的内部品质判别、浅层损伤、内部缺陷以及水果产地、品种鉴别等.定量分析一般用于评价水果内部成分含量,如糖度、酸度、硬度及维生素含量等.定量分析涉及光谱采集模式、光谱预处理、波段选择方法、建模方法和模型评价等[7].近红外光谱采集模式主要有反射、透射、漫反射等.(刘燕德等,2003)[8]研究了水果光特性检测原理及方法,并对三种不同检测方式进行了对比分析,结果表明,对于水果内部品质检测,最适宜用的方法是近红外漫反射光谱检测法.目前国内外水果光谱采集大多数使用漫反射光谱检测方式.光谱预处理方法有很多种,常见的有平滑、导数、标准归一化、傅立叶变换和小波变换[9]等.在波段选择方法上有相关系数法、遗传算法[10]、偏最小二乘法和独立分量分析法[11]等.建模方法常见的有多元线性回归(MLR)、偏最小二乘法(PLS)、主成分回归(PCR)、人工神经网络(ANN)[12]、支持向量机(SVM)[13]等.2.2 常见模型算法模型建立过程就是将通过预处理后的近红外光谱特征与水果有效含量数据进行关联,建立相关关系,建立模型以偏最小二乘(PLS)法最为常见,偏最小二乘法现已成为化学计量学中最有效的多变量校正方法,在化学测量及有关研究中得到广泛应用,它可以集多元线性回归分析、典型相关分析和主成分分析的基本功能为一体,将建模预测类型的数据分析方法与非模型式的数据认识性分析方法有机地结合起来,即:偏最小二乘回归≈多元线性回归分析十典型相关分析十主成分分析.其模型建立步骤可分为两步[14],具体如下:第一步,做矩阵分解,其模型为其中:T和U分别为X矩阵和Y矩阵的得分矩阵;P和Q分别为X矩阵和Y矩阵的载荷(主成分)矩阵;E和F分别为PLS模型拟合X和Y时所引进的误差.第二步,系数关联,将T和U作线性回归.令B为关联系数矩阵:U=TB,这里B=T′U(T′T)-1在预测时,由未知样品的矩阵X未知和校正得到的P校正求出未知样品X矩阵的T未知.然后得到利用PLS建模的优点是:①可以使用全光谱数据或部分光谱数据.②数据矩阵分解和回归交互结合为一步,得到的特征值向量与被测组分或性质相关,而不是与数据矩阵中变化最大的变量相关.③比较适用于小样本,多元数据分析.④可用于复杂的分析体系.其缺点是:①计算速度相对较慢,计算过程较繁,需要多次迭代.②模型建立过程复杂,较抽象,较难理解.2.3 模型评价指标评价建立后模型优劣指标一般常采用相关系数(R)、校正集标准偏差(RMSEC)和预测集标准偏差(RMSEP)[15].R越大,RMSEC和RMSEP越小,模型性能就越好.计算公式为式中:n为校正集样本数;N为预测集样本数;^yi为第i个样品的预测值;yi为第i个样品的参考值(真值);ym为校正集样本真值的平均值.RMSEC是衡量模型好坏的一个重要指标,RMSEP是衡量校正模型预测效果的重要指标.3 近红外光谱分析技术用于水果品质无损检测的研究3.1 苹果品质检测在对苹果的品质检测分析中,(Lammertyn et al,2001)[16] 、(Tsuyoshi etal,2002)[17] 、(Ying Yibin et al,2004)[18]、(刘燕德等,2005)[19]、(赵杰文等,2005)[20]、(王加华等,2008)[21]等人对苹果的糖酸度进行了近红外光谱检测分析.采用近红外漫反射采集方式采集数据,建立预测模型之前先进行光谱数据预处理,主要有平滑、导数、标准归一化和多元散射校正.平滑是去噪最常用的方法,以Savitzky-Golay卷积平滑法最为常见,但需要注意移动窗口及多项式次数的优化选择.导数可以有效地消除基线和其他背景所造成的干扰,但会引入噪声.建立模型的过程中以PLS算法最为常见,文献[21]中就PCR和PLS分别进行建立的模型进行了比较,结果以PLS所建立的模型最优.3.2 梨品质检测在对梨的品质检测分析中,(Liu Yande et al,2006)[22]、(刘燕德等,2006)[23]、(王加华等,2009)[24]、(潘璐等,2009)[25]等人对梨的糖酸度进行了近红外光谱检测分析.数据处理上大多采用平滑、导数、标准归一化和多元散射校正处理.文献[26]中对光谱进行了遗传算法波段优化,然后建立了遗传算法偏最小二乘法(GA-PLS)模型,建模结果为:R=0.966,RMSEC=0.469,RMSEP=0.797.将遗传算法用于波段选择,能更快达到最优解,有效提高测量精度,减少建模所用变量.3.3 其他水果品质检测除了对苹果和梨的研究之外,还有对橘子[26]、水蜜桃[27]、柑橘[28]、大白桃[29]和鲜枣[30]等水果进行近红外光谱分析检测.数据采集方式以漫反射为常见,对数据的预处理上采用平滑、导数、多元散射校正和小波变换等.多数以PLS建立模型,文献[12]还分别以偏最小二乘法结合遗传算法和人工神经网络(PLS-GA-BP)和偏最小二乘法结合BP神经网络(PLS-BP)建立模型进行相互比较,其结果PLS-GA-BP模型优于PLS-BP模型,其酸度和糖度的预测结果与测量值之间的相关系数和预测标准差分别为R=0.83699,RMSEP=0.109447;R=0.85409,RMSEP=0.60934.4 近红外光谱定量分析与传统测量部分水果品质比较近红外光谱分析技术应用在水果的定性与定量检测上有很明显的比较优势,见表1. 表1 苹果等水果糖度分析比较5 近红外光谱无损检测展望现代近红外光谱分析技术包括了近红外光谱仪、化学计量学软件和应用模型三部分.三者的有机结合才能满足快速分析的技术要求,缺一不可.近红外光谱分析的核心技术之一是光谱信息和组分之间建立函数关系及数学模型.在建立模型之前先要对光谱数据进行预处理,这样是为了去掉噪声等外界因素的干扰,从本文中可见平滑和导数是常见的去噪方法.小波变换由于降噪、消除基线漂移和满足局部性等优点,在数据预处理上有明显的优势,再结合遗传算法优化波段,剔除无用信息,这样建立的模型更优一些.建立模型时,PLS算法比较常见,这是因为PLS可以集多元线性回归、典型相关分析和主成分分析的基本功能为一体,其优点在本文中也提到.但是计算速度相对较慢,过程较繁,模型建立过程复杂、抽象和难理解等.最近也提到利用ANN和SVM算法来进行建模,在一些文章中也出现过,ANN能够很好解决抗干扰、抗噪声能力,ANN和SVM都能很好的解决非线性转换能力,但是学习时间都较长.6 结论本文就近红外光谱原理、检测流程、特点及水果定量检测上的应用进行了分析与探究,并就未来可能发展趋势进行了展望.近红外光谱分析技术具有快速、周期短、非破坏性,检测过程无污染、低成本及同时测定多种成分等特点,在很多领域得到广泛应用,随着算法的完善以及新的算法的提出,建立近红外光谱数据模型将会越来越优,精度也越来越高.从目前国内外研究进展情况来看,由于近红外光谱检测技术自身的许多优点,必将成为水果等无损检测中经济、有效且最具发展前景的分析技术之一. 参考文献:【相关文献】[1] 崔艳莉,冀晓磊,古丽菲娅,等.近红外光谱在果蔬品质无损检测中的研究进展[J].农产品加工:学刊,2007,(7):84-86.[2] 梁高峰,贾宏汝,谷运红,等.近红外光谱分析技术及其在农业研究中的应用[J].安徽农业科学,2007,35(29):9113-9115.[3] 李静,刘斌,岳田利,等.近红外光谱分析技术及其在食品中的应用[J].农产品加工:学刊,2007(3):44-47.[4] 应义斌,韩东海.农产品无损检测技术[M].北京:化学工业出版社,2005.[5] 刘燕德.无损智能检测技术及应用[M].武汉:华中科技大学出版社,2007.[6] 孙通,徐惠荣,应义斌.近红外光谱分析技术在农产品/食品品质在线无损检测中的应用研究进展[J].光谱学与光谱分析,2009,29(1):122-126.[7] 韩东海,王加华.水果内部品质近红外光谱无损检测研究进展[J].中国激光,2008,35(8):1123-1131.[8] 应义斌,刘燕德.水果内部品质光特性无损检测研究及应用[J].浙江大学学报:农业与生命科学版,2003,29(2):125-129.[9] 褚小立,袁洪福,陆婉珍.近红外分析中光谱预处理及波长选择方法进展与应用[J].化学进展,2004,29(4):528-541.[10] 陈斌,王豪,林松,等.基于相关系数法与遗传算法的啤酒酒精度近红外光谱分析[J].农业工程学报,2005,21(7):99-102.[11] 方利民,林敏.近红外光谱数据处理的独立分量分析方法研究[J].中国计量学院学报,2008,19(2):137-145.[12] 虞佳佳,何勇,鲍一丹.基于光谱技术的芒果糖度酸度无损检测方法研究[J].光谱学与光谱分析,2008,28(12):2839-2842.[13] 赵杰文,呼怀平,邹小波.支持向量机在苹果分类的近红外光谱模型中的应用[J].农业工程学报,2007,23(4):149-152.[14] 陆婉珍,袁洪福,徐广通,等.现代近红外光谱分析技术[M].北京:中国石化出版社,2000.[15] 夏俊芳,张战锋,王志山.番茄总糖含量的近红外光谱无损检测方法研究[J].食品科学,2009,6(30):171-174.[16] LAM MERTYN J,NICOLAI B,SM EDT D V,et al.Nonestructive measurement ofpH,soluble solids and firmness of Jonagold apples using NIRpectroscopy[J].Acta Horticulturae,2001(562):167-173.[17] TSUYOSHI T,KENKOH H,FUJITOSHI S.Measuring the Sugar Content of Apples and Apple Juice by Near Infrared Spectroscopy[J].OPTICAL REVIEW,2002,9(2):40-44.[18] YING YIBIN,LIU YANDE,FU XIAPING,et al.Effect of wavelet transform techniques upon the estimation of sugar content in apple with near-infraredspectroscopy[C].Nondestructive sensing for food safety,quality,and natural resources,2004,29-41.[19] 刘燕德,应义斌,傅霞萍.近红外漫反射用于检测苹果糖度及有效酸度的研究[J].光谱学与光谱分析,2005,25(11):51-54.[20] 赵杰文,张海东,刘木华.利用近红外漫反射光谱技术进行苹果糖度无损检测的研究[J].农业工程学报,2005,21(3):162-165.[21] 王加华,韩东海.基于遗传算法的苹果糖度近红外光谱分析[J].光谱学与光谱分析,2008,28(10):2308-2311.[22] LIU YANDE,YING YIBIN.Optical system for measurement ofinternal pearquality using near-infrared spectroscopy[J].Optical engineering,2005,44(7):1-5.[23] 刘燕德,应义斌,傅霞萍,等.一种近红外光谱水果内部品质自动检测系统[J].浙江大学学报:工学版,2006,40(1):53-56.[24] 王加华,潘璐,孙谦,等.遗传算法结合偏最小二乘法无损评价西洋梨糖度[J].光谱学与光谱分析,2009,29(3):678-681.[25] 潘璐,王加华,李鹏飞,等.砂梨糖度近红外光谱波段遗传算法优化[J].光谱学与光谱分析,2009,29(5):1246-1250.[26] SHAO YONGNI,HE YONG,BAO YIDAN.Nearinfrared spectroscopy for classification of oranges and prediction of the sugar content[J].International Journal of Food Properties,2009,12(3):644-658.[27] 刘燕德,应义斌.水蜜桃糖度和有效酸度的近红外光谱测定法[J].营养学报,2004,26(5):400-402.[28] 夏俊芳,李小昱,李培武,等.基于小波消噪柑橘内部品质近红外光谱的无损检测[J].华中农业大学学报,2007,26(1):120-123.[29] 马广,傅霞萍,周莹,等.大白桃糖度的近红外漫反射光谱无损检测试验研究[J].光谱学与光谱分析,2007,27(5):907-910.[30] 张淑娟,王凤花,张海红,等.鲜枣品种和可溶性固形物含量近红外光谱检测[J].农业机械学报,2009,40(4):139-142.[31] 李艳肖,邹小波,董英.用遗传区间偏最小二乘法建立苹果糖度近红外光谱模型[J].光谱学与光谱分析,2007,27(10):2001-2004.[32] 徐惠荣,汪辉君,黄康,等.PLS和 SMLR建模方法在水蜜桃糖度无损检测中的比较研究[J].光谱学与光谱分析,2008,28(11):2523-2526.。

同步荧光光谱结合CARS变量优选预测猪肉中四环素残留含量

同步荧光光谱结合CARS变量优选预测猪肉中四环素残留含量

同步荧光光谱结合CARS变量优选预测猪肉中四环素残留含量肖海斌;赵进辉;袁海超;洪茜;刘木华【摘要】为快速检测猪肉中的四环素残留含量,采用同步荧光法结合竞争适应重加权采样(CARS)变量优选法建立了预测猪肉中四环素残留含量的支持向量回归(SVR)模型.从样本的三维同步荧光光谱中确定了最佳波长差为65 nm,采用CARS方法从中挑选出与四环素相关的特征波长变量,并与连续投影算法(SPA)及遗传算法(GA)进行比较.最后,应用SVR算法对优选出的16个波长变量建立猪肉中四环素含量的预测模型.分析发现,多元散射校正(MSC)光谱预处理后的CARS方法优于SPA及GA 变量选择方法,可以有效地筛选出全光谱中的特征波长变量.CARS-SVR建立的四环素预测模型优于原始光谱的SVR模型,其预测集的决定系数(R2)和预测均方根误差(RMSEP)分别为0.961 2和10.94 mg/kg.研究结果表明,采用同步荧光法结合CARS-SVR模型可以预测猪肉中的四环素残留含量,且CARS-SVR能有效地简化模型并提高预测精度.【期刊名称】《光学精密工程》【年(卷),期】2013(021)010【总页数】7页(P2513-2519)【关键词】同步荧光光谱;竞争适应重加权采样(CARS);支持向量回归;四环素;猪肉【作者】肖海斌;赵进辉;袁海超;洪茜;刘木华【作者单位】江西农业大学工学院/生物光电及应用重点实验室,江西南昌330045;江西农业大学工学院/生物光电及应用重点实验室,江西南昌330045;江西农业大学工学院/生物光电及应用重点实验室,江西南昌330045;江西农业大学工学院/生物光电及应用重点实验室,江西南昌330045;江西农业大学工学院/生物光电及应用重点实验室,江西南昌330045【正文语种】中文【中图分类】O657.311 引言猪肉中含有丰富的脂肪、蛋白质、碳水化合物及钙、铁、磷等成分。

它营养丰富,性平味甘,具有丰肌泽肤、补虚强身、滋阴润燥的功效,因此成为人们生活中主要的副食品[1-2]。

基于BiPLS-CARS-PLS的哈密瓜冠层叶片SPAD值反演建模

基于BiPLS-CARS-PLS的哈密瓜冠层叶片SPAD值反演建模

基于BiPLS-CARS-PLS的哈密瓜冠层叶片SPAD值反演建模郭阳;郭俊先;史勇;李雪莲;黄华【期刊名称】《浙江农业学报》【年(卷),期】2022(34)10【摘要】利用光谱技术对大田哈密瓜冠层叶片叶绿素含量定量估测,可为田间水肥调控以及田间管理提供理论依据。

本实验在剔除噪音后的378 nm到1115 nm光谱的基础上采用多元散射校正、标准正态变量相交、标准化、Savitzky-Golay卷积平滑法、归一化、移动平均平滑等方法对原始光谱数据进行预处理,然后采用特征区间选择与特征波长选择相结合的方法实现数据降维和简化模型,并建立偏最小二乘和极限学习机的回归模型。

结果表明,多元散射校正预处理效果最佳,在此基础上,利用反向区间偏最小二乘法(BiPLS)和竞争性自适应重加权采样算法(CARS)相结合共筛选出13个特征波长,将其作为模型的输入变量,由偏最小二乘法(PLS)建立的模型效果最优,其预测集的相关系数R p和均方根误差RMSEP分别为0.9424与1.0062。

因此,采用BiPLS与CARS结合PLS建立的光谱定量分析模型,可实现对哈密瓜冠层叶片叶绿素含量的定量估测。

【总页数】10页(P2286-2295)【作者】郭阳;郭俊先;史勇;李雪莲;黄华【作者单位】新疆农业大学机电工程学院;新疆农业大学数理学院【正文语种】中文【中图分类】S652.1【相关文献】1.光照及氮素水平对水稻冠层叶片SPAD值动态变化的影响2.氮素对水稻冠层叶片SPAD值影响试验研究3.遮荫对水稻冠层叶片 SPAD 值及光合、形态特性参数的影响4.基于冠层高光谱的油菜角果期红边参数及叶片SPAD值反演模型5.SiPLS-CARS与GA-ELM对哈密瓜冠层叶片含水率的反演估测因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
变量 / 样本所建模型更好 的性能 , 且 ML R模型 比 P L S模型性能 略优 ,
0 . 3 4 8 4和 3 . 3 2 7 8。
, R MS E P和 R P D分别为 0 . 9 0 9 7 ,
关键词
变量筛选 ; 样本筛选 ; 近红外光谱 ; 草莓 ;可溶性 固形物
所有波长点都有用 ;另一方 面 , 部分 波长之 间也存在 较为严
重 的共线性 。目前的研究已经证 明冗 余信息 的存在 能够削弱 模 型的预测性 能和稳 定性 _ 3 ] 。因此 , 在 利用 近红 外光 谱对 农 产品无损检测 时,需要 进行 无信 息变量 消除 和变量优 选 。 在众 多变量选择 的算法 中 , 蒙特卡罗无信息变量消除 ( Mo n t e
第3 5 卷 , 第2 期
2 0 1 5年 2月








S p e c t r o s c o p y a n d S p e c t r a l An a l y s i s
Vo 1 . 3 5 , No . 2 , p p 3 7 2 — 3 7 8 Fe b r u a r y ,2 0 1 5
有“ 水果 皇后 ” 的美称 。 开展基于草莓 内部 品质的快速 检测分 级技术研究具有重要意义 。 本研究 中将 C A R S变量选 择方法
影算法 ( s u c c e s s i v e p r o j e c t i o n s a l g o r i t h m,s P A) 是两种分别在
个关键变量 。 为 了验证 C R S算法的性能 , A 蒙特卡罗无信息变量消除 MC - UV E和连续投影算法 S P A用于 比 较研究 。C R S算法在 消除无信息变量 的同时可 以对共线 性信息进 行去 除。同样 , A 为 了评估 S P A算 法在特 征样本选择 中的性能 ,经典的 Ke n n a r d - S t o n e 算法也用于 比较分析 。S P A算法能够用于校正 集特征样本 的优
用和维护都非常关键 。以草莓 内部 品质近红外光谱预测为例 , 从 关键 变量和特征样本 优选两方 面进行研究 。
采用竞争性 自适应重加权 C A RS算法对光谱变量进行初次选 择 ,随后采用连续投影算法 S P A对校正集样 本 进行优选 ,获得 9 8个特征样 本 , 针对优选后 的变量 / 样 本子集利用 S P A算 法作二次 关键变量提取 , 获得 2 5
引 言
迄今 , 大量研究 已经证 明近红外光谱能够 有效用 于农 产 品无损检测的定量 和定性 分析[ 1 ] 。但 是 ,目前 所采 用 的光 谱仪精度通常较高 , 原始光谱数 据中存在较 多 的波长点 。一 方面 , 在针对特定对象 中特定成分作定量分 析的时候并 不是
行 有效 去除和共 线性 变量 进行有效压缩 , 最终 优选出针对 预 测 目标最为关键 的变量E 7 , 8 3 。 另外 , 在研究 中我们也发现 ,目前较 多 的研究 集 中在 光 谱关键变量 的提 取 ,但对 校 正样 本 的有 效 选 择并 不 多。然 而, 选择合理有效 的校正集样本 不仅可 以提高建模 速度 、减
选 。针对最终优选后的变量/ 样本 ( 2 5 / 9 8 ) 子集建立 P L S和 ML R模 型对 草莓 内部可溶性 固形 物含量 S S C含
量进 行定量 预测 。结果表 明, 两个模型利用原始变量 / 样本的 0 . 5 9 / 6 5 . 3 3 的信 息均 能够 获得 比基于原 始
C a r l o — u n i n f o r ma t i v e v a r i a b l e e l i mi n a t i o n , MC - UVE ) 和 连续 投
草莓属 于蔷薇科 草莓 属多年生草本 果树 , 在 世界小浆 果 生产中居于首位 。 草莓 以其柔 软多汁 、营养 丰富而 著称 ,素
文献标识码 : A D OI :1 0 . 3 9 6 4 / j . i s s n . 1 0 0 0 — 0 5 9 3 ( 2 0 1 5 ) 0 2 - 0 3 7 2 - 0 7 择理论 _ 7 ] ,但研究 已经证明该方法可以同时对无信 息变量进
中图分类号 : 06 5 7 A算 法对 草 莓 S S C含 量 N I R 光谱 预 测模 型 中变量 及样 本 筛选
李江波 , 郭志 明, 黄文倩 , 张保 华 , 赵 春江
北京市农林科学 院北京农业智能装备技术研究中心 , 北京 1 0 0 0 9 7


采用光谱技术对水果进行 定量 或定 性分析 ,如何 获得一个 简单 、有效 的校正模 型对后续 模型 的应
少模型库的存储空 间,而且 ,当遇 到模型界 外样 品时 , 通 过
较少 的样 品 , 便可以扩大模型的使用范 围 , 便 于模型 的更新 和维护 , 进一步节省 人力 、物力 投入 成本_ 9 ] 。并且 , 样 本 的 选择在 多元校正模型 的传递 中也非 常重要_ 1 。因此 , 校正样 本 的选择也作 为本研究 的一个重要方 面。
和S P A样 本选 择方法应 用 于草莓 可溶 性 固形物 ( S S C) 的定
量预测 中。为此 , 系统 比较 C R S变量选 择方法与 MC A - UVE
收稿 日期 :2 0 1 3 — 1 1 — 0 2 ,修订 日期 : 2 0 1 4 — 0 3 — 0 4 基金项 目: j E 京市博士后科研活动经费( 2 O 1 3 Z Z - 7 O ) ,中国博士后科学基金项 目( 2 0 1 2 M5 2 0 1 9 3 ) 和 国家 自然科学基金项 目( 3 1 3 0 1 2 3 6 ) 资助 作者简介 : 李 江波,1 9 8 2年生 , 北京市农林科学院北京农业智能装备技术研究 中心博士后
有效信息获取和降低共线信息的研究 中取得了较好结果的方
法L 6 _ 。与之相 比 ,竞争 性 自适 应重 加权 算法 ( c o mp e t i t i v e a —
d a p t i v e r e we i g h t e d s a mp l i n g , C A RS ) 是一种新 提出 的变 量选
相关文档
最新文档