应用CARS和SPA算法对草莓SSC含量NIR光谱预测模型中变量及样本筛选

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
变量 / 样本所建模型更好 的性能 , 且 ML R模型 比 P L S模型性能 略优 ,
0 . 3 4 8 4和 3 . 3 2 7 8。
, R MS E P和 R P D分别为 0 . 9 0 9 7 ,
关键词
变量筛选 ; 样本筛选 ; 近红外光谱 ; 草莓 ;可溶性 固形物
所有波长点都有用 ;另一方 面 , 部分 波长之 间也存在 较为严
重 的共线性 。目前的研究已经证 明冗 余信息 的存在 能够削弱 模 型的预测性 能和稳 定性 _ 3 ] 。因此 , 在 利用 近红 外光 谱对 农 产品无损检测 时,需要 进行 无信 息变量 消除 和变量优 选 。 在众 多变量选择 的算法 中 , 蒙特卡罗无信息变量消除 ( Mo n t e
第3 5 卷 , 第2 期
2 0 1 5年 2月








S p e c t r o s c o p y a n d S p e c t r a l An a l y s i s
Vo 1 . 3 5 , No . 2 , p p 3 7 2 — 3 7 8 Fe b r u a r y ,2 0 1 5
有“ 水果 皇后 ” 的美称 。 开展基于草莓 内部 品质的快速 检测分 级技术研究具有重要意义 。 本研究 中将 C A R S变量选 择方法
影算法 ( s u c c e s s i v e p r o j e c t i o n s a l g o r i t h m,s P A) 是两种分别在
个关键变量 。 为 了验证 C R S算法的性能 , A 蒙特卡罗无信息变量消除 MC - UV E和连续投影算法 S P A用于 比 较研究 。C R S算法在 消除无信息变量 的同时可 以对共线 性信息进 行去 除。同样 , A 为 了评估 S P A算 法在特 征样本选择 中的性能 ,经典的 Ke n n a r d - S t o n e 算法也用于 比较分析 。S P A算法能够用于校正 集特征样本 的优
用和维护都非常关键 。以草莓 内部 品质近红外光谱预测为例 , 从 关键 变量和特征样本 优选两方 面进行研究 。
采用竞争性 自适应重加权 C A RS算法对光谱变量进行初次选 择 ,随后采用连续投影算法 S P A对校正集样 本 进行优选 ,获得 9 8个特征样 本 , 针对优选后 的变量 / 样 本子集利用 S P A算 法作二次 关键变量提取 , 获得 2 5
引 言
迄今 , 大量研究 已经证 明近红外光谱能够 有效用 于农 产 品无损检测的定量 和定性 分析[ 1 ] 。但 是 ,目前 所采 用 的光 谱仪精度通常较高 , 原始光谱数 据中存在较 多 的波长点 。一 方面 , 在针对特定对象 中特定成分作定量分 析的时候并 不是
行 有效 去除和共 线性 变量 进行有效压缩 , 最终 优选出针对 预 测 目标最为关键 的变量E 7 , 8 3 。 另外 , 在研究 中我们也发现 ,目前较 多 的研究 集 中在 光 谱关键变量 的提 取 ,但对 校 正样 本 的有 效 选 择并 不 多。然 而, 选择合理有效 的校正集样本 不仅可 以提高建模 速度 、减
选 。针对最终优选后的变量/ 样本 ( 2 5 / 9 8 ) 子集建立 P L S和 ML R模 型对 草莓 内部可溶性 固形 物含量 S S C含
量进 行定量 预测 。结果表 明, 两个模型利用原始变量 / 样本的 0 . 5 9 / 6 5 . 3 3 的信 息均 能够 获得 比基于原 始
C a r l o — u n i n f o r ma t i v e v a r i a b l e e l i mi n a t i o n , MC - UVE ) 和 连续 投
草莓属 于蔷薇科 草莓 属多年生草本 果树 , 在 世界小浆 果 生产中居于首位 。 草莓 以其柔 软多汁 、营养 丰富而 著称 ,素
文献标识码 : A D OI :1 0 . 3 9 6 4 / j . i s s n . 1 0 0 0 — 0 5 9 3 ( 2 0 1 5 ) 0 2 - 0 3 7 2 - 0 7 择理论 _ 7 ] ,但研究 已经证明该方法可以同时对无信 息变量进
中图分类号 : 06 5 7 A算 法对 草 莓 S S C含 量 N I R 光谱 预 测模 型 中变量 及样 本 筛选
李江波 , 郭志 明, 黄文倩 , 张保 华 , 赵 春江
北京市农林科学 院北京农业智能装备技术研究中心 , 北京 1 0 0 0 9 7


采用光谱技术对水果进行 定量 或定 性分析 ,如何 获得一个 简单 、有效 的校正模 型对后续 模型 的应
少模型库的存储空 间,而且 ,当遇 到模型界 外样 品时 , 通 过
较少 的样 品 , 便可以扩大模型的使用范 围 , 便 于模型 的更新 和维护 , 进一步节省 人力 、物力 投入 成本_ 9 ] 。并且 , 样 本 的 选择在 多元校正模型 的传递 中也非 常重要_ 1 。因此 , 校正样 本 的选择也作 为本研究 的一个重要方 面。
和S P A样 本选 择方法应 用 于草莓 可溶 性 固形物 ( S S C) 的定
量预测 中。为此 , 系统 比较 C R S变量选 择方法与 MC A - UVE
收稿 日期 :2 0 1 3 — 1 1 — 0 2 ,修订 日期 : 2 0 1 4 — 0 3 — 0 4 基金项 目: j E 京市博士后科研活动经费( 2 O 1 3 Z Z - 7 O ) ,中国博士后科学基金项 目( 2 0 1 2 M5 2 0 1 9 3 ) 和 国家 自然科学基金项 目( 3 1 3 0 1 2 3 6 ) 资助 作者简介 : 李 江波,1 9 8 2年生 , 北京市农林科学院北京农业智能装备技术研究 中心博士后
有效信息获取和降低共线信息的研究 中取得了较好结果的方
法L 6 _ 。与之相 比 ,竞争 性 自适 应重 加权 算法 ( c o mp e t i t i v e a —
d a p t i v e r e we i g h t e d s a mp l i n g , C A RS ) 是一种新 提出 的变 量选
相关文档
最新文档