CARS_SPA算法结合高光谱检测马铃薯还原糖含量_姜微
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
像头、镜头;光源为 150 W 可调功率光纤卤素灯。
高光谱图像光谱仪狭缝宽度为 25 μm,光谱范围为
是 400~1000 nm,光谱分辨率为 1.29 nm,采集图像
时波段间隔为3 nm,空间分辨率 0.15 mm。
1.2 还原糖含量化学分析法
还原糖含量化学值测定:采用 3,5-二硝基水
杨酸比色法,具体步骤参见文献[11]。
1.3 数据采集
不同波段下光源强度分布不均匀,摄像头中
存在暗电流,导致光源分布较弱波段噪声过大,
须对高光谱图像校正。为降低光源因温度变化造
成图像干扰,每采集 20 幅样本图像,作一次全白
标定图像和全黑标定图像采集,根据公式(1)得到
校正后高光谱图像[12]。
I=
Is Iw
- Id - Id
(1)
式中,I-校正后图像;Is-原始图像;Iw-白板
ln( N
p/2) -1
ቤተ መጻሕፍቲ ባይዱ
本文中,变量数 p 为 203,设定 MC 采样次数为
200,因此,常数 a 和 k 值分别为 1.0235 和 0.0232。
开始
蒙特卡洛采样(MCS) 次数 i≤N?
Y
随机抽取一定比例样品(90%) 作为校正集建立 PLS 模型
N
N 次采样后,CARS 获得 N 个 变量子集及对应 RMSECV 值
Abstract: The paper used competitive adaptive reweighed sampling (CARS) and successive
projections algorithm (SPA) to select the characteristic wavelength for detecting the reducing sugar content in potato. A total of 238 samples were prepared and the potato reducing sugar content was determined by colorimetry. Among them, 190 samples were selected as the calibration set and 48 samples as the validation set. The performance of CARS-SPA was compared with full spectrum and classical variable extraction methods. Results showed that the band screened by algorithm CARS-SPA had the best effect, compared to full spectrum modeling, the wavelength of the model reduced from 203 to 17, the model validation set coefficient r2 increased from 0.8464 to 0.8965, and the root mean square error of prediction (RMSEP) decreased from 0.0758 to 0.0490. The results demonstrated that it was feasible to detect the reducing sugar content of potato using CARS-SPA combined with hyperspectral imaging.
通过 CARS 算法去除变量,其权重ωi 均设为
0。主要流程见图 2。
变量保留率 ri=ae-ki
其中,a 和 k 为常数,分别在第 1 次和第 N 次
MCS 采样时,样本集中全部 p 个变量参与建模和仅
2 个变量参与建模,即 r1=1 且 rN=2/p,从而
a=
æ
ç
è
p 2
1/(N
ö
÷
ø
- 1)
k=
法。去除与样本无关信息,提高模型预测能力。
1.5 竞争性自适应重加权算法(CARS)
竞争性自适应重加权算法(CARS)是模拟达尔
文进化论“适者生存”提出的变量选择方法[14]。每次
通过自适应重加权采样(ARS)技术筛选 PLS 模型中回
归系数绝对值大波长点,去除权重小波长点,交叉
验证选出 PLS 模型中交叉验证均方根误差 RMSECV
式中,b=Wc=[b1,b2,…,bp],表示一个 p 维 系数向量。b 中第 i 个元素绝对值|bi(| 1≤i≤p)表示
·90·
东北农业大学学报
第 47 卷
第 i 个波段对 Y 贡献,|bi|值越大该变量越重要。为
评价每个波段重要性,定义权重为:
∑ ωi=
|bi | |p
i=1
bi
|
,i=1,2,…,p
薯为研究对象。去除表面缺陷明显样本,共 238 个 样品。随机选取其中 190 个作建模样本集,其余 48 个作预测样本集。试验前将马铃薯表面清洗干净。
采用美国 HeadWall 公司生产高光谱图像采集系 统。系统由图像采集单元、光源、样本输送平台三 部分组成。图像采集单元包括图像光谱仪、CCD 摄
最小子集定义为最优变量子集。
假定所测样本光谱阵矩阵为 Xm×p,m 为样本 数,p 为变量数,Ym×1表示目标响应向量。T 为 X 分
矩阵,是 X 与 W 线性组合,W 为组合系数。c 表示
Y 和 T 建立 PLS 校正模型回归系数向量,e 为预测
残差。则有如下关系式成立:
T=XW
Y=Tc+e=XWc+e=Xb+e
Using CARS-SPA algorithm combined with hyperspectral to determine reducing sugars content in potatoes/JIANG Wei1, 2, FANG Junlong1, WANG Shuwen1,
WANG Runtao1(1. School of Electrical and Information, Northeast Agricultural University, Harbin 150030, China; 2. Department of Computer, Harbin Finance University, Harbin 150030, China)
本文以马铃薯为研究对象,基于高光谱成像 技术获取马铃薯光谱曲线信息,采用竞争性自适 应重加权算法(CARS)结合连续投影算法(SPA)筛 选特征波长,与全光谱和其他变量提取方法比 较,分别建立偏最小二乘 PLS 模型并验证,获取适 用于马铃薯品质定量分析的高光谱最优变量。
1 材料与方法
1.1 样品与仪器 选用黑龙江省哈尔滨周边城市不同品种马铃
第 47 卷 第 2 期
东北农业大学学报
47(2): 88~95
2016 年 2 月
Journal of Northeast Agricultural University
February 2016
网络出版时间 2016-1-25 16:04:10 [URL] http://www.cnki.net/kcms/detail/23.1391.S.20160125.1604.018.html
第2期
姜 微等:CARS-SPA 算法结合高光谱检测马铃薯还原糖含量
·89·
马铃薯还原糖含量是影响加工品质重要因素 之一[1]。准确、快速测定马铃薯还原糖含量对于马 铃薯深加工等具有重要意义。目前,测定还原糖 的电化学法和比色法多为传统方法,操作步骤繁 琐,成本高,不利大批样品分析测定[2]。研究马铃 薯还原糖含量快速检测方法,具有一定应用价值。
记录回归系数,第 i 个波段对 Y 贡献|bi|;评价波长重要性,计算 权重ωi;计算变量保留率 ri=ae-ki
比较 N 个 RMSECV 值,选出具 有最小 RMSECV 值得变量子集
利用指数衰减函数强行去除|bii|值较小波长
采用 ARS 采样技术从 p×ri个 变量中提取新变量子集
Key words: hyperspectral; CARS; SPA; potato; reducing sugars
收稿日期:2015-08-27 基金项目:现代农业产业技术体系建设专项资金(CARS-10-P22);国家高技术研究发展计划(863 计划)(2013AA102303) 作者简介:姜微(1980-),女,讲师,博士研究生,研究方向为农业信息技术。E-mail: jwhancg@126. com *通讯作者:房俊龙,教授,博士生导师,研究方向为信息处理与智能测控。E-mail: 13936439133@126. com
共制备 238 个样本,比色法测定马铃薯还原糖含量,选择 190 个样本作校正集,48 个样本作验证集,与全光谱和经
典变量提取方法比较。结果表明,CARS-SPA 算法筛选波段效果最佳,相比于全谱建模其参与建模波长点由 203 个
减少到 17 个,模型验证集决定系数 r2由 0.8464 提高到 0.8965,均方根误差(RMSEP)由 0.0758 降到 0.0490。结果表
图像;Id-黑色图像。
1.4 数据预处理
为减弱或消除基线漂移、散射等非目标因素
对光谱影响,对高光谱成像仪采集光谱预处理 。 [13]
分别对原始光谱采用平滑 13 点、最大值归一化、基
线校正、正交信号校正和标准化等预处理,并依次
比较原始光谱和预处理后光谱对定标模型影响,以
系数最大、均方根误差最小原则,确定预处理方
高光谱成像技术可获取被测对象光谱信息和 波长图像信息。该技术检测马铃薯内外部品质研究 已有报道。Dacal-Nieto 等应用高光谱成像技术无损 检测马铃薯空心病[3]。Rady 等提出高光谱成像技术 快速检测马铃薯含糖量可行[4]。Jiang 等基于高光谱 成像技术检测马铃薯中淀粉含量,效果良好[5]。周竹 等应用高光谱图像系统、透射光谱系统和傅立叶变 换近红外光谱仪检测马铃薯黑心病,表明光谱检 测马铃薯黑心病,高光谱成像系统高于傅立叶变 换成像[6]。苏文浩等应用高光谱技术结合图像处理 方法检测马铃薯外部缺陷,表明正确识别率达 82.5% 。 [7] 周竹等应用高光谱技术检测马铃薯干物 质含量[8]。吴辰等应用高光谱成像技术快速检测马 铃薯淀粉含量取得较好效果,验证模型相关系数 和均方根误差分别为 0.982 和 0.249[9]。金瑞等基于 高光谱图像和光谱信息融合技术可同时识别马铃薯 多种缺陷指标,混合识别率达 96.58%[10]。由于高光 谱具有较高分辨率,导致大量冗余信息存在于原始 光谱信息中。因此,利用高光谱数据定量分析前压 缩光谱信息尤为必要。
CARS-SPA 算法结合高光谱检测马铃薯还原糖含量
姜 微 1, 2,房俊龙 1*,王树文 1,王润涛 1
( 1. 东北农业大学电气与信息学院,哈尔滨 150030;2. 哈尔滨金融学院计算机系,哈尔滨 150030 )
摘 要:以竞争性重加权自适应选择算法(CARS)结合连续投影算法(SPA)选择马铃薯还原糖含量特征波长,
明,采用 CARS-SPA 结合高光谱成像技术检测马铃薯还原糖含量结果可行。
关键词:高光谱;竞争性自适应重加权采样算法;连续投影算法;马铃薯;还原糖
中图分类号:TS255.7;S532
文献标志码:A
文章编号:1005-9369(2016)02-0088-08
姜微, 房俊龙, 王树文, 等. CARS-SPA 算法结合高光谱检测马铃薯还原糖含量[J]. 东北农业大学学报, 2016, 47(2): 88-95. Jiang Wei, Fang Junlong, Wang Shuwen, et al. Using CARS-SPA algorithm combined with hyperspectral to determine reducing sugars content in potatoes[J]. Journal of Northeast Agricultural University, 2016, 47(2): 88-95. (in Chinese with English abstract)