基于电子鼻的山核桃陈化时间检测
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于电子鼻的山核桃陈化时间检测
庞林江;王俊;王允祥;吴从元;何志平
【摘要】Walnut(carya cathayensis Sarg)samples with artificial aging times(0 d,2 d,4 d and 6 d)and natural aging times(0 year,l year and 2 year) were measured by PEN2 electronic nose made in Germany. Based on principal component analysis (PCA),Probabilistic Neural Network (PNN) algorithm pattern recognition method was applied to build discriminating model from aging times. The parameter of Spread in the PNN model and the number of principal component factors were optimized by cross-validation method. The results showed that PCA could basically distinguish walnut of artificial aging times and natural aging times. Experimental results showed that the optimal recognition model of artificial aging walnut was obtained with 4 principal component factors and Spread=0.1 or 0.2,the discriminating rates of walnut in the calibration sets and prediction sets were 100% and 65% .respectively. However,the optimal model of natural aging walnut was obtained with 2 principal component factors and Spread = 0.1 ~0.6 and both discriminating rates in the calibration and prediction sets were 100%. The present study demonstrated that Electronic nose technique with PCA and PNN methods could discriminate walnut well from diverse of artificial or natural aging times,and these methods were much better for natural aging walnut than those of artificial aging walnut.%选取人工陈化山核桃(0 d、2 d、4 d和6 d)和自然陈化山核桃(0 y、1 y和2 y)作为研究对象,采用德国PEN2便携式电子鼻进
行检测,在主成分分析(PCA)的基础上,采用概率神经网络(PNN)模式识别方法建立山核桃陈化时间鉴别模型,模型参数Spread和主成分数通过交互验证的方法优化。
结果标明,PCA基本可区分不同陈化时间的人工陈化和自然陈化的山核桃。
当主成分数为4和Spread=0.1或Spread=0.2时,人工陈化山核桃所得识别模
型最佳,校正集样本识别率为100%,预测集样本识别率为65%;当主成分数为
2和Spread=0.1~0.6时,自然陈化山核桃所得识别模型最佳,校正集样本和预
测集样本识别率均为100%。
研究表明,基于主成分分析(PCA)和概率神经网络(PNN)的电子鼻技术可较好鉴别不同陈化时间的人工陈化和自然陈化的山核桃,且对自然陈化山核桃的识别效果要优于人工陈化山核桃。
【期刊名称】《传感技术学报》
【年(卷),期】2011(024)006
【总页数】6页(P928-933)
【关键词】电子鼻;陈化时间;主成分分析;概率神经网络;山核桃
【作者】庞林江;王俊;王允祥;吴从元;何志平
【作者单位】浙江农林大学农业与食品科学学院,杭州311300;浙江大学生物系
统工程与食品科学学院,杭州310029;浙江农林大学农业与食品科学学院,杭州311300;杭州市农业机械管理站,杭州310001;浙江农林大学农业与食品科学学院,杭州311300
【正文语种】中文
【中图分类】TP212.2
山核桃(Carya cathayensis Sarg)属于胡桃科(Juglandaceae)山核桃属(Carya Nutt.),是我国特有的珍贵干果和木本油料树种。
山核桃仁含油率高达70%以上,是木本油料最高的一种,且不饱和脂肪酸含量亦位居前茅,可达90%。
山核桃中
的油脂受环境、光照、氧气、水分、金属离子等因素的影响及其本身特性,极易氧化酸败从而陈化,产生哈味,且会产生对人体有害的物质,致使商品和营养价值大大降低[1-2]。
因此,加强山核桃陈化检测具重要的实际意义。
目前,山核桃
油脂哈败及其新鲜度评价主要靠感官评定,主观性强、重复性差;因此,众学者尝
试通过理化方法评定山核桃的新鲜度[3-4],理化检测方法虽然准确,但处理
程序复杂,操作繁琐,不具有实时性。
所以,探索快速准确的即时检测方法是大势所趋。
电子鼻是由气敏传感器阵列和模式识别系统组成的一种能识别简单或复杂气体的仪器。
通过电子鼻模拟人的嗅觉,借助模式识别技术对传感器阵列响应信息进行辨识、处理,实现了对样品品质的检测,符合且能满足现代检测所需的快速、实时、准确、无损等要求。
电子鼻技术在食品、化妆品、医药、环境控制、临床诊断等领域已有很多的研究,且取得较好的测定结果[5]。
但此项技术在山核桃检测方面的应用研究未见相关报道。
本文通过对陈化方式、不同陈化时间的山核桃进行陈化检测,提取典型特征,结合统计模式识别方法和神经网络分析方法对输入的山核桃挥发性气味信号进行模式识别,实现对山核桃陈化时间的鉴别,及对未知陈化时间的山核桃样品进行识别,以期为山核桃陈化检测提供一种快速准确的方法。
1 材料与方法
1.1 材料
1.1.1 试验材料
新鲜山核桃产自于浙江临安昌化镇。
将新鲜山核桃置入温度为45℃、湿度为90%
的老化箱,每隔2 d取样一次,获得人工陈化时间分别为0 d、2 d、4 d、6 d的山核桃;将上述地域的新鲜山核桃采用真空包装置于0±1℃环境下自然陈化1 y、2 y的山核桃,获得陈化时间分别为0 y、1 y、2 y的山核桃。
1.1.2 试验仪器
本试验采用PEN2便携式电子鼻(德国AIRSENSE公司),仪器组成主要包含5个
部分:传感器阵列、采样通道、内置泵、控制单元和计算机。
PEN2电子鼻包含
W1C、W5S、W3C、W6S、W5C、W1S、W1W、W2S、W2W和W3S 10个
金属氧化物传感器阵列,各传感器的性能描述见参考文献[6]。
PEN2电子鼻传
感器响应信号值(G/G0)是传感器接触样品挥发物时电导率G与传感器接触经活性
炭过滤后的标准气体时电导率G0的比值。
1.2 试验方法
采用静态顶空采样系统。
把山核桃放置在烧杯内,用保鲜膜将其密封一定时间,积累一定的挥发性物质。
然后通过针头将挥发性气体吸到电子鼻的传感器通道里,然后将尾气排除出外,再进行第二轮顶空采样。
每测完一次,都要采用氮气对样品通道进行清零。
根据其以前研究所确定的实验方法[7],通过方差分析确定山核桃样品密封时间为45 min,密封质量为80 g,检测时间和清洗时间均设置为60 s。
1.3 分析方法
主成分分析(Principal Component Analysis,PCA)是将原变量进行正交变换,使少数几个新变量(主成分)是原变量的线性组合,同时,新变量又尽可能地表征了原变量的数据结构特征而不丢失信息,从而达到将数据降维,排除重叠信息的目的[8]。
主成分分析是研究将多指标问题化为少数几个综合指标问题的一种统计方法[9]。
概率神经网络(Probabilistic Neural Network,PNN)根据Bayes定律和最优判定原则进行模式分类[10],通常由输入层、隐层、加层和输出层构成[11]。
第
1层为输入层,传递函数为线性函数,其作用是转化输入信号;第2层为隐层,它
与输入层之间通过权值Wij相连接,传递函数为g(zi)=exp(zi-1)/σ2,其中zi为该层第i个神经元的输入,σ为均方差;第3层为加层,该层神经元数目与欲分的模式数目相同;第4层为输出层,其神经元输出为离散值1和-1(或零),分别代表输入模式的类别[12]。
2 结果与讨论
2.1 传感器响应分析
图1为人工陈化4 d山核桃的传感器响应信号图。
横坐标为测量时间,纵坐标为
传感器响应信号值。
从图中可以发现,各个传感器对于样本的响应是不同的。
前
10 s内,所有传感器的响应信号强度变化较小,10 s至60 s过程内,除W5S传
感器的响应信号强度迅速增加外,其余传感器的响应信号强度均缓慢趋于稳定,
30 s时开始达到动态平衡。
因此提取第30s的传感器响应信号值数据进行分析。
图1 人工陈化4 d山核桃的传感器响应信号图
2.2 主成分分析
2.2.1 人工陈化
采用SAS统计分析软件对人工陈化山核桃原始数据进行主成分分析,根据主成分
得分绘制二维得分图(如图2所示),可知,第1、2主成分方差贡献率分别为
77.74%、18.10%,前两个主成分累计方差贡献率为95.84%,已包含原始数据的绝大部分信息量,0 d的山核桃明显远离人工陈化的山核桃,0 d和6 d陈化时间的山核桃组内距较小,2 d和4 d陈化时间的山核桃组内距较大且存在部分重叠现象,说明陈化时间对山核桃新鲜度具有一定的影响,且随着陈化时间的增加对其影响越大。
如2 d和4 d陈化时间的山核桃有重叠现象,6 d人工陈化效果明显,且从图2中可以看出,其与2 d和4 d陈化时间的山核桃区域具有明显的界限。
PCA结果表明,主成分分析基本能够正确区分0 d、2 d和4 d、6 d陈化山核桃,
但对区分2 d和4 d陈化时间山核桃存在困难。
图2 不同人工陈化时间山核桃主成分分析得分图
图3为人工陈化山核桃主成分分析的方差累计贡献率与主成分数关系,由图3可知,随着主成分数的增加,方差累计贡献率也逐渐接近100%(代表原始数据的全部信息量),当主成分数为5个时,方差累计贡献率为 99.66%,按照四舍五入法接近100%,因此考虑提取前5个主成分数据来进行后续概率神经网络分析。
图3 人工陈化山核桃主成分分析的方差累计贡献率与主成分数关系
2.2.2 自然陈化
采用SAS统计分析软件对自然陈化山核桃原始数据进行主成分分析,根据主成分得分绘制二维得分图(如图4所示),由图4可知,第一、二主成分方差贡献率分别为53.65%、33.37%,前两个主成分累计方差贡献率为87.02%,已包含原始数据的绝大部分信息量,0 y和2 y陈化时间山核桃组内距较小,1 y陈化时间山核桃组内距较大,0 y和1 y陈化时间山核桃存在部分重叠现象,表明0 y和1 y陈山核桃的部分信息类似或相同,说明经过1 y储存的山核桃品质接近于新鲜山核桃(0 y),而储存2 y的山核桃具有明显陈化现象,经过理化检测也验证了这个推断。
分析结果表明,主成分分析基本能够正确区分2 y、0 y和1 y陈化时间山核桃,但对区分0 y和1 y陈化时间山核桃有一定困难。
图4 不同自然陈化时间山核桃主成分分析得分图
图5所示为自然陈化山核桃主成分分析的方差累计贡献率与主成分数关系,由图5可知,随着主成分数的增加,方差累计贡献率也逐渐接近100%(代表原始数据的全部信息量),当主成分数为6个时,方差累计贡献率为99.71%,按照四舍五入法接近100%,因此考虑提取前6个主成分数据来进行后续概率神经网络分析。
图5 自然陈化山核桃主成分分析的方差累计贡献率与主成分数关系
2.3 概率神经网络
在主成分分析定性分析的基础上,进一步采用概率神经网络识别人工陈化和自然陈化山核桃。
概率神经网络由MATLAB统计分析软件的newpnn过程实现。
2.3.1
人工陈化
将120个山核桃样本分为校正集和预测集,每类人工陈化时间取前20个样本作为
校正集和后10个样本作为预测集,则校正集样本总数为80个,预测集样本总数
为40个。
采用概率神经网络识别4类人工陈化时间山核桃,执行MATLAB软件
的“newpnn”函数语句构建概率神经网络,Spread表示径向基传递函数的分布
密度,Spread值越大,函数越平滑。
在概率神经网络模型建立过程中,主成分数
和Spread值都对模型的判别结果有一定影响,因此采用交互验证的方法优化主成
分数和Spread值2个参数,根据图3分析结果选取前5个主成分特征向量作为
概率神经网络判别模型的输入向量,而Spread默认值为0.1,因此,设定主成分
数的优化区间为[1,2,3,4,5]和 Spread 值的优化区间为[0.1,0.2,
0.3……0.8,0.9]。
优化过程如表 1 ~表 2 所示,当校正集样本的识别率最高时
预测集样本的识别率也最高的判别模型为最佳识别模型,即是主成分数为4和Spread=0.1或Spread=0.2时,所建立的概率神经网络模型识别率最高,校正集
样本的识别率为100%,用该模型验证预测集中的40个样本时,其正确识别率为65%。
预测集样本的详细识别结果见表3,0 d和6 d陈化时间山核桃完全识别正确,2 d陈化时间山核桃有4个样本被错判为4 d陈化时间山核桃,4 d陈化时间
山核桃的10个样本完全被错判为2 d陈化时间山核桃。
表1 不同主成分数和Spread条件校正集样本PNN模型的交互验证识别率主成
分数 Spread=0.1 Spread=0.2 Spread=0.3 Spread=0.4 Spread=0.5 Spread=0.6 Spread=0.7 Spread=0.8 Spread=0.9 1 95.00% 93.75%
91.25% 91.25% 86.25% 86.25% 86.25% 85.00% 85.00%2 98.75% 98.75% 96.25% 95.00% 93.75% 93.75% 93.75% 91.25% 91.25%3 100.00%
98.75% 96.25% 96.25% 96.25% 96.25% 96.25% 95.00% 93.75%4
100.00% 100.00% 96.25% 96.25% 95.00% 95.00% 95.00% 95.00%
95.00%5 100.00% 100.00% 98.75% 97.50% 96.25% 96.25%95.00%
95.00% 95.00%
表2 不同主成分数和Spread条件预测集样本PNN模型的交互验证识别率主成
分数 Spread=0.1 Spread=0.2 Spread=0.3 Spread=0.4 Spread=0.5 Spread=0.6 Spread=0.7 Spread=0.8 Spread=0.9 1 75.00% 75.00%
75.00% 75.00% 77.50% 77.50% 77.50% 77.50% 80.00%2 62.50% 62.50% 62.50% 62.50% 65.00% 65.00% 65.00% 65.00% 70.00%3 60.00% 60.00% 60.00% 60.00% 60.00% 62.50% 65.00% 65.00% 65.00%4 65.00% 65.00% 62.50% 62.50% 62.50% 62.50% 65.00% 67.50% 67.50%5 60.00% 60.00% 60.00% 60.00% 60.00% 60.00% 60.00% 65.00% 65.00%
表3 主成分数为4和Spread=0.1或Spread=0.2时PNN模型预测集数据的识
别结果陈化时间样本数目总体识别率/%0 d 10 10 0 0 0 100 65 2 d 10 0
6 4 0 60 4 d 10 0 10 0 0 0识别结果0 d 2 d 4 d 6 d个体识别率/%6 d 10 0 0 0 10 100
2.3.2 自然陈化
将90个山核桃样本分为校正集和预测集,每类自然陈化时间取前20个样本作为
校正集和后10个样本作为预测集,则校正集样本总数为60个,预测集样本总数
为30个。
采用概率神经网络识别4类自然陈化时间山核桃,执行MATLAB软件
的“newpnn”函数语句构建概率神经网络。
在概率神经网络模型建立过程中,主
成分数和Spread值都对模型的判别结果有一定影响,因此采用交互验证的方法优
化主成分数和Spread值2个参数,根据图5分析结果选取前6个主成分特征向
量作为概率神经网络判别模型的输入向量,设定主成分数的优化区间为[1,2,3,
4,5,6]和 Spread 值的优化区间为[0.1,0.2,0.3……0.8,0.9]。
优化过程
如表 4~表5所示,当校正集样本的识别率最高时预测集样本的识别率也最高的判
别模型为最佳识别模型,即是主成分数为2和Spread=0.1~0.6时,所建立的概
率神经网络模型识别率最高,校正集样本的识别率为100%,用该模型验证预测集
中的30个样本时,其正确识别率为100%。
预测集样本的详细识别结果见表6,0 y、1 y和2 y陈化时间山核桃完全识别正确。
表4 不同主成分数和Spread条件校正集样本PNN模型的交互验证识别率主成
分数 Spread=0.1 Spread=0.2 Spread=0.3 Spread=0.4 Spread=0.5 Spread=0.6 Spread=0.7 Spread=0.8 Spread=0.9 1 83.33% 81.67%
81.67% 83.33% 81.67% 80.00% 80.00% 80.00% 80.00%2 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 98.33% 95.00% 93.33%3 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00%4 100.00% 100.00% 100.00% 100.00% 100.00% 100.00%
100.00% 100.00% 100.00%5 100.00% 100.00% 100.00% 100.00%
100.00% 100.00% 100.00% 100.00% 100.00%6 100.00% 100.00%
100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00%
表5 不同主成分数和Spread条件预测集样本PNN模型的交互验证识别率主成
分数 Spread=0.1 Spread=0.2 Spread=0.3 Spread=0.4 Spread=0.5 Spread=0.6 Spread=0.7 Spread=0.8 Spread=0.9 1 83.33% 83.33%
83.33% 83.33% 86.67% 86.67% 86.67% 86.67% 90.00%2 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00%
100.00%3 93.33% 93.33% 93.33% 93.33% 93.33% 93.33% 93.33%
93.33% 93.33%4 93.33% 93.33% 93.33% 93.33% 93.33% 93.33% 93.33% 93.33% 93.33%5 93.33% 93.33% 93.33% 93.33% 93.33% 93.33% 93.33%
93.33% 93.33%6 93.33% 93.33% 93.33% 93.33% 93.33% 93.33% 93.33% 93.33% 93.33%
表6 主成分数为2和Spread=0.1~0.6时PNN模型预测集数据的识别结果陈化
时间样本数目总体识别率/%0 y 10 10 0 0 100 100 1 y 10 0 10 0 100
识别结果0 y 1 y 2 y个体识别率/%2 y 10 0 0 10 100
3 结论
(1)主成分分析表明,基本可以用来区分不同陈化时间的人工陈化山核桃和自然陈
化山核桃,只是在区分0 d、2 d、4 d、6 d人工陈化时间山核桃时,完全区分2
d和4 d陈化时间山核桃存在困难;在区分0 y、1 y、2 y自然陈化时间山核桃时,
完全区分0 y和1 y陈化时间山核桃存在困难,说明经过1 y储存的山核桃品质接
近于新鲜山核桃(0 y),但到了后期变化较大,经过理化检测也验证了这个推断。
PCA分析也表明陈化时间对山核桃新鲜度的影响很大,且随着陈化时间的增加对
其影响越大。
(2)概率神经网络表明,当主成分数为4和Spread=0.1 或Spread=0.2 时,0 d、2 d、4 d、6 d 人工陈化时间山核桃的校正集样本识别率为100%,预测集样本识
别率为65%;当主成分数为2和Spread=0.1 ~0.6 时,0 y、1 y、2 y 自然陈化时间山核桃的校正集样本识别率为100%,预测集样本识别率为100%。
(3)试验研究表明,基于主成分分析和概率神经网络的电子鼻对自然陈化时间山核
桃的识别结果优于对人工陈化时间山核桃的识别结果。
参考文献:
[1]杨剑婷,郝利平.关于引起核桃中油脂哈败因素的研究初探[J].山西农业大
学学报,2001,21(3):271 -273.
[2]Mexis S F,Badeka A V,Riganakos K A,et al.Effect of Packaging and Storage Conditions on Quality of Shelled Walnuts[J].Food Control,
2009(20):743 - 751.
[3]陶菲,郜海燕,陈杭君,等.不同包装对山核桃脂肪氧化的影响[J].农业工程学报,2008,24(9):303 -305.
[4]郝利平,杨剑婷.贮藏因素对核桃脂肪酶活性与油脂酸价的影响[J].农业工程学报,2005,21(5):170 -172.
[5]Perisa M,Escuder-Gilabert L.A 21st Century Technique for Food Control:Electronic Noses[J].Analytica Chimica Acta,2009(638):1-15. [6]海铮,王俊.电子鼻信号特征提取与传感器优化的研究[J].传感技术学报,2006,19(3):606 -610.
[7]庞林江,王俊,路兴花.电子鼻判别小麦陈化年限的检测方法研究[J].传感技术学报,2007,20(8):1717 -1722.
[8]Labreche S,Bazzo S,Cade S,et al.Shelf Life Determination by E-lectronic Nose:Application to Milk[J].Sensors and Actuators B,
2005(106):199-206.
[9]徐亚丹,王俊,赵国军.检测掺假牛奶的电子鼻传感器阵列的优化[J].传感技术学报,2006,19(4):957 -962.
[10]Abdel Fattah Mohamed,Ren Fuji.GA,MR,FFNN,PNN and GMM Based Models for Automatic Text Summarization[J].Computer Speech and Language,2009(23):126 -144.
[11]Kim D Ookie,Hyawn Kim Dong,Chang Seongkyu.Application of Probabilistic Neural Network to Design Breakwater Armor Blocks
[J].Ocean Engineering,2008(35):294 -300.
[12]吴少雄.小波包概率神经网络控制图在线检测和分析系统[J].农业机械学
报,2008,39(11):211 -215.。