二维相关红外光谱与支持向量机和灰度共生矩阵统计法相结合判别掺杂牛奶
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二维相关红外光谱与支持向量机和灰度共生矩阵统计法相结合
判别掺杂牛奶
单慧勇;曹燕;赵辉;杨仁杰;杨延荣;卫勇
【摘要】应用二维相关红外光谱与支持向量机(SVM)和灰度共生矩阵统计方法相结合对分别掺杂有尿素、三聚氰胺和葡萄糖的牛奶进行判别.以质量浓度为外扰,建立掺杂牛奶的二维相关红外光谱图,选择角二阶矩、主对角线惯性矩、相关系数、熵的均值和标准差作为图像纹理特征并分别建立3种掺杂牛奶的SVM判别模型.结果表明:在对同步谱的分析中,上述3种掺杂牛奶样品中,掺杂尿素的牛奶样品训练集分类准确率为91.7%,预测集的准确率为85.0%;掺杂三聚氰胺和葡萄糖的牛奶的训练集分类准确率和预测集分类准确率分别为96.7%,90.0%和91.7%,100%.用同步谱和异步谱相结合的方法对准确率较低的掺杂尿素的牛奶做进一步试验,两种准确率分别提升为98.1%和92.3%;这一数据的提升是由于两者相结合提供了更大的信息量,有利于掺杂牛奶的判别.据此认为,此方法对掺杂牛奶的判别是可行的.
【期刊名称】《理化检验-化学分册》
【年(卷),期】2019(055)003
【总页数】6页(P254-259)
【关键词】二维相关红外光谱;灰度共生矩阵;掺杂牛奶;支持向量机
【作者】单慧勇;曹燕;赵辉;杨仁杰;杨延荣;卫勇
【作者单位】天津农学院工程技术学院,天津 300384;天津农学院工程技术学院,天津 300384;天津农学院工程技术学院,天津 300384;天津农学院工程技术学院,
天津 300384;天津农学院工程技术学院,天津 300384;天津农学院工程技术学院,
天津 300384
【正文语种】中文
【中图分类】O657.33
最近几年发生的“三聚氰胺”“皮革奶”等事件,使整个乳制品行业的信誉遭受严重危机,如何实现掺杂牛奶的快速检测已经成为影响乳制品行业进一步发展的关键问题[1-5]。
由于牛奶本身体系的复杂多变性、掺杂物的微量性以及掺杂物和牛奶特有成分的特征峰相互重叠的影响,通过一维红外光谱很难对其特征峰进行分析。
相比常规二维红外光谱,二维相关红外光谱具有更高的分辨率,可以更好地提取微弱的特征信息,能对复杂的图谱进行解析[6-8]。
本课题组前期应用二维相关红外光谱方法对
掺杂牛奶进行了研究[9-14],虽可通过人工谱图比对进行分析,但由于噪声影响,存在比对效率低、不够客观,无法实现大批量样品检测等缺点。
为实现二维相关红外光谱的精确量化,本工作以掺杂牛奶的二维相关红外光谱图为研究对象,应用数字图像理论深入研究提取谱图特征信息,克服谱图直接比对存在主观误判和无法实现大量谱图比对的缺点,同时与人工智能支持向量机(SVM)相结合,开展
掺杂牛奶二维相关红外光谱图的鉴别分析工作,以实现掺杂牛奶的快速客观判别。
1 二维相关红外光谱图的构建
1.1 二维相关光谱理论
二维相关光谱表示在给系统施加特定外扰时,测量光谱内部结构以及内部各组成元素产生相应变化的现象,反映了各变化之间的相互作用、相互影响。
图1是在对
测量系统施加外部干扰的情况下获得二维相关光谱的流程图。
图1 二维相关光谱流程示意图Fig.1 Schematic diagram of 2-dimensional correlation spectroscopy
从图1中看到,对测量系统添加外部干扰而引起测量光谱发生改变而得到系统动
态光谱,再通过二维相关分析得到二维相关光谱[8]。
1.2 掺杂牛奶二维相关红外光谱图的构建
试验选用某品牌纯牛奶,以质量浓度为外扰,利用电子天平称取不同质量的掺杂物,按照低密高疏的浓度分布原则,分别配制质量浓度为0.01~0.3g·L-1的掺杂
牛奶、纯牛奶样品各40个。
试验所用仪器为美国Nicolet IR200型傅里叶变换红外光谱仪,采用DTGS检测器,近红外光谱优选波段范围是4 200~4 800cm-1,分辨率1cm-1,扫描间隔为4cm-1,扫描32次求平均值。
通过试验获得纯牛奶、掺杂尿素牛奶、掺杂三聚氰胺牛奶、掺杂葡萄糖牛奶的一维近红外动态光谱数据,共采集240个样品:第一组中1~40号为掺杂尿素的牛奶,41~80号为纯牛奶;第二组中81~120号为掺杂三聚氰胺的牛奶,121~160号为纯牛奶;第三组中161~200号为掺杂葡萄糖的牛奶,201~240号为纯牛奶。
根据二维相关理论进行分析、计算,构造各样品的二维相关同步谱和异步谱[8]。
图2为掺杂尿素牛奶二维相关同步谱和同步异步谱。
图2 掺杂尿素牛奶的二维相关光谱图Fig.2 2-Dimensional correlation spectra of urea-doped milk
2 灰度共生矩阵原理
2.1 灰度共生矩阵的定义
灰度共生矩阵(GLCM)是由 HARALICK等[15]提出的检测像素之间空间关系纹理特征的统计方法。
它的理论基础是灰度图像的二阶组合条件概率密度函数,即指从灰度级i的点离开某一固定位置d=(Dx,Dy)达到灰度为j的概率。
灰度共生矩阵通常用P(i,j)(i,j=0,1,2,…,L-1)来表示,其中L是图像灰度
级,(i,j)是像素的灰度。
d是像素间的空间位置,d不相同则两像素间的距离、方向有差异。
灰度共生矩阵的生成方向(θ)通常有4个,分别为0°,45°,90°,145°,见图3。
图3 灰度共生矩阵的像素对Fig.3 Pixel pairs of gray level co-occurrence matrix
2.2 灰度共生矩阵的特征参数
灰度共生矩阵有14个用于纹理分析特征参数,分别是:角二阶距、对比度、相关度、熵、方差、均值和、方差和、逆差距、差方差、和熵、差熵、聚类阴影、显著聚类和最大概率。
ULABY等[16]的研究表明:在基于灰度共生矩阵的这14个
纹理特征中,仅有4个特征是不相关的,分别为角二阶矩、主对角线惯性矩、相
关系数、熵,这4个特征既便于计算又能达到好的分类精度,试验也选取这4个
特征进行研究。
1)角二阶矩(ASM)
角二阶矩又称能量,是灰度共生矩阵各元素值的平方和,用以衡量图像纹理灰度变化的均一程度。
当灰度共生矩阵的所有元素值均相等时,ASM小,纹理细腻;否则,则ASM大,纹理粗糙。
2)主对角线惯性矩(CON)
灰度共生矩阵主对角线惯性矩又称对比度,是图像纹理清晰度和沟纹深浅的度量。
纹理的沟纹越深,则其对比度越大,效果越清晰;相反,则沟纹越浅,效果也越模糊。
3)相关系数(COR)
式中:μ1、μ2、σ12、σ22 分别定义为
其中μ1、μ2 为均值
相关系数是度量灰度共生矩阵元素在行或列方向上的相似程度。
当矩阵元素值均匀相等时,相关性越大;否则相关性越小。
若图像纹理存在方向性时,则在该方向矩阵的相关系数较大。
相关性的大小反映了图像中局部灰度相关性。
4)熵(ENT)
熵是用来衡量图像信息量的参数,表明能量的分布均匀程度和稳定状态。
就图像而言,当共生矩阵中所有值均相等时,图像纹理越细腻,熵值也越大;反之,图像纹理越复杂,熵值也越小。
3 基于二维相关谱灰度共生矩阵判别掺杂牛奶
3.1 灰度共生矩阵的纹理特征提取
按下述方法对1.2节中所构建的掺杂牛奶二维相关谱图提取纹理特征:
1)对图像灰度量化,为减小计算量,将灰度等级量化为16级;
2)提取水平、对角线、垂直、反对角线不同方向上的灰度共生矩阵;
3)构造特征向量,选取角二阶矩、主对角线惯性矩、相关系数、熵作为图像的纹理特征参数,特征向量由每幅图像的这4个参数的均值和标准差构成。
将特征向量存放在特征矩阵中,特征矩阵的每一行为一幅图像的特征向量,表示的是一幅图像。
4)归一化处理特征向量矩阵。
3.2 掺杂牛奶支持向量机判别模型的建立
支持向量机是为了解决非线性回归和模式分类问题而产生的,因其在解决小样本、高维数、非线性等方面的独特优势,被广泛应用于各个领域的识别和分类[17-
19]。
试验所用工具箱为Libsvm,由台湾大学林智仁教授实验室开发。
建模判别流程图见图4。
图4 建模判别流程图Fig.4 Flow chart of discrimination by modeling 3.2.1 掺杂尿素牛奶的判别
选择掺杂尿素牛奶、纯牛奶各30个作为训练集,余下20个样品作为预测集。
依据上述方法,采用同步谱图提取灰度共生矩阵特征,优化选择惩罚参数c=32和核函数参数g=1,建立掺杂尿素牛奶与纯牛奶SVM判别模型,训练集的自准确率的结果见图5(纵坐标标值0表示纯牛奶,1表示掺杂尿素)。
图5 同步谱判别掺杂尿素牛奶训练集Fig.5 Discrimination of training set of urea-doped milk by synchronous spectra
在训练集60个样品中有2个掺杂尿素牛奶样品被误判为纯牛奶,有3个纯牛奶样品被误判为掺杂尿素牛奶,模型训练集分类准确率为91.7%。
利用所建立的SVM模型对预测集进行预测,预测结果见图6(纵坐标标值0表示纯牛奶,1表示掺杂尿素)。
在预测集20个样品中有3个掺杂尿素牛奶样品被误判为纯牛奶,纯牛奶样品都得到正确判别,模型分类准确率为85.0%。
图6 同步谱判别掺杂尿素牛奶预测集Fig.6 Discrimination of prediction set of urea-doped milk by synchronous spectra
采用同样算法,从80个4 200~4 800cm-1间的同步异步二维相关谱试验样品中选取57个样品(掺杂尿素牛奶、纯牛奶样品各27个)作为训练集,余下的26个样品作为预测集。
依据上述方法,选择最佳参数惩罚参数c=16和核函数参数g=0.5,建立同步异步谱掺杂牛奶与纯牛奶SVM判别模型,训练集自准确率的结果见图7(纵坐标标值0表示纯牛奶,1表示掺杂尿素)。
在80个样品训练集中仅有1个掺杂尿素牛奶样品被误判为纯牛奶,纯牛奶样品没有被误判,模型训练集分类准确率为98.1%。
图7 同步异步谱判别掺杂尿素牛奶训练集Fig.7 Discrimination of training set of urea-doped milk by synchronous asynchronous spectra
利用所建立的SVM模型对所选样品进行训练预测,预测结果见图8(纵坐标标值0表示纯牛奶,1表示掺杂尿素)。
预测集模型分类准确率为92.3%,26个样品中仅有2个纯牛奶样品被误判为掺杂尿素的牛奶,掺杂尿素的牛奶样品没有被误判。
3.2.2 掺杂三聚氰胺牛奶的判别
采用同样的算法,从240个4 200~4 800cm-1间的同步二维相关谱试验样品中选取第二组的60个样品(掺杂三聚氰胺牛奶、纯牛奶样品各30个)作为训练集,余下的20个样品作为预测集。
选择惩罚参数c=16和核函数参数g=8,建立掺杂三聚氰胺牛奶与纯牛奶SVM判别模型,训练集的自准确率结果见图9(纵坐标标值0表示纯牛奶,1表示掺杂三聚氰胺)。
图8 同步异步谱判别掺杂尿素牛奶预测集Fig.8 Discrimination of prediction set of urea-doped milk by synchronous asynchronous spectra
图9 同步谱判别掺杂三聚氰胺牛奶训练集Fig.9 Discrimination of prediction set of melamine-doped milk by synchronous spectra
在训练集60个样品中有1个掺杂三聚氰胺牛奶样品被误判为纯牛奶,有1个纯牛奶样品被误判为掺杂三聚氰胺牛奶,模型训练集分类准确率为96.7%。
利用所建立的SVM模型对所选样品进行训练预测,预测结果见图10(纵坐标标值0表示纯牛奶,1表示掺杂三聚氰胺)。
预测集模型分类准确率为90.0%,20个样品中只有2个掺杂三聚氰胺样品被误判为纯牛奶,纯牛奶样品都得到正确判别。
3.2.3 掺杂葡萄糖牛奶的判别
从240个同步二维相关谱试验样品中选取第三组的60个样品(掺杂葡萄糖牛奶和
纯牛奶样品各30个)作为训练集,余下的20个样品作为预测集。
选择惩罚参数
c=8和核函数参数g=4,建立掺杂葡萄糖牛奶与纯牛奶SVM判别模型,训练集的自准确率结果见图11(纵坐标标值0表示纯牛奶,1表示掺杂葡萄糖)。
在训练集60个样品中有5个掺杂葡萄糖牛奶样品被误判为纯牛奶,纯牛奶样品没有被误判,模型训练集分类准确率为91.7%。
图10 同步谱判别掺杂三聚氰胺牛奶预测集Fig.10 Discrimination of prediction set of melamine-doped milk by synchronous spectra
图11 同步谱判别掺杂葡萄糖牛奶训练集Fig.11 Discrimination of training set of glucose-doped milk by synchronous spectra
利用所建立的SVM模型对所选样品进行训练预测,预测结果见图12(纵坐标标
值0表示纯牛奶,1表示掺杂葡萄糖)。
在预测集20个样品中没有被误判的样品,模型分类准确率为100%。
图12 同步谱判别掺杂葡萄糖牛奶预测集Fig.12 Discrimination of prediction set of glucose-doped milk by synchronous spectra
同步谱判别掺杂尿素牛奶和纯牛奶的预测集准确率为85.0%,准确率偏低,而采用同步异步谱后判别掺杂尿素牛奶预测集准确率是92.3%,训练集的准确率是98.1%,表明同步谱和异步谱相结合信息量更大,更有利于掺杂牛奶的判别。
采用同步谱判别掺杂三聚氰胺牛奶和纯牛奶的预测集准确率为90.0%;同步谱判别掺杂葡萄糖牛奶和纯牛奶的预测集准确率为100%。
总的来说同步异步谱所提取的灰度共生矩阵特征的识别率相对较高,这可能与同步谱和异步谱相结合的信息量更大,更有利于掺杂牛奶判别有关。
本工作以掺杂牛奶的二维相关红外光谱图为研究对象,提取同步谱图灰度共生矩阵的角二阶矩、主对角线惯性矩、相关系数、熵等特征信息,以提取特征的均值和标准差作为纹理特征,与支持向量机相结合,开展掺杂牛奶的二维相关红外光谱图的
量化分析工作。
结果表明,采用提取纯牛奶和掺杂牛奶的二维相关谱图灰度共生矩阵特征来判别掺杂牛奶的方法是可行的,为二维相关谱图的客观量化和自动识别提供了一条新的研究思路。
参考文献:
【相关文献】
[1]秦虹.牛奶掺假及检测方法研究现状[J].甘肃畜牧兽医,2018,48(11):25-28.[2]吉喆,陈文,王铒,等.极谱法测定牛奶中的三聚氰胺[J].理化检验-化学分册,2017,53(9):1014-1019.
[3]谭棕,陈达.牛奶中三聚氰胺的显微拉曼光谱检测新方法研究[J].分析仪器,2016
(S1):51-53.
[4]杨晋辉,郑楠,杨永新,等.红外光谱在牛奶生产和检测方面的研究进展[J].农业工程
学报,2016,32(17):1-11.
[5]姜洪喆,赵昕,褚璇,等.交流阻抗技术在牛奶质量安全检测中的应用[J].中国奶牛,2016(8):45-49.
[6]杨仁杰,杨延荣,刘海学,等.二维相关谱在食品品质检测中的研究进展[J].光谱学与
光谱分析,2015,35(8):2124-2129.
[7]张海洋,廖彩淇,杨仁杰,等.基于近、中红外光谱数据融合掺假牛奶的判定[J].天津
农学院学报,2017,24(4):52-56.
[8] NODA I. Advances in two-dimensional correlation spectroscopy [J].Vibrational Spectroscopy,2004,36(2):143-165.
[9]杨仁杰.基于二维相关谱掺杂牛奶检测方法研究[D].天津:天津大学,2013.
[10]刘海学,杨仁杰,朱文碧.等.基于近红外自相关谱检测奶粉中的三聚氰胺[J].光谱学与光谱分析,2017,37(10):3074-3077.
[11]于舸,杨仁杰,吕爱君,等.基于异谱二维 NIR-IR相关判别掺杂牛奶[J].光谱学与光谱分析,2015,35(8):2099-2102.
[12]杨仁杰,刘蓉,刘海学,等.基于二维红外相关谱的模式识别技术判别掺杂牛奶[J].中国食品学报,2015,15(4):196-200.
[13]崔彩路,杨仁杰,朱文碧,等.二维相关红外谱结合PARAFAC-MLR判别掺杂牛奶[J].天津农学院学报,2015,22(1):19-23.
[14]刘蓉,苗静,杨仁杰.基于二维相关近红外光谱判定牛奶中掺杂的目标物[J].理化检验
-化学分册,2013,49(4):386-390.
[15] HARALICK R M,SHANMUGAM K,DINSTEIN I.Textural features for image classification[J].IEEE Transactions on Systems,Man,and Cybernet-ics,1973,3(6):6102-6211.
[16] ULABY F T,KOUYATE F,BRISCO B,et al.Textural information in SAR images [J].IEEE Transaction on Geoscience and Remote Sensing,1986,24(2):235-241.[17]丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011,40(1):2-10.
[18]李玉景.支持向量机在模式识别领域中的应用研究[D].青岛:青岛大学,2008.[19]忻栋.支持向量机算法的研究及在说话人识别上的应用[D].杭州:浙江大学,2002.。