高光谱图像的特征提取与特征选择研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高光谱图像的特征提取与特征选择研究∗
杨仁欣,杨燕,原晶晶
【摘要】特征提取和特征选择是模式识别的关键问题之一,它影响到分类器的设计及其性能.高光谱图像数据是超高维多特征数据集,如何实现高维特征空间的特征压缩和特征提取是一个重要课题.基于高光谱图像谱图合一、数据维度高的数据结构特点,该文从光谱和图像两个层面分别综述了主成分分析、最小噪声分离、独立成分分析等光谱特征提取方法以及基于颜色、纹理、形状等图像特征提取方法.还详细介绍了核主成分分析和投影寻踪方法这两种高光谱特征提取新方法,并给出了以上方法的应用实例.特征提取和特征选择的研究将为后续的高光谱图像分类奠定良好的基础.
【期刊名称】广西师范学院学报(自然科学版)
【年(卷),期】2015(000)002
【总页数】5
【关键词】高光谱图像;特征提取;特征选择;主成分分析;最小噪声分离;独立成分分析;核主成分分析;投影寻踪
0 引言
特征提取和特征选择在模式识别中扮演着一个重要角色.特征提取过程的实质是通过映射或变换的方法,将高维空间中的特征描述用低维空间的特征来描述.特征选择是从众多特征中找出那些最有效的特征来实现降维.基于高光谱图像图谱合一,数据结构高维的特点,本文从光谱和图像两个层面综述了典型的高光谱图像的特征提取和特征选择方法,并给出相应的应用实例.
1 高光谱特征提取和特征选择的研究
高光谱特征提取是指对原始的光谱空间特征进行重新组合和优化,提取出最适合当前应用需求的新特征.高光谱特征提取如图1[1]所示,通常使用线性或非线性方程,将原始的高维特征空间投影到低维的优化后的新特征空间,提取的特征应同时满足类别可分性准则.高光谱特征选择则是对原始特征空间的子集挑选,选出那些最具有可分性的光谱波段.高光谱特征选择如图2所示.常用的高光谱特征提取和特征选择方法有主成分分析、最小噪声分离、独立成分分析法等.
1.1 主成分分析
主成分分析是一种统计分析方法.所谓主成分,其实也就是原变量的线性组合.即假设有p个指标,我们把这p个指标看做p个随机变量,记为X1,X2,…,Xp,主成分分析实质就是要讨论这p个指标的线性组合问题:
主成分分析法的缺点:
(1)在主成分分析中,通常使所提取的前几个主成分的累计贡献率能够达到一个较高的值,其次对这些被提取的主成分必须都能够给出一个合理的解释,否则所谓的主成分将毫无意义.
(2)主成分的含义不是很清晰,不像原始变量的含义那么明确.
赵丽红[2]等把其改进算法二维对称主成分分析应用到人脸识别中,取得了很好的识别性能.杨秀坤等提出了主成分分析-二阶导数光谱成像方法,并通过兔子动脉红外显微图像中胆固醇分布的成像实验,验证该方法的可行性和有效性.实验结果表明,该方法可以提高光谱分辨率[3].
1.2 最小噪声分离
Green(1988)在主成分分析方法的基础上,又发展了最小噪声分离.采用最小噪声分离变换使变换后各成分按照信噪比而不是方差从大到小排序.以下是其基本流
程:
魏新华[4]等人采用高光谱技术和最小噪声分离分析方法对含有异性纤维的籽棉图像进行研究,试验结果表明,该方法的识别率达到91.0%,该研究可为棉花异性纤维检测系统的开发提供参考.肖雄斌[5]等人提出的一种基于最小噪声分离变换的高光谱图像异常检测方法,提高了异常检测率.林娜[6]等人提出的核最小噪声分离变换高光谱影像的非线性特征提取方法,可获得优于最小噪声分离特征提取的端元提取效果.
1.3 独立成分分析
独立成分分析是一种利用统计原理进行计算的方法,主要用于高光谱数据特征提取.
于绍慧[7]等人利用独立成分分析对微分谱进行解析更有利于多组分混合三维荧光光谱所含成分的识别.白璘[8]等人提出的一种独立成分分析和小波变换相结合的高光谱图像有损压缩方法,可以很好地保留高光谱图像的光谱特性.何元磊[9]等人提出的一种基于独立成分分析的异常探测算法,取得了良好的检测性能,且运算复杂度较低.
2 图像特征提取和特征选择的研究
由于高光谱图像数据信息谱图合一的特点,基于图像的特征提取可以提取样本的空间分布特征信息,该特征也可用于反映样本信息.常用的图像特征提取和特征选择方法所涉及的特征有颜色特征、纹理特征、形状特征.
2.1 颜色特征
颜色特征反映了图像的整体特征,通常采用颜色的一阶矩(Mean)、二阶矩(Variance)和三阶矩(Skewness)来表达图像的颜色特征.
设P(j,i)为图像的第j个像素的第i个颜色分量值,则一阶矩为
它表示待测区域的颜色均值.二阶距为
它表示待测区域的颜色方差,即不均匀性.三阶距为
三阶矩反映颜色的不对称性.如果图像颜色完全对称,其值应为零.
徐贵力等提出用百分率直方图法提取缺素叶片图像颜色特征,此方法提取的颜色特征能理想地识别缺素番茄叶片[10].金伟提出的一种新的颜色特征提取方法,即像素不连通区域面积直方图法,对图像旋转、缩放等具有较好的鲁棒性[11].郑小东等根据植物生长智能监控的需求,设计了叶颜色特征提取方法,为后续决策处理提供了数据支持[12].
2.2 纹理特征
图像的纹理特征是由图像上地物重复排列造成的灰度值有规则的分布,它不同于灰度和颜色等图像特征.图像的纹理特征反映了图像固有的属性,能够体现图像的重要信息,比如图像的粗糙程度、细致程度和均匀程度等.常见的纹理特征提取方法有统计法、结构法和模型法.
孙磊等针对全色图像云检测与雪检测的问题,提出了一种基于多种纹理特征的特征提取方法,实验结果验证了其算法的有效性[13].白丽等提出的基于皮肤纹理特征的高分辨人脸图像识别算法,可以提高人脸识别的性能[14].章勇勤等分别从时域和频域的角度提出的纹理特征检测算子,有效地提高了图像的信噪比[15].
2.3 形状特征
形状特征描述的是图像的一种局部特征,是其在局部区域的几何性质.
毋媛媛等将不变矩理论引入作物病害图像形状特征提取中,通过运用主成分分析和统计分析方法,得到适合两种作物病害识别的形状特征,并将其应用到作物病害