高光谱影像特征选择与提取
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其公式如下:
其中:Si为第i个波段的标准差; 和 是第i 波段与其前后两波段的相关系数或i波段与任意两个 波段的相关系数;是第i幅图像指数的大小。
由于基于全局的波段选择算法,选择的波段往往是 联虚地集中在某一个连续子空间中。而连续子空间 往往相似性大,这就造成信息重复使用,影响后续 的处理效果。
(A1为吸收峰左半端的面积,A为吸收峰的整体面
积)。
利用这些参数可以对地物进行识别和分类,如对同 类地物光谱曲线特征求交得到识别地物的有效特征; 对不同类地物光谱曲线特征求交得到区分不同类地 物的有效特征,从而达到快速识别和实现地物分类 的目的。
不同地物光谱曲线,其吸收波峰波谷形状、位置、
式中,Ui、Uj分别表示i、j类的亮度均值矢量, 分别为i、j类的协方差矩阵,tr[A]表示矩阵A对角 线元素之和。
式中符号的意义同于“离散度”公式中的定义。
对于任何一给定的地物类别,只要算出这两个不同 类别在所有可能的波段组合中的标准距离、离散度 或B距离,并去最大者,便是区分这两个类别的最 佳波段组合,即最优子集。
像元大小 30m 图像大小 256x6460 数据产品有Level0(原始数据)
和Level1两种 L1数据产品已经进行了辐射校正
回归偏度的表示
回归 偏度 分析
高光谱特征选择与特征提取研究 苏红军,杜培军 高光谱遥感数据解译的最佳波段选择方法研究 刘建平,赵英时 高光谱遥感数据最佳波段选择方法试验研究 刘建平,赵英时,孙淑玲 高光谱遥感图像特征选择和提取方法的比较_基于试验区Barrax的HyMap数
“均值间的标准距离”d被定义为:
式中,u1、u2分别为两类对应的样本区域的光谱 均值; 分别为两类对于的样本区域的方差。d 反映两类在每一波段内地可分性大小。d越大,可 分性越大。此法是一维特征空间中两类别间可分性 的一种度量,它不适合进行多变量的研究。对于多 维特征空间、多变量的可分性研究,可用离散度、 B距离等方法。
段的选优方法即最佳指数因子。该方法根据下式给 出N个波段组合中的最优指数大小:
其中:Si为第i个波段的标准差;Ri,j表示第i个波 段与第j个波段之间的相关系数。
选择的波段数目一般取3,即将所有可能的三个波 段组合在一起。OIF越大,则相应组合波段图像的 信息量就越大。
在实际应用中,这种方法存在局限性。首先,它选 择出来的最优波段未必是最优点;其次,OIF算法
宽度、深度和对称度等属性也不同。每一个光谱吸 收特征可以由光谱吸收谷点M及其两个肩部S1 和 S2组成,或由吸收峰值点及两个肩部组成。
植被指数 导数光谱
常规多光谱植被指数通常表达为近红外波段与可见
光红波段的差值和比值的组合,常用的是比值植被 指数(RVI)和标准化植被指数(NDVI)。对于高 光谱遥感数据而言,NDVI可以被看作是一个梯级 函数,来表达植被反射率在=0.7um处的突然递增。
高光谱遥感大量的光谱波段数据为人们了解地物提 供了丰富的信息,这对于后续进行的地物分类和目 标识别是十分有益的然而波段的增多也必然导致信 息的冗余和数据处理难度的增加。如何既能有效利 用高光谱数据的最大信息,又能较快地处理高光谱 数据成为光谱数据处理的研究热点和未来发展方向。 其中压缩波段和光谱特征提取与选择的研究是两个 重点。
吸收波段位置(P)是光谱最小值对应的波长,有
时也可定义为光谱最大值对应的波长;吸收波段位 置处的光谱值即反射值(R);波段深度(H)是由
于矿物化学成分在某波长点上吸收光谱特征而比邻 接波段有较低的反射率;宽度(W)是指波段深度
一半处的宽度;斜率
。
其中: 、 分别为吸收终点、吸收始点反射
率值; 、 为相应的波长;吸收峰对称度S=A1/A
据 陈桂红,唐伶俐,姜小光 高光谱遥感数据特征提取算法与分类研究 苏红军,杜培军,盛业华 基于自动子空间划分的高光谱数据特征提取 谷延锋,张晔 投影寻踪方法与高光谱遥感图像数据特征提取的研究 刘卓,易东云 成像光谱数据的光谱信息特点及最佳波段选择_以北京顺义区为例 姜小光,
王长耀 成象光谱图象光谱吸收鉴别模型与矿物填图研究 王晋年,郑兰芬,童庆禧 高光谱数据的波段序列结构分析与应用研究 张远飞,吴德文,张艮中,朱谷
波段压缩 光谱特征
基于信息量原则(波段选择) 基于类别可分性原则(波段选择) 基于搜索方法(波段选择) 基于数学变换
熵和联合熵 最佳指数因子(optimal index factor,OIF) 自动子空间划分 自适应波段选择(adaptive band selection,ABS) 波段指数(band index,BI)
光谱曲线特征 光谱运算与变换特征 光谱相似性度量特征
光谱曲线直接编码 光谱吸收特征参数 光谱吸收指数
光谱曲线特征的重要思想是强调曲线形状,直接编
码是一种非常直观的方式,最常用的是二值编码 (binary coding),即对每一像元,对各波段属 性值与某一阀值比较,相应地赋予“0”或“1”的 编码。
主要有主成份分析(Principal Component Analysis,PCA)、小波变换(Wavelet Transform, WT)、独立成分(Independent Component Analysis ,ICA、投影寻踪方法等
从操作对象、算法原理、特征性质和应用方式等方 面综合考虑,光谱体系包括光谱曲线特征、光谱变 换特征和光谱相似度量特征三个层次,分别对应于 全部波段的像元光谱曲线分析、部分波段的数据变 换与组合、光谱相似性度量三种应用模式。
植被指数在高光谱应用中非常重要,能够描述植被 的精细信息如叶面积指数LAI、植土比、植被组分
等,以进行植被指数与生物量预测,在有些分类如
神经网络分类器中经常将其作为一个独立特征参加 分类。
导数光谱也称光谱微分技术(Spectral Derivative)。采用导数光谱技术可以消除光谱数
据之间的系统误差、减弱大气辐射、散射和吸收对 目标光谱的影响,以便提取可识别地物的光谱吸收 参数(波长位置、深度、宽度和吸收光谱指数等); 光谱一阶、二阶和高阶微分可以消除背景噪声,分 辨重叠光谱。
对于高光谱图像波段选择而言计算量过大。
该方法通过定义波段相关系数矩阵及其近邻可传递 相关矢量,将高光谱数据空间划分为适合的数据子 空间。这种划分方法有着充分的理论依据,反映了 数据的局部特性。自动子空间划分就是根据相关系 数矩阵灰度图成块的特点,依据高光谱影像相邻波 段相关系数的大小,将波段划分为适合的数据子空 间。划分好子空间后,再进行波段选择。
其中S[i]为第i波段编码Xi为该波段原始属性值,T
为阀值。通常阀值选整个光谱向量的平均值,也可 以取向量中值或根据光谱曲线进行人工阀值选择。
[
二值编码采用单阀值进行处理,划分取决范围较大,
表达进度较低。一种改进算法是多值编码。四值编码基
本方法是:首先对整个像元光谱向量取平均值,得到阀
值T0,将像元属性值分为
相关矩阵为:
进一步地,我们将可传递的相关矢量定义为:
我们对该矢量进行处理,从中提取局部相关的极小 值。根据这些自动提取的极小值(设在波段开区间 (1,N)内这样的极小值共有P-1个),我们将高 光谱空间S划分为P个适合的数据子空间(它的维数 是Lj(j=1,2,……,p-1,))
该方法针对OIF方法在实际应用中存在的局限性,充 分考虑了各波段的空间相关性和谱间相关性。
基于以上考虑,将高光谱数据分为K组,每组波段 数分别为n1,n2,……nk,定义波段指数为:
式中( 为第i波段的均方差, 为第i波段与所
在组内其他波段相关系数的绝对值之和的平均值, 为第i波段与所在组以外地其它波段之间的相关系数 的绝对值之和)。
均值间的标准距离 离散度 类间平均可分性 B距离
根据香农信息论原理,一幅8bit表示的图像X的熵 为:
式中:X为输入图像,Pi为图像像素灰度值为i的概 率。
同理,两个波段联合熵为: n个波段图像的联合熵为:
高光谱图像数据波段标准差大,则信息量丰富;而
波段间的相关系数小,波段信息冗余度小。根据以 上原理,Chavez等人与1982年提出了一种组合波
为光谱角度。在具体计算中并不需要求出实践角度,
采用光谱角余弦作为判据即可。同类像元光谱角余 弦较大,接近于1,而不同类像元的光谱角余弦则 较少。
光谱角在衡量像元光谱相似性方面具有明显的优越 性,光谱角填图SAM(spectral angle mapping)
在高光谱遥感信息分类、聚类都得到了非常广泛的 应用。
昌,李红 高光谱遥感数据光谱特征的提取与应用 杜培军,陈云浩,方涛,陈雍业 基于高光谱图像的特征提取/选择及其应用的研究(硕士论文) 谈晓晔 高光谱遥感数据最佳波段选择方法研究(硕士论文)杨金红
P 、
此外,在高光谱遥感像元相似度量与特征衡量中,
一些常规的指标如相关系数、高维空间距离等也可 以作为量度指标。
示例数据(Hyperion西藏驱龙) 10nm光谱分辨率 1-70波段覆盖356-1058nm的可
见光和近红外区域
71-242波段覆盖852-2577nm 的短波红外波段
式中:X={X1,X2,……,XN}为光谱向量,N为波段 数,λ={λ1, λ2,……,λN}为波长集合。
以此类推,可以计算出任意阶导数光谱。通过导数 光谱运算可以发现待定地物某阶导数具有明显区别 于其它地物的特征,从而用于地物识别。
植被指数与导数光谱实质是在光谱空间上进行特定
运算以形成新的特征,按照这一思路,可以设计其
它光谱运算特征,如波段求和、取均值以及其它更 复杂的运算获取的特征。
光谱角填图(spectral angle mapping)
光谱信息散度 SID(Spectral information divergence)
式中,N为波段数,A=( , ,……, )和B= ( , ,……, )分别表示两个光谱向量,其 中元素 、 表示像元在第i个波段上的反射率,a
遥感所 张艮中
高光谱影像特点 高光谱影像特征选择与提取 蚀变信息提取应用示例
高光谱遥感是20世纪最后二十年,人类在对地观测
方面取得的重大技术突破之一,也是当前及以后几 十年内的遥感前沿技术。它利用成像光谱仪纳米级 的光谱分辨率,获取许多非常窄且光谱连续的图像 数据,实现地物空间、辐射、光谱信息的同步获取; 为每个像元提供数十至数百个窄波段的光谱信息, 并生成一条完整而连续的光谱曲线。
上面几种方法是针对两个类别而言,也就是说它们 都是类对间的可分型度量。对于对类别而言,一个 常用的办法是计算平均可分型的平均值,并按平均 值的大小排列所有被评价的子集顺序,从而选择最 佳组合波段。
分为最优(Optimal)搜索算法和次优搜索算法。
目前实际高光谱图像波段选择都使用次优搜索算法。 次优搜索算法是依照准则函数选择一组性能较好的, 但不一定是最好的特征集合。传统的方法有有序贯 前向选择法(Sequential Forward Selection, SFS)和序贯后向选择法(Sequential Backward Selection ,SBS)
、
两个区
间,确定两个区间的像元,在分别对两个区间的像元属 性值取均值,得到两个新的阀值 、 ,最终形成四个
区间间、Βιβλιοθήκη 、、,分别用0、
1、2、3表示,对每一像元向量,根据其各波段属性值
所处区间分别赋以相应的编码,最后进行匹配比较。
地物光谱曲线反映了地物的吸收和反射特征,对光
谱吸收特征参数的提取将成为未来高光谱信息处理 研究的主要方向。光谱吸收特征主要由以下特征参 数表示,吸收波长波段位置(P)、反射值(R), 深度(H)、宽度(W)、斜率(K)、对称度 (S)、面积(A)等。
其中:Si为第i个波段的标准差; 和 是第i 波段与其前后两波段的相关系数或i波段与任意两个 波段的相关系数;是第i幅图像指数的大小。
由于基于全局的波段选择算法,选择的波段往往是 联虚地集中在某一个连续子空间中。而连续子空间 往往相似性大,这就造成信息重复使用,影响后续 的处理效果。
(A1为吸收峰左半端的面积,A为吸收峰的整体面
积)。
利用这些参数可以对地物进行识别和分类,如对同 类地物光谱曲线特征求交得到识别地物的有效特征; 对不同类地物光谱曲线特征求交得到区分不同类地 物的有效特征,从而达到快速识别和实现地物分类 的目的。
不同地物光谱曲线,其吸收波峰波谷形状、位置、
式中,Ui、Uj分别表示i、j类的亮度均值矢量, 分别为i、j类的协方差矩阵,tr[A]表示矩阵A对角 线元素之和。
式中符号的意义同于“离散度”公式中的定义。
对于任何一给定的地物类别,只要算出这两个不同 类别在所有可能的波段组合中的标准距离、离散度 或B距离,并去最大者,便是区分这两个类别的最 佳波段组合,即最优子集。
像元大小 30m 图像大小 256x6460 数据产品有Level0(原始数据)
和Level1两种 L1数据产品已经进行了辐射校正
回归偏度的表示
回归 偏度 分析
高光谱特征选择与特征提取研究 苏红军,杜培军 高光谱遥感数据解译的最佳波段选择方法研究 刘建平,赵英时 高光谱遥感数据最佳波段选择方法试验研究 刘建平,赵英时,孙淑玲 高光谱遥感图像特征选择和提取方法的比较_基于试验区Barrax的HyMap数
“均值间的标准距离”d被定义为:
式中,u1、u2分别为两类对应的样本区域的光谱 均值; 分别为两类对于的样本区域的方差。d 反映两类在每一波段内地可分性大小。d越大,可 分性越大。此法是一维特征空间中两类别间可分性 的一种度量,它不适合进行多变量的研究。对于多 维特征空间、多变量的可分性研究,可用离散度、 B距离等方法。
段的选优方法即最佳指数因子。该方法根据下式给 出N个波段组合中的最优指数大小:
其中:Si为第i个波段的标准差;Ri,j表示第i个波 段与第j个波段之间的相关系数。
选择的波段数目一般取3,即将所有可能的三个波 段组合在一起。OIF越大,则相应组合波段图像的 信息量就越大。
在实际应用中,这种方法存在局限性。首先,它选 择出来的最优波段未必是最优点;其次,OIF算法
宽度、深度和对称度等属性也不同。每一个光谱吸 收特征可以由光谱吸收谷点M及其两个肩部S1 和 S2组成,或由吸收峰值点及两个肩部组成。
植被指数 导数光谱
常规多光谱植被指数通常表达为近红外波段与可见
光红波段的差值和比值的组合,常用的是比值植被 指数(RVI)和标准化植被指数(NDVI)。对于高 光谱遥感数据而言,NDVI可以被看作是一个梯级 函数,来表达植被反射率在=0.7um处的突然递增。
高光谱遥感大量的光谱波段数据为人们了解地物提 供了丰富的信息,这对于后续进行的地物分类和目 标识别是十分有益的然而波段的增多也必然导致信 息的冗余和数据处理难度的增加。如何既能有效利 用高光谱数据的最大信息,又能较快地处理高光谱 数据成为光谱数据处理的研究热点和未来发展方向。 其中压缩波段和光谱特征提取与选择的研究是两个 重点。
吸收波段位置(P)是光谱最小值对应的波长,有
时也可定义为光谱最大值对应的波长;吸收波段位 置处的光谱值即反射值(R);波段深度(H)是由
于矿物化学成分在某波长点上吸收光谱特征而比邻 接波段有较低的反射率;宽度(W)是指波段深度
一半处的宽度;斜率
。
其中: 、 分别为吸收终点、吸收始点反射
率值; 、 为相应的波长;吸收峰对称度S=A1/A
据 陈桂红,唐伶俐,姜小光 高光谱遥感数据特征提取算法与分类研究 苏红军,杜培军,盛业华 基于自动子空间划分的高光谱数据特征提取 谷延锋,张晔 投影寻踪方法与高光谱遥感图像数据特征提取的研究 刘卓,易东云 成像光谱数据的光谱信息特点及最佳波段选择_以北京顺义区为例 姜小光,
王长耀 成象光谱图象光谱吸收鉴别模型与矿物填图研究 王晋年,郑兰芬,童庆禧 高光谱数据的波段序列结构分析与应用研究 张远飞,吴德文,张艮中,朱谷
波段压缩 光谱特征
基于信息量原则(波段选择) 基于类别可分性原则(波段选择) 基于搜索方法(波段选择) 基于数学变换
熵和联合熵 最佳指数因子(optimal index factor,OIF) 自动子空间划分 自适应波段选择(adaptive band selection,ABS) 波段指数(band index,BI)
光谱曲线特征 光谱运算与变换特征 光谱相似性度量特征
光谱曲线直接编码 光谱吸收特征参数 光谱吸收指数
光谱曲线特征的重要思想是强调曲线形状,直接编
码是一种非常直观的方式,最常用的是二值编码 (binary coding),即对每一像元,对各波段属 性值与某一阀值比较,相应地赋予“0”或“1”的 编码。
主要有主成份分析(Principal Component Analysis,PCA)、小波变换(Wavelet Transform, WT)、独立成分(Independent Component Analysis ,ICA、投影寻踪方法等
从操作对象、算法原理、特征性质和应用方式等方 面综合考虑,光谱体系包括光谱曲线特征、光谱变 换特征和光谱相似度量特征三个层次,分别对应于 全部波段的像元光谱曲线分析、部分波段的数据变 换与组合、光谱相似性度量三种应用模式。
植被指数在高光谱应用中非常重要,能够描述植被 的精细信息如叶面积指数LAI、植土比、植被组分
等,以进行植被指数与生物量预测,在有些分类如
神经网络分类器中经常将其作为一个独立特征参加 分类。
导数光谱也称光谱微分技术(Spectral Derivative)。采用导数光谱技术可以消除光谱数
据之间的系统误差、减弱大气辐射、散射和吸收对 目标光谱的影响,以便提取可识别地物的光谱吸收 参数(波长位置、深度、宽度和吸收光谱指数等); 光谱一阶、二阶和高阶微分可以消除背景噪声,分 辨重叠光谱。
对于高光谱图像波段选择而言计算量过大。
该方法通过定义波段相关系数矩阵及其近邻可传递 相关矢量,将高光谱数据空间划分为适合的数据子 空间。这种划分方法有着充分的理论依据,反映了 数据的局部特性。自动子空间划分就是根据相关系 数矩阵灰度图成块的特点,依据高光谱影像相邻波 段相关系数的大小,将波段划分为适合的数据子空 间。划分好子空间后,再进行波段选择。
其中S[i]为第i波段编码Xi为该波段原始属性值,T
为阀值。通常阀值选整个光谱向量的平均值,也可 以取向量中值或根据光谱曲线进行人工阀值选择。
[
二值编码采用单阀值进行处理,划分取决范围较大,
表达进度较低。一种改进算法是多值编码。四值编码基
本方法是:首先对整个像元光谱向量取平均值,得到阀
值T0,将像元属性值分为
相关矩阵为:
进一步地,我们将可传递的相关矢量定义为:
我们对该矢量进行处理,从中提取局部相关的极小 值。根据这些自动提取的极小值(设在波段开区间 (1,N)内这样的极小值共有P-1个),我们将高 光谱空间S划分为P个适合的数据子空间(它的维数 是Lj(j=1,2,……,p-1,))
该方法针对OIF方法在实际应用中存在的局限性,充 分考虑了各波段的空间相关性和谱间相关性。
基于以上考虑,将高光谱数据分为K组,每组波段 数分别为n1,n2,……nk,定义波段指数为:
式中( 为第i波段的均方差, 为第i波段与所
在组内其他波段相关系数的绝对值之和的平均值, 为第i波段与所在组以外地其它波段之间的相关系数 的绝对值之和)。
均值间的标准距离 离散度 类间平均可分性 B距离
根据香农信息论原理,一幅8bit表示的图像X的熵 为:
式中:X为输入图像,Pi为图像像素灰度值为i的概 率。
同理,两个波段联合熵为: n个波段图像的联合熵为:
高光谱图像数据波段标准差大,则信息量丰富;而
波段间的相关系数小,波段信息冗余度小。根据以 上原理,Chavez等人与1982年提出了一种组合波
为光谱角度。在具体计算中并不需要求出实践角度,
采用光谱角余弦作为判据即可。同类像元光谱角余 弦较大,接近于1,而不同类像元的光谱角余弦则 较少。
光谱角在衡量像元光谱相似性方面具有明显的优越 性,光谱角填图SAM(spectral angle mapping)
在高光谱遥感信息分类、聚类都得到了非常广泛的 应用。
昌,李红 高光谱遥感数据光谱特征的提取与应用 杜培军,陈云浩,方涛,陈雍业 基于高光谱图像的特征提取/选择及其应用的研究(硕士论文) 谈晓晔 高光谱遥感数据最佳波段选择方法研究(硕士论文)杨金红
P 、
此外,在高光谱遥感像元相似度量与特征衡量中,
一些常规的指标如相关系数、高维空间距离等也可 以作为量度指标。
示例数据(Hyperion西藏驱龙) 10nm光谱分辨率 1-70波段覆盖356-1058nm的可
见光和近红外区域
71-242波段覆盖852-2577nm 的短波红外波段
式中:X={X1,X2,……,XN}为光谱向量,N为波段 数,λ={λ1, λ2,……,λN}为波长集合。
以此类推,可以计算出任意阶导数光谱。通过导数 光谱运算可以发现待定地物某阶导数具有明显区别 于其它地物的特征,从而用于地物识别。
植被指数与导数光谱实质是在光谱空间上进行特定
运算以形成新的特征,按照这一思路,可以设计其
它光谱运算特征,如波段求和、取均值以及其它更 复杂的运算获取的特征。
光谱角填图(spectral angle mapping)
光谱信息散度 SID(Spectral information divergence)
式中,N为波段数,A=( , ,……, )和B= ( , ,……, )分别表示两个光谱向量,其 中元素 、 表示像元在第i个波段上的反射率,a
遥感所 张艮中
高光谱影像特点 高光谱影像特征选择与提取 蚀变信息提取应用示例
高光谱遥感是20世纪最后二十年,人类在对地观测
方面取得的重大技术突破之一,也是当前及以后几 十年内的遥感前沿技术。它利用成像光谱仪纳米级 的光谱分辨率,获取许多非常窄且光谱连续的图像 数据,实现地物空间、辐射、光谱信息的同步获取; 为每个像元提供数十至数百个窄波段的光谱信息, 并生成一条完整而连续的光谱曲线。
上面几种方法是针对两个类别而言,也就是说它们 都是类对间的可分型度量。对于对类别而言,一个 常用的办法是计算平均可分型的平均值,并按平均 值的大小排列所有被评价的子集顺序,从而选择最 佳组合波段。
分为最优(Optimal)搜索算法和次优搜索算法。
目前实际高光谱图像波段选择都使用次优搜索算法。 次优搜索算法是依照准则函数选择一组性能较好的, 但不一定是最好的特征集合。传统的方法有有序贯 前向选择法(Sequential Forward Selection, SFS)和序贯后向选择法(Sequential Backward Selection ,SBS)
、
两个区
间,确定两个区间的像元,在分别对两个区间的像元属 性值取均值,得到两个新的阀值 、 ,最终形成四个
区间间、Βιβλιοθήκη 、、,分别用0、
1、2、3表示,对每一像元向量,根据其各波段属性值
所处区间分别赋以相应的编码,最后进行匹配比较。
地物光谱曲线反映了地物的吸收和反射特征,对光
谱吸收特征参数的提取将成为未来高光谱信息处理 研究的主要方向。光谱吸收特征主要由以下特征参 数表示,吸收波长波段位置(P)、反射值(R), 深度(H)、宽度(W)、斜率(K)、对称度 (S)、面积(A)等。