高光谱遥感数据的特征选择与提取
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CHENLI
4
5.1 最优特征的选择——可分性
为了进行最优选择,我们需要一个准则来衡量。 如果特征可以进行分类,那么我们利用分类的 错误概率来作为特征选择的准则。前人的研究 表明:可分性越高的特征,分类错误的概率越 低,选择的特征越优。
最优特征——分类错误概率——可分性
CHENLI
5
可分性准则
选择可分性准则必须综合考虑两个策略: 一、选择各类平均可分性最大的特征 二、选择最难分的类别具有的可分性最大的特征
谱数据比传统数据多1-2个数量级,表现在显示,
存储,管理方面相当繁琐
(2)计算量增大:数据的膨胀导致计算机处理
载荷大幅度增加,寻找有效地降维空间手段是
必要的
(3)统计参数的估计误差增大:利用统计方法
为了达到比较精确的估计,样本个数一般是波
段数的100倍以上,这在高光谱数据中往往无法
实现,因此,导致了分类精度的普遍下降。
第一个策略能均衡照顾到各类的可分性; 第二个策略能照顾到最难分的类别。
CHENLI
6
光谱可分性准则
设计光谱可分性的准则必须满足三个方面的要 求(黄凤岗等,1998):
(1)与错误概率具有单调关系。这样准则取最
大值的情况下,所得到的错误概率应该是最小 的。
(2)度量特性。设定两类地物类别i,j的度量特
CHENLI
21
计算机搜索:
CHENLI
22
由包络线去除法调整的明矾石光谱曲线
CHENLI
23
包络线去除前后的光谱反射率曲线对比
CHENLI
24
2)选择特征波段区分地物
举例说明:经过包络线去除后,可以有效的区 分高岭石与白云石的有效区间,这里挑选5个 特征波段: B1(2.16) B2(2.18) B3(2.21) B4(2.32) B5(2.38)
CHENLI
19
1.光谱特征位置搜索
特征位置通常是要确定特征吸收波段的位置 分为以下三个部分:
1)包络线去除(包络线归一化) 包络线从外观上面来看,相当于光谱曲线的“外 壳”,我们用连续的这种折线段来近似表示光谱 曲线的包络线。
CHENLI
20
手工搜索:利用定义手工逐点直线连接突出的
“峰”值点,并使得折线在“峰”值点的外角 >180度,然后用实际光谱波段值去除相应的 波段值,这样归一化后,峰值点均为1,非 “峰”值点均小于1。这样就很容易测定吸收 特征参数。
8
(1)各类样本间的平均距离
各类样本之间的距离越大,类别可分性越大,因此可 以利用各类样本之间的距离的平均值作为可分性的准 则。
d|12|
例如:常用的距离函数有欧氏距离,马氏距离,明氏 距离等。
但是,很多情况下,类别之间的平均距离并不一定代 表了类别之间的可分性。如下图所示
CHENLI
9
两种分布的可分性比较
CHENLI
17
5.2 光谱特征选择
CHENLI
18
通过特征选择,可以强化最具可分性的光谱波段, 这里分为:光谱特征位置搜索和光谱距离统计。
光谱特征位置搜索:根据专家对特定地物的物理 化学性质和光谱特性分析,选择最具有排他性的 光谱特征波段。
光谱距离统计:在光谱可分性距离的统计准则下, 选择光谱波段子集,使得在某一个光谱可分性距 离统计准则下,其统计差异最大或者最优。
性为
J
ij
,J
越大,两类特征的分离程度越大。
ij
(3)单调性。新加入的特征,准则函数的值并
不减小。
CHENLI
7
可分性准则所描述的指标
满足这个策略的可分性准则有很多,归纳起来 可以分为以下四种准则: (1)各样本之间的平均距离; (2)类别间的相对距离; (3)离散度; (4)J-M距离;
CHENLI
CHENLI
13
(3)离散度 离散度可以克服当两个类别均值相等时,不能有效区
分类别的局限,离散度表达式为:
当类别多于两个时,可以用平均离散度来衡量类别可 分性。
CHENLI
14
尽管离散度克服了类均值相等给归一化距离带来的 麻烦,但是并非最优的类别可分性度量,当样本的 分布存在的情况如下图所示的时候,离散度并不能 有效的反映可分性(b的可分性显然要高于a)
类别间的距离平均值不能完全反映类 别的可分性
CHENLI
10
(2)类别间的归一化距离
根据费歇尔准则,分类时总是希望类内的离散度尽
量小,类间的离散度尽量大,那么根据这个定律,
可以作为相对距离的一个度量,度量的公式为归一
化距离:
dnorm|
1 1
2 2
|
CHENLI
11
CHENLI
12
当我们用这个距离公式衡量类别的可分性的时 候,存在这样的情况,无法衡量两类的差别:
CHENLI
15
(4)J-M 距离(Jeffries-Matusita )
J-M距离基于条件概率理论,其表达式可以近似为:
Jij {[p (X /w i)p (X /w j)]2d} 1 X /2
x
P代表第i个像元属于w的条件概率。
CHENLI
16
总结
1)可分性准则中J-M距离的可分性效果是最好的,J-M 距离实际上就是两类概率密度函数之差,基于先验概 率和样本分布。
CHENLI
25
第五章 高光谱遥感数据的特征选择 与提取
本章主要介绍高光谱遥感数据的可 分性标准,光谱特征选择,光谱自相关 性分析,特征提取以及投影变换等内容。
CHENLI
1
高光谱遥感数据有助于我们完成更加细致的遥
感地物分类和目标识别,然而波段的增多也必 然导致信息的冗余和数据处理复杂性的增加。
具体表现在:
(1)数据量急剧增加:波段的增加,使得高光
2)离散度的可分性效果总体不如J-M距离,但是当各类 模式分布相对集中,模式距离没有超出临界值时,也 比较有效。
3)归一化距离的衡量有效性又源自文库之。加入样本均值十 分接近,或者过于分散,会丧失有效性。
4)各样本距离的平均值用来衡量可分性,效果最差。 只有当样本的各个分布一致,且既不太离散也不太集 中的特殊情况下,才有效。
CHENLI
2
问题提出?
当光谱维数增加的时候,特征组合形式成指数 倍增加,例如原始波段为N,优选后的光谱波 段是M,那么光谱特征组合数为:N!/(NM)!/M!。显然这个数目很巨大,直接导致了运 算效率下降,因此,如何优化光谱特征空间, 进行光谱选择非常重要。
CHENLI
3
该图列出了波段数增加时,不同的样本个数与 类别可分性的变化