高光谱遥感数据的特征选择与提取资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
d | 1 2 |
例如:常用的距离函数有欧氏距离,马氏距离,明氏 距离等。 但是,很多情况下,类别之间的平均距离并不一定代 表了类别之间的可分性。如下图所示
9
两种分布的可分性比较
类别间的距离平均值不能完全反映类 别的可分性
10
(2)类别间的归一化距离
根据费歇尔准则,分类时总是希望类内的离散度尽 量小,类间的离散度尽量大,那么根据这个定律, 可以作为相对距离的一个度量,度量的公式为归一 化距离:
第一个策略能均衡照顾到各类的可分性; 第二个策略能照顾到最难分的类别。
6
光谱可分性准则
设计光谱可分性的准则必须满足三个方面的要 求(黄凤岗等,1998): (1)与错误概率具有单调关系。这样准则取最 大值的情况下,所得到的错误概率应该是最小 的。 (2)度量特性。设定两类地物类别i,j的度量特 性为 J ij , J ij越大,两类特征的分离程度越大。 (3)单调性。新加入的特征,准则函数的值并 不减小。
7
可分性准则所描述的指标
满足这个策略的可分性准则有很多,归纳起来 可以分为以下四种准则: (1)各样本之间的平均距离; (2)类别间的相对距离; (3)离散度; (4)J-M距离;
8
(1)各类样本间的平均距离
各类样本之间的距离越大,类别可分性越大,因此可 以利用各类样本之间的距离的平均值作为可分性的准 则。
2
问题提出?源自文库
当光谱维数增加的时候,特征组合形式成指数 倍增加,例如原始波段为N,优选后的光谱波 段是M,那么光谱特征组合数为:N!/(NM)!/M!。显然这个数目很巨大,直接导致了运 算效率下降,因此,如何优化光谱特征空间, 进行光谱选择非常重要。
3
该图列出了波段数增加时,不同的样本个数与 类别可分性的变化
4
5.1 最优特征的选择——可分性
为了进行最优选择,我们需要一个准则来衡量。 如果特征可以进行分类,那么我们利用分类的 错误概率来作为特征选择的准则。前人的研究 表明:可分性越高的特征,分类错误的概率越 低,选择的特征越优。
最优特征——分类错误概率——可分性
5
可分性准则
选择可分性准则必须综合考虑两个策略: 一、选择各类平均可分性最大的特征 二、选择最难分的类别具有的可分性最大的特征
d norm | 1 2 | 1 2
11
12
当我们用这个距离公式衡量类别的可分性的时 候,存在这样的情况,无法衡量两类的差别:
13
(3)离散度
离散度可以克服当两个类别均值相等时,不能有效区 分类别的局限,离散度表达式为:
当类别多于两个时,可以用平均离散度来衡量类别可 分性。
第五章 高光谱遥感数据的特征选择 与提取
本章主要介绍高光谱遥感数据的可 分性标准,光谱特征选择,光谱自相关 性分析,特征提取以及投影变换等内容。
1
高光谱遥感数据有助于我们完成更加细致的遥 感地物分类和目标识别,然而波段的增多也必 然导致信息的冗余和数据处理复杂性的增加。
具体表现在: (1)数据量急剧增加:波段的增加,使得高光 谱数据比传统数据多1-2个数量级,表现在显示, 存储,管理方面相当繁琐 (2)计算量增大:数据的膨胀导致计算机处理 载荷大幅度增加,寻找有效地降维空间手段是 必要的 (3)统计参数的估计误差增大:利用统计方法 为了达到比较精确的估计,样本个数一般是波 段数的100倍以上,这在高光谱数据中往往无法 实现,因此,导致了分类精度的普遍下降。
25
以上的五个特征可以构成一个凸面几何空间, 高岭石与白云石在这个投影变换后的特征空间 集中在两个彼此分离的区间,两者能够完全区 分
26
3)基于特征位置进行彩色合成
19
1.光谱特征位置搜索
特征位置通常是要确定特征吸收波段的位置 分为以下三个部分: 1)包络线去除(包络线归一化) 包络线从外观上面来看,相当于光谱曲线的“外 壳”,我们用连续的这种折线段来近似表示光谱 曲线的包络线。
20
手工搜索:利用定义手工逐点直线连接突出的 “峰”值点,并使得折线在“峰”值点的外角 >180度,然后用实际光谱波段值去除相应的 波段值,这样归一化后,峰值点均为1,非 “峰”值点均小于1。这样就很容易测定吸收 特征参数。
17
5.2 光谱特征选择
18
通过特征选择,可以强化最具可分性的光谱波段, 这里分为:光谱特征位置搜索和光谱距离统计。 光谱特征位置搜索:根据专家对特定地物的物理 化学性质和光谱特性分析,选择最具有排他性的 光谱特征波段。 光谱距离统计:在光谱可分性距离的统计准则下, 选择光谱波段子集,使得在某一个光谱可分性距 离统计准则下,其统计差异最大或者最优。
21
计算机搜索:
22
由包络线去除法调整的明矾石光谱曲线
23
包络线去除前后的光谱反射率曲线对比
24
2)选择特征波段区分地物
举例说明:经过包络线去除后,可以有效的区 分高岭石与白云石的有效区间,这里挑选5个 特征波段: B1(2.16) B2(2.18) B3(2.21) B4(2.32) B5(2.38)
14
尽管离散度克服了类均值相等给归一化距离带来的 麻烦,但是并非最优的类别可分性度量,当样本的 分布存在的情况如下图所示的时候,离散度并不能 有效的反映可分性(b的可分性显然要高于a)
15
(4)J-M 距离(Jeffries-Matusita )
J-M距离基于条件概率理论,其表达式可以近似为:
J ij { [ p ( X / wi )
P代表第i个像元属于w的条件概率。
x
p ( X / w j ) ] 2 dX }1 / 2
16
总结
1)可分性准则中J-M距离的可分性效果是最好的,J-M 距离实际上就是两类概率密度函数之差,基于先验概 率和样本分布。 2)离散度的可分性效果总体不如J-M距离,但是当各类 模式分布相对集中,模式距离没有超出临界值时,也 比较有效。 3)归一化距离的衡量有效性又次之。加入样本均值十 分接近,或者过于分散,会丧失有效性。 4)各样本距离的平均值用来衡量可分性,效果最差。 只有当样本的各个分布一致,且既不太离散也不太集 中的特殊情况下,才有效。