第4章-1 高光谱数据降维与可分性准则

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.2高维特征带来的新问题 3.“维数灾难”问题 思考:既然不同波段包含了不同光谱信息, 那么,在利用遥感影像分类时,是否波段越多, 分类越精确? 研究表明,事实并非如此
11
武汉大学 龚龑
《高光谱遥感》
• 高光谱遥感数据有助于我们完成更加细致的遥感地物分类 和目标识别,然而波段的增多也必然导致信息的冗余和数 据处理复杂性的增加。具体表现在: (1)数据量急剧增加:波段的增加,使得高光谱数据比传 统数据多1-2个数量级,表现在显示,存储,管理方面相 当繁琐; 假设原始光谱波段数为N,优选后的光谱波段是M,N>M, 则: 光谱特征组合的数目为:N!/(N-M)!M! 100!/(100-3)!3!=161,700
3.2几何距离可分性准则原理 6.两类之间的距离
A类
B类 Y1 Y2
X1 X2 X3
两类样本之间的距离
两两之间
41
武汉大学 龚龑
《高光谱遥感》
三、基于几何距离的可分性准则
3.2几何距离可分性准则原理 7.各类总的均方距离 总的样本距离
两类样本之间的距离
取欧氏距离时,总的均方距离为
类与类两两求和
42
例如:对于有 N个波段的高光谱数据来讲,当前 应用需求是区分w1类和w2类。
如果利用任意一个波段都能达到这个 目的,那么,仅取一个波段就包含了足够 信息,其余N-1维特征就是多余的。
7
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.2高维特征带来的新问题 2.超维几何体体积 根据超维立方体的体积公式,随着空 间维数的增加,超立方体的体积急剧增加, 并且向角部分布。
8
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.2高维特征带来的新问题 2.超维几何体体积
超立方体中内切求的体积 与超立方体之比
伽马函数
9
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.2高维特征带来的新问题 2.超维几何体体积
例如:密度分析GRID算法
由于体积因素 影响,高维空间 中数据的分布呈 现出稀疏、严重 不规则等特点, 使得常规的分析 算法效果不佳。
12
武汉大学 龚龑
《高光谱遥感》
(2)计算量增大:数据的膨胀导致计算机处理载荷大幅度 增加,寻找有效地降维空间手段是必要的; (3)统计参数的估计误差增大: 随着波段数增多,样本的统计参数也要求越多。为达到 比较精确的参数估计,训练样本数应当是所用波段数的10倍 以上。在样本数不变的情况下,分类精度随所使用波段数的 变化呈现出Hughes现象。
第四章 第1节 高光谱数据降维与可分性准则
《高光谱遥感》
一、高光谱数据的降维问题 二、类别可分性准则 三、基于几何距离的可分性准则 四、基于类的概率密度的可分性准则
3
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.1高光谱数据的高维特征 • 高光谱分辨率的影响 在给定的波长区间内,高的光谱分辨率导致影 像波段数众多、连续。 一方面,高光谱遥感的核心优势是反映光谱特 征的细微差异;另一方面众多的波段数目给数据处 理带来新的问题。
1 1
2
2
《高光谱遥感》
• 各类样本之间的距离越大,类别可分性越大,因 此可以利用各类样本之间的距离的平均值作为可 分性的准则。
• 常用的距离函数有:欧氏距离,马氏距离,明氏 距离等。
34
武汉大学 龚龑
《高光谱遥感》
需要注意:很多情况下,类别之间的平均距离并不 一定代表了类别之间的可分性。如下图所示:
13
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.2高维特征带来的新问题 3.“维数灾难”问题
14
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.2高维特征带来的新问题 3.“维数灾难”问题 这说明高光谱数据区分地类之间的能力极大 地受到训练样本的限制,在分析高光谱影像时, 要获得好的分类精度就需要更多的训练样本。 如果训练样本不足时,往往会出现在样本点 数目一定的前提下,分类精度随着特征维数的增 加“先增后降”的现象,这就是所谓的Hughes”维 数灾难”现象。
37
武汉大学 龚龑
《高光谱遥感》
三、基于几何距离的可分性准则
3.2几何距离可分性准则原理 3.类内及总体的均值矢量
类内的均值矢量
总体的均值矢量
38
武汉大学 龚龑
《高光谱遥感》
三、基于几何距离的可分性准则
3.2几何距离可分性准则原理 4.类内距离
类内均Leabharlann Baidu欧氏距离定义为:
先求出各自到 类心的距离的 平方,再求和
20
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.2高维特征带来的新问题 综上所述,高维特征引起了多种问题 • • • • • 信息冗余大 超维几何体体积 “维数灾难”问题 高维空间中的参数估计问题 高阶统计特性
因此,在高光谱数据应用的特定阶段,可 以对高维数据进行降维处理,得到具有代表意 义的低维光谱特征,并在低维光谱空间中进行 相应分析(聚类分析)。
高光谱影像属于高维空间数据,已有的研究结 果表明,这种数据有许多不同于低维数据的分布特 性,这些特性决定了人们在对高光谱影像分析时应 采用不同策略和方法。
6
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.2高维特征带来的新问题 1.信息冗余大 波段数量多,但并非每个波段在任何时候 都是有用信息。波段之间的相关性导致信息冗 余很大,尤其是相邻波段之间的相关性很强。
19
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.2高维特征带来的新问题 5.高阶统计特性 在低维空间,只使用均值向量进行分类的结果 比只使用方差信息得到的结果的精度高,说明在此 种情况下,在分类过程中数据分布的位置比分布的 形状和方向作用要大的多,这也是人们通常遇到的 情况。 但是,当维数增加时,只考虑均值信息进行 分类的精度并不再增加,而考虑方差信息的分类 精度却随着特征维数的增加而继续增加。
23
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.3高光谱降维
高光谱数据降维的方法
• 波段选择
具体内容在下一讲中介绍
• 特征变换 降维后得到的低维特征空间是否 有效进行类别区分?
24
武汉大学 龚龑
第四章 第1节 高光谱数据降维与可分性准则
《高光谱遥感》
一、高光谱数据的降维问题 二、类别可分性准则 三、基于几何距离的可分性准则 四、基于类的概率密度的可分性准则
n
T 1/ 2 1/ 2
32
武汉大学 龚龑
基于几何距离的可分性准则 ----欧氏距离
特点:利用各样本间距离的平均值作为可分性准则 欧几里德距离表达式(其中i, j 为样本,k为波段): 欧氏距离含义:随着各样本间的平均距离增加,类别间的可分性增加。
µ 2 µ 1 µ 1 + µ 2 +
《高光谱遥感》
《高光谱遥感》第四章 高光谱数据处理
第四章 《高光谱数据处理》主要内容 • • • • 高光谱数据的特征选择与提取 高光谱特征参量化 高光谱遥感影像分类与光谱匹配 混合光谱
1
武汉大学 龚龑
《高光谱遥感》
《高光谱遥感》第四章 高光谱数据处理
第1节 高光谱数据降维与可分性准则
2
武汉大学 龚龑
15
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.2高维特征带来的新问题 4.高维空间中的参数估计问题 随着空间维数的增加,要得到同样精度的估 计值将需要更多的样本数。 研究表明,对于监督分类而言,若要得到比较 满意的分类结果: • 线性分类器需要 的样本数与空间的 维数呈线性关系。 • 对于基于二次估计量的 分类器,所需的样本数与 空间的维数呈平方关系。
29
武汉大学 龚龑
《高光谱遥感》
三、基于几何距离的可分性准则
3.1基本思想
• 不同的类别 不同的分布区域
• 类别可分性 区域可分性
• 区域可分性 通过几何距离来度量
30
武汉大学 龚龑
《高光谱遥感》
31
武汉大学 龚龑
《高光谱遥感》
三、基于几何距离的可分性准则
3.2几何距离可分性准则原理
27
武汉大学 龚龑
光谱可分性准则 基于几何距离可分 基于类的概率密度可分
各样本间的平均距离 马 氏 距 离 明 氏 距 离
类别间的相对距离
J-M
欧 氏 距 离
归一化均 值距离等
离 散 度
……
距 离
第四章 第1节 高光谱数据降维与可分性准则
《高光谱遥感》
一、高光谱数据的降维问题 二、类别可分性准则 三、基于几何距离的可分性准则 四、基于类的概率密度的可分性准则
类内均方距离也可定义为:
两两运算,不 涉及类心
39
武汉大学 龚龑
《高光谱遥感》
三、基于几何距离的可分性准则
3.2几何距离可分性准则原理 5.类内离差矩阵
类内离差矩阵,反映类内部样本在均值周 围的散布情况。
与类内均方欧氏距离的关系:
(矩阵的迹)
40
武汉大学 龚龑
《高光谱遥感》
三、基于几何距离的可分性准则
17
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.2高维特征带来的新问题 5.高阶统计特性 在高维数据空间中,除了数据点分布的绝 对位置以外,数据分布的形状和方向对于分类 具有更加重要的影响作用。
18
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.2高维特征带来的新问题 5.高阶统计特性
武汉大学 龚龑
《高光谱遥感》
三、基于几何距离的可分性准则
21
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.3高光谱降维
N D R 若 {xn }n 为D维空间中的一个容量为 1 N的数据集合,假设其来自于维数为D的某一 数据集的采样。降维的目标是探求数据集合适 的低维坐标描述,将原数据集合投影到低维空 间,获得原数据集合的低维简洁表示。
两种分布的可分离性比较
35
武汉大学 龚龑
《高光谱遥感》
三、基于几何距离的可分性准则
3.2几何距离可分性准则原理 2.点与点集的距离
当前点与点集中每个点逐个计算距离
36
武汉大学 龚龑
《高光谱遥感》
类别间与类别内的相对距离

根据费歇尔准则,分类时总是希望类内的离散 度尽量小,类间的离散度尽量大,那么根据这 个定律,可以作为相对距离的一个度量,度量 的公式,都是根据类内和类间离散度矩阵来进 行定义。
16
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.2高维特征带来的新问题 4.高维空间中的参数估计问题
因此,“维数灾难”现象可以从样本数量与数据复杂度关系理论来解释
模式识别的类别统计信息 分类精度较高 参数估计较准确 多光谱图像 高 向量均值和方差等 根据训练样本估算出来 训练样本的数目相对于 低 特征空间的维数的比例 分类精度较低 参数估计不准确 高光谱图像
1.点与点的距离
T a ( a , a ,..., a ) 在 n 维特征空间中,特征点 1 2 n T 与特征点 b (b1 , b2 ,..., bn )
之间的欧氏距离为:
d (a,b) [(a - b)(a - b) ] 2 = (a k - b k ) k=1
4
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.1高光谱数据的高维特征 • 波谱空间与光谱空间 波段数众多导致波谱曲线信息的丰富
灰 度 值 多光谱
灰 度 值
高光谱
波段数众多导致光谱空间维数的增多 “维数”是指光谱空间的维数
5
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.1高光谱数据的高维特征
方法: • 波段选择 • 特征变换
22
武汉大学 龚龑
《高光谱遥感》
一、高光谱数据的降维问题
1.3高光谱降维
注意不要走向另一个极端:降维绝对不是 对高维光谱信息的舍弃,而是立足于高维数据, 针对不同的使用目的得到相应低维数据。
图书馆的书种类繁多,不同专业的同 学各取所需,只选一小部分,但并不意味 着其它的书是多余的。
25
武汉大学 龚龑
《高光谱遥感》
二、类别可分性准则
2.1高光谱数据降维与类别可分性判据的关系 降维得到低维特征
指导降维
形成特征空间 分布不同 可分性存在差异 衡量可分性?
定量化的指标
可分性判据
26
武汉大学 龚龑
《高光谱遥感》
二、类别可分性准则
2.2可分性准则基本概念 • 可分性准则 概念:从高维数据中得到了一组用来分类的特征, 需要一个定量的标准来衡量特征对分类的有效性。 特点:通过已知类别先验知识,衡量当前特征空间 对类别的区分效果。 可分性准则的主要类型: • 基于几何距离的可分性准则 • 基于概率密度的可分性准则
相关文档
最新文档