第四章 遥感数字图像的计算机分类
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通过选择代表各类别的已知样本(训练区)的象元光谱特征, 事先取得个类别的参数,确定判别函数,从而进行分类。 在监督分类中,先定义信息类,然后检验它们的光谱可分性。
24
监督分类(supervised classification)
训练区的作用
已知覆盖类型的代表样区 用于描述主要特征类型的光谱属性 其精度直接影响分类结果
遥感图像的计算机分类
它是对地球表面及其环境在遥感图像上的信息进行属 性的识别和分类,从而达到识别图像信息所相应的实际地 物,提取所需地物信息。
7
统计模式识别的概念和基本问题
遥感图像目视判读与计算机分类的比较
相同点:目的一致; 不同点:目视判读——直接利用人类的自然识别智能; 计算机分类——利用计算机模拟人类的识别能力。
判别准则
18
计算机分类处理的一般过程
原始图像数据的预处理 准 备 阶 段 图像变换及特征选择 分类器的设计 初始变量参数的确定 几何校正、辐射校正 量化、采样、增强等
特征选择(Feature Selection) 特征提取(Feature Extraction)
分 类 判 决
每个像素的分类判决
分类编码图像、结果检验 精度评价 可靠性评价
如果2个以上的波段相关性很强,那么方差协方差矩阵
的逆矩阵就不存在,或非常不稳定。在训练数据几乎都 取相同值的均质性数据组的情况下也是如此。此时,最 好采用主成分分析法,把维数减到仅剩相互独立的波段。
当总体分布不符合正态分布时,不适于采用以正态分
布的假设为基础的最大似然比分类法。其分类精度也将 下降。
0 0 TM Band 3 255
32
最大似然比分类法
它是通过求出每个像素对于各个类别的归属概率,把 该像素分到归属概率最大的类别中去的方法。
255 255
ቤተ መጻሕፍቲ ባይዱ
1
2
TM Band 4
concrete high buildings grass slope water bare soils forest
区别:监督分类法确定有用信息类别,然后再检验它们的
光谱可分性;而非监督分类法先确定光谱的可分性,然后 再确定它们的有用信息。
36
分类算法的思路
先选择若干个模式点作为聚类的中心,每一个中
心代表一个类别,按照某种相似性度量方法将各模式 归于各聚类中心所代表的类别,形成初始分类。然后 由聚类准则判断初始分类是否合理,如果不合理就修 改分类,如此反复迭代运算,直到合理为止。
基本思想 假定各类的分布函数为正态,按正态分布规律 用最大似然判别规则进行判决,得取分类结果。 Bayes准则及判别函数
X属于wi的概率,又称后验概率
22
三、遥感数字图像的分类方法
分类执行方式:监督分类、非监督分类
分类模型或分类器:统计分类、模糊分
类、邻域分类、神经网络分类等。
23
监督分类(supervised classification)
辅助数据(ancillary data) (非遥感数据,如DEM、 土壤类型)
特征提取(feature
extraction):通过变换找出最能反映 地物类别差异的特征变量用于分类的过程 6
统计模式识别的概念和基本问题
模式识别
是人们沿着仿生学的道路,用计算机系统作为工具来 模拟人类的感知和识别智能,它是人工智能的一个分支。
TM Band 4
0
concrete high buildings grass slope water bare soils forest
0 TM Band 3 255
0
TM Band 3
255
31
平行多面体分类
要求分割面总是与各特征轴正交,如果各类别在特征 空间中呈倾斜分布,就会产生分类误差。可先采用各轴的 正交变换后,再进行多级分割。
34
分类结果
35
非监督分类(unsupervised classification)
非监督分类法不必使用训练样区数据作为分类的基础。通 过检验大量的未知像元并根据多光谱空间中的自然集群将 它们分为若干类。 基本前提:同种地物类型的值在测量空间上应该相互接近, 而不同的地物类型应该具有比较明显的可分性。
2、光谱变换后数据;
3、非遥感数据 3
遥感图像分类的实质
图象分类 过程的总目标 是,将图象中 所有的像元自 动地进行土地 覆盖类型或土 地覆盖专题的 分类。
4
影响遥感图像分类精度的因素
大气状况的影响:吸收、散射。
下垫面的影响:下垫面的覆盖类型和起伏状态对分类 具有一定的影响。
其他因素的影响:云朵覆盖;不同时相的光照条件不 同,同一地物的电磁辐射能量不同;地物边界的多样 性。
第四章
遥感数字图像计算机解译
一、遥感数字图像计算机分类的一般原理
二、遥感分类的常用判别函数
三、遥感数字图像的分类方法
四、遥感数字图像的分类后处理
五、光谱特征分类中的辅助处理技术 六、遥感图像计算机分类新方法
1
一、遥感数字图像计算机分类的一般原理
遥感图像解译
遥感图像数据
解译
专题图像 专题地图
专业应用
TM Band 4
concrete high buildings grass slope water bare soils forest
0 0 TM Band 3 255
0 0 TM Band 3 255
33
使用最大似然比分类法的注意事项
各类别的训练数据至少要为特征维数的2-3倍以上,这
样才能统计出具有较高精度的均值、方差与协方差;
9
光谱特征向量与特征点集群
基于统计模式识别的分类方法
监督分类与非监督分类 分类处理与增强处理的异同 共同点:增强和提取遥感图像中目标物的信息 不同点:
增强处理→增强视觉效果→提高图像的可解译性(定性)
图像分类→地物类别的区分(定量信息)
10
光谱特征向量与特征点集群
光谱特征向量
光谱特征变量:由于受外界各种因素的影响,使得同类地 物的成像亮度值总是带有随机误差,导致图像亮度值(即光谱特 征)的观测值为一个随机变量(x)。 光谱特征向量:同名地物点在不同波段图像中亮度的观测量 构成一个多维的随机向量(X),称为光谱特征向量。即
特征点集群在空间中的分布情况
•最理想情况
不同类别集群至少在一个特 征子空间(某一波段图像)中的 投影(即亮度范围)是完全可以 相互区分开的——可以用简单的 图像密度分割实现。
13
光谱特征向量与特征点集群
•典型情况
不同类别地物的集 群,在任一个子空间都 有重叠现象存在,但在 总的特征空间中却是可 以完全分开的。即单波 段的图像不能实现图像 的分类,只有利用多波 段图像在多维空间中才 能实现精确分类。
29
判别分析分类方法
线性判别分析分类 逐步判别分析分类 平行多面体分类(很少用) 最小距离分类(距离判别函数) 最大似然比分类(最常用)
30
最小距离分类法
最小距离分类法是以特征空间中的距离作为像元分类 的依据。原理简单,计算速度快,分类精度不高。
255
255
1 TM Band 4
2
concrete high buildings grass slope water bare soils forest 0
X x1, x2 ,, xn
T
n ——图像波段总数 xi ——地物图像点在第 i 波段图像中的亮度值
11
光谱特征向量与特征点集群
光谱特征空间
为度量地物的光谱特征,建立的以各波段图像的亮度 分布为子空间的多维空间。
12
光谱特征向量与特征点集群
特征点集群
每个地物点依其在各个波段所具有的光谱值可以在一个多维空 间中找到一个相应的特征点,但由于随机性所致,同类地物的各取 样点在光谱特征空间中的特征点将不可能表现为一个点,而是表现 为一个相对聚集的点集群,不同类地物点集群在特征空间中一般相 互分离,这些点集群称为特征点集群。
255 255
1
TM Band 4
TM Band 4
2 concrete high buildings grass slope water bare soils forest
concrete
high buildings
grass slope water bare soils forest
0 0 TM Band 3 255
14
光谱特征向量与特征点集群
•一般情况
不论是在总的特征 空间还是任一子空间, 不同类别的集群之间总 有重叠现象,这时重叠 部分的特征点所相应的 地物,在分类时会出现 不同程度的分类误差, 这是遥感图像分类中最 常见的现象。
15
地物与光谱特征空间的关系
16
计算机分类的基本原理
• 基本原理
不同的地物具有不同的光谱特征,同类地物具有相 同或相似的光谱特征→将图像中的每个像元或区域划归 为若干类别是的一种,即通过光谱特征分析→选择特征 参数→将特征空间划分为不重叠的子空间→将影像像元 划分到各个子空间→实现分类 图象分类:基于数字图象中反映的同类地物的光谱 相似性和异类地物的光谱差异性。 依据是遥感图像像素的相似度。
距离 相关系数 17
计算机分类的基本原理
• 基本思想
同类地物的光谱特征比 较接近,在特征空间中的点 聚集在该类的中心附近;多 类目标聚集多个点族。
类别界面
• 方法
判别函数: 找到一个函数使fAB(X)=0 判别准则: fAB(X)>0,X为A类; fAB(X) <0,X为B类
• 分类算法的核心
判别函数
5
统计模式识别的概念和基本问题
模式(pattern):
在多波段图象中,每个象元都具有一组 对应取值,称为象元模式,即一个像元对应多个值。
特征(feature):在多波段图象中,每个波段都可看作
一个变量,称为特征变量。特征变量构成特征空间。
波段:光谱波段 其它派生波段(纹理、上下文关系、波段比等)
方法
目视解译
光谱规律 解译标志(亮度、色 地学规律 调、位置、时间、纹 解译者的经验 理、结构等)
计算机分类 属性识别、分类 提取信息、识别地物 2
景物类型
一、遥感数字图像计算机分类的一般原理
计算机分类
是通过模式识别理论,利用计算机将遥感图象自 动分成若干地物类别的方法。
如土地覆盖/土地利用分类、森林类型分类、植被 类型分类、岩性分类、…… 数据→信息 (遥感数据---地物信息) 主要数据类型: 1、原始光谱数据;
27
选择训练样区—在特征空间上选取
水泥地面
90
69
TM Band 4
49
28
水体
8 14
35
56
77
88
TM Band 3
28
训练样本中的各个像素在特征空间中的分布情况
Cluster 1
Band 1 DNs
Band 1 DNs
Cluster 3 Cluster 2
Band 1 DNs
Band 1 DNs
遥感图像的模式特征及其分类方法
光谱特征
↓ 基于光谱特征的统计识别方法
纹理特征
↓ 基于纹理特征的统计识别方法
(主要)
(次要、补充)
8
统计模式识别的概念和基本问题
统计模式识别的基本含义
(1)把识别对象的特征的每一个观测量视为从属于一定分布 规律的随机变量;
(2)在多维观测的情况下,把识别对象特征的各维观测值的 总体视为一个随机矢量,每一个随机矢量在一个多维特征空间中 都有一个特征点与之相对应; (3)所有特征点的全体在特征空间中将形成一系列的分布群 体,每个分布群体中的特征点被认为具有相似特征,并可以划为 同一类别; (4) 找到各个分布群体的边界线(面)或确定任意特征点落 入每个分布群体中的条件概率,并以此依据来确定特征点(或相 应的识别对象)的分类。
统一表示为:
d ij [ | x ik x jk |q ]1/ q
k 1
N
明可夫斯基距离存在的主要问题
•明氏距离与特征参数的量纲有关(解决办法:标准化处理) •明氏距离没有考虑特征参数间的相关性
20
马氏距离(Mahalanobis)
21
二、遥感分类的常用判别函数
最大似然法判别函数 (Bayes准则)
训练区的选择
•训练区必须具有典型性和代表性 •图件时间和空间上的一致性
25
训练区的选择
26
选择训练样区--直接在图像上选取
裸地 水体 林地
覆盖类型 水体 水泥地面 高层建筑
颜色 青色 紫色 浅紫色 红色 黄色 绿色
像元数 3793 975 1866 784 924 3122
水泥地面
高层建筑
裸地 草地 林地
输 出
分类结果输出
19
二、遥感分类的常用判别函数
距离判别函数
欧氏距离:
N, 波段数;dij第个i像元与第j个像元在N维空间中的距离;
xik为第个k波段上第i个像元的灰度值。
绝对距离:
d ij | x ik x jk |
k 1
N
明可夫斯基距离(Minkowski):
欧氏距离和绝对距离可
24
监督分类(supervised classification)
训练区的作用
已知覆盖类型的代表样区 用于描述主要特征类型的光谱属性 其精度直接影响分类结果
遥感图像的计算机分类
它是对地球表面及其环境在遥感图像上的信息进行属 性的识别和分类,从而达到识别图像信息所相应的实际地 物,提取所需地物信息。
7
统计模式识别的概念和基本问题
遥感图像目视判读与计算机分类的比较
相同点:目的一致; 不同点:目视判读——直接利用人类的自然识别智能; 计算机分类——利用计算机模拟人类的识别能力。
判别准则
18
计算机分类处理的一般过程
原始图像数据的预处理 准 备 阶 段 图像变换及特征选择 分类器的设计 初始变量参数的确定 几何校正、辐射校正 量化、采样、增强等
特征选择(Feature Selection) 特征提取(Feature Extraction)
分 类 判 决
每个像素的分类判决
分类编码图像、结果检验 精度评价 可靠性评价
如果2个以上的波段相关性很强,那么方差协方差矩阵
的逆矩阵就不存在,或非常不稳定。在训练数据几乎都 取相同值的均质性数据组的情况下也是如此。此时,最 好采用主成分分析法,把维数减到仅剩相互独立的波段。
当总体分布不符合正态分布时,不适于采用以正态分
布的假设为基础的最大似然比分类法。其分类精度也将 下降。
0 0 TM Band 3 255
32
最大似然比分类法
它是通过求出每个像素对于各个类别的归属概率,把 该像素分到归属概率最大的类别中去的方法。
255 255
ቤተ መጻሕፍቲ ባይዱ
1
2
TM Band 4
concrete high buildings grass slope water bare soils forest
区别:监督分类法确定有用信息类别,然后再检验它们的
光谱可分性;而非监督分类法先确定光谱的可分性,然后 再确定它们的有用信息。
36
分类算法的思路
先选择若干个模式点作为聚类的中心,每一个中
心代表一个类别,按照某种相似性度量方法将各模式 归于各聚类中心所代表的类别,形成初始分类。然后 由聚类准则判断初始分类是否合理,如果不合理就修 改分类,如此反复迭代运算,直到合理为止。
基本思想 假定各类的分布函数为正态,按正态分布规律 用最大似然判别规则进行判决,得取分类结果。 Bayes准则及判别函数
X属于wi的概率,又称后验概率
22
三、遥感数字图像的分类方法
分类执行方式:监督分类、非监督分类
分类模型或分类器:统计分类、模糊分
类、邻域分类、神经网络分类等。
23
监督分类(supervised classification)
辅助数据(ancillary data) (非遥感数据,如DEM、 土壤类型)
特征提取(feature
extraction):通过变换找出最能反映 地物类别差异的特征变量用于分类的过程 6
统计模式识别的概念和基本问题
模式识别
是人们沿着仿生学的道路,用计算机系统作为工具来 模拟人类的感知和识别智能,它是人工智能的一个分支。
TM Band 4
0
concrete high buildings grass slope water bare soils forest
0 TM Band 3 255
0
TM Band 3
255
31
平行多面体分类
要求分割面总是与各特征轴正交,如果各类别在特征 空间中呈倾斜分布,就会产生分类误差。可先采用各轴的 正交变换后,再进行多级分割。
34
分类结果
35
非监督分类(unsupervised classification)
非监督分类法不必使用训练样区数据作为分类的基础。通 过检验大量的未知像元并根据多光谱空间中的自然集群将 它们分为若干类。 基本前提:同种地物类型的值在测量空间上应该相互接近, 而不同的地物类型应该具有比较明显的可分性。
2、光谱变换后数据;
3、非遥感数据 3
遥感图像分类的实质
图象分类 过程的总目标 是,将图象中 所有的像元自 动地进行土地 覆盖类型或土 地覆盖专题的 分类。
4
影响遥感图像分类精度的因素
大气状况的影响:吸收、散射。
下垫面的影响:下垫面的覆盖类型和起伏状态对分类 具有一定的影响。
其他因素的影响:云朵覆盖;不同时相的光照条件不 同,同一地物的电磁辐射能量不同;地物边界的多样 性。
第四章
遥感数字图像计算机解译
一、遥感数字图像计算机分类的一般原理
二、遥感分类的常用判别函数
三、遥感数字图像的分类方法
四、遥感数字图像的分类后处理
五、光谱特征分类中的辅助处理技术 六、遥感图像计算机分类新方法
1
一、遥感数字图像计算机分类的一般原理
遥感图像解译
遥感图像数据
解译
专题图像 专题地图
专业应用
TM Band 4
concrete high buildings grass slope water bare soils forest
0 0 TM Band 3 255
0 0 TM Band 3 255
33
使用最大似然比分类法的注意事项
各类别的训练数据至少要为特征维数的2-3倍以上,这
样才能统计出具有较高精度的均值、方差与协方差;
9
光谱特征向量与特征点集群
基于统计模式识别的分类方法
监督分类与非监督分类 分类处理与增强处理的异同 共同点:增强和提取遥感图像中目标物的信息 不同点:
增强处理→增强视觉效果→提高图像的可解译性(定性)
图像分类→地物类别的区分(定量信息)
10
光谱特征向量与特征点集群
光谱特征向量
光谱特征变量:由于受外界各种因素的影响,使得同类地 物的成像亮度值总是带有随机误差,导致图像亮度值(即光谱特 征)的观测值为一个随机变量(x)。 光谱特征向量:同名地物点在不同波段图像中亮度的观测量 构成一个多维的随机向量(X),称为光谱特征向量。即
特征点集群在空间中的分布情况
•最理想情况
不同类别集群至少在一个特 征子空间(某一波段图像)中的 投影(即亮度范围)是完全可以 相互区分开的——可以用简单的 图像密度分割实现。
13
光谱特征向量与特征点集群
•典型情况
不同类别地物的集 群,在任一个子空间都 有重叠现象存在,但在 总的特征空间中却是可 以完全分开的。即单波 段的图像不能实现图像 的分类,只有利用多波 段图像在多维空间中才 能实现精确分类。
29
判别分析分类方法
线性判别分析分类 逐步判别分析分类 平行多面体分类(很少用) 最小距离分类(距离判别函数) 最大似然比分类(最常用)
30
最小距离分类法
最小距离分类法是以特征空间中的距离作为像元分类 的依据。原理简单,计算速度快,分类精度不高。
255
255
1 TM Band 4
2
concrete high buildings grass slope water bare soils forest 0
X x1, x2 ,, xn
T
n ——图像波段总数 xi ——地物图像点在第 i 波段图像中的亮度值
11
光谱特征向量与特征点集群
光谱特征空间
为度量地物的光谱特征,建立的以各波段图像的亮度 分布为子空间的多维空间。
12
光谱特征向量与特征点集群
特征点集群
每个地物点依其在各个波段所具有的光谱值可以在一个多维空 间中找到一个相应的特征点,但由于随机性所致,同类地物的各取 样点在光谱特征空间中的特征点将不可能表现为一个点,而是表现 为一个相对聚集的点集群,不同类地物点集群在特征空间中一般相 互分离,这些点集群称为特征点集群。
255 255
1
TM Band 4
TM Band 4
2 concrete high buildings grass slope water bare soils forest
concrete
high buildings
grass slope water bare soils forest
0 0 TM Band 3 255
14
光谱特征向量与特征点集群
•一般情况
不论是在总的特征 空间还是任一子空间, 不同类别的集群之间总 有重叠现象,这时重叠 部分的特征点所相应的 地物,在分类时会出现 不同程度的分类误差, 这是遥感图像分类中最 常见的现象。
15
地物与光谱特征空间的关系
16
计算机分类的基本原理
• 基本原理
不同的地物具有不同的光谱特征,同类地物具有相 同或相似的光谱特征→将图像中的每个像元或区域划归 为若干类别是的一种,即通过光谱特征分析→选择特征 参数→将特征空间划分为不重叠的子空间→将影像像元 划分到各个子空间→实现分类 图象分类:基于数字图象中反映的同类地物的光谱 相似性和异类地物的光谱差异性。 依据是遥感图像像素的相似度。
距离 相关系数 17
计算机分类的基本原理
• 基本思想
同类地物的光谱特征比 较接近,在特征空间中的点 聚集在该类的中心附近;多 类目标聚集多个点族。
类别界面
• 方法
判别函数: 找到一个函数使fAB(X)=0 判别准则: fAB(X)>0,X为A类; fAB(X) <0,X为B类
• 分类算法的核心
判别函数
5
统计模式识别的概念和基本问题
模式(pattern):
在多波段图象中,每个象元都具有一组 对应取值,称为象元模式,即一个像元对应多个值。
特征(feature):在多波段图象中,每个波段都可看作
一个变量,称为特征变量。特征变量构成特征空间。
波段:光谱波段 其它派生波段(纹理、上下文关系、波段比等)
方法
目视解译
光谱规律 解译标志(亮度、色 地学规律 调、位置、时间、纹 解译者的经验 理、结构等)
计算机分类 属性识别、分类 提取信息、识别地物 2
景物类型
一、遥感数字图像计算机分类的一般原理
计算机分类
是通过模式识别理论,利用计算机将遥感图象自 动分成若干地物类别的方法。
如土地覆盖/土地利用分类、森林类型分类、植被 类型分类、岩性分类、…… 数据→信息 (遥感数据---地物信息) 主要数据类型: 1、原始光谱数据;
27
选择训练样区—在特征空间上选取
水泥地面
90
69
TM Band 4
49
28
水体
8 14
35
56
77
88
TM Band 3
28
训练样本中的各个像素在特征空间中的分布情况
Cluster 1
Band 1 DNs
Band 1 DNs
Cluster 3 Cluster 2
Band 1 DNs
Band 1 DNs
遥感图像的模式特征及其分类方法
光谱特征
↓ 基于光谱特征的统计识别方法
纹理特征
↓ 基于纹理特征的统计识别方法
(主要)
(次要、补充)
8
统计模式识别的概念和基本问题
统计模式识别的基本含义
(1)把识别对象的特征的每一个观测量视为从属于一定分布 规律的随机变量;
(2)在多维观测的情况下,把识别对象特征的各维观测值的 总体视为一个随机矢量,每一个随机矢量在一个多维特征空间中 都有一个特征点与之相对应; (3)所有特征点的全体在特征空间中将形成一系列的分布群 体,每个分布群体中的特征点被认为具有相似特征,并可以划为 同一类别; (4) 找到各个分布群体的边界线(面)或确定任意特征点落 入每个分布群体中的条件概率,并以此依据来确定特征点(或相 应的识别对象)的分类。
统一表示为:
d ij [ | x ik x jk |q ]1/ q
k 1
N
明可夫斯基距离存在的主要问题
•明氏距离与特征参数的量纲有关(解决办法:标准化处理) •明氏距离没有考虑特征参数间的相关性
20
马氏距离(Mahalanobis)
21
二、遥感分类的常用判别函数
最大似然法判别函数 (Bayes准则)
训练区的选择
•训练区必须具有典型性和代表性 •图件时间和空间上的一致性
25
训练区的选择
26
选择训练样区--直接在图像上选取
裸地 水体 林地
覆盖类型 水体 水泥地面 高层建筑
颜色 青色 紫色 浅紫色 红色 黄色 绿色
像元数 3793 975 1866 784 924 3122
水泥地面
高层建筑
裸地 草地 林地
输 出
分类结果输出
19
二、遥感分类的常用判别函数
距离判别函数
欧氏距离:
N, 波段数;dij第个i像元与第j个像元在N维空间中的距离;
xik为第个k波段上第i个像元的灰度值。
绝对距离:
d ij | x ik x jk |
k 1
N
明可夫斯基距离(Minkowski):
欧氏距离和绝对距离可