第六章 遥感图像分类(三)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6.4
非监督分类
K-均值方法 均值方法
然后计算每个像素到类中心的欧氏距离,并 然后计算每个像素到类中心的欧氏距离, 将每个像素重新分配给最近的一类。 将每个像素重新分配给最近的一类。若类中的像素 发生了变动,则该类的中心(均值) 发生了变动,则该类的中心(均值)在进行下一步 操作之前要重新计算。 操作之前要重新计算。 先计算A到两个类的平方距离: 先计算A到两个类的平方距离:
6.4
非监督分类
K-均值方法 均值方法
实例计算:假定4个像素A,B,C,D A,B,C,D的两个波段 实例计算:假定4个像素A,B,C,D的两个波段 B1和B2的数据如下 的数据如下: B1和B2的数据如下:
目标是将这些像素分成K=2个类, 目标是将这些像素分成K=2个类,使每个类内 K=2个类 像素之间的距离比不同类像素之间的距离小。 像素之间的距离比不同类像素之间的距离小。为了 实施K=2均值法,将这些像素先随意分成两个类, K=2均值法 实施K=2均值法,将这些像素先随意分成两个类, 比如说(AB) CD), ),然后计算这两个类的中心 比如说(AB)和(CD),然后计算这两个类的中心 均值)和坐标( ),由此得到 由此得到: (均值)和坐标( ),由此得到:
6.4
非监督分类
初始类别参数的选择
(i=1,2,…K)。其中, 为均值, 为标准差, (i=1,2, K)。其中,mi为均值, 为标准差, K) 为波段数。 K为波段数。 如图为Nc=4的情形: 如图为Nc=4的情形: Nc=4的情形
6.4
非监督分类
初始类别参数的选择
3、最大最小距离法 该法的原则是各初始类别之间尽可能地保持 最大距离。为做到这一点, 最大距离。为做到这一点,首先在整幅图像中按 一定方式(如等间隔方式) 一定方式(如等间隔方式)获取一个抽样的像素 几何{X} {X}, ,Xn}, 为抽样个数, 几何{X},{X}={X1,X2,…,Xn},n为抽样个数,下 ,Xn} 图中n=11 表示抽样11个像素点。 n=11, 11个像素点 图中n=11,表示抽样11个像素点。 然后按照以下步骤进行选心: 然后按照以下步骤进行选心: 取抽样集中任一像素( ① 取抽样集中任一像素(如X1)作为第一个 初始类别的中心Z 初始类别的中心Z1; ② 计算X1与其他各抽样点之间的距离D0 取与 计算X 与其他各抽样点之间的距离D 之距离最远的抽样点( 之距离最远的抽样点(如X7)作为第二个初始类别 中心Z 中心Z2,即:
6.4
非监督分类
初始类别参数的选择
然后,给定一个光谱相似性比较阈值, 然后,给定一个光谱相似性比较阈值,依次 把抽样集中每个像素的光谱特征与初始类别的光 谱特征进行相似性比较, 谱特征进行相似性比较,若该像素与初始类别相 则作为该类中的一个成员,若不相似, 似,则作为该类中的一个成员,若不相似,则该 像素作为新的一个新的初始类别。 像素作为新的一个新的初始类别。 最后,每个初始类别都包含了一定的成员, 最后,每个初始类别都包含了一定的成员, 据此可计算各类别中心的期望和协方差矩阵。 据此可计算各类别中心的期望和协方差矩阵。 2、直方图法 该方法在整幅图像直方图的基础上选定类别 中心。假定初始类别有Nc Nc个 中心。假定初始类别有Nc个,每个初始类别中心 位置Z j=1,2,…,Nc 可按照下式确定: ,Nc) 位置Zj(j=1,2, ,Nc)可按照下式确定:
6.4
非监督分类
K-均值方法 均值方法
适合的m个类的初始中心。 适合的m个类的初始中心。 将全部数据随机地分为m个类别, b、将全部数据随机地分为m个类别,计算每个 类的重心,将这些重心作为m个类的初始中心。 类的重心,将这些重心作为m个类的初始中心。 在第k次迭代中,对任一样本X ② 在第k次迭代中,对任一样本X按如下的方 法把它调整到 个类别中的某一类别中去。 调整到m 法把它调整到m个类别中的某一类别中去。对于所 有的 ,如果 , 为中心的类。 则 ,其中 是以 为中心的类。 ③ 由第二步得到 类新的中心 其中, 类中的样本数。 ,其中,Nj为 类中的样本数。 按照下面误差平方和J最小的原则确定。 按照下面误差平方和J最小的原则确定。J的表达式 为:
6.4
非监督分类
概述
在开始图像分类时,用非监督分类方法来探 在开始图像分类时,用非监督分类方法来探 索数据的本来结构及其自然点群的分布情况往往 索数据的本来结构及其自然点群的分布情况往往 很有价值。 很有价值。 非监督分类主要采用聚类分析方法, 聚类分析方法 非监督分类主要采用聚类分析方法,把像素 按照相似性归成若干类别,使得属于同一类别的 按照相似性归成若干类别,使得属于同一类别的 像素之间的差异(距离)尽可能的小而不同类别 像素之间的差异(距离) 中像素间的差异尽可能的大。 中像素间的差异尽可能的大。 由于没有利用地物类别的先验知识, 由于没有利用地物类别的先验知识,非监督 分类只能事先假定初始的参数, 分类只能事先假定初始的参数,并通过预分类处 理来形成类群, 理来形成类群,通过迭代使有关参数达到允许的 范围为止。因此,非监督分类算法的关键是初始 范围为止。因此, 类别参数的选定和迭代调整问题。 类别参数的选定和迭代调整问题。
第六章 遥感图像分类
6.1 6.2 6.3 6.4 6.5 6.6 6.7 基本知识 遥感图像分类基本原理 监督分类 非监督分类 遥感图像分类新方法 分类后处理和精度分析 分类中非光谱辅助信息应用
6.4
非监督分类
概述
非监督分类是指人们事先对分类过程不加入 非监督分类是指人们事先对分类过程不加入 任何的先验知识, 任何的先验知识,而仅凭遥感图像中地物的光谱 特征,即自然聚类的特征进行的分类。 特征,即自然聚类的特征进行的分类。 特点:分类结果只是区分了存在的差异, 特点:分类结果只是区分了存在的差异,但 不能确定类别的属性。 不能确定类别的属性。类别的属性需要通过目视 判读或实地调查后进行确定。 判读或实地调查后进行确定。 非监督分类有多种方法,其中K 非监督分类有多种方法,其中K-均值方法和 ISODATA方法是效果较好,使用最多的两种方法。 方法是效果较好 ISODATA方法是效果较好,使用最多的两种方法。 非监督分类的假设:相同条件下, 非监督分类的假设:相同条件下,遥感图像 上的同类地物具有相同或相近的光谱特征, 上的同类地物具有相同或相近的光谱特征,从而 表现出某种内在的相似性,归属于同一光谱特征 表现出某种内在的相似性, 空间,反之则不同。 空间,反之则不同。
6.4
非监督分类
K-均值方法 均值方法
④ 对于所有的 如果 则迭代结束,否则转到第②步继续进行。 则迭代结束,否则转到第②步继续进行。 均值算法的优点是实现简单, K-均值算法的优点是实现简单,缺点是过分 依赖初值,容易收敛于局部极值。 依赖初值,容易收敛于局部极值。该方法在迭代过 程中没有调整类数的措施, 程中没有调整类数的措施,产生的结果受所选聚类 中心的数目、初始位置、 中心的数目、初始位置、类分布的几何性质和读入 次序等因素影响较大。初始分类选择不同, 次序等因素影响较大。初始分类选择不同,最后的 分类结果可能不同。 分类结果可能不同。
6.4
非监督分类
初始类别参数的选择
则:Z2=Xj。
6.3
非监督分类
初始类别参数的选择
对于剩余的每个抽样点, ③ 对于剩余的每个抽样点,计算它到已 知各初始类别中心的距离D (i=1,2…,m),m ,m),m为 知各初始类别中心的距离Dij(i=1,2 ,m),m为 已有初始类别数, 已有初始类别数,并取其中的最小距离最为该 点的代表距离D ,D };m为 点的代表距离Dj,Dj=min{D1j,D2j,…,Dmj};m为 已形成的初始类别数。 已形成的初始类别数。 在此基础上, 在此基础上,再对所有各剩余点的最小距 Dj进行相互比较 取其中最大者, 进行相互比较, 离Dj进行相互比较,取其中最大者,并选择与 抽样点( 之对应的抽样点 之对应的抽样点(如X11)作为一个新的初始类别 中心点( 中心点(如Z3=X11). 重复上面步骤, ④ 重复上面步骤,直到初始类别的个数 达到指定数目为止。 达到指定数目为止。
6.4
非监督分类
概述
主要过程如下: 主要过程如下: 确定初始类别参数, ① 确定初始类别参数,即确定最初类别数和 类别中心(点群中心); 类别中心(点群中心); ② 计算每一个像素所对应的特征向量与各点 群中心的距离; 群中心的距离; ③ 选取与中心距离最短的类别作为这一向量 的所属类别; 的所属类别; 计算新类别均值; ④ 计算新类别均值; 比较新的类别均值与初始类别均值, ⑤ 比较新的类别均值与初始类别均值,如果 发生了改变,则以新的类别均值作为聚类中心, 发生了改变,则以新的类别均值作为聚类中心, 再从第②步开始进行。 再从第②步开始进行。
6.4源自文库
非监督分类
K-均值方法 均值方法
由于A到(AB)的距离小于到(CD)的距离, 由于A AB)的距离小于到(CD)的距离, 因此A不用重新分配。计算B到两个类的平方距离, 因此A不用重新分配。计算B到两个类的平方距离, 得到: 得到: 结果表明,B应重新分配到类(CD)中,得到 结果表明, 应重新分配到类(CD) (BCD)。接下来更新类中心的坐标: 类(BCD)。接下来更新类中心的坐标:
6.4
非监督分类
K-均值方法 均值方法
K-均值算法的聚类准则是使每一分类中,像素 均值算法的聚类准则是使每一分类中, 使每一分类中 点到该类别中心的距离的平方和最小。其基本思想是, 点到该类别中心的距离的平方和最小。其基本思想是, 通过迭代逐次移动各类的中心, 通过迭代逐次移动各类的中心,直到满足收敛条件为 止。 收敛条件:对于图像中互不相交的任意一个类, 收敛条件:对于图像中互不相交的任意一个类, 计算该类中的像素值与该类均值差的平方和。 计算该类中的像素值与该类均值差的平方和。将图像 中所有类的平方和相加,并使相加后的值达到最小。 中所有类的平方和相加,并使相加后的值达到最小。 设图像中总类数为m 各类的均值为C 设图像中总类数为m,各类的均值为C,类内的像 素数为N 像素值为f, f,那么收敛条件就是使得下式最 素数为N,像素值为f,那么收敛条件就是使得下式最 小:
6.4
非监督分类
初始类别参数的选择
初始类别参数是指:基准类别集群中心( 初始类别参数是指:基准类别集群中心(数 是指 学期望M ),以及集群分布的协方差矩阵 以及集群分布的协方差矩阵∑ 学期望Mi),以及集群分布的协方差矩阵∑i。 无论采用何种判别函数, 无论采用何种判别函数,都要预先确定其初 始类别的参数,以下介绍几种确定的方法 介绍几种确定的方法: 始类别的参数,以下介绍几种确定的方法: 1、光谱特征比较法 首先在遥感图像中定义一个抽样集, 首先在遥感图像中定义一个抽样集,它可以 是整幅图像的所有像素, 是整幅图像的所有像素,也可以是按一定间隔抽 样的像素;然后选定抽样集中任一像素作为第一 样的像素;然后选定抽样集中任一像素作为第一 个类别(初始类别); 个类别(初始类别);
6.4
非监督分类
初始类别参数的选择
该方法与光谱特征比较法相比, 该方法与光谱特征比较法相比,不受阈值 的影响,与直方图法相比, T的影响,与直方图法相比,结果更接近实际 各类点群的分布位置, 各类点群的分布位置,所以这是一种较为合理 的方法。 的方法。 4、局部直方图峰值法 整幅遥感图像直方图的分布是由各类地物 直方图叠加形成的,同时, 直方图叠加形成的,同时,每个类别的中心一 般在本类别直方图的峰值位置, 般在本类别直方图的峰值位置,而该位置在图 像的总体直方图中往往会表现为局部峰值。 像的总体直方图中往往会表现为局部峰值。局 部直方图峰值法以搜索总体直方图局部峰值为 基础来选定初始类别的中心。 基础来选定初始类别的中心。
6.4
非监督分类
K-均值方法 均值方法
K-均值算法如图。假 均值算法如图。 设图像上的地物要分为m 设图像上的地物要分为m 为已知数。 类,m为已知数。具体计 算步骤如下: 算步骤如下: 适当选取m ① 适当选取m个类的 初始中心 ,初 始中心的选择对聚类结果 有一定影响, 有一定影响,一般有两种 方法: 方法: a、根据问题性质和 经验确定类别数m 经验确定类别数m,从数 据中找出直观上看来比较