遥感-论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅谈遥感图像非监督分类的实现方法
摘要:遥感领域容易获得大量未标注样本,适用于半监督学习。而且当标注样本需要付出大的代价又想获得较好的分类效果时,传统的全监督学习不再适合,必须采取半监督学习方法。本文介绍了K_means算法、ISODATA 算法、UCLDA算法、基于高斯混合模型的半监督分类算法和支持向量机分类方法等几种遥感图像半监督分类方法,并从半监督分类原理、分类过程、分类方法等探讨了几种算法的半监督分类的实现及其区别与联系。
关键词:半监督学习,半监督分类,算法
1.前言
高光谱遥感影像提供了极为丰富的地球表面信息,可以处理各种地球表面遥感问题。主要的应用包括环境测绘、全球变化研究、地质研究、湿地测绘、道路通行能力评估、植物及矿物的鉴定等。所有的这些应用都有一个共同的要求,那就是要对场景中的每个像素进行分类。遥感图像分类是信息提取及处理的关键技术之一,图像分类的目的是将图像中每个像元根据其在不同波段的光谱亮度、空间结构特征或者其他信息,按照某种规则或算法划分为不同的类别[1]。快速、高精度的遥感图像分类方法是实现各种实际应用的前提[2]。
伴随着“数字地球”概念的提出,越来越多的民用场合需要用到遥感图像,而利用目的不同,对遥感图像处理则提出了不同的要求,所以图像分类也就显得尤为重要。最常用的遥感图像分类方法主要是监督分类和非监督分类。两种方法有区别、有联系、各有优、缺点,在实际应用效果上,有相同和不相同的地方[3]。本文从几种非监督分类方法的原理、算法及优缺点出发,探讨遥感图像非监督分类的实现过程。
2.非监督分类及其实现方法
2.1.非监督分类
非监督分类(unsupervised),也称为聚类分析或点群分析。即在多光谱图像中搜寻、定义其自然相似光谱集群组的过程。非监督分类不需要人工选择训练样本,仅需极少的人工初始输入,计算机按照一定规则自动地根据像元光谱或空间等特征组成集群组,然后分析者将每个组和参考数据比较,将其划分到某一类别中去。
遥感影像的非监督分类,是指人们事先对分类过程不施加任何的先验知识,仅凭据遥感影像的光谱特性的分布规律,顺其自然地进行盲目分类。非监督分类主要采用聚类分析的方
法,即把一组像素按照相似性归成若干类别,使得同一类别的像素之间的距离尽可能小而不同类别之间的距离尽可能大。它首先要确定基准类别的参量,再由集群的参数来调整预制的参量,再聚类调整,直到有关参数达到允许的范围[4]。就分类精度来说,对于非监督分类,在不知道影像先验知识的情况下,判断分类精度的指标是各聚类中心间的距离和聚类内部标准差。类间距离反映了类间的离散程度,类内标准差反映了各类内部的聚合程度,类间距离越大,类内标准差越小,则说明所得的分类结果越好,各类聚合度越高[5]。
它的主要优点表现在:①不需要对所要分类的区域有广泛的了解和熟悉;②人为误差的机会减少;③独特的、覆盖面小的类别均能够被识别[6]。主要缺点是来自对其“自然”的依赖性:①所产生的光谱集群组并不一定对应于分析者想要的类别,因此分析者面临着如何将它们和想要的类别相匹配的问题,实际上几乎很少有一对一的对应关系;②分析者较难对产生的类别进行控制,因此其产生的类别也许并不能让分析者满意;③图像中各类别的光谱特征会随时间、地形等变化,不同图像以及不同时段的图像之间的光谱集群组无法保持其连续性,从而使不同图像之间的对比变得困难。
2.2.K_means算法
K_means算法是一种常用的非监督分类方法。K_means算法的步骤:①基本初始参数的确定;②初始类别中心的选择;③分类;○4计算新的聚类中心。但该算法的结果往往受到初始聚类中心选择和聚类中心的个数等因素的影响。目前比较常用的初始类别中心的确定方法有任意选取K个样本作为初始聚类中心法,像素光谱特征比较法,最大最小选心法和总体直方图均匀定心法等。魏从玲,符丽萍[7]对非监督分类的几种确定初始聚类方法进行了对比研究表明,发现最大最小距离选心法可以保证较高的精度,但分类效率不高;均值标准差确定初始聚类法和任意选取K个样本作为初始聚类中心的方法分类效率相对较高,但是精度较低。包健,厉小润[8]采用最大最小选心法,在确定分类总数的条件下,研究了K_means 算法中迭代次数对遥感影像的非监督分类的影响。实验结果表明,随着迭代次数的增加,类别中心会从相互之间差距最大的聚类中心调整为图像上所占像素比较多的类的聚类中心,反映到分类图上就是从开始表现图像边界的图转向表现图像占像素比较多的类组成的图。
K_means算法在高光谱遥感影像的非监督分类中具有较强的实用性,表现出了良好的优点。但是,由于K均值算法需要先给定类别数,而这在很多情况下都是凭主观臆测获得。另外,K均值算法只采用均值作为一个类的代表点,这只有当类的自然分布为球体或接近球体时,即各类中各分量的方差接近相等时才可能有较好的分类效果[9]。
2.3.ISODATA算法
遥感影像分类的理论依据是各类样本内在的相似性,影像分类就是将相似的种类(像元)合并,将不相似的种类(像元)分开,这样就可以把各像元在特征空间的分布按其相似性分割或合并成一些集群。ISODATA 算法就是利用合并和分开的一种著名的聚类方法。它是个循环过程,通常需要定义初始聚类中心、初始类别数、最大不变像元百分比和允许迭代的最大次数等参数。该算法的基本步骤为:给出初始聚类中心;计算其它像元离这些中心的距离,按照最小距离规则划分到其对应的集群中;重新计算每个集群的均值,按定义的参数调整集群组;直到达到相应的参数条件为止。ISODA2TA 法的实质是以初始类别为“种子”进行自动迭代聚类的过程。
经过ISODATA算法得到的集群组只是一些自然光谱组,需要分析者将每个集群组归到其对应的类别中,这个过程通常需要参考其他的图。有时一些自然组可能是混合的,不一定会对应于一个类别,因此在实际应用中,经过ISODATA 算法得到的图,分析者将一些易于识别的组归类后,做成一个黑白掩膜图像,用到原图像中,过滤掉归类的部分,留下难以归类的图像,对这个残余图像重新运行ISODATA 算法,直到所有的集群组都能归类。
2.4.UCLDA算法
有监督的分类方需要大量训练样本,而样本的选择比较困难,并且从光谱库或野地探测获得的样本都与实际要处理的高光谱影像有较大的差异,这也大大降低了算法的实效性。针对这一问题,张凯,赵辽英,厉小润等[10]从特征提取的角度提出了一种用于高光谱混合像元分类的非监督约束线性判别分析算法(UCLDA)。
UCLDA分类方法的实现步骤为:(1) 利用VCA提取端元光谱ui,i = 1,…,p ( p为总的端元数)。(2) 根据VCA得到的端元光谱向量利用SAM构造训练样本,即ui形成的光谱角度小于5°的所有像元作为第i类训练样本,记为ci,i = 1…p。(3) 用CLDA算法求出正交投影算子集(共p个投影算子),分别为Wi,i = 1…p。(4) 把影像中的所有像元向W 进行投影,得每个像元的投影向量,记为Vk,k = 1,…,n ( n为影像中像元总数)。(5) 把各端元向量向W做投影,得到各端元的投影向量,记为Ej,j = 1,…,p。(6) 对Vk( k = 1,…,n )求欧氏距离‖Vk- Ej‖( j = 1,…,p),再根据最小距离分类方法分类。
实验证明,该方法对高光谱数据处理具有较好的效果。UCLDA方法不仅能够自动提取影像端元光谱,而且克服了子空间方法需要大量样本的缺点。模拟高光谱数据和真实遥感影像的实验结果表明,UCLDA是一种有效的高光谱影像分类方法,且其性能明显好于SAM分类,并略优于最小二乘光谱混合分析技术,但明显好于经典的光谱角匹配分类。
2.5.基于高斯混合模型的半监督分类算法