高光谱遥感影像分类算法 - SVM

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高光谱遥感影像分类算法——SVM

1高光谱遥感简介

20 世纪 80 年代以来,遥感技术的最大成就之一就是高光谱遥感技术的兴起[1]。高光谱遥感技术又称成像光谱遥感技术,始于成像光谱仪的研究[2]。所谓高光谱遥感(Hyperspectral Remote Sensing)通俗地说就是指利用很多很窄的电磁波波段从感兴趣的物体中获取有关数据的方法。高光谱遥感的最大特点是,在获得目标地物二维空间影像信息的同时,还可以获得高分辨率的可表征其地物物理属性的光谱信息,即人们常说的具有“图谱合一”的特性。可见,与全色、彩色和多光谱等图像数据相比,高光谱影像革命性地把地物的光谱反射信息、空间信息和地物间的几何关系结合在了一起[3]。因此,可以很客观地说,高光谱遥感是代表遥感最新成就的新型技术之一,同时也是目前国内外学者,特别是遥感领域的学者的研究热点之一[4-5]。

2高光谱遥感研究背景

在以美国为代表的成像光谱仪研制成功,并获得高光谱影像数据后,高光谱遥感影像由于其蕴含了丰富的信息(包括地物的空间位置、结构以及光谱特性等信息)使得人们对地物的识别有了显著的提高,并且在许多方面和领域(比如,农业、林业、地质勘探与调查和军事等)都体现出了潜在的巨大应用价值[6]。虽然高光谱影像数据的确为我们的提供了丰富的对地观测信息,但也正是因为高光谱庞大的数据量和高维数的问题使得我们目前对高光谱数据的处理能力显得较为低效,而这也在一定程度上制约了高光谱数据在现实生产和生活的广泛应用与推广[7-8]。因此,为了响应人们对高光谱影像数据处理方法所提出的新的迫切要求,也为了充分利用高光谱数据所包含的丰富信息以最大程度地发挥高光谱的应用价值,我们必须针对高光谱数据的独有特点,在以往遥感图像数据处理技术的基础上,进一步改善和发展高光谱遥感影像处理分析的方法与技术。

3高光谱遥感分类研究

3.1分类的意义

分类是人类了解和认识世界的不可或缺的基本手段。人类的日常生活和生产实践都离不开,也不可能离开分类活动。面对海量数据,人类需要借助计算机来对自身感兴趣的数据进行自动、高效和准确地分类。这一迫切需求已体现在各个

行业和研究领域中。比如,互联网、金融、机器学习、模式识别、数据挖掘、GIS 和RS等行业和研究领域。

众所周知,通过遥感影像对目标地物进行分类不仅一直是高光谱遥感研究领域的研究重点和主要研究内容,同时也是高光谱遥感数据处理方式的手段之一。其主要任务是将遥感影像中所有像元或部分像元划分为不同土地覆盖类型以产生出相应的专题地图[2]。而这些专题图可以在不同程度上清晰地反映出某一区域范围内地物的显现和潜在的空间关系与分布及规律信息。因此,对遥感影像数据进行分类处理是人们获取、认识和发现现实规律信息的重要而又有效的途径[6]。同时,这也能使得高光谱遥感影像能真正有效地应用于我们的实际生产和生活中,为我们的生活提供便利。

3.2面临的问题

虽然现在已经有了许多包括监督分类和无监督聚类方法在内的多种地物分类方法被应用于解决高光谱图像分类问题当中,但在遥感影像地物分类算法不断向着更高效率、更高精度和更加实用的方向发展的背景下,这些方法中的绝大部分仍然难以满足现实的生产和科研需求。此外,遥感影像分类作为图像分类领域中最具挑战性的工作,虽然通过多年的发展取得了长足的进步,但仍然存在着许多问题:Hughes效应(一种在训练样本数目不变的情况下,随着参与分析的波段数目的增加,分类精度会出现先增加后降低的现象)、光谱混合的影响、分类器的选择和特征选择与提取等等[9-10]。而这些问题都会影响到影像的分类精度。并且这些问题的存在正是制约高光谱遥感产品进一步推广与应用的瓶颈之一[3]。当然,这也成为了促使国内外众多的研究者和研究团队长期致力于探索更为高效、准确和实用的高光谱分类算法的背后的主要推动力。

3.3常用分类方法

目前,针对高光谱遥感影像的地物分类算法可大致分为基于地物光谱特征匹配的分类算法和基于统计数据统计特征的地物分类算法。其中,基于地物光谱特征匹配的分类算法常见的主要包括:光谱角填图法(Spectral Angle Mapper,SAM)、光谱信息散度(Spectral Information Divergence,SID)、光谱二进制编码(Binary Coding,BC)和最小距离法(Minimum Distance Classifier,MDC)等。常见的基于数据统计特征的地物分类算法主要包括:K均值聚类(K-Means)、Isodata、最大似然法(Maximum Likelihood,ML)、决策树(Decision Tree,DT)、神经网络(Neural Network,NN)和支持向量机(Support Vector Machine,SVM)等[3]。

传统的基于地物光谱特征匹配的分类算法,以及包括Isodata聚类、K均值

算法和最大似然法在内的传统的统计分类算法是建立在经验风险最小化原则基础之上的,即这些算法只有在样本数据足够多,样本数量趋向于无穷大的情况下,其分类性能和精度才能得到有效保证[6]。然而在大多数的实际情况中,人们所能使用的样本数目往往是很有限的,很难到理论上的要求。此外,有些分类算法(比如,基于光谱特征匹配的SAM、SID和BC等)还需要大量的先验知识,对光谱特征数据的依赖性也较高[3]。所以,在利用这些传统的分类方法对高光谱遥感影像进行分类时,不但算法的执行速度会很慢,而且经分类处理后得出的结果在精度方面也很难让人感到满意,有时甚至还会出现严重的Hughes现象。因此,对于像高光谱遥感影像这种拥有较高数据维度和较少标注样本的遥感数据而言,把这些传统的分类方法直接应用到高光谱遥感数据的分类处理过程中实际上是很不合理的,也是不可行的[2]。

最近几年,基于机器学习的多种分类方法,比如决策树分类、神经网络分类、贝叶斯分类和SVM分类等等,已经在遥感领域得到了广泛的应用,并成为遥感领域中的一个新的研究热点[6,11]。然而,从目前国内外研究者已有的在这类方法的研究上看,虽然决策树分类、神经网络分类和贝叶斯分类与上文所提到的传统的分类方法相比,在高光谱遥感影像的分类性能和分类精度方面分别有了一定程度上的提高,但由于这三种分类方法仍然是建立在经验风险最小化原则的基础之上的[6],因此这也就同样无法避免上文所述及的传统分类法所避免不了的缺陷。而其中的神经网络往往还会陷入局部最优的问题。

与决策树分类、神经网络分类和贝叶斯分类不同的是,SVM由于是在统计学习的理论背景下产生的,并且以结构风险最小化原则为基础,所以SVM有着严格的理论基础,能够较好地解决高光谱遥感数据中的小样本、非线性和高维数等问题。因此与上述其它方法相比,SVM在高光谱遥感影像分类方面取得了较大成功,并有着训练样本小、分类精度高、学习效率高和模型推广性好且能避免局部最优等诸多优点[6]。故本文选取SVM分类算法作为高光谱遥感影像数据分类方法的代表,对其具体内容作一个较为详细的介绍。

4SVM分类

实际上,本文所详述的用于高光谱遥感影像数据分类的支持向量机(SVM)分类算法产生自机器学习领域。而也正如大家所了解的那样,支持向量机(SVM)是一种广泛用于数据分类和回归的监督学习模型或算法,在众多的遥感图像分类算法中它被归于监督分类算法的一员。本文在前文中也有提到,SVM是一种建立在统计学习理论(起源于上个世纪60年代)之上的,并采用结构风险最小化准则的机器学习算法。这使得它能够对小样本统计进行较好的估计和预测学习,同时缩小模型泛化误差的上界,从而提高模型的泛化能力和推广性。由于目前有关

相关文档
最新文档