一种基于S3V M模型的高光谱遥感影像分类改进算法 黄庆彬

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一种基于S3V M模型的高光谱遥感影像分类改进算法黄庆彬摘要:在实际的高光谱遥感影像分类当中,训练样本获取不易,传统分类方法

受训练样本数量不足的限制而较难获得很好的分类结果。针对这一问题,本文提

出一种优化半监督支持向量机模型的高光谱遥感影像分类算法。本文方法使用K-means++算法对所使用的对未标记样本做聚类后获得未标记样本聚类特征,之后

用其辅助构建算法分类器,从而实现在小样本情况下提高高光谱影像分类精度。

实验表明本文所提方法切实可行,具有较好的稳健性。

关键词:高光谱遥感影像;分类;S3VM;未标记样本

An Improved Classification Algorithm for Hyperspectral Remote Sensing Image Based on S3VM Model

Wei Lifei

Abstract:In the actual classification of hyperspectral remote sensing images,

the training samples are not easy to obtain.The traditional classification method is difficult to obtain good classification results due to the shortage of training

samples.Aiming at this problem,this paper proposes a hyperspectral remote sensing image classification algorithm which optimizes the semi-supervised support vector machine model.In this paper,the K-means++ algorithm is used to cluster the unlabeled samples to obtain the unlabeled sample clustering features,and then use it to construct the algorithm classifier,so as to improve the classification accuracy of hyperspectral imagery in small samples.Experiments show that the proposed method

is feasible and has good robustness.

Key words:hyperspectral remote sensing image;classification;S3VM;unlabeled sample

高光谱遥感影像能够提供的非常丰富的人们所需的地物信息[1]。利用高光谱

遥感影像对地物进行分类,是高光谱遥感影像诸多重要应用之一[2],这一应用已

广泛在生态监测、土地利用评价、农业遥感、城市规划等国民生产或科研领域中

应用[3-4]。

由于高光谱数据具有数据高维、数据量大等特点,原本用于多光谱影像的传

统分类方法不再适用于对的高光谱遥感影像进行分类。传统分类方法的理论假设

对样本的数量有很高的要求。但是,实际的分类问题中,样本的获取并有不简单,较难获取足够数量样本用以满足传统统计理论[5-6]。支持向量机是一种具有优异

二类分类性能的学习方法,它建立于统计学习理论之上,能够在有限训练样本的

情况下获得较好的分类结果[7-9]。将支持向量机拓展到高光谱遥感影像分类这一

多类分类问题中是可行的,且已经有许多效果较好的研究成果[10-13]。

为能在小样本情况下获得的分类结果的精度更高,本文研究依据统计学习理

论提出一种用于高光谱遥感影像分类的半监督支持向量机模型的方法。本文方法

在每类的训练样本数量较少的情况下使用K-means++聚类算法[14]对所使用的未标记的样本点进行聚类,运用未标记样本点中的结构信息来辅助完成构建SVM,最

终完成对高光谱遥感影像的分类。

1 算法模型研究

本文提出一种优化的支持向量机模型用于对高光谱遥感影像进行分类,所提

方法基于半监督支持向量机理论体系[15],将未标记样本特征纳入模型算法当中,重点工作如下。

1.1 获取未标记样本特征

本文方法在进行分类时,为了克服由于使用大量未标记样本将导致算法时间复杂度较高这一局限,首先使用上文所述的K-means++聚类算法对所选用的未标记样本进行聚类,提取其特征,获得聚类核函数。

在具体算法实现当中对未标记样本进行迭代计算,直到标准测度函数达到最小值,即开始收敛为止,这时候获得的聚类结果将为最优的。标准测度函数的定义如下公式:

(1.1)

其中,为未标记样本的聚类集合的数目;为未标记样本的聚类集合;为未标记样本;为第类的聚类中心的位置;,为聚类集合当中包含的样本数目;为到的距离。

使用K-means++聚类算法对未标记样本进行聚类时,核心部分是要确定其聚类中心个数与训练样本的类别数目相同的前提下,对其未标记样本进行次迭代运算,对于每个都将对应得到一个聚类值(为迭代运算的次数,其范围为)。依据和被划分到同一聚类集合的次数获得聚类核,其表达式如下:

(1.2)

在未标记样本聚类核表达式中,为样本,为K-means++聚类算法迭代计算所进行的次数。

对于训练样本,本文采用高斯核函数[16]计算训练样本的基核,其表达式如下:

(1.3)

其中,为训练样本;,,为样本个数;作为高斯核函数中的一个宽窄因子,其作用是调控着高斯核函数的局部的作用区域。

1.2 综合训练

通过之前的计算,获得未标记样本的聚类核函数以及训练样本的原始基核。本文通过使用未标记样本的聚类核函数与训练样本的原始基核之和来修正算法的核函数,以求避免直接使用预设核函数可能存在训练样本分布上的不足或者误差等局限,修正核函数如下式:

(1.4)

将前文所得的未标记样本对应的聚类核函数式(5.2)和训练样本的原始基核式(5.3)代入至修正核函数式(5.4),可以得到:

(1.5)

之后使用修正核函数来训练新的支持向量机,并用其对高光谱遥感影像做进一步的分类工作。

2 优化S3VM模型的高光谱遥感影像分类算法

本文方法在选择出所需的未标记样本之后,使用K-means++算法对所使用的对未标记样本做聚类后获得未标记样本聚类核,之后将其与标准支持向量机经标记样本训练后所得的核进行组合成修正的基核,从而进一步实现对高光谱影像的分类处理工作。本文所提优化半监督支持向量机的技术实现流程如图1.1所示。

图2.1 算法流程图

3 分类实验与分析

本文实验使用的高光谱遥感影像数据为Indian Pines数据集。该数据集是最早用于高光谱遥感影像分类的测试数据,于1992年6月在美国Indiana对一块印度松林使用AVIRIS(机载可见光/红外成像光谱仪)进行成像后截取其中145×145大小后所获得[17]。

相关文档
最新文档