基于DCNN的高分辨率遥感影像场景分类
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第53卷第4期华中师范大学学报(自然科学版)
Vol.53No.4
2019年8月JOURNAL OF CENTRAL CHINA NORMAL
UNIVERSITY(Nat.Sci.)Aug
.2019收稿日期:2019-03-
04.基金项目:十三五科技部国家重点研发计划项目(2016YFC0803107,2016YFB052601,2017YFB0504103).
*通讯联系人.E-mail:duanxuelin@w
hu.edu.cn.DOI:10.19603/j.cnki.1000-1190.2019.04.017文章编号:1000-1190(2019)04-0568-
07基于DCNN的高分辨率遥感影像场景分类孟庆祥,段学琳
(武汉大学遥感信息工程学院,武汉430000
)摘 要:针对传统场景分类方法不能准确地表达高分辨率遥感影像丰富的语义信息问题,提出了一种基于卷积神经网络的高分辨率影像场景分类方法.此方法大致分为3步:第1步,依据不同卷积窗口做卷积运算提取颜色,
纹理和形状等低阶特征;第2步,利用池化层将这些低阶特征进行过滤,得到重要特征;第3步,重组提取出来的特征以形成高阶语义特征进行场景分类.在具体实验中利用三个不同尺寸的卷积核对数据集进行分类探究,并且使用了数据增广、正则化和Dropout等手段,提升模型对新样本的适应能力,很好地解决了过拟合问题.该方法在所进行的实验中表现良好,在WHU-RS19数据集上取得了88.47%的准确率,和传统的场景分类方法相比,显著提升了分类精度.
关键词:高分辨率遥感影像;场景分类;深度学习;深度卷积神经网络中图分类号:P237
文献标识码:A
遥感技术的不断发展,
带来了影像分辨率的提升.这种高空间分辨率的遥感影像具有丰富的空间信息和纹理特征,包含了大量的语义信息.然而面向像素和面向对象的解译方法存在着很多不足,无法满足遥感影像高层次内容解译的需求.因此,对高分辨率遥感图像进行场景分类成为了当前遥感
图像解译中活跃的研究课题[1].
场景分类是遥感研究领域的热点.通俗的来说,就是用给定的图像,通过其包含的内容对它的场景类别进行判断.传统的场景分类方法可以概括为两类:基于低层次特征的方法和基于中层语义
特征建模的方法[2]
.
基于低层特征的场景分类,即依赖于颜色、纹理和形状等低层特征的分类方法,此类分类算法比较简单,但泛化能力较弱、精度不
够高[3-4].
基于中间语义的图像分类,即先生成底层特征,
然后结合分类器实现图像场景分类,其代表有视觉词袋(BoVW)[5]以及由此衍生的空间金字塔匹配核(SPMK)
[6]等,此类方法会导致信息的丢失,存在一定的局限性.
由于传统的场景分类方法无法满足大数据环
境下人们的分类要求,学者们开始将深度学习[7-8]算法应用到影像分类中.典型的深度网络模型[9]主要有深度置信网(DBN)[10]
、栈式自动编码器网络(SAE)[11]和卷积神经网络(CNN)[12-
13].
其中,卷积神经网络是目前较为流行的基于监督的深度学习方法,
该方法在图像识别、物体识别、图像语义分割中都得到了广泛的应用.近年来,越来越多的学者将卷积神经网络运用于图像分类.文献[14]将卷积神经网络用于图像分类,在CIFAR-10数据集上取得了较好的分类效果.文献[15]用卷积神经网络对Landsat
TM5中等分辨率遥感影像进行了分类实验,并与支持向量机分类结果进行比较,在一定程度上体现了卷积神经网络在图像分类的优越性.与此同时,有学者将卷积神经网络运用于遥感影像的场景分类,并取得了一定的进展,这种场景分类方法很快受到了广泛的关注.
在此基础上,本文提出一种基于深度卷积神经网络的场景分类模型DCNN,将该模型用于高分辨率遥感影像的场景分类,加入数据增广并且利用正则化方法和丢弃函数调整模型参数,最终实现基于卷积神经网络的高分辨率遥感影像分类.
1卷积神经网络
卷积神经网络是一种受生物学启示的,包含卷积计算且具有深度结构的前馈神经网络.它可以进行监督分类,提取出遥感影像中的语义特征.一个
基本的卷积神经网络结构有3层[16-
17]:输入层-隐
含层-输出层,
隐含层又分为4部分———卷积层、
第4期孟庆祥等:基于DCNN的高分辨率遥感影像场景分类569
池化层、激活函数和全连接层.
1
)卷积层:对输入的遥感影像数据进行特征提取,通过卷积核对图像进行卷积运算,得到特征图.其中,卷积核大小、步长以及填充方式决定了特征图的大小.
2)池化层:主要起过滤作用,减少参数、压缩数据,以保留重要特征,减小过拟合.3)激活函数:把卷积层输出结果做非线性映射,协助表达复杂特性.常用的激活函数有tanh、
sigmoid和ReLU[18]
.其中,sig
moid和tanh容易造成梯度消失的问题,而线性整流函数ReLU具有
分段线性性质,在一定程度上避免了梯度爆炸和梯度消失问题.同时,它还比较符合生物学的原理,具有一定的稀疏性.
4
)全连接层:对卷积层和池化层得到的特征进行综合.特征图在全连接层中会失去3维结构,被展开为向量并通过激活函数传递至下一层.最后的分类器接收就是对全连接层产生的结果进行分类,输出分类结果
.
图1 卷积神经网络
Fig
.1 Convolution Neural Network 为了更好地训练卷积神经网络,
通常会加入一些技巧,例如:Dropout[19]、正则化[20]
以及数据增广等,使得训练的模型具有更强的泛化能力,以提高分类准确率.
2基于DCNN的场景分类
2.1技术路线
本文提出了一种基于卷积神经网络的高分辨率遥感影像场景分类模型DCNN,并参照经典卷积网络结构LeNet-5、AlexNet、GoogleNet中常用的卷积核尺寸,使用3×3,5×5,7×7三个不同尺寸的卷积核对数据集进行分类探究.卷积核越大,感受野越大,获取的图片信息越多,获得的特征越好.但是大的卷积核会导致计算量的暴增,不利于模型深度的增加,计算性能也会降低.因此,对于更大尺寸的卷积核,本文不予以讨论.全文的技术路线如图2所示.
2.2DCNN的网络结构
和AlexNet类似,本文所用DCNN包含5个卷积层和3个全连接层(如图3所示).第一层卷积层只能提取一些低级的特征,随着层数的增多,能学会的特征也就越复杂.全连接层则把前边提取到的特征综合起来,随着其层数加深,
模
图2 技术路线
Fig.2 Technology
Roadmap型非线性表达能力提高.但如果层数过多,又会带来运算时间增加,运算效率降低等困扰.和一般的卷积神经网络相比,本文所用的DCNN模型
既可以在一定程度上提高模型的学习能力,又能保证运算效率.在卷积运算中,卷积的步长为1,并采用全0填充的方式.池化过程所使用的过滤器尺寸为2*2,过滤步长为2.激活函数采用ReLU,并在实验中加入LRN以提高分类准确度.最后,由隐含层末尾的全连接层将得到的特征图展开为向量传递给Softmax分类器,得到最终分类结果.