基于深度学习的岸线侵占建筑物识别提取
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于深度学习的岸线侵占建筑物识别提
取
摘要:河湖岸线侵占是河湖水域岸线管理的重要问题之一,为河湖生态和防洪等安全带来了严重威胁。
本文基于卫星遥感数据,通过引入Vgg16深度神经网络,提高了传统U-Net网络在收缩路径上的特征提取能力。
研究结果表明,改进的Vgg16 U-Net深度神经网络能够较好的实现建筑物的智能识别,通过叠加河湖管理范围空间矢量进行分析,可实现侵占河湖岸线建筑物的智能提取,有效提高河湖岸线的监管效率和质量。
关键词:河湖岸线;遥感识别;深度学习
1引言
河湖岸线具有可开发的土地利用属性,同时具有行(蓄)洪、调节水流和维护河道(湖泊)健康的自然与生态环境功能属性,河湖岸线资源的保护与开发利用对经济社会可持续发展、维护生态系统良性循环以及保护河湖健康具有十分重要的作用[1]。
然而,随着经济社会的不断发展和城市化进程的加快, 岸线开发利用的需求日益增长,在此形势下,不合理的岸线资源利用愈演愈烈[5-6],特别是长江中下游等经济发展较为迅速的地区,违规侵占河湖岸线来建设房屋、廊桥等构筑物的现象较为普遍,为河湖生态安全、防洪安全等带来了严重威胁。
近年来,遥感技术在水利方面的应用优势逐渐凸显,由于遥感影像具有覆盖范围广、时效性强的特点,将高分辨率遥感技术应用于河湖岸线违规建筑物的监管,将有力提升对侵占河湖岸线现象的监管效率,降低人力损耗,助力河湖长制工作的顺利推进[6]。
但由于卫星遥感影像存在数据量大、目标分布不均衡、色彩对比度低等问题,给违规建筑物的自动识别与提取带来了巨大挑战。
随着深度学习遥感算法研究的不断深入,基于深度学习方法的河湖岸线违规建筑物的自动识别与提取成为可能[2-3],一大批以深度学习理论为基础的建筑物提取与识别方法
相继被提出[7-9],但在岸线侵占建筑物识别与提取方面的研究还不多。
为此,本
文将Vgg16深度神经网络与全卷积神经网络U-Net相融合,并结合河湖岸线管理
范围划定成果,开展岸线侵占建筑物的智能识别与提取方法研究,以实现对河湖
岸线违规建筑物的智慧监管。
2研究方法
2.1Vgg16 U-Net
考虑到违规建筑物的识别与提取涉及建筑物的位置、大小、范围等基础属性,本文采用全卷积神经网络作为岸线侵占建筑物识别的基础方法。
U-Net方法作为
全卷积神经网络的一种,最早是为生物医学图像的分割所开发,网络的结构主要
由收缩路径(contracting path)和扩张路径(expanding path)组成[9]。
其中,收缩路径用于获取影像的上下文信息(context),实现影像特征的提取,扩张
路径用于精确的定位(localization)与分类,两条路径是相互对称的。
在扩张
路径中,影像编码器部分提取的特征会被上采样到它们所属的尺度,在最后一层
中使用sigmoid函数计算每个像素所属的类(构建类和非构建类)的概率,实现像
素级分类。
由于遥感影像的语义特征相比于传统光学图像要更为复杂,本研究采用
VGG16[11]网络对U-Net[10]模型的收缩路径进行改进,增强网络在收缩路径上的特
征提取能力,以下简称VGG16 U-Net。
2.2技术路线
本文基于VGG16 U-Net的河湖岸线违规建筑物提取主要包括样本数据集构建、智能模型构建与训练、违规建筑物识别这三个部分。
总体技术流程为:样本数据
的构建包括样本标注、样本清洗、样本裁切和样本增强等步骤,样本数据集是基
于深度学习智能模型构建的基础。
智能模型的构建与训练涵盖了人工神经网络的
构建、损失函数的选取、训练过程中优化器及参数的设置与可视化和模型的打包
压缩等步骤,这一步骤最终形成有效的建筑物自动识别模型。
在建筑物成功识别
的基础上,通过与河湖管理范围线进行空间叠加分析,可实现对违规建筑物的智
能识别。
3结果分析
3.1研究数据
为了表征不同尺度和不同场景下的建筑物特征,本文选用多传感器(国内外
主流光学卫星、航摄仪、数码相机等)、多分辨率(0.5m、0.8m、1m、2m)的多源
遥感影像,通过目视解译的方式,利用ArcGis软件首先绘制建筑物的轮廓矢量
并进行二值化,形成对应的标签数据。
通过对原始图像和标签数据的裁剪和数据
增广,形成105128张512×512大小的影像数据和标签数据。
同时,贵州省已经完成省内流域面积50km2以上河流管理范围线的划定工作,狭长的河湖岸线区域根据其可开发利用程度依次划分为保护区、保留区、控制利
用区和开发利用区。
该数据为河湖岸线的管理与保护提供了重要的指引。
本文使
用河湖管理范围划界成果作为识别岸线建筑物是否违规的依据。
3.2精度评定
为了评定建筑物提取模型的准确性,本文选用基于像素的F1评分方法来验
证模型的建筑物提取精度,结合精度和召回率比值来确定评分。
其中,精度表征
了被预测为建筑物的相元中预测正确的比例(其中存在误识别为建筑的相元);
召回率表征了正确识别为建筑物的相元占所有真实建筑物相元的比例。
3.3岸线侵占建筑物的识别与提取
在本研究中,选用Intel Core(TM) i7-10700K CPU和英伟达RTX 3090(24G)作为本文的实验设备。
在训练阶段,采用Adadelta算法作为优化器,学习率设
置为0.01,损失函数采用二元交叉熵函数,mini-epoch为8,epoch数目为50。
训练完成后,基于训练的模型在测试图像上进行测试。
表1给出Vgg16 U-Net和原始U-Net 的精度对比。
可以看到,将原始U-Net
的收缩路径替换为Vgg16网络后,建筑物的提取精度得到较大程度的提升,在召
回率和F1评分上也得到明显的提升,这主要是由于Vgg16模型的网络深度更深,结构更为复杂缘故;这使得模型可以更好的实现对遥感影像高层次语义特征的提取,从而提高了对象提取的准确性。
表1 U-Net与Vgg16 U-Net模型精度对比
模型精度(%)召回率(%)F1 评分
(%)
U-Net79.2875.5177.35
86.9483.2788.07
Vgg16 U-
Net
为了违章建筑物与普通建筑物的区分,将识别出的二值化建筑物影像进行矢量化,获取识别出的建筑物矢量;在此基础上与河湖管理范围线矢量进行空间叠加分析,可识别出侵占岸线建筑物的位置、面积、分布等信息。
4结论
河湖岸线侵占是河湖水域岸线管理中的重要问题之一,为河湖生态安全、防洪安全等带来了严重威胁。
本文基于卫星遥感数据和深度学习方法,通过引入Vgg16深度神经网络,改进了传统U-Net网络的收缩路径,提高传统U-Net人工神经网络的特征提取能力。
实验结果表明,改进的U-net网络在建筑物提取的准确性上有较大程度的提升,这主要得益于Vgg16更深和更为复杂的网络结构,提高了模型对遥感影像语义特征的表征能力。
通过与河湖管理范围线矢量进行空间叠加分析,可以实现侵占河湖岸线建筑物的自动识别与提取,这对提高河湖岸线的管理效率与质量、降低人工岸线的巡检成本等具有重要意义。
参考文献
[1]杨鹏, 郑长安, 刘达,等. 长江流域智慧河湖岸线管理探究[J]. 中国防汛抗旱, 2022, 32(3):5.
[2]邓鸿儒, 徐佳, 单文龙,等. 利用主动深度学习提取极化SAR影像建筑区[J]. 测绘科学技术学报, 2018, 35(3):7.
[3]张艳, 王翔宇, 张众维,等. 一种基于边界感知的遥感影像建筑物提取方法[J]. 西安电子科技大学学报, 2022, 49(1):9.
[4]瑚敏君, 冯德俊, 李强. 基于实例分割模型的建筑物自动提取[J]. 测绘通报, 2020(4):6.
[5]沈洋. 基于深度学习的河湖"四乱"问题卫星遥感图像目标检测算法[J]. 信息与电脑, 2021, 33(23):3.
[6]谢优平, 董胜光, 肖祥红. 河湖"四乱"问题遥感监测体系构建探讨与实践[J]. 测绘与空间地理信息, 2021.
[7]唐文博. 基于卷积神经网络的高分辨率多光谱遥感图像上的城区建筑物变化检测技术[D]. 浙江大学.
[8]谭衢霖. 高分辨率多光谱影像城区建筑物提取研究[J]. 测绘学报, 2010(6):6.
[9]瑚敏君, 冯德俊, 李强. 基于实例分割模型的建筑物自动提取[J]. 测绘通报, 2020(4):6.
[10]Guo M, Liu H, Xu Y, Huang Y. Building Extraction Based on U-Net with an Attention Block and Multiple Losses [J]. Remote Sensing. 2020; 12(9):1400.
[11] Erdem F , U Avdan. Comparison of Different U-Net Models for Building Extraction from High-Resolution Aerial Imagery [J]. International Journal of Environment and Geoinformatics, 2020(3).。