遥感影像解译样本
遥感影像解译手册
遥感影像解译手册河南省环境监测中心2012.121 生态遥感监测与评价工作流程 (1)1.1 生态遥感监测与评价的主要目标包括: (1)1.2 工作流程 (1)1.3 提交成果 (2)2 遥感影像处理 (2)2.1 遥感影像简介 (2)2.2 遥感影像准备 (2)2.3 原始影像导出 (4)2.4 波段合成与分离 (6)2.5 影像校色处理 (8)2.6 地图投影 (10)3 几何纠正 (20)3.1 几何纠正简介 (20)3.2 几何纠正基本步骤 (21)3.3 质量检查 (25)3.4图像拼接 (26)4 遥感解译 (27)4.1 土地利用/覆盖数据的解译 (27)4.2 具体操作 (29)5 检查 (31)1 生态遥感监测与评价工作流程1.1 生态遥感监测与评价的主要目标包括:(1)利用前年Landsat TM数据监测全国土地利用/覆盖分布;(2)对全国生态环境质量进行评价,并分析前年间全国生态环境质量空间分布及变化趋势;(3)结合近几年间我国社会、经济、环境、人类活动因子,分析生态环境重大变化区域的脆弱机制,为制定生态保护和恢复的对策提供依据。
1.2 工作流程生态遥感监测与评价的具体流程如图1。
图11.3 提交成果主要有四部分:(1)影像,以县和整景为单位,两类;(2)解译数据,以省为单元的当年现状图层及动态图层;(3)生态报告;(4)地面核查数据,照片、数据库、报告。
2 遥感影像处理2.1 遥感影像简介遥感是通过遥感器这类对电磁波敏感的仪器,在远离目标和非接触目标物体条件下探测目标地物,获取其反射、辐射或散射的电磁波信息(如电场、磁场、电磁波、地震波等信息),并进行提取、判定、加工处理、分析与应用的一门科学和技术。
遥感,从字面上来看,可以简单理解为遥远的感知,泛指一切无接触的远距离的探测;从现代技术层面来看,“遥感”是一种应用探测仪器,不与探测目标相接触,从远处把目标的电磁波特性记录下来,通过分析,揭示出物体的特征性质及其变化的综合性探测技术。
卫星遥感影像解译样本生产技术规程
卫星遥感影像解译样本生产技术规程英文回答:## Satellite Remote Sensing Image Interpretation Sample Production Technology Specification.1. Overview.Satellite remote sensing image interpretation is a process of extracting information from satellite images. This information can be used for various purposes, such as land use mapping, agricultural monitoring, and disaster assessment.The accuracy of satellite remote sensing image interpretation depends on the quality of the samples used for training the image classification algorithm. Therefore, it is important to develop a standardized procedure for the production of high-quality samples.2. Sample Collection.The first step in sample production is to collect a set of representative samples. These samples should cover the entire range of variability in the image data.The samples can be collected manually or automatically. Manual sample collection is time-consuming, but it allows for a more precise selection of samples. Automatic sample collection is less time-consuming, but it may result in a less representative sample set.3. Sample Labeling.Once the samples have been collected, they must be labeled with the correct land cover class. This labeling can be done manually or automatically.Manual labeling is time-consuming, but it allows for a more precise labeling of samples. Automatic labeling is less time-consuming, but it may result in a less accurate labeling.4. Sample Validation.After the samples have been labeled, they must be validated to ensure that they are accurate. This can be done by comparing the labels to ground truth data.The ground truth data can be collected through field surveys or by using other sources of information, such as aerial photographs or lidar data.5. Sample Selection.The final step in sample production is to select a subset of samples to use for training the image classification algorithm. This subset should be representative of the entire range of variability in the image data.The samples can be selected randomly or by using a stratified sampling approach. Stratified sampling ensures that all land cover classes are adequately represented inthe training set.6. Conclusion.The production of high-quality samples is essential for the accuracy of satellite remote sensing image interpretation. By following the steps outlined in this specification, users can produce samples that are representative, accurate, and suitable for training image classification algorithms.中文回答:## 卫星遥感影像解译样本生产技术规程。
遥感影像目视解译实验报告
地类编码
地类名称
遥感判读标志
具体特征
011
水田
颜色、纹理、形状
颜色是黑色、纹理是排列整齐条带状、形状Fra bibliotek方形013
旱地
颜色、纹理、形状
颜色为土黄色、纹理是排列整齐、形状为方形
033
其它林地
颜色、图形、相关布局
颜色为绿色、图形为连绵的树林、相关布局呈条带状分布
043
其它草地
颜色、图形、空间位置
101
铁路用地
形状、纹理、图形
形状为长矩形、纹理为条状、图形为道路
114
坑塘水面
颜色、形状、大小
颜色为墨绿色、形状为不规则椭圆形、大小为适中
颜色为浅绿色、图形为不规则的椭圆形、空间位置为环绕坑塘水面
201
城市
形状、纹理、空间位置
形状为建筑物、纹理为排列整齐、空间位置为位于江西农业大学教学区
203
村庄
形状、纹理、空间位置
形状为建筑物、纹理为分散的块状、空间位置为位于农大附近的村庄
204
采矿用地
形状、大小、颜色
形状为厂房建筑、大小为小型厂房、颜色为灰白色
遥感影像解译样本数据技术规定
全局唯一性。需要在照片整理阶段,把文件名改用照片标识符命名,文件名的后缀名
不变。
遥感影像解译样本数据采集要求
3.2 地面照片属性采集要求
应正确操作获取相关属性参数的仪器,照片的拍摄点位置、照片方位角的值
应尽可能发挥仪器设备的精度水平,确保获得高质量的数据。拍摄点位置定位精 度一般应控制在15米以内。照片方位角的精度应在5度以内。 地面照片包含18项属性内容,其获取方法和采集要求见下表。
3 4 5 6
拍摄点经度 拍摄点纬度
部分相机自动记录;也可通过与 从照片 EXIF 信息的 GPSLongitude 标 GPS 设备同步提取 记中读取。采用 WGS84坐标系。 同上 从照片 EXIF 信息的 GPSLatitude 标记 中读取。采用 WGS84坐标系。 从照片 EXIF 信息的 GPSDOP 标记中 读取。无法获时可以不填写。 从照片 EXIF 信息的 GPSAltitude 标记 中读取。为大地高。
测拍摄距离并记录。可以现场估测,也可以内业确定拍摄对象位置后测算其与相
机位置之间的距离得到。 • 对于需要长焦远距离拍摄的景物,应在同一拍摄位置采用相同的相机姿态(包 括镜头方位角、俯仰角、横滚角3个参数)分别用正常焦距、中焦和长焦拍摄3张
照片,或至少用正常焦距和长焦拍摄两张照片,以利于在照片上完整反映远方地
内容和属性
遥感影像解译样本数据内容和属性
解译样本数据内容:一是地面照片,二是遥感影像实例数据。
两者之间根据位置和反映的内容具有明确的对应关系,下面几种情况都是合 理的:
一对一关系:
一对多关系: 多对一关系: 一般针对比较复杂的地面环境。 多对多关系: 上面两种情况的综合。
遥感影像解译样本数据一体化整理方法
遥感影像解译样本数据一体化整理方法发布时间:2022-09-25T05:07:16.464Z 来源:《建筑创作》2022年第4期(2月)作者:王刚[导读] 遥感影像解译样本数据收集的时候,要求对地面照片、影像案例、样本数据库做到结构化整合,构成数据格式统一、保存结构比较规范、逻辑关系比较严谨。
王刚江苏省地质测绘院江苏南京 211100摘要:遥感影像解译样本数据收集的时候,要求对地面照片、影像案例、样本数据库做到结构化整合,构成数据格式统一、保存结构比较规范、逻辑关系比较严谨。
在建立策略模型中,提供一系列整理策略,运用Bresenham图形制定算法,和栅格、矢量、数据库数据编程接口,处理了每个部分自动化解决问题,完成影像案例收集、地面照片视野范畴图形栅格化、数据库信息收集和记录、结构组织和结构化输出等自主控制,进而完成一体化自动处理。
关键词:遥感影像;解译样本数据;一体化整理方法遥感影像解译样本数据收集就是为了运用典型光谱、纹理、形状、空间部位等特点,建立地面覆盖分类样本库,为解释人员准确认识每种元素提供关键参照,同时在解释结果质量控制层面展现重要的作用。
在首次我国地理国情调查中,遥感影像解译样本数据收集属于一种关键内容,收集的流程就是在外收集完成地面照以后,让有关人员通过正射处理影像数据源中裁切和地面照片拍摄范畴与内容相同的航空航天遥感影像;同时通过结构调整,构成十分完善的成果内容。
一、遥感影像解译样本数据的种类遥感影像解译样本数据包括不同种类、不同格式、满足不同准确的数据,这之中,地面照片运用JPG格式,满足EXIF准则;遥感影像案例运用非压缩的TIFF格式;影像数据源运用的是非压缩的TIFF、ERDAS或者IMG格式;影像坐标信息运用TIFF WORLD文档格式;影像投影信息运用XML格式,满足OGC规格;影像要素数据运用XML格式;遥感影像解译样本数据库。
当前不存在任何一种合适的策略可以一体化做好遥感影像解译样本数据整合这种工作。
遥感影像目视解译(土地利用)
遥感影像解译标准的制定与完善
总结词
制定和完善遥感影像解译标准是提高解译质量和可重 复性的关键。
详细描述
由于遥感影像目视解译具有较强的主观性和经验性,不 同解译人员可能得出不同的解译结果。为了提高解译质 量和可重复性,需要制定和完善遥感影像解译标准。通 过建立统一的解译流程、符号体系和精度评估方法等标 准,规范解译人员的操作和评估方法,从而提高解译结 果的准确性和一致性。同时,标准的制定和完善也有助 于推动遥感影像目视解译的规范化发展,促进其在土地 利用监测和管理中的广泛应用。
人工智能与机器学习在遥感影像解译中的应用
总结词
人工智能和机器学习技术为遥感影像目视解译提供了 新的方法和思路,能够提高解译效率和精度。
详细描述
随着人工智能和机器学习技术的快速发展,这些技术 逐渐被应用于遥感影像的解译中。通过训练机器学习 模型,使其具备学习和识别遥感影像中地物特征的能 力,可以辅助或替代目视解译,提高解译效率和精度 。同时,机器学习技术还可以用于遥感影像的自动分 类和变化检测等方面,为土地利用监测和管理提供更 为准确和及时的数据支持。
间接解译标志
如地形地貌、水体分布、植被覆盖等 ,通过综合分析间接推断地物的类型 和特征。
遥感影像的解译步骤与方法
初步解译
根据解译标志对遥感影像进行 初步分类和识别。
详细解译
在初步解译的基础上,进一步 细化分类,完善地物特征信息 。
验证与修正
通过实地调查和验证,对解译 结果进行必要的修正和补充。
制图与输出
PART 04
遥感影像目视解译在土地 利用中的应用案例
REPORTING
WENKU DESIGN
城市扩张的监测与评估
总结词
遥感影像(标准假彩色合成)解译标志
主要分布在城镇及经济发达区周围或交通沿线
边界清晰
灰色或色调不均
影像结构较粗糙
未利用土地
沙地
主要分布湖积平原及西部风沙区
逐渐过渡,边界不清晰
浅绿色
影像结构比较均匀
盐碱地
主要分布在本区西部低洼地
边界较清晰
白色,夹蓝色或红色斑点
影像结构粗糙
沼泽地
主要分布在河流沿岸及平原上的低洼地及沿海
几何形状明显,边界清楚
影像纹理较均一
旱
地
主要分布在山区、坡地、丘陵缓坡地带、
河流冲洪积、滨海平原台地、山前平原
沿山脚低缓坡不规则条带状或大面积分布,边界不清楚
影像色调多样,一般为浅绿色、浅灰色、浅黄色(春)红色或浅红色(夏)褐色(收割后)
影像结构粗糙、纹理明显,有条状纹理,有田块形状,可见农田防护林网格
林地
有林地
不同地貌区域均有分布以大小兴安岭、长白山等山地为主
影像色调多样
影像结构不一
草地
高覆盖度草地
主要分布在低洼地或平地,山地丘陵的阳坡及顶部也有分布
面状条带状块状,边界清晰
红色,黄色,褐色,绿色
影像结构较均一,边界清晰,无纹理
中覆盖度草地
主要分布在低洼地及山地丘陵的阳坡或顶部
面状条带状块状,边界清晰
黄色,褐色,绿色或白色
影像结构较均一
低覆盖度草地
山地丘陵阳坡或顶部,主要分布在辽西山地,西部低洼地也有分布
受地形控制边界自然圆滑,呈不规则形状
深红色、暗红色,色调均匀
有绒状纹理
灌木林地
主要分布在丘陵及河谷两侧
受地形控制边界自然圆滑,呈不规则形状
浅红色,色调均匀
锟斤拷锟斤拷锟斤拷锟揭o拷薪锟斤拷
严重错漏 1. 主要成果类型缺失 2. 存在重要内容错漏 3. 其他严重错漏 1. 未实现地类全覆盖,采集数量严重不满足要求 2. 其他严重错漏
1. 存在严重错漏,影响成果使用 2. 其他严重的错漏
1. 数量、拍摄质量、标绘等严重不符合要求 2. 其他严重错漏
1. 影像空间参考系不正确 2. 影像分辨率范围与色彩模式等不符合要求 3. 其他严重的错漏
1 解译样本质量检查与控制
1. 1 质量检查与控制关键点的设立
根据《遥感影像解译样本数据技术规定》及测绘产品 质量检查办法 GB /T18316 - 2001 及 GB /T24356 - 2009 中 的相关质量检查与控制的要求,分别从数据完整性、样本 数量及分布密度、样本数据库、地面照片及遥感影像 5 个方 面设立质量检查与控制的关键点,具体检查内容见表 1。
1. 2 过程质量检查与控制
为确保普查成果的质量,充分发挥好过程质量控制、 质量监督管理的作用,根据 1. 1 中质量检查与控制的关键 点,对影响解译 样 本 成 果 质 量 的 资 料、技 术、流 程 等 主 要 要素进行控制,及时发现并解决生产中出现的质量问题, 采用“预防为主、防 检 结 合 ”的 手 段 将 成 果 的 质 量 隐 患 消 除在生产环节,确保地理国情普查成果的真实、准确和可 靠。在生产过程中要分别从图 1 中描述的几个方面进行 过程质量控制,其 中 地 面 照 片 要 具 有 典 型 性,且 其 姿 态、 距离、总像素等要满足拍摄要求; 遥感影像实例要与遥感 数据源相同,满足裁切范围要求并与照片相对应。
5) LCA 层元数据参考资料要与实际利用情况一致。 6) 不能存在非法代码。 7) 相邻面属性相同应合并处理,合并采取就近就大 的原则。 8) 拓扑检查: 通过拓扑检查看是否存在面重叠、面裂 隙、复合要素。
基于深度学习的遥感解译地物样本库建设研究
2023/ 10 27基于深度学习的遥感解译地物样本库建设研究李莹 化涛(河南丰图测绘服务有限公司,河南 郑州 45000)摘 要:针对遥感解译样本库存在分类体系混乱、共享共用难等问题,结合自然资源调查监测工作的业务需求,探讨自然资源遥感智能解译样本库的建设研究。
主要研究内容包括样本分类体系构建、采集与清洗、建库,形成分布均匀、种类齐全、涵盖不同地物类型及观测尺度的遥感解译样本库,提升了国产高分辨率卫星遥感信息提取与变化检测自动化、智能化业务能力,服务自然资源监测监管及相关行业应用。
关键词:样本库;自然资源;深度学习;服务应用1 背景近年来,随着对地观测技术的发展,遥感影像数据以几何级数的速度快速增长。
这些时效性强、覆盖范围广、多类型、多分辨率的海量遥感数据在地表信息提取、资源与生态环境变化监测等诸多领域发挥了巨大作用[1-3]。
遥感影像数据量的快速增长和数据类型的不断丰富,对数据快速精准解译方法与技术提出了更高要求。
随着大数据、云计算、人工智能等技术的不断进步,深度学习技术在图像识别方面取得重大进展。
深度学习技术也支持场景理解、地物目标检测与土地覆盖分类等任务。
人们通过构建大量样本数据训练深度学习网络,提高遥感影像特征提取成效[4]。
遥感影像解译包括场景识别、目标检测、地物分类、变化检测等不同层次的任务,每种任务都可基于多种影像资源来实现,面向智能解译的样本库必须充分体现这种多源特性,才能保证解译精度。
当前已有不少遥感解译样本数据集,总体来看,这些样本集存在分类体系不统一、解译样本量小、多样性不足、样本影像来源单一、样本尺寸固定等问题,已经严重影响大范围多源异构遥感影像解译效率与质量[5]。
现有遥感影像智能解译样本集大多针对具体应用场景和解译对象来建设,不同样本集采用了不同的分类体系,开放性与可扩展性不足,难以支持样本集的共享与综合利用。
现有样本采集工具标注内容不全面,样本标签格式不统一,样本标注效率和质量存在缺陷,样本空间分布不均匀、数量少、类型简单,亟须研究顾及地貌景观类别的样本分布策略,并研发专用遥感影像样本采集工具,以提升采集质量与效率[6,7]。
遥感图像解译 实验报告
遥感图像解译实验报告1. 实验目的本实验旨在通过遥感图像解译技术,对不同区域的地物进行分类和识别,实现对遥感图像的解读和分析。
2. 实验原理遥感图像解译是利用遥感图像获取的信息,通过对图像进行分析和解读,对图像中的地物进行分类和识别的过程。
其主要依靠计算机图像处理技术、模式识别和人工智能等方法。
本实验采用的遥感图像为航拍图像,航拍图像分辨率高,能够提供更为详细的地物信息。
在图像预处理阶段,首先对图像进行镶边去除、几何校正和辐射校正等预处理工作,以消除图像中的各种干扰因素。
在图像解译阶段,首先进行目标选择,选取感兴趣的区域进行进一步分析。
然后进行目标分类,将不同的地物进行分类和识别,可以根据地物的不同光谱特征和纹理信息进行分类。
本实验使用的图像解译方法主要包括:- 监督分类方法:通过对已知类别地物进行样本点选择,从而建立分类器进行分类。
- 非监督分类方法:根据像元的统计学特征,将图像中的地物进行聚类,从而实现地物分类。
- 物体识别方法:基于物体的形态、纹理等特征,通过模式识别方法进行识别。
3. 实验步骤3.1 数据准备本实验使用的航拍图像是一幅城市区域的遥感图像,分辨率为1米。
图像中包含了建筑物、道路、植被等多种地物。
3.2 图像预处理首先对图像进行镶边去除,去除图像四周的无效边缘信息。
然后进行图像的几何校正和辐射校正,以消除图像中的几何畸变和辐射差异。
3.3 目标选择选取感兴趣的区域进行进一步的分析。
根据图像中的特定区域选择建筑物、道路、植被等不同类别的地物。
3.4 目标分类对选取的目标进行分类和识别。
首先使用监督分类方法,选择已知类别地物进行样本点选择,并建立分类器。
然后使用非监督分类方法,对图像中的地物进行聚类分类。
最后使用物体识别方法,对地物进行形状和纹理等特征的识别。
3.5 结果分析分析实验得到的分类结果,评估分类的准确性和可靠性。
通过对分类结果的比较和分析,得出对地物的解释和发现。
4. 实验结果经过实验的数据处理和图像解译,得到了图像中各个地物类别的分类结果。
遥感影像的目视解译实验报告(一)
遥感影像的目视解译实验报告(一)遥感影像的目视解译实验报告1. 简介本报告旨在介绍和分析遥感影像的目视解译实验过程和结果。
通过目视解译,我们能够获取遥感影像中的地物信息,为地理信息系统(GIS)和自然资源管理等领域提供重要数据支持。
2. 实验目的•理解遥感影像的基本概念和解译方法;•学习使用目视解译技术获取地物信息;•掌握常用的目视解译符号和标记。
3. 实验步骤1.选择适当的遥感影像数据集,并导入到图像处理软件中。
2.调整图像的显示参数,使得地物轮廓和颜色能够清晰可见。
3.根据实验需求,选择相应的目视解译符号和标记,如线状地物、点状地物、面状地物等。
4.在图像上进行目视解译,将观测到的地物信息用符号和标记进行标注。
5.根据实验要求,进行目视解译验证和纠正,保证解译结果的准确性和可靠性。
4. 实验结果与分析通过目视解译实验,我们成功地获取了遥感影像中的地物信息,并进行了相应的符号和标记标注。
经过验证和纠正,得到了准确的解译结果。
5. 实验收获与总结通过本次实验,我对遥感影像的目视解译方法和技术有了更深入的了解。
我学会了处理遥感影像数据和调整图像显示参数,掌握了常用的目视解译符号和标记。
同时,我也意识到目视解译的准确性和可靠性对于地理信息系统等应用的重要性。
6. 参考文献•Smith, J., & Brown, A. (2018). Remote Sensing Techniques for Earth Observation. John Wiley & Sons.注:本报告仅为示例,实际报告中需根据实验内容进行相应修改。
遥感影像的目视解译实验报告1. 简介本报告旨在介绍和分析遥感影像的目视解译实验过程和结果。
通过目视解译,我们能够获取遥感影像中的地物信息,为地理信息系统(GIS)和自然资源管理等领域提供重要数据支持。
2. 实验目的•理解遥感影像的基本概念和解译方法;•学习使用目视解译技术获取地物信息;•掌握常用的目视解译符号和标记。
浅谈遥感解译样本数据入库前的质量检查
199管理及其他M anagement and other浅谈遥感解译样本数据入库前的质量检查刘海波(辽宁省自然资源事务服务中心,辽宁 沈阳 110034)摘 要:遥感解译样本数据成果是地理国情监测数据成果之一,是遥感影像数据解译时对地理环境的正确认知,是保证解译监测结果正确的基本前提。
利用具有对照关系的地面照片和遥感影像为主的解译样本数据,为遥感影像解译者建立对相关地域的正确认识提供支持,在解译结果的质量控制方面发挥重要作用,同时也为长期监测积累实地参考资料。
关键词:地理国情监测;遥感解译样本;地面照片中图分类号:P208 文献标识码:A 文章编号:11-5004(2020)02-0199-2收稿日期:2020-01作者简介:刘海波,男,生于1981年,汉族,辽宁台安人,本科,测绘工程师,高级工程师,研究方向:遥感科学与技术。
遥感解译样本数据包含两类,一是地面照片,二是遥感影像实例数据。
两类数据分别从不同的侧面反映地物影像形态特征,起到相互印证的作用,可以帮助解译人员更高效地认知遥感影像所蕴含的信息。
两者之间根据位置和反映的内容具有明确的对应关系。
所以保证遥感解译样本数据的质量前提是保证地面照片和遥感影像实例数据的质量满足技术要求,检查方法以计算机程序自动检查为主,人机交互检查为辅。
1 基本质量要求遥感影像解译样本是地理国情监测内业判读解译的重要参考依据,关系到监测解译成果的质量与效率。
保证基本质量要求是满足入库数据质量的前提[1]。
1.1 遥感解译样本数据内容与属性的要求1.1.1 数据内容原则上,每个县区范围内,所有新生型的新增图斑,除房屋类、道路类之外其对应的每种其他覆盖类型(最细一级类)一般至少应采集1个典型样本点,形成地面照片和遥感影像实例构成的完整解译样本数据。
1.1.2 属性要求地面照片的属性有18项,包括照片的标识符、拍摄时间、拍摄点经度、拍摄点纬度、位置定位平面精度水平、拍摄点高程、定位方法、定位时观测到的卫星数量、照片方位角、照片方位角的参照方向、方位角准确程度、拍摄距离、相机俯仰角、相机横滚角、照片主体所属的地理国情信息类型代码、样点地理环境描述、拍摄者、35mm 等效焦距。
遥感影像智能解译样本库现状与研究
㊀㊀第50卷㊀第8期测㊀绘㊀学㊀报V o l.50,N o.8㊀2021年8月A c t aG e o d a e t i c ae tC a r t o g r a p h i c aS i n i c a A u g u s t,2021引文格式:龚健雅,许越,胡翔云,等.遥感影像智能解译样本库现状与研究[J].测绘学报,2021,50(8):1013G1022.D O I:10.11947/j.A G C S.2021.20210085.G O N GJ i a n y a,X U Y u e,H U X i a n g y u n,e t a l.S t a t u s a n a l y s i s a n dr e s e a r c ho f s a m p l ed a t a b a s e f o r i n t e l l i g e n t i n t e r p r e t a t i o no f r e m o t es e n s i n g i m a g e[J].A c t aG e o d a e t i c a e t C a r t o g r a p h i c a S i n i c a,2021,50(8):1013G1022.D O I:10.11947/j.A G C S.2021.20210085.遥感影像智能解译样本库现状与研究龚健雅,许㊀越,胡翔云,姜良存,张㊀觅武汉大学遥感信息工程学院,湖北武汉430079S t a t u sa n a l y s i s a n d r e s e a r c h o f s a m p l e d a t a b a s e f o r i n t e l l i g e n t i n t e r p r e t a t i o n o f r e m o t e s e n s i n g i m a g eG O N GJ i a n y a,X UY u e,H UX i a n g y u n,J I A N GL i a n g c u n,Z H A N G M iS c h o o l o f R e m o t eS e n s i n g a n d I n f o r m a t i o nE n g i n e e r i n g,W u h a nU n i v e r s i t y,W u h a n430079,C h i n aA b s t r a c t:T h e r a p i dd e v e l o p m e n t o f e a r t ho b s e r v a t i o n p r o j e c t s i nC h i n ah a so b t a i n e da l a r g ev o l u m eo f m u l t iGs o u r c e(m u l t iGt y p es e n s o r s,m u l t iGt e m p o r a l,m u l t iGs c a l e)r e m o t es e n s i n g d a t a.B u t t h ec a p a b i l i t y o f i n t e l l i g e n t r e m o t es e n s i n g i m a g e p r o c e s s i n g l a g sb e h i n dd a t aa c q u i s i t i o n.I nr e c e n t y e a r s,p e o p l eh a v e s i g n i f i c a n t l y i m p r o v e d t h e e f f e c t i v e n e s s o f i m a g e f e a t u r e e x t r a c t i o nw i t h d e e p l e a r n i n g n e t w o r k s.B u t l i m i t e d n u m b e r a n dv a r i e t y o f s a m p l ed a t a i sn o t e n o u g h f o r p r o c e s s i n g t h em u l t iGs o u r c e r e m o t es e n s i n g i m a g e s.T h i s p a p e r a n a l y z e de x i s t i n g s a m p l ed a t a s e t s a n d p r o p o s e dam e t h o d f o r c o n s t r u c t i n g a s a m p l ed a t a b a s e f o r i n t e l l i g e n t r e m o t e s e n s i n g i m a g e i n t e r p r e t a t i o n,i n c l u d i n g t h ed a t am o d e l,c l a s s i f i c a t i o n s y s t e m,d a t a o r g a n i z a t i o n,a sw e l l a s t h e I n t e r n e tGb a s e d p l a t f o r m f o r c o l l a b o r a t i v e s a m p l e c o l l e c t i o na n d s h a r i n g.K e y w o r d s:r e m o t es e n s i n g i n t e l l i g e n ti n t e r p r e t a t i o n;s a m p l e d a t a b a s e;m u l t iGs o u r c er e m o t e s e n s i n g i m a g e;d a t a b a s em o d e l;d e e p l e a r n i n gF o u n d a t i o n s u p p o r t:T h eN a t i o n a l K e y R e s e a r c h a n dD e v e l o p m e n t P r o g r a mo f C h i n a(N o.2016Y F B0501403); M a j o r P r o g r a mo f t h eN a t i o n a l N a t u r a l S c i e n c e F o u n d a t i o n o f C h i n a(N o.92038301)摘㊀要:我国遥感对地观测等项目顺利实施,获取了大量时效性强㊁覆盖范围广㊁信息量丰富的遥感数据.但遥感影像智能化自动处理技术发展仍相对滞后,无法满足区域/全球大范围地物信息快速提取的需求.近年来,人们利用深度学习技术显著提高了影像特征提取成效,但由于所使用的深度学习样本数量和类型有限,对于多源遥感影像的自动解译能力仍然不足.本文面向大范围多源遥感影像地物信息智能解译需求,在分析现有样本集现状及问题的基础上,研究提出遥感影像智能解译样本库设计方案,并在此基础上设计了基于互联网的样本协同采集与共享服务框架.本文将为多源遥感影像样本库建设提供参考,为大范围遥感影像智能解译提供支持.关键词:遥感智能解译;样本库;多源遥感影像;数据模型;深度学习中图分类号:P237㊀㊀㊀㊀文献标识码:A㊀㊀㊀㊀文章编号:1001G1595(2021)08G1013G10基金项目:国家重点研发计划(2016Y F B0501403);国家自然科学基金重大研究计划(92038301)㊀㊀近年来,随着对地观测技术的发展,遥感影像数据以几何级数的速度快速增长[1G2].这些时效性强㊁覆盖范围广㊁多类型㊁多分辨率的海量遥感数据被用于地表信息提取㊁资源与生态环境变化监测等诸多领域,发挥了巨大作用.但是,遥感影像数据量的快速增长和数据类型的不断丰富,也对数据快速精准解译方法与技术提出了更高要求,原始拍摄数据大量堆积与可用信息提取不足的矛盾日益突出[3G5].当前,我国正在着力构建国内国际双循环相互促进的新发展格局,无论是国内社会经济发展建设㊁资源环境动态监测评估,还是支持全球可持续发展㊁构建人类命运共同体,均需区域/全球大范围地理空间信息的支持,进而对多源遥感信息快速解译能力提出了更为迫切的A u g u s t2021V o l.50N o.8A G C S h t t p:ʊx b.s i n o m a p s.c o m需求.得益于大数据㊁云计算㊁人工智能等技术的不断进步,深度学习技术在图像识别方面取得重大进展[6].2015年微软研究团队宣布机器学习系统在I m a g e N e t2012分类数据集中的图像识别错误率已经降低到4.94%,低于人眼辨识的错误率5.1%[7].自此之后,面向普通图像处理的深度神经网络框架和模型迅猛发展,其支持的图像识别技术在公共安全㊁生物㊁工业㊁农业㊁交通㊁医疗等领域得到广泛应用,其中不少已经融入百姓日常生活,例如人脸识别㊁车牌识别㊁指纹识别㊁食品品质检测㊁医学心电图识别等.随着高性能计算等技术的不断发展,图像识别能力不断提升,应用前景不可限量.在遥感领域,近年也利用深度学习技术支持场景理解㊁地物目标检测与土地覆盖分类等任务.人们通过构建大量样本数据训练深度学习网络,显著提高了遥感影像特征提取成效[8G10].但整体上,智能遥感解译系统的实用化㊁商业化程度仍未达到人脸㊁指纹识别等普通图像解译的水平.遥感影像解译涉及场景识别㊁目标检测㊁地物分类㊁变化检测㊁三维重建等不同层次的任务,区域/全球大范围地物信息的提取需要依赖多源(多类型传感器㊁多时相㊁多尺度)遥感数据,但目前已经建立的样本库尚难以支持多源异构遥感影像的处理[3],主要问题表现在5个方面:①各类样本库采用不同的分类体系,导致所训练出来的深度学习模型难以共享样本集,处理样本库覆盖范围外的数据时出现分类偏差;②预设的样本种类难以完全覆盖区域/全球地表环境的多样性,遇到新类别(开集问题)时,模型的解译体系不能灵活扩展,导致出现误判[11];③样本的空间分布对不同区域地理环境特点体现不足,导致模型对局部地区特征过度拟合,进而降低深度学习模型大范围应用时泛化能力[6,12];④现有样本库大多模仿I m a g e N e t 模式构造,对遥感影像的多尺度㊁多传感器㊁多时相特性体现不足,且大多不具备地理位置属性和时间属性,削弱了模型的稳健性;⑤现有样本大多是分别面向场景㊁目标㊁像素构建的,未见集成场景G目标G像素的综合样本集.海量且多类型的遥感影像样本库是实现大范围异构遥感影像高精度智能解译的基础.样本库应遵循统一分类体系,涵盖空间分布合理的多尺度㊁多传感器㊁多时相遥感影像,应具备样本类型与类别动态扩展及样本自动精化的能力,还应满足场景㊁目标㊁像素等不同层级的精准解译要求.本文面向多源异构遥感影像地物信息智能解译需求,在分析现有样本集现状及问题的基础上,研究提出遥感影像智能解译样本库建设方案(如图1所示).整体技术流程包括标准制定㊁方法设计㊁工程实施㊁应用支持等几个主要环节,其中方法设计环节主要包括样本概念模型设计㊁样本分类模型设计㊁样本组织模型设计和样本采集方法设计;工程实施环节主要包括样本库构建㊁样本协同采集与共享服务平台开发.样本分类与编码标准是在样本概念与分类模型基础上形成的,用于指导样本采集㊁管理㊁共享㊁应用全流程.本文提出的方法将为多源遥感影像样本库建设提供参考,为大范围遥感影像智能解译提供支持.图1㊀遥感影像样本库设计与建设技术流程F i g.1㊀D e s i g n a n d c o n s t r u c t i o n p r o c e s s o fr e m o t es e n s i n g i m a g e s a m p l e d a t a b a s e1㊀遥感深度学习样本集建设现状遥感影像解译包括场景识别㊁目标检测㊁地物分类㊁变化检测㊁三维重建等不同层次的任务,每种任务都可基于多种影像资源(多类型传感器㊁多时相㊁多尺度)来实现,面向智能解译的样本库必须充分体现这种多源特性,才能保证解译精度.当前已有不少遥感解译样本数据集,总体来看,这些样本集存在分类体系不统一㊁解译样本量小㊁多样性不足㊁样本影像来源单一㊁样本尺寸固定等问题,已经严重影响大范围多源异构遥感影像解译效率与质量.1.1㊀常用公开遥感解译样本数据集目前,遥感解译样本数据均是针对不同的解译任务而构建的,主要包括场景分类样本㊁地物目标检测样本㊁地物要素分类样本㊁变化检测样本等几类.表1为当前常用公开场景分类㊁目标检测㊁4101第8期龚健雅,等:遥感影像智能解译样本库现状与研究地物要素分类㊁变化检测样本数据集的内容与主要指标.表1㊀部分常用公开样本集T a b.1㊀S o m e c o m m o n l y u s e d p u b l i c s a m p l e s e t s数据集任务类型类别数量/张样本数量样本尺寸分辨率/m波段实例标注方式实例数量影像来源U CGM e r c e d A2121002560.3R G B U S G SN a t i o n a l M a p U r b a n A r e a I m a g e r yR S D46GWHU A461170002560.5~2R G B G E,天地图E u r o S A T A1027000641013个波段S e n t i n e lG2D O T A(V2.0)B1811067800G200000.12~1R G B旋转边界框1488666G E,G FG2,J LG1R S O D B4976~10000.3~3R G B水平边界框6950G E,天地图x V i e w B601413~30000.3R G B水平边界框1000000W o r l d V i e wG3I S P R SGV a i h i n g e n C6332500ˑ25000.09I R,R,G,D S M,N d s mM a s s a c h u s e t t sB u i l d i n g s C21511500ˑ15001R G BG I D C151506800ˑ75000.8~10R G B,N I R G FG2M t SGWH D917200ˑ60001R G B,N I RS Z T A K IA i r C h a n g e D213952ˑ6401.5R G BA B C D D24253160ˑ1600.4R G B㊀注㊀任务类型:A为场景分类;B为目标检测;C为地物分类;D为变化检测.㊀㊀由表1可知,这些大多是场景分类与目标提取样本,地物目标检测(像素分割)和变化检测的样本量很少,难以支持多层级信息解译.其中,场景分类样本的数量最多,在遥感解译中常用作后续目标检测地物分类任务解译模型的初始化与训练数据.但场景样本大多为R G B影像,难以支持含有更多光谱信息的遥感模型训练.且场景样本尺寸大多较小,致使解译模型突出地物的局部特征而难以提取大范围场景特征.目标识别样本的标注方式依赖于不同数据集面向的目标类别,存在标注方式不统一㊁类别不统一的现象,在共享应用时,必须进行类别综合才能实现跨数据集使用.地物要素分类样本由于标注成本高且分类体系不统一,现存样本数量较少,缺少多光谱㊁高光谱㊁红外㊁S A R㊁激光雷达㊁多视角等多类型传感器样本,难以支持大范围多源影像解译.变化检测的样本数量是最少的,且大多仅针对某一种地物的变化进行标注,没有考虑实际情况中多种地物组合变化情况,也无法支持业务化应用.此外,这些样本集中样本的大小较为固定,基于有限大小的样本块进行深度学习模型训练,将对解译模型的感受视野造成限制[13],不利于大范围遥感影像信息提取.为满足对于大规模样本库的多种需求情况,应设计以上各类任务为驱动的遥感影像解译样本数据模型,既满足各任务单独使用需求,又使得不同任务或不同传感器间数据可以高效组织索引.1.2㊀样本分类现有遥感影像智能解译样本集大多针对具体应用场景和解译对象来建设,不同样本集采用了不同的分类体系.地表覆盖分类采用最多的是联合国粮农组织(F o o d a n d A g r i c u l t u r e O r g a n i z a t i o n o f t h e U n i t e dN a t i o n s,F A O)提出的«地表覆盖分类体系(L a n dC o v e rC l a s s i f i c a t i o nS y s t e m,L C C S)»,它基于地表覆盖属性组合进行类别定义,具有较好的灵活性和可扩展性.美国地质调查局(U S G S)的«遥感数据土地利用与土地覆盖分类体系»[14]㊁我国的«地理国情监测内容与指标»(C H/T9029 2019)[15]㊁«中国全球测图地表覆盖产品分类(30m㊁10m)»[16]等均参考了L C C S 分类.国际标准化组织基于F A O的L C C S颁布了两个国际标准«G e o g r a p h i c I n f o r m a t i o nGC l a s s i f i c a t i o n S y s t e m sGP a r t1:C l a s s i f i c a t i o n S y s t e mS t r u c t u r e»(I S O19144 1)和«G e o g r a p h i c I n f o r m a t i o nGC l a s s i f i c a t i o nS y s t e m sGP a r t2:L a n d C o v e r M e t aL a n g u a g e,(L C M L)»(I S O19144 2)[17G18],我国以等同采标的方式将I S O19144 15101A u g u s t2021V o l.50N o.8A G C S h t t p:ʊx b.s i n o m a p s.c o m翻译为国家标准«地理信息分类系统»(G B/T 30322)[19].有些数据集的分类还参考了«土地利用现状分类»(G B/T21010 2017)[10]㊁«地理信息兴趣点分类与编码»(G B/T35648 2017)等国家标准.由于这些样本集在样本类别定义(命名㊁语义)㊁层级及兼容性等方面有较大差异,开放性与可扩展性不足,难以支持样本集的共享与综合利用.1.3㊀样本采集方法常用的样本标注工具主要有L a b e l M e[20G21]㊁L a b e l I m g[22]等,它们可用于小尺寸的全色㊁R G B 影像的目标检测或场景分类样本的标注,在处理大尺寸遥感影像时需先切割成小尺寸,且不支持变化检测㊁像素分割等样本的标注,以及多光谱㊁多视角等样本的制作.一些地理信息软件(如A r c G I S和Q G I S)支持多光谱影像标注,但导出的标签一般是矢量,需要先转换格式才能输入深度学习模型.像素级影像分割样本标注一般利用专业软件(如E N V I㊁E R D A S)以人工标注或半自动标注方式完成,其中,人工标注包括专业人员和众包标注两种方式,前者质量高但效率低,后者效率高但质量参差不齐.I m a g e N e t等是利用众包完成标注后再经专业人员审核.某一类别地物实体在不同地理环境中的空间分布是不均匀的,例如东南亚水系丰富,而中亚草原荒漠较多.采样时必须考虑地理环境对要素分类空间分布的影响,使每个地理空间区域都有足够的样本类别与样本数量[23G24],才能保证解译的精度.现有样本集(特别是地物分类样本)大多基于局部区域的少量影像构建[8G10],样本类型与数量的空间分布不合理,导致机器学习模型错误分类[25].总体来看,亟须研究顾及地貌景观类别的样本分布策略,并研发专用遥感影像样本采集工具,以提升采集质量与效率.1.4㊀样本数据管理与共享服务目前,多数遥感影像样本集由遥感社区的研究人员或学术组织制作,通常以数据文件方式存储在局域网服务器㊁公共资源(如G i t H u b等)和云存储平台(如百度云㊁G o o g l eD r i v e等),提供链接供获得授权者下载使用[26G27].集成使用多个样本集的使用者需要从不同链接分别获取,且由于这些数据集的分类与定义不一致而不得不进行大量的整合处理工作,这种情况不但影响效率,也在一定程度上降低了所训练模型的泛化能力.例如,虽然多个目标检测样本集均有 飞机 样本,但其成像质量㊁采样季节和采样区域均有差异,用这些样本训练出来的模型解译效果会受影响.为此,亟须建立遥感解译样本服务平台,实现对多类型传感器㊁多时相㊁多尺度遥感样本数据的集成管理㊁动态维护和在线服务,以解决全球/区域大范围样本数据融合与共享问题.2㊀任务驱动的遥感影像智能解译样本库设计㊀㊀由前述分析可知,建设可支持大范围多源异构遥感影像智能解译的样本库需要突破的关键技术包括:① 任务驱动 的遥感影像解译样本模型;②统一可扩展的遥感解译样本分类体系;③支持全局关联的数据组织索引方法.其中,样本模型应涵盖多传感器类型㊁多时相㊁多尺度遥感影像,分类体系应支持样本类型与类别动态扩展,数据组织与索引应满足跨区域跨类别快速调用索引需求.2.1㊀面向任务的样本模型本文针对场景分类㊁目标检测㊁地物分类㊁变化检测㊁三维重建等解译任务,定义了相应的样本类型,包括:(1)场景分类样本.场景识别对应于计算机视觉中的图像分类任务,其目的是自动给航空或航天遥感影像贴上特定语义类别标签,支持场景与目标(如机场㊁码头㊁立交桥等)的快速检索.场景识别是高分辨率遥感影像理解的基本步骤,近年已成为遥感领域的热点研究主题.场景数据主要包括局部或区域性场景影像,以及对应的分类文本标签.(2)目标检测样本.目标检测是在影像中定位一个或多个感兴趣的特定地物(如建筑物㊁车辆㊁飞机等),并识别预测地物相应的类别.主要包括目标影像㊁目标定位框坐标数据㊁目标分类信息.由于遥感地物内容繁杂,有时解译模型难以区分或判定部分样本中细分的地物类别.因此,需要综合考虑地物目标的地域㊁时相㊁地形地貌㊁地块分布模式或其在影像中的图斑大小等因素,甚至需要提供示例图片进行说明.(3)地物分类样本.利用遥感影像进行语义分割的目的是将遥感影像中的每个像素与预先定义的地表覆盖类别关联起来.包含影像数据以及对应逐像素分类的栅格分类信息数据.6101第8期龚健雅,等:遥感影像智能解译样本库现状与研究(4)变化检测样本.用于定位及识别同一地理位置处多时态间的变化信息.需要前后两个时相的影像,并且基于统一分类体系对标签影像的图斑属性进行标注.需要针对每种变化类型制定合理的判定准则和规范要求,必要时提供示例说明.(5)立体多视样本.此样本集由密集匹配数据集构成,用于通过多视角遥感影像构建三维地表模型.原始数据包括多视影像,以及对应的相机内外方位元素参数㊁影像覆盖范围的地面真值参考数据(主要为激光点云或产品级三维地表模型).通过自动配准方法,将影像与高程数据进行匹配,形成样本数据.样本类型的逻辑模型如图2所示.遥感影像解译样本由地物(像素分割)样本㊁目标样本㊁场景样本构成.其中,地物样本又包括来自于平面影像的平面样本,以及来自于立体多视影像的立体多视样本.平面样本包括单时相样本㊁变化检测样本.逻辑上,目标由像素组成,场景由目标组成,但3种样本的采样过程是单独进行的.同一地物可采集多种任务类型样本,不同任务的样本可根据地理位置进行关联,各类型任务又可包含不同传感器类型的数据.图2㊀样本类型逻辑模型F i g .2㊀L o g i c a lm o d e l o f s a m p l e t y pe 2.2㊀统一可扩展样本分类体系由于区域/全球范围地物信息复杂多样,难以预设完备的样本种类,因而遥感影像智能解译样本的分类必须采用开放框架,具有可扩展性.为突破因样本库已有类型不完备而造成解译模型的认知局限问题,本文研究了支持新类别灵活扩展的分类体系(如图3所示).主要思路是基于国家标准«地理信息分类系统»(G B /T30322)构建全局分类体系框架,再结合前节定义的具体任务类型进行扩展.图3㊀样本分类框架F i g .3㊀S a m pl e c l a s s i f i c a t i o n f r a m e w o r k 7101A u g u s t2021V o l.50N o.8A G C S h t t p:ʊx b.s i n o m a p s.c o m㊀㊀国家标准«地理信息分类系统»(G B/T 30322)(等同采标I S O19144 1G e o g r a p h i c I n f o r m a t i o nGC l a s s i f i c a t i o nS y s t e m sGP a r t1:C l a s sGi f i c a t i o nS y s t e m S t r u c t u r e)[13]框架分为两个层次,第一层次采用二分法(d i c h o t o m o u s)定义主要地表覆盖类别,第二层次以模块层次结构(m o d u l a rGh i e r a r c h i c a l)对每一类别赋以环境属性㊁技术属性,进而通过不同属性的组合来定义子类.基于模块层次结构的属性,可以组合成便于索引的分类属性表.每种属性赋以体现类别的层次及层级间隶属关系的标识编码,方便索引.通过增加层次模块的属性定义,可以灵活扩展定义新的类别,并由用户生成具体任务的分类实例.在此基础上,结合目标识别任务中出现的移动目标与固定目标(表2)对第一层次和第二层次 人造地表和相关区域 进行了扩展,从而形成了全集的分类体系,具体每个任务的分类体系为此全集体系的实例.本框架能够支持各类样本的分类:(1)地表覆盖地物样本分类实例.这种分类方式可以涵盖现有所有地表覆盖类别,并可实现已有各种像素样本分类与本文分类体系的类别映射与转换.例如,在«地理国情普查内容与指标»(第一次全国地理国情普查,G D P J01 2013)中,阔叶林的定义是:由双子叶乔木树种为主构成的树林,阔叶林合计占65%以上.有冬季落叶的落叶阔叶林(又称夏绿林)和四季常绿的常绿阔叶林(又称照叶林)两种类型.其中 树林 对应于附录表1属性表中的A12(自然植被区域)㊁A3(树木), 占65%以上 对应A10(60~70%), 阔叶 对应D1(阔叶), 常绿 对应E1(常绿), 冬季落叶 对应于E2(每年落叶).因此,地理国情分类中的 阔叶林 就可以映射为本分类体系中的 A12A3A10D1E1E2 .(2)场景样本分类实例.场景样本分类取上述分类体系的子集,可实例化(表2),综合参考已有开源样本数据集中的分类类别后,包含9个一级类,23个二级类和119个三级类.表2㊀场景样本分类实例T a b.2㊀I n s t a n c e o f s c e n eGb a s e d s a m p l e c l a s s i f i c a t i o n 层级目标类别一级类二级类移动目标固定目标人飞机船火车车公共设施交通设施建筑物工业设施其他㊀㊀(3)目标样本分类实例.目标识别样本分类取上述分类体系的子集,可实例化(表3).表3为综合已有开源样本数据集中的分类场景样本分类总表,包含两个一级类,10个二级类及109个三级类.表3㊀目标样本分类实例T a b.3㊀I n s t a n c e o f o b j e c tGb a s e d s a m p l e c l a s s i f i c a t i o n 层级场景类别一级类二级类种植土地林草地房屋建筑区交通运输构筑物人工堆掘地荒漠与裸露地水域其他耕地园地林地草地建筑区居住用地公共基础设施交通载体交通设施硬化地表水工设施工业设施体育设施温室/大棚环保设施采矿用地盐碱地表沙质地表岩石地表水域沼泽自然景观城市空间2.3㊀支持全局关联的数据组织与索引遥感影像智能解译往往是多任务关联的,对于某一地物,往往需要使用与其相关的多种类型的样本,或利用某一类型样本完成不同任务.为此,本文提出以数据集为组织单元的遥感影像解译样本数据组织模型(如图4所示),以支持全局关联的样本组织与索引.本模型数据集包括像素分割样本数据集㊁目标样本数据集㊁场景样本数据集㊁变化检测样本数据集㊁多视角样本数据集等,每个数据集均建立相应的元数据.每个数据集由相应分类的样本实例组成,样本实例由样本表描述,每个样本都赋予唯一的样本标识码,以支持样本的全生命周期管理与溯源.8101第8期龚健雅,等:遥感影像智能解译样本库现状与研究图4㊀样本数据组织模型F i g .4㊀L o g i cm o d e l o f s a m pl e d a t a ㊀㊀样本表记录样本的基本信息,例如像素分割样本表主要包括样本标识编码㊁样本所在数据集㊁样本的尺寸㊁样本所在区域㊁样本拍摄时间㊁样本标注信息(质量㊁采集人㊁标注时间等)㊁影像存储路径㊁影像类型,以及影像通道数㊁影像分辨率㊁传感器㊁样本用途(训练㊁验证㊁测试等).目标样本还包括目标的标签信息,变化检测样本包括前后时相影像信息,立体多视样本包括深度信息等.根据不同解译需求,可将这些属性进行有机组合,实现多维语义检索与数据分析.数据集元数据㊁样本表数据㊁样本分类数据等存储在关系数据库中,数据实体以文件方式存储于文件系统.基于上述模型,分别定义数据集㊁场景样本㊁目标样本㊁地物分类样本㊁变化检测样本㊁立体多视样本的属性结构,以及分类总表㊁各类样本分类表的属性结构.表4与表5分别是数据集属性表㊁场景样本属性表结构的示例.表4㊀数据集属性表T a b .4㊀A t t r i b u t e t a b l e o f t h e d a t a b a s e序号属性项描述类型长度取值说明约束1D A T A S E T _I D数据集编号T e x t 20数据唯一I DY 2D A T A S E T _N AM E 数据名称T e x t 20 Y 3D A T A S E T _V E R S I O N 数据集版本T e x t 5Y 4T A S K _T Y P E任务类型T e x t 20支持的解译任务类型Y 5D A T A S E T _L I N K 数据集链接T e x t 300数据集官方下载链接N 6D A T A S E Y _C O P R 数据集版权归属T e x t 100机构组织名称Y 7D A T A SE T _C I T E数据集引用方式T e x t150论文引用等N3㊀基于网络互操作的样本采集与共享服务㊀㊀遥感影像智能解译样本库的构建是一项持续性工作,应充分利用已有各类样本数据集,将其进行归一化整合处理后纳入样本库中.在此基础上,还须建立支持样本不断扩展㊁精化的工作机制与支撑平台.因此,本文设计了多源异构样本整9101A u gu s t 2021V o l .50N o .8A G C S h t t p :ʊx b .s i n o m a ps .c o m 合技术路线,面向互联网用户的众包样本标注与共享服务平台架构.3.1㊀已有样本归一化整合图5为已有样本整合处理的技术流程.首先,需要将已有样本的类别与本文设计的分类体系进行语义映射;然后,依据本项目设计的统一编码规则和数据库结构进行转换,并根据多维查询的语义建立样本索引;最后,将样本集的元数据信息(包括版权信息等)存储在相关的元数据表中,方便样本的质量追溯和权属认定.图5㊀多源样本数据整合技术流程F i g .5㊀F l o w c h a r t o fm u l t i Gs o u r c e s a m p l e d a t a i n t e gr a t i o n 3.2㊀众包样本采集样本标注是样本库建设的基础工作.为解决全球/区域大范围样本数据采集问题,本文设计了基于网络互操作机制的样本采集平台,支持样本的众包协同采集标注㊁在线校验㊁动态扩展.由于遥感解译样本的判读与标注需要地学专业知识的支撑,目前样本采集还主要采用专业人员手工采集的方式,效率低㊁成本高,且由于样本标注者的专业认知差异导致标注质量不均.为提高样本采集效率与质量,本文设计了自动/半自动结合标注方法.基本思路是基于已有样本数据训练深度学习模型进行自动解译,对自动解译结果进行精度评估并进行人机交互修正完善,利用影像的交互分割优化等算法显著提升其效率,通过合理分配不同程度的专业人员进行在线校验,最后将满足要求的样本补充至样本库.技术流程示意图如图6所示.3.3㊀样本共享服务平台针对大规模样本共享服务问题,本文设计了基于遥感解译样本开源共享平台,支持多维语义查询㊁统计分析㊁数据共享服务.遥感影像样本共享服务平台的总体框架如图7所示,包括基础设施层㊁数据存储层㊁数据服务层和应用层.其中,基础设施层包括分布式存储阵列㊁G P U 集群㊁文件系统㊁数据库系统及网络环境等.以分布式弹性大规模存储阵列支撑全球范围海量遥感影像样本集的高吞吐和可扩展管理,以G P U 集群支持深度学习模型计算和在线多并发访问快速响应需求.数据存储层支持多尺度多类型样本数据的存储㊁扩展㊁维护与版权保护.服务层支持遥感影像样本的多维语义查询和样本数据服务发布,对外提供具有互操作能力的数据访问服务接口.应用层允许用户进行开放注册并根据版权协议进行权限管理,在此基础上提供样本的录入㊁校验㊁多维语义查询㊁数据获取和可视化功能服务,并基于时空数据关联分析㊁样本综合统计分析㊁知识发现等数据挖掘模型为用户提供样本的在线分析与应用.图6㊀自动/半自动结合标注F i g .6㊀A u t o m a t i c /s e m i Ga u t o m a t i c c o m b i n e d l a b e l i n gt i o n 4㊀结㊀论本文针对大规模遥感智能解译需求,分析了已有样本数据集的现状及存在的问题,提出了任务驱动的遥感解译样本库设计.本文依据所提出的方案,对已有的73个开源样本数据集进行了归一化处理㊁映射转换,构建了包含256万样本的数据库,涵盖了场景分类㊁目标检测㊁单要素/多要素分类㊁变化检测㊁三维多视角重建等多种遥感智能解译任务,以及多种遥感影像传感器类型(多光谱㊁高光谱㊁S A R ㊁三维多视角).在前期工作基础上,搭建了遥感样本在线采集与共享服务平台,初步实现了网络协同样本采集㊁样本查询等功能.下一步将不断扩充样本库,并加快完善样本采集与共享服务平台建设,支持全球范围的众包样本采集,实现样本在线校验和录入㊁多维语义查询和统计分析等功能,为基于机器学习的遥感影像智能解译提供有力支撑.0201。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基本信息:影像类型、影像分辨率、影像拍摄时间数、据
影像波段数
位置信息:左上角经度、左上角纬度、右上角经度、
右上角纬度、左下角经度、左下角纬度、
右下角经度、右下角纬度
经纬度 坐标
地面照片采集总体要求
采集的地面照片需充分保证样本的典型性
每一个样本应能够代表所属的覆盖类型,能综合反映该类型 的总体特征,或者突出反映该类型某一方面的特征;在地表 地物分布和覆盖类型相对比较一致的一定区域内,样本总体 在数量上应能代表该区域的整体特征,在分布上应贴近地物 和覆盖类型分布的趋势
地面照片属性及采集要求
相机姿态参数 6个
反应拍摄地面照片时照相瞬间相机的空间位置和与地面直角坐标系相对 的旋转姿态参数,类似于摄影测量中的像片外方位元素
样点与相机空间位置影响 遥感影像样本裁切的大小
地面照片采集质量要求
地面照片尽可能使用精细模式保存,总像素数量应 在200万像素以上。由于数据量原因,不建议采用 过大的总像素数量,建议一般控制在1000万像素以 下。地面照片的长宽尺寸不做限定,可根据相机情 况合理设置
地面照片采集质量要求
同一地物不同角度、焦距拍照是为充分反映地物、提高信息量
地面照片采集质量要求
地面照片文件格式与命名
• 采用JPG格式存储 • 文件名为“照片标识符”+“.jpg”后缀名
照片标识符为32位字符
01-02位为字母“PH” 03-16位使用时间属性,格式为YYYYMMDDHHMMSS 17-23位使用拍摄点经度,取度分秒,格式为DDDMMSS 24-29位使用拍摄点纬度,取度分秒,格式为DDMMSS 30-32位使用照片方位角,取到度,格式为DDD 即:PHYYYYMMDDHHMMSSDDDMMSSDDMMSSDDD 实际命名中出现数据缺失位时用“0”填充,保证全局唯一
超过1000km2的区域范围,各覆盖类型平均采样点应≥15个 小于1000km2的区域范围,各覆盖类型平均采样点应≥10个 样点的分布应尽可能与图斑的分布相一致且均匀
难以到达的特殊困难地区
各覆盖类型平均采样点数应不少于3个
图斑数很少且图斑总面积很小的覆盖类型
若具有典型性,也必须至少采集1个样点
实际操作可依区域具体情况按要求灵活确定样本数量
地面照片采集质量要求
拍摄时应尽可能水平持握相机,使其保持正常姿态 ,避免照片信息失真误导使用者。特殊情况下,相 机俯仰角或横滚角大于10度以上时,并记录其值。
地面照片采集质量要求
应尽可能拍摄离相机200米范围以内的景物,避免 照片与遥感影像实例之间的空间对应关系失真 难以到达只能通过远距离拍摄的,拍摄距离大于 200米时,应估测拍摄距离并记录。可以现场估测 ,也可以内业确定拍摄对象位置后测算其与相机位 置之间的距离得到
– 遥感影像实例数据从经过正射处理的影像数据源截
取的与地面照片拍摄范围和内容一致的航空航天遥感影像
遥感影像解译样本数据的内容
样点:也称拍摄点,拍摄地面照片的位置点,依据拍摄地
面照片时照相瞬间相机的空间坐标确定其空间位置。
地面照片与样点(拍摄点)的关系
• 为便于操作,每一张照片表示一个样点 • 对于一对一或一对多的情况,每一张照片及对应的遥感
清晰反映一定范围内地物特征的照片
不同侧 面反映 地物分 布与覆 盖,相 互印证
一对一关系:一张地面照片只对应一幅遥感影像实例。这种情况下, 可用的遥感影像数据源比较单一。 一对多关系:一张地面照片对应多张不同类型或时相的遥感影像实例。
多对一关系:多张地面照片对应一幅遥感影像。这种情况一般针对比 较复杂的地面环境,难以通过一张地面照片全面反映其特征,需要从 不同位置和角度对同一地点的地物拍摄多张地面照片。但针对拍摄对 象所在区域,只有一种可供采集遥感影像实例的数据源。 多对多关系:多张地面照片对应多幅遥感影像实例。这是上面第2和 第3两种情况的综合。在第3种情况的基础上,有多种类型或时相的数 据源可供采集遥感影像实例。
样点地理环境描述 参考信息:定位方法、照片方位角参照方向、35mm等效焦距 辅助信息:位置定位平面精度水平、定位时观测到的卫星数量、
方位角准确程度
绝大部分可从相机EXIF信息或其它采集设备自动获得
遥感影像解译样本数据的属性
遥感影像实例的属性 共13个见规范表5-2
标识信息:遥感影像实例标识符
来自元
地面照片反映的地表季相或覆盖状态应尽可 能与遥感影像的时相接近
如果季相差别较大,需确保通过照片判别出的地物或覆盖状 态与影像上判别出的一致,否则不应作为样本保留
地面照片采集总体要求
样本应根据具体情况采集
内业有疑问及分类错误的图斑,原则上都需要采集 对应的解译样本 内业较确定的图斑,选取典型区域按每类图斑3%10%抽样进行核查并采集样本 核查时准确率不达标的图斑,应扩大抽样比例和地 域范围进行核查并采集样本
遥感影像解译样本
2013年12月
云南省地图院 肖提荣
遥感影像解译样本数据的作用
• 用具有对照关系的地面照片和遥 感影像记录信息与知识
• 帮助解译人员对遥感影像地域直 观、正确的认知,确保解译精度
• 遥感影像解译结果质量控制
遥感影像解译样本数据的内容
– 地面照片 用通用数码相机在地面实地拍摄的能较全面
地面照片可有计划拍摄,也可是无计划拍摄
两种方式应有机结合,外业时需要有较强的无计划 拍摄意识,碰到典型类型,应及时拍摄采样
地面照片采集总体原则
应注意保护照片原始信息
地面照片在整理过程中,除文件名称外,应避免对 原始照片文件进行造成属性信息发生错误改变的再 、时相比较一致且连片、地理环境差 异不大的区域
影像实例代表一个样点 • 对于多对一或多对多的情况,有多个样点形成一个逻辑
上的样点组,该样点组由一组具有上述对应关系的地面 照片和遥感影像实例组成
样点不是被摄目标,只跟着照片走
遥感影像解译样本数据的属性
地面照片的属性 共18个见规范表5-1
标识信息:照片的标识符 基本信息:拍摄时间、拍摄者 位置信息:拍摄点经度、拍摄点纬度、拍摄点高程 姿态信息:照片方位角、相机俯仰角、相机横滚角 关联信息:拍摄距离、照片主体所属的地理国情信息类型代码、