自然资源大数据整合与更新关键技术研究与应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自然资源大数据整合与更新关键技术研究与应用
发表时间:2019-08-28T10:25:12.827Z 来源:《建筑学研究前沿》2019年11期作者:江吉标
[导读] 我国自然资源随着科学技术的快速发展而得以有效利用。
崇左市地质勘查测绘院广西崇左 532200
摘要:我国地大物博,国土面积辽阔,自然资源涉及土地、矿产、森林、草原、湿地、水、海洋等,覆盖国土空间规划及人类活动空间的多项要素。随着自然资源信息化进程不断推进,自然资源数据量日渐增加,在自然资源部成立的背景下,自然资源的一体化管理和国土空间的统一管控是当前一段时间内自然资源管理的重点工作,自然资源和国土空间相互关联,密不可分,因此急需要将自然资源和相关国土空间的规划数据进行一体化整合,构建自然资源和规划数据融合的一体化数据体系。如何实现自然资源数据整合加工,对提高数据的完整性和现实性具有重要意义。
关键词:自然资源;大数据整合与更新关键技术;研究与应用
引言
我国自然资源随着科学技术的快速发展而得以有效利用。近些年来,国内对数字资源整合方法以及其相关技术的研究工作比较多,在数字资源整合方法的研究工作上已经取得了非常可观的进展。但是我国的自然资源数据因机构改革等原因,相关数据尚未形成一体化整合,还有待完善。
1 技术路线
基于统一数据模型的自然资源大数据整合与更新技术采用“图形驱动业务”的建设思路,充分利用已有的数据库成果,以自然资源一体化数据库建设为核心,具体流程包括数据调研与分析、数据资源目录建设、构建统一数据模型、一体化数据库设计、数据标准化整合、数据库建库以及数据联动更新等。1)数据调查与分析:按照自然资源数据整合与更新工程的数据资源体系建设要求,对山、水、林、田、湖、草等管理对象和管理工作中形成的数据资源进行系统调研分析。2)数据资源目录建设:遵循科学性、实用性、稳定性、可扩展性、兼容性与针对性等原则,形成自然资源数据目录体系。3)统一数据模型构建:采用面向对象的理论与方法,通过统一对象描述与编码、概念模型设计、逻辑模型设计等过程建立对象关系、构建统一数据模型和设计联动更新机制,以模拟自然资源管理的空间对象的结构和行为。4)一体化数据库设计:包括数据库的总体架构设计、逻辑设计、物理设计、性能设计、安全设计与建库流程设计等内容。5)数据标准化整合:依托现有数据,通过数据分析与检查、数据映射与抽取、数据预处理、对象编码与关联关系建立、质检审核等过程,为自然资源大数据管理与业务运行提供数据基础。6)数据库建库:采用“分布存储、集中管理”的设计思路,针对未建库的数据采用标准化建库方法进行“新建”;对于已建库数据,根据实际情况,采用数据库迁移“统管”或者动态视图“引流”的方式实现数据统一管理。7)数据联动更新:基于统一数据模型,利用缓冲资源池完成数据更新,并将数据变化前后的编号信息、属性信息、业务信息记录在对象变化表中。经过数据抽取,将最终的成果数据和关联表格存储在一体化数据库中,实现联动更新、数据“留痕”。
2 自然资源数据整合的意义及内容
在进行自然资源数据的处理时,所利用到的数据整合方案,就是指利用数据转换以及通信来达到数据结构与数据含义的统一。通过这种方式来将信息孤岛消除,使数据能够实现分布式异构以及全方位的共享。自然资源数据的特点是,空间与时态并存,具有高强度行政保密性以及存储海量等,所以,对自然资源数据进行整合时,可以采用多种机制来进行。目前,我们可以了解到的数字资源整合机制大概可以分为,代理整合机制,数据仓库整合机制,中介器封装器整合机制以及对等网整合机制。在这四种整合机制当中,除掉数据仓库整合机制剩下的三种整合机制通过对数据自身来进行整合,然后再利用对的模式或者中介代理通信,使国土数据资源在进行共享前实现转换以及翻译,所以这三种方法大多数时候是用与在学校以及图书馆的数字资源整合工作。而数据仓库整合机制,则是对多类型,多结构空间属性时态并存以及多标准的数据整合工作比较适应,而自然资源数据就属于这种特点的数据,可以利用数据仓库整合机制来进行自然资源数据整合。
3 关键技术
3.1 统一数据模型构建
采用面向对象的理论与方法,遵循“数据与应用分离”的原则,将空间图元(地块)作为自然资源管理的空间对象进行设计,所有涉及位置、面积、界线的信息均与图形挂接,包括统一对象描述、概念模型设计和逻辑模型设计等过程。1)统一对象描述。为保证空间对象在整个数据资源中的唯一性,按照统一编码规则对空间对象进行编码描述,如同人的身份证号,作为唯一性标识,形成业务关联、信息回溯、综合分析的基础与纽带。2)概念模型设计。采用面向对象的思想来描述自然资源数据,包括对象的逻辑组织、对象间的关系与限制,具有抽象性、封装性、多态性、继承性等特征。概念模型的建模过程更专注于分析问题本身,发掘重要的业务领域概念,并建立业务领域概念之间的关系。3)逻辑模型设计。在概念模型设计的基础上,对自然资源中的各项业务内容进行数据建模,实现空间对象、基本信息、项目信息、业务信息的组织与存储,形成自然资源大数据逻辑数据对象模型。对自然资源数据业务关系进行梳理,构建数据关系模型,包括空间关系模型、业务关系模型和时态关系模型。
3.2 数据挖掘
知识是对数据包含的信息更抽象的描述,是对大量数据进行分析的过程。而规则是基于知识的表达,是一种过程性的知识。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的但又是潜在有用的信息和知识的过程。基于数据挖掘进行地理信息数据的集成,国外研究已经趋于成熟并被广泛使用,国内学者在理论、方法和应用等方面都进行了有益的探讨。实际上,在自然资源数据整合的每一个环节都需要进行数据挖掘和关联规则的提取和应用,从海量的数据集合中抽取隐含的、先前未知的、对决策有潜在价值的规则。
3.3 应用情况
采用基于一体化数据模型驱动的自然资源大数据整合与更新技术,实现了从自然资源管理基础图元(地块)到空间要素对象,再到逻辑数据对象的模型层层深化与设计;建成了包括公共基础数据、专业基础数据和业务管理数据等数据分类在内的省级自然资源数据资源体