空间数据库中数据质量控制的方法与措施
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
空间数据质量特性与质量控制
范志坚1,2,方源敏1,汪虹 2
(1.昆明理工大学国土资源工程学院昆明 650093;2.云南省基础地理信息中心昆明 650034)
摘要:本文主要讨论空间数据质量特性、质量控制所涉及的内容。结合笔者最近从事空间数据库建库的具体实践和工作体会,探讨从位置精度、属性精度、时间精度、数据完整性和逻辑一致性等方面对数据质量进行全面控制,最终建成一个质量可靠的空间数据库。
关键词:地理信息系统;空间数据库;空间数据;质量特性;质量控制
Quality characteristic and Quality control of Spatial data
Fan Zhi-jian1,2,Fang Yuan-min1,Wang-Hong2
(1.Faculty of Land Resources Engineering,Kunming University of Science and Technology,Kunming
650093,China;2.Yunnan Provincial Geomatics center,Kunming 650034,China)
Abstract:This paper mainly talks over contents which are involved with quality characteristic and quality control of spatial data.Integrating with concrete practice and work experience which the writer has recently been engaged in establishing spatial database,a very comprehensive control of data quality should be discussed from aspects of positional accuracy、attribute accuracy、temporal accuracy、data compression、as well as logic conformance and so on.Finally,a dependable spatial database should be set up.
Key words:GIS;spatial database;spatial data;quality characteristic;quality control
0 引言
空间数据库是随着地理信息系统(GIS)的开发和应用而发展起来的数据库新技术,它是地理信息系统的重要组成部份,是地理信息系统应用部份的前题和基础。空间数据库为此建立了如实体、关系、数据独立性、完整性、数据操作、资源共享等一系列基本概念。以空间数据存储和操作为对象的空间数据库,把被管理的数据从一维推向了二维、三维甚至更高维。空间数据库是一种应用于空间数据处理与信息分析领域的具有工程性质的数据库,它所管理的对象主要是空间实体。在空间数据库中,空间数据质量的好坏,直接影响到空间数据库的经济效益和社会效益。
要得到高质量的空间数据,最重要的是在空间数据生产和使用过程中进行质量管理和质量控制。通过质量管理和质量控制,可以分析影响产品质量的原因,进而提高空间数据的质量。空间数据的质量是空间数据库生存和发展的保障,缺少质量指标的空间数据将无法得到用户的信任,且直接影响到地理信息系统应用、分析、决策的正确性和可靠性。由此可知,空间数据质量是空间数据库的生命线。
1 空间数据库中的误差
空间数据库建立后,数据库中的误差包含了原始数据的误差和数据库建库所引入的误差。
1.1 原始数据的误差
原始数据是指空间数据库建设时所包含的基本的数字化数据。它未经过任何地理信息系统的分析处理。原始数据的误差可分为源误差、处理误差和应用误差等三种类型。
源误差:源误差是指数据采集和录入中产生的误差。包括遥感数据、测量数据、属性记录、GPS数据、地图、地图数字化精度等的误差。
处理误差:处理误差是指数据录入后进行空间数据处理过程中产生的误差。包括几何改正、坐标变换和比例变换、投影变换、几何数据的编辑、属性数据的编辑、空间分析(如多边形叠置、数据层叠加时的冗余多边形等)、图形化简(数据压缩和曲线光滑)、数据格式转换、计算机裁切误差、空间内插、矢量-栅格数据的相互转换等。
使用误差:使用误差是指空间数据被使用过程中出现的误差。包括数据的完备程度、时间的有效性(即现势性)、拓扑关系的正确性、缺乏数据的质量报告、由应用模型引起的误差等。
以上三种误差中,数据处理误差远远小于源误差,使用误差看来不属于数据本身的误差,但是这些因素直接影响到应用的效果,所以也应列为空间数据误差的范畴。
1.2 空间数据库建库所引入的误差
空间数据库中的多源数据,经过基础地理信息数据库系统管理平台的各种分析、处理后,可以形成新的数据和最后产品。在这个过程中还会产生新的误差,这些误差包括:计算误差、拓扑叠加分析引起的数据误差以及GIS中的误差传播问题。
计算误差:计算机能否按需要的精度存储和处理数据,主要取决于计算机字长。在计算机字长不够的情况下进行许多大数据的运算时,会出现较大的舍入误差。图形图像处理的算法选择也与计算误差相关。数据处理过程中引入的计算误差一般还是较小,特别是与数据源误差相比,此项误差是可以忽略不计的。
拓扑叠加分析引起的数据误差:叠加分析是地理信息系统中很常用的一种分析方法。通过同一地区不同内容的多幅地图的叠加组合,产生新的图形和属性信息。在这个过程中,往往产生拓扑匹配、位置和属性方面的数据质量问题。由于叠加时,多边形的边界可能不完全重合,从而产生若干无意义的多边形。对这些无意义多边形进行处理的结果往往会改变边界线的位置。叠加后形成的新的多边形,其属性值的确定也可能存在属性组合带来的误差。
地理信息系统中的误差传播问题:地理信息系统中,由于从数据来源、空间数据库建立到空间数据库的操作和使用都引入了各种误差因素,特别是空间数据集成与整合所引入的误差。因此空间数据库系统应用分析的最终结果中也包含了这些误差因素的影响。误差传播的研究目的就是研究初始过程和中间过程中引入的误差因素对于最后结果的影响,并模拟误差的变化。目前,由于对地理信息系统误差传播机理的认识还不够深入,误差传播的很多方面都还处于研究和试验阶段。但是,对于地理信息系统的专业人士来说,了解数据的各类误差均会以某种方式在系统中传播并将对地理信息系统的最后应用结果的质量产生影响,对理解地理信息系统数据、数据产品和空间数据库的可靠性将是十分有益的。
以上讨论了空间数据库中原始数据本身含有的误差和随后空间数据库操作中引入的误差。一般来说,原始数据的误差远远大于空间数据库操作中引入的误差,因此,要想控制空间数据库的数据质量,数据获取生产过程中的质量控制及