空间数据质量在GIS中的影响

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

地理信息系统(GIS)的基础是空间数据,空间数据的核心是质量,空间数据的生产与质量控制是一个相互作用的过程,生产数据是为了应用,而数据质量是一个关系到数据可靠性和系统可靠性的重要问题。随着数据质量在建设数字地球、进行矿产预测的计算机模拟中发挥着越来越重要的作用,但如果空间数据的质量及其精度未能引起足够的重视,由这些空间数据进行重新运算和组合产生的空间数据就不是最终需要的结果,可能导致最终决策错误。要提高空间数据的质量,减小空间数据误差,就要对空间数据误差产生和扩散的所有过程和环节进行控制。在数据采集时对元数据进行跟踪,采取相应的措施提高数据质量。以地图数字化为例,对纸质地图进行数字化前应对其进行校正或配准,选用精度比较高的数字化仪和扫描仪提高栅格数据的精度等;根据空间数据质量评价的标准还应制定相应的细则来提高数据质量;对采集和处理空间数据人员进行岗前培训等也都能减小误差的传播。

1 GIS 空间数据质量控制研究现状

GIS 空间数据的质量优劣直接影响着GIS应用中分析结果的可靠程度及应用的真正实现,也影响着GIS产业的健康发展。因此,近年来国内外越来越关注GIS数据的精度和质量控制的研究。GIS数据的质量控制问题涉及面很广,包括数据质量的衡量标准、表示方法,数据误差的来源和性质,评价方法和控制方法及相关政策等。如政府部门积极制定法规保障数据质量;将数据作为产品,采用管理产品质量的方法管理数据质量;数据质量的教育、培训与咨询;初步形成了地理数据质量的系列国际标准,如ISO 19100系列标准中地理信息质量标准;方法上,主要成果和结论,包括直线不确定性模型的改进、曲线不确定性模型的建立;将平差理论引入GIS数据误差处理和质量控制,并提出了实用方法;对GIS 数字化误差的性质、分布进行了深入研究;从抽样检验的理论出发,探讨了GIS 产品的质量控制技术和方法。

2 空间数据质量的概念

2.1空间数据的质量

空间数据是有关空间位臵、专题特征以及时间信息的符号记录,而数据质量是空间数据在表达这3个基本要素时所能达到的准确性、一致性、完整性以及它们三者之间统一性的程度。由于现实世界的复杂性、模糊性以及人类认识和表达能力的局限性,空间数据在表达上不可能完全达到真值,只能在一定程度上接近真值。用户根据需要对空间数据的处理也会导致出现一定的质量问题。所以空间数据的误差产生于各种数据源及空间数据的输入和处理过程中。

2.2与空间数据质量相关的几个概念

2.2.1误差(Error)反映了数据与真实值或公认的真值之间的差异,它是一种常用的数据准确性的表达方式。

2.2.2准确度(Accuracy)指结果值、计算值或估计值与真实值或公认的真值的接近程度。

2.2.3精密度(Resolution)表示数据的精密程度,亦即数据表示的有效位数。它表现了测量值本身的离散程度。

2.2.4不确定性(Uncertainty)关于空间过程和特征不能被准确确定的程度,是自然界各种空间现象自身固有的属性。在内容上,它是以真值为中心的一个范围,这个范围越大,数据的不确定性也越大。

2.2.5分辨率(Resolution)指最小的可分离单元或最小的可表达单元。对栅格数据,指图像象元大小;对于矢量数据,指坐标点的密集程度。

2.2.6现势性(Modernistic)数据的现势性是指数据采集的时间,数据的更新时间等。地理数据有些具有明确的时效特征,如土地利用测量数据,随地区的差异在时间上有明显的变化。一般来说,具有动态特征的数据,它们的时间有效性较短,相反则长。

3 空间数据质量问题的来源

从GIS中不同数据的表达形式到生成计算机可识别数据,从不同数据的处理变换到数据的应用,在这些过程中都会有数据质量问题的产生。

3.1现象自身存在的不稳定性

空间现象自身存在的不稳定性包括空间特征和过程在空间、专题和时间内容上的不确定性。空间现象在空间上的不确定性指其在空间位臵分布上的不确定性变化,如某种土壤类型边界划分的模糊性,某种土地利用类型边界变动的频繁性;空间现象在时间上的不确定性表现为其在发生时间段上的游移性;空间现象在属性上的不确定性表现为属性类型划分的多样性,非数值型属性值表达的精确性。因此,空间数据存在质量问题是不可避免的。

3.2现象的表达

数据采集、制图过程中采用的测量方法、量测精度的选择,人们对同一变量概念理解的不一致性以及对某一空间地理特征表达方式是否合理等,由于它们都受到人类自身的关于空间过程和特征的认知以及表达的影响,因此,通过它们生成的数据都有可能出现误差。例如,在地图投影中,由椭球体到平面的投影转换必然产生误差;制图综合必然要综合掉一部分数据内容而使地图数据出现误差;在一些像土壤、地质、森林、地理等的学科中,许多概念还没有取得一致性的认识,即使是同一学科领域的专家,他们岁同一种具有空间特征的变量的认识也可能有很大差异,也必然导致数据测量误差的产生。

3.3空间数据处理中的误差

在数据处理过程中,容易产生误差的几种情况:

3.3.1投影变换地图投影是开口的三维地球椭球面或球面到二维平面的拓扑变换。在不同的投影形式下,地理特征的位臵、面积和方向表现会有差异。

3.3.2地图数字化和扫描后的矢量化处理数字化过程采点的位臵精度、空间分辨率、属性赋值等都有可能出现误差。

3.3.3数据格式转换在矢量数据和栅格数据的格式转换中,数据所表达的空间特征的位臵具有差异性。

3.3.4数据抽象在数据发生比例尺变换时,对数据进行的聚类、归并、合并等操作时产生的误差,它包括知识性误差(例如,操作符合地学规律的程度)和数据所表达的空间特征位臵的变化误差。

3.3.5建立拓扑关系拓扑过程中伴随着数据所表达的空间特征的位臵坐标的变化。

3.3.6与主控数据层的匹配一个数据库中,常存存储同一地区的多层数据面,为了保证各数据层之间空间位臵的协调性,一般建立一个主控数据层以控制其他数据层的边界和控制点。在与主控数据层匹配的过程中也会存在空间位移,导致误差的出现。

3.3.7数据叠加操作和更新数据在进行叠加运算以及数据更新时,会产生空间位臵和属性值的差异。

3.3.8数据集成处理指在来源不同、类型不同的各种数据集的相互操作过程中所产生的误差。数据集成是包括数据预处理、数据集之间的相互运算、数据表达等过程在内的复杂过程,其中位臵误差、属性误差都会出现。

3.3.9数据处理过程中误差的传递和扩散在数据处理的各个过程中,误差是累积和扩散的,前一过程的累积误差可能成为下一阶段的误差起源,从而导致新的误差的产生。

3.4空间数据使用中的误差

3.4.1对数据的解释过程对于同一种数据来说,不同用户对它的内容的解释和理解可能不同。例如,对于土壤数据,城市开发部门、农业部门、环境部门对某一级别土壤类型内涵的理解和解释会有很大差异。处理这类问题的方法是随空间数据提供各种相关的文档说明,如元数据。

3.4.2缺少文档缺少对某一地区不同来源的空间数据的说明,诸如缺少投

相关文档
最新文档