空间数据质量
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
25
四、空间数据质量控制
常见的方法有 : 1. 传统的手工方法 主要是将数字化数据与数据源进行比较, 图形部分的检查包括目视方 法、绘制到透明图上与原图叠加比较, 属性部分的检查采用与原 属性逐个对比或其他比较方法。 2. 元数据方法 元数据中包含了大量的有关数据质量的信息, 通过它可以检查数据质 量, 同时元数据也记录了数据处理过程中质量的变化, 通过跟踪 元数据可以了解数据质量的状况和变化。 3. 地理相关法 用空间数据的地理特征要素自身的相关性来分析数据的质量。例如, 从地表自然特征的空间分布着手分析 , 山区河流应位于地形的最 低点(最低等高线)
13
(二)、空间数据质量的评价
• 数据质量评价矩阵 P45 注意: • 质量评价对生产者和用户都十分重要 • 多尺度(多精度):不同用户,不同比例尺 对数据质量有不同要求 • 时效性:不同数据有不同时效要求 • 数据精度的测试结果与测试报告
14
(二)、空间数据质量的评价
数据质量的研究涉及数据问题的检查方法、评价方法和标准等内容。 一、GIS数据质量问题的检查方法 发现数据错误,探测数据精度和准确性,是研究数据质量的前提。GIS 中对数据 质量检查的方法主要有直接评价、间接评价和非定量描述等。 1、直接评价法 (1)用计算机程序自动检测 例如,检测文件格式是否符合规范、编码是否正确、数据是否超出范围等。 (2)随机抽样检测 在确定抽样方案时,应考虑数据的空间相关性。 2、间接评价法 所谓间接评价法是指通过外部知识或信息进行推理来确定空间数据的质量的 方法。 3、非定量描述法 非定量描述法是指通过对数据质量的各组成部分的评价结果进行的综合分析来 确定数据的总体质量的方法。
4
8.数据集成处理: 指在来源不同、类型不同的各种数据集的 相互操作过程中所产生的误差。数据集成是包括数据预处 理、数据集之间的相互运算、数据表达等过程在内的复杂 过程, 其中位臵误差、属性误差都会出现。 9.数据的可视化表达: 数据在可视化过程中为适应视觉效果 , 需对数据的空间特征位臵、注记等进行调整, 由此产生数 据表达上的误差。 10. 数据处理过程中误差的传递和扩散 : 在数据处理的各个 过程中, 误差是累计和扩散的, 前一过程的累计误差可能 成为下一个阶段的误差起源, 从而导致新的误差的产生。
24
• b. 线误差。线在系统数据库中既可表示线性现象 , 又可 以通过连成的多边形表示面状现象。 • 第一类:线在真实世界中是可以找到的, 如道路、河流、 行政界线等, 这类线性特征的误差主要产生于测量和对数 据的后处理 ; • 第二类:现实世界中找不到的 , 如按数学投影定义的经 纬线、等高线、气候区划线和土壤类型界限等, 这类线性 特征的线误差, 被称为解译误差。 解译误差与属性误差直接相关, 若没有属性误差, 则 可以认为那些类型界线是准确的, 因而解译误差为零。
2. 常见空间数据误差分析
• LIS中的误差包括逻辑误差、 几何误差、属性误差和时 间误差,后两种误差和普通 系统概念一样 • (1) 逻辑误差:数据的 不完整性是通过上述四类 误差反映出来的。事实上 检查逻辑误差, 有助于发 现不完整的数据和其他三 类误差。对数据进行质量 控制或质量保证或质量评 价, 一般先从数据的逻辑 性检查人手。如图3-3 所 示
23
• (2) 几何误差。由于地图是以二维平面坐标表示位臵 ,
• • • • • 在二维平面上的几何误差主要反映在点和线上。 a. 点误差。 关于某点的点误差即为测量位臵(x,y)与其真实位臵 ( x0 ,y0)的差异。坐标误差定义为: Δx = x - x0 Δy = y - y0 为了衡量整个数据采集区域或制图区域内的点误差 , 一般 采用抽样测算 ( Δx,Δy)。抽样点应随机分布于数据采集 区内, 并具有代表性。这样抽样点越多, 所测的误差分布 就越接近于点误差的真实分布。
第10章
空间数据质量
• 一、空间数据质量的概念 • 1. 空间数据质量wenku.baidu.com
• 在计算机软件、硬件环境选定之后 ,GIS 中数据质量 的优劣决定着系统的分析质量以及整个应用的成败 • 空间位臵、专题特性以及时间是表达现实世界空间 变化的三个基本要素。数据质量则是空间数据在表 达这三个基本要素时 , 所能够达到的准确性、一致 性、完整性以及它们三者之间统一性的程度。 • 完整性:能否完全地表达要描述的给定目标 • 空间数据质量的好坏是一个相对概念
19
(2) 遥感数据误差
• 遥感数据的误差来源: • 观测过程:受空间分辨率、几何畸变和辐射误 差等影响。 • 处理和解译过程:由图像处理中的影像或图像 校正和匹配以及遥感解译判读和分类引人的, 其中包括混合像元的解译判读所带来的属性误 差。
20
(3) 测量数据的误差
• 标准椭球体代表地球真实表面空间时 , 已经引人了 一定的误差因素 , 由于这种误差因素无法排除 , 一 般也不作为误差考虑。 • 测量方面的误差通常考虑的是系统误差、操作误差 和偶然误差。 • (a) 系统误差的发生与一个确定的系统有关 , 它受 环境因素(如温度、湿度和气压等)、仪器结构与性 能以及操作人员技能等方面的因素综合影响而产生。 系统误差不能通过重复测量以检查或消除, 只能用 数字模型模拟和估计。
17
(三)、空间数据源误差及其分析
1. 空间数据源误差
• 地图、 • 遥感 • 测量
18
(1) 地图误差
• 地图固有误差。指用于数字化的地图本身所带有 的误差, 包括控制点误差、投影误差等。 • 材料变形产生的误差。这类误差是由于图纸的大 小受湿度和温度变化的影响而产生的。温度不变 的情况下, 若湿度由0%增至25%,则纸的尺寸可能 改变 1.6%; 纸的膨胀率和收缩率不相同, 即使温 度又恢复到原先水平, 图纸也不能恢复原有的尺 寸 • 数字化误差:数字化仪;扫描矢量化
15
(二)、空间数据质量的评价
二、研究GIS 数据质量的常用方法 1、敏感度分析法 2、尺度不变空间分析法 3、Monte Carlo实验仿真 4、空间滤波
16
(二)、空间数据质量的评价
三、数据采集中数据质量的评价内容 GIS中数据采集的方法通常可分为直接方法和间接方法两种。直接方法是指直 接从野外采集,以获取观测数据、图像等,间接方法是指从已有的图件上进行采 集。 地图数字化是获取矢量数据的主要方法之一,也是GIS中的重要误差源,是GIS 数据质量研究的重点之一。下面对地图数字化的数据误差作一分析。 1、地图固有误差的来源和类型 在地图的固有误差中,除了含有控制点和碎部点引入的误差外,至少存在下列误 差: (1)控制点展绘误差 (2)编绘误差 (3)绘图误差 (4)综合误差 (5)地图 复制误差和分版套合误差 (6)绘图材料的变形误差 (7)特征的定义 2、数字化的误差 (1)自动回归法 (2)ε-Band法(误差带方法) (3)对比法
21
• (b) 操作误差是操作人员在使用设备、读数或记 录观测值时, 因粗心或操作不当而产生的。 • (c) 偶然误差是一种随机性的误差, 由一些不可 预料和不可控制的因素引人。这种误差具有一定 的特性, 如正负误差出现频率相同、大误差少、 小误差多等。偶然误差可采用随机模型进行估计 和处理。
22
1
2. 与数据质量相关的几个概念
(1) 误差(Error)。
误差反映了数据与真值或者大家公认的真值 之间的差异, 它是一种常用的数据准确性 的表达方式。 误差研究包括 : 位臵误差: 即点的位臵的误差、线的位臵 的误差和多边形的位臵的误差 ; 属性误差:
2
产生的误差的环节
1. 2. 3. 投影变换 : 地图投影是将三维地球椭球面到二维场平 面的拓扑变换。在不同投影形式下 , 地理恃征的位臵、 面积和方向的表现会有差异。 地图数字化和扫描后的矢量化处理 : 数字化过程采点 的位臵精度、空间分辨率、属性赋值等都可能出现误 差。 数据格式转换 : 在矢量格式和栅格格式之间的数据格 式转换中, 数据所表达的空间特征的位臵具有差异性。 数据抽象: 在数据发生比例尺度变换时, 对数据进行 的聚类、归并、合并等操作时产生的误差
5
(2) 准确度(Accuracy)
• 数据的准确度: 被定义为结果、计算 值或估计值与真实值或者大家公认的 真值的接近程度。 • 即一个记录值(测量或观察值)与它的 真实值之间的接近程度。 • 它可用误差来衡量。
6
(3) 精度(Precision)
• 数据的精密度:数据表示的精密程度, 用 数据的有效位数来表示, 它表现了测量值 本身的离散程度。 • 精确度:精密度的实质在于它对数据准确 度的影响, 同时在很多情况下, 它可以通 过准确度而得到体现, 故常把二者结合在 一起称为精确度, 简称精度, 即对现象描 述的详细程度。 • 精度低的数据并不一定准确度也低.
12
(4) 时间精度: (5) 逻辑一致性:指地理数据关系上的可靠性,包括数据结 构、数据内容(如毛面积、净面积和扣除面积的关系), 以 及拓扑性质上的内在一致性。 (6) 数据完整性。指地理数据在范围、内容及结构等方面满 足所有要求的完整程度, 包括数据范围、空间实体类型、 空间关系分类、属性特征分类(如土地利用分类编码能否 涵盖所有现象)等方面的完整性。 (7) 表达形式的合理性。主要指数据抽象、数据表达与真实 地理世界的吻合性, 包括空间特征、专题特征和时间特征 表达的合理性等。
10
二、空间数据质量的评价
(一)、空间数据质量标准
• 空间数据质量标准是生产、使用和评价空 间数据的依据。 • 目前, 世界上已建立了一些数据质量标准, 如美国FGDC的质量标准等。 • 空间数据质量标准的建立必须考虑数据产 生的全过程。
11
空间数据质量标准的要素及内容
(1) 数据情况说明:对地理数据的来源、内容及处理过 程等做出准确、全面和详尽的说明。 (2) 位臵精度:为空间实体的坐标数据及实体真实位臵 的接近程度, 常表现为空间三维坐标数据精度。它包 括数学基础精度、平面精度、高程精度、接边精度、 形状再现精度 ( 形状保真度 ) 、像元定位精度 ( 图像分 辨率)等。 (3) 属性精度:指空间实体的属性值与其真值相符的程 度。通常取决于地理数据的类型, 且常常与位臵精度 有关, 包括要素分类与代码的正确性、要素属性值的 准确性及其名称的正确性等。
7
(4) 不确定性(Uncertainty)
• 不确定性是关于空间过程和特征不能被准确确 定的程度, 是自然界各种空间现象自身固有的 属性。在内容上, 它是以真值为中心的一个范 围, 这个范围越大, 数据的不确定性也就越大。 • 土地信息系统的不确定性包括空间位臵的不确 定性、属性不确定性、时域不确定性和逻辑上 的不一致性及数据的不完整性。 • 数据的不完整性指对于给定的目标 , GIS没有 尽可能完全地表达该物体。
4.
3
5. 建立拓扑关系 : 拓扑过程中伴随有数据所表 达的空间特征的位臵坐标的变化。 6. 与主控数据层的匹配 : 一个数据库中 , 常存 储同一地区的多层数据面 , 为保证各数据层 之间空间位臵的协调性 , 一般建立一个主控 数据层以控制其他数据层的边界和控制点。 在与主控数据层匹配的过程中也会存在空间 位移, 从而导致误差。 7. 数据叠加操作和更新 : 数据在进行叠加运算 以及数据更新时 , 会产生空间位臵和属性值 的差异。
8
(5) 空间分辨率 (Spatial Resolution)
• 分辨率是空间目标可辨识的最小尺寸。 如遥感影像上最小可分辨的地物目标。 在一个图形扫描仪中最小的物理分辨率 从理论上讲是由设施的像元大小来确定 的。在一个激光打印机上这是 84.67×10-3mm,
9
(6) 比例尺(Scale)
比例尺是地图上一个记录的距离和它所表现的 " 真实世界的"距离之间的一个比例。地图的比 例尺将决定地图上一条线的宽度所表现的地 面的距离。例如, 在一个 1:10 000 比例尺的 地图上, 一条0.5mm宽度的线对应着5m的地面 距离。如果这是线的最小的宽度 , 那么就不 可能表示小于5m的现象。