空间数据质量与元数据.pptx
第9章_空间元数据

§9.2 元数据的内容及标准
二、空间元数据的内容
空间元数据的内容包括:
确定一套地理空间数据的存在性及其位臵; 确定一套地理空间数据对某种应用的适宜性; 确定获取一套地理空间数据的手段; 确定成功地转换一套地理空间数据的方法和途径; 确定一套地理空间数据的存储与表达方法; 确定一套地理空间数据的使用方法; …………
图形(Graph):与预定义的限制规则一致的零维(如 node)、一维(link或chain)和二维(T多边形)有拓扑 相关的对象集;
12
§9.1 元数据的基本概念
四、空间元数据概念列举
数据层(Layer):集成到一起的面域分布空间数据集, 它用于表示一个主体中的实体,或者有一公共属性 或属性值的空间对象的联合;
详述(Explicit):由一对数或三个数分别直接描述水 平位臵和三维位臵的方法;
介质(Media):用于记录、存储或传递数据的物理设 备。
15
§9.2 元数据的内容及标准
元数据的内容
空间元数据的内容 元数据的分类
元数据的标准
我国元数据的发展
16
§9.2 元数据的内容及标准
一、元数据的内容
19
§9.2 元数据的内容及标准
三、元数据的分类----按内容划分
模元数据:
用于描述数据模型的元数据,与描述数据的元数据在 结构上大致相同,其内容包括模型名称、模型类型、建 模过程、模型参数、边界条件、作者、引用模型描述、 建模使用软件、模型输出等。
20
§9.2 元数据的内容及标准
三、元数据的分类----按对象划分
6
§9.1 元数据的基本概念
二、数据存储
我们所讨论的元数据是以数据的形式存储的,这 不同于以往的元数据。它应尽可能多地反映数据集自 身的特征规律,以便于用户对数据集的准确、高效与 充分的开发与利用。不同领域的数据库,其元数据的 内容会有很大差异。通过元数据可以检索、访问数据 库,可以有效利用计算机的系统资源,可以对数据进 行加工处理和二次开发等。 科学界关于元数据认识的共同点是:元数据的目 的就是促进数据集的高效利用,并为计算机辅助软件 工程(CASE)服务。
第四章空间数据与数据质量

第四章空间数据与数据质量空间数据是对现实世界对象(地理特征)的空间信息和专题属性信息描述,它具有诸如数据量巨大,结构复杂多样、操作是计算密集型的,具有自相关性等特征。
空间数据是地理信息系统不可缺少的组成部分,其质量在很大程度上影响和制约着地理信息系统的可用性,为地理信息系统用户提供满足质量要求的空间数据是地理信息系统建设的关键任务之一。
4.1空间数据4.1.1空间数据的来源地理信息系统的数据源是指建立地理信息系统数据库所需要的各种类型数据的来源。
地理信息系统的数据源是多种多样的,并随系统功能的不同而不同,通常包括以下几种:(1)地图数据:各种类型的地图是GIS最主要的数据源,因为地图是地理数据的传统描述形式,是具有共同参考坐标系统的点、线、面的二维平面形式的表示,内容丰富,图上实体间的空间关系直观,而且实体的类别或属性可以用各种不同的符号加以识别和表示。
(2)遥感数据:遥感数据是GIS中一个极其重要的信息源。
通过遥感影象可以快速、准确地获得大面积的、综合的各种专题信息,航天遥感影象还可以取得周期性的资料,这些都为GIS提供了丰富的信息。
(3)测量数据:测量数据主要指使用大地测量、GPS、城市测量、摄影测量和其他一些测量方法直接量测所得到的测量对象的空间位置信息。
各种实测数据特别是一些GPS点位数据、地籍测量数据常常是GIS的一个很准确和很现势的资料。
(4)国民经济的各种统计数据常常也是GIS的数据源。
如人口数量、人口构成、国民生产总值等等。
各种文字报告和立法文件在一些管理类的GIS系统中,有很大的应用,如在城市规划管理信息系统中,各种城市管理法规及规划报告在规划管理工作中起着很大的作用。
4.1.2空间数据的基本特征地理数据一般具有三个基本特征:属性特征(非定位数据),描述空间对象的特性,即是什么,如对象的类别、等级、名称、数量等。
空间特征(定位数据):描述空间对象的地理位置以及相互关系,又称几何特征和拓扑特征,前者用经纬度、坐标表示,后者如交通学院与电力学院相邻等。
空间元数据

§9.1 元数据的基本概念
二、数据存储
我们所讨论的元数据是以数据的形式存储的,这 不同于以往的元数据。它应尽可能多地反映数据集自 身的特征规律,以便于用户对数据集的准确、高效与 充分的开发与利用。不同领域的数据库,其元数据的 内容会有很大差异。通过元数据可以检索、访问数据 库,可以有效利用计算机的系统资源,可以对数据进 行加工处理和二次开发等。 科学界关于元数据认识的共同点是:元数据的目 的就是促进数据集的高效利用,并为计算机辅助软件 工程(CASE)服务。
层 (Stratum) :在有序系统中数据层、级别或梯度 序列; 纬度 (Latitude) :在中央经线上度量,以角度单位 度量离开赤道的距离;
经度 (Longitude) :经线面到格林尼治中央经线面 的角度距离;
12
§9.1 元数据的基本概念
四、空间元数据概念列举
经圈(Meridian):穿过地球两极的地球的大圆圈; 坐标(Ordinate) :在笛卡尔坐标系中沿平行于 X 轴和 Y轴测量的坐标值;
图形 (Graph) :与预定义的限制规则一致的零维(如 node )、一维 (link 或 chain) 和二维 (T多边形 ) 有拓扑 相关的对象集;
11
§9.1 元数据的基本概念
四、空间元数据概念列举
数据层(Layer):集成到一起的面域分布空间数据集, 它用于表示一个主体中的实体,或者有一公共属性 或属性值的空间对象的联合;
投 影 (Projection) : 将 地 球 球面坐 标 中的空 间 特 征 (集)转化到平面坐标体系时使用的数学转化方法;
投影参数 (Projection Parameters) :对数据集进行 投影操作时用于控制投影误差、变形实际分布的参考 特征; 地图(Map):空间现象的空间表征,通常以平面图形 表示;
空间数据的采集和质量控制(PPT64页).pptx

2、投影与坐标系:
每一种投影都与一个坐 标系统相联系。坐标系 统是一套说明某一物体 地理坐标的参数,参数 之一为投影。投影关系 着如何将图形物体显示 于平面上,而坐标系统 则显示出地形地物所在 的相对位置。
3、统一的地图投影系统的意义:
为地理信息系统选择和设计一种或几种适用的地图投影系 统和网格坐标系统,为各种地理信息的输入、输出及匹配处理 提供一个统一的定位框架,使各种来源的地理信息和数据能够 具有共同的地理基础,并在这个基础上反映出它们的地理位置 和地理关系特征。
1)绝对空间:具有属性描述的空间位置的集合,一系列坐标值组成。
2)相对空间:是具有空间属性特征的实体的集合,由不同实体之间的 空间关系组成。
返回
§3-2 地理参照系和控制基础 二、地理空间的数学建构---如何建立地球表面的几何模型
地理信息系统原理
1、最自然的面: 包括海洋底部、高山、高原在内的固体地球表面,起伏不定, 难以用一个简洁的数学式描述。
便于量算和进一步的空间数 据处理和分析。
GIS
地
椭 球 体
图 投 影
模
型
返回
地理信息系统原理
• 3、高程系统 • 采用不同的基准面表示地面点的高低所产生的几种不同的高程
表示法,或者对水准测量数据采取不同的处理方法所产生的几种 高程表示法。有正高、正常高、力高和大地高程等系统。
高程基准面基本上有两种:一是大地水准面,它是正高和力 高的基准面;二是椭球面,它是大地高程的基准面。此外,为了 克服正高不能精确计算的困难还采用正常高,以似大地水准面为 基准面,它非常接近大地水准面。
数据源?
§3-1 概述
现实世界
文字报告、 遥感图象 等
GIS
空间数据的质量控制

第八页,共55页。
3.影响空间数据质量的原因
数据处理过程
数据搜集 数据输入
数据存储 数据处理 数据输出 数据使用
误差来源
野外测量误差:仪器误差、记录误差 遥感数据误差:辐射和几何纠正误差、信息提取误差 地图数据误差:原始数据误差、坐标转换、制图综合及印刷 数字化误差:仪器误差、操作误差 不同系统格式转换误差:栅格-矢量转换、三角网-等值线转换
第二十五页,共55页。
(2)空间数据互操作协议
GIS-A 直接调用 操纵
操纵空间数 据的API
直接调用 操纵
GIS-B
特点:比外部数据交换标准方便,但由于各种软件 存储和处理空间数据的方式不同,空间数据的互操 作函数又不可能很庞大,因此往往不能解决所有问 题。
第二十六页,共55页。
(3)空间数据共享平台
(3)数据生产质量控制
(4)数据加工处理质量控制
第三十三页,共55页。
(5)数据质量控制策略数据清洗ຫໍສະໝຸດ 产组织管理建立质量保障体系
建立“二级检查、一级验收”制度
区分数据清理的优先级 监理机构设定
第三十四页,共55页。
三、质量评价体系
Satellite imagery
Mr User
Maps Existing data
(3) 属性精度:指空间实体的属性值与其真值相符的 程度。通常取决于地理数据的类型, 且常常与位置 精度有关, 包括要素分类与代码的正确性、要素属 性值的准确性及其名称的正确性等。
第二十九页,共55页。
(4) 时间精度:要素时间属性和时间关系的准确度 (5) 逻辑一致性:指地理数据关系上的可靠性,包括数据
数值精度不够 空间精度不够:每个格网点太大、地图最小制图单元太大
空间数据质量分析PPT课件

2. 元数据方法 元数据中包含了大量的有关数据质量的信息, 通过它可以检查数据质
量, 同时元数据也记录了数据处理过程中质量的变化, 通过跟踪元 数据可以了解数据质量的状况和变化。
3. 地理相关法 用空间数据的地理特征要素自身的相关性来分析数据的质量。例如,
5
(2) 准确度(Accuracy)
• 数据的准确度: 被定义为结果、计算 值或估计值与真实值或者大家公认的 真值的接近程度。
• 即一个记录值(测量或观察值)与它的 真实值之间的接近程度。
• 它可用误差来衡量。
2021
6
(3) 精度(Precision)
• 数据的精密度:数据表示的精密程度, 用 数据的有效位数来表示, 它表现了测量值 本身的离散程度。
2021
9
(6) 比例尺(Scale)
比例尺是地图上一个记录的距离和它所表现的" 真实世界的"距离之间的一个比例。地图的比 例尺将决定地图上一条线的宽度所表现的地 面的距离。例如, 在一个1:10 000比例尺的地 图上, 一条0.5mm宽度的线对应着5m的地面 距离。如果这是线的最小的宽度, 那么就不可 能表示小于5m的现象。
从地表自然特征的空间分布着手分析, 山区河流应位于地形的最低 点(最低等高线)
• 精确度:精密度的实质在于它对数据准确 度的影响, 同时在很多情况下, 它可以通过 准确度而得到体现, 故常把二者结合在一 起称为精确度, 简称精度, 即对现象描述的 详细程度。
• 精度低的数据并不一定准确度也低.
2021
7
(4) 不确定性(Uncertainty)
空间数据准确度和质量培训课件PPT(共 34张)

13
图7.7 两个图层的外部边界线。一条用粗线表示,另一条用细线表 示,在图上方的两条线没有重合。
14
图7.8 图中黑色方块显示节点错误。阴 影区域有两个黑色方块。放大时, 如插图所示,它变得明显,左边两个 节点错误代表存在间隙的悬挂节 点,右边的第三个黑色方块代表一 个可接受的悬挂节点,附加到路 的尽头。间隙意味着沿着道路中 断,将会在最短路径分析等数据分 析出现问题。
线的简化和平滑
线的简化是指通过消除线条上的某些点,简化 或概化线条的过程。 线的平滑是指通过使用一些数学函数(例如样 条函数)改变线型的过程。
30
图7.22 线的简化的 Douglas-Peucker 算法是一个迭代过程,要求使用容差、趋 势线,并计算节点到趋势线的离差。详见7.6.2 节解释。
定位错误
定位错误是指数字化要素的几何错误。 可以通过用于数字化的数据源来检查定位错误。
4
图7.1 常见的跟踪数字化错误类型。细线为源地图上的线,粗线为跟 踪形成的线。
5
空间数据准确度标准
在美国,空间数据准确度标准的发展经历了三个阶段。 1. 首先,是1947年修订与采用的美国国家制图准确度标
17
用地图拓扑编辑
地图拓扑(map topology)是要素组成部分之间 拓扑关系的临时集合,这些要素组成部分被认为是 重合一致的。比如,可以在土地利用图层和土壤图 层之间建立地图拓扑,使它们的外部轮廓重合。
18
用拓扑规则编辑
■ Geodatabase 总共有30种拓扑规则,这些拓扑规 则适用于点、线和面要素。可用于修正图层或图 层间的拓扑错误。
8
图7.2 (a)未闭合多边形,(b)两个多边形之间有缝隙, (c)多边形重叠。
空间数据质量

8
(5) 空间分辨率 (Spatial Resolution)
• 分辨率是空间目标可辨识的最小尺寸。 如遥感影像上最小可分辨的地物目标。 在一个图形扫描仪中最小的物理分辨率 从理论上讲是由设施的像元大小来确定 的。在一个激光打印机上这是 84.67×10-3mm,
9
(6) 比例尺(Scale)
比例尺是地图上一个记录的距离和它所表现的 " 真实世界的"距离之间的一个比例。地图的比 例尺将决定地图上一条线的宽度所表现的地 面的距离。例如, 在一个 1:10 000 比例尺的 地图上, 一条0.5mm宽度的线对应着5m的地面 距离。如果这是线的最小的宽度 , 那么就统数据库中既可表示线性现象 , 又可 以通过连成的多边形表示面状现象。 • 第一类:线在真实世界中是可以找到的, 如道路、河流、 行政界线等, 这类线性特征的误差主要产生于测量和对数 据的后处理 ; • 第二类:现实世界中找不到的 , 如按数学投影定义的经 纬线、等高线、气候区划线和土壤类型界限等, 这类线性 特征的线误差, 被称为解译误差。 解译误差与属性误差直接相关, 若没有属性误差, 则 可以认为那些类型界线是准确的, 因而解译误差为零。
19
(2) 遥感数据误差
• 遥感数据的误差来源: • 观测过程:受空间分辨率、几何畸变和辐射误 差等影响。 • 处理和解译过程:由图像处理中的影像或图像 校正和匹配以及遥感解译判读和分类引人的, 其中包括混合像元的解译判读所带来的属性误 差。
20
(3) 测量数据的误差
• 标准椭球体代表地球真实表面空间时 , 已经引人了 一定的误差因素 , 由于这种误差因素无法排除 , 一 般也不作为误差考虑。 • 测量方面的误差通常考虑的是系统误差、操作误差 和偶然误差。 • (a) 系统误差的发生与一个确定的系统有关 , 它受 环境因素(如温度、湿度和气压等)、仪器结构与性 能以及操作人员技能等方面的因素综合影响而产生。 系统误差不能通过重复测量以检查或消除, 只能用 数字模型模拟和估计。
元数据及数据质量介绍41页PPT

36、如果我们国家的法律中只有某种 神灵, 而不是 殚精竭 虑将神 灵揉进 宪法, 总体上 来说, 法律就 会更好 。—— 马克·吐 温 37、纲纪废弃之日,便是暴政兴起之 时。— —威·皮 物特
38、若是没有公众舆论的支持,法律 是丝毫 没有力 量的。 ——菲 力普斯 39、一个判例造出另一个判例,它们 迅速累 聚,进 而变成 法律。 ——朱 尼厄斯
40、人类法律,事物有规律,这是不 容忽视 的。— —爱献 生
6、最大的骄傲于最大的自卑都表示心灵的最软弱无力。——斯宾诺莎 7、自知之明是最难得的知识。——西班牙 8、勇气通往天堂,怯懦通往地狱。——塞内加 9、有时候读书是一种巧妙地避开思考的方法。——赫尔普斯 10、阅读一切好书如同和过去最杰出的人谈话。——笛卡儿
空间数据的质量控制PPT文档58页

56、极端的法规,就是极端的不公。 ——西 塞罗 57、法律一旦成为人们的需要,人们 就不再 配享受 自由了 。—— 毕达哥 拉斯 58、法律规定的惩罚不是为了私人的 利益, 而是为 了公共 的利益 ;一部 分靠有 害的强 制,一 部分靠 榜样的 效力。 ——格 老秀斯 59、假如没有法律他们会更快乐的话 ,那么 法律作 为一件 无用之 物自己 就会消 灭。— —洛克
60、人民的幸福是至高无个的法。— —西塞 罗
66、节制使快乐增加并使享受加强。 ——德 谟克利 特 67、今天应做的事没有做,明天再早也 是耽误 了。——裴斯 泰洛齐 68、决定一个人的一生,以及整个命运 的,只 是一瞬 之间。 ——歌 德 69、懒人无法享受休息之乐。——拉布 克 70
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
受环境因素、仪器结构、操作人 员的技能等影响。它不能通过重 复观测以检查或消除。
操作误差可通过几何或代数关系 检查其一致性,或通过重复观测 检查并消除操作误差。
它由不可预料、不可控制的因素 引起。可采用随机模型进行估计 和处理。
空间数据的质量控制
传统手工 图形:目视方法等 方法 属性:逐个检查
第七讲 空间数据质量和元数据
中山大学 遥感与地理信息工程系
空间数据质量 元数据
空间数据
空间数据是有关空间位置、专题特征以及 时间信息的符号记录。
空间数据质量是指空间数据在表达空间位 置、专题特征以及时间信息时能够达到的准确 性、一致性、完整性,以及他们三者之间同一 性的程度。
空间数据的质量具有相对性。
地图数据的质量问题
地图固有误差 如控制点误差、投影物差 材料变形误差 热胀冷缩
跟踪数字化 1、数字化要素对象
图形数字化误差 2、数字化仪 3、数字化操作
扫描数字化 原图质量、扫描精度等
遥感数据的质量问题
遥感仪器 遥感图像的处理 空间位置和属性方面的误差 和解译
测量数据的质量问题
系统 误差
操作 误差
性 质 元数据应尽可能多地反映数据集自身的特征规律。
作 用 通过元数据可以检索、访问数据库,可以有效的 利用计算机资源,可以对数据进行加工处理和二 次开发等。
元数据的类型(1)
分类标准
类型
1、科研型元数据 内容 2、评估型元数据
3、模型元数据 描述对象 1、数据层元数据
2、属性元数据 3、实体元数据
名称 线 Line 线段 Line segment 线 String
弧 Arc 链 Link 环 Ring
链环 Chain
概念 一维对象的一般术语; 两个点之间的直线段;
由相互连接的一系列线段组成的没有分支 线段,线可以自身或与其他线相切; 由数学表达式确定的点集组成的弧状曲线;
两个结点之间的拓扑关联;
封闭状不相切链环或弧段序列;
非相切线段或由结点区分的弧段构成的有 方向无分支序列;
空间 特征
✓ ✓
✓ ✓ ✓
时间 特征
✓
✓ ✓ ✓ ✓
专题
特征
✓ ✓ ✓ ✓ ✓ ✓
空间数据质量评价矩阵表
空间数据质量问题的来源
✓空间现象自身存在的不稳定性 ✓空间现象的表达 ✓空间数据处理中的误差 ✓空间数据使用中的误差
空间现象的表达
✓ 定义 变量概念理解的不一致性导致
数据测量误差。
✓ 测量 测量仪器本身有一定的设计精度。 ✓ 表达方式 图形的不合理表达产生误差。 ✓ 物理介质的变化
元数据
元数据概念
Metadata,原意是关于数据变化的描述, 即关于数据的数据。
目 的 1、促进数据集的高效利用 2、为计算机辅助软件工程(CASE)服务。
内 容 对数据集的描述;对数据项、数据所有者、数 据生产历史等的说明;对数据质量的描述;对数 据处理信息的说明;对数据转换方法的描述;对 数据库的更新、集成方法等的说明。
数据处理中的误差
投影变换 地图数字化和扫描后的矢量化处理 数据格式转换 数据抽象 建立拓扑关系 与主控数据层的匹配 数据叠加操作和更新 数据集成处理 数据的可视化表达 数据处理过程中误差的传递和扩散
空间数据使用中的误差
✓ 对数据的解释过程 ✓ 缺少文档
常见空间数据源的误差分析
✓地图数据的质量问题 ✓遥感数据的质量问题 ✓测量数据的质量问题
属性精度
指空间实体的属性与其真值相符的 程度。通常取决于地理数据的类型,且 常常与位置精度有关,包括要素分类与 标准的正确性、要素属性值的准确性、 名称的正确性等。
时间精度
指数据的现势性。可以通过数据更 新的时间和频度来表现。
逻辑一致性
指地理数据关系上的可靠性,包括 数据结构、数据内容,以及拓扑性质上 的内在一致性。
元数据的类型(2)
分类标准
类型
在系统 1、系统级别元数据 中的作用 2、应用层元数据
元数据的 1、控制层元数据 作用 2、说明元数据
空间元数据的概念和标准
名称
空间数据 Geospatial data 类型 Type
概念 用于确定具有自然特征或者人工建筑特征的地 理实体的地理位置、属性及其边界的信息。
数据类型指该数据能接受的值的类型。
对象Object
指地理实体的部分或整体的数字表达。
实体类型 Entity type 点Point
对于具有相似地理特征的地理实体集合的定义 和描述。
确定位置的0维地理对象。来自结点Node拓扑连接两个或多个链或环的一维对象。
标识点 Label 显示地图或图表时用于特征标识的参考点。
元数据方 元数据包含大量有关数据的信息, 法 通过跟踪元数据可以了解数据质 量的状况和变化。
地理相关 用空间数据的地理特征要素自身 法 的相关性来分析数据的质量。如 山区河流应当位于微地形的最低 点。
数字化过程的质量控制
❖ 数据预处理工作 ❖ 数字化设备的选用 ❖ 数字化对点的精度(<0.1mm) ❖ 数字化限差 ❖ 数据的精度检查(直<0.2mm;曲<0.3mm)
几个概念
➢误差—— 误差反映了数据与真实值或大 家公认的真值之间的差异。
➢数据的准确度 ——结果、计算值、估计 值与真实值之间的差异。
➢数据的精密度——数据表示的精密程度, 亦即数据表示的有效
位数。 ➢不确定性——关于空间过程和特征不能
被准确确定的程度。
空间数据质量评价
空间数据质量标准要素
✓数据情况说明 ✓位置精度 ✓属性精度 ✓时间精度 ✓逻辑一致性 ✓数据完整性 ✓表达形式的完整性
数据完整性
指地理数据在范围、内容和结构等 方面满足所有要求的完整程度,包括数 据范围、空间实体类型、空间关系分类、 属性特征分类等方面的完整性。
表达形式的合理性
主要指数据抽象、数据表达与真实 地理世界的吻合性,包括空间特征、专 题特征、时间特征表达的合理性。
空间数据质量的评价
数据描述 数据要素 世系(继承性) 位置精度 属性精度 逻辑一致性 完整性 表现形式准确性
数据情况说明
要求对地理数据的来源、数据内容 及其处理过程等做出准确、全面和详尽 的说明。
位置精度
指空间实体的坐标数据与实体真实位 置的接近程度,通常表现为空间三维坐 标数据精度。它包括数学基础精度、平 面精度、高程精度、接边精度、形状再 现精度、像元定位精度。平面精度又分 为相对精度和绝对精度。