地图数据的采集和地图数据库
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
地图数据的采集和地 图数据库
数据源
数据源:指建立计算机地图制图系统的数 据库所需的各种数据的来源。
空间信息的获取是一个空间信息系统建设 的首要任务。一个空间信息系统建设,70 %以上的工作(费用)将花费在空间信息 (特别是矢量数据)的获取上面。
地图数据源
数据源种类 1 地图:地图数字化 2 遥感影像数据:图象、GPS坐标点文件等 3 实测数据:形成纸质地图或坐标点文件 4 文字与统计资料 GIS重要的属性数据源 5 已有数字数据:各种交换格式数据
国土基础信息分类编码
大小 类类 码码
一
二标
级
级志
代
代码
码
码
属性分类分级编码举例
土地利用分类编码
分类系统 园地
代码 耕地 100 灌溉水田 101 望天田 102 水浇地 103 旱地 104 菜地 105
200 果园 201 桑园 202 茶园 203 橡胶园 204
地图数据的采集
几何数据采集 两种方式: 地图跟踪数字化(数字化仪输入、屏幕矢
属性数据分类
分类是将具有共同属性特征的事物或现象归并在一起,而把具有不同 属性特征的事物分开的过程。
原则: 科学性:选择事物或现象最稳定的属性和特征作为分类的依据。 完整性和系统性:形成一个完整的分类体系,低级的类应能归并到高
级的类中。 实用性:考虑对信息分类所依据的属性特征的获取方式和获取能力,
数据模型按不同的应用层次分成三种类型 :分别是概念数据模型、逻辑数据模型、 物理数据模型。
逻辑数据模型 1 层次模型 2 网状模型 3 关系模型
1
d
4
f
B
a
eC
b
A
2
h
c
3
5 g 6
M
层次模型
A
a
b
c
12
M
层次分明,结构清晰, 易于实现
层次模型
缺点: 对任何对象的查询都从根节点开始,低层次的对象的查询
属性数据编码
原则:1 科学性,与分类体系相适应,便于 数据库管理。
2 唯一性:一个代码唯一的表示一类对象。 3 完整性和可扩充性:能完整的反映分类体
系,并留下足够的备用代码,适应扩充的 需要。 4 应用性和规范性:代码应尽可能反映对象 的特点,结构简单,便于记忆,格式规范 、统一。
属性分类分级编码举例
优点,但处理起来复杂。
属性数据编码
代码的种类: 分类码(特征码):根据地理信息分类体系设计的
专业信息的分类代码,表示不同类别的数据。 标志码(识别码):在分类码的基础上,对每类数
据设计出其全部实体的识别代码,表示某一类数 据中的某个个体。 代码的功能:代码表示对象的名称,是对象的唯 一标志;代码也可作为区分分类对象类别的标志 ;代码可作为对象排序的标志。
地图跟踪数字化
基本过程 将需要数字化的图件(地图、航片等)固定在数字化板
上,设定数字化范围,输入有关参数,选择数字化方式, 按地图要素的类别实施数字化 在进行地图手扶跟踪数字化时,需要在数字化仪面板坐 标和地图真实坐标之间建立映射关系,通常的做法是先录 入三个不在同一条直线上的控制点。
控制点(tic)概念
量化)——传统的数据采集方法。 地图扫描矢量化(自动或半自动矢量化)
:较为先进的地图数字化方式
地图跟踪数字化
数字化仪原理 目前较为常用的数字化仪是电磁感应式数字化
仪,它是利用电磁感应原理检测出图形坐标数据 的。由游标线圈(定位器)、工作桌面(包括铺 设其下的栅格阵列导线)以及电子部件、微处理 器和输出装置组成。其中游标线圈是电磁发射源 ,工作桌面接收信号,电子部件、微处理器把游 标线圈在工作桌面上的位移量转换成x,y坐标, 最后经输出装置输入计算机
属性数据的采集
数据量较小,可以在输入几何数据的同时, 用键盘输入;
➢ 数据量大,与几何数据分别输入,根据预 先建立属性表输入属性;
➢ 从其它统计数据库导入属性,通过关键字 段联接图形。
几何数据与属性数据之间的联系:公共标识 码(用户ID),即 几何数据(图形数据) 与属性数据之间的公共标识符
地图数据的编辑和数据质量分析
数据质量分析
地图数据质量的含义:地图数据具有定位、定性 和时间性三大特征。地图数据的质量是指用该数 据来表达其三大特征时所能达到的准确性、一致 性和完整性,以及它们之间统一性的程度。
基本内容: 1 准确性:几何位置精度以及属性精度 2 一致性:数据的逻辑一致性,如:节点匹配、
多边形闭合及拓扑关系的正确性等 3 现势性 4 统一性:各类数据之间的统一协调
数据质量的评价方法
间接评价法:所谓间接评价法是指通过外 部知识或信息进行推理来确定空间数据的 质量的方法。用于推理的外部知识或信息 如用途、数据历史记录、数据源的质量、 数据生产的方法、误差传递模型等。
地图数据误差
地图数据的质量通常用误差来衡量,而地图数据误差主要来自于地图 数据采集过程。地图数据采集的方法除野外观测数据、图像外,主要 是对已有的地图进行数字化采集,地图数字化中,地图原有误差和数 字化过程引入的误差是两个主要的误差源:
地图上具有控制地图图幅精确度的一些点, 也称地理控制点(同名点),通常这些点 都具有准确的实地坐标或可以精确定位的 ,如图幅图廓点、公路网格点、测量点、 道路交叉口等
地图扫描数字化
1、扫描仪数字化思想 通过扫描将地图转换为栅格数据,然后采
用栅格数据矢量化的技术追踪出线和面, 采用模式识别技术识别出点和注记,并根 据地图内容和地图符号的关系自动给矢量 数据赋以属性值。 2、主要方法 自动矢量化 交互式矢量化 :采用人机交互方式
原则:1 符合数值估计精度的要求。在满足精度的前提下 ,尽可能选择较少的分级数。
2 分级应符合数据的分布特征。级内差异尽可能小,各级 代表值之间的差异尽可能大。
3 应顾及可视化的效果。等级的划分要以图形的方式表示 出来,考虑到人对图形符号等级的感受,分级数不易超过 8级。
4 分级时主要使用数学方法。最优分割分级是在有序样本 不被破坏的前提下,使其分割的级内离差平方和为最小而 级间离差平方和为极大的一种分级方法。它可以用来对有 序样本或可变为有序(排序)的样本进行分级
关系模型
地图-多边形关系M(A,B,C) 多边形-线关系A(a,b,c),B(b,d,e),C(e,f,g,h) 边-节点关系 a(1,2),b(1,3),c(2,3),d(1,4),e(4,3),f(4,5),g(5,
6),h(6,3) 这些空间关系可以用二维表来表达
M
A
M
B
M
C
A
a,b,c
数据编辑:数据采集的过程中,无论是地 图的几何数据数字化还是属性数据数字化 ,都不可能完全正确,常见的错误有:地 图错误的遗漏,地图要素的重复或多余, 几何数据的位置不正确或不完整,属性数 据的遗漏、重复,几何数据与属性数据的 连接错误等。因此必须对采集的数据进行 编辑修改。为此,首先要显示数据,然后 才能进行编辑修改。
应与有关的标准协调一致。 可扩性:应能容纳新增加的事物和现象,而不至于打乱已建立的分类
系统。 最常用的分类方法是层次分类法,优点是层次清晰,使用方便,缺点
是分类体系确定后,不易改动,当分类层次较多时,代码位数较长。
属性数据分级
对事物或现象的数量或特征进行等级的划分,主要过程为 分级数和分数界线的确定。
1 地图原有误差 控制点和碎部点误差 地图制图综合误差与编绘误差 地图清绘误差 印刷误差 图纸变形误差 2 数字化误差 仪器差 人员差 数字化方式 数字化软件
数据质量的控制
目的:减少误差,提高精度 数据质量控制方法: 1 误差带法 2 比较法 3 相关法
地图数据模型
DXF/E00 /MIF等
地图数据源
已有数字数据是目前空间数据共享的一个重要途径,因此 ,一般的空间信息系统平台都提供了各种交换格式的数据 转入/转出功能。
纸质地图是GIS主要的数据源。主要通过对地图的跟踪数 字化和扫描数字化获取。在使用地图时,应考虑到地图投 影所引起的变形,必要时需要进行坐标转换或投影变换。
网络模型
A
M B
a
c
b
d
e
1
2
3
Baidu Nhomakorabea
4
网络模型
缺点: 结构复杂,增加查询和定位困难,用户需要熟悉
数据的逻辑结构,知道自己所在的相应位置 网状模型不直接支持对于层次结构的表达 网状模型的数据操作命令具有过程式性质
网状数据库是导航式(Navigation)数据库,用户 在操作数据库时不但说明要做什么,还要说明怎 么做。例如在查找语句中不但要说明查找的对象 ,而且要规定存取路径
数据显示
数据显示是指在屏幕上通过绘图机把有关 信息显示出来,以便与原图进行比较,找 出数字化过程中的差错,加以编辑修改。 为了能对采集到的数据进行较为完整的显 示,计算机地图制图系统应提供如下基本 功能:
1 图形显示功能 2 符号设置及符号库功能 3 图形输出功能
数据编辑修改
编辑系统一般具有的主要功能: 投影变换 数据匹配 数据查询 图形编辑 属性编辑及注记配置
效率很低,并且很难进行反向查询,插入和删除操作比较 复杂,父节点的删除意味着下层所有子节点均被删除。 数据独立性较差,数据更新涉及很多指针 层次命令具有过程式性质,用户必须了解数据的物理结构 ,并在数据操作命令中显式的给出数据的存取路径 难以描述复杂的地理实体之间的联系,描述多对多的关系 时导致物理存储上的冗余
属性数据编码
数据编码是指确定属性数据代码的过程。代码是 一个易于被计算机识别与处理的符号,是计算机 地图制图中定性查询信息的主要依据和手段。
编码的基础是分类分级,编码的结果是代码。 代码的类型: 1 数字代码:结构简单,便于计算机处理,直观性
较差。 2 字母代码:便于识别,易于记忆,但占空间多。 3 数字、字母混合代码,有数字代码与字母代码的
遥感影像含有丰富的资源环境信息,是大面积、动态的、 实时的数据源,是GIS数据更新的重要方式。将坐标点文 件转为地图数据也是空间信息系统平台必须提供的基本功 能。
数据的分类编码
地图数据分为几何数据和属性数据,数据 的分类编码指的是属性数据编码。
属性数据:用来描述实体的属性特征的数 据。
在计算机地图制图系统中,通常把那些与 几何数据有密切联系的属性数据用编码的 形式表示,并与几何数据一起管理起来。
数据质量的评价方法
直接法:1 直接用计算机程序进行自动检测 。用计算机软件自动发现数据中的某些类 型的错误,并自动算出数据中不符合数据 项的百分率或平均质量等级等。例如,可 以检测文件格式是否符合规范、编码是否 正确、数据是否超出范围等。
2 随机抽样检测:在确定抽样方案时,应考 虑数据的空间相关性。
B
b,d,e
C
e,f,g,h
a
1
2
b
1
3
c
2
3
d
1
4
e
4
3
f
4
5
g
5
6
h
6
3
关系模型
关系之间的联系需要执行系统开销较大的 连接操作,运行效率不够高。
关系模型描述复杂的地理对象时,需要对 地理实体进行不自然的分解,导致存储模 式、查询途径及操作等方面显得 语义不合 理。
模拟和操作复杂地理对象的能力较弱,无 法用递归和嵌套的方式来描述复杂关系的 层次和网状结构。
数据源
数据源:指建立计算机地图制图系统的数 据库所需的各种数据的来源。
空间信息的获取是一个空间信息系统建设 的首要任务。一个空间信息系统建设,70 %以上的工作(费用)将花费在空间信息 (特别是矢量数据)的获取上面。
地图数据源
数据源种类 1 地图:地图数字化 2 遥感影像数据:图象、GPS坐标点文件等 3 实测数据:形成纸质地图或坐标点文件 4 文字与统计资料 GIS重要的属性数据源 5 已有数字数据:各种交换格式数据
国土基础信息分类编码
大小 类类 码码
一
二标
级
级志
代
代码
码
码
属性分类分级编码举例
土地利用分类编码
分类系统 园地
代码 耕地 100 灌溉水田 101 望天田 102 水浇地 103 旱地 104 菜地 105
200 果园 201 桑园 202 茶园 203 橡胶园 204
地图数据的采集
几何数据采集 两种方式: 地图跟踪数字化(数字化仪输入、屏幕矢
属性数据分类
分类是将具有共同属性特征的事物或现象归并在一起,而把具有不同 属性特征的事物分开的过程。
原则: 科学性:选择事物或现象最稳定的属性和特征作为分类的依据。 完整性和系统性:形成一个完整的分类体系,低级的类应能归并到高
级的类中。 实用性:考虑对信息分类所依据的属性特征的获取方式和获取能力,
数据模型按不同的应用层次分成三种类型 :分别是概念数据模型、逻辑数据模型、 物理数据模型。
逻辑数据模型 1 层次模型 2 网状模型 3 关系模型
1
d
4
f
B
a
eC
b
A
2
h
c
3
5 g 6
M
层次模型
A
a
b
c
12
M
层次分明,结构清晰, 易于实现
层次模型
缺点: 对任何对象的查询都从根节点开始,低层次的对象的查询
属性数据编码
原则:1 科学性,与分类体系相适应,便于 数据库管理。
2 唯一性:一个代码唯一的表示一类对象。 3 完整性和可扩充性:能完整的反映分类体
系,并留下足够的备用代码,适应扩充的 需要。 4 应用性和规范性:代码应尽可能反映对象 的特点,结构简单,便于记忆,格式规范 、统一。
属性分类分级编码举例
优点,但处理起来复杂。
属性数据编码
代码的种类: 分类码(特征码):根据地理信息分类体系设计的
专业信息的分类代码,表示不同类别的数据。 标志码(识别码):在分类码的基础上,对每类数
据设计出其全部实体的识别代码,表示某一类数 据中的某个个体。 代码的功能:代码表示对象的名称,是对象的唯 一标志;代码也可作为区分分类对象类别的标志 ;代码可作为对象排序的标志。
地图跟踪数字化
基本过程 将需要数字化的图件(地图、航片等)固定在数字化板
上,设定数字化范围,输入有关参数,选择数字化方式, 按地图要素的类别实施数字化 在进行地图手扶跟踪数字化时,需要在数字化仪面板坐 标和地图真实坐标之间建立映射关系,通常的做法是先录 入三个不在同一条直线上的控制点。
控制点(tic)概念
量化)——传统的数据采集方法。 地图扫描矢量化(自动或半自动矢量化)
:较为先进的地图数字化方式
地图跟踪数字化
数字化仪原理 目前较为常用的数字化仪是电磁感应式数字化
仪,它是利用电磁感应原理检测出图形坐标数据 的。由游标线圈(定位器)、工作桌面(包括铺 设其下的栅格阵列导线)以及电子部件、微处理 器和输出装置组成。其中游标线圈是电磁发射源 ,工作桌面接收信号,电子部件、微处理器把游 标线圈在工作桌面上的位移量转换成x,y坐标, 最后经输出装置输入计算机
属性数据的采集
数据量较小,可以在输入几何数据的同时, 用键盘输入;
➢ 数据量大,与几何数据分别输入,根据预 先建立属性表输入属性;
➢ 从其它统计数据库导入属性,通过关键字 段联接图形。
几何数据与属性数据之间的联系:公共标识 码(用户ID),即 几何数据(图形数据) 与属性数据之间的公共标识符
地图数据的编辑和数据质量分析
数据质量分析
地图数据质量的含义:地图数据具有定位、定性 和时间性三大特征。地图数据的质量是指用该数 据来表达其三大特征时所能达到的准确性、一致 性和完整性,以及它们之间统一性的程度。
基本内容: 1 准确性:几何位置精度以及属性精度 2 一致性:数据的逻辑一致性,如:节点匹配、
多边形闭合及拓扑关系的正确性等 3 现势性 4 统一性:各类数据之间的统一协调
数据质量的评价方法
间接评价法:所谓间接评价法是指通过外 部知识或信息进行推理来确定空间数据的 质量的方法。用于推理的外部知识或信息 如用途、数据历史记录、数据源的质量、 数据生产的方法、误差传递模型等。
地图数据误差
地图数据的质量通常用误差来衡量,而地图数据误差主要来自于地图 数据采集过程。地图数据采集的方法除野外观测数据、图像外,主要 是对已有的地图进行数字化采集,地图数字化中,地图原有误差和数 字化过程引入的误差是两个主要的误差源:
地图上具有控制地图图幅精确度的一些点, 也称地理控制点(同名点),通常这些点 都具有准确的实地坐标或可以精确定位的 ,如图幅图廓点、公路网格点、测量点、 道路交叉口等
地图扫描数字化
1、扫描仪数字化思想 通过扫描将地图转换为栅格数据,然后采
用栅格数据矢量化的技术追踪出线和面, 采用模式识别技术识别出点和注记,并根 据地图内容和地图符号的关系自动给矢量 数据赋以属性值。 2、主要方法 自动矢量化 交互式矢量化 :采用人机交互方式
原则:1 符合数值估计精度的要求。在满足精度的前提下 ,尽可能选择较少的分级数。
2 分级应符合数据的分布特征。级内差异尽可能小,各级 代表值之间的差异尽可能大。
3 应顾及可视化的效果。等级的划分要以图形的方式表示 出来,考虑到人对图形符号等级的感受,分级数不易超过 8级。
4 分级时主要使用数学方法。最优分割分级是在有序样本 不被破坏的前提下,使其分割的级内离差平方和为最小而 级间离差平方和为极大的一种分级方法。它可以用来对有 序样本或可变为有序(排序)的样本进行分级
关系模型
地图-多边形关系M(A,B,C) 多边形-线关系A(a,b,c),B(b,d,e),C(e,f,g,h) 边-节点关系 a(1,2),b(1,3),c(2,3),d(1,4),e(4,3),f(4,5),g(5,
6),h(6,3) 这些空间关系可以用二维表来表达
M
A
M
B
M
C
A
a,b,c
数据编辑:数据采集的过程中,无论是地 图的几何数据数字化还是属性数据数字化 ,都不可能完全正确,常见的错误有:地 图错误的遗漏,地图要素的重复或多余, 几何数据的位置不正确或不完整,属性数 据的遗漏、重复,几何数据与属性数据的 连接错误等。因此必须对采集的数据进行 编辑修改。为此,首先要显示数据,然后 才能进行编辑修改。
应与有关的标准协调一致。 可扩性:应能容纳新增加的事物和现象,而不至于打乱已建立的分类
系统。 最常用的分类方法是层次分类法,优点是层次清晰,使用方便,缺点
是分类体系确定后,不易改动,当分类层次较多时,代码位数较长。
属性数据分级
对事物或现象的数量或特征进行等级的划分,主要过程为 分级数和分数界线的确定。
1 地图原有误差 控制点和碎部点误差 地图制图综合误差与编绘误差 地图清绘误差 印刷误差 图纸变形误差 2 数字化误差 仪器差 人员差 数字化方式 数字化软件
数据质量的控制
目的:减少误差,提高精度 数据质量控制方法: 1 误差带法 2 比较法 3 相关法
地图数据模型
DXF/E00 /MIF等
地图数据源
已有数字数据是目前空间数据共享的一个重要途径,因此 ,一般的空间信息系统平台都提供了各种交换格式的数据 转入/转出功能。
纸质地图是GIS主要的数据源。主要通过对地图的跟踪数 字化和扫描数字化获取。在使用地图时,应考虑到地图投 影所引起的变形,必要时需要进行坐标转换或投影变换。
网络模型
A
M B
a
c
b
d
e
1
2
3
Baidu Nhomakorabea
4
网络模型
缺点: 结构复杂,增加查询和定位困难,用户需要熟悉
数据的逻辑结构,知道自己所在的相应位置 网状模型不直接支持对于层次结构的表达 网状模型的数据操作命令具有过程式性质
网状数据库是导航式(Navigation)数据库,用户 在操作数据库时不但说明要做什么,还要说明怎 么做。例如在查找语句中不但要说明查找的对象 ,而且要规定存取路径
数据显示
数据显示是指在屏幕上通过绘图机把有关 信息显示出来,以便与原图进行比较,找 出数字化过程中的差错,加以编辑修改。 为了能对采集到的数据进行较为完整的显 示,计算机地图制图系统应提供如下基本 功能:
1 图形显示功能 2 符号设置及符号库功能 3 图形输出功能
数据编辑修改
编辑系统一般具有的主要功能: 投影变换 数据匹配 数据查询 图形编辑 属性编辑及注记配置
效率很低,并且很难进行反向查询,插入和删除操作比较 复杂,父节点的删除意味着下层所有子节点均被删除。 数据独立性较差,数据更新涉及很多指针 层次命令具有过程式性质,用户必须了解数据的物理结构 ,并在数据操作命令中显式的给出数据的存取路径 难以描述复杂的地理实体之间的联系,描述多对多的关系 时导致物理存储上的冗余
属性数据编码
数据编码是指确定属性数据代码的过程。代码是 一个易于被计算机识别与处理的符号,是计算机 地图制图中定性查询信息的主要依据和手段。
编码的基础是分类分级,编码的结果是代码。 代码的类型: 1 数字代码:结构简单,便于计算机处理,直观性
较差。 2 字母代码:便于识别,易于记忆,但占空间多。 3 数字、字母混合代码,有数字代码与字母代码的
遥感影像含有丰富的资源环境信息,是大面积、动态的、 实时的数据源,是GIS数据更新的重要方式。将坐标点文 件转为地图数据也是空间信息系统平台必须提供的基本功 能。
数据的分类编码
地图数据分为几何数据和属性数据,数据 的分类编码指的是属性数据编码。
属性数据:用来描述实体的属性特征的数 据。
在计算机地图制图系统中,通常把那些与 几何数据有密切联系的属性数据用编码的 形式表示,并与几何数据一起管理起来。
数据质量的评价方法
直接法:1 直接用计算机程序进行自动检测 。用计算机软件自动发现数据中的某些类 型的错误,并自动算出数据中不符合数据 项的百分率或平均质量等级等。例如,可 以检测文件格式是否符合规范、编码是否 正确、数据是否超出范围等。
2 随机抽样检测:在确定抽样方案时,应考 虑数据的空间相关性。
B
b,d,e
C
e,f,g,h
a
1
2
b
1
3
c
2
3
d
1
4
e
4
3
f
4
5
g
5
6
h
6
3
关系模型
关系之间的联系需要执行系统开销较大的 连接操作,运行效率不够高。
关系模型描述复杂的地理对象时,需要对 地理实体进行不自然的分解,导致存储模 式、查询途径及操作等方面显得 语义不合 理。
模拟和操作复杂地理对象的能力较弱,无 法用递归和嵌套的方式来描述复杂关系的 层次和网状结构。