空间数据库概述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
地理空间实体:指具有空间分布特征和 一定几何形态的事物和现象,可分为资 源、环境、经济和社会以及地质、地形、 气候、植物、耕地、水文、经济与社会 等。 包括空间要素和属性要素。
28
图层:
指一定空间范围内具有相同属性要素的一组同 类地理空间实体。需要注意的是,GIS中图层概 念并不是地理空间实体的简单堆砌,而是在某 种特殊应用领域下空间实体的组合,并且相互 之间有着密切的联系。
间数据库性能的瓶颈,而现有的关
系数据库查询优化技术不能完全适
用于空间数据,所以查询优化技术
的研究势必成为空间数据库应用的
难点和突破点 。
34
例如:将查询分两步进行:即初次过滤和二次筛选
空间 数据库
初次过 滤
不准确 的候选 集合
二次筛 选
最终查 询结果
35
2 5
1 3
2 4
6
1 3
2 7
1
36
五、索引
第一章 空间数据库概述
第一章 空间数据库概述
第一节 空间数据库概念 第二节 空间数据库的研究内容
2
一、为什么要研究空间数据库
数据库(DataBase,简称DB):
存放数据的仓库。 长期存储在计算机内的、有组织的、可
共享的数据集合。
3
一、为什么要研究空间数据库
数据库管理系统(DataBase Management System,简称 DBMS):
述的二进制块的管理高得多。 但是仍然没有解决对象的嵌套问题,空间数
据结构也不能由用户任意定义,使用上仍然 受到一定限制。
18
GIS厂商开发的空间数据管理模块 ESRI : ARCSDE MapInfo: Spatialware
关系数据库管理系统厂商直接开发的 空间数据管理模块
Oracle Spatial Informix Ingres DB2
GIS还可以用来处理海量空间数据。 而实际上GIS就是空间数据库的前端!
5
一、为什么要研究空间数据库
例如“列出2011年销售总额的前十 位顾客”
对DBMS而言很简单 顺序扫描或者索引
6
一、为什么要研究空间数据库
例如“列出居住在离公司总部50公里以内的顾客” 这会难住普通的DBMS 要处理这个查询,必须把公司总部和顾客的地址
描述、存储和处理空间数据及其属性数 据的数据库系统。
8
三、空间数据库的作用
1、对海量数据的管理能力。 2、空间分析功能。 3、设计方式灵活,满足用户要求。 4、支持网络功能。
9
四、空间数据库的特征
多种数据类型特征(5D产品,矢量或栅 格)
空间特征(空间位置、空间属性、空间关 系)
非结构化特征(属性定长结构、空间坐标 和空间关系变长结构)
19
5、面向对象空间数据库管理系统
定义:能满足上述所有需求
它不仅支持变长记录,而且支持对象的嵌 套、信息的继承与聚集。
允许用户定义对象和对象的数据结构以及 它的操作。
这种空间数据结构可以是不带拓扑关系的面 条数据结构,也可以是拓扑数据结构,当采 用拓扑数据结构时,往往涉及对象的嵌套、 对象的连接和对象与信息聚集。
40
空
空间数据
间
数
据
库
属性数据
空间查询 属性查询
??? SQL
32
目前,空间查询语言的设计大体有
基于SQL扩展的空间查询语言 可视化查询语言 自然查询语言。
33
四、查询优化
由于空间数据具有结构复杂、数据 量庞大等特点,使得面向空间数据 的查询比单纯的属性数据查询要复 杂的多。
因此空间数据查询的效率成为了空
空间数据索引
作为一种辅助性的空间数据结构,介于 空间操作算法和地理对象之间,它通过 筛选,排除大量与特定空间操作无关的 地理对象,从而缩小了空间数据的操作 范围,提高了空间操作的速度和效率。
37
空间数据索引采用分割原理,把查询空 间划分为若干区域(通常为矩形或多边 形)。这些区域或单元包含空间数据并 可惟一标识。
位于用户和操作系统之间的,管理控制 DB的建立、运行和维护的软件。
具有数据定义、数据操纵、数据库运行、 数据库建立和维护功能。
属性数据!
4
一、为什么要研究空间数据库
GIS的出现激发了人们开发空间数据 库的兴趣。
GIS提供了便于分析地理数据和将地 理数据可视化的机制 。
GIS 可以对某些对象和图层进行多 种操作。
优点:一体化管理,数据的安全性、 一致性、完整性、并发控制性、数 据恢复较好,速度较快
缺点:部分解决空间对象反向检索 问题
17
4.对象——关系数据库管理
实现:
在关系数据库管理系统中进行扩展,使之能 直接存贮和管理非结构化的空间数据,
主要解决了空间数据的变长记录的管理, 由数据库软件商进行扩展,效率要比前面所
图形图像特征(结果可视化) 数据编码特征(数据分类分级编码) 海量数据特征
10
五、SDBMS的发展 文件管理方式 二元化空间数据库管理系统 全关系型空间数据库管理系统 对象-关系空间数据库管理系统 面向对象空间数据库管理系统
11
1、文件管理方式
最初当数据库技术还不是很成熟的时候, GIS应用采用文件系统存储数据。
变换到一个能够计算和比较距离的适当参照系中, 可能是经纬度坐标系, 然后数据库扫描顾客列表计算顾客和公司之间的 距离 如果距离小于50英里保存顾客名字。 这一过程无法用索引来缩小搜索范围,因为传统 索引无法处理多维数据的排序问题。
所以迫切需要能处理空间数据和查询的数据库。
7
二、定义:
空间数据库(Spatial DataBase Management System ,SDBMS)
29
地图:
指在实际应用系统中为表达更现实的语 义而对图层按照空间范围或专题进行的 组合。如城市规划地图上,包括交通, 电力,水力,煤气管道等多个图层,对 应于现实生活中城市规划时需要牵涉到 的各个部门。
30
地理空间数据库
地图
图层
图层 地理空间实体库
图层
空间要素
属性要素
31
二、空间数据查询语言
空间索引是用特定的数据结构和算法 来完成的,目前高效的空间索引有R树、 R+树、格网索引法、BSP树、KDP 树、CELL树、四叉树等。
38
六、数据挖掘
“人们被数据淹没,但却饥饿于知识” 数据挖掘(Data Mining),又称为数
据库中的知识发现(Knowledge Discovery in Database, KDD),
关系数据库提供了Binay(二进制) 字段,变长的坐标数据采用该字段 管理
优点:一体化管理,数据的安全性、 一致性、完整性、并发控制性、数 据恢复较好
缺点:速度慢,没有解决空间对象
反向检索问题
16
4、对象-关系空间数据库管理系统
定义:关系数据库推出了空间数据 管理的模块,定义了操纵空间对象 的API函数,属性数据和坐标数据用 关系数据库统一管理
就是从大量数据中获取有效的、新颖的、 潜在有用的、最终可理解的模式的非平 凡过程,简单的说,数据挖掘就是从大 量数据中提取或“挖掘”知识。
39
空间数据挖掘(Spatial Data Mining) , 也称基于空间数据库的数据挖掘和知 识发现,是指从空间数据库中提取用 户感兴趣的空间模式与特征、空间与 非空间数据的普遍关系及其它一些隐 含在数据库中的普遍的数据特征。空 间数据挖掘是数据挖掘的一个新的分 支。
据结构。
26
GIS成功的关键取决于人们对现实世 界认识和模拟的正确程度。由于面 向对象的方法能够模拟和操纵复杂 对象,能够将人们对于地理空间的 认识正确映射到计算机内,面向对 象的开发思想正逐步成为GIS开发的 基本方式。
27
用面向对象的观点来看,可将地理空 间数据归结为空间实体、图层、地图 3个层次:
采用图层的方式来组织地理空间数据可以表达 地理空间数据的分布性:(1)对于地理位置上 分布的空间数据,可以按空间范围划分图层, 如全国铁路交通图,就可以由各个省市的铁路 交通图组成;(2)对于空间范围相同的空间数 据,可根据应用的需要(即专题)人为地划分 到不同的图层里,如武汉市交通图,按交通的 种类可分为一级,二级公路等图层。
面向对象的数据模型不成熟
没有面向对象空间数据库管理系统
20
第二节 空间数据库的研究内容
空间数据模型 空间数据的管理方式 空间数据查询语言 查询优化 索引 数据挖掘 ……
21
一、空间数据模型
空间数据模型就是寻求一种描述地 理实体的有效的数据表示方法,根 据应用要求建立实体的数据结构和 实体之间的关系以便于应用。
基于对象的模型以带有属性数据的 点、直线、曲线或区域来显示地理 数据:笛卡尔坐标系统及其上的算 法定义了向量系统中的点、直线和 曲线都可以用点来表示,即,可视 为一个有序点集。
基于对象的模型可以方便的存贮空
间拓扑关系,也适用于方位、距离
分析,相对于基于场的模型,要求
更少的存贮空间但要求更复杂的数
定义:属性数据用关系数据库管理, 坐标数据用文件管理,两者间建立 联系
优点:实现空间数据管理、速度较 快
缺点:数据的安全性、一致性、完 整性、并发控制性、数据恢复较差, 没有解决空间对象反向检索问题
14
图形信息 图形文件
属性信息 关系数据库
GIS应用文件
15
3、全关系型空间数据库管理系统
定义:属性数据和坐标数据用关系 数据库统一管理
经典的空间数据模型分为两大类: 基于场的和基于对象的模型。
22
1 基于场的模型
基于场的数据模型中,将信息空间 视为在空间结构上一定分布的集合 体,每一个空间分布被规则化成一 个从空间框架到空间属性的数据函 数。
23
基于场的模型使用矩阵或栅格的单元 来显示、定位和存贮地理数据:利用 一个唯一的参考坐标代表每个在矩阵 边缘或内部的单元或点,而每个单元 或点上被赋予离散的属性值;基于场 的模型中的分辨率依赖于单元或栅格 的大小,不同的场模型中的分辨率可 能有很大的差别。
24
GIS常常需要在不同的数据层存贮各 种不同的信息如植被、土质、水文 或其他信息等,不同的数据层对应 不同的地理属性。数字区域模型 DTM(Digital Terrain Model)和数 字高程模型DEM(Digital Elevation Model)是典型的基于场的空间数据 模型。
25
2 基于对象的模型
每个GIS应用都对应自己的空间和属性数 据文件,当多个应用需要访问的数据有相同 部分时,就将这些数据提取出来,存放在一 个新的公共数据文件中 。
12
图形信息 图形文件
属性信息 属性文件
GIS应用文件
数据文件1
数据文件1
数据文件n
GIS应用1
GIS应用2
GIS应用n
公共数据文件1
13
2、二元化空间数据库管理系统
28
图层:
指一定空间范围内具有相同属性要素的一组同 类地理空间实体。需要注意的是,GIS中图层概 念并不是地理空间实体的简单堆砌,而是在某 种特殊应用领域下空间实体的组合,并且相互 之间有着密切的联系。
间数据库性能的瓶颈,而现有的关
系数据库查询优化技术不能完全适
用于空间数据,所以查询优化技术
的研究势必成为空间数据库应用的
难点和突破点 。
34
例如:将查询分两步进行:即初次过滤和二次筛选
空间 数据库
初次过 滤
不准确 的候选 集合
二次筛 选
最终查 询结果
35
2 5
1 3
2 4
6
1 3
2 7
1
36
五、索引
第一章 空间数据库概述
第一章 空间数据库概述
第一节 空间数据库概念 第二节 空间数据库的研究内容
2
一、为什么要研究空间数据库
数据库(DataBase,简称DB):
存放数据的仓库。 长期存储在计算机内的、有组织的、可
共享的数据集合。
3
一、为什么要研究空间数据库
数据库管理系统(DataBase Management System,简称 DBMS):
述的二进制块的管理高得多。 但是仍然没有解决对象的嵌套问题,空间数
据结构也不能由用户任意定义,使用上仍然 受到一定限制。
18
GIS厂商开发的空间数据管理模块 ESRI : ARCSDE MapInfo: Spatialware
关系数据库管理系统厂商直接开发的 空间数据管理模块
Oracle Spatial Informix Ingres DB2
GIS还可以用来处理海量空间数据。 而实际上GIS就是空间数据库的前端!
5
一、为什么要研究空间数据库
例如“列出2011年销售总额的前十 位顾客”
对DBMS而言很简单 顺序扫描或者索引
6
一、为什么要研究空间数据库
例如“列出居住在离公司总部50公里以内的顾客” 这会难住普通的DBMS 要处理这个查询,必须把公司总部和顾客的地址
描述、存储和处理空间数据及其属性数 据的数据库系统。
8
三、空间数据库的作用
1、对海量数据的管理能力。 2、空间分析功能。 3、设计方式灵活,满足用户要求。 4、支持网络功能。
9
四、空间数据库的特征
多种数据类型特征(5D产品,矢量或栅 格)
空间特征(空间位置、空间属性、空间关 系)
非结构化特征(属性定长结构、空间坐标 和空间关系变长结构)
19
5、面向对象空间数据库管理系统
定义:能满足上述所有需求
它不仅支持变长记录,而且支持对象的嵌 套、信息的继承与聚集。
允许用户定义对象和对象的数据结构以及 它的操作。
这种空间数据结构可以是不带拓扑关系的面 条数据结构,也可以是拓扑数据结构,当采 用拓扑数据结构时,往往涉及对象的嵌套、 对象的连接和对象与信息聚集。
40
空
空间数据
间
数
据
库
属性数据
空间查询 属性查询
??? SQL
32
目前,空间查询语言的设计大体有
基于SQL扩展的空间查询语言 可视化查询语言 自然查询语言。
33
四、查询优化
由于空间数据具有结构复杂、数据 量庞大等特点,使得面向空间数据 的查询比单纯的属性数据查询要复 杂的多。
因此空间数据查询的效率成为了空
空间数据索引
作为一种辅助性的空间数据结构,介于 空间操作算法和地理对象之间,它通过 筛选,排除大量与特定空间操作无关的 地理对象,从而缩小了空间数据的操作 范围,提高了空间操作的速度和效率。
37
空间数据索引采用分割原理,把查询空 间划分为若干区域(通常为矩形或多边 形)。这些区域或单元包含空间数据并 可惟一标识。
位于用户和操作系统之间的,管理控制 DB的建立、运行和维护的软件。
具有数据定义、数据操纵、数据库运行、 数据库建立和维护功能。
属性数据!
4
一、为什么要研究空间数据库
GIS的出现激发了人们开发空间数据 库的兴趣。
GIS提供了便于分析地理数据和将地 理数据可视化的机制 。
GIS 可以对某些对象和图层进行多 种操作。
优点:一体化管理,数据的安全性、 一致性、完整性、并发控制性、数 据恢复较好,速度较快
缺点:部分解决空间对象反向检索 问题
17
4.对象——关系数据库管理
实现:
在关系数据库管理系统中进行扩展,使之能 直接存贮和管理非结构化的空间数据,
主要解决了空间数据的变长记录的管理, 由数据库软件商进行扩展,效率要比前面所
图形图像特征(结果可视化) 数据编码特征(数据分类分级编码) 海量数据特征
10
五、SDBMS的发展 文件管理方式 二元化空间数据库管理系统 全关系型空间数据库管理系统 对象-关系空间数据库管理系统 面向对象空间数据库管理系统
11
1、文件管理方式
最初当数据库技术还不是很成熟的时候, GIS应用采用文件系统存储数据。
变换到一个能够计算和比较距离的适当参照系中, 可能是经纬度坐标系, 然后数据库扫描顾客列表计算顾客和公司之间的 距离 如果距离小于50英里保存顾客名字。 这一过程无法用索引来缩小搜索范围,因为传统 索引无法处理多维数据的排序问题。
所以迫切需要能处理空间数据和查询的数据库。
7
二、定义:
空间数据库(Spatial DataBase Management System ,SDBMS)
29
地图:
指在实际应用系统中为表达更现实的语 义而对图层按照空间范围或专题进行的 组合。如城市规划地图上,包括交通, 电力,水力,煤气管道等多个图层,对 应于现实生活中城市规划时需要牵涉到 的各个部门。
30
地理空间数据库
地图
图层
图层 地理空间实体库
图层
空间要素
属性要素
31
二、空间数据查询语言
空间索引是用特定的数据结构和算法 来完成的,目前高效的空间索引有R树、 R+树、格网索引法、BSP树、KDP 树、CELL树、四叉树等。
38
六、数据挖掘
“人们被数据淹没,但却饥饿于知识” 数据挖掘(Data Mining),又称为数
据库中的知识发现(Knowledge Discovery in Database, KDD),
关系数据库提供了Binay(二进制) 字段,变长的坐标数据采用该字段 管理
优点:一体化管理,数据的安全性、 一致性、完整性、并发控制性、数 据恢复较好
缺点:速度慢,没有解决空间对象
反向检索问题
16
4、对象-关系空间数据库管理系统
定义:关系数据库推出了空间数据 管理的模块,定义了操纵空间对象 的API函数,属性数据和坐标数据用 关系数据库统一管理
就是从大量数据中获取有效的、新颖的、 潜在有用的、最终可理解的模式的非平 凡过程,简单的说,数据挖掘就是从大 量数据中提取或“挖掘”知识。
39
空间数据挖掘(Spatial Data Mining) , 也称基于空间数据库的数据挖掘和知 识发现,是指从空间数据库中提取用 户感兴趣的空间模式与特征、空间与 非空间数据的普遍关系及其它一些隐 含在数据库中的普遍的数据特征。空 间数据挖掘是数据挖掘的一个新的分 支。
据结构。
26
GIS成功的关键取决于人们对现实世 界认识和模拟的正确程度。由于面 向对象的方法能够模拟和操纵复杂 对象,能够将人们对于地理空间的 认识正确映射到计算机内,面向对 象的开发思想正逐步成为GIS开发的 基本方式。
27
用面向对象的观点来看,可将地理空 间数据归结为空间实体、图层、地图 3个层次:
采用图层的方式来组织地理空间数据可以表达 地理空间数据的分布性:(1)对于地理位置上 分布的空间数据,可以按空间范围划分图层, 如全国铁路交通图,就可以由各个省市的铁路 交通图组成;(2)对于空间范围相同的空间数 据,可根据应用的需要(即专题)人为地划分 到不同的图层里,如武汉市交通图,按交通的 种类可分为一级,二级公路等图层。
面向对象的数据模型不成熟
没有面向对象空间数据库管理系统
20
第二节 空间数据库的研究内容
空间数据模型 空间数据的管理方式 空间数据查询语言 查询优化 索引 数据挖掘 ……
21
一、空间数据模型
空间数据模型就是寻求一种描述地 理实体的有效的数据表示方法,根 据应用要求建立实体的数据结构和 实体之间的关系以便于应用。
基于对象的模型以带有属性数据的 点、直线、曲线或区域来显示地理 数据:笛卡尔坐标系统及其上的算 法定义了向量系统中的点、直线和 曲线都可以用点来表示,即,可视 为一个有序点集。
基于对象的模型可以方便的存贮空
间拓扑关系,也适用于方位、距离
分析,相对于基于场的模型,要求
更少的存贮空间但要求更复杂的数
定义:属性数据用关系数据库管理, 坐标数据用文件管理,两者间建立 联系
优点:实现空间数据管理、速度较 快
缺点:数据的安全性、一致性、完 整性、并发控制性、数据恢复较差, 没有解决空间对象反向检索问题
14
图形信息 图形文件
属性信息 关系数据库
GIS应用文件
15
3、全关系型空间数据库管理系统
定义:属性数据和坐标数据用关系 数据库统一管理
经典的空间数据模型分为两大类: 基于场的和基于对象的模型。
22
1 基于场的模型
基于场的数据模型中,将信息空间 视为在空间结构上一定分布的集合 体,每一个空间分布被规则化成一 个从空间框架到空间属性的数据函 数。
23
基于场的模型使用矩阵或栅格的单元 来显示、定位和存贮地理数据:利用 一个唯一的参考坐标代表每个在矩阵 边缘或内部的单元或点,而每个单元 或点上被赋予离散的属性值;基于场 的模型中的分辨率依赖于单元或栅格 的大小,不同的场模型中的分辨率可 能有很大的差别。
24
GIS常常需要在不同的数据层存贮各 种不同的信息如植被、土质、水文 或其他信息等,不同的数据层对应 不同的地理属性。数字区域模型 DTM(Digital Terrain Model)和数 字高程模型DEM(Digital Elevation Model)是典型的基于场的空间数据 模型。
25
2 基于对象的模型
每个GIS应用都对应自己的空间和属性数 据文件,当多个应用需要访问的数据有相同 部分时,就将这些数据提取出来,存放在一 个新的公共数据文件中 。
12
图形信息 图形文件
属性信息 属性文件
GIS应用文件
数据文件1
数据文件1
数据文件n
GIS应用1
GIS应用2
GIS应用n
公共数据文件1
13
2、二元化空间数据库管理系统