空间数据库学习报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
国内外空间数据库技术现状、存在问题与发
展趋势
学号:20151389012 姓名:苏逸
摘要:随着计算机技术日益成熟,以及“数字城市”理念逐步深入人心,空间数据库技术在20世纪60年代后迅速发展。本文论述了国内外空间数据库技术的发展现状,罗列了一些尚存问题,展望了空间数据库的发展方向,希望能对笔者的空间数据库课程的学习打下认知基石。
关键词:空间数据库技术
一、国内外空间数据库现状
1.1空间数据库管理模式发展历程
管理模式经历了纯文件模式、文件结合关系型数据库的管理模式、全关系型数据库管理模式和面向对象的数据库管理模式四个阶段。
1.2当下空间数据库主流类型
1.2.1混合模型数据库
所谓混合模型数据库其基本思想是将地理空间信息按照专题特性进行分层,每个图层由一类相同或相似的空间实体构成,如在一个城市中,道路、旅游景点、大专院校等不同特性的空间实体构成不同专题的图层,然后对这些图层进行分层存储和处理。对于图层中的每个空间实体,其属性数据被分为两部分: 空间属性和非空间属性,空间属性存储在文件系统中,非空间属性则存储在关系数据库中,两者通过一个全局唯一的标识符进行关联。其示意图如下图所示。
图1
1.2.2 对象-关系型数据库
近年来,结合关系数据库和面向对象思想的对象—关系数据模型渐渐成为GIS应用中构建数据库系统的主流技术。由于这种技术更为逼真地模拟了现实世界中空间实体的结构和相互关系,并且采用单一系统进行存储, 因而消除了传统混合模型的缺点, 更有利于对空间数据进行管理和维护。
该类型数据库有如下优点:
①采用对象-关系数据模型的商业化数据库产品技术上已经比较成熟,这就使得采用对象-关系模型构造的数据模型可以直接在一个对象-关系数据库中进行存储、管理,并且由于采用了符合行业标准的开放式数据接口,使得数据的共享更加方便有效;
②由于采用了单独的数据库进行数据管理, 使得对空间数据进行操作更加简单和方便,效率也大大提高;
③通过采用开放式的SQL平台以及大量空间操作函数的使用,能够开发出功能更加强大的应用系统,扩展了GIS 应用的范围[1]。
1.2 空间数据库技术现状
近些年,空间数据库技术在索引、数据更新、多源数据获取方面获得了一些进展,以下举出例子。
1.2.1空间数据库索引技术[2]
(1)空间数据库索引技术的定义
数据索引是指在磁盘上组织数据记录的一种数据结构,是对存储在存储介质上的数据位置信息的描述。它用于优化某类数据检索的操作,是提高系统对数据获取效率的一种重要手段。
(2)空间数据库索引技术分类[2]
①简单格网空间索引
格网空间索引的原理简单,即把目标空间实体集合所在的空间范围划分成一系列大小相同的格。基于格网索引的查找思路也较简单,在数据分布较均匀的情况下,查询效率较高。但格网的大小直接影响了索引表的大小,格网太小,索引表会急剧膨胀,维护索引表本身的花费增加,查询效率随之下降;反之,落在一个格内的空间实体可能会过多;因此格的大小严重制约着查询效率的提高。
②K-D 树空间索引
K-D 树是早期用于索引多维空间数据的数据结构之一。 K-D 树的每层都把空间划分为两个部分,沿着树的根结点进行一维划分;依次划分下一层结点,尽量保证左右子树中的结点数目均衡,当结点中包含的点数少于叶子结点中包含的最大点数时停止划分。为了平衡K-D 树的深度,可结合 B 树来得到K-D-B树索引结构,但此类索引树对于占据一定空间范围的空间实体而言(如线和多边形),构造空间索引仍然不方便。因为当使用数据库表构造K-D 树的索引表时,树型结构的递归层次深,导致查询效率降低。
③R 树空间索引
R树是B树在多维空间上的自然扩展,是由Guttman提出的最早支持多维空间存取的方法之一。R树是一种高度平衡树,可控制树的深度,采用对象的最小外包矩形(MBR)来近似表示空间实体。R 树有如下几条特性:(1) 叶结点中存储该结点对应的空间要素的MBR 和空间要素标识;(2)MBR 二维上是矩形,三维上是长方体,以此类推到高维空间;(3)非叶结
点存放其子女结点集合的整体外包络矩形和指向其子女结点的指针。 R 树是一种动态索引结构,其查询、插入、删除可同时进行,而且不需要定期的对树结构重新组织。 R 树适合于多维空间查询,不过由于空间数据分布的偶然性,使得各层节点 MBR 容易重叠,导致实际执行空间查询时,会产生多个查询分支,很大程度上降低了空间查询的效率。在最坏的情形下,一个空间查询会退化成线性搜索。若使用外部数据库来描述 R 树,在缺乏特定的快速物理数据块访问接口情况下,效率也会大打折扣。
④四叉树空间索引
在基于固定网格划分的四叉树空间索引机制中,工作空间在X、Y 方向上进行2N 等分,形成2N×2N 的网格,并以此建立 N 级四叉树。在四叉树中,空间要素标识记录在其外包络矩形所覆盖的每一个叶结点中。但当同一父亲的四个兄弟结点都要记录该空间要素标识时,则只将该空间要素标识记录在该父亲结点上,并按这一规则向上层推进。层次型的树状结构并不适合使用数据库表来直接描述,可通过对四叉树的各层节点进行编码,来反映四叉树的层次结构。四叉树索引在内存中的层次型树状结构,其查询效率较高。
(3)空间数据库索引技术的应用[3]
①Oracle Spatial的空间数据索引可以通过用户定义的功能和索引方式,对用户定义的数据类型进行存储、恢复和操作,弥补了以往关系数据库管理的不足;
②IBM空间数据刀片(Spatial DataBlade):IBM DB2 Spatial Extender提供基于网格的三层空间索引,该索引技术是基于传统的分层B树索引形成的;
③MySQL空间数据扩展:MySQL Spatial Extensions用自己的Geometry数据类型存储空间数据,符合和遵循OpenGIS中的Geometry模型;
④ERSI空间数据引擎:这是一种处于应用程序和数据库管理系统之间的中间件技术,在用户和异构空间数据库之间提供了一个开放接口。
1.2.2数据更新技术[4]
(1)国内外空间数据库更新技术发展动态
①国外
美国地质调查局测绘部从 2001年开始计划建立近实时数据更新机制,将数据的现势性保持在几天或数月之内。英国军械测量局根据其实际情况,建立了推扫式和散点式相结合的更新机制。日本采用基于栅格的更新方法,先更新1:2. 5万地形图,再用1:2. 5万图更新1 ∶ 5 万图,城市地区每3年更新一次,郊区每5 年更新一次,山区每10年更新一次。加拿大测绘署地形信息中心2001年启动了一项利用Landsat-7 影像更新 1 ∶ 5 万地形数据的计划,每年使用Landsat-7影像更新1 000幅以上地形数据。
②国内
我国一些经济发展较快的省、市在建立更新机制、利用遥感影像获取变化信息、历史数据存取、增量更新、多尺度级联更新等方面进行了许多有益的尝试,并取得一定成效。浙江