大型空间地理信息数据库的解决方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专刊
中国测绘报/2003年/05月/20日/第003版/
大型空间地理信息数据库的解决方案
李莉
商瑶玲
在4月8日本报刊登的《构建大型空间基础地理信息数据库》一文中,介绍了在建设空间基础地理信息数据库中遇到的问题。本文针对该文提出的问题,提出大型空间地理信息数据库的解决方案,引入地理信息数据库模式和数据仓库的概念。
地理数据库模式
型。利用文件系统进行空间数据的管理,属性数据采用关系型数据库管理。这种模式通过文件系统和属性数据库中的关键字段作为关联项,实现整个数据库的管理操作。在这种模式中,空间信息基于文件系统的存储;而属性信息采用关系型表管理,通过用公共字段从外部实现图和描述信息的协同操作。此模式虽实现了利用关系型数据库和空间数据之间的关联,但由于从外部进行图形和属性的关联,大型数据库建设的局限性很大。
随着数据库和GIS技术的发展,全关系型数据库及其访问语言SQL已成为信息领域进行信息存储、操作及访问的标准。通过在全关系型数据库中加入空间数据字段的方法,将属性信息和空间图形数据统一存储于关系型数据库(RDBMS)的二维表中,它主要由数据库主体(关系型)和基于关系型数据库环境的空间数据引擎构成。此模式从内部管理整个空间及属性数据,从而保证了空间数据和属性数据的一致性、共享性、完整性、稳定性,提高了运行效率。
空间数据仓库
关系数据库、并行处理和分布式技术的飞速发展为数据仓库的概念奠定了基础。上世纪90年代初,W.H.Inmon提出数据仓库这个名词,他给数据仓库的定义是:数据仓库是集成的、面向主题的、用于决策支持的数据库的集合,其中每个数据单元都与时间相关。数据仓库中的数据应当是良构的、一致的、相对稳定的。数据仓库不同于数据库,数据库是一种通用平台,而数据仓库是一种概念,在此概念下进行的构造过程,称之为数据仓库处理。所以,数据仓库不是即时购买的现成产品,而是一个建立的过程。数据仓库的解决方案是支持异构环境,保护企业在RDBMS、硬件以及操作系统上已有的投资,而且满足企业在数据仓库上不断变化的要求。在数据库建设的过程中,需要完成数据仓库建模、数据转换传输、前端的数据展现、元数据管理、数据仓库管理、数据仓库系统和数据性能调整和过程管理等多项工作。数据仓库的这些特点,解决了多数据源、多种结构、多种时态、多种主题、多尺度的海量空间数据管理的种种需求。
构建空间数据仓库的过程
1.数据库设计主要是按照数据仓库方法设计数据库,确定数据库所支持的用户层次和不同目的访问数据库。
2.数据的清洗、加载是重要的工作环节,以利于提高数据的准确性,规范化关键字段的机制,实现不同环境的数据匹配集成,其中涉及复杂的数据变换处理。在数据向数据库加载过程中,进行数据的集聚、概括和清洗。
3.元数据设计是数据仓库设计的重要组成部分。元数据及其访问工具决定着用户利用数据仓库的能力。只有通过元数据的导航,用户才能找到所要数据,进行相关的分析。
4.处理海量数据的管理与调度办法。数据
仓库管理的数据量大多在千兆以上,采用大规模并行处理和性能优化技术,
以提高对数据库处理的效率。
5.为满足不同用户对数据仓库的需求,开
发前端数据表现工具或界面。
6.数据的管理与维护,应具有数据的自动安全、备份和数据迁移管理功能。
空间数据仓库是一个基于现有成熟的数据库系统的不断完善改进的创新过程。空间数据仓库除应具有传统RDBMS 共享性、完善性、数据独立性,还应面向主题集成,具有历史性、稳定性和时序性,其主题数据采用关系型数据库,基于万维网技术下分布式管理操作。
商品化的空间数据库软件分析现有的用于空间数据库管理的商品化软件,有建立在空间索引方式的、基于客户/服务器的和超级空间数据库引擎,它建立了一个连续的空间模型,将空间数据加载到关系型数据库中,实现RDBMS 对空间数据和属性数据的高效管理,可实现大量用户针对同一数据的同时操作。国内、国外GIS 公司都投入了相当的精力在利用RDBMS 实现多种类型空间数据管理方面进行研究。
目前具有一定影响的软件有:以空间中间件结构实现空间数据库管理的系统有ESRI 公司的ArcSDE 和Map Info 公司的Spatial ware 和直接与关系型数据库挂接的Intergraph 公司的G eoMedia Professional 。
ESRI 公司在Arc GIS 8系列中引入了地理数据库(G eodatabase )的概念,其实质是引入了
一个面向海量空间数据管理的空间数据模型,ArcSDE 采用了中间件技术。中间件实现了对
于不同操作系统、不同数据库、不同应用软件平台间的数据和信息的沟通和兼容。Oracle Spa 2tia 与ArcSDE 的定位不同。前者是在RDBMS 模型的基础上实现了空间数据模型的扩展,是提供了对于空间点、线、面空间要素的存储与检索。后者则是定位于空间数据的管理和应用,在提供以上对于空间基本要素的基本管理功能的基础上,还提供面向空间对象的注记、平面拓扑、线性拓扑、栅格(影像)数据、三维表面、网络、CAD 数据等GIS 中所特有的数据类型的管理;面向数据时态版本管理的工作流和长事务处理机制。同时通过异步缓冲、空间索引等方式解决对于空间数据的多用户高效并发访问的问题。在空间数据的备份方面,提供指定空间数据对象的备份恢复和整体空间数据库的备份恢复。
数据仓库技术使人们从一个全新的角度认识地理信息系统的重要性,为人们共享多维时空的信息展现了光明的前景,使我们充分认识地理信息集成产生的巨大价值。担任何技术一旦被当成灵丹妙药,就有可能走入误区,让我们紧密关注数据仓库技术的发展,及时将这一技术引入到空间海量地理信息的应用领域中来。