GIS概论 第四章 空间数据库

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章空间数据库

第一节数据库概述

数据库技术是60年代初开始发展起来的一门数据管理自动化的综合性新技术。数据库的应用领域相当广泛,从一般事务处理,到各种专门化数据的存储与管理,都可以建立不同类型的数据库。建立数据库不仅仅是为了保存数据,扩展人的记忆,而主要是为了帮助人们去管理和控制与这些数据相关联的事物。地理信息系统中的数据库就是一种专门化的数据库,由于这类数据库具有明显的空间特征,所以有人把它称为空间数据库,空间数据库的理论与方法是地理信息系统的核心问题。

一、数据库的定义

数据库就是为了一定的目的,在计算机系统中以特定的结构组织、存储和应用的相关联的数据集合。

计算机对数据的管理经过了三个阶段—最早的程序管理阶段,后来的文件管理阶段,现在的数据库管理阶段。其中,数据库是数据管理的高级阶段,它与传统的数据管理相比有许多明显的差别,其中主要的有两点:一是数据独立于应用程序而集中管理,实现了数据共享,减少了数据冗余,提高了数据的效益;二是在数据间建立了联系,从而使数据库能反映出现实世界中信息的联系。

地理信息系统的数据库(以下称为空间数据库)是某区域内关于一定地理要素特征的数据集合。空间数据库与一般数据库相比,具有以下特点:

(1) 数据量特别大,地理系统是一个复杂的综合体,要用数据来描述各种地理要素,尤其是要素的空间位置,其数据量往往大得惊人。即使是一个很小区域的数据库也是如此。

(2) 不仅有地理要素的属性数据(与一般数据库中的数据性质相似),还有大量的空间数据,即描述地理要素空间分布位置的数据,并且这两种数据之间具有不可分割的联系。

(3) 数据应用的面相当广,如地理研究、环境保护、土地利用与规划、资源开发、生态环境、市政管理、道路建设等等。

上述特点,尤其是第二点,决定了在建立空间数据库时,一方面应该遵循和应用通用数据库的原理和方法,另一方面又必须采取一些特殊的技术和方法来解决其它数据库所没有的管理空间数据的问题。

二、数据库的主要特征

数据库方法与文件管理方法相比,具有更强的数据管理能力。数据库具有以下主要特征:

1、数据集中控制特征

在文件管理方法中,文件是分散的,每个用户或每种处理都有各自的文件,不同的用户或处理的文件一般是没有联系的,因而就不能为多用户共享,也不能按照统一的方法来控制、维护和管理。数据库很好地克服了这一缺点,数据库集中控制和管理有关数据,以保证不同用户和应用可以共享数据。数据集中并不是把若干文件“拼凑”在一起,而是要把数据“集成”。因此,数据库的内容和结构必须合理,才能满足众多用户的要求。

2、数据冗余度小的特征

冗余是指数据的重复存储。在文件方式中,数据冗余太。冗余数据的存在有两个缺点:一是增加了存储空间;二是易出现数据不一致。设计数据库的主要任务之一是识别冗余数据,并确定是否能够消除。在目前情况下,即使数据库方法也不能完全消除冗余数据。有时,为了提高数据处理效率,也应该有一定程度的数据冗余。但是,在数据库中应该严格控制数据的冗余度。在有冗余的情况下,数据更新、修改时,必须保证数据库内容的一致性。

3、数据独立性特征

数据独立是数据库的关键性要求。数据独立是指数据库中的数据与应用程序相互独立,即应用程序不因数据性质的改变而改变;数据的性质也不因应用程序的改变而改变。数据独立分为两级:物理级和逻辑级。物理独立是指数据的物理结构变化不影响数据的逻辑结构;逻辑独立意味着数据库的逻辑结构的改变不影响应用程序。但是,逻辑结构的改变必然影响到数据的物理结构。目前,数据逻辑独立还没有能完全实观。

4、复杂的数据模型数据模型能够表示现实世界中各种各样的数据组织以及数据间的联系。复杂的数据模型是实现数据集中控制、减少数据冗余的前提和保证。采用数据模型是数据库方法与文件方式的一个本质差别。

数据库常用的数据模型有三种:层次模型,网络模型和关系模型。因此,根据使用的模型,可以把数据库分成:层次型数据库,网络型数据库和关系型数据库。

5、数据保护特征

数据保护对数据库来说是至关重要的,一旦数据库中的数据遭到破坏,就会影响数据库的功能,甚至使整个数据库失去作用、数据保护主要包括四个方面的内容:安全性控制、完整性控制、并发控制、故障的发现和恢复。

三、数据库的系统结构

数据库是一个复杂的系统。数据库的基本结构可以分成三个层次:物理级、概念级和用

户级。

1、物理级:数据库最内的一层。它是物理设备上实际存储的数据集合(物理数据库)。它是由物理模式(也称内部模式)描述的。

2、概念级:数据库的逻辑表示,包括每个数据的逻辑定义以及数据间的逻辑联系。它是由概念模式定义的,这一级也被称为概念模型。

3、用户级:用户所使用的数据库,是一个或几个特定用户所使用的数据集合(外部模型),是概念模型的逻辑子集。它由外部模式定义。

四、数据组织方式

数据是现实世界中信息的裁体,是信息的具体表达形式。为了表达有意义的信息内容,数据必须按照一定的方式进行组织和存储。数据库中的数据组织一般可以分为四级:数据项、记录、文件和数据库。

1、数据项:是可以定义数据的最小单位,也叫元素、基本项、字段等。数据项与现实世界实体的属性相对应,数据项有一定的取值范围,称为域。域以外的任何值对该数据项都是无意义的。如表示月份的数据项的域是1—12,13就是无意义的值。每个数据项都有一个名称,称为数据项目。数据项的值可以是数值的、字母的、汉字的等形式。数据项的物理特点在于它具有确定的物理长度,一般用字节数表示。

几个数据项可以组合,构成组合数据项。如“日期”可以由日、月、年三个数据项组合而成。组合数据项也有自己的名字,可以作为一个整体看待。

2、记录:由若干相关联的数据项组成。记录是应用程序输入—输出的逻辑单位。对大多数据库系统,记录是处理和存储信息的基本单位。记录是关于一个实体的数据总和,构成该记录的数据项表示实体的若干属性。

记录有“型”和“值”的区别。“型”是同类记录的框架,它定义记录,“值”是记录反映实体的内容。

为了唯一标识每个记录,就必须有记录标识符,也叫关键字。记录标识符一般由记录中的第一个数据项担任,唯一标识记录的关键字称主关键字,其它标识记录的关键字称为辅关键字。

3、文件:文件是一给定类型的(逻辑)记录的全部具体值的集合。文件用文件名称标识。文件根据记录的组织方式和存取方法可以分为:顺序文件、索引文件、直接文件和倒排文件等等。

4、数据库:是比文件更大的数据组织。数据库是具有特定联系的数据的集合,也可以看成是具有特定联系的多种类型的记录的集合。数据库的内部构造是文件的集合,这些文件

相关文档
最新文档