GIS概论 第四章 空间数据库
4地理信息系统空间数据库
4地理信息系统空间数据库地理信息系统(GIS)在当今的社会发展中扮演着至关重要的角色,而空间数据库则是地理信息系统的核心组成部分。
它就像是一个巨大的数字仓库,专门用来存储和管理与地理空间相关的各种数据。
那么,什么是地理信息系统空间数据库呢?简单来说,它是一种用于存储、管理和查询地理空间数据的数据库系统。
这些数据包括但不限于地理位置、地形地貌、土地利用、道路网络、水系分布等等。
与传统的数据库相比,空间数据库具有独特的特点和功能,能够处理和分析空间位置关系,为地理信息系统的应用提供强大的数据支持。
空间数据库中的数据类型多种多样。
有点数据,比如一个城市的坐标点;有线数据,例如一条河流的走向;还有面数据,像是一个湖泊的范围。
此外,还有栅格数据和矢量数据之分。
栅格数据就像是一幅由像素组成的图片,每个像素代表一个特定的地理区域和属性值。
矢量数据则是通过点、线、面的坐标来精确描述地理实体的形状和位置。
为了有效地管理这些复杂的数据,空间数据库采用了一系列特殊的技术和结构。
其中,索引技术是非常关键的。
它就像是一本书的目录,能够帮助我们快速找到所需的数据。
常见的空间索引包括 R 树、四叉树等。
通过这些索引结构,空间数据库能够在大量的数据中迅速定位到与查询条件相关的部分,大大提高了数据检索的效率。
空间数据库的存储方式也有讲究。
它不仅要考虑数据的存储空间,还要保证数据的读写速度和完整性。
在存储数据时,需要根据数据的类型、规模和使用频率等因素,选择合适的存储介质和存储策略。
例如,对于经常访问的热点数据,可以采用高速缓存来提高访问速度;对于大规模的历史数据,可以采用压缩存储来节省空间。
数据的质量对于空间数据库来说至关重要。
不准确、不完整或不一致的数据可能会导致错误的分析结果和决策。
因此,在数据采集、录入和更新的过程中,需要严格遵循相关的标准和规范,进行数据质量控制和检查。
同时,要建立有效的数据更新机制,确保数据库中的数据能够及时反映现实世界的变化。
《地理信息技术应用》最新备课课件:4-GIS空间数据库
1)采用标准DBMS存储空间数据的主要问题 ➢GIS中空间数据记录是变长的,且要存储和维护空间 数据拓扑关系; ➢DBMS一般都难以实现对空间数据的关联、连通、包 含、叠加等基本操作。 ➢GIS需要一些复杂的图形功能,一般的DBMS不能支 持;
➢地理信息是复杂的,单个地理实体的表达需要多个文 件、多条记录、或许包括大地网、特征坐标、拓扑关系、 空间特征量测值、属性数据的关键字以及非空间专题属 性等; ➢具有高度内部联系的GIS数据记录需要更复杂的安全 性维护系统。
存储在计算机环境中的相互关联的数据集
在这样的环境中,数据是永久的,也就是说 它可以幸免于软件和硬件的问题(除非是磁盘 崩溃)。
大数据卷和持久性是数据库最大的两个特点。
一个简单的数据库系统环境
Application programs/queries
Software to process queries Software to access stored data
④ 重新设计一个具有空间数据和属性数据管理和分析 功能的数据库系统。
2.数据库的数据与文件组织分级
数据项 数据项是可以定义数据的最小单位,也叫元素、基本项、 字段等,数据项与现实世界实体的属性相对应,数据项 有一定的取值范围,称为域,域以外的任何值对该数据 项都是无意义的。 记录 记录是由若干相关联的数据项组成,是处理和存储信息 的基本单位,是关于一个实体的数据总和,构成该记录 的数据项表示实体的若干属性。为了唯一标识每个记录, 就必须有记录标识符,也叫关键字。记录标识符一般由 记录中的第一个数据项担任,唯一标识记录的关键字称 主关键字,其它标识记录的关键字称为辅关键字。
DBMS
Stored database
Stored database definition metadata
地理信息系统GIS 第四章 GIS空间数据库
1. 程序管理阶段 —20世纪50年代
数据面向应用,程序间不能实现数据共享。
程序1 程序2
2. 文件管理阶段 —20世纪60年代
数据1 数据2
• 由文件系统管理数据,应用程序与数据 的逻辑结构有关联;
• 应用程序直接访问所使用的数据文件;
• 数据共享性、独立性差。
程序1 程序2 程序3
数据库的维护
数据库的通讯
Geographic Information System
应用系统 DBMS OS 硬件
DOBceManS在Un信iv息ers系ity统o中f C的hi位na置
3.数据库应用系统(DBS)
满足特定的用户数据处理 需求而建立起来的,具有数据 库访问功能的应用软件,它提 供给用户一个访问和操作特定
径 类:一组对象的抽象描述。有继承性
Geographic Information System
Ocean University of China
第三节GIS数据库逻辑设计
主要包括五个方面的内容: ●数据源的选择; ●各种数据集的评价; ●各数据集的设计; ●数据字典的产生; ●数据库具体存储和管理结构的设计。
点线查询:如某个结点由哪些线相交而成。
Geographic Information System
Ocean University of China
面线查询:如某个多边形的边界有哪些线。
面点查询:如某个多边形内有哪些点状地物。
线面查询:如某条线经过(穿过)的多边形有哪些,某 条链的左、右多边形是哪些。
线线查询:如与某条河流相连的支流有哪些,某条道路 跨过哪些河流。
线点查询:如某条道路上有哪些桥梁,某条输电线上有 哪些变电站。
GIS04
数据间的逻辑联系
主要是指记录与记录之间的联系: 主要是指记录与记录之间的联系: (1: 1、一对一的联系 (1:1) 2、一对多的联系 (1:N) (1: (M: 2006年全球数据库管理系统排名
IDC数据显示 2006年 数据显示, 据权威调研机构 IDC数据显示,2006年 全球数据库市场规模达到了165亿美元。 165亿美元 全球数据库市场规模达到了165亿美元。 其中,甲骨文(Oracle)的销售额为73 (Oracle)的销售额为73亿 其中,甲骨文(Oracle)的销售额为73亿 美元,占到了44.4% 排名首位。 44.4%, 美元,占到了44.4%,排名首位。IBM 位居第二, DB2数据库的销售额为 数据库的销售额为35 位居第二,其DB2数据库的销售额为35 亿美元,同比增长11.9% 11.9%。 亿美元,同比增长11.9%。略低于甲骨 文的14.7% 以及业内14.3% 14.7%, 14.3%的平均水 文的14.7%,以及业内14.3%的平均水 微软排名第三,营收额达到了31 31亿 平。微软排名第三,营收额达到了31亿 美元,涨幅高达25% 25%, 美元,涨幅高达25%,市场份额为 18.6%。此外,Sybase和 18.6%。此外,Sybase和NCR Teradata分居第四和第五位 分居第四和第五位。 Teradata分居第四和第五位。
(1)层次数据结构 如图所示
(2)层次数据结构的数据存取 在层次数据库中,地理客体的存取有两法: ●树遍历法 这种存取方法是以“ 这种存取方法是以“树”的遍历顺序搜索为基础 首先搜索双亲节点,然后搜索其子女节点, 的,首先搜索双亲节点,然后搜索其子女节点,进行所 遍历”检索, 谓“ 遍历”检索,如某个双亲节点拥有多个子女节 则先检索这一双亲节点拥有的多个子女节点, 点, 则先检索这一双亲节点拥有的多个子女节点, 然后再检索与此双亲节点在同一级的其他双亲节点 深度优先) (深度优先) ;或者依次按照双亲与子女节点的层 次关系逐层遍历(广度优先) 次关系逐层遍历(广度优先)。
地理信息系统概论重点讲义(4)
重点一空间数据库模型1.空间数据库空间数据库是地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和,一般是以一系列特定结构的文件的形式组织在存储介质之上的。
2.空间数据库模型空间数据库模型是关于现实世界中空间实体及其相互间联系的概念,为描述空间数据组织和设计空间数据库模式提供了基本的方法。
一般而言,GIS 空间数据模库型由概念数据库模型、逻辑数据库模型和物理数据库模型三个有机联系的层次所组成。
3.数据库概念模型:( conceptual model)概念模型为了把现实世界中的具体事物抽象、组织为某一数据库管理系统支持的数据模型。
人们常常首先将现实世界抽象为信息世界,然后将信息世界转换为机器世界。
也就是说,首先把现实世界中的客观对象抽象为某一种信息结构,这种信息结构并不依赖于具体的计算机系统,不是某一个数据库管理系统(DBMS)支持的数据模型,而是概念级的模型,称为概念模型。
4.逻辑模型逻辑模型,是指数据的逻辑结构。
在数据库中,逻辑模型有关系、网状、层次,可以清晰表示个个关系。
在管理信息系统中,逻辑模型:是着重用逻辑的过程或主要的业务来描述对象系统,描述系统要“做什么”,或者说具有哪些功能。
1)关系数据模型是把数据的逻辑结构归结为满足一定条件的二维表格,每个二维表格称为一个关系。
关系模型以记录组或数据表的形式组织数据,便于利用各种地理实体与属性之间的关系进行存储和变换,不分层也无指针,是建立空间数据和属性数据之间关系的一种非常有效的数据组织方法。
2)关系数据库:是建立在关系数据库模型基础上的数据库,借助于集合代数等概念和方法来处理数据库中的数据。
目前主流的关系数据库有oracle 、SQL、access 、db2 等。
3)对象—关系管理模式是指在关系型数据库中扩展,通过定义一系列操作空间对象(如点、线、面)的API 函数,来直接存储和管理非结构化的空间数据的空间数据库管理模式。
5.物理模型,在管理信息系统中,物理模型:描述的是对象系统“如何做”、“如何实现”系统的物理过程。
地理信息系统空间数据库
三、关系模型
用二维表来表达实体和实体之间的联系。使得设 计、操纵较为容易。
四、三种传统数据模型的比较
§4.3 空间数据库概念模型设计 —语义模型和面向对象模型
• 传统数据模型的弱点: (1)以记录为基础的结构不能很好面向用户
传统模型-记录;现实世界-事务、实体。有时不对应。
(2)不能以自然对象(Object):实体的抽象(基本元素),封装了数据和操作集 的实体。
• 消息(Message):请求 对象执行某一操作或回答 某些信息的要求。
• 类:描述一组对象的共同特征。类和实体是抽象与具 体的关系。
3. 对象的性质
• 封装:
• 继承:某类对象可以自然地拥有另一类对象的某些特 征和功能。不必重复实现,减少代码。
2. 概念模型(空间特征,关系描述)
(1)空间特征:点、线、面、体四种基本类型; (2)实体在空间、时间、属性三方面存在联系: • 空间联系:空间位置、分布、关系、运动等; • 时间联系:客体随时间变化,可构成时态数据库; • 属性关系:属性多级分类中的从属关系、聚类关系、相
关关系。
3. 空间数据库的数据模型设计
层次、网状显式地描述关系,但不自然;关系模型联系隐 含,必须检索全部记录才能确定。
(3)语义贫乏
用单一结构描述描述“交互”、“从属”、“构成”等众 多联系,语义上无法区别。
(4)数据类型太少
只提供常用的简单数据类型,不能自定义新的数据类型。
一、语义数据模型
-实体联系模型(E –R模型)
• 提供三种语义概念:
(1)实体:客观存在的起独立作用的客体。 (2)联系:实体间的相互作用或对应关
系:1:1,1:N,M:N, (3)属性:对实体和联系特征的描述。
GIS原理--地理空间数据库 ppt课件
3.1 语义数据模型 语义数据模型的结构是由若干种抽 象所组成,用这些抽象来描述客体的基 本语义特性,再根据语义模型结构规则 把这些抽象有机地组织起来。 最常用的语义模型之一是实体联系模 型(E—R模型),由实体、联系和属性 构成。
采用E—R模型进行数据库的概 念设计可以分为以下三个步骤: (1)设计局部的E—R模型 (2)设计全局的E—R模型 (3)全局E—R模型的优化
(1)空间数据库 地理信息系统在计算机物理存 储介质上存储的地理空间数据的总和, 一般是以一系列特定结构的文件的形 式组织在存储介质之上的。
(2)空间数据库管理系统 指能够对物理介质上存储的地理 空间数据进行语义和逻辑上的定义, 提供必需的空间数据查询检索和存取 功能,以及能够对空间数据进行有效 的维护和更新的一套软件系统。一般 建立在常规数据库管理系统之上。
第四章 地理空间数据库 §1 空间数据库概述 空间数据库是地理信息系统中空 间数据的存储场所。 用户在决策过程中,通过访问空间 数据库获得空间数据;在决策过程完成 后再将决策结果存储到空间数据库中。
空间数据库的布局和存取能力 对地理信息系统功能的实现和工作 的效率影响极大。
1.1 空间数据库的概念 统进行扩展加入一定量的空间数据 存储与管理功能。(如Oracle)。 方法二,在常规数据库管理系统 之上添加一层空间数据库引擎,以获 得常规数据库管理系统之外的的空间 数据存储与管理功能。(如SDE)
(3)空间数据库应用系统 由空间分析模型和应用模型 构成。
数据库系统的结构
4.4 空间数据库的物理设计
(1)存储记录的格式设计 (2)存储方法设计 (3)访问方法设计 (4)完整性和安全性的考虑 (5)应用设计 (6)形成物理设计说明书
GIS第四章地理信息系统空间数据库
三、 面向对象的数据模型 1、基本概念
对象:对现实世界中一个事物的抽象或模型化表达。自身状 态+内在功能(客体数据+对数据的操作)。一个对象具有一 个唯一的名称标识。 类:多个对象共同特征的抽象概括。 实例:某类的一个具体对象。 消息:对象之间相互请求或相互协作的唯一途经和通信形式。 方法:对象收到消息后应采取的动作系列的描述。
(1)空间数据库存储系统 空间数据库存储系统是GIS在计算机物理存储介质上存
储的与应用相关的地理空间数据的总和。 一般以一系列特定结构的文件形式存储在硬盘、光盘等
介质上。
(2)空间数据库管理系统 指能够对介质上存储的地理空间数据进行语义和逻辑
上的定义,提供空间数据查询、检索、存取、维护和更新 功能的软件系统。
2空间数据库设计的原则尽量减少空间数据存储的冗余量提供稳定的空间数据结构满足用户对空间数据及时访问的需求并能高效地提供用户所需的空间数据查询结果在数据元素间维持复杂的联系以反映空间数据的复杂性支持多种多样的决策需要具有较强的应用适用性装入试验性的空间数据对应用程序进行测试以确认其功能和性能是否满足设计要求并检查对数据库空间的占有情况装入实际的空间数据即数据库的加载建立起实际运行的空间数据库知识结构一什么传统数据模型
第三节 空间数据库逻辑模型设计
一、关系数据模型
在关系模型中,数据的逻辑结构为满足一定条件的二 维表,表具有固定的列数和任意的行数,在数学上称为 “关系”。
二维表是同类实体的各种属性的集合,每个实体对应 于表中的一行,相当于通常的一个记录;表中的列表示属 性,相当于通常记录中的一个数据项。这种满足一定条件 的规范化关系的集合,就构成了关系模型。
文件管理:20世纪50年代后期至60年代中期。计算机 用于科学计算,也用于数据管理。数据以文件形式长期保 存在磁盘上。但文件之间相互独立、缺乏联系。数据重复 产生冗余。文件建立、存取、查询、插入、删除、修改等 操作都要用程序实现。
地理信息系统空间数据库
转换
现实世界
人类的认识、抽象
机器世界 DBMS支持的数据模型
现实世界中客观实体的抽象过程
信息世界的 概念模型
1. 空间数据库的设计过程
这一过程一般需要两步 ①人类对客体的认识、抽象,建立概念模型。 ②将概念模型转换为计算机能够接受的形式,即数据模型。
就是将地理空间客体按一定的组织形式,在数据库系统中加以表达的过程。
把用户的需求加以解释,用概念模型表达出来,具体任务包括: 1)数据库的宏观定义 指对数据库比例尺、地图投影和坐标系统的定义。 2)数据库的特征设计 对于各种地理特征有关的属性数据中以什么几何形式表达进行设计。 3)数据库表格及其关系的设计表达 对与地理特征有关的属性数据在数据库中表达方式的设计。
通过实体变化过程来反映。
实体间的属性主要体现为属性多级分类体系中 的从属关系、聚类关系和相关关系
第一节 空间数据库概述
第一节 空间数据库概述
空间数据库的数据模型设计
数据模型建立的目的 揭示空间实体的本质特征,并对其进行抽象化,使之转化为计算机能够接受和处理的数据形式。 能够对空间数据进行统一管理 帮助用户查询、检索、增加删除和修改数据 保障空间数据的独立性、完整性、和安全性
第一节 空间数据库概述
(2)数据模型
层 次 模 型 网 状 模 型 关 系 模 型 面 向 对 象 模 型 常用数据模型种类
尽量减少空间数据存储冗余; 提供稳定的空间数据结构,在用户的需要改变时,数据结构能够做出相应的变化; 满足用户对空间数据及时访问的需求,高效提供用户所需的空间数据查询结果; 在空间元素间维持复杂的联系,反映空间数据的复杂性; 支持多种决策需要,具有较强的应用适应性。
第二节 传统的数据模型
第四章 GIS空间数据库gis
另外,消息还分公有消息和私有消息,
对象之间发送的消息,叫公有消息,对象自
己向本身发送的消息,叫私有消息。
(5) 协 议:
协议是一个对象对外服务的说明, 它告知一个对象可以为外界做什么; 它是由一个对象能够接受并且愿意接 受的所有消息构成的对外接口。 外界对象能够并且只能向该对象 发送协议中所提供的消息,请求该对 象服务。
3、面向对象的特性
3)多态性:
是指同一对象被不同对象接收时,可 解释为不同的含义。 同一消息,对不同对象,功能不同。 功能重载(参数)——多态,简化消息, 但功能不减。
4、面向对象模型的核心技术:
---分类,概括,聚集,联合
1)分 类: 分类是把一组具有相同属性结构和 操作方法的对象归纳或映射为一个公 共类的过程。 对象和类的关系是“实例”的关 系;(instance-of)。
过程,也就是GIS中空间实体建立 数据模型的过程。
数据模型是现实世界的规格化的说明。 具体地说,数据库的数据结构、操作集合和 完整性约束规则集合组成了数据库的数据模 型。 空间数据模型是对空间实体进行描述和 表达的手段,使之能反映实体的某些结构特 性和行为功能,是衡量GIS功能强弱与优劣 的主要因素之一。 从这一角度来说,空间数据库的设计最终 可以归结为空间数据库模型的设计。
江、黄河等。真正抽象的河流不存在,只存
在河流的例子。
类描述了实例的共有形式(属性等)以及作
用于类中对象上的操作(方法)。每个对象都是 这个类的一个实例,对象与类的关系是 instance—of的关系。类——申请实例—— 成为具体对象。
(4)方法和消息:
对同一个类所定义的所有操作称为方法, 对类的操作是由方法来具体实现的。消息是 对象之间的请求与协作。如鼠标点就是消息; 点某按钮,就是对按钮提出请求。
(GIS)第四章-空间数据库
• 类:是对多个相似对象共同特性的描述。共享同一属性和方法
集的所有对象的集合构成类。 • 实例:是由一特定类描述的具体对象。
• 类和实例之间是抽象和具体的关系,实例是某类的一个具体对
象,类是多个实例的抽象综合。
(二)继承及类之间的层次关系
继承:是一种现实世界中对象之间独特的关系,它使得某类对象 可以得到另一类对象的特征和能力。如饭店子类从建筑物类继承地址、 建筑日期等属性。
ORM图可以表达子类型的关系。
示,强制性约束用圆点表示。
第三节 空间数据库逻辑模型设计
数据库逻辑设计的任务是把数据库概念设计阶段产生的概念数据库 模式变换为逻辑数据库模式,即适应于某种特定数据库管理系统所支持 的逻辑模型。
传统的数据模型 层次模型
网状模型
关系模型
一、层次模型
• • 概念:层次模型是以记录类型为结点的有向树或森林,能 很好地表达1:N的关系。 主要特点:
的约束来表达业务规则。
ORM图是用图形符号的形式表现对象角色建模的结果。它用对象类 型和谓词来表ቤተ መጻሕፍቲ ባይዱ一个事实。
Spatial_Obj
Polygon
Polygon_ID
具有/属于
对象类型:表示实际对象或概念的类型,必须以大写字母开头的英文
名词的形式出现,必须具有唯一的定义,且在模型范围内只能被定义一次。 对象类型有两类:
•
较强的应用适应性
设计技术
数据设计者使用的设计工具,其中包括各种算法、文本化方法、用
户组织的图形表示法、各种转化规则、数据库定义的方法及编程技 术。
设计技术分为两类:数据分析技术和技术设计技术。
四、空间数据库的实现和维护
4GIS空间数据库
第四章GIS空间数据库第一节空间数据库概述一、数据库概念数据库有三个基本部分组成:⑴ 数据集(库):按一定结构组织起来的相关数据的集合,既包括数据与数据间的联系。
⑵ 物理存储介质:计算机的外存与内存储器,外存存储数据,内存存储操作系统与数据库管理系统,并有一定数量的缓冲区,用于数据处理。
⑶ 数据库软件:核心是数据库管理系统(DBMS),对数据进行建立、定义、管理与维护,还有数据库应用系统,通过空间分析模型对数据进行分析与决策。
二、数据库特征⑴ 数据集中控制维护管理。
⑵数据独立于应用程序。
⑶ 数据共享,多用户可同时存续数据,提高使用效率。
⑷ 减少数据冗余,提高数据的一致性。
⑸ 数据结构化,数据按一定结构形式构成,数据间具有联系。
⑹ 数据保护功能,具有使用权限,确保数据安全。
第二节数据模型一、关系模型关系模型是以数学理论为基础构建的数据模型,它把复杂的数据结构归纳为简单的二元关系,即把每一个实体集看作是一个二维表。
关系模型是用一个单一的二维表结构表示实体及实体间的联系,而满足一定条件的二维表称为一个关系。
其中每一行是一个实体(记录),每一列是一个实体属性(字段),表中第一行是各字段的型的集合。
作为一个关系的二维表,必须满足以下条件:⑴ 表中的每一个属性值都是不可再分的基本单元;⑵ 表中每一列的属性名必须是唯一的;⑶ 表中每一列必须有相同的数据类型;⑷ 表中不能有完全相同的行;关系模型的最大特点是描述的一致性,结构简单清晰。
显然,实体及其联系在关系表中一目了然。
也可以通过关系之间的连接运算建立新的关系,对关系数据库的查询和统计操作均通过布尔逻辑与数学关系运算实现。
关系模型存取路径完全对用户隐蔽,使程序与数据具有高度的独立性。
关系模型使用与维护方便。
由关系数据结构组成的数据库系统称为关系数据库系统。
在关系数据库中,对数据的操作几乎全部建立在一个或多个关系表格上,通过对这些表格的操作来实现对数据的管理。
二、层次模型与树结构层次模型是在数据处理中发展最早、技术上已成熟的一种数据模型。
4地理信息系统空间数据库
范围索引实质是无索引文件的一种图形检索方法。对所击点 的图,通过判别是在那个包络线矩形之内,基本决定其位置。
一次判别
一次判后再进一步一次判别
二、格网索引基本思想
是将区域划分成大小相等的网格,记录每个网格内所包含 的空间实体在数据库中的地址。
为了便于建立空间索引的线性表,可以将每个空间网格按
顺序进行编码,建立顺序码与空间实体的对应关系。
点-点查询:查询距离某点实体一定范围内的其他点实体。如查询距离水井 1km范围内的所有村落。 “开窗”查询: 在图形显示屏幕上用光标临时划定一个不规则的多边形, 好像在背景地图上开了一个“窗”,然后查出和该
窗口有关的点、线、面及其属性信息。
二、属性数据查询
大多数的GIS软件都将属性信息存储在关系数据库中, 而几乎所有的关系数据库管理系统都支持结构化查询语
一、范围索引
即在记录每个空间实体的坐标时,同时记录每个空间实
体的最大和最小坐标。
在通过一个查询范围查询包含在其中的空间实体时,根 据空间实体的最大和最小范围,预先排除那些没有落入 查询范围内的空间实体,只对那些最大和最小范围落在 查询范围内的空间实体进行进一步的坐标位置等判断,
最后查询出那些真正落入查询范围内的空间实体。
空间索引 空间对象 代码
C
A B B B B B C C C D
2 12- 15 15 24 26 36-37 34 40 42 60
三、四叉树索引
四叉树空间索引是将区域进行若干层次的划分,每个层
次的划分是将上一层次划分得到的每个区域分成四个相
等的子区域,判定空间实体包含在哪一层次的那个子区
域中,则用子区域的编码来记录空间实体,这样就形成
GIS空间数据库
时空一体化数据模型:P137
27
GIS分析 找离火车站 最近的汽车 站? 属性为火 车站的点 检索
距离最近 的汽车站
空 间 计 算
所有属性为 汽车站的点 检索
空间 数据库
13
三、传统数据库管理空间数据的局限性
(5)具有高度内部联系的G1S数据记录需要更 复杂的安全性维护系统,为了保证空间数 据库的完整性,保护数据文件的完整性, 保护系列必须与空间数据一起存储,否则 一条记录的改变就会使其他数据文件产生 错误。
21
五、空间数据库的设计
物理设计
–主要内容包括:确定记录存储格式,选择文件 存储结构,决定存取路径,分配存储空间。 –物理设计的好坏将对数据库的性能影响很大, 一个好的物理存储结构必须满足两个条件:
地理数据占有较小的存储空间 对数据库的操作具有尽可能高的处理速度
–在完成物理设计后,要进行性能分析和测试
23
五、空间数据库的设计
空间数据库的设计 –数据字典设计 数据字典用于描述数据库的整体结构、数据 内容和定义等。 数据字典的内容包括: • 数据库的总体组织结构、数据库总体设计 的框架 • 各数据层详细内容的定义及结构、数据命 名的定义
24
六、空间数据库的实现与维护
1.实现 建立空间数据库结构 调试运行
(1)层次模型 将数据组织成一对多关系的有向有序的树结构。 (2)网络模型 结点数据间没有明确的从属关系,一个结点 可与其他多个结点建立联系。
7
图4-1 实体E及其空间要素
层次模型
网状模型
一、数据库相关概念
层次数据模型和网状数据模型的缺陷: 要求应用程序员必须熟悉面向磁盘的优化技术和数据库的 物理组织,对于每次特定的数据查询,必须编出十分复杂的 查询应用程序。 一旦有新类型的数据加入,将会导致数据库结构的变化, 在这种情况下,通常应用程序需要重写。
地理信息系统空间数据库
• 空间数据库:GIS在计算机物理存储介质 上存储的与应用相关的地理空间数据, 一般以特点数据结构的文件的形式组织。
• 空间数据库管理系统:能进行语义和逻 辑定义存储在空间数据库上的空间数据, 提供必需的空间数据查询、检索和存取 功能,以及能够对空间数据进行有效的 维护和更新的一套软件系统。--建立在常 规DBMS上,具有特定空间数据管理功 能。
三种数据模型的比较
Geodatabase数据模型
• 在GeoDatabase地理数据模型诞生前,空间数据多是以 文件形式管理的,如ArcView的Shapefile和ArcInfo的 Coverage等。
• 在过去近二十年中,Shapefile、Coverage数据模型得到 了广泛的应用,但是随着GIS技术和数据库技术的发展, 以文件形式管理空间数据暴露出了在数据输入、存储 及管理等方面的缺欠。
属性联系:从属/聚类/相关
数据模型设计
空间数据模型:对空间客体进行描述和表 达的数学手段,使之能够反映客体的某 些结构特征和行为功能。
优点:能对空间数据进行统一的管理,帮 助用户查询、检索、增删和修改数据, 保证空间数据的独立性、完整性和安全 性,以利于对空间数据的使用和管理。
数据模型
• 层次模型 • 网状模型 • 关系模型 • 语义模型 • 面向对象模型
• Model Management Diagrams include Packages, Subsystems, and Models.
What Is a CASE Tool?
Since the early days of writing software, there has been an awareness of the need for automated tools to help the software developer. Initially the concentration was on program support tools such as translators, compilers, assemblers, macro processors, and linkers and loaders. However, as computers became more powerful and the software that ran on them grew larger and more complex, the range of support tools began to expand. In particular, the use of interactive time-sharing systems for software development encouraged the development of program editors, debuggers, code analyzers, and program-pretty printers.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章空间数据库第一节数据库概述数据库技术是60年代初开始发展起来的一门数据管理自动化的综合性新技术。
数据库的应用领域相当广泛,从一般事务处理,到各种专门化数据的存储与管理,都可以建立不同类型的数据库。
建立数据库不仅仅是为了保存数据,扩展人的记忆,而主要是为了帮助人们去管理和控制与这些数据相关联的事物。
地理信息系统中的数据库就是一种专门化的数据库,由于这类数据库具有明显的空间特征,所以有人把它称为空间数据库,空间数据库的理论与方法是地理信息系统的核心问题。
一、数据库的定义数据库就是为了一定的目的,在计算机系统中以特定的结构组织、存储和应用的相关联的数据集合。
计算机对数据的管理经过了三个阶段—最早的程序管理阶段,后来的文件管理阶段,现在的数据库管理阶段。
其中,数据库是数据管理的高级阶段,它与传统的数据管理相比有许多明显的差别,其中主要的有两点:一是数据独立于应用程序而集中管理,实现了数据共享,减少了数据冗余,提高了数据的效益;二是在数据间建立了联系,从而使数据库能反映出现实世界中信息的联系。
地理信息系统的数据库(以下称为空间数据库)是某区域内关于一定地理要素特征的数据集合。
空间数据库与一般数据库相比,具有以下特点:(1) 数据量特别大,地理系统是一个复杂的综合体,要用数据来描述各种地理要素,尤其是要素的空间位置,其数据量往往大得惊人。
即使是一个很小区域的数据库也是如此。
(2) 不仅有地理要素的属性数据(与一般数据库中的数据性质相似),还有大量的空间数据,即描述地理要素空间分布位置的数据,并且这两种数据之间具有不可分割的联系。
(3) 数据应用的面相当广,如地理研究、环境保护、土地利用与规划、资源开发、生态环境、市政管理、道路建设等等。
上述特点,尤其是第二点,决定了在建立空间数据库时,一方面应该遵循和应用通用数据库的原理和方法,另一方面又必须采取一些特殊的技术和方法来解决其它数据库所没有的管理空间数据的问题。
二、数据库的主要特征数据库方法与文件管理方法相比,具有更强的数据管理能力。
数据库具有以下主要特征:1、数据集中控制特征在文件管理方法中,文件是分散的,每个用户或每种处理都有各自的文件,不同的用户或处理的文件一般是没有联系的,因而就不能为多用户共享,也不能按照统一的方法来控制、维护和管理。
数据库很好地克服了这一缺点,数据库集中控制和管理有关数据,以保证不同用户和应用可以共享数据。
数据集中并不是把若干文件“拼凑”在一起,而是要把数据“集成”。
因此,数据库的内容和结构必须合理,才能满足众多用户的要求。
2、数据冗余度小的特征冗余是指数据的重复存储。
在文件方式中,数据冗余太。
冗余数据的存在有两个缺点:一是增加了存储空间;二是易出现数据不一致。
设计数据库的主要任务之一是识别冗余数据,并确定是否能够消除。
在目前情况下,即使数据库方法也不能完全消除冗余数据。
有时,为了提高数据处理效率,也应该有一定程度的数据冗余。
但是,在数据库中应该严格控制数据的冗余度。
在有冗余的情况下,数据更新、修改时,必须保证数据库内容的一致性。
3、数据独立性特征数据独立是数据库的关键性要求。
数据独立是指数据库中的数据与应用程序相互独立,即应用程序不因数据性质的改变而改变;数据的性质也不因应用程序的改变而改变。
数据独立分为两级:物理级和逻辑级。
物理独立是指数据的物理结构变化不影响数据的逻辑结构;逻辑独立意味着数据库的逻辑结构的改变不影响应用程序。
但是,逻辑结构的改变必然影响到数据的物理结构。
目前,数据逻辑独立还没有能完全实观。
4、复杂的数据模型数据模型能够表示现实世界中各种各样的数据组织以及数据间的联系。
复杂的数据模型是实现数据集中控制、减少数据冗余的前提和保证。
采用数据模型是数据库方法与文件方式的一个本质差别。
数据库常用的数据模型有三种:层次模型,网络模型和关系模型。
因此,根据使用的模型,可以把数据库分成:层次型数据库,网络型数据库和关系型数据库。
5、数据保护特征数据保护对数据库来说是至关重要的,一旦数据库中的数据遭到破坏,就会影响数据库的功能,甚至使整个数据库失去作用、数据保护主要包括四个方面的内容:安全性控制、完整性控制、并发控制、故障的发现和恢复。
三、数据库的系统结构数据库是一个复杂的系统。
数据库的基本结构可以分成三个层次:物理级、概念级和用户级。
1、物理级:数据库最内的一层。
它是物理设备上实际存储的数据集合(物理数据库)。
它是由物理模式(也称内部模式)描述的。
2、概念级:数据库的逻辑表示,包括每个数据的逻辑定义以及数据间的逻辑联系。
它是由概念模式定义的,这一级也被称为概念模型。
3、用户级:用户所使用的数据库,是一个或几个特定用户所使用的数据集合(外部模型),是概念模型的逻辑子集。
它由外部模式定义。
四、数据组织方式数据是现实世界中信息的裁体,是信息的具体表达形式。
为了表达有意义的信息内容,数据必须按照一定的方式进行组织和存储。
数据库中的数据组织一般可以分为四级:数据项、记录、文件和数据库。
1、数据项:是可以定义数据的最小单位,也叫元素、基本项、字段等。
数据项与现实世界实体的属性相对应,数据项有一定的取值范围,称为域。
域以外的任何值对该数据项都是无意义的。
如表示月份的数据项的域是1—12,13就是无意义的值。
每个数据项都有一个名称,称为数据项目。
数据项的值可以是数值的、字母的、汉字的等形式。
数据项的物理特点在于它具有确定的物理长度,一般用字节数表示。
几个数据项可以组合,构成组合数据项。
如“日期”可以由日、月、年三个数据项组合而成。
组合数据项也有自己的名字,可以作为一个整体看待。
2、记录:由若干相关联的数据项组成。
记录是应用程序输入—输出的逻辑单位。
对大多数据库系统,记录是处理和存储信息的基本单位。
记录是关于一个实体的数据总和,构成该记录的数据项表示实体的若干属性。
记录有“型”和“值”的区别。
“型”是同类记录的框架,它定义记录,“值”是记录反映实体的内容。
为了唯一标识每个记录,就必须有记录标识符,也叫关键字。
记录标识符一般由记录中的第一个数据项担任,唯一标识记录的关键字称主关键字,其它标识记录的关键字称为辅关键字。
3、文件:文件是一给定类型的(逻辑)记录的全部具体值的集合。
文件用文件名称标识。
文件根据记录的组织方式和存取方法可以分为:顺序文件、索引文件、直接文件和倒排文件等等。
4、数据库:是比文件更大的数据组织。
数据库是具有特定联系的数据的集合,也可以看成是具有特定联系的多种类型的记录的集合。
数据库的内部构造是文件的集合,这些文件之间存在某种联系,不能孤立存在。
五、数据间的逻辑联系数据间的逻辑联系主要是指记录与记录之间的联系。
记录是表示现实世界中的实体的。
实体之间存在着一种或多种联系,这样的联系必然要反映到记录之间的联系上来。
数据之间的逻辑联系主要有三种:Array1、一对一的联系:简记为1:1,如图4-1所示,这是一种比较简单的一种联系方式,是指在集合A中存在一个元素a i,则在集合B中就有一个且仅有一个b j与之联系。
在1:1的联系中,一个集合中的元素可以标识另一个集合中的元素。
例如,地理名称与对应的空间位置之间的关系就是一种一对一的联系.2、一对多的联系(1:N):现实生活中以一对多的联系较多常见。
如图4-2所示,这种联系可以表达为:在集合A中存在一个a i,则在集合B中存在一个子集B′=(b j1,b j2…b jn)与之联系。
通常,B′是B的一个子集。
行政区划就具有一对多的联系,一个省对应有多个市,一个市有多个县,一个县又有多个乡。
3、多对多的联系(M:N):这是现实中最复杂的联系(如图4-3所示),即对于集合A中的一个元素a i。
在集合B就存在一个子集B′=(b j1,b j2…b jn)与之相联系。
反过来,对于B集合中的一个元素B j在集合A中就有一个集合A′=(a i1,a i2,a i3…a in)与之相联系。
M:N的联系,在数据库中往往不能直接表示出来,而必须经过某种变换,使其分解成两个1:N的联系来处理。
地理实体中的多对多联系是很多的,例如土壤类型与种植的作物之间有多对多联系。
同一种土壤类型可以种不同的作物,同一种作物又可种植在不同的土壤类型上。
第二节 传统数据库系统的数据模型数据模型是数据库系统中关于数据和联系的逻辑组织的形式表示。
每一个具体的数据库都是由一个相应的数据模型来定义。
每一种数据模型都以不同的数据抽象与表示能力来反映客观事物,有其不同的处理数据联系的方式。
数据模型的主要任务就是研究记录类型之间的联系。
目前,数据库领域采用的数据模型有层次模型、网状模型和关系模型,其中应用最广泛的是关系模型。
一、 层次模型层次模型是数据处理中发展较早、技木上也比较成熟的一种数据模型。
它的特点是将数据组织成有向有序的树结构。
层次模型由处于不同层次的各个结点组成。
除根结点外,其余各结点有且仅有一个上一层结点作为其“双亲”,而位于其下的较低一层的若干个结点作为其“子女”。
结构中结点代表数据记录,连线描述位于不同结点数据间的从属关系(限定为一对多的关系)。
对于图4-4所示的地图M 用层次模型表示为如图4-5所示的层次结构。
层次模型反映了现实世界中实体间的层次关系,层次结构是众多空间对象的自然表达形式,并在一定程度上支持数据的重构。
但其应用时存在以下问题:1、由于层次结构的严格限制,对任何对象的查询必须始于其所在层次结构的根,使得低层次对象的处理效率较低,并难以进行反向查询。
数据的更新涉及许多指针,插入和删除操作也比较复杂。
母结点的删除意味着其下属所有子结点均被删除,必须慎用删除操作。
2、层次命令具有过程式性质,它要求用户了解数据的物理结构,并在数据操纵命令中显式地给出存取途径。
3、模拟多对多联系时导致物理存贮上的冗余。
4、数据独立性较差。
二、网状模型网络数据模型是数据模型的另一种重要结构,它反映着显示世界中实体间更为复杂的联系,其基本特征是,结点数据间没有明确的从属关系,一个结点可与其它多个结点建立联系。
如图4-6所示的四个城市的交通联系,不仅是双向的而且是多对多的。
如图4-7所示,学生甲、乙、丙、丁、选修课程,其中的联系也属于网络模型。
网络模型用连接指令或指针来确定数据间的显式连接关系,是具有多对多类型的数据组织方式,网络模型将数据组织成有向图结构。
结构中结点代表数据记录,连线描述不同结点数据间的关系。
有向图(Digraph)的形式化定义为:Digraph =(Vertex ,(Relation))其中Vertex 为图中数据元素(顶点)的有限非空集合;Relation 是两个顶点(Vertex)之间的关系的集合。
有向图结构比层次结构具有更大的灵活性和更强的数据建模能力。