武汉大学2011 空间数据库复习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、数据库:就是为了一定的目的,在计算机系统中以特定的结构组织、存储、管理和应用的相关联的数据集合,是数据管理的高级阶段。
空间数据库是存取、管理空间信息的数据库,指的是地理信息系统在计算机物理存储介质上存储的应用相关的地理空间数据的总和,一般是以一系列特定结构的文件的形式组织在存储介质之上的
空间数据库与关系数据库间的主要区别:
1)和关系数据库相比,空间数据库没有固定的运算符集合
2)空间数据库处理对象复杂,具有空间范围,不能自然按一维排序
3)检测空间谓词需要用到大量复杂计算,所以CPU的代价不是主要由I/O决定
空间数据模型:是关于现实世界中空间实体及其相互联系的概念,它为描述空间数据的组织和设计空间数据库模式提供着基本方法
空间数据库管理系统:
1)一个SDBMS是一个软件模块,它利用一个底层数据库管理系统
2)SDBMS支持多种空间数据模型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言
3)SDBMS支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规则
空间信息:也就是指在某个空间框架(如地球表面)中的位置信息。空间信息是指与研究对象的空间地理分布有关的信息,它表示地理系统诸多要素的数量、质量、分布特征,相互联系和变化规律的图、文、声、像等的总称
地理信息系统:是用于采集、模拟、处理、检索、分析和表达地理空间数据的计算机信息系统,可以作为ADBMS的前端
数据模型:数据模型是一条或一组用于标识和表示空间参照对象的规则,数据模型是数据集的特定结构和模式,是对数据的文件描述,有利于某些性质的前期分析。数据模型是数据库系统中关于数据内容和数据之间联系的逻辑组织的形式表示。每一个具体的数据库都是由一个相应的数据模型来定义。层次模型、网络模型、关系模型、面向对象模型
对象模型:对象模型很适合表示有固定形状的空间实体
场模型:用于表示连续的或无固定形状的概念
2、数据库的发展:(图)
数据库系统的前身为文件系统,数据库技术最初产生于20世纪60年代中期,根据数据模型的发展,可以划分为三个阶段:第一代的网状、层次数据库系统;第二代的关系数据库系统;第三代的以面向对象模型为主要特征的关系数据库系统
3、场操作可以分为三类:局部操作、聚焦操作、区域操作
局部操作:空间框架内一点给定位置的新场的取值只依赖于同一位置场的输入值
聚焦操作:在指定位置的结果场的值依赖于同一位置的一个假定小领域输入场的值
区域操作:与聚集运算符或微积分中的积分运算有关,如森林的例子中计算每个树种的平均高度
4、数据库设计的三个步骤:
首先,采用高层次的概念数据模型来组织所有与应用相关的可用信息:重点关注应用的数据类型及其联系和约束,设计过程的这个阶段不考虑具体实现细节。概念模型通常用浅显的文字,结合简单一致的图形符号来表示。实体-联系模型是所有概念设计工具中最为流行的一种;然后,逻辑建模阶段,与概念数据模型在商用DBMS上的具体实现有关;最后,数据库设计的第三步骤是物理设计的建模,它解决了数据库应用在计算机中具体实现时方方面面的细节
5、概念模型:是对真实世界中问题域内的事物的描述,不是对软件设计的描述。E-R模型表示
逻辑模型:是指数据的逻辑结构。关系模型表示
物理模型:1)概念数据模型在计算机内部具体的存储形式和操作机制,用一个有效容错的方式2)执行逻辑数据模型的理论基础,使用现在的构件
邻接表、邻接矩阵表示
基于内存的物理模型:邻接表、邻接矩阵
基于外存的物理模型:规范化表结构:用两个关系R和S来分别描述结点和边
非规范化表结构:采用非规范化表结构可以加快边的查询速度
6、象形图:
象形图是一种将对象插在方框内的微缩图表示,这些微缩图用来扩展ER图,并插到实体矩形框中的适当位置
7、空间索引:
是指根据空间对象的位置和形状或空间对象之间的某种空间关系按一定的顺序排列的一种数据结构,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针
空间索引文件:是用来提高空间数据查询效率的辅助文件。索引文件的记录只有两个域,即码域和空间数据的页面地址
硬盘驱动器存取时间(t a)t a=t s+t v+t t t s为寻道时间,t v为延迟时间,t t为传
输时间通常,t s>t v>t t
9、从软件的角度,数据在磁盘上以域、记录、文件这种层次结构的形式存放的。
文件:文件是记录的集合,类似于整个关系表
域:域是一种管理边界,用于一组计算机共享共用的安全数据库,域实际上是一组服务器和工作站的集合。是属性的取值范围,表示一个关系表或实体属性
记录:每条记录都是相同或不同类型的域的集合。表的“行”称为“记录”,对应于关系表的一行,即一个实体,是属性的集合
文件结构:一种组织文件中记录顺序的方法,以便于对文件的各种操作。包括:无序文件(堆)、散列文件、有序文件、聚类文件
10、空间填充曲线:空间填充曲线是利用一个线性顺序来填充空间,可以获得丛一端到另一端的曲线。多维空间本身没有自然排序关系,但存在一对一的连续映射,可以将多维空间的点映射到一维空间,以达到对多维空间进行一维排序的目的。常用的算法有Z曲线和Hilberlt曲线
Z曲线:1)读入x和y坐标的二进制表示 2)隔行扫描二进制数字的比特到一个字符串3)计算出结果二进制串的十进制值
Hilberlt曲线:
1)读入x和y坐标的n比特二进制表示。
2)隔行扫描二进制比特到一个字符串。
3)将字符串自左至右分成2比特长的串si,其中i=l,…,n。
4)规定每个2比特长的串的十进制值di,例如“00”等于0,“01”等于l;“10”等于3;“11”等于2。
5)对于数组中每个数字j,如果
·j=0把后面数组中出现的所有l变成3,并把所有出现的3变成1。
·j=3把后面数组中出现的所有0变成2,并把所有出现的2变成0。
6)将数组中每个值按步骤5转换成二进制表示(2比特长的串),自左至右连接
所有的串,并计算其十进制值。