空间数据库重点

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

●1、数据库基本概念

什么是数据库?

数据库的英文是DATA BASE,其意义为数据基地,即统一存贮和集中管理数据的基地。

(1)存储在计算机环境中的相互关连的数据集

(2)在这样的环境中,数据是永久的,也就是说它可以幸免于软件和硬件的问题(除非是磁盘崩溃)。

(3)大数据卷和持久性是数据库最大的两个特点。

数据库系统的构成

数据库是存贮在计算机内的有结构的数据集合;

数据库管理系统是一个软件,用以维护数据库、接受并完成用户对数据库的一切操作;

数据库系统指由硬件设备、软件系统(操作系统、数据库管理系统、应用软件)、专业领域的数据体和管理人员构成的一个运行系统。

数据库中的数据模型

主要的数据模型:层次,网状,关系,面向对象的数据模型,约束数据模型

空间数据库:指以特定的信息结构(如国土、规划、环境、交通等)和数据模型(如关系模型、面向对象模型等)表达、存储和管理从地理空间中获取的某类空间信息,以满足不同用户对空间信息需求的数据库。

●2、数据库查询索引

关系数据库的八个查询运算符

SELECT:这个运算符用来查询表中的行。它可以列出所有的行或只有那些符合选择条件的行。PROJECT:这个运算符用来查询表中的列。它可以生成一个表的子集,并删除其中重复的值。JOIN:这个运算符可以利用两表中特定列之间的关系将一个表中的一行与另一个表中的行实现横向连接(即串连)。

PRODUCT(积):两表的积,也被称为笛卡尔积,是由一个表中的每一行与另一个表中的每一行串联而得到。

UNION(并):这个运算符可以把两个表合成一个新表,而这个表中具有两个表中所有的数据。要对表使用并运算,则这些表的列数和数据类型之间必须互相兼容。在并运算中,重复的行将会被删除。

INTERSECT(交):这个运算符将生成一个包含了两个表中共有行的新表。对表使用交运算,则这些表列数和数据类型之间必须可以互相兼容。

DIFFERENCE(差):这个运算符生成一个表,该表由第一个表中出现而第二个表未出现的所有有行构成。要对表使用差运算,则这些表在列数和数据类型上必须互相兼容。正如四则运算一样,差的顺序非常重要。因此,如下图所示,表R -表S与表S - 表R的结果是不一样的。

DIVIDE(除):这运算符需要一个二元(即两列)表和一个一元(即一列)表产生一个新表,该表由二元表中与一元表中匹配的列值组成。

空间查询:

空间查询比常规数据库查询更加复杂,因为他们涉及的是二维或者三维数据,且查询结果以图形表示。在空间数据库内容中,空间查询是利用一个或多个操作算子构成的,包括表达空间关系的谓词。

主要的空间查询包括点查询、区域查询和最邻近查询三种空间选取查询以及空间连接的方法。点查询:给定一个查询点P,找出所有包含它的空间对象O。

区域查询:给定一个查询多边形P,找出所有与之相交的空间对象O。

空间连接:两个表R和S基于一个空间谓语θ进行连接时,该连接成为空间连接。

最近邻查询:空间聚集,即给定一个对象O,找出所有距离O最近的对象P。

空间查询处理:过滤筛选步骤(对象近似技术)和细化求精(相关技术)步骤;基本思想是首先用一个不精确的大致范围来进行查询,产生一个满足条件的较小的候选集合,然后对候选集合中的对象进行精确地筛选,产生最终的查询结果。

空间索引:就是指依据空间对象的位置、形状或空间对象之间的某种空间关系按一定的顺序排列的一种数据结构,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。

空间索引的基本概念是近似的使用,即借以空间访问过程逐渐地缩小它的查询范围直至要求的数据库对象被找到。换句话,空间数据索引的基本概念是将空间划分为一些可管理的子空间,子空间进一步被划分为更小的子空间的过程。

传统数据库索引技术有B树、B+树、二叉树、ISAM索引、哈希索引等。

空间索引方法:

格网索引:是将研究区域用横竖线条划分大小相等或不等的格网,记录每一个格网所包含的空间实体。当用户进行空间查询时,首先计算出用户查询对象所在格网,然后再在该网格中快速查询所选空间实体,这样一来就大大地加速了空间索引的查询速度。

四叉树索引:四叉树索引就是递归地对地理空间进行四分,直到自行设定的终止条件(比如每个节点关联图元的个数不超过3个,超过3个,就再四分),最终形成一颗有层次的四叉树。分为线性四又树和层次四叉树。

R树和R+树空间索引:R树是一种多级平衡树,是B树在多维空间上的扩展。在R树中存放的数据并不是原始数据,而是这些数据的最小边界矩形(MBR),空间对象的MBR被包含于R树的叶结点中。R+树索引允许矩形相互重叠,允许一个对象同时为多个虚拟矩形所包围。

3、专业数据库(分布式数据库,时态数据库)基本概念思想

专业数据库:分布式数据库演绎数据库时态数据库实时数据库

分布式数据库:

概念:逻辑上是一个统一的数据库系统

物理上分散在不同的场地(节点)

各场地通过计算机网络连接在一起

统一由一个分布式数据库管理系统( DDBMS )管理

优点:可靠性:单一部件失效不一定会使整体失效

自治性:DDB允许各个场所有各自的自主权

模块性:整个系统结构灵活,增减结点对系统的影响较小

高效率、高可用性:合理的分布布局,使得数据存储在常用的结点;对常用数据重复提高响应速度

特点:数据的物理分布性和逻辑整体性

数据的分布独立性(也称分布透明性):用户视角看DDB类似于集中式数据库

数据的冗余存储:适当冗余提高系统处理效率和可靠性

场地自治和协调性:每个结点既能执行局部应用请求,又能通过网络处理全局的应用请求。

演绎数据库:

基本概念:根据已知的事实和规则进行推理,回答用户提出的各种问题。演绎数据库也被称为逻辑数据库、演绎关系数据库或虚关系数据库;具有很强的推理能力,这种推理能力起源于人工智能的研究;根据已知的数据和这些逻辑关系可推出另一些在数据库中并不存在而客观又是正确的数据

内容:实数据(事实);规则;虚数据(虚数据系根据已知的实数据经使用规则推理而得到

相关文档
最新文档