数据库技术发展动态

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

仲恺农业工程学院
计算机科学与工程学院
8.3 并行数据库系统
8.3.1 并行结构模型
8.3.2 数据Fra Baidu bibliotek置与数据偏斜
仲恺农业工程学院
计算机科学与工程学院
8.3.1 并行结构模型
❖ 并行计算机是并行数据库的基础。1986年,美国学者 M.Stonebraker提出了并行计算机的3种并行结构模型。
❖ (1)共享主存结构(Shared Memory)简称SM 结构,也称全共享结构(SE-Shared Everything)。 在此种结构中,各处理机通过共享主存通信,每个处理 机都能访问任一存储单元和任一磁盘单元,处理机与存 储器之间通过高速总线或交叉开关连接,如图8-5(a)。 这是目前较成熟的结构,居市场主流。采用该结构的机 器有IBM的IBM3090,BULL的DPS8,Sequent和 Encore公司的对称多处理机等。该结构的优点是:结构 简单、负载均衡、通信效率高。缺点是:维护开销大、 可扩充性受限制、可用性低。建立在这种结构上的并行 数据库系统有:XPRS、DBS3、Volcalno、IBM3090 上的DB2等。
仲恺农业工程学院
计算机科学与工程学院
8.2.3 数据分布
数据分布包括分割和分配两个方面,可以描述为以下两个步骤: 先从逻辑上将全局概念模式,即全局关系模式,划分成若干逻辑 片段(子关系)——分割;再按一定的冗余度将片段分配到各个 节点上,这时逻辑片段就成为具体的物理片段——分配。 对分布式数据库分割后,仍应保持DDB原有的特质,所以分割 后的各逻辑关系之间应遵循下列原则: (1)完整性原则。全局关系的所有数据必须包括在任何一个片 段中,不允许出现某个数据属于全局关系,但却不属于任何片段。 (2)重构性原则。所有片段必须能重构(逆操作)成全局关系。 (3)不相交原则。不允许一个全局关系的某些数据既属于该全 局关系的某一个片段又属于该全局关系的另一个片段。即要求一 个全局关系被分割后得到的各个数据片段必须是相互不重叠的。
❖ 分布性是指数据不是存放在单一场地为单个计算机配置的存储设备上, 而是按全局需要将数据划分成一定结构的数据子集,分散地存储在各 个场地(节点)上。
❖ 逻辑协调性是指各场地上的数据子集,相互间由严密的约束规则加以 限定,而在逻辑上是一个整体。
❖ 实际上,基于以上两个特性的DDB是虚拟的、逻辑的,即是由许多 LDB逻辑组织而成的,它是针对于全体用户的、全局的数据库。
❖ (1)集中型。数据虽经划分,但所有逻辑片段完全集中 在一个场地上,仍然像一个集中数据库一样。
❖ (2)分割型。数据被划分后,所有逻辑片段各自分配在 一个场地上,所有场地上分配的只是全局关系的一个子关 系。
❖ (3)混合型。数据被划分后的逻辑片段根据需要分配, 共享的片段在需要共享的场地上重复设置,高度私用的片 段只设置在所需要的场地上。
仲恺农业工程学院
计算机科学与工程学院
8.2.3 数据分布
❖ 在构成分布式数据库系统的运行环境时,必须考虑构成分布 式数据库系统所应用的各个组成部分各自如何使用数据的问 题,所以,分布式数据库系统同样存在着分布式数据库DDB 的设计问题,这就是数据分布。它包括了分布式数据库的逻 辑划分和物理分配,以及用户对分布式数据库的划分或分配 的感知程度(透明度)。
仲恺农业工程学院
计算机科学与工程学院
第8章数据库技术发展动态
❖本章要点
▪ 数据库技术发展的主要特点 ▪ 新一代数据库技术的特点 ▪ 掌握数据模型的发展 ▪ 面向应用的数据库新技术
仲恺农业工程学院
计算机科学与工程学院
第8章数据库技术发展动态
8.1 面向对象数据库系统 8.2 分布式数据库系统 8.3 并行数据库系统 8.4 其他数据库 8.5 数据仓库
仲恺农业工程学院
计算机科学与工程学院
8.3.1 并行结构模型
(a)共享主存
(b)共享磁盘
仲恺农业工程学院
(c)无共享 图8-5 并行结构模型
计算机科学与工程学院
8.3.2 数据分置与数据偏斜
❖ 1.数据分置
❖ 类似于分布数据库中的数据分布,并行数据库中的数据如 何分布到各结点的存储设备上去呢?这就是数据分置 (Data Placement)问题。它由数据划分和分配两部 分组成。要把数据分置到不同结点上,首先要对数据进行 划分(Partitioning),这类似于分布数据库中的全局 关系分段。分段与分布是以用户使用数据的方式以及在什 么结点使用为依据的。与此不同,并行数据库的用户查询 并不与特定结点相联系,数据分置不考虑特定用户的特定 应用,它的目标是有利于用户查询的并行处理。
图8-4 联邦数据库结构
仲恺农业工程学院
计算机科学与工程学院
3.联邦式数据库的分级结构
(1)本地模式:它是部件DBS的概念模式。 (2)部件模式:它是本地模式经转换器处理后变成FDBS公共数据模型的 形式。 (3)输出模式:它给出了部件模式可被FDBS使用的一个子集和一些访问 控制信息。 (4)联邦模式: 它是各输出模式的并集,由各输出模式经构造器生成。 (5)外模式: 外模式由联邦模式经过滤器导出,其数据模型可以不同。 (6)转换器:把一种数据模型(格式)转换为另一种数据模型(格式)。把一 种数据语言转换为另一种数据语言。 (7)过滤器:限制从一层处理器传送到另一层处理器的命令和相应的数据。 (8)构造器:把单个处理器的操作,分解、复制成多个操作(查询分解)。 把多个处理器产生的数据合并成单个数据集合(模式集成)。
仲恺农业工程学院
计算机科学与工程学院
8.3.1 并行结构模型
❖ (2)共享磁盘结构(Shared-Disk)简称SD结构,如图85(b)。在此种结构中,每个处理机有自己的内存,通过高速互 连网,可以访问任何磁盘。这种结构的优点是可扩充性好,负载 均衡,维护开销不大,可用性较高。缺点是复杂度较高,潜在性 能较低的问题。建立在该类结构上的并行数据库系统有IBM的 IMS/VS数据共享产品,DEC公司的VAX DBMS和Rdb产品, 以及在DEC cluster和NCUBE计算机上的ORACLE数据库实 现等。
仲恺农业工程学院
计算机科学与工程学院
2.多数据库系统的分级结构
图8-2 有全局概念模式的MDBS结构
仲恺农业工程学院
计算机科学与工程学院
2.多数据库系统的分级结构
❖ ( 2 ) 无 全 局 要 领 模 式 的 参 考 结 构 如 图 8-3 所 示 。 在此种结构中,将MDBS分布为两层:本地系统 层和多数据库层。本地系统层由各本地数据库组 成;多数据库层由多数据库用户的外模式组成。 这些外模式可以定义在一个或多个本地概念模式 上。用户用编程通过外模式访问MDBS,而实现 对各本地数据库访问的责任交给多数据库层与本 地系统层之间的映射。
仲恺农业工程学院
计算机科学与工程学院
2.多数据库系统的分级结构
图8-3 无全局概念模式的MDBS结构
仲恺农业工程学院
计算机科学与工程学院
3.联邦式数据库的分级结构
❖ 联邦数据库系统 由一组既协同工
作又独立自治的
部件数据库系统
组成。这些部件 DBS可以是 CDB、DDB、 甚至是另一个 FDBS。如图 8-4所示,联邦 数据库结构包含 如下几个部分:
仲恺农业工程学院
计算机科学与工程学院
8.2.1 分布式数据库及其分类
▪ 2.分布式数据库的分类 ▪ 分布式数据库的类型很多,根据不同的准则,有不同的分类方法。
我们从数据冗余、全局数据库的构成、数据库分级结构和本地数 据库的配置等方面对它们分类。 ▪ (1)按数据冗余分类,全局分布数据库的数据分布到网络中各结 点时,会有如下情况:完全复制型、完全分割型、子集复制型、 子集分布型。 ▪ (2)按全局数据库的构成分类:同构型分布数据库、异构型分布 数据库。 ▪ (3)按本地数据库的配置方式可分成:可分布访问的集中数据库、 中心数据库加专用数据库、多级分布数据库、水平分布数据库。 ▪ (4)按本地数据库的数据是否全部集成到全局数据库中分类:对 等型分布数据库(Peer-to-Peer DBS)、多数据库系统(MultiDBS)。
本章小结
仲恺农业工程学院
计算机科学与工程学院
8.1 面向对象数据库系统
❖8.1.1 面向对象数据库系统的基本概念 ❖8.1.2 面向对象数据库系统的特征
❖8.1.3 面向对象数据库系统的查询 ❖8.1.4 面向对象数据库系统的并发控制 ❖8.1.5 面向对象数据库管理系统OODBMS
仲恺农业工程学院
计算机科学与工程学院
8.2 分布式数据库系统
❖8.2.1 分布式数据库及其分类
❖ 1.分布式数据库(Distributed Data Base ,DDB)
❖ 分布式数据库是计算机网络环境中各场地(Site)或节点(Node)上 数据库的逻辑集合。它是一组结构化的数据集合,逻辑上属于同一系 统,而物理上分布在计算机网络的不同节点上,具有分布性和逻辑协 调性的特点。
仲恺农业工程学院
计算机科学与工程学院
8.2.3 数据分布
❖ 分割后的工作便是分配,分配的目标是将已分割好的片段 分配到不同的场地中去,使得某节点对某片段的访问尽量 为本地访问。分配的过程是线性的,亦即分割的输出是分 配的输入。显然,分割与分配有着天然的联系,二者的区 别仅在于分割着眼于全局,分配则考虑片段关系。数据分 配一般有以下几种方式:
仲恺农业工程学院
计算机科学与工程学院
8.3.1 并行结构模型
❖ (3)无共享结构(Shared Nothing)简称SN结构, 如图8-5(c)。这是一种松耦合系统,每个计算机系统 通过高速网络互连,各计算机系统独占自己的主存与磁 盘,这种结构的并行数据库本质上是一种分布数据库。 无共享结构的优点很突出:它的扩充性好,增加新结点 系统可平衡地增长,线性加速比好,在多个结点上复制 数据,可增加系统可用性、可靠性,资源竞争对系统的 干扰小,系统维护开销不大。而该结构的缺点是复杂度 高,负载平衡难于达到,因为它依赖于数据库中数据的 分割与放置。建立在该结构上的并行数据库有 Teradata的DBC、Tandem的NonStopSQL产品 以及原型系统BUBBA、EDS、GAMMA、GRACE、 PRISMA等。
仲恺农业工程学院
计算机科学与工程学院
8.2.2 分布式数据库的分级结构
❖ 1.对等型分布数据库的分级结构 ❖ 对等型的分级结构如图8-1,它的全局概念模式
是所有结点本地概念模式的并集。
仲恺农业工程学院
图8-1 ANSI/SPARC分布DB参考结构
计算机科学与工程学院
8.2.2 分布式数据库的分级结构
❖ 数据分布的主要目的是提高访问的局部性。即通过数据的合 理分布,尽可能地使更多的数据能够就地存放,以减少远距 离的数据访问,但在任何分布式数据库中,达到所有数据的 访问都局部化是不可能的。即使多复本也只能达到读的完全 局部化,对于数据的更新则需各个复本同步更新,因此仍然 需要进行远程访问。一个成功的分布式数据库的设计应使访 问的局部性能更好。数据分布的目的是为了就地访问而不是 分布访问。
仲恺
数据库原理及应用
Principles and Applications of the Database
第8章数据库技术 发展动态
仲恺农业工程学院 计算机科学与工程学院
An Introduction to Database System
第8章数据库技术发展动态
❖ 本章导读
▪ 数据库是计算机科学技术中发展最快,应用最广泛的重要分支之一, 它已经成为计算机信息系统和计算机应用系统的重要技术基础和支 柱。探究其发展的基础可以涉及到两种源动力。一种是方法论的发 展,其中较为典型的代表是:面向对象数据库 (OODB) 技术、分布 式数据库(DDB)技术和多媒体数据库(MDB)技术的发展和形成;另 一种是数据库技术与相关技术的有机结合,如主动数据库、并行数 据库、工程数据库、时态数据库、模糊数据库、演绎数据库、统计 数据库、空间数据库、知识库和科学与文献数据库等,它们都是特 定技术领域的知识通过数据库技术,实现对特定数据对象的计算机 管理并实现对被管理数据对象的操作。
❖ 2.多数据库系统的分级结构
❖ 多数据库放宽了分布数据库中所有数据从逻辑上 看必须都在一个全局数据库中的要求,允许部分 数据只供本地用户使用。这里又有两种参考结构:
❖ (1)带有全局要领模式的参考结构如图8-2所 示。在此种结构中,全局概念模式是本地概念模 式的集成。本地用户的外模式定义在本地概念模 式上,不改变本地用户原来使用本地数据库的方 式。全局用户的外模式定义在全局概念模式上, 用统一的语言访问多数据库。
相关文档
最新文档