分布式数据库总结

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

%%%%%%%%%%%%%%%第一章:分布式数据库系统概述

数据库:长期存储在计算机内的有组织的,可共享的相关数据的集合。

数据库管理系统:DBMS是介于用户与操作系统之间的一层数据管理软件。为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS基于某种数据模型。

数据库系统:数据库系统(DBS)通常是指带有数据库的计算机应用系统。包括数据库、相应的硬件、软件和各类人员。

数据库技术:数据库技术是研究数据库的结构、存储、设计、管理和使用的一门软件学科;是一门综合性较强的学科。

数据抽象:视图抽象——外模式;概念抽象——概念模式;物理抽象——内模式

数据模型:数据模型三要素:数据结构;数据操作;完整性约束

模式/内模式映象:该映象存在于模式与内模式之间,用于定义模式与内模式之间的对应性。本映象一般在内模式中描述。

外模式/模式映象:该映象存在于外模式与模式之间,用于定义外模式和模式之间的对应性。本映象一般在外模式中描述。

物理独立性:在数据库系统的三级模式结构中,存在模式/内模式的映象,当内模式发生变化时,只要修改模式/内模式的映象,就可以保持模式不变,从而保证程序与数据的物理独立性。逻辑独立性:在数据库系统的三级模式结构中,存在外模式/模式的映象,当模式发生变化时,只要修改外模式/模式的映象,即可保持外模式不变,从而保证程序和数据的逻辑独立性。

DDBS具有如下四个基本特点:物理分布性逻辑整体性场地自治性场地之间协作性

计算机网络:定义为相互联接、彼此独立的计算机系统的集合。相互联接指两台或多台计算机通过信道互连,从而可进行通信;彼此独立则强调在网络中,计算机之间不存在明显的主从关系,即网络中的计算机不具备控制其他计算机的能力,每台计算机都具有独立的操作系统。计算机网络的组成:通信子网和资源子网

分布式数据库定义:物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。分布式数据库系统可以看成是计算机网络和数据库系统的有机结合。

分布式数据库系统的特点:①物理分布性:数据不是存放在一个站点上②逻辑整体性:是与分散式数据库系统的区别③站点自治性:是与多处理机系统的区别④数据分布透明性⑤集中与自治相结合⑥存在适当的数据冗余度⑦事务管理的分布性

分布式数据库的分类:

㈠按局部DBMS的数据模型分类

①同构型DDBS:各个站点上数据库的数据模型都是同一数据模型。

⒈同构同质型:同一类型,同一种DBMS

⒉同构异质型:同一类型,不是同一种DBMS

②异构型DDBS:各个站点上数据库的数据模型的类型是各不相同的。

㈡按DDBS的全局控制类型分类

①全局控制集中型DDBS:全局控制机制和全局数据词典位于中心站点

②全局控制分散型DDBS:全局控制机制和全局数据词典分散在网络的各个站点上。

③全局控制可变型DDBS:也称主从型DDBS。分成两组站点,一组包含全局控制机制和全局控制词典,另外一组不包含。

分布式数据库的组成成分:

①应用数据库,它是分布式数据库的主体,关于应用所需要的数据的集合;

1、局部数据(只提供本站点的局部应用所需要的数据);

2、全局数据(虽然物理上存储在个站点上,但是参与全局应用)

②描述数据库(数据字典、数据目录或元数据)关于数据库中该数据结构的定义,以及全局数据的分片、分布的描述。

1、局部数据目录(局部站点上的数据词典)

2、全局数据目录(提供全局数据的描述和管理相关信息)

数据分片要准守的原则:①完备性原则:要把所有的数据映射到各个片断中;②可重构原则:关系分片后的各个片断可重构整个关系;③不相交原则:关系分片后的各个片断不能重叠分布式数据库是多层的:①全局外层(全局外模式)②全局概念层:(全局概念模式、分片模式和分配模式)描述分布式数据库总全局数据的逻辑结构和数据结构。③局部概念层:局部概念模式④局部内层:局部内模式

DDBS的体系结构自上而下有六个层次:全局外模式;全局概念模式;分片模式;分配模式;局部概念模式;局部内模式

模式结构:全局外模式,全局概念模式,分片模式,分配模式,局部概念模式,局部内模式。分布式数据库管理系统的功能模块:要保证数据库的共享性、可用性、安全性、完整性、分布透明性等功能的实现,应该包括如下四个基本功能模块:①查询处理模块:查询分析和查询优化②完整性处理模块③调度处理模块④可靠性处理模块

DDBMS在物理硬件层和集中式系统的主要区别是:各种各样被称为站点或节点的计算机必须通过通信网络连接起来,在站点间传输数据和命令。

分布式数据库管理系统的参考模型的主要成分:处理器和模式。

分布式数据库中的数据独立性:①逻辑独立性②物理独立性③分布独立性(分布透明性):分三个层次:分片透明性(完全分布透明性);位置透明性(中级分布透明性);局部数据模型透明性(低级分布透明性);无分布透明性:异构数据

分布透明性的定义:指用户或用户程序使用分布式数据库如同使用集中式数据库那样,不必关心全局数据的分布情况,包括全局数据的逻辑分片情况、逻辑片段的站点位置分配情况,各站点数据库的数据模型等情况对用户和用户程序是透明的。

分布透明性的三个层次:①分片透明性:分布透明性中的最高层,位于全局概念模式与分片模式之间。②位置透明性:分布透明性的中间层,位于分片模式和分配模式之间。

③局部数据模型透明性:分布透明性的最底层,位于分配模式与局部概念模式之间。

%%%%%%%%%%%%%%%第二章:分布式数据库系统的设计

设计集中式数据库的一般方法包括四个阶段:需求分析,概念设计,逻辑设计,物理设计分布式数据库加一阶段:分布设计,包括数据的分片设计和pain段的位置分配设计。

需求分析阶段输出:应用的频率表,实体的划分表,数据与应用的计划表。

DDBS设计方法:自顶向下(重构法);自底向上(组合法);混合法

分片应遵守的原则:(1)完整性条件;(2)可重构条件;(3)不相交条件

分片的方式:(1)水平分片:是对全局关系执行“选择”操作。分为基本分片和基于到处分片。(2)垂直分片;是通过“投影”操作把它的属性分成若干组。导出分片;混合分片

分布式查询策略:

代价公式:QC = I/O 代价+ CPU 代价+ 通讯代价

通讯代价:TC = 传输延迟时间C0 + (传输数据量X * 数据传输速率C1)

相关文档
最新文档