分布式数据库系统概述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章分布式数据库系统概述
1、逻辑集中和物理分散:(P4)
分布式数据库系统定义:
分布式数据库,通俗地说,是物理上分散而逻辑上集中的数据库系统。
分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑位连接起来,共同组成一个统一的数据库系统。
物理分散:
分布式数据库系统中的数据不是存储在一个站点上,而是分散的存储在由计算机网络连接起来的多个站点;这是与集中式数据库系统的最大差别之一。
逻辑集中:
分布式数据库系统中的数据物理上是分散在各个站点中,但是这些分散的数据逻辑上构成一个整体,它们被分布式数据库系统的所有用户共享,并由一个分布式数据库管理系统统一管理,它使得“分布”对用户来说是透明的。
这是与分散式数据库的最大区别。
2、构与质:(P7)
构:数据库的数据模型;
质:DBMS的类型;
构与质的种类:
同构型:数据库的数据类型是同一类型的;其中同构型DDBS又分为:同构同质DDBS、同构异质DDBS;
●同构同质DDBS:站点上的数据库都是同一类型的,而且是同一种
DBMS;
●同构异质DDBS:站点上的数据库都是同一类型的,但不是同一种
DBMS;
异构型DDBS:各站点上数据库的数据模型的类型各不相同;
3、分布式数据库的体系结构、模式结构和功能结构的理解(参考P9、P12和
P17的图解及定义);
●体系结构:给出该系统的总体架构,定义整个系统的各组成部分及他们
的功能,定义系统个组成部分之间的相互关系。
组成成分有:局部DB 和全局DB,局部DBMS和全局DBMS,及局部DBA和全局DBA。
●模式结构:全局外模式,全局概念模式,分片模式,分配模式,局部概
念模式,局部内模式。
●功能模式:查询处理模块,完整性处理模块,调度处理模块,可靠性处
理模块。
4、分布式数据库数据分布透明性的划分:(P25)
分布透明性的定义:
指用户或用户程序使用分布式数据库如同使用集中式数据库那样,不必关心全局数据的分布情况,包括全局数据的逻辑分片情况、逻辑片段的站点位置分配情况,各站点数据库的数据模型等情况对用户和用户程序是透明的。
分布透明性的三个层次:
●分片透明性:分布透明性中的最高层,位于全局概念模式与分片模式之
间。
●位置透明性:分布透明性的中间层,位于分片模式和分配模式之间。
●局部数据模型透明性:分布透明性的最底层,位于分配模式与局部概念
模式之间。
第二章分布式数据库系统的设计
1、分布式数据库的设计目标:(P41)
分布式数据库设计的目标除了包括集中式数据库设计中的目标外,还要包括以下几点:
分布式数据库的本地性或近地性;
控制数据的适当冗余;
工作负荷分布;
存储的能力和费用;
(详细内容参看课本内容)
2、1)分片应遵守的原则:(P45)
(1)完整性条件;
(2)可重构条件;
(3)不相交条件
2)分片的方式:(P45)
(1)水平分片:是对全局关系执行“选择”操作。
分为基本分片和基于到处分片。
(2)垂直分片;是通过“投影”操作把它的属性分成若干组。
3、P67,习题2.9
第三章分布式数据库的查询处理与优化
1、分布式数据库查询处理的分类及层次结构:
1)分布式数据库查询的分类:(P76)
(1)局部查询;
(2)远程查询;
(3)全局查询;
2)层次结构:(P78)
分布式数据库查询处理的层次结构,查询处理可分为四个层次:
(1)查询分解:将查询问题转换成一个定义在全局关系上的关系代数式;
(2)数据本地化:把一个在全局关系上的查询,进行具体化,落实到适合
片段上的查询;
(3)全局优化:寻找最优策略;
(4)局部优化:每个子站点上执行的子查询;
2、查询优化的方式:(P79)
1)基于关系代数等价变换的查询优化处理
2)基于半连接算法的查询优化处理
3)基于直接连接算法的查询优化处理
(详细原理参照课本及例题3.3、例题3.4 、P95 习题3.6)
h
第四章分布式数据库中的事务管理和恢复
1、根代理及事务代理的概念:(P100 )
根代理:每个应用中负责启动整个事务的代理,也成为总代理;
事务代理:在分布式数据库系统中,为了完成在不同站点上的相应功能,分布式应用必须在这些站点中执行若干进程,这些进程称为该应用的事务代理。
根代理特权:
●只有根代理才能发出全局有效的事务开始、提交和撤销原语。
●只有根代理才能请求建立新的事务代理。
●各站点上的子事务都执行成功,根代理才能决定提交该事务,否则根代
理将决定撤销该事务。
2、两阶段提交协议如何划分及每阶段任务
3、分布式数据库的故障类型:
第五章分布式数据库的并发控制
1、串行调度:(P133)
设有一组事务T={T1, T2, T3…Tn},如果事务T i的所有操作都先于T j的
操作,记为T i < T j。
若有一个调度S,其每个事物的执行均有T i < T j
对所有的i不等于j,记为S={…<T i < T j…},则称S为一个串行调度。
2、可串行调度:(P134)
让有冲突的操作串行执行,非冲突的操作并行执行。
(详细参照课本内容)
4、看题P171 习题5.2、习题5.3。