分布式数据库系统复习材料

合集下载

分布式数据库复习题(佟玉君).doc

分布式数据库复习题(佟玉君).doc

一、名词解释1.DDBS: (Distributed DataBase System)分布式数据库系统,是一个物理上分散而逻辑上集中的数据集。

2.Transparency:也称分布透明性(Distribution Transparency),分布透明性指用户不必关系数据的逻辑分片,不必关心数据物理位置分配的细节,也不必关系各个场地上数据库数据模型。

分布透明性可归入物理独立性的范围。

包括三个层次:分片透明性、位置透明性和局部数据模型透明性。

3.Transaction:事务,是访问数据库的最小逻辑工作单位,它是一个操作序列。

分布式事务是一个分布式操作的序列,被操作的数据分布在不同站点上。

4.Concurrency:迸发控制,并发控制就是负责正确协调并发事务的执行,保证并发存取操作不至于破坏数据库的完整性和一致性,确保并发执行的多个事务能够正确地运行并获得正确的结果。

5.Reliability:数据库可靠性,指数据库在一个给定的时间间隔内不产生任何失败的概率。

二、简答题1、简述分布式数据库12条规则。

答:1.局部自治2.不依赖于中心节点3.不间断的处理4.位置独立性5.分片独立性6. 副本独立性7.分布式查询处理8.分布式事务管理9.硬件独立性10.操作系统独立性11.网络独立性12. DBMS独立性独立性用户可以从逻辑的高度对数据进行操作,就如同数据都存用户应该可以从逻辑的观点出发进行操作,就如同数据实际用户可以从逻辑的高度对数据进行操作,就如同根本没有副本用户应该可以从逻辑的观点出发进行操作,高可靠性,高可靠性,高可用性用户不需要了解数据实际存储的位置,用户不需要了解数据实际存储的位置在给定节点上的所有操作都是由所在节点控制的。

在给定节点上的所有操作都是由所在节点控制的。

所有的节点平等对待,不依赖中心,所有的节点平等对待,不依赖中心,主节点提供集中的的存在一样。

上并没有分片一样。

的存在一样。

上并没有分片一样。

分布式数据库复习要点

分布式数据库复习要点

分布式数据库复习要点第一章1、分布式数据库的定义(P4)物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。

分布式数据库系统可以看成是计算机网络和数据库系统的有机结合。

2、分布式数据库的两种分类方法(P7)●按局部DBMS的数据模型分同构型DDBS:各个站点上数据库使用同一数据模型同构同质型-数据模型相同,且是同一种DBMS(同一厂家)同构异质型-数据模型相同,不是同一种DBMS异构型DDBS :各站点上数据库的数据模型类型不同全局控制集中型DDBS:全局控制机制和全局数据词典位于中心站点全局控制分散型DDBS:全局控制机制和全局数据词典分散在网络的各个站点上。

全局控制可变型DDBS:也称主从型DDBS。

分成两组站点,一组包含全局控制机制和全局控制词典,另外一组不包含。

3、分布式数据库的组成成分(两部分)(P9)●数据:分布式数据库的主体,包括局部数据和全局数据。

●数据目录:数据结构的定义、全局数据的分片、分布、授权、事务恢复等描述,包括局部和全局数据目录。

4、分布式数据库的数据分片的定义和类型(3种)(P10)数据分片:又称数据分割、数据分段,局部数据库是由全局数据库分割而成。

三种类型:●水平分片:按特定条件把全局关系的所有元组划分成若干个互不相交的子集,对全局关系施加选择运算。

●垂直分片:把全局关系的属性集分成若干个子集,对全局关系施加投影运算。

●混合分片:以上两种方法的混合。

5、分布式数据库的分布策略(4条)(P11)数据分布:根据某种策略把数据分片所得的逻辑片断分散地存储在各个站点上.●集中式:所有数据都安排在同一站点上●分割式:所有数据只有一份,被分割成若干个逻辑片段,每个片段被放置在特定的站点●复制式:所有数据有多个副本,每个站点都有一个完整的数据副本●混合式:分割式和复制式的混合6、分布式数据库的模式结构(P13)分四层:●全局外层:全局外模式---全局应用的用户视图。

分布式数据库系统复习题

分布式数据库系统复习题

一、何为分布式数据库系统?一个分布式数据库系统有哪些特点?答案:分布式数据库系统通俗地说,是物理上分散而逻辑上集中的数据库系统。

分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位连接起来,共同组成一个统一的数据库系统。

因此,分布式数据库系统可以看成是计算机网络与数据库系统的有机结合。

一个分布式数据库系统具有如下特点:物理分布性,即分布式数据库系统中的数据不是存储在一个站点上,而是分散存储在由计算机网络连接起来的多个站点上,而且这种分散存储对用户来说是感觉不到的。

逻辑整体性,分布式数据库系统中的数据物理上是分散在各个站点中,但这些分散的数据逻辑上却构成一个整体,它们被分布式数据库系统的所有用户共享,并由一个分布式数据库管理系统统一管理,它使得“分布”对用户来说是透明的。

站点自治性,也称为场地自治性,各站点上的数据由本地的DBMS管理,具有自治处理能力,完成本站点的应用,这是分布式数据库系统与多处理机系统的区别。

另外,由以上三个分布式数据库系统的基本特点还可以导出它的其它特点,即:数据分布透明性、集中与自治相结合的控制机制、存在适当的数据冗余度、事务管理的分布性。

二、简述分布式数据库的模式结构和各层模式的概念。

分布式数据库是多层的,国内分为四层:全局外层:全局外模式,是全局应用的用户视图,所以也称全局试图。

它为全局概念模式的子集,表示全局应用所涉及的数据库部分。

全局概念层:全局概念模式、分片模式和分配模式全局概念模式描述分布式数据库中全局数据的逻辑结构和数据特性,与集中式数据库中的概念模式是集中式数据库的概念视图一样,全局概念模式是分布式数据库的全局概念视图。

分片模式用于说明如何放置数据库的分片部分。

分布式数据库可划分为许多逻辑片,定义片段、片段与概念模式之间的映射关系。

分配模式是根据选定的数据分布策略,定义各片段的物理存放站点。

局部概念层:局部概念模式是全局概念模式的子集。

分布式数据库复习题

分布式数据库复习题

1.试叙述分布式DBS的体系结构,它有什么特征?2.简述分布式数据库的两种分类方法。

3.简述分布式数据库中可能出现的故障类型。

4.简述分布式数据库的功能。

5.什么是并发控制的定义?6. 什么是分布式数据库?7.分布式事务的特性?8.分布式数据库的组成分成哪两部分?9.分布式数据库的数据分片的定义和类型?10.半连接有什么用途?半连接的收益和代价是如何计算的?11.画出分布式数据库的模式结构。

12.给出分布式数据库设计步骤13.下面是某学院的一个学生档案数据库的全局模式:Student={sno,sname,sex,birth,major,class,dno}Grade={sno,cno,grade}其中sno,sname,sex,birth为学生的“学号”,姓名,性别和出生日期,major,class,dno为专业,班级和所属的“系号”。

全学院共有8个系,dno分别为1,2,…8。

其中cno为课程号,grade 为考试成绩。

根据需要,要求将学生关系Student中的{sno,class }保存在场地0,其他属性和成绩Grade按“系号”1-4,5-6分别保存在场地1和场地2上。

根据上述要求,将全局模式进行分片,写出分片定义和分片条件。

分片定义和分片条件Stu = Student∞Gradesno=snoStudent1=ПStusno,classStuTemp=П,snam e,,,sexm ajordnobirthTempStudent2=δ<=dno1<=4TempStudent3=δ<=dno65<=Site Student1(0), Student2(1), Student3(2);(1)指出各分片的类型,并画出“分片树”。

(2)假设要求查询“系号”是1的所有学生的姓名和成绩,写出在全局模式上的SQL查询语句,并要求转换成相应的关系代数表示,画出全局查询树,请依次进行全局优化和分片优化,画出优化后的查询树。

分布式数据库系统复习材料

分布式数据库系统复习材料

分布式数据库系统复习材料在学习和复习分布式数据库系统时,需要掌握以下几个关键知识点:1.分布式数据库架构:分布式数据库系统可以采用集中式架构、两层架构、三层架构等不同的架构模式。

其中集中式架构通过一个中央服务器管理所有的数据,两层架构将数据分为客户端和服务器两部分进行管理,三层架构引入中间层服务器来协调不同的功能和数据层。

2.分布式数据库一致性:分布式数据库系统需要保证数据的一致性。

数据的一致性可以通过ACID原则来保证,即原子性、一致性、隔离性和持久性。

此外,还可以使用分布式事务来保证数据的一致性,分布式事务可以通过两阶段提交(2PC)或者三阶段提交(3PC)来实现。

3.分布式数据库的查询:分布式数据库系统可以进行分布式查询,即将查询请求分发给不同的节点进行处理。

常用的查询分发策略包括哈希分发、范围分发和复制分发。

哈希分发根据查询内容的哈希值将查询请求分发到对应的节点上,范围分发根据数据的范围将查询请求分发到对应节点上,复制分发将查询请求分发到多个节点上进行处理。

4.分布式数据库的数据复制:分布式数据库系统可以通过数据复制来提高数据的可靠性和性能。

数据复制可以采用同步复制或者异步复制方式。

同步复制要求数据在所有节点上都写入成功后才算成功,而异步复制则可以先将数据写入一个节点,然后再异步地将数据复制到其他节点上。

5.分布式数据库的容错与恢复:分布式数据库系统需要具备容错和恢复机制,以应对节点故障或者网络故障等异常情况。

常用的容错机制包括故障检测、容错存储和故障恢复。

故障检测可以通过心跳机制或者节点监视来实现,容错存储可以通过数据备份或者数据冗余来实现,故障恢复可以通过副本恢复或者数据迁移来实现。

6.分布式数据库的性能优化:分布式数据库系统可以通过多种方式来优化性能。

常用的性能优化方法包括数据分片、负载均衡和缓存机制。

数据分片可以将数据分散到不同的节点上,以减轻节点的负载;负载均衡可以将查询请求均匀地分发到各个节点上,以提高查询的响应速度;缓存机制可以将频繁查询的数据缓存在节点上,以减少磁盘访问,提高查询性能。

Nosql分布式数据库复习题带答案

Nosql分布式数据库复习题带答案

Nosql分布式数据库复习题带答案一、选择题1、以下哪个不是Nosql分布式数据库的特点?A.高度可扩展性B.面向文档的数据模型C.严格的ACID事务D.水平扩展能力答案:C.严格的ACID事务解释:Nosql分布式数据库通常不提供严格的ACID事务,而是采用柔性事务模型,如最终一致性。

这是因为Nosql系统设计的主要目标是高可用性和高性能,而严格的ACID事务会限制这些目标的实现。

2、下列哪个不是Nosql分布式数据库的查询语言?A. SQLB. JSON查询语言C. MapReduceD.结构化查询语言答案:D.结构化查询语言解释:Nosql分布式数据库通常使用非结构化查询语言,如SQL或JSON 查询语言,而不是结构化查询语言。

这是因为Nosql数据库以非结构化和半结构化数据为主,而结构化查询语言主要用于关系型数据库中的结构化数据。

3、下列哪个是分布式Nosql数据库中的一种常用技术?A.分片技术B.复制技术C.缓存技术D.压缩技术答案:A.分片技术解释:在分布式Nosql数据库中,分片技术是一种常见的技术,用于将数据分散到多个节点上,以提高数据的可用性和扩展性。

复制技术用于数据的冗余备份,缓存技术用于提高查询速度,而压缩技术用于减少存储空间的使用。

4、下列哪个是关系型数据库的优点?A.高度可扩展性B.面向文档的数据模型C.支持严格的事务一致性D.高并发读写能力答案:C.支持严格的事务一致性解释:关系型数据库支持严格的事务一致性,这是其一个重要优点。

关系型数据库使用ACID事务,确保数据在多个操作中保持一致性。

其他选项都是Nosql分布式数据库的优点。

5、下列哪个是分布式数据库的缺点?A.复杂性增加B.性能瓶颈C.数据一致性降低D.成本增加答案:A.复杂性增加解释:分布式数据库的设计和维护比单一数据库更复杂,需要更多的技术和资源来管理。

在分布式系统中,故障恢复和数据复制等任务也更加复杂。

因此,分布式数据库的复杂性增加是其主要的缺点。

分布式数据库复习重点

分布式数据库复习重点

DBMS1
DBMS2
DBMSm
4.
网络
1 1.1
分布式数据库设计概述 DDBS创建方法
重构法
根据实现环境 和用户需求
1.
用户1
用户2
用户n
2.
按照DDBS的 设计思想和方 法
从总体设计做 起,包括 LDBS,重新建 立一个DDBS 可有效解决数 据一致性、完 整性和可靠性 问题。 通常是同构异 质或同构同质 DDBS
2 自顶向下设计DDB
2.2 数据的分片设计
小项谓词选择
(1) A<10 (2) A<10 (3) A<10 (4) A<10 (5) A<10 (6) A<10 (7) A<10 (8) A<10
A>5 Loc=SA Loc=SB A>5 Loc=SA ¬(Loc=SB) A>5 ¬(Loc=SA) Loc=SB A>5 ¬(Loc=SA) ¬(Loc=SB) ¬(A>5) Loc=SA Loc=SB ¬(A>5) Loc=SA ¬(Loc=SB) ¬(A>5) ¬(Loc=SA) Loc=SB ¬(A>5) ¬(Loc=SA) ¬(Loc=SB)
5 分布式数据库系统的体系结构和组成成分 5.3 DDBS中数据的分片与分布
1. 数据分片(P.10) 又称数据分割、数据分段,局部数据库是由全局数据库分割而成 • • • 水平分片(对全局关系施加选择运算) 垂直分片(对全局关系施加投影运算) 混合分片(两种方法的混合)
数据分片要准守的原则:
• • • 完备性原则:要把所有的数据映射到各个片断中 可重构原则:关系分片后的各个片断可重构整个关系 不相交原则:关系分片后的各个片断不能重叠

分布式数据库试题及答案

分布式数据库试题及答案

数据库试题目录1. 九八年秋季试题 (5)1.1. 概念题 (5)1.1.1. 比较半连接方法和枚举法的优缺点。

(5)1.1.2. 2PL协议的基本思想。

(5)1.1.3. WAL协议的主要思想。

(5)1.1.4. SSPARC三级模式体系结构。

(5)1.1.5. 设计OID的数据结构时应考虑哪些问题。

(6)1.2. 某个大学中有若干系,且每个系有若干个班级和教研室,每个教研室有若干个教员,其中教授、副教授每个人带若干名研究生。

每个班有若干名学生,每个学生可选修若干门课程,每门课程可由若干学生选修。

完成下列各种要求: (7)1.3. 下面是某学院的一个学生档案数据库的全局模式: (9)1.3.1. 将全局模式进行分片,写出分片定义和分片条件。

(9)1.3.2. 指出各分片的类型,并画出分片树。

(9)1.3.3. 假设要求查询系号为1的所有学生的姓名和成绩,写出在全局模式上的SQL查询语句,并要求转换成相应的关系代数表示,画出全局查询树,请依次进行全局优化和分片优化,画出优化后的查询树。

要求给出优化变换过程。

(10)1.4. 设数据项x,y存放在S1场地,u,v存放在S2场地,有分布式事务T1和T2,T1在S1场地的操作为R1(x)W1(x)R1(y)W1(y),T2在S1场地的操作为R2(x)R2(y)W2(y);T1在S2场地上的操作作为R1(u)R1(v)W1(u),T2在S2场地上的操作作为W2(u)R2(v)W2(v)。

对下述2种情况,各举一种可能的局部历程(H1和H2),并说明理由。

(11)1.4.1. 局部分别是可串行化,而全局是不可串行化的 (11)1.4.2. 局部和全局都是可串行化的。

要求按照严格的2PL协议,加上适当的加锁和解锁命令,(注意,用rl(x)表示加读锁,wl(x)表示加对x加写锁,ul(x)表示解锁)121.5. 试述面向对象的数据库系统中页面服务器和对象服务器两种Client/Server体系结构的主要特点, (12)2. 九九年春季试题 (13)2.1. DBMS解决了信息处理技术中的哪些挑战? (13)2.2. 在关系数据库应用设计中,为什么要对数据库模式进行规范化? (13)2.3. 简述ACID特性。

分布式数据库系统架构设计考试

分布式数据库系统架构设计考试

分布式数据库系统架构设计考试(答案见尾页)一、选择题1. 分布式数据库系统(DDBS)的三个层次及其主要特点是什么?A. 存储层、逻辑层、应用层B. 节点层、网络层、存储层C. 数据层、查询层、事务层D. 主节点层、从节点层、副本层2. 什么是分布式数据库系统的CAP理论,以及它的三个要素?A. 一致性、可用性、分区容错性B. 一致性、可用性、数据一致性C. 可用性、分区容错性、数据一致性D. 数据完整性、可用性、分区容错性3. 什么是分布式数据库系统的BASE理论,以及它的三个特性?A. 基本可用、软状态、最终一致性B. 基本可用、硬状态、即时一致性C. 基本可用、软状态、即时一致性D. 基本可用、硬状态、最终一致性4. 分布式数据库系统中的一种常见的分片技术是什么?A. 水平分片B. 垂直分片C. 分区D. 列分片5. 什么是分布式数据库系统中的一致性哈希算法?A. 通过哈希函数将关系分成不同的碎片B. 通过将关系映射到环上,并分配哈希值C. 通过将关系映射到树上,并分配哈希值D. 通过将关系映射到网格上,并分配哈希值6. 分布式数据库系统中的复制策略有哪些?A. 完全复制B. 不完全复制C. 混合复制D. 并发复制7. 什么是分布式数据库系统中的分布式事务?A. 由一组相关的本地事务组成,这些事务在逻辑上是一致的B. 由一组相关的本地事务组成,这些事务在逻辑上是一致的,并且提交或回滚C. 由一组相关的远程事务组成,这些事务在逻辑上是一致的D. 由一组相关的远程事务组成,这些事务在逻辑上是一致的,并且提交或回滚8. 分布式数据库系统中的负载均衡技术在哪个方面提高了系统性能?A. 将请求分散到多个数据库服务器上B. 提高数据库服务器的缓存性能C. 优化数据库索引D. 优化数据库查询语句9. 什么是分布式数据库系统中的数据复制?A. 将数据从一个数据库同步到另一个数据库的过程B. 将数据从一个数据库同步到另一个数据库,并在同步过程中保持数据的一致性C. 将数据从一个数据库同步到另一个数据库,并在同步过程中保持数据的一致性和完整性D. 将数据从一个数据库同步到另一个数据库,并在同步过程中保持数据的一致性、完整性和可扩展性10. 什么是分布式数据库系统中的分区和水平分片?A. 分区是将关系分成不同的片段,水平分片是在垂直方向上分割关系B. 分区是将关系分成不同的片段,水平分片是在水平方向上分割关系C. 分区是将关系分成不同的片段,水平分片是在水平方向上分割关系,并在每个片段上实现数据的分片D. 分区是将关系分成不同的片段,水平分片是在水平方向上分割关系,并在每个片段上实现数据的分片,同时保证数据的一致性11. 分布式数据库系统的定义及其与传统数据库系统的区别是什么?A. 分布式数据库系统由多个物理上分散的数据库组成,逻辑上是一个统一的整体。

计算机数据库设计与分布式数据库技术复习

计算机数据库设计与分布式数据库技术复习

计算机数据库设计与分布式数据库技术复习一、引言计算机数据库是现代信息系统的重要组成部分,用于存储、管理和操作大量的结构化数据。

而分布式数据库技术则使得数据库可以在多个独立的计算机上进行分布式存储和处理,提高了系统的可伸缩性和可靠性。

本文将对计算机数据库设计和分布式数据库技术进行复习和总结。

二、计算机数据库设计1. 数据库的概念和分类数据库是指一个组织和管理数据的系统,主要分为关系型数据库和非关系型数据库两大类。

关系型数据库以表格的形式存储数据,通过SQL语言进行操作;而非关系型数据库则采用键值对、文档、列族等方式存储数据,如MongoDB、Redis等。

2. 数据库设计的基本原则数据库的设计需要遵循一些基本原则,包括实体完整性、关系完整性、域完整性等。

实体完整性要求每条记录都具有唯一标识,关系完整性要求表之间的关联关系必须符合业务逻辑,域完整性要求每个字段的取值必须符合约束条件。

3. 数据库模型和范式数据库模型定义了数据库的结构和操作方式,主要有层次模型、网状模型和关系模型等。

其中关系模型是最常用的数据库模型,通过表格的形式表示数据之间的关系。

范式是用来评价数据库设计的标准,包括第一范式、第二范式和第三范式等,用于保证数据的一致性和查找效率。

4. 数据库索引和查询优化数据库索引是提高查询效率的重要手段,通过在表上创建索引可以加快数据的查找速度。

常用的索引类型包括B树索引、哈希索引和全文索引等。

同时,通过优化查询语句的编写和数据库的物理组织结构,还可以进一步提高查询效率。

三、分布式数据库技术1. 分布式数据库的概念和架构分布式数据库是将数据库系统分布在多个计算机上,通过网络连接进行通信和协作,实现数据的分布式存储和处理。

分布式数据库的架构包括中心化架构、两层架构和三层架构等,其中三层架构是目前应用最为广泛的分布式数据库架构。

2. 分布式数据库的数据一致性和并发控制在分布式数据库中,由于数据的分布式存储和处理,需要解决数据一致性和并发控制的问题。

2023年分布式系统复习笔记

2023年分布式系统复习笔记

分布式系统复习笔记朱贵强(南京大学计算机科学与技术系,江苏省南京市210093)1 绪论1.1 分布式系统旳定义A distributed system is a collection of independent computers that appears to its user as a single, coherent system.(独立旳计算机旳集合,对这个系统旳顾客来说,系统就像一台计算机同样)。

1.1.1 定义包括了硬件和软件两个方面旳内容。

硬件指旳是机器自身是独立旳;软件是说对于顾客来讲就像在和单个系统打交道。

1.1.2 分布式系统旳目旳是单一性(single),不过区别于网络系统旳单一性,从功能上来说,网络系统都可以完毕,不过两者之间旳差异在于透明性。

而构造分布式系统也不仅仅是用网线连接若干台独立旳计算机。

1.2 分布式系统旳原因(why distributed)1.2.1 相对于集中系统,分布式系统旳长处1.2.2 相对于独立旳PC,分布式系统旳长处1.2.3 分布式系统旳缺陷1.3 分布式系统旳挑战(challenges,D2 P18-19)1.3.1 Heterogeneity异构性:独立旳计算机(系统)之间旳异构性,重要表目前系统、硬件、网络体系构造之间旳差异。

1.3.2 Openness开放性:通过一致旳接口实现通信和互访。

一种开放旳分布式系统根据一系列准则来提供服务,这些准则描述了所提供服务旳语法和语义。

一般接口旳语法比较轻易由IDL定义,不过语义比较难实现。

1.3.3 Security安全性:包括机密性、完整性,通过加密、访问控制、强行访问、隐蔽通道等方式实现。

1.3.4 Scalability可扩展性:通过规模、地区、管理扩展来度量,体现为服务器和网络能力有限所导致旳性能问题。

扩展技术有隐藏通信等待时间(异步通信,地区扩展合用),分布技术(把组件分割成多种部分并分散到系统中去),复制技(复制组件并把备份分布到系统各处,缓存是复制旳一种特殊形式,不过都会带来一致性旳问题)。

《分布式数据库系统及应用》知识总结

《分布式数据库系统及应用》知识总结

第一章分布式数据库系统概述1、理解分布式数据库系统的特点:(1)物理分布性:数据不是存放在一个站点上(2)逻辑整体性:是与分散式数据库系统的区别(3)站点自治性:是与多处理机系统的区别(4)数据分布透明性(5)集中与自治相结合(6)存在适当的数据冗余度(7)事务管理的分布性2、能够按照不同标准描述分布式数据库系统的分类:(1)按局部DBMS的数据模型分类○1同构型DDBSa)同构同质型(同一个公司的同一种模式)b)同构异质型(不同公司不同模式)○2异构型DDBS(2)按DDBS的全局控制类型分类○1全局控制集中型DDBS:全局控制机制和全局数据词典位于中心站点○2全局控制分散型DDBS:全局控制机制和全局数据词典分散在网络的各个站点上。

○3全局控制可变型DDBS:也称主从型DDBS。

分成两组站点,一组包含全局控制机制和全局控制词典,另外一组不包含。

3、理解分布式数据库中数据的独立性和分布透明性:逻辑独立性物理独立性(表示用户程序与数据的全局逻辑结构和数据的物理结构无关)分布独立性(用户不必关心全局数据的分布情况,包括逻辑分片、物理位置分配情况以及各站点数据库的数据模型等)分三个层次:▪分片透明性(完全分布透明性):位于全局概念模式与分片模式之间,用户编写应用程序只对全局关系进行操作,不必考虑数据的逻辑分片▪位置透明性(中级分布透明性):位于分片模式和分配模式之间。

包括两情形-----各片段被复制情况和片段及其各副本的站点位置分配情况。

▪局部数据模型透明性(低级分布透明性):需要知道数据的分片情况和站点分配情况第二章分布式数据库系统设计1、理解分布式数据库的设计目标:(1)本地性或近地性○1尽量减少通信次数和通信量,90/10准则○2分片和分布方案(本地和远程访问次数)择优(2)控制数据适当冗余○1冗余增加了可靠性、可用性,提高了效率○2维护数据一致性开销增加(3)工作负荷分布○1各站点可以分担整个工作任○2本地性降低(4)存储能力和费用2、理解水平分片的定义、分类和应用:定义:水平分片是对全局关系执行“选择”操作,把具有相同性质的元祖进行分组,构成若干个不相交的子集。

分布式数据库知识点整理

分布式数据库知识点整理

分布式数据库知识点整理1.一致性:-强一致性:在任何时间点,任何用户对数据库的操作都应该得到相同的结果。

-弱一致性:在分布式环境下,不同节点之间的数据可能存在一段时间的不一致性,但最终会达到一致性。

2.数据分片和分区:-将数据划分为多个分片或分区,并将其存储在不同的节点上,以实现数据的分布式存储和查询。

-常见的分片策略包括:基于哈希、基于范围、基于列表等。

3.数据复制:-将数据复制到多个节点上,以提高数据的可用性和容错性。

-主从复制:一个节点(主节点)负责接收写入请求,其他节点(从节点)复制主节点的数据。

-复制的方式包括同步复制和异步复制。

4.分布式事务:-分布式环境下,多个节点之间的事务一致性需要保证。

5.数据一致性与可用性的权衡:-数据的一致性和可用性往往是相互矛盾的。

数据复制和分片会增加系统的可用性,但可能导致数据的不一致性。

6.数据分布式查询:-查询在分布式数据库中的执行需要考虑到数据的分布和复制情况。

-中心化查询:将查询发送到一个中央节点,由该节点负责查询和合并结果。

-分布式查询:将查询发送到各个节点上并行执行,并将结果合并返回。

7.数据一致性调度与冲突解决:-在分布式环境中,不同节点上的数据修改操作可能存在冲突,需要一致性调度和冲突解决机制。

-基于锁的调度方法:通过加锁保证数据的一致性,但可能导致性能瓶颈。

-基于时间戳的调度方法:通过时间戳判断数据操作的先后顺序,从而解决冲突。

8.分布式数据库的扩展性:-分布式数据库可以通过添加更多的节点来扩展存储容量和处理能力。

9.分布式数据库的容错性:-分布式数据库可以通过数据复制和数据分片的方式实现容错,即使一些节点发生故障,系统仍能继续运行。

10.分布式数据库的监控与管理:-分布式数据库需要进行监控和管理,以保证其正常运行和性能优化。

-监控工具可以实时监测数据库的状态、性能和可用性。

-管理工具可以进行各种管理操作,如节点的添加和删除、数据的迁移等。

分布式数据库复习要点

分布式数据库复习要点

分布式数据库复习要点第一章1、分布式数据库的定义(P4)物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。

分布式数据库系统可以看成是计算机网络和数据库系统的有机结合。

2、分布式数据库的两种分类方法(P7)●按局部DBMS的数据模型分同构型DDBS:各个站点上数据库使用同一数据模型同构同质型-数据模型相同,且是同一种DBMS(同一厂家)同构异质型-数据模型相同,不是同一种DBMS异构型DDBS :各站点上数据库的数据模型类型不同全局控制集中型DDBS:全局控制机制和全局数据词典位于中心站点全局控制分散型DDBS:全局控制机制和全局数据词典分散在网络的各个站点上。

全局控制可变型DDBS:也称主从型DDBS。

分成两组站点,一组包含全局控制机制和全局控制词典,另外一组不包含。

3、分布式数据库的组成成分(两部分)(P9)●数据:分布式数据库的主体,包括局部数据和全局数据。

●数据目录:数据结构的定义、全局数据的分片、分布、授权、事务恢复等描述,包括局部和全局数据目录。

4、分布式数据库的数据分片的定义和类型(3种)(P10)数据分片:又称数据分割、数据分段,局部数据库是由全局数据库分割而成。

三种类型:●水平分片:按特定条件把全局关系的所有元组划分成若干个互不相交的子集,对全局关系施加选择运算。

●垂直分片:把全局关系的属性集分成若干个子集,对全局关系施加投影运算。

●混合分片:以上两种方法的混合。

5、分布式数据库的分布策略(4条)(P11)数据分布:根据某种策略把数据分片所得的逻辑片断分散地存储在各个站点上.●集中式:所有数据都安排在同一站点上●分割式:所有数据只有一份,被分割成若干个逻辑片段,每个片段被放置在特定的站点●复制式:所有数据有多个副本,每个站点都有一个完整的数据副本●混合式:分割式和复制式的混合6、分布式数据库的模式结构(P13)分四层:●全局外层:全局外模式---全局应用的用户视图。

分布式数据库复习资料

分布式数据库复习资料

一.简答题1.说明分布式数据库设计与集中式数据库设计的主要区别。

2.试叙述分布式DBS的体系结构,它有什么特征?3.简述分布式数据库的创建方法与设计方法。

4.简述分布式数据库系统的透明性。

5.在分布式数据库系统中,为什么要对数据进行分片?什么是关系的片段?关系的片段有那些类型。

6.什么是简单谓词?什么是极小项谓词?7.分布式事务有哪些基本性质。

8.简述分布式数据库中可能出现的故障类型。

9.检查点的作用和需做的工作。

10.简述2PC协议。

11.基本2PL与严格2PL的异同。

12.如何理解分布式数据库的“可靠性”和“可用性”。

二.下面是某个公司人事数据库的两个全局关系EMP={eno,ename,title,salary,addr,phone,dno};DEPT={dno,dname}该公司共有3个部门,dno 分别为0,1,2。

要求将DEPT关系和EMP关系的部分属性(ename,addr,phone)保存在部门0的场地上,EMP关系的部分属性(title,salary)保存在所在部门场地上。

根据上述要求,(1)将全局模式进行分片,写出分片定义和分片条件(2)指出各分片的类型,并画出分片树(3)对查询select ename,salary,dname from EMP,DEPT where dno=2.进行全局优化,画出优化后的全局查询树(4)进行分片优化,画出优化后的分片查询树三.下面是当一个数据库系统出现故障时,日志文件中的信息说明::D为数据记录,下标i表示事务号,上标表示对数据的第j步操作;D jiB:表示事务i开始执行;i:表示事务i提交;Ci:表示事务i废弃;AiK:是检查点。

根据上述log 信息,完成下面的处理:(1)画出对应的事务并发执行图(2)找出发生故障时系统中的活动事务,确定“反做”和“重做”事务集(3)指出需要undo的和redo的数据记录。

分布式数据库系统原理与应用考试

分布式数据库系统原理与应用考试

分布式数据库系统原理与应用考试(答案见尾页)一、选择题1. 分布式数据库系统的定义及特点是什么?A. 分布式数据库系统是由多个物理数据库组成的,它们可以分布在不同的地理位置。

B. 分布式数据库系统提供了一个透明的、逻辑上集中、物理上分布的数据存储,使用户感觉好像数据只存储在一个数据库中。

C. 分布式数据库系统通过数据复制和分片技术实现数据的冗余和容错。

D. 分布式数据库系统的主要目标是提高数据访问性能和数据一致性。

2. 以下哪个选项不是分布式数据库系统的一致性策略?A. 串行处理B. 两阶段提交协议C. 检索优化D. 乐观并发控制3. 在分布式数据库系统中,如何实现数据分片?A. 通过范围分区B. 通过列表分区C. 通过哈希分区D. 通过目录分区4. 分布式数据库系统中的复制策略有哪些?A. 同步复制B. 异步复制C. 混合复制D. 并发复制5. 分布式数据库系统中的数据一致性是如何保证的?A. 通过分布式事务协议B. 通过分布式锁机制C. 通过数据复制和分片D. 通过备份和恢复机制6. 什么是分布式数据库系统的CAP理论?A. 一致性、可用性和分区容错性不能同时满足B. 一致性、可用性和分区容错性可以同时满足C. 一致性、可用性和分区容错性之间存在权衡D. 以上都不是7. 在分布式数据库系统中,如何实现数据镜像?A. 通过主从复制B. 通过分片C. 通过复制集D. 通过日志备份8. 分布式数据库系统中的分片有哪几种类型?A. 范围分片B. 列表分片C. 哈希分片D. 直接分片9. 什么是分布式数据库系统中的读写分离?A. 将读操作和写操作分开在不同的节点上执行B. 将读操作和写操作集中在同一个节点上执行C. 将写操作分散到多个节点上执行,而读操作集中在一个节点上执行D. 将写操作集中在一个节点上执行,而读操作分散到多个节点上执行10. 分布式数据库系统中的故障恢复策略有哪些?A. 主从复制恢复B. 副本恢复C. 分片恢复D. 重建恢复11. 以下哪个不是分布式数据库系统的常见分区策略?A. 节点分区B. 范围分区C. 距离分区D. 列分区12. 分布式数据库系统中,分布式事务的处理方式有哪几种?A. 两阶段提交(2PC)B. 三阶段提交(3PC)C. 检查点(Checkpoint)D. 分布式事务协议(DTCP)13. 什么是分布式数据库中的复制策略?有哪些常见的复制策略?A. 主从复制B. 并发复制C. 分片复制D. 混合复制14. 在分布式数据库系统中,如何实现数据的负载均衡?A. 数据库中间件B. 分布式缓存C. 负载均衡器D. 读写分离15. 分布式数据库系统中,如何保证数据的一致性和完整性?A. 两阶段提交(2PC)B. 三阶段提交(3PC)C. 检查点(Checkpoint)D. 四阶段提交(4PC)16. 以下哪个是分布式数据库系统中的分布式锁机制?A. 乐观锁B. 悲观锁C. 行级锁D. 页级锁17. 分布式数据库系统中,如何处理跨库查询?A. 使用SQL查询B. 使用中间表C. 使用分布式查询语言(DQL)D. 使用ETL工具18. 分布式数据库系统中,如何实现数据备份和恢复?A. 定期全量备份B. 增量备份C. 差量备份D. 主从备份19. 以下哪个是分布式数据库系统的发展趋势?A. 向规模更小的分布式数据库发展B. 向更高性能的分布式数据库发展C. 向更容易扩展的分布式数据库发展D. 向更强一致性的分布式数据库发展20. 以下哪个选项是分布式数据库系统中常用的数据复制技术?A. 主从复制B. 并发复制C. 混合复制D. 非阻塞复制21. 分布式数据库系统中的分片策略有哪几种?A. 范围分片B. 列分片C. 层次分片D. 索引分片22. 在分布式数据库系统中,如何实现数据的一致性?A. 通过分布式事务协议如两阶段提交(2PC)实现B. 通过分布式锁机制实现C. 通过分布式日志和重放技术实现D. 通过数据复制和分片实现23. 分布式数据库系统面临的主要挑战包括哪些?A. 数据复制的一致性问题B. 查询优化的复杂性C. 安全性和隐私保护问题D. 系统的可靠性和容错性24. 以下哪个选项是分布式数据库系统中常用的分片算法?A. 条件分片B. 基于范围的分片C. 基于哈希的分片D. 基于权重的分片25. 分布式数据库系统中的分布式事务处理有哪些类型?A. 两阶段提交(2PC)B. 三阶段提交(3PC)C. 这些选项都不是D. 没有分布式事务处理26. 以下哪个选项是分布式数据库系统中常用的负载均衡技术?A. 轮询负载均衡B. 权重负载均衡C. 简单轮询D. 加权轮询27. 分布式数据库系统中的数据迁移有以下几种类型?A. 结构迁移B. 非结构迁移C. 逻辑迁移D. 物理迁移28. 以下哪个选项是分布式数据库系统中常用的故障恢复技术?A. 回滚操作B. 前滚操作C. 数据重同步D. 数据复制恢复29. 分布式数据库系统的定义及其与传统数据库系统的区别是什么?A. 分布式数据库系统可以在多个节点上存储数据,而传统数据库系统通常在一个节点上存储所有数据。

分布式数据库考试题目-共5题

分布式数据库考试题目-共5题

1.分布式数据库有哪些体系结构及含义分布式数据库分布式数据库系统中的数据是分布存放在计算机网络的不同场地的计算机中,每一场地都有自治处理(独立处理)能力并能完成局部应用。

当今流行的数据库系统的体系结构典型的是客户端/服务器模式,客户端为用户提供数据操作接口,服务器为用户提供数据处理功能,分布式数据库系统从功能层次可以划分为C/S结构,若从场地能力划分,又类似于对等性结构,因为个节点功能平等。

1)基于客户端/服务器端(C/S)的体系结构C/S结构的基本原则是将计算机应用任务分解成多个子任务,由多台计算机分工完成,即“功能分布”原则。

客户机完成数据处理、数据表示、用户接口等功能。

服务器完成DBMS的核心功能。

应用处理器(AP):用于完成分布数据处理的软件,如:处理访问多个场地的请求,查询全局字典中分布信息等。

数据处理器(DP):负责进行数据管理的软件,类似于一个集中式数据库管理系统(DBMS)通信管理器(CM):负责为AP和DP在多个场地之间传送命令和数据。

2)基于“中间件”的C/S结构传统的c/s结构是由全局事物管理统一协调和调度事物的执行,属于紧耦模式,导致系统复杂度高,资源利用率低,为此目前的分布式数据库系统均采用基于“中间件”的C/S结构,由中间件实现桥接C/S的功能,使C/S 之间具有松散的耦合模式2.分布式数据库系统,有几类:多数据库集成系统,对等数据库系统。

描述一下多数据库系统(MDB):MDBS 是在己经存在的数据库系统(称为局部数据库系统:LDBs) 之上为用户提供一个统一的存取数据的环境。

是指若干相关数据库的集合。

各个数据库可以存在同一场地,也可分布多个场地。

在多数据库系统中,不是所有子事务的成功或失败都影响全局事务的执行结果,多数据库事务中的部分结果也可被其它事务引用。

多数据库系统中,需要松弛型事务(relaxed transaction);事务是长事务(long transaction,目标是要实现对多副本的全局数据的并发操作,同时,要保证数据的一致性和局部场地的自治性。

分布式数据库系统知识点及习题

分布式数据库系统知识点及习题

第9章分布式数据库系统9.1 基本内容分析9.1.1 本章重要概念(1)分布计算的三种形式:处理分布,数据分布,功能分布。

(2)C/S系统,工作模式,技术特征,体系结构,两层、三层、多层C/S结构。

(3)DDBS的定义、特点、优点、缺点和分类;分布式数据存储的两种形式(分片和分配)。

(4)DDB的体系结构:六层模式,分布透明性的三个层次,DDBS的组成,DDBMS的功能和组成。

(5)分布式查询处理的查询代价,基于半联接的优化策略,基于联接的优化策略。

(6)分布式数据库的并发控制和恢复中出现的问题,以及处理机制。

9.1.2 本章的重点篇幅(1)两层、三层、多层C/S结构。

(教材P365-367)(2)分布式数据存储:分片和分配。

(教材P375-377)(3)DDB的体系结构。

(教材P378的图9.10,P381的图9.12)(4)基于半联接的执行示意图。

(教材P389的图9.17)9.2 教材中习题9的解答9.1 名词解释·集中计算:单点数据和单点处理的方式称为集中计算。

·分布计算:随着计算机网络技术的发展,突破集中计算框架,DBMS的运行环境逐渐从单机扩展到网络,对数据的处理从集中式走向分布式、从封闭式走向开放式。

这种计算环境称为分布计算。

·处理分布:指系统中处理是分布的,数据是集中的这种情况。

·数据分布:指系统中数据是分布的,但逻辑上是一个整体这种情况。

·功能分布:将计算机功能分布在不同计算机上执行,譬如把DBMS功能放在服务器上执行,把应用处理功能放在客户机上执行。

·服务器位置透明性:指C/S系统向客户提供服务器位置透明性服务,用户不必知道服务器的位置,就可以请求服务器的服务。

·集中式DBS:所有工作都由一台计算机完成,这种DBS称为集中式DBS。

·DDBS:是物理上分散逻辑上集中的DBS,每一场地既能完成局部应用又能完成全局应用,这种系统称为DDBS。

分布式数据库系统及其应用 复习

分布式数据库系统及其应用 复习

一、填空分布式数据库系统按局部数据库管理系统的数据模型分类,可以分为和两类。

同构型DDBS 异构型DDBS分布式数据库系统按全避控制系统类型分类,可以分为、和三类。

全局控制集中型DDBS 全局控制分散型DDBS 全局控制可变型DDBS分布式数据库是分布式数据库系统中各站点上数据库的逻辑集合,它由和组成。

应用数据库描述数据库数据分片的三种基本方法是:、和三类。

水平分片垂直分片混合分片分布式数据库中的数据分布策略有:、、和四层。

集中式分割式复制式混合式分布式数据库是多层模式结构,一般划分为、、和四层。

全局外层全局概念层局部概念层局部内层一个分布式数据库管理系统一般应包括、、和四个基本功能模块。

查询处理模块完整性处理模块调度处理模块可靠性处理模块分布透明性包括、和三个层次。

分片透明性位置透明性局部数据模型透明性分布式数据库系统的创建方法,大致可分为和两种。

组合法重构法集中式数据库设计一般包括:需求分析,概念设计,逻辑设计和物理设计四个阶段,分布式数据库设计除了上述四个阶段外,还需增加一些个新的阶段,它位于和之间。

分布设计逻辑设计物理设计水平分片的方法可归为和两种。

初级分片导出分片DA TAID-D相对于DA TAID-1增加了和两个阶段。

分布要求分析分布设计DA TAID-D中的分布设计分成、、和四个阶段。

分片设计非冗余分配冗余分配局部模式的重新构造分布式查询优化的准则是。

通信费用和响应时间最短在分布式系统中,查询代价QC=。

I/O代价+CPU代价+通信代价在分布式环境下,查询可分为、和三种类型。

局部查询远程查询全局查询分布式查询处理可以分为、、和四层。

查询分解数据本地化全局优化局部优化一个分布式事务通常是由和组成。

主事务子事务事务的四个特性是:、、和。

原子性一致性隔离性耐久性控制分布式事务所执行的控制模型有:、和。

主从模型三角模型层次模型分布式数据库系统中,通信故障可以分为和两种。

报文故障网络分割故障事务恢复主要是依靠来实现的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章1、世界上第一个分布式数据库系统SDD—1是由美国计算机公司(CCA)于1976年至1979年在DEC—10和DEC—20计算机上实现。

2、分布式数据库系统是数据库系统与计算机网络相结合的产物3、12条规则既不是相互独立的,也不是同等重要的,完全实现难度很大。

4、实现和建立分布式数据库系统绝对不是数据库技术与网络技术的简单结合。

分布式数据库系统虽然基于集中式数据库系统,但却有它自己的特色和理论基础。

5、一些商品化的数据库系统产品,如Oracle,Ingres,Sybase,Informix,IBM DB2等6、关系技术是分布式技术的一个先决条件。

7、分布式数据库系统是物理上分散而逻辑上集中的数据库系统。

分布式数据库系统使用计算机网络将地理位置分散而管理和控制又不需要不同程度集中的多个逻辑单位连接起来,共同组成一个统一的数据库系统。

因此,分布式数据库系统可以看成是计算机网络与数据库系统的有机结合。

8、在分布式数据库系统中,被计算机网络连接的每个逻辑单位是能够独立工作的计算机,这些计算机称为站点也称为结点。

9、在分布式数据库系统中,一个用户或一个应用如果只访问他注册的那个站点上的数据称为本地(或局部)用户或本地应用;如果访问涉及两个或两个以上的站点中的数据,称为全局用户或全局应用。

10、一个分布式数据库系统应用应该具有以下几种特点:(1)物理分布性:分布式数据库系统的数据具有物理分布性,这是与集中式数据库系统的最大差别之一(2)逻辑整体性:区别一个数据库系统是分散式还是分布式,只需判断该数据库系统是否支持全局应用(3)站点自治性:各站点上的数据由本地的DBMS管理,具有自治处理能力,完成本站点的应用(局部应用),这是分布式数据库系统与多处理机系统的区别11、数据分布透明性是指用户不必关心数据是如何被逻辑分片的,不必关心数据及其片段是否被复制及复制副本的个数,也不必关心数据及其片段的物理位置分布的细节,同时也不必关心局部场地上数据库支持哪种数据模型12、增加数据冗余度方便了检索,提高了系统的查询速度、可用性和可靠性,但不利于数据的更新,这将增加系统维护的成本13、按局部数据库管理系统的数据模型分类(1)同构型:同构同质型、同构异质型(2)异构型14、按分布式数据库系统的全局控制系统类型分类:全局控制集中型DDBS、全局控制分散型DDBS、全局控制可变型DDBS15、在集中式数据库系统中,除了计算机本身的硬件和软件外,主要成分有:数据库DB、数控管理系统DBMS和数据库管理员DBA。

分布式数据库系统在次基础上做了扩充:数据库分为局部DB和全局DB;数据库管理系统分为局部DBMS和全局DBMS;数据库管理员分为局部DBA和全局DBA15、分布式数据库有两部分组成:一部分是关于应用所需要的数据的集合,称为应用数据库,它是分布式数据库的主体;另一部分是关于数据库中数据结构的定义,以及全局数据的分片、分布的描述,称为数据字典、数据目录或元数据16、局部数据目录是指本站点中的局部数据字典,而全局数据目录就是全局数据字典,又称网路数据,是提供全局数据的描述和管理的相关信息,如数据的结构定义,数据的分片、分布处理、授权、事务恢复等的必要信息17、数据分片有三种基本方法:水平分片、垂直分片、混合分片18、定义各类片段要遵守的规则:完备性条件、可重构条件、不相交条件19、所谓数据分布是指分布式数据库中的数据不是存储在一个站点的计算机存储设备上,而是根据需要将数据划分成逻辑片段,按某种策略将这些片段分散地存储在各个站点上20、数据分布的策略有:集中式、分割式、复制式、混合式21、集中式数据库的模式结构:内模式、模式、外模式22、分布式数据库是多层模式结构:(1)全局外层:全局外模式(2)全局概念层:全局概念模式、分片模式、分配模式(3)局部概念层:局部概念模式(4)局部内层:局部内模式23、分布式数据库管理系统的功能模块:(1)查询处理模块|:查询处理模块至少由两部分组成:查询分析和优化处理(2)完整性处理模块:该模块主要负责维护数据库的完整性和一致性规则,处理多副本数据的同步更新等(3)调度处理模块(4)可靠性处理模块24、(分布式中)所谓数据分布独立性是指用户或用户程序使用分布式数据库如同使用集中式数据库那样,不必关心全局数据的分布情况,包括全局数据的逻辑分片情况、逻辑片段的站点位置分配情况,以及各站点上数据库的数据模型等。

25、分布透明性有三层:分片透明性、位置透明性、局部数据模型透明性26、分片透明性是分布透明性的最高层。

当分布式数据库具有分片透明性时,用户编写应用程序只对全局关系进行操作,不必考虑数据的逻辑分片,当分片模式改变时,只要改变全局概念模式到分片模式之间的映像,就不会影响用户程序,从而实现了数据分片透明性。

27、位置透明性也称分配透明性是分布透明性的中间层。

当分布式数据库具有位置透明时,用户编写应用程序要了解全局数据的数据分片情况,但不必了解各逻辑片段的复制副本情况,也不必关心各片段及其副本的站点位置分配情况。

当片段及其副本的存储站点改变时,只要改变从分片模式到分配模式之间的映像,就不会影响用户程序,从而实现了数据片段的位置透明性28、局部数据模型透明性也称局部映像透明性,即与各站点上数据库的数据模型无关,是分布透明性的最底层。

29、如果一个分布式数据库系统提供分片透明性,当然它也提供分配透明性和局部数据模型透明性,所以也称完全分布透明性,是分布透明性的最高级别如果一个分布式数据库系统提供分配透明性,而没有提供分片透明性,当然它也提供局部数据模型透明性,所以也称为中级分布透明性如果一个分布式数据库系统只提供局部数据模型透明性,不提供分片透明性,也不提供分配透明性,称为低级分布透明性如果一个分布式数据库系统,连局部数据模型透明性也不提供,即将异构数据模型转换也交给用户和用户程序自己处理,称为无分布透明性30、分布式数据库系统的有点:良好的可靠性和可用性、提高系统效率,降低通信费用、较大的灵活性和可伸缩性、经济性和保护投资31、分布式数据库系统中存在的技术问题:数据的分片、分布与冗余度;异构数据库的互联;分布式数据库的查询处理;分布式数据库的更新处理第二章1、分布式数据库系统的创建方法即分布式数据库系统的实现方法,大致可分为两种:组合法和重构法。

2、组合法也称为集成法,这是一种自底向上的创建方法。

3、创建分布式数据库系统应考虑:一方面要对网络系统的功能进行剖析,另一方面还需要对各个站点上原有的数据库系统进行剖析。

除此之外,还需解决数据的一致性、完整性以及可靠性。

(此方法是建立在原有的系统里)4、重构法是根据系统的实现环境和用户需求,按照分布式数据库系统的设计思想和方法,采用统一的观点,从总体设计做起,包括各站点上的数据库系统,重新建立一个分布式数据库。

(此方法是建立在新建的系统里)5、重构法的优点在于,可以按照统一的思想来考虑分布式数据库系统中的各种问题,有效地解决分布式数据库系统的数据一致性、完整性和可靠性。

6、(简答题)分布式数据库设计的目标包括集中式数据库设计中的目标,还要包括以下几点:(1)分布式数据库的本地性或进地性。

分布式数据库系统中最重要的目标是尽量减少对网络的利用,即尽可能减少站点之间的通信次数和通信量。

所以,分布式数据库设计中的一个主要原则是使数据和应用实现最大程度的本地性。

(2)控制数据库的适当冗余。

这不仅使应用具有高度的可用性和本地性,而且当数据的任何一个副本不能使用时,可方便地使用在另一站点中的该数据的副本进行恢复,从而提高系统的可靠性。

(3)工作负荷分布。

分布式计算机系统的一个重要特征是把工作负荷分布在网络中的各个站点上。

(4)存储的能和费用。

数据库的分布会受到各站点的存储能力的影响。

在网络中可以有专门用于存储数据的站点。

数据存储的费用与CPU,I/O及传输的费用相比是不重要的,但是必须考虑各站点可用存储空间的限制。

(P43具体实现,第三段)7、分布式数据库系统的创建方法有重构法和组合法,相应的分布式数据库设计方法也有两种方法,即自顶而下方法和自底而上方法。

前一种方法是从头开始设计分布式数据库,而后一种方法则通过聚集现存的数据库来设计分布式数据库。

8、设计集中式数据库的一般方法包括四个阶段:需求分析、概念设计、逻辑设计和物理设计。

分布式数据库设计出了上述阶段外,还要增加一个新的阶段,叫做分布设计,它位于逻辑设计与物理设计之间,以一个全局的、与站点无关的模式作为输入,以产生分布式数据库各站点的子模式(局部概念模式)作为结果输出。

9、分布式数据库的分布设计要求确定数据的分片和片段的分配。

分片是指把一个全局对象(实体或关系)细分成若干逻辑片段的过程;分配是指把各片段映射到一个或多个站点的过程,片段是最适合的数据分配单位。

10、在自顶向下的数据分布设计中,必须要解决的第一个问题是数据的分片设计。

11、因此,如果同一个片段的任意两个元素具有“相同的性质(例如访问频率相同)”的话,那么数据分配时所用的任意一种丰富都将把这两个元素放在一起,以这种方式得到的片段将是分布式数据库中数据合适的分配和存储单位。

12、分片设计的基本目的是产生一个对全局数据合适的划分方案。

13、P45 数据分片的基本类型和方法(全看)14、数据分片方法两种:水平分片与垂直分片。

两者交替可以产生混合分片。

15、水平分片的方法可归为初级分片和导出分片两类。

16、P45 例2.1,2.2,2.317、P48 垂直分片(全看)18、在确定数据片段的位置分配时,应根据应用需求确定设计是非冗余分配还是冗余分配。

在非冗余分配中,每个片段恰好映射到一个站点上;在冗余分配中,每个片段映射到一个或多个站点上。

19、在非冗余分配的设计中,最简单的方法是“最佳适应”方法。

20、冗余分配的设计可选用如下两种方法的任意一种。

1)“所有得益站点”法2)“附加复制”法21、P50 数据片段分配的费用和得益估算22、DA TAID—D是自顶向下设计分布式数据库的一个典型方法。

23、DA TAID-D要求对其增加两个阶段:分布要求分析阶段和分布设计阶段。

1)分布要求分析阶段:需要这一阶段是为了收集关于分布的信息,如水平分片的划分谓词,每一应用在各站点激活的频率等。

2)分布设计阶段:这一阶段始于全局数据库模式的规格说明和所收集的分要求,然后产生全局数据的分片模式和片段的位置分配模式,分配模式描述了分配在各站点上的数据情况。

24、建立三种类型的表作为分部要求分析阶段的输出:应用的频率表、实体的划分表和数据与应用的极化表。

25、分布设计的目的是从全局数据模式、逻辑访问表和分布要求出发,将数据分配在站点上。

相关文档
最新文档