分布式数据库系统_复习
分布式数据库复习题(佟玉君).doc
一、名词解释1.DDBS: (Distributed DataBase System)分布式数据库系统,是一个物理上分散而逻辑上集中的数据集。
2.Transparency:也称分布透明性(Distribution Transparency),分布透明性指用户不必关系数据的逻辑分片,不必关心数据物理位置分配的细节,也不必关系各个场地上数据库数据模型。
分布透明性可归入物理独立性的范围。
包括三个层次:分片透明性、位置透明性和局部数据模型透明性。
3.Transaction:事务,是访问数据库的最小逻辑工作单位,它是一个操作序列。
分布式事务是一个分布式操作的序列,被操作的数据分布在不同站点上。
4.Concurrency:迸发控制,并发控制就是负责正确协调并发事务的执行,保证并发存取操作不至于破坏数据库的完整性和一致性,确保并发执行的多个事务能够正确地运行并获得正确的结果。
5.Reliability:数据库可靠性,指数据库在一个给定的时间间隔内不产生任何失败的概率。
二、简答题1、简述分布式数据库12条规则。
答:1.局部自治2.不依赖于中心节点3.不间断的处理4.位置独立性5.分片独立性6. 副本独立性7.分布式查询处理8.分布式事务管理9.硬件独立性10.操作系统独立性11.网络独立性12. DBMS独立性独立性用户可以从逻辑的高度对数据进行操作,就如同数据都存用户应该可以从逻辑的观点出发进行操作,就如同数据实际用户可以从逻辑的高度对数据进行操作,就如同根本没有副本用户应该可以从逻辑的观点出发进行操作,高可靠性,高可靠性,高可用性用户不需要了解数据实际存储的位置,用户不需要了解数据实际存储的位置在给定节点上的所有操作都是由所在节点控制的。
在给定节点上的所有操作都是由所在节点控制的。
所有的节点平等对待,不依赖中心,所有的节点平等对待,不依赖中心,主节点提供集中的的存在一样。
上并没有分片一样。
的存在一样。
上并没有分片一样。
分布式数据库系统复习题
一、何为分布式数据库系统?一个分布式数据库系统有哪些特点?答案:分布式数据库系统通俗地说,是物理上分散而逻辑上集中的数据库系统。
分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位连接起来,共同组成一个统一的数据库系统。
因此,分布式数据库系统可以看成是计算机网络与数据库系统的有机结合。
一个分布式数据库系统具有如下特点:物理分布性,即分布式数据库系统中的数据不是存储在一个站点上,而是分散存储在由计算机网络连接起来的多个站点上,而且这种分散存储对用户来说是感觉不到的。
逻辑整体性,分布式数据库系统中的数据物理上是分散在各个站点中,但这些分散的数据逻辑上却构成一个整体,它们被分布式数据库系统的所有用户共享,并由一个分布式数据库管理系统统一管理,它使得“分布”对用户来说是透明的。
站点自治性,也称为场地自治性,各站点上的数据由本地的DBMS管理,具有自治处理能力,完成本站点的应用,这是分布式数据库系统与多处理机系统的区别。
另外,由以上三个分布式数据库系统的基本特点还可以导出它的其它特点,即:数据分布透明性、集中与自治相结合的控制机制、存在适当的数据冗余度、事务管理的分布性。
二、简述分布式数据库的模式结构和各层模式的概念。
分布式数据库是多层的,国内分为四层:全局外层:全局外模式,是全局应用的用户视图,所以也称全局试图。
它为全局概念模式的子集,表示全局应用所涉及的数据库部分。
全局概念层:全局概念模式、分片模式和分配模式全局概念模式描述分布式数据库中全局数据的逻辑结构和数据特性,与集中式数据库中的概念模式是集中式数据库的概念视图一样,全局概念模式是分布式数据库的全局概念视图。
分片模式用于说明如何放置数据库的分片部分。
分布式数据库可划分为许多逻辑片,定义片段、片段与概念模式之间的映射关系。
分配模式是根据选定的数据分布策略,定义各片段的物理存放站点。
局部概念层:局部概念模式是全局概念模式的子集。
分布式数据库系统复习材料
分布式数据库系统复习材料在学习和复习分布式数据库系统时,需要掌握以下几个关键知识点:1.分布式数据库架构:分布式数据库系统可以采用集中式架构、两层架构、三层架构等不同的架构模式。
其中集中式架构通过一个中央服务器管理所有的数据,两层架构将数据分为客户端和服务器两部分进行管理,三层架构引入中间层服务器来协调不同的功能和数据层。
2.分布式数据库一致性:分布式数据库系统需要保证数据的一致性。
数据的一致性可以通过ACID原则来保证,即原子性、一致性、隔离性和持久性。
此外,还可以使用分布式事务来保证数据的一致性,分布式事务可以通过两阶段提交(2PC)或者三阶段提交(3PC)来实现。
3.分布式数据库的查询:分布式数据库系统可以进行分布式查询,即将查询请求分发给不同的节点进行处理。
常用的查询分发策略包括哈希分发、范围分发和复制分发。
哈希分发根据查询内容的哈希值将查询请求分发到对应的节点上,范围分发根据数据的范围将查询请求分发到对应节点上,复制分发将查询请求分发到多个节点上进行处理。
4.分布式数据库的数据复制:分布式数据库系统可以通过数据复制来提高数据的可靠性和性能。
数据复制可以采用同步复制或者异步复制方式。
同步复制要求数据在所有节点上都写入成功后才算成功,而异步复制则可以先将数据写入一个节点,然后再异步地将数据复制到其他节点上。
5.分布式数据库的容错与恢复:分布式数据库系统需要具备容错和恢复机制,以应对节点故障或者网络故障等异常情况。
常用的容错机制包括故障检测、容错存储和故障恢复。
故障检测可以通过心跳机制或者节点监视来实现,容错存储可以通过数据备份或者数据冗余来实现,故障恢复可以通过副本恢复或者数据迁移来实现。
6.分布式数据库的性能优化:分布式数据库系统可以通过多种方式来优化性能。
常用的性能优化方法包括数据分片、负载均衡和缓存机制。
数据分片可以将数据分散到不同的节点上,以减轻节点的负载;负载均衡可以将查询请求均匀地分发到各个节点上,以提高查询的响应速度;缓存机制可以将频繁查询的数据缓存在节点上,以减少磁盘访问,提高查询性能。
Nosql分布式数据库复习题带答案
Nosql分布式数据库复习题带答案一、选择题1、以下哪个不是Nosql分布式数据库的特点?A.高度可扩展性B.面向文档的数据模型C.严格的ACID事务D.水平扩展能力答案:C.严格的ACID事务解释:Nosql分布式数据库通常不提供严格的ACID事务,而是采用柔性事务模型,如最终一致性。
这是因为Nosql系统设计的主要目标是高可用性和高性能,而严格的ACID事务会限制这些目标的实现。
2、下列哪个不是Nosql分布式数据库的查询语言?A. SQLB. JSON查询语言C. MapReduceD.结构化查询语言答案:D.结构化查询语言解释:Nosql分布式数据库通常使用非结构化查询语言,如SQL或JSON 查询语言,而不是结构化查询语言。
这是因为Nosql数据库以非结构化和半结构化数据为主,而结构化查询语言主要用于关系型数据库中的结构化数据。
3、下列哪个是分布式Nosql数据库中的一种常用技术?A.分片技术B.复制技术C.缓存技术D.压缩技术答案:A.分片技术解释:在分布式Nosql数据库中,分片技术是一种常见的技术,用于将数据分散到多个节点上,以提高数据的可用性和扩展性。
复制技术用于数据的冗余备份,缓存技术用于提高查询速度,而压缩技术用于减少存储空间的使用。
4、下列哪个是关系型数据库的优点?A.高度可扩展性B.面向文档的数据模型C.支持严格的事务一致性D.高并发读写能力答案:C.支持严格的事务一致性解释:关系型数据库支持严格的事务一致性,这是其一个重要优点。
关系型数据库使用ACID事务,确保数据在多个操作中保持一致性。
其他选项都是Nosql分布式数据库的优点。
5、下列哪个是分布式数据库的缺点?A.复杂性增加B.性能瓶颈C.数据一致性降低D.成本增加答案:A.复杂性增加解释:分布式数据库的设计和维护比单一数据库更复杂,需要更多的技术和资源来管理。
在分布式系统中,故障恢复和数据复制等任务也更加复杂。
因此,分布式数据库的复杂性增加是其主要的缺点。
分布式数据库系统考试
分布式数据库系统考试(答案见尾页)一、选择题1. 分布式数据库系统的定义是什么?A. 一种将数据存储在多个地理位置的数据库系统中,通过分布式计算框架来管理和访问数据的一种技术。
B. 一种单一的集中式数据库系统,所有数据都存储在一个服务器上。
C. 一种将数据分割成多个部分,并分布存储在不同的服务器上的数据库系统。
D. 一种不依赖于单一服务器的数据库系统,数据可以跨多个服务器进行存储和访问。
2. 分布式数据库系统的优点包括哪些?A. 提高数据处理速度和效率。
B. 降低单点故障的风险。
C. 更好的数据冗余和容错能力。
D. 扩展性更强,可以更容易地添加新的数据和节点。
3. 以下哪个不是分布式数据库系统中的常见拓扑结构?A. 星形拓扑B. 环形拓扑C. 网状拓扑D. 树形拓扑4. 在分布式数据库系统中,什么是分片?A. 将整个数据库系统的数据分成多个部分,每个部分存放在一个单独的节点上。
B. 将数据库系统的一个或多个表按照某种规则分成多个部分。
C. 将数据库系统的数据按照某种规则分成多个部分,每个部分存放在一个单独的节点上。
D. 将数据库系统的一个或多个表按照某种规则分成多个部分,并存放在不同的节点上。
5. 在分布式数据库系统中,什么是复制?A. 将数据库系统的数据复制到多个节点上,以确保数据的可靠性和可用性。
B. 将数据库系统的数据存储在多个地理位置,以确保数据的可靠性和可用性。
C. 将数据库系统的数据按照某种规则分成多个部分,并存放在不同的节点上。
D. 将数据库系统的一个或多个表按照某种规则分成多个部分,并存储在不同的节点上。
6. 在分布式数据库系统中,什么是分布式事务?A. 一种需要在多个节点上同步更新数据的事务处理方式。
B. 一种可以在多个节点上并行处理的事务处理方式。
C. 一种需要确保数据的一致性和完整性的事务处理方式。
D. 一种可以在多个节点上同时执行的事务处理方式。
7. 分布式数据库系统中的数据一致性是指什么?A. 数据在多个节点上保持一致的状态。
分布式数据库复习重点
DBMS1
DBMS2
DBMSm
4.
网络
1 1.1
分布式数据库设计概述 DDBS创建方法
重构法
根据实现环境 和用户需求
1.
用户1
用户2
用户n
2.
按照DDBS的 设计思想和方 法
从总体设计做 起,包括 LDBS,重新建 立一个DDBS 可有效解决数 据一致性、完 整性和可靠性 问题。 通常是同构异 质或同构同质 DDBS
2 自顶向下设计DDB
2.2 数据的分片设计
小项谓词选择
(1) A<10 (2) A<10 (3) A<10 (4) A<10 (5) A<10 (6) A<10 (7) A<10 (8) A<10
A>5 Loc=SA Loc=SB A>5 Loc=SA ¬(Loc=SB) A>5 ¬(Loc=SA) Loc=SB A>5 ¬(Loc=SA) ¬(Loc=SB) ¬(A>5) Loc=SA Loc=SB ¬(A>5) Loc=SA ¬(Loc=SB) ¬(A>5) ¬(Loc=SA) Loc=SB ¬(A>5) ¬(Loc=SA) ¬(Loc=SB)
5 分布式数据库系统的体系结构和组成成分 5.3 DDBS中数据的分片与分布
1. 数据分片(P.10) 又称数据分割、数据分段,局部数据库是由全局数据库分割而成 • • • 水平分片(对全局关系施加选择运算) 垂直分片(对全局关系施加投影运算) 混合分片(两种方法的混合)
数据分片要准守的原则:
• • • 完备性原则:要把所有的数据映射到各个片断中 可重构原则:关系分片后的各个片断可重构整个关系 不相交原则:关系分片后的各个片断不能重叠
分布式数据库复习要点
分布式数据库复习要点第一章1、分布式数据库的定义(P4)物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。
分布式数据库系统可以看成是计算机网络和数据库系统的有机结合。
2、分布式数据库的两种分类方法(P7)●按局部DBMS的数据模型分同构型DDBS:各个站点上数据库使用同一数据模型同构同质型-数据模型相同,且是同一种DBMS(同一厂家)同构异质型-数据模型相同,不是同一种DBMS异构型DDBS :各站点上数据库的数据模型类型不同全局控制集中型DDBS:全局控制机制和全局数据词典位于中心站点全局控制分散型DDBS:全局控制机制和全局数据词典分散在网络的各个站点上。
全局控制可变型DDBS:也称主从型DDBS。
分成两组站点,一组包含全局控制机制和全局控制词典,另外一组不包含。
3、分布式数据库的组成成分(两部分)(P9)●数据:分布式数据库的主体,包括局部数据和全局数据。
●数据目录:数据结构的定义、全局数据的分片、分布、授权、事务恢复等描述,包括局部和全局数据目录。
4、分布式数据库的数据分片的定义和类型(3种)(P10)数据分片:又称数据分割、数据分段,局部数据库是由全局数据库分割而成。
三种类型:●水平分片:按特定条件把全局关系的所有元组划分成若干个互不相交的子集,对全局关系施加选择运算。
●垂直分片:把全局关系的属性集分成若干个子集,对全局关系施加投影运算。
●混合分片:以上两种方法的混合。
5、分布式数据库的分布策略(4条)(P11)数据分布:根据某种策略把数据分片所得的逻辑片断分散地存储在各个站点上.●集中式:所有数据都安排在同一站点上●分割式:所有数据只有一份,被分割成若干个逻辑片段,每个片段被放置在特定的站点●复制式:所有数据有多个副本,每个站点都有一个完整的数据副本●混合式:分割式和复制式的混合6、分布式数据库的模式结构(P13)分四层:●全局外层:全局外模式---全局应用的用户视图。
分布式数据库系统架构设计考试
分布式数据库系统架构设计考试(答案见尾页)一、选择题1. 分布式数据库系统(DDBS)的三个层次及其主要特点是什么?A. 存储层、逻辑层、应用层B. 节点层、网络层、存储层C. 数据层、查询层、事务层D. 主节点层、从节点层、副本层2. 什么是分布式数据库系统的CAP理论,以及它的三个要素?A. 一致性、可用性、分区容错性B. 一致性、可用性、数据一致性C. 可用性、分区容错性、数据一致性D. 数据完整性、可用性、分区容错性3. 什么是分布式数据库系统的BASE理论,以及它的三个特性?A. 基本可用、软状态、最终一致性B. 基本可用、硬状态、即时一致性C. 基本可用、软状态、即时一致性D. 基本可用、硬状态、最终一致性4. 分布式数据库系统中的一种常见的分片技术是什么?A. 水平分片B. 垂直分片C. 分区D. 列分片5. 什么是分布式数据库系统中的一致性哈希算法?A. 通过哈希函数将关系分成不同的碎片B. 通过将关系映射到环上,并分配哈希值C. 通过将关系映射到树上,并分配哈希值D. 通过将关系映射到网格上,并分配哈希值6. 分布式数据库系统中的复制策略有哪些?A. 完全复制B. 不完全复制C. 混合复制D. 并发复制7. 什么是分布式数据库系统中的分布式事务?A. 由一组相关的本地事务组成,这些事务在逻辑上是一致的B. 由一组相关的本地事务组成,这些事务在逻辑上是一致的,并且提交或回滚C. 由一组相关的远程事务组成,这些事务在逻辑上是一致的D. 由一组相关的远程事务组成,这些事务在逻辑上是一致的,并且提交或回滚8. 分布式数据库系统中的负载均衡技术在哪个方面提高了系统性能?A. 将请求分散到多个数据库服务器上B. 提高数据库服务器的缓存性能C. 优化数据库索引D. 优化数据库查询语句9. 什么是分布式数据库系统中的数据复制?A. 将数据从一个数据库同步到另一个数据库的过程B. 将数据从一个数据库同步到另一个数据库,并在同步过程中保持数据的一致性C. 将数据从一个数据库同步到另一个数据库,并在同步过程中保持数据的一致性和完整性D. 将数据从一个数据库同步到另一个数据库,并在同步过程中保持数据的一致性、完整性和可扩展性10. 什么是分布式数据库系统中的分区和水平分片?A. 分区是将关系分成不同的片段,水平分片是在垂直方向上分割关系B. 分区是将关系分成不同的片段,水平分片是在水平方向上分割关系C. 分区是将关系分成不同的片段,水平分片是在水平方向上分割关系,并在每个片段上实现数据的分片D. 分区是将关系分成不同的片段,水平分片是在水平方向上分割关系,并在每个片段上实现数据的分片,同时保证数据的一致性11. 分布式数据库系统的定义及其与传统数据库系统的区别是什么?A. 分布式数据库系统由多个物理上分散的数据库组成,逻辑上是一个统一的整体。
分布式系统复习题及参考答案
关于分布式系统复习题与参考答案一、填空题(每题n分,答错个扣分,全错全扣g,共计m分)1.访问透明性是指对不同数据表示形式以及资源访问方式的隐藏。
而位置透明是用户无法判别资源在系统中的物理位置。
2. 迁移透明性是指分布式系统中的资源移动不会影响该资源的访问方式。
而复制透明是指对同一个资源存在多个副本的隐藏。
3. 一个开放的分布式系统就是根据一系列准则来提供服务,这些准则描述了所提供服务的语法和语义。
4. 集群计算系统一个突出的特征是它的同构性;它提供了最大限度的分布式透明性。
可用于单个程序在多台计算机上并行地运行。
5. 网格计算系统具有高度的异构性:其硬件、操作系统、网络、管理域和安全策略等都不尽相同。
6. 网格计算系统一个关键问题是如何把来自不同计算机组织的资源集中起来,使一组人或机构进行协调工作。
7. 分布式事务处理的四个特性是:原子性、一致性、独立性和持久性。
8. 分布式普适系统应用程序的需求归纳为三种,它们是:接受上下文的变化、促使自主合成、认可共享为默认行为。
9. 分布式系统体系结构样式很多,其最重要的有:分层体系结构;基于对象的体系结构、以数据为中心的体系结构以及基于事件的体系结构等四类。
10. 客户/服务器结构的应用程序通常划分为三层,它们是:用户接口层、处理层和数据层。
11. 在结构化点对点体系结构中覆盖网络是用一个确定性的过程来构成的,这个使用最多的进程是通过一个分布式哈希表来组织进程的。
12. 超级对等体通常是维护一个索引或充当一个代理程序的结点。
13. 分布式软件体系结构主要分集中式、非集中式和各种混合形式三大类。
其非集中式体系结构又分为结构化的点对点、非结构化的点对点、超级对等体三种。
14. 实现软件自适应的基本技术分为要点分离、计算映像和基于组件的设计三种类型。
15. 分布式的自主系统指的是自我管理、自我恢复、自我配置和自我优化等各种自适应性。
16. 一个线程独立地执行它自己的程序代码。
分布式数据库系统_复习
一、填空分布式数据库系统按局部数据库管理系统的数据模型分类,可以分为__________ 和 ______ 两类。
同构型DDBS 异构型DDBS分布式数据库系统按全避控制系统类型分类,可以分为________________________ 、_______________ 和___________ 三类。
全局控制集中型DDBS 全局控制分散型DDBS 全局控制可变型DDBS分布式数据库是分布式数据库系统中各站点上数据库的逻辑集合,它由_______ 和_______ 组成。
应用数据库描述数据库数据分片的三种基本方法是:____________________、_________________ 和 ____________ 三类。
水平分片垂直分片混合分片分布式数据库中的数据分布策略有:___________________ 、、_________和___________ 四层。
集中式分割式复制式混合式分布式数据库是多层模式结构,一般划分为____________________ 、_____________ 、_______________ 和___________ 四层。
全局外层全局概念层局部概念层局部内层一个分布式数据库管理系统一般应包括___________________ 、_____________ 、________________和___________ 四个基本功能模块。
查询处理模块完整性处理模块调度处理模块可靠性处理模块分布透明性包括_________________ 、_________________ 和 ___________ 三个层次。
分片透明性位置透明性局部数据模型透明性分布式数据库系统的创建方法,大致可分为______________________ 和___________ 两种。
组合法重构法集中式数据库设计一般包括:需求分析,概念设计,逻辑设计和物理设计四个阶段,分布式数据库设计除了上述四个阶段外,还需增加一些个新的阶段 _________________________ ,它位于_______________ 和___________ 之间。
Nosql分布式数据库复习题带答案
第一章1.交易型系统,比如银行核心系统对一致性和可用性要求比较高,基本上选择关系型数据库系统进行数据的管理,由于它放弃了分区容错性,因此系统在扩展上存在限制。
True/ false2.以下哪些是NoSQL数据库的特点?A .NoSQL数据满足最终一致性 B. 灵活的数据模式C.NoSQL集群的可扩展性强,可动态添加和删除节点D.数据以多副本的方式存放在不同节点上3.Base的核心思想是无法做到强一致性,但每个应用都可以根据自身的特点,采用适当方式达到最终一致性。
TrueFalse4.适合于存储大量复杂、互连接的数据类型,比如人际交往、推荐系统和知识图谱的NoSQL 数据库有:A.MongoDB B. Neo4j C. Redis D. HBase5.NoSQL是指no SQL,表示用非关系型数据库替代关系型数据库。
True/ False6.NoSQL数据库种类比较繁多,以下哪些是NoSQL数据库?A. HBaseB. MongoDBC. RedisD. Oracle7.数据库(Database)是按照一定的数据模型来组织、存储和管理数据的仓库。
操作系统里的文件夹可看作是一个数据库。
True /False8.数据模型(Data Model)是数据特征的抽象。
数据模型所描述的内容有三部分,分别为数据结构、数据操作和数据约束。
True False9.在一个分布式系统中可以同时满足一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)这三项要。
True/False10.大数据时代,数据的存储与管理有哪些要求?A.数据管理系统具有很高的扩展性,适应海量数据的迅速增长!B.满足完整性的约束条件C.满足用户的高并发读写D.要适应多变的数据结构11.数据库按逻辑模型进行区分,有关系模型、层次模型、网状模型等,以下哪个是层次模型数据库。
A. IMSB. OracleC. DB2D. MySQL12.数据库系统通常由软件、数据库和数据管理员组成。
《分布式数据库系统及应用》知识总结
第一章分布式数据库系统概述1、理解分布式数据库系统的特点:(1)物理分布性:数据不是存放在一个站点上(2)逻辑整体性:是与分散式数据库系统的区别(3)站点自治性:是与多处理机系统的区别(4)数据分布透明性(5)集中与自治相结合(6)存在适当的数据冗余度(7)事务管理的分布性2、能够按照不同标准描述分布式数据库系统的分类:(1)按局部DBMS的数据模型分类○1同构型DDBSa)同构同质型(同一个公司的同一种模式)b)同构异质型(不同公司不同模式)○2异构型DDBS(2)按DDBS的全局控制类型分类○1全局控制集中型DDBS:全局控制机制和全局数据词典位于中心站点○2全局控制分散型DDBS:全局控制机制和全局数据词典分散在网络的各个站点上。
○3全局控制可变型DDBS:也称主从型DDBS。
分成两组站点,一组包含全局控制机制和全局控制词典,另外一组不包含。
3、理解分布式数据库中数据的独立性和分布透明性:逻辑独立性物理独立性(表示用户程序与数据的全局逻辑结构和数据的物理结构无关)分布独立性(用户不必关心全局数据的分布情况,包括逻辑分片、物理位置分配情况以及各站点数据库的数据模型等)分三个层次:▪分片透明性(完全分布透明性):位于全局概念模式与分片模式之间,用户编写应用程序只对全局关系进行操作,不必考虑数据的逻辑分片▪位置透明性(中级分布透明性):位于分片模式和分配模式之间。
包括两情形-----各片段被复制情况和片段及其各副本的站点位置分配情况。
▪局部数据模型透明性(低级分布透明性):需要知道数据的分片情况和站点分配情况第二章分布式数据库系统设计1、理解分布式数据库的设计目标:(1)本地性或近地性○1尽量减少通信次数和通信量,90/10准则○2分片和分布方案(本地和远程访问次数)择优(2)控制数据适当冗余○1冗余增加了可靠性、可用性,提高了效率○2维护数据一致性开销增加(3)工作负荷分布○1各站点可以分担整个工作任○2本地性降低(4)存储能力和费用2、理解水平分片的定义、分类和应用:定义:水平分片是对全局关系执行“选择”操作,把具有相同性质的元祖进行分组,构成若干个不相交的子集。
分布式数据库复习要点
分布式数据库复习要点第一章1、分布式数据库的定义(P4)物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。
分布式数据库系统可以看成是计算机网络和数据库系统的有机结合。
2、分布式数据库的两种分类方法(P7)●按局部DBMS的数据模型分同构型DDBS:各个站点上数据库使用同一数据模型同构同质型-数据模型相同,且是同一种DBMS(同一厂家)同构异质型-数据模型相同,不是同一种DBMS异构型DDBS :各站点上数据库的数据模型类型不同全局控制集中型DDBS:全局控制机制和全局数据词典位于中心站点全局控制分散型DDBS:全局控制机制和全局数据词典分散在网络的各个站点上。
全局控制可变型DDBS:也称主从型DDBS。
分成两组站点,一组包含全局控制机制和全局控制词典,另外一组不包含。
3、分布式数据库的组成成分(两部分)(P9)●数据:分布式数据库的主体,包括局部数据和全局数据。
●数据目录:数据结构的定义、全局数据的分片、分布、授权、事务恢复等描述,包括局部和全局数据目录。
4、分布式数据库的数据分片的定义和类型(3种)(P10)数据分片:又称数据分割、数据分段,局部数据库是由全局数据库分割而成。
三种类型:●水平分片:按特定条件把全局关系的所有元组划分成若干个互不相交的子集,对全局关系施加选择运算。
●垂直分片:把全局关系的属性集分成若干个子集,对全局关系施加投影运算。
●混合分片:以上两种方法的混合。
5、分布式数据库的分布策略(4条)(P11)数据分布:根据某种策略把数据分片所得的逻辑片断分散地存储在各个站点上.●集中式:所有数据都安排在同一站点上●分割式:所有数据只有一份,被分割成若干个逻辑片段,每个片段被放置在特定的站点●复制式:所有数据有多个副本,每个站点都有一个完整的数据副本●混合式:分割式和复制式的混合6、分布式数据库的模式结构(P13)分四层:●全局外层:全局外模式---全局应用的用户视图。
分布式数据库复习资料
一.简答题1.说明分布式数据库设计与集中式数据库设计的主要区别。
2.试叙述分布式DBS的体系结构,它有什么特征?3.简述分布式数据库的创建方法与设计方法。
4.简述分布式数据库系统的透明性。
5.在分布式数据库系统中,为什么要对数据进行分片?什么是关系的片段?关系的片段有那些类型。
6.什么是简单谓词?什么是极小项谓词?7.分布式事务有哪些基本性质。
8.简述分布式数据库中可能出现的故障类型。
9.检查点的作用和需做的工作。
10.简述2PC协议。
11.基本2PL与严格2PL的异同。
12.如何理解分布式数据库的“可靠性”和“可用性”。
二.下面是某个公司人事数据库的两个全局关系EMP={eno,ename,title,salary,addr,phone,dno};DEPT={dno,dname}该公司共有3个部门,dno 分别为0,1,2。
要求将DEPT关系和EMP关系的部分属性(ename,addr,phone)保存在部门0的场地上,EMP关系的部分属性(title,salary)保存在所在部门场地上。
根据上述要求,(1)将全局模式进行分片,写出分片定义和分片条件(2)指出各分片的类型,并画出分片树(3)对查询select ename,salary,dname from EMP,DEPT where dno=2.进行全局优化,画出优化后的全局查询树(4)进行分片优化,画出优化后的分片查询树三.下面是当一个数据库系统出现故障时,日志文件中的信息说明::D为数据记录,下标i表示事务号,上标表示对数据的第j步操作;D jiB:表示事务i开始执行;i:表示事务i提交;Ci:表示事务i废弃;AiK:是检查点。
根据上述log 信息,完成下面的处理:(1)画出对应的事务并发执行图(2)找出发生故障时系统中的活动事务,确定“反做”和“重做”事务集(3)指出需要undo的和redo的数据记录。
分布式数据库系统原理与应用考试
分布式数据库系统原理与应用考试(答案见尾页)一、选择题1. 分布式数据库系统的定义及特点是什么?A. 分布式数据库系统是由多个物理数据库组成的,它们可以分布在不同的地理位置。
B. 分布式数据库系统提供了一个透明的、逻辑上集中、物理上分布的数据存储,使用户感觉好像数据只存储在一个数据库中。
C. 分布式数据库系统通过数据复制和分片技术实现数据的冗余和容错。
D. 分布式数据库系统的主要目标是提高数据访问性能和数据一致性。
2. 以下哪个选项不是分布式数据库系统的一致性策略?A. 串行处理B. 两阶段提交协议C. 检索优化D. 乐观并发控制3. 在分布式数据库系统中,如何实现数据分片?A. 通过范围分区B. 通过列表分区C. 通过哈希分区D. 通过目录分区4. 分布式数据库系统中的复制策略有哪些?A. 同步复制B. 异步复制C. 混合复制D. 并发复制5. 分布式数据库系统中的数据一致性是如何保证的?A. 通过分布式事务协议B. 通过分布式锁机制C. 通过数据复制和分片D. 通过备份和恢复机制6. 什么是分布式数据库系统的CAP理论?A. 一致性、可用性和分区容错性不能同时满足B. 一致性、可用性和分区容错性可以同时满足C. 一致性、可用性和分区容错性之间存在权衡D. 以上都不是7. 在分布式数据库系统中,如何实现数据镜像?A. 通过主从复制B. 通过分片C. 通过复制集D. 通过日志备份8. 分布式数据库系统中的分片有哪几种类型?A. 范围分片B. 列表分片C. 哈希分片D. 直接分片9. 什么是分布式数据库系统中的读写分离?A. 将读操作和写操作分开在不同的节点上执行B. 将读操作和写操作集中在同一个节点上执行C. 将写操作分散到多个节点上执行,而读操作集中在一个节点上执行D. 将写操作集中在一个节点上执行,而读操作分散到多个节点上执行10. 分布式数据库系统中的故障恢复策略有哪些?A. 主从复制恢复B. 副本恢复C. 分片恢复D. 重建恢复11. 以下哪个不是分布式数据库系统的常见分区策略?A. 节点分区B. 范围分区C. 距离分区D. 列分区12. 分布式数据库系统中,分布式事务的处理方式有哪几种?A. 两阶段提交(2PC)B. 三阶段提交(3PC)C. 检查点(Checkpoint)D. 分布式事务协议(DTCP)13. 什么是分布式数据库中的复制策略?有哪些常见的复制策略?A. 主从复制B. 并发复制C. 分片复制D. 混合复制14. 在分布式数据库系统中,如何实现数据的负载均衡?A. 数据库中间件B. 分布式缓存C. 负载均衡器D. 读写分离15. 分布式数据库系统中,如何保证数据的一致性和完整性?A. 两阶段提交(2PC)B. 三阶段提交(3PC)C. 检查点(Checkpoint)D. 四阶段提交(4PC)16. 以下哪个是分布式数据库系统中的分布式锁机制?A. 乐观锁B. 悲观锁C. 行级锁D. 页级锁17. 分布式数据库系统中,如何处理跨库查询?A. 使用SQL查询B. 使用中间表C. 使用分布式查询语言(DQL)D. 使用ETL工具18. 分布式数据库系统中,如何实现数据备份和恢复?A. 定期全量备份B. 增量备份C. 差量备份D. 主从备份19. 以下哪个是分布式数据库系统的发展趋势?A. 向规模更小的分布式数据库发展B. 向更高性能的分布式数据库发展C. 向更容易扩展的分布式数据库发展D. 向更强一致性的分布式数据库发展20. 以下哪个选项是分布式数据库系统中常用的数据复制技术?A. 主从复制B. 并发复制C. 混合复制D. 非阻塞复制21. 分布式数据库系统中的分片策略有哪几种?A. 范围分片B. 列分片C. 层次分片D. 索引分片22. 在分布式数据库系统中,如何实现数据的一致性?A. 通过分布式事务协议如两阶段提交(2PC)实现B. 通过分布式锁机制实现C. 通过分布式日志和重放技术实现D. 通过数据复制和分片实现23. 分布式数据库系统面临的主要挑战包括哪些?A. 数据复制的一致性问题B. 查询优化的复杂性C. 安全性和隐私保护问题D. 系统的可靠性和容错性24. 以下哪个选项是分布式数据库系统中常用的分片算法?A. 条件分片B. 基于范围的分片C. 基于哈希的分片D. 基于权重的分片25. 分布式数据库系统中的分布式事务处理有哪些类型?A. 两阶段提交(2PC)B. 三阶段提交(3PC)C. 这些选项都不是D. 没有分布式事务处理26. 以下哪个选项是分布式数据库系统中常用的负载均衡技术?A. 轮询负载均衡B. 权重负载均衡C. 简单轮询D. 加权轮询27. 分布式数据库系统中的数据迁移有以下几种类型?A. 结构迁移B. 非结构迁移C. 逻辑迁移D. 物理迁移28. 以下哪个选项是分布式数据库系统中常用的故障恢复技术?A. 回滚操作B. 前滚操作C. 数据重同步D. 数据复制恢复29. 分布式数据库系统的定义及其与传统数据库系统的区别是什么?A. 分布式数据库系统可以在多个节点上存储数据,而传统数据库系统通常在一个节点上存储所有数据。
DDBS期末复习
DDBS 课程期末复习提纲单选题 填空题 综合题第一章1、什么是DDB 、DDBS 、DDBMS ?DDS : 数据库系统DDBS :分布式数据库系统DDBMS :分布式数据库管理系统2、理解局部应用和全局应用访问本地银行数据:局部应用通兑业务、转账业务:全局应用3、DDBS 分哪三类?如何区分这三类?同构同质型DDBS :各个场地都采用同一类型的数据模型(譬如都是关系型), 并且是同一型号的DBMS 。
同构异质型DDBS :各个场地采用同一类型的数据模型,但是DBMS 的型号不同,譬如DB2、ORACLE 、SYBASE 、SQL Server 等。
异构型DDBS :各个场地的数据模型的型号不同,甚至类型也不同。
随着计算机网络技术的发展,异种机联网问题已经得到较好的解决,此时依靠异构型DDBS 就能存取全网中各种异构局部库中的数据。
4、什么是GDD 、LDD ?全局数据字典(GDD ):提供全局数据的描述和管理的相关信息,如数据的结构定义,分片、分布处理、授权、事务恢复等必要信息。
局部数据字典(LDD ):提供局部数据的描述和管理的相关信息5、数据分片有哪三类?(1)水平分片:按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段。
(2)垂直分片:把一个全局关系的属性集分成若干子集,并在这些子集上作投影运算,每个投影称为垂直分片。
(3)混合分片:以上两种方法的混合。
可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式,但他们的结果是不相同的。
6、数据分布有哪四种方式?DB1 DB1 DB1 计算机计算机计算机通讯网北重上银行系访问本地银行数据:局部应用 通兑业务、转账业务:全局应用(1)集中式:所有数据片段都安排在同一个场地上。
(2)分割式:所有数据只有一份,它被分割成若干逻辑片段,每个逻辑片段被指派在一个特定的场地上。
(3)全复制式:数据在每个场地重复存储。
分布式数据库系统知识点及习题
第9章分布式数据库系统9.1 基本内容分析9.1.1 本章重要概念(1)分布计算的三种形式:处理分布,数据分布,功能分布。
(2)C/S系统,工作模式,技术特征,体系结构,两层、三层、多层C/S结构。
(3)DDBS的定义、特点、优点、缺点和分类;分布式数据存储的两种形式(分片和分配)。
(4)DDB的体系结构:六层模式,分布透明性的三个层次,DDBS的组成,DDBMS的功能和组成。
(5)分布式查询处理的查询代价,基于半联接的优化策略,基于联接的优化策略。
(6)分布式数据库的并发控制和恢复中出现的问题,以及处理机制。
9.1.2 本章的重点篇幅(1)两层、三层、多层C/S结构。
(教材P365-367)(2)分布式数据存储:分片和分配。
(教材P375-377)(3)DDB的体系结构。
(教材P378的图9.10,P381的图9.12)(4)基于半联接的执行示意图。
(教材P389的图9.17)9.2 教材中习题9的解答9.1 名词解释·集中计算:单点数据和单点处理的方式称为集中计算。
·分布计算:随着计算机网络技术的发展,突破集中计算框架,DBMS的运行环境逐渐从单机扩展到网络,对数据的处理从集中式走向分布式、从封闭式走向开放式。
这种计算环境称为分布计算。
·处理分布:指系统中处理是分布的,数据是集中的这种情况。
·数据分布:指系统中数据是分布的,但逻辑上是一个整体这种情况。
·功能分布:将计算机功能分布在不同计算机上执行,譬如把DBMS功能放在服务器上执行,把应用处理功能放在客户机上执行。
·服务器位置透明性:指C/S系统向客户提供服务器位置透明性服务,用户不必知道服务器的位置,就可以请求服务器的服务。
·集中式DBS:所有工作都由一台计算机完成,这种DBS称为集中式DBS。
·DDBS:是物理上分散逻辑上集中的DBS,每一场地既能完成局部应用又能完成全局应用,这种系统称为DDBS。
分布式数据库复习
第一章1、世界上第一个分布式数据库系统SDD—1是由美国计算机公司(CCA)于1976年至1979年在DEC—10和DEC—20计算机上实现。
2、分布式数据库系统是数据库系统与计算机网络相结合的产物3、12条规则既不是相互独立的,也不是同等重要的,完全实现难度很大。
4、实现和建立分布式数据库系统绝对不是数据库技术与网络技术的简单结合。
分布式数据库系统虽然基于集中式数据库系统,但却有它自己的特色和理论基础。
5、关系技术是分布式技术的一个先决条件。
6、分布式数据库系统是物理上分散而逻辑上集中的数据库系统。
分布式数据库系统使用计算机网络将地理位置分散而管理和控制又不需要不同程度集中的多个逻辑单位连接起来,共同组成一个统一的数据库系统。
因此,分布式数据库系统可以看成是计算机网络与数据库系统的有机结合。
7、在分布式数据库系统中,被计算机网络连接的每个逻辑单位是能够独立工作的计算机,这些计算机称为站点也称为结点。
8、在分布式数据库系统中,一个用户或一个应用如果只访问他注册的那个站点上的数据称为本地(或局部)用户或本地应用;如果访问涉及两个或两个以上的站点中的数据,称为全局用户或全局应用。
9、一个分布式数据库系统应用应该具有以下几种特点:(1)物理分布性:分布式数据库系统的数据具有物理分布性,这是与集中式数据库系统的最大差别之一(2)逻辑整体性:区别一个数据库系统是分散式还是分布式,只需判断该数据库系统是否支持全局应用(3)站点自治性:各站点上的数据由本地的DBMS管理,具有自治处理能力,完成本站点的应用(局部应用),这是分布式数据库系统与多处理机系统的区别10、数据分布透明性是指用户不必关心数据是如何被逻辑分片的,不必关心数据及其片段是否被复制及复制副本的个数,也不必关心数据及其片段的物理位置分布的细节,同时也不必关心局部场地上数据库支持哪种数据模型11、增加数据冗余度方便了检索,提高了系统的查询速度、可用性和可靠性,但不利于数据的更新,这将增加系统维护的成本12、按局部数据库管理系统的数据模型分类(1)同构型:同构同质型、同构异质型(2)异构型按分布式数据库系统的全局控制系统类型分类:全局控制集中型DDBS、全局控制分散型DDBS、全局控制可变型DDBS13、在集中式数据库系统中,除了计算机本身的硬件和软件外,主要成分有:数据库DB、数控管理系统DBMS和数据库管理员DBA。
分布式数据库复习题
1.试叙述分布式DBS的体系结构,它有什么特征?2.简述分布式数据库的两种分类方法。
3.简述分布式数据库中可能出现的故障类型。
4.简述分布式数据库的功能。
5.什么是并发控制的定义?6. 什么是分布式数据库?7.分布式事务的特性?8.分布式数据库的组成分成哪两部分?9.分布式数据库的数据分片的定义和类型?10.半连接有什么用途?半连接的收益和代价是如何计算的?11.画出分布式数据库的模式结构。
12.给出分布式数据库设计步骤13.下面是某学院的一个学生档案数据库的全局模式:Student={sno,sname,sex,birth,major,class,dno}Grade={sno,cno,grade}其中sno,sname,sex,birth为学生的“学号”,姓名,性别和出生日期,major,class,dno为专业,班级和所属的“系号”。
全学院共有8个系,dno分别为1,2,…8。
其中cno为课程号,grade 为考试成绩。
根据需要,要求将学生关系Student中的{sno,class }保存在场地0,其他属性和成绩Grade按“系号”1-4,5-6分别保存在场地1和场地2上。
根据上述要求,将全局模式进行分片,写出分片定义和分片条件。
分片定义和分片条件Stu = Student∞Gradesno=snoStudent1=ПStusno,classStuTemp=П,snam e,,,sexm ajordnobirthTempStudent2=δ<=dno1<=4TempStudent3=δ<=dno65<=Site Student1(0), Student2(1), Student3(2);(1)指出各分片的类型,并画出“分片树”。
(2)假设要求查询“系号”是1的所有学生的姓名和成绩,写出在全局模式上的SQL查询语句,并要求转换成相应的关系代数表示,画出全局查询树,请依次进行全局优化和分片优化,画出优化后的查询树。
计算机数据库设计与分布式数据库技术复习
计算机数据库设计与分布式数据库技术复习一、引言计算机数据库是现代信息系统的重要组成部分,用于存储、管理和操作大量的结构化数据。
而分布式数据库技术则使得数据库可以在多个独立的计算机上进行分布式存储和处理,提高了系统的可伸缩性和可靠性。
本文将对计算机数据库设计和分布式数据库技术进行复习和总结。
二、计算机数据库设计1. 数据库的概念和分类数据库是指一个组织和管理数据的系统,主要分为关系型数据库和非关系型数据库两大类。
关系型数据库以表格的形式存储数据,通过SQL语言进行操作;而非关系型数据库则采用键值对、文档、列族等方式存储数据,如MongoDB、Redis等。
2. 数据库设计的基本原则数据库的设计需要遵循一些基本原则,包括实体完整性、关系完整性、域完整性等。
实体完整性要求每条记录都具有唯一标识,关系完整性要求表之间的关联关系必须符合业务逻辑,域完整性要求每个字段的取值必须符合约束条件。
3. 数据库模型和范式数据库模型定义了数据库的结构和操作方式,主要有层次模型、网状模型和关系模型等。
其中关系模型是最常用的数据库模型,通过表格的形式表示数据之间的关系。
范式是用来评价数据库设计的标准,包括第一范式、第二范式和第三范式等,用于保证数据的一致性和查找效率。
4. 数据库索引和查询优化数据库索引是提高查询效率的重要手段,通过在表上创建索引可以加快数据的查找速度。
常用的索引类型包括B树索引、哈希索引和全文索引等。
同时,通过优化查询语句的编写和数据库的物理组织结构,还可以进一步提高查询效率。
三、分布式数据库技术1. 分布式数据库的概念和架构分布式数据库是将数据库系统分布在多个计算机上,通过网络连接进行通信和协作,实现数据的分布式存储和处理。
分布式数据库的架构包括中心化架构、两层架构和三层架构等,其中三层架构是目前应用最为广泛的分布式数据库架构。
2. 分布式数据库的数据一致性和并发控制在分布式数据库中,由于数据的分布式存储和处理,需要解决数据一致性和并发控制的问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、填空
分布式数据库系统按局部数据库管理系统的数据模型分类,可以分为和两类。
同构型DDBS 异构型DDBS
分布式数据库系统按全避控制系统类型分类,可以分为、
和三类。
全局控制集中型DDBS 全局控制分散型DDBS 全局控制可变型DDBS
分布式数据库是分布式数据库系统中各站点上数据库的逻辑集合,它由和组成。
应用数据库描述数据库
数据分片的三种基本方法是:、和三类。
水平分片垂直分片混合分片
《
分布式数据库中的数据分布策略有:、、
和四层。
集中式分割式复制式混合式
分布式数据库是多层模式结构,一般划分为、、
和四层。
全局外层全局概念层局部概念层局部内层
一个分布式数据库管理系统一般应包括、、
和四个基本功能模块。
查询处理模块完整性处理模块调度处理模块可靠性处理模块
分布透明性包括、和三个层次。
,
分片透明性位置透明性局部数据模型透明性
分布式数据库系统的创建方法,大致可分为和两种。
组合法重构法
集中式数据库设计一般包括:需求分析,概念设计,逻辑设计和物理设计四个阶段,分布式数据库设计除了上述四个阶段外,还需增加一些个新的阶段,它位于和之间。
分布设计逻辑设计物理设计
水平分片的方法可归为和两种。
初级分片导出分片
DATAID-D相对于DATAID-1增加了和两个阶段。
分布要求分析分布设计
》
DATAID-D中的分布设计分成、、
和四个阶段。
分片设计非冗余分配冗余分配局部模式的重新构造
分布式查询优化的准则是。
通信费用和响应时间最短
在分布式系统中,查询代价QC=。
I/O代价+CPU代价+通信代价
在分布式环境下,查询可分为、和三种类型。
局部查询远程查询全局查询
分布式查询处理可以分为、、和四层。
【
查询分解数据本地化全局优化局部优化一个分布式事务通常是由和组成。
主事务子事务
事务的四个特性是:、、和。
原子性一致性隔离性耐久性
控制分布式事务所执行的控制模型有:、和。
主从模型三角模型层次模型
分布式数据库系统中,通信故障可以分为和两种。
报文故障网络分割故障
事务恢复主要是依靠来实现的。
日志
,
并发控制机制可以为和两种类型。
悲观并发控制法乐观并发控制法
常用的基本封锁算法有:、、和。
简单的分布式封锁方法主站点封锁法主副本封锁法快照方法
预防死锁的方法有和两种类型。
非占先权方法占先权方法
检测分布式死锁的三种方法是、和。
集中式层次式分布式
二、[
三、简答题
分布式数据库系统的特点是什么
答:物理分布性:数据不是存放在一个站点上
逻辑整体性:是与分散式数据库系统的区别
站点自治性:是与多处理机的系统的区别
数据分布透明性
集中与自治相结合
存在适当的数据冗余度
事务管理的分布性
/
分布式数据库中数据分片的规则是什么
答:(1)完备性原则:必须把全局关系的所有数据映射到各自片段中,绝不允许有属于全局关系的数据却不发球它的任何一个片段。
(2)可重构原则:必须保证能够由同一个全局关系的各个片段来重建该全局关系。
对于水平分片可用并操作重构全局关系,对于垂直分片可用连接操作重构全局关系。
(3)不相交原则:关系分片后的各个片断不能重叠或只包含主键重叠。
DATAID-D相对于DATAID-1增加哪两个阶段,这两个阶段的具体工作是什么
答:(1)分布要求分析阶段:收集关于分布的信息,如水平分片的划分谓词,每一应用在各站点激活的频率等。
(2)分布设计阶段:始于全局数据库模式的规格说明和所收集的分布要求,然后产生全局数据的分片模式和片段的位置分配模式,分配模式描述了分配在各站点上的数据情况。
分布式事务的一般结构是什么
:
答:分布式事务的一般结构为:
Begin Transaction原语:开始一个事务(2分)
T1[]
T2[]
: 子事务或操作序列
:
Tn[]
Commit原语:事务成功完成的结束(2分)
Rollback或Abort原语:事务失败的结束(1分)
,
五、论述题
分布式数据库中,"数据分配"有哪些策略"数据分片"有哪些策略数据分片的准则是什么
数据分配是指数据在计算机网络各场地上的分配策略。
包括:
(1)集中式:所有数据均安排在同一个场地上。
(2)分割式:所有数据只有一份,分别被安置在若干个场地。
(3)全复制式:数据在每个场地重复存储。
(4)混合式:数据库分成若干可相交的子集,每一子集安置在一个或多个场地上,但是每一场地未必保存全部数据。
数据分片的方式有以下三种:
(1)水平分片:按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段。
(2)垂直分片:把一个全局关系的属性集分成若干子集,并在这些子集上做投影运算,每个投影为垂直分片。
(3)混合型分片:将水平分片与垂直分片方式综合使用则为混合型分片。
数据分片应遵循的准则为:
(1)完备性条件:必须把全局关系的所有数据映射到各个片段中,绝不允许发生属于全局关系的某个数据不属于任何一个片段。
(2)重构条件:划分所采用的方法必须确保能够由各个片段重建全局关系。
(3)不相交条件:要求一个全局关系被划分后得到的各个数据片段互相不重叠。
简述基于关系代数等价变换查询优化处理的基本原理和实现方法
答:基本原理:把查询问题转变为关系代数表达,分析得到查询树,进行从全局到片段的变换得到基于片段上的查询树,然后利用关系代数等价变换规则的优化算法,尽可能先执行选择和投影操作。
实现步骤和方法:(1)将一个查询问题转换成关系代数表达式。
(2)从关系代数表达式到查询树的变换:对一个关系代数表达式进行语法分析,可得到一棵语法树。
(3)从全局查询到片段查询的变换:把基于全局关系的查询树中的全局关系名,用其重构该全局关系的各片段名替换,变换成相应片段上的查询树。
(4)利用关系代数等价变换规则的优化算法,对片段上的查询树进行优化处理,最后达到优化查询的目的。