第2讲分布式数据库的设计-水平分片概要

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方案1 场地0 场地1 场地2 总部(EMP) 分公司1(无) 分公司2(无) 方案2 总部(EMP0) 分公司1(EMP1) 分公司2(EMP2) 方案3 总部(EMP) 分公司1(EMP1) 分公司2(EMP2)
上面三种方案中,除方案1外,均须进行分片定义。方案3中,分公 司的数据信息除本场地存储外,总部场地也存储一份相同信息,存在 在不同场地上互称副本。
第三章分布式数据库的设计
分布式数据库系统原理与应用
内容简介
解决数据分布的问题
①如何对分布式数据库进行逻辑划分 ②如何对逻辑划分结果进行实际物理分配
3.1两种设计策略( Top-down 和 Bottom-up )
3.2分片的定义级作用 3.3水平分片 3.4垂直分片 3.5混合分片 3.6分片的表示方法 3.7分配设计
P(FDB)=PDB P-1(PDB)=FDB
P():表示分配模式映射函数,能从片段数据库经得到物理数据库
P-1()表示分配模式的反映射函数。能从物理数据库得到片段数据库。
分布式数据库系统原理与应用
3.2分片的定义及作用
3.2.4分片的原则
完备性:所有全局数据必须映射到某个片段上。 可重构性:所有片段必须可以重新构成全局数据。 不相交性:划分的各片段所包含的数据不允许相同。
分布式数据库系统原理与应用
3.1两种设计策略
3.1.1-Top-down
概念设计 全局概念模式 需求分析 系统需求说明书 视图设计
外部模式定义
分布设计 局部概念模式 物理设计
局部物理模式 调优
分布式数据库系统原理与应用
3.1两种设计策略
3.1.2-Bottom-up
GCS Integrator InS 1 Translator 1 InS 2 Translator 2 … … InS n Translator n
分布式数据库系统Leabharlann Baidu理与应用
3.2分片的定义及作用
3.2.1分片的定义
分片(Fragmentation) 对全局数据的划分。 片段 划分的结果称为片段
是分布式数据库中数据的存储单位。
分配(Allocation):对片段的存储场地的指定,称为分配。 数据复制:片段存储在一个以上场地时 数据分割:片段只存储在一个场地
FDB
分配模式 PDB
分布式数据库系统原理与应用
3.2分片的定义及作用
分片模式:定义从全局关系到片段模式的映射关系。 分配模式:定义从片段关系到物理关系的映射关系。 1:N时为复制;1:1时为分割。
R1 R2 R1 R R2 R3 全局关系 片段 R3 场地2 R2 R3 场地3
场地1
副本
分布式数据库系统原理与应用
3.1两种设计策略
Top_Down和 Bottom-UP应用场合
Top_Down: 适 于 新 设 计 一 个 数 据 库 系 统 。 (designed from scratch) Bottom-UP: 已存在许多数据库系统,并将它 们集成为一个数据库。典型的数据集成的研究。
分布式数据库系统原理与应用
3.2分片的定义及作用
3.2.4分片的原则
完备性 如果全局关系R划分的片段为R1,R2,…,Rn,则对于R中 任意数据项d(dR),一定存在dRi(1in)。 可重构性 如果全局关系R划分的片段为R1,R2,…,Rn,则存在关 系运算,使得R=R1R2…Rn。 不相交性 如果全局关系R水平划分的片段为R1,R2,…,Rn,则任 意两个不同的片段的交集为空,即RiRj=(ij, 1in, 1jn)。
总公司
网络
分公司2
分公司2为场地2,职工关系为EMP2
EMP=EMP0+EMP1+EMP2为全局数据
分布式数据库系统原理与应用
3.2分片的定义及作用
数据分布要求 方案1:公司总部保留全部数据。 方案2:各单位只保留自己的数据。 方案3:公司总部保留全部数据,各分公司只保留自己单位的数据。 系统采用以上不同方案,对应需求不同的数据分配方案。如:
分布式数据库系统原理与应用
3.2分片的定义及作用
3.2.3分片设计过程
分片过程是将全局数据进行逻辑划分和实际物理分配的过程。
①全局数据划分为片段数据 ②片段数据经过分配得到物理数据
GDB
分片模式
GDB : 全 局 数 据 库 (Global DB) FDB : 片 段 数 据 库 ( Fragmentation DB ) PDB : 物 理 数 据 库 (Physical DB)
分布式数据库系统原理与应用
3.2分片的定义及作用
3.2.3分片设计过程 F(GDB)=FDB
F():表示分片模式映射函数;能从全局数据库得到片段数据库
GDB=∑FDBi 表示全局数据库是划分的多个片段数据库的集合。
F-1(FDB)=GDB
F-1()表示分片模式的反映射函数;能从片段数据库得到全局数据
Database 1
Database 2

Database n
分布式数据库系统原理与应用
3.2分片的定义及作用
例:某集团公司分地理位置分别在不同城市的总公司和下 属两个分公司组成,彼此之间靠网络相连接,业务管理由 分布式数据库系统完成。其网络结构图如下所示
分公司1
假设:人事系统中,有职工关系,定义为: EMP {ENO,EName,Salary,DNO}。 场地定义:总公司为场地0,职工关系为 EMP0 分公司1为场地1,职工关系为EMP1
本课程侧重 top-down 设计中存在的关键技术。
分布式数据库系统原理与应用
3.1两种设计策略
3.1.1 Top-down 设计过程
基于五步递归实现: 1. 需求分析(Requirement analysis) 2. 概念设计、视图集成、E-R 表示、转换到关 系模式 3. 分布设计、数据分片和分配 4. 物理设计 5. 性能调优(Tuning)
分布式数据库系统原理与应用
3.2分片的定义及作用
3.2.2分片的作用
减少网络传输量。如:采用数据复制,可就近访问所需信息。需
频繁访问的信息分片存储在本地场地上。 增大事务处理的局部性。局部场地上所须数据分片分配在各自的 场地上,减少数据访问的时间,增强局部事务效率。 提高数据的可用性和查询效率。就近访问数据分片或副本,可提 高访问效率。同时当某一场地出故障,若存在副本,非故障场地上 的数据副本均是可用的。保证了数据的可用性、数据的完整性和系 统的可靠性。 使负载均衡。减少数据访问瓶颈,提高整个系统效率。
相关文档
最新文档