高级数据库原理与技术

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


2.充分利用节点信息


3.通信方法和协议

2013年11月25日星期一
ADB Sides By MAO
11
第一篇 预备知识
内容提要

第1章 分布式系统

分布式系统的定义 高层操作系统

第2章 数据库基础知识

数据库技术的发展 数据模型 数据库系统的基本组成 数据库设计与实例 数据库操作语言

显然,上面的硬件分布性是递增的。从分布式系 统的观点看,随着硬件分布性的增强,系统才更 有希望接近分布式系统的目标。上面的D和E是构 成理想分布式系统的硬件环境。
2013年11月25日星期一
ADB Sides By MAO
4
分布性的刻画(续)

2.控制方式层次




A.单个控制点:物理上的或概念上的一个控制节点。 B.固定主从关系:有一个节点是主节点,其它的是从节点。当然 也可以构成多级主从关系。这种主从关系是预先规定好的,不能 修改。 C.动态主从关系:可以通过程序修改主从关系。 D.多个控制节点独立工作:例如,多个计算机最多是在I/O级别 上交换信息。 E.多个控制点在某个层次上(如任务分割)协同工作。 F.多个同构控制点完全协同工作。 G.多个同构或异构控制点完全协同工作。
2013年11月25日星期一
ADB Sides By MAO
15

概念数据模型(conceptual data model ):
面向客观世界,与具体的数据库系统和计算 机无关,它着重对客观世界事物描述以及 内在关系的刻画。
例如: E-R模型,扩充E-R模型(EE-R),面向对象 模型,谓词模型。
2013年11月25日星期一

当然理想的分布式系统的数据分布是F。如果放宽 标准的话,C,D和E也可以认为是分布式系统的 数据组织形式。
2013年11月25日星期一
ADB Sides By MAO
6
分布性的刻画(续)

图1-1可以帮助我们直观上区分哪些系统是理想的 分布式系统、哪些是准分布式系统、哪些只是使 用了部分分布式思想或技术的系统、哪些根本就 不是分布式系统。
2
分布式系统的定义



美国电工电子学会下属的计算机学会给出的分布式系统描述为“包含 多个相连的处理资源,这些资源能在系统的控制下,对单一问题进行 合作,而且最少依赖集中过程、数据或硬件。” 英国国家科学研究委员会下属的计算机学会给出的分布式系统描述为 “包含多个独立的但又交互作用的计算机,它们可以对公共问题进行 合作。这个系统的特点是包含多个控制路径,它们执行一个程序的不 同部分而且又相互作用。” P.H.Enslow总结了分布式系统的五个基本准则,从中可以对分布式 系统有个更透彻的认识。
2013年11月25日星期一 ADB Sides By MAO
1
第一篇 预备知识
内容提要

第1章 分布式系统

分布式系统的定义 高层操作系统

第2章 数据库基础知识

数据库技术的发展 数据模型 数据库系统的基本组成 数据库设计与实例 数据库操作语言
2013年11月25日星期一
ADB Sides By MAO
硬 件 E D C
B
A
E D C B F数据
A
A
B
C
D
E
F G 控制
图1-1 分布特征示意
2013年11月25日星期一
ADB Sides By MAO
7

典型的非分布式系统及其特征加以分析 1.系统中引入专用处理部件

在系统中引入专用处理部件的系统大多是一台主机和若干用于固 定任务的专用部件。像引入通道的计算机、控制通信的前端处理 机、向量乘法器、快速傅里叶变换器等属于这种。尽管这些使用 很普遍的系统在结构上具有多处理机特性,但是那些专用部件只 能完成某些特定的任务,在地位上和主机是不平等的。




1.资源的重复性:所谓资源的重复性是指分布式系统中硬件、软件以及数据的冗 余配置。 2.物理上的分布性:从硬件上看,不同的计算机或处理器以节点形式相对独立地 分布。随着概念的技术的发展,其实这里的分布性也可以从不同层次来理解。从软 件上看,每个节点都可以有全局相关的系统程序、局部系统程序以及应用程序;从 数据上看,它可能是一个数据分布的系统。 3.高层操作系统(或分布式操作系统):它负责对系统的分布性资源进行统一的 控制,使一个简单的硬件堆积转变为一个统一协调的工作系统。 4.系统的透明性:理想的分布式系统应该为最终用户屏蔽具体的系统实现细节, 用户像使用单一的集中式系统一样来使用分布式系统。 5.协作的自治性:理想的分布式系统应该是每个节点都是一个完整的处理系统, 表现出强大的自治性。

2.时间延迟


3.通信的代价


4.负载均衡

2013年11月25日星期一
ADB Sides By MAO
10
分布式操作系统设计原则

1.内核最小

每个节点都有自己的本地操作系统,高层操作系统不能代替本地 操作系统来完成本地处理任务。它的重点要集中在通信控制、任 务分割、透明访问等全局工作上。 由于系统的自治性、时间延迟以及系统可用性等的考虑,分布式 系统面对的是不完整甚至是不精确的状态信息。高层操作系统必 须考虑最大程度上利用这些状态信息。在修正不一致性状态信息、 推测缺省状态信息、仲裁死锁、并发控制等方面,需要有合理而 有效的机制。 在网络互联结构中,有许多成功的通信协议可以借鉴。但是,必 须考虑分布式系统的特点,所有通信参数都必须通过完善的定义 而且有严格执行的接口。协议的选择和研制要考虑节点的自治性 和兼容性。
2013年11月25日星期一
ADB Sides By MAO
12
数据存储和处理技术的发展过程

图2-1给出了数据存储和处理技术的发展过程。




20世纪60年代:文件处理;数据库探索 20世纪70年代: 层次和网络数据库系统的系统化研究和应用; 关系模型诞生、关系型数据库系统的研究与研制; 数据模型工具,如实体关系模型的使用和工具研制等; 索引和数据组织技术;查询语言的标准化,如SQL; 20世纪80年代: 关系型数据库日渐成熟并开始大量应用; 数据查询处理和优化技术发展增强了关系型数据库处理规模; 分布式数据库概念得到广泛接受并被系统化研究; 一些其它数据库技术和系统被研究和研制 20世纪90年代: 跨平台的大型数据库系统得到应用; 以数据仓库为核心的多样化数据存储和处理技术; 数据分析和挖掘技术得到系统化研究并被逐步使用 21世纪:数据处理和分析技术的研究成果会逐步应用到商品中, 并且会不断探索新的技术
ADB Sides By MAO
2013年11月25日星期一
13
第一篇 预备知识
内容提要

第1章 分布式系统

Baidu Nhomakorabea
分布式系统的定义 高层操作系统

第2章 数据库基础知识

数据库技术的发展 数据模型 数据库系统的基本组成 数据库设计与实例 数据库操作语言
2013年11月25日星期一
ADB Sides By MAO
教材信息:
《高级数据库原理与技术》
By 毛国君 Pub. 人民邮电出版社,2004-8
使用说明:
本书将全面介绍新型高级数据库,包括分布式数据库、并行数 据库、Oracle系统、数据仓库以及诸如面向对象数据库和多媒 体数据库等相关技术。本书按篇组织,各篇相对独立。可作为 计算机专业研究生或高年级本科生教材。本课件供全书讲解之 用,为了取得好的教学效果,教师应该根据学生层次、教学大 纲或课时安排进行必要裁减。

上面的控制方式中,F和G是分布式系统所追求的。 如果放宽标准的话,E也可以认为是分布式系统的 控制形式。
2013年11月25日星期一
ADB Sides By MAO
5
分布性的刻画(续)

3.数据分布层次



A.集中式数据库:在文件及目录上只有单一的拷贝,减少数据存 储冗余是它追求的目标之一。 B.文件分布但中央集中式目录:没有本地目录,所有的访问都必 须通过这个中央目录来完成。 C.重复的数据库拷贝:在每个节点都有一份完整的数据拷贝。 D.主节点存放完整数据,其它节点存放所需的数据或数据分片。 E.主节点存放数据分布图或目录,其它节点存放所需的数据或数 据分片。 F.所有节点都存放最需要的数据或数据分片,而且任何节点都能 形成对其它节点的访问。
在硬件上,系统的各处理部件有不同的地位,有些只是被动地接 受分配的任务。在软件控制上,它们执行的不是协作性协议,而 是按主从模式工作,严重违反了分布式系统的协作自治性原则。 以一个具有多个计算机组成的网络互连结构为例,它们有很好的 自治性,而且能交换信息。但是,这种协作是有限的。它们无法 因为硬件故障来重新分配任务,即使是双机或多机备份系统,离 真正的分布式系统仍有距离,因为它们很难同时合作解决一个大 问题。
14

数据模型(data model):
是数据库数据特征的抽象,描述数据的结构(静 态特征)、定义在其上的操作(动态行为)以及 约束条件。 数据模型按应用层次分为三种类型: 概念数据模型(conceptual data model )、 逻辑数据模型(logic data model )、 物理数据模型(physical data model)。
2013年11月25日星期一
ADB Sides By MAO
3
分布性的刻画

1.硬件构成层次





A.单CPU:单一控制器、单一运算器、单一内存。 B.多执行部件:单一控制器、多运算器或存储器。 C.具有专用功能部件:单一通用控制器、多运算器或存储器、配 有通道/输入输出处理机/向量运算部件/辅助数学运算部件等专用 功能部件。 D.多处理机:多个控制器、多运算器或存储器、单一输入输出系 统。 E.多计算机:多台通用计算机。
2013年11月25日星期一
ADB Sides By MAO
9
分布式系统必须面对的问题

1.不完整系统状态信息

在集中式系统中,总是假设操作系统是在完整而准确的系统状态信息下工 作的。但是,在分布式系统中,这种假设是可望而不可及的。这是因为为 获得这些完整而准确的系统状态信息的代价太大了,根本无法在用户可忍 受的范围内收集和整理出这些状态信息并及时得到利用。 在集中式系统中,操作系统可以及时请求状态信息而保证被询问的部件在 稳定的状态下作出决定。但是,在分布式系统中,由于自治性的局部处理 和多任务的交叉作用使发生时间的滞后是必然的。这种时间延迟也会带来 系统状态信息的不准确。 分布式系统的通信是复杂的,特别是如何使通信的代价降到用户可以忍耐 的层次。在单处理机系统中,我们可以使用信号灯、标志、加锁等来解决 同步处理问题。但是,在分布式系统中,这些方法会大量消耗时间和降低 系统的吞吐能力。解决合理的通信代价问题是分布式操作系统设计的重要 目标。 在集中式系统中,各部件的任务明确。但是分布式系统是多机或多处理机 协同工作的系统,为了提供系统的整个效率和吞吐量,必须考虑最大程度 发挥每个节点的作用。负载均衡是保证系统总效率的关键技术。
ADB Sides By MAO
16

逻辑数据模型(logic data model ):
面向数据库系统的模型,是客观世界到计算机间 的中介模型。
例如: 层次模型,网状模型,关系模型,面向对象模型, 谓词模型,对象关系模型。
2013年11月25日星期一
ADB Sides By MAO
17

物理数据模型(physical data model):
面向计算机物理表示的模型。
概念数据模型---逻辑数据模型--- 物理数据模 型
2013年11月25日星期一
ADB Sides By MAO
18
数据模型的四个世界



现实世界:需要用数据库实现的部分客观世界。 概念世界:将现实世界用概念模型的术语、方法统一 表示。与具体数据库,计算机无关。 信息世界:在概念世界的基础上进一步在数据库级上的 刻画,构成的逻辑模型。 计算机世界:在信息世界的基础上进一步在计算机物理 结构上的描述,构成的物理模型。

2.系统中主从关系明显


3.简单网络互联结构

2013年11月25日星期一
ADB Sides By MAO
8
第一篇 预备知识
内容提要

第1章 分布式系统

分布式系统的定义 高层操作系统

第2章 数据库基础知识

数据库技术的发展 数据模型 数据库系统的基本组成 数据库设计与实例 数据库操作语言
相关文档
最新文档