分布式数据库综述报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
电子科技大学
研究生课程综合考核报告
课程名称:数据库新技术
教师姓名:胡旺
学生姓名:***
学号:************ 成绩:
学期:2015年下学期
分布式数据库综述报告
摘要
随着传统的数据库技术日趋成熟、计算机网络技术的飞速发展和应用范围的扩充,数据库应用已经普遍建立于计算机网络之上。这时集中式数据库系统表现出它的不足:数据按实际需要已在网络上分布存储,再采用集中式处理,势必造成通信开销大;应用程序集中在一台计算机上运行,一旦该计算机发生故障,则整个系统受到影响,可靠性不高;集中式处理引起系统的规模和配置都不够灵活,系统的可扩充性差。在这种形势下,集中式DB的“集中计算”概念向“分布计算”概念发展。分布计算主要体现在客户机/服务器模式和分布式数据库体系结构两个方面。分布式数据库系统通常使用较小的计算机系统,每台计算机可单独放在一个地方,每台计算机中都有DBMS的一份完整拷贝副本,并具有自己局部的数据库,位于不同地点的许多计算机通过网络互相连接,共同组成一个完整的、全局的大型数据库。DDBS已成为信息处理学科的重要领域,正在迅速发展,原因基于以下几点:①它可以解决组织机构分散而数据需要相互联系的问题。②如果一个组织机构需要增加新的相对自主的组织单位来扩充机构,则分布式数据库系统可以在对当前机构影响最小的情况下进行扩充。③均衡负载的需要。数据的分解采用使局部应用达到最大,这使得各处理机之间的相互干扰降到最低。负载在各处理机之间分担,可以避免临界瓶颈。④当现有机构中已存在几个数据库系统,而且实现全局应用的必要性增加时,就可以由这些数据库自下而上构成分布式数据库系统。
关键词:分布式数据库集群数据存储
1.分布式数据库产生背景
20世纪六十年代末和七十年代出现了比较成熟的数据库系统。以IMS为代表的层次型数据库系统于1968年问世。20世纪七十年代初,美国CODASYL的数据库任务组的提出了有名的网络数据库模型DBTG。分布式数据库的研究始于20世纪70年代中期。E. F. Codd于20世纪七十年代中期提出了关系数据库。世界上第一个分布式数据库系统SDD-1是由美国计算机公司(CCA)于1979年在DEC
计算机上实现。七十年代,计算机科学技术的发展与飞速发展的现代通信技术相结合,导致了计算机网络的出现。这个时期,世界上先后建成了许多规模巨大的、全国性的广域计算机网络对经济、国防、情报、科学技术和社会生活产生了深刻的影响。随着微型计算机的广泛应用,又自然地提出了这样的新问题,为了加强和扩大微型计算机处理数据的功能,要求将许多分布在不同地点上的微型计算机互连起来,共同工作。这样,进入了分布式数据库时代。20世纪90年代以来,分布式数据库系统进入商品化应用阶段,传统的关系数据库产品均发展成以计算机网络及多任务操作系统为核心的分布式数据库产品,同时分布式数据库逐步向客户机/服务器模式发展。
随着传统的数据库技术日趋成熟、计算机网络技术的飞速发展和应用范围的扩充,数据库应用已经普遍建立于计算机网络之上。这时集中式数据库系统表现出它的不足:数据按实际需要已在网络上分布存储,再采用集中式处理,势必造成通信开销大;应用程序集中在一台计算机上运行,一旦该计算机发生故障,则整个系统受到影响,可靠性不高;集中式处理引起系统的规模和配置都不够灵活,系统的可扩充性差。在这种形势下,集中式DB的“集中计算”概念向“分布计算”概念发展,以分布式为主要特征的数据库系统的研究与开发受到人们的注意。分布式数据库是数据库技术与网络技术相结合的产物,在数据库领域已形成一个分支。
2.国内外研究进展
分布式数据库系统(Distributed Database system,简称DDBS)已有20多年的发展历史,经历了一个从产生到发展的过程,取得了长足的进步,许多技术问题被提出并得到了解决。20世纪90年代起,DDBS己进入商品化应用阶段,当前,分布式数据库技术已经成熟并得到广泛应用。一些数据库厂商在不断推出和改进自己的分布式数据库产品,以适应多种需要和扩大市场的占有份额。但是,实现和建立分布式数据库系统绝对不是数据库技术与网络技术的简单结合,而是在这两种技术相互渗透和有机融合后的技术升华,它又产生了很多新的技术。而且,分布式数据库系统虽然基于集中式数据库系统,但分布式数据库系统却有它自己的特色和理论基础。由于数据的分布环境形成了很大的固有的技术难度,使得分布式数据库系统的应用被推迟。至今完全遵循分布式数据库系统规则,特别是实
现完全分布透明性的商用系统还很难见到。
2.1 分布式数据库国内发展现状
我国对分布式数据库系统的研究约在20世纪80年代初期开始,一些科研单位和高校先后建立和实现了几个各具特色的分布式数据库系统。如由中国科学院数学研究所设计,由该所与上海科学技术大学、华东师范大学合作实现的C.POREL,武汉大学研制的WDDBS和WOODDBS,东北大学研制的DMD/FO系统等,尤其值得一提的是华中科技大学达梦数据库多媒体研究所开发的DMZ多媒体数据库,它解决了异构数据库系统实现数据的共享和透明访问的难度。他们的工作对我国分布式数据库技术的理论研究和应用开发起到了积极的推动作用。
2.2 分布式数据库国外发展现状
国外对分布数据管理的研究有两个方面:一是单项的研究。比如数据的分布问题,通信问题等。在研究一个问题时,假定其它因素是不变的,得出研究成果。此处还要研究的是要将各种因素综合起来,研究它们的相互作用和结果。数据库设计和更新同步之间就有密切的联系,对于更新要求,依据不同的更新同步方案,对通信系统的要求也随着不同。因此,就要对这些因素综合地考虑。二是对计算机网络的研究。计算机网络技术的迅速发展,已经很大程度地影响到了数据库和分布数据库的领域。不管是在远程网络还是局域网领域,都发生了很多的变比。局域网和远程网之间的处理差别,必然会导致处理数据库和分布数据库问题的显然不同的一些原则和方法。分布式数据库系统已经成为信息处理学科的重要领域,正在迅速发展之中。
3.分布式数据库实现思路及体系结构
分布式数据库系统是在集中式数据库系统的基础上发展起来的,由分布式数据库管理系统和分布式数据库组成,是数据库技术与计算机网络技术的产物。分布式数据库管理系统是具有管理分布数据库功能的计算机系统,分布式数据库则是一组逻辑上属同一系统,但物理上分布在计算机网络的不同结点的结构化数据的集合,由分布于计算机网络上的多个逻辑相关的数据库组成。网络中的每个结点(场地)具有独立处理的能力(称为本地自治),可执行局部应用,同时,每个结点通过网络通讯系统也能执行全局应用。所谓局部应用即仅对本结点的数据