分布式数据库研究现状及发展趋势

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

山西大学研究生学位课程论文(2014 ---- 2015 学年第 2 学期)

学院(中心、所):计算机与信息技术学院

专业名称:计算机应用技术

课程名称:分布式数据库技术

论文题目:分布式数据库研究现状及发展趋势授课教师(职称):曹峰()

研究生姓名:刘杰飞

年级:2014级

学号:201422403003

成绩:

评阅日期:

山西大学研究生学院

2015年 6 月17日

分布式数据库研究现状及发展趋势

摘要随着大数据、云时代的到来,数据库应用需求的拓展和计算机硬件环境的变化,特别是计算机网络与数字通信技术的飞速发展,卫星通信、蜂窝通信、计算机局域网、广域网和激增的Intranet及Internet得到了广泛应用,使分布式数据库系统应运而生。为了符合当今信息系统的应用需求和企业组织的管理思想和管理模式。分布式数据库提供了解决整个信息资产被分裂所成的信息孤岛,为孤岛联系在一起提供桥梁。本文主要介绍分布式数据库的研究现状,存在的一些问题以及未来的发展趋势。

关键词分布式数据库;发展趋势;现状及问题

1.引言

随着信息技术的飞速发展,社会经济结构、生产方式和消费结构已经发生了重大变化,这些变化深刻地影响着人民生活的方方面面。尤其是近十年来人们对计算机的依赖性越来越强,同时也对计算机提出了更高的要求。随着数据库在各个行业中的不断发展,各行业也对数据库提出了更高的要求,数据量也急剧增加,同时有关大数据分析的讨论正在愈演愈烈。甚至出现了爆炸性增长的趋势,一方面是由于移动互联网和移动智能终端的普及发展,数据信息正以每年40%的速度增长,造成数据量庞大;同时,数据种类呈多样性,文本、图片、视频等结构化和非结构化数据共存;另一方面也要求实时交互性强;最重要的是大数据蕴含了巨大的商业价值。相应的对于管理这些数据的复杂度也随之增加。同时各行业部门或企业所使用的软硬件之间的差异,这给开发企业管理数据库管理软件带来了巨大的工作量,如果能够有效解决这个问题,即使用同一模块管理操作不同的数据表格,对不同的数据表格进行查询、插入、删除、修改等操作,也即对企业简单的应用实现即插即用的功能,那么就能大大地减少软件开发的维护和更新费用,缩短软件的开发周期。分布式数据库系统的开发,降低了企业开发的成本,提高了软件使用的回报率。当今社会已进入了信息时代,人们将越来越多的信息存储在网络中的计算机上。如何更有效地存储、管理、共享和提取信息,越来越引起人们的关注。集中式数据库已经不能满足人们的需求,因此分布式数据库系统应运而生,并且得到迅速发展。

分布式数据库系统的出现,有效地利用企业现有资源和网络资源。分布式数据库系统是一个面向地理上分布而在管理上需要不同程度集中的处理系统,主要解决在计算机网络上如何进行数据的分布和处理。由于分布式数据库有许多突出的优点,因此,分布式数据库系统可以广泛地应用于大企业,多种行业及军事国防等领域,这对建立集约型社会,加快社会主义现代化建设,将具有重要的现实意义。。

2.分布式数据库技术发展历史及现状

2.1分布式数据库概述

分布式数据库系统就是由分布于多个计算机结点上的若干个数据库组成,每个子数据库系统都是一个独立的数据库系统,它们都拥有各自的数据库、中央处理机、终端,以及各自的局部数据库管理系统,分布式数据库在使用上可视为一个完整的数据库 ,而实际上它是分布在地理分散的各个结点上。当然,分布在各个结点上的子数据库在逻辑上是相关的。简单的说,分布式数据库系统是物理上分散而逻辑上集中的数据库系统。使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。

分布式数据库是一个建立在计算机通信机制上的网络化系统,由于数据分布存储在不同的站点上,一个事务所涉及的数据可能分布在多个不同的站点上,这种分布执行的事务,系统既要有以一个优化的分布查询策略又要保证事务执行的原则性、可串行性以及解决分布式事务管理和安全问题等等。虽然面临如此大的挑战,但是相比于集中式数据库,分布式数据库的优点主要体现以下一些方面:

(1)现实世界中数据库往往是分布存在于各个物理点的,比如银行的若干支行,公司的子公司,对于每个站点上的数据库来说通常只要描述本地的数据,局部数据库的数据源和大多数用户一般驻留在本地,这就符合分布式的模型。

(2)分布式数据库增加了可靠性和可用性,这是分布式数据库技术的最吸引人的优点,可靠性是说系统在特定时刻能达到的能力,可用性是说在一定时间间隔内系统能继续工作的能力,当数据和DBMS软件分布在几个不同的站点上时,当有几个站点出现故障,仅仅是出故障的站点上数据库系统和软件不能正常工作,而其他站点的数据库系统不受影响仍然能继续工作,这就可以很好的改善系统的可用性和可靠性。如果数据和软件能冗余地存放在多个站点,其改善的效果会更好,但此时会造成数据冗余,对系统造成大的负荷,同时维护成本也同时增加。同时还可以获得一定的容错能力,而在传统的集中式数据库系统中,单个站点的故障会导致整个系统的瘫痪。

(3)分布式数据库还提供局部自治的数据共享,各个站点的用户总是希望拥有自己的数据并且管理自己的数据,同时又想共享其他场地上的有关数据,在分布式数据库系统中各个局部数据库均有一定的自治权,这种基于局部自治的数据共享较好的满足了用户的需求。

(4)分布式数据库还改善了系统整体的性能,当一个大型数据库分布在多个站点上时,在每个站点上就是较小的数据库,由于规模较小,在单个站点上的局部查询和事务处理会有较好的性能。对于事务执行而言,可以调用多个场地上的数据,在不同场地上并行处理以减少相应时间,同时大部分数据可以就地访问,减少了通信开销,避免了集中式数据库的瓶颈问题。

(5)在分布式数据库中,用户可以根据自己的需要增减节点,或对系统进行重新配置,灵活性好。可以逐步扩展处理能力和系统的规模,而不影响现有系统的结构和系统的正常运行,有时候这也是系统扩展的唯一途径。

相关文档
最新文档