分布式数据库的同步更新技术研究_李素萍

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分布式数据库的
同步更新技术研究
李素萍太原理工大学阳泉学院信息系
045000
-94-
中国科技信息2008 年第16 期CHINA SCIENCE AND TECHNOLOGY INFORMA TION Aug.2008
信息科技
的数据则称为本地(或局部)用户或本地应
用;如果访问涉及两个或两个以上的站点中
的数据,则称为全局用户或全局应用。

2 数据同步更新技术
2.1 数据同步更新的概念
[2]
由于多个数据库副本的存在,就必须
采用数据同步更新的技术,捕获各个数据
库中数据对象的改变,维护各个数据库数
据的一致性。

用户只需关心本地数据库的
维护,对于数据副本的更新则由数据库系
统本身去完成。

对于数据同步,各个数据库
系统都有自己的解决方案,目前Informix,
SQL Server, Sybase, Oracle等数据库系统
中都有专门的数据同步构件。

同步更新技术就是这样一种技术,它
通过使在分布式数据库中的数据库站点之
间的数据更新的同步,达到使数据分布存
放的目的,从而实现数据库的分布式处理
应用。

这种处理方式允许应用程序透明地
存取那些分布存放的数据,让用户感觉好
象这些数据就存放在本地的数据库服务器
上。

在实现过程中,数据分为源数据和副
本,源数据一般放在经常更新操作的站点
上,修改数据只能对源数据进行,副本的
修改只能通过复制进行。

它将数据复制的
物理过程分为两步:修改过程和复制过程,
对一个数据拷贝进行插入、修改和删除的
过程称为修改过程;将修改过的拷贝的数据
复制到其它拷贝的过程称为复制过程。

2.2 同步更新技术的作用
[3]
同步更新技术的一个非常重要的作用
分布式数据库的
同步更新技术研究
李素萍太原理工大学阳泉学院信息系045000 1 分布式数据库概述
[1]
分布式数据库系统,通俗地说,是
物理上分散而逻辑上集中的数据库系统。

分布式数据库系统使用计算机网络将地理
位置分散而管理和控制又需要不同程度集
中的多个逻辑单位(通常是集中式数据库系
统)联接起来,共同组成一个统一的数据
库系统。

因此,分布式数据库系统可以看
成是:计算机网络与数据库系统的有机结
合。

在分布式数据库系统中,被计算机网
络联结的每个逻辑单位,称为站点(Site)或
结点(Node)。

所谓地理位置上分散是指各
站点分散在不同的地方,大可为不同国
家,小可为同一建筑物中的不同位置。


谓逻辑上集中是指各站点之间是一个逻辑
整体,并由一个统一的数据库管理系统进
行管理,这个数据库管理系统称为分布式
数据库管理系统((Distributed Database Management System,简称DDBMS)。

一个用户如果只访问他注册的那个站点上
就是可以实现分布式数据库中的各个站点
无阻塞的提交。

这是因为在传统的分布式
数据库中,各个计算机站点之间是假定通
过固定的网络连接,并保持网络持续的连
接性。

在事务提交时,为了保证分布式事
务的原子性,系统通过二次提交(Two-
Phase Commit)协议来对提交进行控制。

在二次提交协议中,由事务协调程序即协
调者(Coordinator)来控制各个参与者是否
可以提交,但是由于网络环境的不健壮性
使得所有参与站点同时提交的可能性减小,
不可避免地造成能够正常提交的站点等待
因失效不能提交的站点,而形成事务提交
的阻塞。

这样就降低了系统的可用性并增
加了事务提交的延迟时间。

2.3 同步更新的方式[4]
数据库同步更新技术根据它的两步物
理过程的差异而形成下列两种同步更新方
式:
(1 )紧凑一致性方式( T i g h t
Consistency)
紧凑一致性方式要求修改过程和复制
过程应同时进行,即数据所有拷贝在任何
时间都应保持一致,这种方式是采用两阶
段提交的技术来实现的。

由于远程传输速
率、响应时间等因素的影响,目前看来,紧
凑一致模式只适合在局域网上运行。

(2 )松散一致性方式( L o o s e
Consistency)
松散一致性方式允许修改过程和复制
过程可异步进行,两者之间存在一个时间
延迟,如果修改能停下来等到复制过程赶
上,则数据的每个拷贝之间就能一致。


参与复制的某个站点有故障时,那个节点
的复制过程暂时停止,等待发生故障的节
点解除故障后再进行。

2.4 数据复制技术
[5]
分布式数据库系统中数据交换策略通
常采用增加数据副本的方法,这使得大多
数远程访问转换成本地访问,从而提高了
应用系统查询速度和可靠性。

由于副本在
多个站点上,一旦要对数据进行更新时,
图1 复制服务器
摘要
本文主要针对网络环境下分布式数据库的同
步更新技术进行了探讨。

首先对于分布式数
据库系统进行了简单的介绍,在此基础上进
一步分析同步更新的技术,主要对数据复制
进行了深入的讨论,希望以此作为建议方
案,实现企业数据库的同步更新。

关键词
分布式数据库;同步更新;数据复制
Abstract
This paper mainly for network environment distributed database synchronization newer technologies were discussed. First distributed database systems for a
simple, on this basis, further analysis of the simultaneous upgrading of technology, mainly for data replication conducted in-depth discussions that as a proposal,
the realization of the enterprise database synchronization update.
Key words
distributed database; synchronization update; data replication为保证数据库的一致性,就必须对增量数据在所有节点上进行复制。

2.4.1 数据复制技术概念
数据复制((Data Replication)作为一种
重要而有力的实现数据分布的数据库技
术,使得数据的分布变得简单。

数据复制
可以把一个系统中的数据通过网络分布到
另外一个或多个地理位置不同的系统中,
其目的是为了提高系统的可用性、可靠性
及性能。

数据复制技术其功能是对数据冗余控
制与维护,它用于将某个服务器上的某些
表中的数据复制和分发到其他的数据库服
务器上,并重新生成,保证数据的同步更
新,使用户在其他站点就可以完成分布式
查询操作,减少网络的开销。

此外,用
户只需关心本地数据库的维护,对于数据
副本的更新则由数据库系统本身去完成。

在实现过程中,数据分为源数据和副
本,源数据一般放在数据的采集结点或经
常有修改操作的结点上,副本一般放在经
常查询操作的结点上。

在一般的复制技术
中,修改操作只能对源数据进行,副本的
修改只能通过复制进行。

在高级复制技术
中,数据的修改也可以在副本上进行。


据复制的物理过程分成两步:修改过程和复
制过程,对一个数据拷贝进行插入、修改
和删除的过程为修改过程;将修改过的拷贝
的数据复制到其它拷贝的过程为复制过
程。

对多节点的分布式数据库系统来说,
数据复制至少有两点好处:一是增加系统的
可用性,即在有些节点不能工作的情况下
能完成某些事务; 二是提高操作的效率,
有复本的节点可就近读到复本中的数据,
减少了通讯量。

2.4.2 数据复制的方式
数据库数据复制技术根据它的两步物
理过程的差异而形成下列两种更新方式: (1 )同步复制。

同步复制方式要求
修改过程和复制过程应同时进行,即数据所有拷贝在任何时间都应保持一致,这种方式是采用两阶段提交的技术来实现的。

此类复制保证所有数据更新后的完整性优先于事务操作的完整性,即所有的数据拷贝在任何时候都是同步的,如果某个目标节点由于某种原因崩溃了,则正在进行的事务操作失败。

由于远程传输速率、响应时间等因素的影响,目前看来,同步复制模式只适合在局域网上运行。

(2 )异步复制。

步复制方式允许修
改过程和复制过程可异步进行,两者之间存在一个时间延迟。

事务不需要直接访问复制的数据拷贝就能完成操作,可以在任意时刻更新源数据,稍后再更新其他复制站点的数据,使数据的每个拷贝之间一致。

当参与复制的某个站点有故障时,那个节点的复制过程暂时停止,等待发生故障的节点解除故障后再进行。

若实际应用允许在一定的时间内(容忍范围由实际的应用决定)各结点上的数据库的内容存在差异,采用异步复制是较好的方案。

它对网络的要求大大降低,能够减少网络资源和硬件资源的消耗,对网络的连接状况呈现出更大的灵活性,更符合实际的应用。

由于采取异步更新数据方式,在复制
数据过程中可能会产生数据冲突现象,如何发现冲突并解决冲突是异步复制过程中一个很关键的问题。

此外,解决异构数据库间的复制问题时,还必须解决因模式定义上的差异引起的模式转换问题。

2.4.3 数据复制技术的分类
根据数据复制的实时性和场地自治性
的不同要求,可以分为:
(1)分布式事务处理
具有最小的场地自治性和最小的数据
同步延迟。

采用两阶段事务处理提交机制,确保数据更改要么全部施加于所有副本集合的成员上,要么全部撤销,各个场点数据状态回到更改前的状态。

(2)事务级数据复制同步
具有较小的场地自治性和较小的数据
同步延迟。

这种方式分为两种:
A 允许数据订阅者更新数据的事务级
数据复制同步。

在这种机制下,不仅允许数据出版者对所出版数据进行更新,同时允许数据订阅者对订阅的数据进行更新。

B 不允许数据订阅者更新数据的事务
级数据复制同步。

在这种机制下,仅允许数据出版者对所出版数据进行更新,而数据订阅者场点仅允许被动接受订阅的数据。

(3)静态数据复制同步
具有较高的场地自治性和较高的数据
同步延迟。

这种方式分为两种:
A.允许数据订阅者更新数据的静态数
据复制同步。

在这种机制下,不仅允许数据出版者对所出版数据进行更新,同时允许数据订阅者对订阅的数据进行更新。

B.不允许数据订阅者更新数据的静态
数据复制同步。

在这种机制下,仅允许数据出版者对所出版数据进行更新,而数据订阅者场点仅允许被动接受订阅的数据。

(4)数据合并复制同步
具有最高的场地自治性和最高的数据
同步延迟。

在这种机制下,不仅允许数据出版者对所出版数据进行更新,同时允许数据订阅者对订阅的数据进行更新。

根据复制的内容又可以分为两大类:
(1 )表复制技术
表复制技术采用把某一时刻源数据的
表的内容通过网络发送到复制的副本。

因为复制的内容是表的某一时刻的状态,所以又形象地称为表快照,多长时间进行一次表快照的复制,要根据实际的需求和环境决定。

表快照的复制是基于表的复制。

由于不是以事务为基础,所以副本缺乏基本的关系完整性。

(2 )事务复制技术
事务复制技术是异步地把修改源数据
的事务通过网络发送到复制的副本,复制可以是修改的表项事务或事务日志。

复制的时间可根据应用需求、网络情况和站点情况而确定。

副本接收到复制内容后,要重复一遍接收到的事务操作来实现与数据
源的一致。

结束语
数据复制技术已经大量应用在各种企
业信息管理系统及应用系统之中,如银
行、外贸、金融等系统中。

数据复制技
术解决了这些系统分布的各节点之间同步
数据、协同工作的问题。

它在原有的多个
集中式的数据库系统的改造和进一步数据
集中的工作中也将有重要的应用。

参考文献
[1] 赖万钦.Oracle复制技术在分布式信息
系统中的同步应用[J].计算机时代.2007, (3).
[2] 胡耀民,周江.分布式环境下高速数据
服务器的研究与设计[J].广东交通职业技
术学院学报.2006,(3).
[3] 杨跃武,王宪生.分布式数据库同步更
新的实现方法[J].佛山科学技术学院学报(自然科学版).2005,(2).
[4] 高春雷,尹燕敏.分布式实时库的一致
性实现[J].电力自动化设备.2005,(4).
[5] 丁鲲,严浩,刁兴春.分布式数据库数据
同步技术研究[J].海军工程大学学报.2004
作者简介
李素萍,出生年月:1967.11.14,性别:女,籍贯:山西省阳泉市,学位:学士,职称:讲师,职务:教师,主要研究方向:软件工程。

相关文档
最新文档