数据保护技术概述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
持续数据保护技术概述
1引言
自2000年以来,数据存储技术已掀起了继计算机浪潮、互联网浪潮之后的第三次浪潮。
通过这三次浪潮,人们也逐渐认识到,对于信息系统来说最重要的不是主机,也不是网络,而是数据。
在企业的IT建设中,数据的完整性、安全性、可用性和管理性是维持业务正常运转的必要条件。
目前,企业数据系统的安全体系主要包括数据保护系统和高可用系统。
数据保护系统提供应用系统的数据后援,确保在任何情况下数据具有完整的恢复能力;高可用系统主要是通过网络、服务器、存储子系统等的冗余,确保系统在发生局部意外的情况下(网络、电源、存储子系统等故障) ,以最短的时间恢复系统。
目前,我们已经认识到了高可用系统的重要作用。
所以,当灾难或事故发生时,及时有效的实现对数据的保护和快速恢复数据的可用性就变得尤为重要。
传统数据保护解决方案的关注点是定期的数据备份,代表技术有镜像技术,快照技术等。
但随着技术的发展和应用要求的提高,一些新技术应运而生,持续数据保护技术(Continuous Data Protection,CDP)便是其中的代表,它是存储备份发展的最新阶段,同时也为我们实现灾难恢复提供了一个新的选择。
本文首先对传统数据保护技术,如镜像技术、快照技术做了简要的介绍;然后从持续数据保护技术的概念、技术特点、实现方式、以及分类等方面对持续数据保护技术做了详细的说明;最后介绍了持续数据保护技术的一些应用。
2传统数据保护技术
2.1镜像技术(Mirrors)
镜像是一个基于块层的功能,是在两个或多个磁盘或存储系统上生成同一个数据的镜像视图的信息存储过程,它包括一个主镜像系统,和一个从镜像系统[1]。
按主、从镜像存储系统所处的位置可分为本地镜像和远程镜像。
远程镜像按请求镜像的主机是否需要镜像站点的确认信息,又可分为同步远程镜像和异步远程镜像。
远程镜像的优点是将灾难引发的数据损耗降低到最低甚至为零;其次,一旦发生灾难,恢复进程所耗费的时间也比较短。
缺点是代价较高,至少需要占用两倍以上的主磁盘空间,另外还无法阻止系统失败、数据丢失、损坏和误删除等灾难的发生。
2.2快照技术(Snapshots)
快照是关于指定数据集合的一个完全可用拷贝,该拷贝包括相应数据在某个时间点(拷贝开始的时间点)的映像。
它可以是其所表示的数据的一个副本(Duplicate),也可以是数据的一个复制品(replicate)[2-3]。
快照技术主要有三种实现方式[4]:分离镜像(Split Mirror)、指针重映射(Pointer
Remapping)和写前拷贝(Copy-on-Write)。
快照技术都是在应用层或文件层实现的,在备份的过程中开销较大,应用范围也相对较窄。
3持续数据保护技术(Continuous Data Protection)
持续数据保护技术(Continuous Data Protection--CDP)是数据保护领域的一项重大突破。
传统的数据保护解决方案都将主要精力放在定期的数据备份上。
但是,在定期备份状态下一直伴随有备份窗口[5]、数据一致性以及对生产系统的影响等问题。
而CDP技术,则将注意力的焦点从备份转向了恢复。
它可以为重要数据中的变化提供连续的保护,IT管理员根本不需要考虑备份的问题。
当灾难发生时,基于CDP的解决方案可以迅速恢复到任何一个需要的还原点,从而为用户提供更大的灵活性和更高的性能。
3.1CDP的概念
SNIA数据保护论坛(DMF)的持续数据保护特别兴趣小组(CDP SIG)对CDP的定义是:持续数据保护是一套方法,它可以捕获或跟踪数据的变化,并将其在生产数据之外独立存放,以确保数据可以恢复到过去的任意时间点[6]。
持续数据保护系统可以基于块、文件或应用实现,能够为恢复对象提供足够细的恢复粒度,实现几乎无限多的恢复时间点。
SNIA给出的概念中明确指出了CDP技术可以“确保数据能恢复到过去的任意时间点”,因此可以提供较以往更为灵活的目标恢复点(Recovery Point Objectives - RPO)和更快的目标恢复时间(Recovery Time Objectives - RTO),它可以捕获和保护数据中所有的变化,而非仅仅是某个预先选定的时间点。
这样就可以随时访问数据,减少数据损失并消除代价高昂的停机损失,同时数据的检索也变得非常可靠、快速和精细。
3.2CDP的技术优势
可以提高数据恢复时间点
以往的备份技术的数据保护间隔一般为24小时,因此用户的数据丢失量风险可能长达24小时;快照技术,则可以将此风险降低到几个小时之内;而CDP技术则可以把数据丢失量风险降低到几秒。
实际上,在传统数据保护技术中采用的是对“单时间点(SPIT)”的数据拷贝进行管理的模式,而持续数据保护可以实现对“任意时间点(APIT)”的数据访问。
从图1我们就可以清楚地看到这几种技术保护间隔的差异。
此外,由图1我们还可以看到,虽然复制技术可以通过与数据产生同步,来获得数据的最新状态,但它无法避免由人为错误或病毒攻击所造成的数据丢失。
当产生的数据由上述原因遭到破坏时(例如数据被误删除),复制技术会将被破坏的数据状态同步到后备数据存储系统上,使后备数据也受到破坏。
但是,采用CDP技术以后,就可以使数据状态恢复到它们被破坏之前的任意一个时间点,这样就可以消除复制技术无法避免的这种风险。
图1 持续数据保护技术与传统数据保护技术的保护间隔比较
●数据恢复更加灵活、方便
由于CDP技术的恢复时间(RTO)和恢复点(RPO)的粒度更细[7],使用者恢复数据时就不必再受数据保护的限制,有时甚至可以实现直接对数据进行恢复操作,因此CDP技术使数据恢复变得更加灵活、方便。
3.3CDP的实现方式
实现持续数据保护的关键就是对数据变化的记录和保存,实现在任意时间点的快速恢复。
它一般有三种实现方式: 基准参考数据模式、合成参考数据模式和复制参考数据模式。
下面就依次做一下介绍。
●基准参考数据模式
我们先来看一下基准参考数据模式的工作原理:首先,根据已产生的数据来建立供恢复时用的参考数据拷贝(这个拷贝只需建立一次);然后,在参考数据拷贝的基础上向前顺序记录数据变化事件日志;最后,当需要对某些数据恢复时,便根据数据变化事件日志,在参考数据拷贝的基础上完成恢复操作。
上面的原理可用图2来表示:
数据变化事
件
图2 基准参考数据模式
从图2我们看出,基准参考数据模式原理简单,实现起来也较容易,但由于数据恢复时需要从最原始的参考数据开始,依次进行数据恢复,所以恢复时间较长。
特别是越靠近当前的恢复时间点,恢复所需要的时间就越长。
●复制参考数据模式
复制参考数据模式的工作原理是:首先,在原始数据产生的同时,恢复时所需的参考数据也同时产生;然后,在同步生产参考数据拷贝的同时,数据变化事件日志便以当前所产生的数据为基础,回退的记录以前数据的变化情况;当需要恢复时,则在当前数据的基础上,依据变化日志,回退到过去任意时间点。
工作原理用图3来表示:
数
据
变
化
事
件
数据变化事件
图3 复制参考数据模式
我们比较图2和图3可以看出,复制参考数据模式和基准参考数据模式在实现原理上是相反的。
复制参考数据模式在数据恢复时,恢复的时间点越靠近当前,所需要的恢复时间就越短。
但是在数据的保存过程中,它需要同时进行数据和日志记录的同步,因此需要较多的系统资源。
●合成参考数据模式
合成参考数据模式的工作原理:首先,同基准参考数据模式一样,建立参考数据拷贝和顺序向前记录的数据变化事件日志;然后,定期根据前一次的参考数据拷贝和变化事件日志,对最初的参考数据拷贝向前移动,使参考数据拷贝记录的是当前产生的数据,而数据变化日志也变成回退的记录以前数据的变化情况;所以,在需要恢复的时候,就可以像复制参考模式那样进行了。
工作原理用图4表示:
数据变化事件
为向后
图4 合成参考数据模式
通过图4我们可以看出,合成参考数据模式是基准参考数据模式和复制参考数据模式的折衷,它可以得到较好的资源占用和恢复时间效果。
但是,它的实现是需要复杂的软件管理和数据处理功能,因此真正实现起来还是比较复杂的。
3.4 CDP 的分类
从操作方式来看,CDP 解决方案的设计方法可以分为基于块的,基于文件的和基于应用的。
因此,CDP 的实现模式也可分为以下三种:
● 基于数据块实现的CDP
基于数据块实现的CDP ,它的功能是直接运行在物理存储设备或逻辑卷管理器上的,甚至也可以运行在数据传输层上。
当数据块写入生产数据的主存储设备时,CDP 系统可以捕获数据的副本,并将其存放在另外一个存储设备中。
它的实现方式又可分为三类:基于主机层、基于传输层和基于存储层。
● 基于文件实现的CDP
基于文件实现的CDP ,作用在文件系统之上。
它可以捕捉文件系统数据或者元数据的变化事件(例如文件的创建、修改、删除等),并及时将文件的变动进行记录,以便将来实现任意时间点的文件恢复。
● 基于应用实现的CDP
基于应用实现的CDP ,直接位于受保护的特定应用之中。
对需要保护的关键应用程序,可以在其中直接嵌入和运行CDP 功能。
这种实现方式能够和应用进行深度整合,确保应用数据在持续保护中的一致性。
此外,它作为应用自身的内置功能,也可以利用特殊的应用API 在发生变化时赋予其连续访问应用内部状态的权限。
它最大的好处就是与应用程序结合紧密,管理比较灵活,便于用户部署和实施。
通过上述的介绍,我们可以看出基于块和基于文件的CDP ,可以利用一种相同的通用方法来支持多种不同的应用。
而基于应用的CDP 则只为某种应用提供持续数据保护功能,但它的表现形式则是一种更为深入的集成方式。
4CDP技术的应用
虽然CDP技术是这几年兴起的新技术,但是它已经逐渐被人们运用到了实际工作中。
例如:(1)因为CDP技术的恢复时间(RTO)和恢复点(RPO)的粒度更细,所以,CDP技术对于当前数据的备份会更及时,而对数据的恢复则更具有随意性。
特别是在备份、恢复那些变化较快的数据,如备份、恢复邮件服务器中的电子邮件信息时,CDP技术比传统数据备份技术更具优势[8]。
因此,它在这方面的应用较为广泛。
(2)CDP技术的应用可以使数据的丢失量尽可能的少,因此它也应用于对关键数据的备份和恢复。
CDP技术目前已经成为备份领域中最为热点的技术,存储业的大佬们也纷纷推出这方面的产品,其中包括来自IBM公司的文件级CDP软件产品(IBM Tivoli Continuous Data Protection for Files)、来自HP和EMC的块级CDP(来自Mendocino软件)以及来自微软和Symantec(赛门铁克)的快照和复制工具[9-10]。
总之,随着人们对CDP技术关注程度的提高,不久的将来,它一定会得到更为广泛的应用。
5结束语
通过本文的介绍,我们可以看出在数据保护方面,CDP技术与传统备份技术相比,具有明显的优势。
目前,它还是起步阶段,但是作为当前备份领域中最尖端的技术,在不久的将来,CDP技术一定会像现在的RAID技术一样被人们广泛的应用于数据保护领域,并从根本上改变人们对数据保护技术的认识。
不过CDP技术也有很多需要完善和发展的方面。
比如,CDP的产品就可以从基于主机的软件向基于网络的硬件发展等等[11]。
所以,在此领域我们还有很多工作要做。