灾难备份系统
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
灾难备份系统的规划与设计
第1章灾备系统建设的基本考虑 (1)
1.1灾备系统建设的重要性 (1)
1.2如何规划灾备系统的建设 (3)
1.2.1风险评估(RA) (3)
1.2.2业务影响分析(BIA) (4)
1.2.3恢复时间目标(RTO)和恢复点目标(RPO) (4)
1.3小结 (5)
第2章目前常用的灾备技术简介 (6)
2.1数据的备份和恢复 (6)
2.2基于磁盘阵列的数据远程复制 (6)
2.3基于数据卷的数据远程复制 (7)
2.4几种常用的远程数据复制技术特性比较 (8)
第3章高性能数据复制技术详解 (10)
3.1EMC公司的SRDF磁盘阵列数据复制工具 (10)
3.1.1产品概述 (10)
3.1.2SRDF工作原理 (11)
3.1.3使用SRDF建立灾难备份中心的建议 (15)
3.2VERITAS公司的VVR数据复制工具 (16)
3.2.1产品概述 (16)
3.2.2VVR工作原理 (17)
3.2.3VVR系统建立灾难备份系统的考虑 (20)
3.3两种数据复制技术的比较 (20)
第4章综述 (22)
第1章灾备系统建设的基本考虑
1.1 灾备系统建设的重要性
在当今的信息社会,企业信息系统持续可靠的运转面临着越来越严峻的挑战,恐怖事件、自然灾害和人为因素都可能导致系统瘫痪和关键数据的丢失。在企业对信息的依赖性越来越强的今天,数据已成为企业的生命源泉。
建设灾备系统可以有效的保证企业信息系统的业务连续性,当然实现灾难备份可以使用的技术多种多样、投资量差别很大,实现的灾备效果也千差万别,下面是国际标准SHARE 78 定义的容灾系统有七个层次:从最简单的仅在本地进行磁带备份,到将备份的磁带存储在异地,再到建立应用系统实时切换的异地备份系统,恢复时间也可以从几天到小时级到分钟级、秒级或零数据丢失等。
1.Tier 0 被定义为没有信息存储的需求,没有建立备援硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复,没
有数据送往异地。这种方式是最为低成本的灾难恢复解决方案,但
事实上这种灾难恢复并没有真正灾难恢复的能力,因为它的数据并
没有被送往远离本地的地方,而数据的恢复也仅是利用本地的记录。
2.Tier 1 是灾难恢复方案需要设计一个应急方案,能够备份所需要的信息并将它存储在异地,然后根据灾难恢复的具体需求,有选择地
建立备份平台,但事先并不提供数据处理的硬件平台。具体操作方
法为数据在完成备份之后,备份介质将会被送到远离本地的地方,
同时具备有数据恢复的程序。在灾难发生后,一整套安装需要在全
新的计算机系统上重新完成。系统和数据将被恢复并重新与网络相
连。这种灾难恢复方案相对来说成本较低(仅仅需要传输工具的消
耗以及存储设备的消耗)。但同时有难于管理的问题,即很难知道什
么样的数据在什么样的地方。一旦系统可以工作,标准的做法是首
先恢复关键应用,其余的应用根据需要恢复。这样的情况下,恢复
是可能的,但需要一定的时间,这依赖于什么时候硬件平台能够被
提供准备好。
3.Tier 2相当于是tier1再加上具有热备份能力的SITE的灾难恢复。热备份SITE拥有足够的硬件和网络设备去支持关键应用的安装需求。
对于十分关键的应用,在灾难发生的同时,必须在异地有正运行着
的硬件提供支持。这种灾难恢复的方式依赖于用PTAM的方法去将
日常数据放入仓库,当灾难发生的时候,数据再被移动到一个热备
份的SITE。虽然移动数据到一个热备份SITE增加了成本,但却明
显降低了灾难恢复的时间。
4.Tier 3 是在Tier 2的基础上用电子链路取代了磁带运输来进行数据传送的灾难恢复。接收方的硬件必须与主SITE物理地相分离,在
灾难发生后,存储的数据用于灾难恢复。由于热备份SITE要保持
持续运行,因此增加了成本。但确实是消除了传输工具的需要,提
高了灾难恢复的速度。
5.Tier 4 这种灾难恢复要求两个SITE同时处于活动状态并管理彼此的备援数据,允许备援行动在任何一个方向发生。接收方硬件必须
保证与另一方平台物理地相分离,在这种情况下,工作负载可以在
两个SITE之间被分担,SITE 1成为SITE 2 的备份,反之亦然。在
两个SITE之间,彼此的在线关键数据的拷贝不停地相互传送着。
在灾难发生时,需要的关键数据通过网络可迅速恢复,通过网络的
切换,关键应用的恢复时间也可降低到了小时级或分钟级。6.Tier 5 在Tier 4的基础上在镜像状态上管理着被选择的数据(根据单一commit范围,在本地和远程数据库中同时更新数据),也就是
说,在更新请求被认为是满意之前,Tier 5需要应用SITE 与备援
SITE的数据都被更新。我们可以想象这样一种情景,数据在两个
SITE 之间相互映象,由远程two-phase commit来同步,因为关键应
用使用了双重在线存储,所以在灾难发生时,仅仅传送中的数据被
丢失,恢复的时间被降低到了分钟级。
7.Tier 6 可以实现0数据丢失率,同时保证数据立即自动地被传输到备援SITE。Tier 6被认为是灾难恢复的最高级别,在本地和远程的
所有数据被更新的同时,利用了双重在线存储和完全的网络切换能
力。Tier 6是灾难恢复中最昂贵的方式,但也是速度最快的恢复方
式。
近几年银行业数据和业务大集中的完成,建立灾备系统已经提上了许多银行的意识日程,某些先行者比如中国工商银行和兴业银行已经建成了Tire 4级的灾难备份系统,人民银行也明确要求实施了数据集中的银行必须建设相应的灾难备份中心,由此可见灾难备份系统必将大量的得到实施。
1.2 如何规划灾备系统的建设
目前国内的IT界往往存在一种认识的误区,好像一提到灾备系统就要是基于高档磁盘阵列、远程光纤连接的两个站点进行实时的数据传输系统等,需要很高的投资和大量的维护费用。根据share 78国际标准关于灾备系统的分级,我们知道实际上针对企业的类型、数据的重要程度、数据的容量以及应用模式的特点来选择不同的方式来建设自己的灾备系统,这样既可以保证业务系统数据的安全,又可以减少盲目的不必要的投资和开销。用户在建立灾难备份系统之前可以采用下述方法来方案的制定和规划:
1.2.1风险评估(RA)
风险评估的目的是针对当前核心业务流程,系统环境和所存在的潜在风险确定系统可恢复能力级别,确定当前业务环境中的客观存在的威胁和薄弱环节,提供在现有条件下,降低风险和改进薄弱环节的建议,提供改善可恢复能力级别的有效方案。
一般来说,人们可将灾难分成下面几个类型:自然灾难(洪水、飓风、地震),外在事件(电力或通讯中断)、技术失灵(电脑宕机或网络受损)及设备受损(火灾)等,由于商业系统会因为计算机系统和网络的紧密连接而受到很大影响,用户IT系统蒙受的冲击及财务损失可能如同灾难本身一样可怕。因而,无论导致网络瘫痪的原因是地震,还是磁盘失效,容灾都可以帮助人们将损失降低到最小。
根据有关信息,目前发生过的灾害主要有停电、机房漏水、数据库崩溃,最可能的灾害主要有火灾和台风(沿海省份),地震(地震多发带,如云南)可能