数据中心灾备服务

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据中心灾备服务

方案相关内容

如何应对“将鸡蛋放在一个篮子里”所带来的风险?对于信息化应用而言,灾备系统的建设已成为备受关注的热点和重点。

概述

数据中心是数据大集中而形成的集成IT应用环境,它是各种IT应用服务的提供中心,是数据计算、网络、存储的中心。数据中心实现了安全策略的统一部署,以及对IT基础设施、业务应用和数据的统一运维管理。

数据大集中的同时也对数据安全提出了更高的要求,如何应对“将鸡蛋放在一个篮子里”所带来的风险,已成为备受关注的重点。面对频频发生的雪灾、地震等自然灾害,对于信息化应用而言,灾备系统的建设也已成为热点。随着2007年11月《信息系统灾难恢复规范》正式成为国家标准,许多用户将从观望、徘徊转向实际应用。对于正处于服务转型期的电信运营商来说,借助灾备中心应用热潮,提供更有价值的信息化服务,改变原有的、单一的网络接入商角色,是值得把握的一次良好机会。

灾难备份概念介绍

1. 灾难备份的分类

灾备从应用层次,大体可分为三个类别:数据级别、应用级别和业务级别。从用户整个业务连续性的保障程度来看,其高可用性级别也随之逐级提高。

1) 数据级别

数据级别灾备的关注点在于数据,即灾难发生后可以确保用户原有的数据不会丢失或者遭到破坏。数据级别灾备是保障数据可用的最低底线,当数据丢失时能够保证应用系统可以重新得到所有数据。这种方案的优点是投入低,构建简单。

2) 应用级别

对于业务应用繁多,并且系统需要保持7*24小时连续运行的企业来说,显然需要高级别的应用灾备系统来满足其需求。应用级备份是在数据级灾备的基础上,在备份站点同样构建一套应用系统。应用级灾备系统能提供不间断的应用服务,使用户的服务请求能够透明地继续运行,保证信息系统提供的服务完整、可靠和安全,完全不受灾难的影响。一般来说,应用级灾备系统需要通过更多软件来实现,它可以使企业的多种应用在灾难发生时进行快速切换,确保业务的连续性。

3) 业务级别

即使构建了数据级灾备和应用级灾备,也都还是在IT范畴之内,对于正常的业务而言,仅有IT系统的保障还是不够的。当一场大的灾难发生时,原有的办公场所都会受到破坏,除了需要原有的数据和原有的应用系统,还需要工作人员在一个备份的工作场所能够正常的开展业务,这就要包括原有工作环境中的一切必须工作设备(如电话、电传、扫描和打印等)。因此用户需要构建最高级别的业务级别灾备,这一级别灾备的大部分内容是非IT系统。

2. 灾难备份的等级划分

以下依据国标GB20988-2007-T《信息安全技术信息系统灾难恢复规范》来说明灾难恢复的等级要求。

1) 灾难恢复资源要素

支持灾难恢复各个等级所需的资源可分为如图1所示的7个要素:

图1 灾难恢复资源要素

数据备份系统

数据备份系统通常由数据备份的硬件、软件和数据备份介质组成,如果是依靠电子传输的数据备份系统,还包括数据备份线路和相应的通信设备。数据备份系统是灾难备份系统的最基本要素,如何将数据(包含系统、应用和业务数据)完整的、实时的复制到灾备中心是灾备系统建设需要重点考虑的事项。

备用数据处理系统

备份数据处理系统是指备用的计算机、外围设备和软件。

备用网络系统

备用网络系统是最终用户用来访问备用数据处理系统的网络,包括备用网络通信设备和备用数据通信线路。

备用基础设施

备用基础设施是灾难恢复所需的、支持灾难备份系统运行的建筑、设备和组织,包括介质的场外存放场所、备用的机房及灾难恢复工作辅助设施,以及容许灾难恢复人员连续停留的生活设施。

专业技术支持能力

专业技术支持能力是对灾难恢复的运转提供支持和综合保障的能力,以实现灾难恢复系统的预期目标。包括硬件、系统软件和应用软件的问题分析和处理能力、网络系统安全运行管理能力、沟通协调能力等。

运行维护管理能力

运行维护管理能力包括运行环境管理、系统管理、安全管理和变更管理等内容。

灾难恢复预案

灾难恢复预案是保障关键业务功能在灾难备份中心的恢复和重续运行、主系统的灾后重建和回退工作,以及突发事件应急响应的组织流程和预案。

2) 灾难恢复能力评价指标

一般地,灾难恢复能力采用三个主要的容灾指标RTO、RPO、NRO作为评判依据:

恢复时间目标RTO(Recovery Time Object)

该指标是容灾恢复的时间指标,从广义上来说是从灾难发生造成业务中断,直到通过各种方法恢复业务所需要的时间。通常越短的RTO意味着越高的容灾能力。另一个狭义的RTO指标是指从决定进行容灾切换到业务可以继续运行所经过的时间。一般用狭义的RTO指标评价IT层面的容灾能力。

恢复点目标RPO(Recovery Point Object)

宕机导致的停机不是故障影响的全部,宕机带来的另一种影响对企业的损害可能更大,那就是永久性数据丢失:宕机以前的数据没有保存到在线数据库或文件中。

宕机之后数据开始恢复的时间点称之为恢复点,恢复点指标RPO,就是当业务恢复后,可以达到与灾难发生前那个时间点相同的工作状态。通常RPO对应着灾难造成的数据丢失程度,如果RPO为0,就相当于没有丢失任何数据。但这种理想状态往往是无法达到的,这就涉及到业务回滚。业务恢复与回滚的不同之处在于

业务恢复不考虑数据丢失,特别是对于没有前后连贯性的一类业务,新的业务处理不需要以前的业务结果,当灾难恢复完成后,可以直接进行新的业务;而业务回滚是与数据丢失相关的,丢失的数据必须通过各种方法进行修复,可能需要手工完成,新业务开始运转后会持续很长的时间,这段时间就是业务回滚时间,也可以叫做修复灾难造成的损失时间。

网络恢复目标NRO (Network Recovery Object )

网络恢复时间是指当灾难发生后,最终用户切换到备用网络系统,并且可以通过备用网络访问灾备中心所需的时间。一个快速收敛聚合的网络可以为应用和数据的迁移提供可靠的传输路径。NRO 可以滞后于RTO ,也可能超前于RTO 。

图2 RPO/RTO/NRO 三者关系

3) 国标灾难恢复等级

以下是对国标灾难恢复等级的简要描述,表1中用蓝色字体表明了不同等级对备用网络系统的要求。

表1 国际灾难恢复等级描述 SHARE78 《信息系统灾难恢复规范》GB/T 20988-2007

Tier-0 无异地备份数据 第1级 基本级。备份介质场外存,安全保管、定期验证。对备用网络没有要求。 Tier-1 有数据备份,无备用系统

Tier-2 有数据备份,有备用系统 第2级 备份场地支持。网络和业务处理系统可在预定

时间内调配到备份中心。配备部分通讯线路和相应的网络设备,或在灾难发生后能在预定的时间内调配所需的通讯线路和网络设备到备

用场地。

相关文档
最新文档