灾难恢复基本概念
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
灾难恢复基本概念及等级划分
当前,灾难恢复在国内发展方兴未艾。
为普及灾难恢复相关知识,国内灾难恢复领域的领军企业GDS组织其资深的咨询顾问团队,特别就灾难恢复的基本概念,以及国家标准《信息系统灾难恢复规范》中对灾难恢复的等级划分进行了介绍。
灾难恢复的基本概念
灾难是一种具有破坏性的突发事件,灾难恢复关注的是灾难对单位的正常运营和社会的正常秩序造成的影响。
其中最明显的是信息服务的中断和延迟影响业务运营。
停顿的时间越长,单位的信息化程度越高,损失就越大。
灾难恢复是指将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态而设计的活动和流程,其目的是减轻灾难的不良影响,保证信息系统所支持的关键业务在灾难发生后能及时恢复和继续运作。
灾难恢复主要涉及的技术和方案有数据的复制、备份和恢复、本地高可用性方案和远程集群等,但灾难恢复不仅仅是恢复计算机系统和网络,除了技术层面
外,还涉及到风险分析、业务影响分析、策略制定和实施等方面,是一项系统性、多学科的专业性工作。
灾备中心是指用于灾难发生时接替生产系统运行进行数据处理和支持关键业务功能运作的场所,包括备用的数据处理中心、工作环境、生活设施和技术支持及运行管理人员。
灾难恢复工作包括灾难恢复规划和灾备中心的日常运行,以及灾难发生后的应急响应、关键业务功能在灾备中心的恢复和重续运行,及生产系统的灾后重建和回退工作。
灾难恢复规划是指为了减少灾难带来的损失和实现灾难恢复所做的事前计划和安排,包含需求确定、策略制定、策略实现、预案制定/落实/管理等四个阶段。
灾难备份是为了灾难恢复而对数据、数据处理系统、网络系统、基础设施、技术支持能力和运行管理能力进行备份的过程。
灾难备份是灾难恢复的基础,是围绕着灾难恢复所进行的各类备份工作。
灾难恢复的主要特点
根据灾难恢复的目标和内涵,灾难恢复拥有四个主要特点:
1. 为高风险、小概率事件准备
由于灾难是低概率事件,灾难备份资源平时一般处于闲置状态,但灾难发生时,若灾备中心无法正常发挥作用,将造成巨大的影响。
2. 投入大、运行维护成本高
灾备中心建设需要大量基础设施、设备、人力投入,并需保证计算机系统的高可用性,其建设投入成本很高,运行维护涉及的设施维护、设备更新、运维人员及其管理的成本也很高。
3. 对技术人员的高专业性要求
灾难恢复团队需熟悉系统,经常参与演练,具有处理日常问题的丰富经验,但建设并长期维持这样一支高水平、演练实践经验丰富的团队十分困难。
4. 灾备中心管理十分规范和严格
灾备中心的管理需具有严格的规范、先进的理念和完善的管理模式,以保障平时的安全运行及在灾难发生或演练时能及时接管。
灾难恢复建设的基本术语
恢复时间目标(RTO)是灾难发生后,信息系统或业务功能从停顿到恢复所必须的时间要求。
恢复点目标(RPO)是指灾难发生后,系统和数据必须恢复到的时间点要求。
业务连续性规划(BCP)是灾难事故的预防和反应机制,是一系列事先制定的策略和规划,确保单位在面临突发的灾难事故时,关键业务功能能持续运作、有效的发挥作用,以保证业务的正常和连续。
BCP不仅包括对信息系统的恢复,而且包括关键业务运作、人员及其它重要资源等的恢复和持续。
业务连续性管理(BCM)是指对单位的潜在风险加以评估分析,确定可能的威胁并建立完善的管理机制来防止或减少灾难带来的损失。
BCM使组织机构认识到潜在的危机和相关影响并制定响应、业务和连续性的恢复计划,提高单位的风险防范与抗击打能力,以有效地减少业务破坏并降低不良影响。
图1 BCP与BCM的关系
灾难恢复等级划分介绍
在《信息系统灾难恢复规范》中,按照七个关键要素(数据备份系统、备用基础设施、备用数据处理系统、备用网络系统、技术支持能力、运行维护管理能力、灾难恢复预案),将灾难恢复划分为六个等级。
以下是对各个等级的简要介绍:
第1级基本支持
第1级要求每周至少一次完全数据备份,备份场外存放;有符合介质存放的场地;需有介质存取、验证和转储的管理制度,并对备份数据进行定期的有效性验证;需制定经过完整测试和演练的灾难恢复预案。
第2级备用场地支持
在第1级的基础上,第2级要求在灾难发生时能在预定时间内调配所需的数据处理设备、通信线路和网络设备到位;同时有备用场地管理制度,与相关厂商有符合RTO要求的紧急供货协议,并与相关运营商有符合RTO要求的备用通信线路协议。
第3级电子传输和部分设备支持
与第2级相比,第3级在数据备份系统方面,进一步要求每天多次利用通信网络将关键数据定时批量传送至备用场地;在技术支持上,还要求在备用场地有专职的计算机机房运行管理人员;而在运行维护支持上,进一步要求有备用数据处理设备硬件维护管理制度,以及电子传输数据备份系统运行管理制度。
第4级电子传输及完整设备支持
第4级相对于第3级中的部分数据处理和网络设备而言,须配置灾难恢复所需要的全部数据处理设备、通信线路和网络设备,并处于就绪状态;备用场地也提出了支持7×24小时运行的高要求;同时,对技术支持人员的运维管理要求也有相应的提高。
第5级实时数据传输及完整设备支持
第5级强调数据传输的实时性,要求采用远程数据复制技术,并利用通信网络将关键数据实时复制到备份场地;备用数据处理系统需配备灾难恢复所需的全部数据处理设备,并处于就绪或运行状态;备用网络系统要求配备灾难恢复所需的通信线路及网络设备,并处于就绪状态,具备通信网络自动或集中切换能力;备用场地则需有7x24专职计算机机房管理人员和数据备份、硬件、网络技术支持人员。
同时还要求有硬件和网络运行管理制度及实时数据备份系统运行管理制度。
第6级数据零丢失和远程集群支持
第6级相对于第5级的实时数据复制而言,要求实现远程数据实时备份,实现零丢失;备用数据处理系统具备与生产数据处理系统一直的处理能力并完全兼容,应用软件是集群的,可以实现实时无缝切换,并具备远程集群系统的实时监控和自动切换能力;对于备用网络系统的要求也加强,要求最终用户可通过网络同时接入主、备中心;备用场地还要7x24专职操作系统、数据库和应用软件的技术支持人员,具备完善、严格的运行管理制度。