IT灾备全面综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

IT灾备全面综述(提供数据调查)

《计算机安全》杂志 2009年10月号刊登奕兵(广州 30 卫士信息安全有限公司)撰写的《IT灾备一席谈》,该文是一篇关于 IT 灾备的全面综述,兹将要点摘录如下:

IT 灾难:

1. 自然灾害(汶川地震)

2. 人为灾难(9.11)

3. 技术灾难(千年虫)

美国对遭致 IT 损伤的 6000 例灾难调查表明:在造成 IT 安全事件的起因中,电力中断占 27%,雷雨占 12%,水灾占 10%,硬件故障占 8%,炸弹袭击占 7%,飓风占 6%,火灾也占 6%,地震占 5%,系统故障占 5%,电线短路占 3%,员工蓄意破坏占 3%,网络故障占 2%,人为错误占 2%,服务停顿占 1%,水管破裂占1%,其它占 2%。

根据 IDC 的统计显示,在美国 2000 年以前 10 年间发生过灾难的公司中,有55% 当时就倒闭;在剩下的 45% 中,因为数据丢失,有 29% 也在两年之内倒闭,生存下来的仅占 16%。

Gartner Group 的数据也表明,在经历大型灾难而导致系统停运的公司中有 2/5 再也没有恢复运营,剩下的公司中也有 1/3 在两年内破产。

美国德克萨斯州大学的调查显示:只有 6% 的公司可以在丢失数据之后还能生存下来,43% 的公司会彻底关门,51% 的公司会在两年之内消失!

灾难往往在不经意间发生,IT 灾备就是预防“小概率、高风险”的事件发生——建立容灾系统的初衷是以尽可能低的代价维持数据的可用性、应用和业务的连续性,把灾难带来的损失降到最低。

相关文件:

1. 中共中央办公厅 2003年7月 27 号文件《关于加强信息安全保障工作的意见》

2. 国务院信息办 2005年5月《重要信息系统灾难恢复指南》

3. 国务院 2006年1月8日《国家突发公共事件总体应急预案》

4. 国家质监局和国家标准化管委会 2007年6月《GB/T 20988-2007 信息系统灾难恢复规范》

“数据级容灾”,是为保证发生大灾难时业务还能持续进行的事前准备,基本上分为计算机事件响应计划、支持业务连续性计划/IT应急计划、灾难恢复计划三部分,实质是关注 IT 的数据安全。

“应用级容灾”,关注 IT 系统安全及其应用安全,灾难发生时生产系统的多种

应用可快速切换到备用系统上,因而能确保业务的连续性。

“业务级容灾”,除了关注 IT 及其应用的安全之外,还对 IT 生产系统所处的场所和电话等设施作灾前备份,大灾难发生后,用户除了需要原有的数据、原有的应用系统,其工作人员还要能在拥有诸如电话等设施的备份工作场所正常地开展业务。

数据级容灾、应用级容灾和业务级容灾是 IT 容灾逐级完善的三种形态。它们都属于“业务连续性管理” BCM 里的内容,BCM 是风险管理 RM 框架中的重要组成,RM 又从属于 IT 治理范畴。

2008年7月,国际灾难恢复协会 DRII 的《业务连续性从业者的专业实务》定义了业务连续性管理的 10 个步骤:

1. 项目启动与管理

2. 风险评估和控制

3. 业务影响分析

4. 业务连续性策略

5. 应急响应与运作

6. 业务连续性计划

7. 意识培养与培训项目

8. 业务连续性计划演练、查核和维护

9. 危机通信

10. 与外部机构的协调

英国 BSI 协会在 2007 年发布的业务连续性管理标准 BS25999 中,定义了业务连续性管理范围有 10 个领域:

1. 风险管理

2. 灾难恢复

3. 紧急事件管理

4. 安全管理

5. 知识管理

6. 危机通信和公共关系

7. 设施管理

8. 供应链管理

9. 质量管理

10. 健康和人身安全

美国国家标准和技术学会(NIST)在 2002 年推出有关应急风险管理和灾难恢复的信息技术应急指南 SP800-34 ,具体把业务连续性计划落实为下列七项内容:

1. 危机通讯计划

2. 场所紧急计划

3. 运行连续性计划

4. 计算机事件响应计划

5. 支持业务连续性计划/IT 应急计划

6. 灾难恢复计划

7. 业务恢复计划

容灾备份的主要技术设计指标:

1. RPO(Recovery Point Objective 数据恢复点目标),用于衡量业务系统所能容忍的数据丢失量。

2. RTO(Recovery Time Objective 恢复时间目标),用于衡量所能容忍的最长业务停止服务时间,也就是从灾难发生到业务系统恢复服务功能所需的最短时间周期。

灾备所需的核心技术有四类:

1. 灾备存储技术(当前热门的是SAN/NAS、虚拟存储等,而重复数据删除等大概算是新技术)

2. 信息系统评估和系统重构技术

3. 网络环境中的信息安全技术

4. 起协管作用的系统管理技术

设计容灾备份系统需要多方面调研和考虑:例如灾难恢复的需求、灾后所要求的恢复速度、备份/恢复数据量的大小、业务(生产)中心与备援数据中心之间的数据传输方式、备援中心运行维护的管理以及投入资金的多少等。要成功实施容灾系统工程,除了需有技术保障外,还要定义关键业务,制订备份/应急/恢复策略,作出备份/应急/恢复方案,编制容灾/应急/恢复流程,明确这些流程的切换机制,确立组织架构,安排测试演练措施等,以保证圆满达成业务连续性的目标。

在建立容灾系统之前,应进行详尽周密的全面调研分析,包括:

1. 业务系统的风险分析(Risk Analysis)

2. 容灾系统对业务系统的影响分析(Business Impact Analysis)

3. 容灾系统的投入/产出分析(Cost-Benefit Analysis)

国际通用的容灾系统评审标准是 1992 年制定的 SHARE78,它评审的内容有:

1. 备份/恢复的范围

2. 灾难恢复计划的状态

3. 业务中心与容灾中心之间的距离

4. 业务中心与容灾中心间怎样连接

5. 数据是怎样在两个中心之间传送的

6. 允许有多少数据丢失

7. 怎样保证及时更新容灾中心里的数据

8. 容灾中心启动容灾进程的能力

9. 允许服务中断时间多少

SHARE78 定义容灾备份中心自动异地远程恢复分为 0-6 七个层次,最高层次Tier 6 不仅可以保证数据的完全一致,而且其存储和网络等环境具备了应用的自动切换能力,是实现数据无丢失的备份。

相关文档
最新文档