灾难恢复体系建设
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
企业规避风险、健康发展的要求 企业进行全球化战略发展和布局、成为世界级企业的要求 行业监管政策的要求
《信息系统灾难恢复规范》--GB/T 20988-2007 《银行业信息系统灾难恢复管理规范 》-- JR/T 0044—2008)
保险业信息系统灾难恢复管理指引》-- 保监发〔2008〕20号
业务持续性与灾难恢复的关系
灾难恢复建设选型——技术选型
灾难恢复建设选型——建设模式
灾难恢复关键资源 灾难备份中心场地资源 灾难恢复系统 (含数据备份系统、备用数据处理系统和备用通信 网络系统) 灾难恢复系统的运行维护支持 可选择的获取方式
三种选择方式: 自行投资建设灾难备份中心; 使用外包的灾难备份中心场地资源; 企业之间联合共建,共同投资与使用。 三种选择方式: 自行投资建设灾难恢复系统; 事先与厂商签订紧急供货协议; 由专业服务商提供,采用租赁模式使用。它机构进行运行和维护。 三种选择方式: 由企业独立完成; 聘请外部专家指导完成; 委托专业服务商完成。 三种选择方式: 专职技术支持人员; 第三方提供技术支持; 由主中心技术支持人员兼任。
灾后回退处理流程 计划内备份系统切换处理流程 人员联系清单等相关信息资料
灾备中心运维——服务体系
灾备中心运维——演练
1.
2.
3.
4.
桌面演练
对预案中的关键内容, 包括工作流程、组织 架构、操作内容等进 行基础性验证。
模拟演练
对灾备系统的关键灾 难恢复能力进行真实 性、有效性验证,包 括系统的RTO、RPO 等参数。
灾难恢复整体规划——灾备中心布局规划
灾备中心布局
生产中心 和灾备中心 应对灾难
可选的 数据复制技术 数据丢失量 灾难恢复和 演练的协调
同城
异地
两中心距离较近,受到相同灾害威胁的几 两中心距离远,受相同灾害威胁的几率小。 率大。
除应对小范围灾难外,还能应对大范围灾难,如:火灾、 应对小范围灾难,如:火灾、建筑物不可用等 台风、海啸、地震、传染病、电网及通信中断或异常 等。 同步或异步 如:EMC SRDF/S 容易做到零数据丢失 比较简单 异步(通常) 如:EMC SRDF/A 不易做到零数据丢失 相对复杂
实现远程数据实时备份,实现零丢失 应用软件可以实现实时无缝切换 远程集群系统的实时监控和自动切换能力
实现远程数据复制技术 备用网络也具备自动或集中切换能力 配置所需要的全部数据和通讯线路及网络设备,并处于就绪状态 7*24 运行;更高的技术支持和运维管理
配置部分数据,通信线路和网络设备 每天实现多次的数据电子传输 备用场地配置专职的运行管理人员 预定时间调配数据,通信线路和网络设备 备用场地管理制度 设备及网络紧急供货协议 每周至少做一次完全数据备份 制定介质存取、验证和转储的管理制度 完整测试和演练的灾难恢复计划
关键业务的中断影响
(财务影响和非财务影响)分析 关键业务的可容许最大中断时间长度分析
恢复各关键业务所需资源分析
关键业务的数据丢失可容许程度分析 确定关键业务恢复时间目标 各业务间的相关性分析 关键业务的恢复优先级分析
识别关键服务时间段和可容许性能下降
灾难恢复整体规划——灾备策略规划
确定灾难恢复等级要求
演练总结
1.更新灾难备份系统 2.文档资料更新 3.更新灾难恢复预案 4.形成演练总结报告 5.演练文档资料存档
携手发展 · 合作共赢
实战演练
对灾备系统的实际恢 复能力、判断决策机 制、通知报告渠道、 资源保障能力等方面 进行验证。
综合演练
全面验证灾难恢复管理 组织架构的领导、决策 与指挥能力;各机构的 沟通协调能力以及应急 资源的协调、保障能力。
灾备中心运维——灾难演练
1.确定演练目标与范围 2.确定演练的时间 3.确定演练的测试方案 4.确定灾难演练计划 5.灾难备份中心提前准备就绪 6.灾难备份系统提前准备就绪 7.确定演练参加单位与人员 8.下发演练通知
序
号 5
要素
灾难恢复预案
要素的考虑要点
明确灾难恢复预案的: A)整体要求 B)制订过程的要求 C)教育、培训和演练要求 D)管理要求 运行维护管理组织架构 人员的数量和素质 运行维护管理制度 其他要求
2
数据备份
系统
数据备份范围与RPO 数据备份技术 数据备份线路
数据处理能力;与生产系统的兼容性要 求 平时的状态(处于就绪还是运行) 备用网络通信设备系统与备用通信线路 的选择 备用通信线路的使用状况
包、合建
灾难恢复系统投资模式:自建、租 赁
灾难备份中心运营管理模式:自营、
外包
灾备建设纲要
灾难恢复建设方案
灾难恢复整体规划 灾备建设选型 灾备建设实施
灾备中心运维
灾难恢复整体规划—风险分析
风险分析的工作内容
基础设施完备性分析
IT系统技术复杂性分析 IT管理复杂性分析 本地数据保护分析 操作与管理流程分析 分析风险的冲击和影响
4级 电子传输及 完整设备支持
3级 电子传输和 部分设备支持 2级 备用场地支持 1级 基本支持
6
灾备分级
6.零数据丢失 + 远程集群支持 5.数据实时传输+完全设备支持
4.电子传输+完全设备支持
3.电子传输+部分设备支持
2.备份介质异地存放和备份中心
1.备份介质异地存放
业务连续性
灾难恢复系统设计要点
对支持关键业务功能的信息系统,采取分类的方式, 分别确定恢复等级. • 第一类:4或5级
• 第二类:3或4级
• 第三类:3级以下
等级保护
成本风险平衡原则,确定每项关键业务功能的灾难 恢复策略.不同的业务功能可能采用不同的灾难恢 复策略
灾难恢复预案 灾 难 技术支持能力 恢 持续运营管理 复 备用通信网络系统 策 备用数据处理系统 略 数据备份系统 要 点 备用基础设施
灾难恢复体系建设
数据中心及信息资源面临的风险
资产信息 客户信息
人为误操作 数据失窃
市场信息
核心业务和技术信息
企业数据中 心承载的信 息资源
设备故障 软件错误 网络中断 电力故障
人 为 风 险
病毒爆发
技 术 风 险
火 灾
地 震
飓 风
洪 水
台 风
自然灾害
必要性
企业业务持续运作的要求
关键信息系统的数据完整性 关键信息系统业务处理的持续性 解决各种大灾难所造成的关键业务大面积停顿问题
确定关键业务(能确保企业生存所需要的基本业务功能)
支持关键业务的信息系统所能容许的中断时间(RTO)
确定关键业务系统所能容许的数据丢失(RPO) 确定灾难恢复所需要的最小资源:
数据备份系统的关键技术 备用数据处理系统(维持基本的处理能力) 备用通信网络资源 灾难备份中心资源 运营管理要求
9
灾难恢复建设要点
6
3
备用数据 处理系统 备用网络 系统
运行维护管理 能力
7
技术支持能力
4
软件、硬件和网络等方面的技术支持要 求 技术支持的组织架构 各类技术支持人员的数量和素质等
《信息系统灾难恢复规范》--GB/T 20988-2007
灾难恢复等级划分
6级 数据零丢失和 远程集群支持 5级 实时数据传输 及完整设备支持
“灾难恢复”是BCM的基础,是业务持续运行的保障。
风险管理 危机通信和 公共关系 灾难恢复 设施管理 业务持续性管理 BCM
安全管理
供应链管理
紧急事件管理
质量管理
知识管理
健康和人身安全
灾难恢复的七大要素
序
号 1 备用基础 设施 灾难备份中心选址与建设 备用的机房及工作辅助设施和生活设施
要素
要素的考虑要点
加强灾难恢复(业务持续)规划
进行RA、BIA分析 确定灾难恢复策略规划
合适选择灾难恢复技术方案
灵活选择灾难备份与恢复技术
综合选择灾难恢复建设策略
灾难备份中心建设模式:自建、外
强化灾难恢复系统的运营管理
强化灾难恢复系统的运营管理,特 别是变更管理与配置管理 重视灾难演练与测试 定期评估灾难恢复预案的有效性
风险分析的目标
识别现有风险点 评价风险和确定风险级别 提出建议改造措施
设立预案灾难场景
灾难恢复整体规划——业务影响分析
业务影响分析的工作内容
关键业务功能的重要性分析
业务影响分析的目标
识别关键业务及相关信息系统资源 识别应用系统的相互关联和支持关系 评估灾难对关键业务的影响(定量/定性) 确定灾难恢复需求(RTO和RPO)
演练准备 实施演练
演练恢复
1.恢复数据备份系统 2.恢复营业网点通信 3.清理演练环境,删除演练 数据
1.模拟灾难发生 2.启动灾难宣告流程 3.模拟灾难断开数据复制链路 4.灾难备份系统准备 5.启用备份系统,并确认备份系统的可 用性和正确性 6.启动应用系统,并确认和验证应用系 统和数据的可用性 7.演练营业网点通信切换 8.灾备中心正式接替电脑中心运营 9.业务处理服务重续运行
灾难恢复预案
技术支持能力
依据成本效益原则,确定灾难恢复资源获取方式和建设模式
灾难恢复建设——灾备中心选择
灾难恢复建设实施——灾难恢复预案开发
灾难恢复预案主要内容:
灾难恢复的目标和范围
灾难恢复的组织架构
灾难预警处理流程 人员疏散计划 损害评估流程 事件通报流程 灾难决策流程 灾难宣告流程
灾难恢复处理流程