应急管理流程与应急预案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2014年3期ITIL先锋讲堂《应急管理流程与应急预案》

一、基本概念

理解BCM、DRP与应急管理的关系

理解紧急事件管理与应急管理的关系

RTO与RPO的含义.

2、 应急管理的流程角色

应急领导组、应急指挥组、应急实施组、应急沟通组和应急保障组

三、风险评价与处置方案

3、 风险的识别与评价:

风险的评价方法-频度*严重度(紧急程度+影响程度);频度、紧急程度均可由定性到定量的评分赋值范围为1-N;紧急程度是指某一特定失效起因出现后,业务系统需要恢复的紧急程度

评价影响程度的因素主要会优先考虑如下4个方面:风险发生的时间和场合、是否影响了关键业务、风险影响的范围、风险发生后对业务和服务提供者服务能力丧失的程度-主要从业务影响和影响设备数量方面可以考虑做加权赋值

风险评价:可容忍/可转移、紧急修复、制定应急预案(含切容灾))

应急处置方案:应急事件处理、应急系统切换、容灾切换

四、应急场景梳理

编号、应用平台、类别、故障现象、故障原因(可能多个)、高可用工作模式、风险场景分析(业务影响分析、恢复要求)、风险处置措施(可容忍/可转移、事件/故障、应急)、应急处置策略(常规应急处置、应急系统切换、容灾切换)、应急预案名称/

编号、应急预案负责人

业务影响分析还要分拆为:影响业务程度、赋值、紧急程度、赋值、频度 赋值、风险值

恢复要求包括:RTO(分钟)、RPO(分钟)

五、应急管理流程

4、 应急启动条件:事件->紧急事件->应急事件(优先级为极高);RTO和RPO可能不能得到保证;应急领导组批准

应急关闭条件:故障排除(或采用替代方案或切换容灾)、已报告及已

善后处理

应急启动子流程关键活动:判定事件等级、紧急事件处置、应急事件诊断和定级、判定是否启动应急响应

应急处置子流程关键活动:召集应急小组和召开会议、查询应急场景库是否包含该场景、依照应急预案处置、现场编写应急处置方案、业务功能确认、编写应急事件情况报告(初始情况报告、进展情况报告、升级情况报告、解决情况报告)

应急关闭子流程关键活动:汇总报告(故障诊断和定级报告、故障沟通报告、技术处置报告)、召开善后会议、是否需要技术善后处置、是否需要改进应急预案、预案改进和发布

可能的管理型善后行动包括:业务数据补录、业务验证、变更记录、更改配置信息.

应急要演练

六、与其他流程的接口:紧急变更流程、事件流程、紧急事件流程、问题流程、变更流程、发布流程(应急预案的发布)

七、应急预案编制与管理

业务系统情况:应急管理需求、应急响应责任部门和人员

应急场景分析:每个场景分析包含-故障现象、业务影响分析、故障原因分析

应急处置:每个场景的处置包括-预案启动条件说明、应急处置目标、应急人员工作分配、应急处置流程、应急处置流程操作说明

附录:设备列表、应急恢复详细技术操作手册、应急响应通信录

八、应急演练

四个方面:演练计划、演练方案、演练执行、演练总结

演练方式:桌面演练(纸面或模拟系统)、单项演练(如切存储)、全面演练(多场景多部门,从底层到业务)

演练方案包括:演练目的、演练组织、演练方式、演练场景、演练时间和地点、演练步骤、演练过程、演练总结等

(实战结论,要演练3次左右才能保证RTO,RPO)

九、三级支持文件:核心业务和核心模块列表、故障诊断和定级报告模板、故障情况报告参考模板、应急演练年度计划表、故障场景应急处置模板、应急风险分析模板、应急预案

一级文件:iso2000等体系文件,要求,框架

二级文件:事件管理,(ITIL的这些流程)

IT服务流程的管控

三级文件:具体的操作文件,比如具体事件的处理方法 SOP,WMI

四级文件:记录,模板,报告

BCM(业务连续性)

ITIL 4P(process,product,partner,people,)

DRP(灾难恢复计划)

下载:长河,针对BCM的业务实操的PPT

Even 一般的时间, Incident 突发事件

事件流程:记录,分派,处理,验证,关闭 跟用户沟通

紧急事件流程: 跟业务部门沟通

紧急到应急:人为的判断,看优先级极高;RPO(业务恢复时

间),RTO(数据丢失的时间点)会被突破

应急场景:可能原因,表象,影响的优先级,人员处置,

做流程过程:

1-抽象出各个角色;流程活动,流向,输入输出,甬道图

2-角色:领导组(听报告),指挥组(流程领导,主任),实施组(具体处置人),沟通组,保障组(后勤,物业)

3-风险评价:定义指导思想,业务影响度,(识别资产,弱点,威胁,漏洞)

DIA:单位时间的损失

4-应急场景:梳理场景 两类:一类是紧急事件就能响应,常规;另一类,应急,需要制定应急预案;

参考配置管理,IT服务连续性管理

5-应急管理流程:

应急需要领导小组审批,应急启动子流程(召开应急会议,召集人员,),判定事件的紧急度

识别 ,分析,处置 CIA

相关文档
最新文档