计算机机房应急预案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算机机房应急预案

计算机机房应急预案

XXXX单位名称

20XX年XX月

编制人员

编制审核XXX XXXX

前言

近年来,经常会听到某地机房发生因某种原因导致灾难性的事件;由于处理不及时或人为因素操作不当,导致严重后果,造成了巨大的经济损失。为了避免类似事情发生,项目组每年对应急预案进行修订,优化使用流程及操作步骤,保障在突发情况下及时、有效处理各类应急情况。本应急预案编制依据《单位网络系统运行管理规定》而编写。

根据单位领导提出新的改进建议,应急预案的版本修订相比之前有了较大的改动,项目组结合机房的实际情况,针对所涉及故障及其处理方法分别进行说明并细化了每一个处理步骤,增加了非工作时间机房出现突发事件的处理步骤及紧急联系人相关信息,确保维护人员能够直观、及时、有效地处理突发情况,在维护人员不能第一时间到达现场,其他人员也能以及有效协助处理突发情况。

项目组每年组织两次的机房应急演练,模拟机房设备故障,维护人员参照应急预案能够熟练操作并进行突发事件的处理,验证应急预案对于机房的有效性和可用性。

目次

1概述 (1)

1.1目的 (1)

1.2应急预案存放 (1)

1.3编制依据 (1)

1.4技术资料 (1)

2 适用范围及启动条件 (2)

3 应急组织和职责 (2)

4应急响应流程 (4)

4.1 应急事件响应 (4)

4.2 应急事件升级 (4)

5应急执行流程 (5)

5.1 影响程度的评估 (5)

5.2 宣告启动应急 (8)

5.3 应急恢复 (9)

5.4 事后处理 (10)

5.5 应急注意事项 (10)

6应急恢复步骤 (12)

6.1强电系统故障 (12)

6.2 UPS故障 (15)

6.3 网络系统故障 (16)

6.4 机房漏水 (18)

6.5 空调故障 (20)

6.6 机房火灾 (23)

附表一交换机信息 (29)

附表二自主运维办公交换机信息 (30)

附表三交换机常用命令 (31)

附表四机房应急预案联系人信息表 (31)

附表五机房服务器联系人信息表 (31)

7 预案附录 (32)

附录一机房示意图 (32)

附录二配电柜操作说明书 (32)

附录三 UPS操作说明 (32)

附录四空调操作手册 (32)

附录五设备监控软件使用说明书 (32)

1概述

1.1目的

为了提高单位计算机机房、网络突发事件的应急处理能力,最大程度地预防和减少突发事件及其造成的损害,保障设备正常运行,制定本预案。本预案参照单位领导的要求,对机房空调、电力、消防、漏水以及网络系统五种突发情况制定具体的应急工作流程。

1.2应急预案存放

1) 电子版本

本应急预案电子版存放于单位共享服务器及所有项目组成员工作电脑中。

2) 纸质版本

本应急预案纸质文档存放于机房缓冲区桌面、运维人员办公室。

1.3编制依据

本应急预案编制依据《单位安全管理规定》编写。

1.4技术资料

2 适用范围及启动条件

1)地域范围:

本预案适用于本单位机房及网络运行中发生故障时使用。

2)人员范围:

本预案在执行中涉及的人员包括机房、网络运维人员,相关主管领导,大楼安保人员以及机房内各应用系统负责人等。

3)启动条件

机房、网络运行中出现的一般性突发事件和重大突发事件。

一般性突发事件:是指机房、网络突发故障,将影响机房提供正常服务及网络服务的能力且预计修复时间大于30分钟,此时应立即启动应急预案,主要包括:

1)市电中断和UPS故障引起的电力供应中断。

2)机房空调冷凝水或上下水管道漏水。

3)机房温度超过30℃。

4)网络故障影响用户范围超过20%,预计修复时间在2小时以内。

重大突发事件:是指一般性突发事件在特定的时间内无法修复或发生特殊事件时,严重影响机房提供正常服务及网络服务的能力,并且修复时间大于2小时,此时除了立即启动应急预案外还应升级为重大事件,其中包括但不限定于以下分类:

1)机房出现火灾。

2)市电中断和UPS故障引起的电力供应中断。

3)机房温度超过40℃。

4)网络故障造成全网中断,预计修复时间超过2小时。

3 应急组织和职责

计算机机房应急组名单如下:

表1 应急小组名单

4应急响应流程

4.1 应急事件响应

1、发生突发事件时,通过电话或当面通知应急小组组长报告情况。

2、必要时第一时间启动应急预案。

3、应急小组组长根据实际情况启动应急预案,参照应急恢复步骤组织协调相关

人员进行应急处理。

4、电话通知机房内生产业务系统管理员做相应的应急措施。

5、应急小组组长根据情况判定是否需要将事件升级为重大事件。

6、事件处理完毕后,应急小组组长将事件处理详细经过形成书面报告,上报

部门主任和单位领导。

4.2 应急事件升级

在应急小组组长认定突发事件升级为重大事件时,应按以下步骤操作:

1、立即通知部门主任。

2、通知机房内生产业务系统管理员事件升级为严重,参照应急恢复步骤做相应

的应急措施。

3、根据应急决策领导的决策指令处理故障。

4、事件处理完毕后,应急小组组长将事件处理详细经过形成书面报告,上报部

门主任和单位领导。

相关文档
最新文档