数据中心应急预案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据中心应急预案
V1.0
2017年11月
修改记录:
目录
一、总则 (5)
二、术语 (5)
三、适用范围 (5)
四、应急通讯录 (5)
五、现场应急指挥领导小组 (6)
六、应急事件汇报流程 (7)
七、操作安全注意事项 (9)
八、应急处理预案流程 (9)
(一)市电双路供电中断 (9)
(二)UPS故障处理 (11)
(三)机柜空开掉电 (12)
(四)风冷精密空调故障高温处理 (13)
(五)水冷空调高温报警处理 (14)
(六)局部高温处理 (15)
(七)空调供电中断多台 .................................................................................. 错误!未定义书签。
(八)空调高压报警 .......................................................................................... 错误!未定义书签。
(九)空调低压报警及制冷剂泄漏处理 .......................................................... 错误!未定义书签。
(十)机房低温报警处理 (15)
(十一)机房湿度过低的处理 (16)
(十二)机房湿度过高的处理 (16)
(十三)气流故障处理 ...................................................................................... 错误!未定义书签。
(十四)漏水应急处理 (17)
(十五)环境监控故障处理 (18)
(十六)消防系统应急处理 (18)
(十七)公共卫生事件处理............................................................................... 错误!未定义书签。
(十八)防汛应急处理 (21)
(十九)治安应急处理 (26)
(二十)地震应急处理 (28)
九、应急操作指引维护 (29)
一、总则
为提高运维人员对各种险情及紧急情况的应对能力,以防突发性事件对公司和客户造成重大损失,结合运维实际,制定各种应急事件处理预案。应急预案遵循以防为主、防救结合的方针,坚持以人为本、避免伤亡原则,做到责任明确、程序简洁、分工合理、反应灵敏,以应对可能出现的各类险情及紧急情况。
为加强对突发性事件(事故)应急反应的组织领导工作,在数据中心成立现场应急指挥领导小组,组织指挥重特大突发性事件(事故)的救援、抢险工作,确保救援、抢险工作反应迅速、组织有序、效果突出。
二、术语
防护用品:劳动者在生产过程中为免遭或减轻事故发生和职业病危害的个人随身穿(佩)戴的用品。
防护设施:在生产过程中为免遭或减轻事故发生和职业病危害的公共防护设备。
操作资格:特种作业人员必须经专门的安全技术培训并考核合格,取得《中华人民共和国特种作业操作证》(以下简称操作资格证)后,方可上岗作业。
三、适用范围
数据中心。
四、应急通讯录
应急通讯录应定时更新,对供应商值班电话应按月度抽查有效性。各职位A/B角互换,当第一负责人A角联络不上时,B角人员担当行使第一负责人职权。应急通讯录应打印成册放置在数据中心值班电话旁的明显位置。
五、现场应急指挥小组
数据中心成立现场应急指挥小组,小组成员履行规定的应急职责。现场应急指挥小组架构图中应有明确的小组人员姓名和联系方式,并打印张贴在数据中心明显位置。
六、应急事件汇报流程
(一)在应急事件中的汇报遵守如下流程:
➢突发事件发现人报告给数据中心值班人员
➢数据中心值班人员报告到数据中心应急总指挥;
➢应急总指挥根据反馈信息,对整体的事件初步情况报告做出判断,组织人员初步评估事件严重程度和事件等级,决策启动相应应急程序。
➢各相应应急组组长接受到通报后,根据应急流程实施应急指挥。
(二)事件通报机制:
七、操作安全注意事项
以下的内容列出了基本的安全注意事项,但它不能包含所有的情况,应时刻警惕!
1.没有数据中心经理许可,严禁任何人员触及各供电设施开关。
2.油罐区、柴油发电机组及配电间和UPS 间应急电源系统设备所在区域,此区域严
禁明火和电焊操作,非工作人员或未经上级部门许可人员,严禁入内。
3.所有操作运行人员必须有操作职格证及公司内部安全培训,否则不能执行操作,安
全培训包含在应急电源系统的培训内。
4.操作运行人员必须完全熟悉相关设备的安全信息,并且知道操作步骤。
5.在机组周围要时刻注意机组的状态,安全隐患包括机械运动、电气伤害、高电压、
烫伤等。
6.注意警告标牌并且在操作之前要确认无人在机器周围工作。
八、应急处理预案
(一)市电双路供电中断
➢值班工程师
1.值班人员接到故障报警的信息后,查看监控报警平台影响范围,包含UPS后备时
间,空调运行状况,向设施工程师及数据中心经理汇报。
2.短信平台发出告警短信通知基础设施工程师及数据中心主管现场处理。
3.巡检人员查找断电原因,查看发电机是否自动或人员手动投入(发电机投入时间应
在10分钟内投入)。
4.值班人员在电脑上查看UPS的输出电压和备份时间,上报设施工程师及DC经理,
同时观察机房环境温升情况。
5.发电机供给正常后,检查冷机及配电、UPS运行状况,根据温升情况,开启机房备
用空调,并全面巡检空调及日常设施(CCTV、门禁等)。
6.根据设施工程师安排进行应急处置。
7.待处理结束将处理过程、处理结果录入Remedy。
➢基础设施工程师
1.根据故障信息,现场进行处理。
2.向DC主管进行汇报事件处理进程及影响评估。
3.根据机房温升判断,不可控情况下,在室外气温25度以下,开启消防排烟进行降
温。
4.根据电路供给情况,对空调配电进行手动切换。
5.指挥关闭一些不必要设备,节约电力资源。
➢数据中心主管
1.第一时间向ADM及客户当值人员汇报当前故障信息及后续发展评估,建议客户评