运维应急方案

运维应急方案
运维应急方案

运维应急方案

目录

1前言 (3)

2目标 (3)

3组织结构 (3)

4应急预警 (3)

4.1应急预警级别 (3)

4.2应急预警处理流程 (5)

4.2.1一级预警处理 (5)

4.2.2二级预警处理 (5)

4.2.3三级预警处理 (6)

5附件 (7)

5.1.1故障报告单 (7)

1 前言

运维部负责公司业务系统运行维护工作。

为了保障公司因业务系统的安全、平稳运行,运维部特此指定运维应急方案,通过此方案来保证系统的安全。

2 目标

?保障公司游戏服务器的正常运行、网络的畅通。

?严格岗位制度、明确工作职责,规范工作流程。

?工作规范化,制度化,加强文档管理力度。

3 组织结构

根据运维工作的范围和性质,下设三个小组:

?系统维护组

?应用维护组

?技术值班组

4 应急预警

4.1 应急预警级别

4.2 应急预警处理流程

运维过程中出现重要故障或紧急情况时,按以下规定流程进行处理及汇报。在遇到故障时,及时汇报上级领导并采取措施及时解决,具体汇报流程如下:

4.2.1 一级预警处理

运维过程中,如果遇到一级预警,按以下流程进行处理:

1.当通过监控或得知系统出现故障时,首先在最短的时间查看故障点状态,

并分析故障原因。

2.运维工程师在排查出故障后,立即着手解决。

3.在故障排除后,对所发生故障的设备进行事后跟踪。

4.在故障排除后,运维工程师应对故障原因及解决办法进行详细说明。

4.2.2 二级预警处理

运维过程中,如果遇到二级预警,按以下流程进行处理:

1.当通过监控或得知系统出现故障时,首先在最短的时间内查看故障点状态,

并分析故障原因。

2.立即报告给组长,运维小组长应通过电话或当面把故障报告相关部门领导,

在故障完全排查清楚后以书面形式递交“故障报告单”。

3.运维工程师在排查出故障后,如能够立即解决,则立刻解决故障,如需要

设备厂商的技术人员到现场,应立即拨打技术厂商的技术工程师联系电话,

请求立即到现场进行故障排除。

4.在故障排除后,运维工程师应对故障原因及解决办法进行详细说明。

4.2.3 三级预警处理

运维过程中,如果遇到三级预警,按以下流程进行处理:

1.当通过监控或得知系统出现故障时,首先在最短的时间查看故障点状态,

并分析故障原因。

2.立即报告给运维中心主管人员,主管人员应通过电话或当面把故障报告给

相关领导部门,在故障完全排查清楚后以书面形式递交“故障报告单”。

3.运维工程师在排查出故障后,如能够立即解决,则立刻解决故障,如需要

设备厂商的技术人员到现场,应立即拨打技术厂商的技术工程师联系电话,

请求立即到现场进行故障排除。

4.如果因硬件设备出现故障而无法修复,需要更换时,应报运维中心主管人

员,主管人员办理硬件更换事宜。

5.在故障排除后,运维工程师应对故障原因及解决办法进行详细说明。

5 附件

5.1.1 故障报告单

相关主题
相关文档
最新文档