中国电信无线网络应急指导手册
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国电信无线网络应急指导手册
中国电信股份有限公司网络运营部
二零一二年十一月
1概述
应急处理是一种突发性情况下实施的维护工作,是在网络或设备发生紧急事故、严重影响用户使用时为迅速恢复业务、排除故障而进行的一系列故障处理措施。本手册为应急处理框架,以设备故障、应急容灾、信令拥塞三类场景为例,提出三类事件发生时的处理原则,为各省编制本省应急预案提供参考。各省在制定省应急预案时应充分考虑本省实际情况,在本指导手册中三类场景基础上进行适度扩展,以应对可能发生的突发性网络问题。
本文同时提供华为、中兴、阿朗设备厂家的设备紧急故障处理指导手册及部分省份应急预案作为参考。
2无线网络紧急故障定义
紧急故障是指发生突然、影响面广、涉及范围大,严重影响用户使用感知并可对网络的安全运行与服务质量造成严重后果的设备或网络事故。
根据紧急故障影响范围,无线网络紧急故障(简称“紧急故障”)可分为3个级别:
3应急处理预案要求
各省应针对不同的场景分别制定相应的无线网络应急处理预案(简称“应急
预案”),以指导紧急故障发生时的应急处理工作。
紧急故障处理时应遵循应急处理预案的各项要求。
应急预案包括应急处理组织结构、应急处理上报流程、应急处理方法等。4应急处理组织及流程
应急通信处理工作坚持统一指挥、分级负责、严密组织、密切协同、快速反应、保障有力的原则。
4.1.1应急处理小组组织架构
根据紧急故障影响范围、发生原因、处理流程、分公司组织结构等,应急处理小组可包括责任单位、协作单位、支撑单位、设备厂家成员等多方,其中责任单位为无线维护相关部门,协作单位为核心网(含电路域和/或分组域)、业务平台、传输、动力等相关维护专业以及客服、网监等相关部门。应急处理小组中各单位、部门应职责明确,参与应急处理小组的单位及部门均应指定负责人和接口人,以确保应急处理过程中各环节工作的落实。
4.1.2紧急故障上报要求
故障发生时,应根据故障影响程度范围将故障上报至相关单位和部门的负责人,上报的方式包括短信、邮件、电话等,上报的内容包括故障发生点、故障发生时间、故障影响范围、预计修复时间等内容。上报要求如下:
●达到B级故障时,故障发现部门或人员以电话方式通知故障处理值班人员及
其维护主管。并通过短信方式通知应急处理小组各成员。
●达到A级故障时,故障发现部门或人员以电话方式通知故障处理值班人员及
其维护主管,由维护主管通过电话方式通知客服部门,并协助客服部门进行客户投诉拦截及安抚工作。
●达到A+级故障时,除以上上报要求外,还应在故障发生时,立即上报集团网
运部,并在故障处理过程中及时汇报处理进展情况,故障处理完成一周内向集团网运部提交故障处理报告。
4.1.3应急处理流程
流程中各环节的职责部门由各省根据实际组织架构确定,以下流程供参考。
中国电信无线网络应急恢复处理流程
1、目的
明确中国电信无线网络紧急重大故障的应急恢复处理流程,界定部门职责,规范处理,缩小影响范围及时长,提高处理效率。
2、适用范围
中国电信各级分公司无线网络紧急重大故障的应急恢复处理。
3、流程/流程说明
5应急处理方法
以下以设备故障,应急容灾,信令拥塞三个场景为例,介绍应急处理的过程和方法。
场景一、设备故障,是指无线网络设备的单板、背板机框等故障,以及附属设备动力、传输、电源等原因引起设备无法正常运行的故障。
场景二、应急容灾,主要针对自然灾害(冰灾,台风,火灾,地震,洪灾)、战争、突发事件等应急情况下造成的主设备故障且短期内无法恢复时的应急处理。
场景三、信令拥塞,是指由于突发的不可预知的事件引发的信令冲击,引起的全局或者局部的话务、信令拥塞,设备部分资源如信令处理板件、背板带宽资源、声码器资源无法正常运行,主要体现为相关处理板件CPU占用率过高、业务接通率下降、用户感知明显变差、甚至可能引发大面积网络瘫痪的情况。
应急处理包括日常准备、应急处理、处理评估三部分内容。
●日常准备包括备品备件、应急工具、应急资料、应急设备数据等的准备。
●应急处理包括针对不同场景启动相应预案的条件、实施方法步骤。
●处理评估包括故障原因的分析、故障影响范围、影响程度、故障恢复情况的
评估等。
5.1 应急日常准备
日常准备工作的好坏是应急处理成功的关键,日常工作中,应注意以下工作内容:
●做好应急预案中所涉及资源的配备,应急资料及时更新
●每年应不定期进行应急处理演练,以确保应急处理流程畅通,应急维护人员
操作熟练。
根据不同场景预案,日常准备的应急资源、资料也不同,本文列举上述三个场景中重要的应急资源及资料的准备。
5.1.1设备故障应急处理日常准备
5.1.1.1 备品备件
备品备件用于运营设备发生故障时故障部件的更换,包括主设备单板板件、机框等备件,主设备硬件板件应注明型号、版本情况、数量、存放地点等信息。备品备件应定期进行测试,确保备件的完好。
5.1.1.2 维护检查工具
维护检查工具是故障设备检修中需要使用的工具,分为通用工具和厂家专用工具,通用工具主要有扳手、十字起、梅花起等,厂家专用工具指厂家设备维护专有的硬、软件工具。
5.1.2应急容灾处理日常准备
应急容灾应提前做好容灾组网规划,包括VIP站点信息、应急专用传输通道的规划以及应急容灾方案实施时需要启用的数据配置脚本的预制作等。
5.1.2.1 容灾组网规划
容灾组网是指主设备(主要指BSC/PCF/AN等)发生重大的、短期内不可恢复故障时,紧急将主设备管理下的VIP站点割接到其它主设备时的组网情况。容灾组网规划时应以当前地市无线网络组网结构为基础,建立容灾主设备的组网备份关系。
容灾组网要求如下:
●优先考虑异地异机房异楼层的设备灾备。
●根据每个主设备下VIP站点数量、容灾资源(如板卡、传输)冗余情况建立
灾备关系。