第3章 故障定位的基本思路与方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3章故障定位的基本思路与方法
本章介绍常见故障的基本处理思路和方法。包括:
对维护人员的要求
故障定位的基本原则
故障判断与定位的常用方法
故障处理的过程示例
3.1 对维护人员的要求
快速定位和及时排除光传送系统的故障,对维护人员的业务技能、操作规范等都有很高要求。维护人员应做到以下应知应会。
3.1.1 专业技能
1. 熟练掌握SDH的基本原理
参见《光同步数字传送网》主编:韦乐平人民邮电出版社。
2. 熟练掌握传输系统告警信号流及告警产生的机理
参见《OptiX OSN 3500/2500/1500智能光传输系统维护手册告警及性能事件分册》。
3. 熟练掌握以下常见告警信号的处理
(1)线路告警
R_LOS
R_LOF
R_OOF
AU_AIS
AU_LOP
MS_AIS
MS_RDI
B1_EXC
B2_EXC
HP_LOM
HP_SLM
HP_TIM
HP_UNEQ
(2)支路告警
TU_AIS
TU_LOP
T_ALOS
P_LOS
EXT_LOS
UP_E1_AIS
LP_RDI
LP_SLM
LP_TIM
LP_UNEQ
B3_EXC
(3)保护倒换告警
PS
(4)时钟告警
LTI
SYNC_C_LOS
SYN_BAD
(5)设备告警
POWER_FAIL
FAN_FAIL
BD_STATUS
告警信号的处理方法,参见《OptiX OSN 3500/2500/1500智能光传输系统维护手册告警及性能事件分册》。
4. 熟练掌握传输设备和网管的基本操作
参见网管操作手册和网管的联机帮助。
5. 熟练掌握传输常用仪表的基本操作
传输设备在维护中常用的仪表包括:2M误码仪、光功率计、SDH分析仪、示波器、万用表等,使用方法参见各仪表的使用手册。
3.1.2 工程组网信息
熟悉组网情况。
熟悉业务配置。
熟悉设备运行状况。
熟悉工程文档,并作好工程文档的维护工作。
3.1.3 故障现场数据的采集与保存
采集并保存设备的告警及性能事件。
采集并保存各网元及单板的配置数据。
采集并保存各网元及单板的运行状态数据。
采集并保存网管的操作日志。
3.2 故障定位的基本原则
故障定位关键是:将故障点准确地定位到单站。
故障定位的一般原则可总结为四句话:先外部,后传输;先网络,后网元;
先高速,后低速;先高级,后低级。
故障定位的一般原则可总结如下:
先定位外部,后定位传输。
在定位故障时,应先排除外部的可能因素,如光纤断,对接设备故障或电源问题等。
先定位网络,后定位网元。
在定位故障时,首先要尽可能准确地定位出是哪个站的问题。
先高速部分,后低速部分。
从告警信号流中可以看出,高速信号的告警常常会引起低速信号的告警;
因此在故障定位时,应先排除高速部分的故障。
先分析高级别告警,后分析低级别告警。
在分析告警时,应首先分析高级别的告警,如紧急告警、主要告警;然后再分析低级别的告警,如次要告警和提示告警。
3.3 故障判断与定位的常用方法
故障定位的常用方法可简单地总结为:“一分析,二环回,三换板”。
当故障发生时,首先通过对告警、性能事件、业务流向的分析,初步判断故障点范围。然后,通过逐段环回,排除外部故障或将故障定位到单个网元,以至单板。最后,更换引起故障的单板,排除故障。
对于较复杂的故障,需要综合使用表3-1所示的方法进行故障定位和处理。
表3-1 复杂故障的定位和处理
常用方法适用范围操作特点
告警、性能分析法通用
全网把握,可初步定位故障点;不影响
正常业务;依赖于网管。
环回法
分离外部故障,将故
障定位到单站、单板
不依赖于告警、性能事件的分析;快捷。
替换法
将故障定位到单板,
或分离外部故障
简单;对备件有需求;需要与其他方法
同时使用。
配置数据分析法
将故障定位到单站或
单板
可查清故障原因;定位时间长;依赖于
网管。
更改配置法将故障定位到单板风险高;依赖于网管。
仪表测试法
分离外部故障,解决
对接问题
通用,具有说服力,准确度高;对仪表
有需求;需要与其他方法同时使用。
经验处理法特殊情况处理快速;易误判;需经验积累。
3.3.1 告警、性能分析法
SDH信号的帧结构里定义了丰富的、包含系统告警和性能信息的开销字节。
因此,当SDH系统发生故障时,一般会伴随有大量的告警和性能事件信息,通过对这些信息的分析,可大概判断出所发生故障的类型和位置。
获取告警和性能事件信息的方式有以下两种:
通过网管查询传输系统当前或历史发生的告警和性能事件数据。
通过传输设备机柜和单板的运行灯、告警灯的状态,了解设备当前的运行状况。
1. 通过网管获取告警信息,进行故障定位
通过网管获取故障信息,定位故障的特点是:
全面:能够获取全网设备的故障信息。
准确:能够获取设备当前存在哪些告警、告警发生时间,以及设备的历史告警;能够获取设备性能事件的具体数值。