故障分析与处理方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通过网管获取告警和性能信息,进行故障定位
全面性
不仅是一个站、一块板的故障信息,而且是全网设备 的故障信息;
详实性
可以知道当前设备存在的告警是什么时间发生的,以 前曾经发生过什么历史告警。性能不好时,误码、指 针调整有多少。
华为机密,未经许可不得扩散
文档密级:内部公开
通过设备上的指示灯获取告警信息,进行故障定位
文档密级:内部公开
华为机密,未经许可不得扩散
常用方法
告警分析法 逐段环回法 互换、替换法
处理步骤(对于网管维护人员)
检查各站登录是否正常,各站光路上是 否有危急告警。 检查业务中断站点支路板上业务通道。 逐段环回
文档密级:内部公开
华为机密,未经许可不得扩散
无保护链型组网
支 持 软 件 环 操 作 工 软 件 环 回 环 回 级 别 回 的 单 板 具 操 作 类 型
应 用
网 管 、 内 环 回 、 按 V C 4 通 道 级 别 或 整 将 故 障 定 位 到 单 站 , 且 可 初 线 路 板 尾 纤 外 环 回 个 S T M N 信 号 环 回 步 判 断 线 路 板 是 否 存 在 故 障 远 端 环 可 分 离 交 换 机 故 障 还 是 传 输 网 管 、 支 路 板 回 、 本 故 障 , 且 可 初 步 判 断 支 路 板 自 环 线 按 业 务 通 道 环 回 地 环 回 是 否 存 在 故 障 。 网 管 、 可 定 位 单 站 故 障 中 , 是 线 路 交 叉 板 命 令 行 线 路 环 回 按 业 务 通 道 环 回 侧 故 障 还 是 支 路 侧 故 障 。
线路板和支路板通道的环回设置 支路通道保护属性
分析以上的配置数据是否正常,来定位故障。
华为机密,未经许可不得扩散
文档密级:内部公开
“仪表测试法”指采用各种仪表(如误码仪、万 用表光功率计、SDH分析仪等)检查传输故障。
如: 用误码仪测试业务通断、误码 用万用表测试供电电压,检查电压过高或过低问题
华为机密,未经许可不得扩散 文档密级:内部公开
故 障 定 位 过 程 常 用 方 法 其 它 方 法 替 换 法 、 测 试 1 . 排 除 外 部 设 备 故 障 告 警 性 能 分 析 法 法 、 环 回 法 2 . 故 障 定 位 到 单 站 环 回 法 告 警 性 能 分 析 法
告 警 性 能 分 析 法 、 环 3 . 故 障 定 位 到 单 板 并 最 回 法 、 更 改 配 置 法 、 替 换 法 终 排 除 配 置 数 据 检 查 法 、 经 验 处 理 法
华为机密,未经许可不得扩散
文档密级:内部公开
复用段环 w 3 e e 2 w OptiX MSP环 w 4 e w e
1
w
5 e
组网配置
某局Optix 622复用段保护环,组网图所示,1号站为网管中心站。 某日,维护人员发现,2站、3站相连的线路板出现RLOS告警,各站 交叉板均有保护倒换告警,查询各节点倒换状态正常。但 3号站与 1 号站的业务中断(N0.1个VC4),其它站业务正常。
处理步骤
1、中断业务样本采样:
选取1号站第二支路板的第一个2M通道,即1站的t2:1。 2、保护倒换前,样本业务1号站的t2:1走的路径如图所示
华为机密,未经许可不得扩散
文档密级:内部公开
处理步骤
3、逐段环回,缩小故障范围: 在1号站第二支路板的第一个 2M通道上挂表测试然后通 过网管逐段进行如下的环回操作。 当站点数较多时,可采用二分法,进行环回操作。
先单站,后单板
在定位故障时,要尽可能准确地将故障定位到 单站。
华为机密,未经许可不得扩散
文档密级:内部公开
先线路,后支路
从告警信号流中可以看出,线路板的故障常常 会引起支路板的异常告警,因此在故障定位时, 应按“先线路,后支路”的顺序,排除故障;
先高级,后低级
在分析告警时,应首先分析告警级别高的告警, 如危急告警、主要告警;然后再分析低级别的 告警,如次要告警和一般告警。
华为机密,未经许可不得扩散
文档密级:内部公开
分类故障的处理
华为机密,未经许可不得扩散
文档密级:内部公开
常见原因
外部原因 供电电源故障,如设备掉电、供电电压过低等 交换机故障 光纤、电缆故障。如光纤性能劣化、损耗过高,或 光纤损断;中继电缆脱落、损断或接触不良等 人为原因 误操作设置了光路或支路通道的环回 误操作更改、删除配置数据 设备本身故障 单板失效或性能不好
文档密级:内部公开
处理步骤
5、更换3号站东向SL4板,故障仍存在。 更换 4 号站西向 SL4 板,故障排除,说明该板不能正 常穿通No.3VC4。
“仪表测试法”分析定位故障,说服力比较强。但 需要采用仪表。
华为机密,未经许可不得扩散 文档密级:内部公开
在一些特殊的情况下通过复位单板、单站
掉电重启、重新下发配置等手段可有效及 时的排除故障、恢复业务。
但建议该处理故障的办法尽量少用,因为该 方法不利于故障原因的彻底查清。遇到这种 情况,除非情况紧急,一般还是应尽量使用 上面介绍的方法,或请求支援尽可能地将故 障定位出来,以消除设备内外隐患。
TA000301 故障分析与处理方法
ISSUE 1.1
光网络产品课程开发室
内容
传输故障分析方法
传输分类故障的处理
目标
掌握OptiX传输设备常用的故障分析方法
掌握 OptiX 传输设备典型故障业务中断、误
码、ECC的处理方法
华为机密,未经许可不得扩散
文档密级:内部公开
传输故障分析方法
文档密级:内部公开
பைடு நூலகம்
故障现象
华为机密,未经许可不得扩散
复用段保护倒换后业务正常的必要条件:
1、线路板正常监测到告警,正常传递K1、K2字节。
2、主控板正确处理K1、K2字节,保护倒换协议正常。 3、交叉板接受主控板发来指令,正常倒换。 4、保护倒换的备用通道正常。
华为机密,未经许可不得扩散
文档密级:内部公开
华为机密,未经许可不得扩散
文档密级:内部公开
采用环回法应注意的问题:
1、软件环回是一种不彻底的环回,只能初步定位故障的位 置。 2 、对远端站点线路板第一个 VC4 作环回操作时 , 一定要确 认环回后ECC通信不会中断,才可进行操作。
一旦远端站点的ECC通信中断,则只能到远端站点现场才
能解开环回,恢复ECC通信。 3、“环回法”会导致正常业务的暂时中断,一般只有在出 现业务中断等重大事故时,才使用环回法进行故障排除。
华为机密,未经许可不得扩散
文档密级:内部公开
二、画业务路径图:
画出所采样业务一个方向的路径图。 在路径图中表示出:该业务的源和宿,该业务所经过的站 点,该业务所占用的VC4通道和时隙。 例如:
华为机密,未经许可不得扩散
文档密级:内部公开
三、逐段环回,定位故障站点
依据中断业务的路径图,在1号站第2块支路板的第 1个 2M通道外接一个2M误码仪,监测业务好坏。
华为机密,未经许可不得扩散
文档密级:内部公开
“ 更改配置法”所更改的配置内容包括:
时隙配置、板位配置等。
该方法适用于没有备板的情况下,初步定位故障 类型,并暂时排除故障,恢复业务。
华为机密,未经许可不得扩散
文档密级:内部公开
查询、分析设备当前的配置数据,例如:
时隙配置
复用段的节点参数
华为机密,未经许可不得扩散
文档密级:内部公开
“环回法”的步骤: 1.环回业务通道采样; 2.画业务路径图;
3.逐段环回,定位故障站点;
4.初步定位单板问题。
华为机密,未经许可不得扩散
文档密级:内部公开
一、环回业务通道采样:
1 、从多个有故障的站点中选择其中的一个站点; 2 、从所选择一个站点的多个有问题的业务通道 中选择其中的一个业务通道。由于自环第一 个 VC4 通道,可能会影响 ECC 通信,因此尽 量不要选择第一个VC4通道内的业务。
华为机密,未经许可不得扩散
文档密级:内部公开
处理步骤
4、逐段环回,定位故障站点和单板: 在对3号站的东向SL4板No.3VC4做外环回时,发现业务不 通,而对4号站的西向 SL4 板No.3VC4做内环回时,业务正常, 说明问题在3号站的东向SL4板和4号站的西向SL4板之间。
华为机密,未经许可不得扩散
一、通过机柜顶部的告警指示灯查看告警 二、通过单板告警指示灯查看告警
缺点
设备指示灯仅反映设备当前的运行状态,对于设备曾 经出过故障,无法表示; 设备每种告警对应的指示灯闪烁情况,可以通过网管 软件进行重新定义,甚至于可以将某种告警屏蔽掉。
华为机密,未经许可不得扩散
文档密级:内部公开
环回法,是 SDH 传输设备定位故障最常用,最行之有效 的一种方法。
文档密级:内部公开
故障定位的确关键:
将故障点准确地定位到单站
由于传输设备站与站之间
的距离较远,在进行故障
定位时,首先就应将故障 点准确地定位到单站。
华为机密,未经许可不得扩散
文档密级:内部公开
故障定位的原则
先外部,后传输
在定位故障时,应先排除外部的可能因素,如
光纤断,交换故障或电源问题等。
华为机密,未经许可不得扩散
文档密级:内部公开
“替换法”就是使用一个工作正常的物件去替换一个
怀疑工作不正常的物件,从而达到定位故障、排除
故障的目的。这里的物件,可以是一段线缆、一个 设备、一块单板、一块模块或一个芯片。
“替换法”适用于排除传输外部设备的问题,如光
纤、中继电缆、交换机、供电设备等;或故障定位 到单站后,用于排除单站内单板或模块的问题。
华为机密,未经许可不得扩散
文档密级:内部公开
故障定位的常用方法
一分析 二环回 三换板
一、当故障发生时,首先通过对告警事件、性能事件、 业务流向的分析,初步判断故障点范围; 二、通过逐段环回,排除外部故障,并最终将故障定位 到单站,乃至单板; 三、通过换板,排除故障问题。
华为机密,未经许可不得扩散 文档密级:内部公开
华为机密,未经许可不得扩散
文档密级:内部公开
5.若环回2号站东向线路板业务正常,环回3站西向线路板 业务不通,则可能3站有故障或2站的东向线路板有故障。 6.到达2号站,通过尾纤将东向线路板环回,若此时1站挂 表测试的业务正常,则说明2站东向线路板没有问题,故障点 在3站或光缆有问题,直接转第7步。 若环回后业务不通,则说明该板有故障。通过更换该板, 排除此处故障,若此处故障排除后,业务恢复正常,则故障处 理完毕。否则继续作逐段环回。 7.到达3号站,对3号站作单站测试,通过尾纤将西向线路 板环回,发现业务不正常,更换3号站西向线路板,故障排除。
华为机密,未经许可不得扩散
文档密级:内部公开
故障处理对维护人员的要求
掌握SDH常用开销字节功能、告警信号流
(告警--帧结构--逻辑功能块--单板硬件) 熟练掌握所维护传输设备的基本操作
熟悉所维护局的情况
(组网拓扑、保护属性、业务分配、命令行配置) 作好现场数据的采集与
华为机密,未经许可不得扩散
华为机密,未经许可不得扩散 文档密级:内部公开
1. 排除传输外部设备故障: 分离传输问题还是交换机问题 光纤故障的排除 中继线缆故障的排除 2.故障定位到单站 供电电源故障的排除 将故障定位到单站,最 接地问题的排除 常 用 的 方 法就 是 “ 环 回 法”。 另外,告警性能分析法, 也是将故障定位到站点 3. 故障定位到单板并最终 比较常用的方法。 排除 故障定位到单站后 , 进一步定位故障位置 最常用的方法就是替 换法。
组网配置
图5-1为四个站组成的一条无保护链,1站为网管中心站,集中型业 务,即每个站均与1站有2M业务。
故障现象
4站支路板有TU-AIS告警,1站支路板对应通道有LP-RDI告警, 1站和4站的2M业务中断。
文档密级:内部公开
华为机密,未经许可不得扩散
处理步骤
1.在1号站挂一2M误码表,监测1号站与4号站的2M业务。 2.通过网管对4号站的支路板作软件内环回。若仪表显示 业务正常,则说明是 4 号站有问题,进入第三步。若仪表显 示业务中断,则说明传输设备有问题,进入第四步。 3.在4号站的DDF配线架上,再作一个对传输设备的硬件 内环回,若此时仪表仍显示业务正常,则说明传输设备没有 问题。需排除交换机或中继电缆的问题。 4.分别对1号站西向线路板、2号站东向线路板、3号站东 向线路板作内环回。