传输基本故障处理方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.故障定位到单站 ! 将故障定位到单站 最常 用的方法就是“环回
法”
! 另外 告警性能分析法
3.故障定位到单板并最终 排除
也是将故障定位到站点 比较常用的方法
! 故障定位到单站后
进一步定位故障位置
最常用的方法就是替
换法
故障处理方法
故障定位过程
常用方法
1.排除外部设备故障
替换法 测试 法 环回法
2.故障定位到单站
! 先高级 后低级 ➨ 在分析告警时 应首先分析告警级别高的告警 如危急告警 主要告警 然后再分析低级别的告 警 如次要告警和一般告警
故障定位
"" 故障定位的常用方法
一分析 二环回 三换板
一 当故障发生时 首先通过对告警事件 性能事件 业务流向的分析 初步判断故障点范围
二 通过逐段环回 排除外部故障 并最终将故障定位 到单站 乃至单板
应用
线路板
网管 内环回 尾纤 外环回
按VC4通道级别或整 将故障定位到单站 且可初 个STM-N信号环回 步判断线路板是否存在故障
支路板
网管 自环线
远端环 回本 地环回
按业务通道环回
可分离交换机故障还是传输 故障 且可初步判断支路板
是否存在故障
网管 交叉板 命令行 线路环回
可定位单站故障中 是线路 按业务通道环回 侧故障还是支路侧故障
业务中断问题
"" 复用段保护倒换后业务正常的必要条件
1 线路板正常监测到告警 正常传递K1 K2字节 2 主控板正确处理K1 K2字节 保护倒换协议正 常 3 交叉板接受主控板发来指令 正常倒换 4 保护倒换的备用通道正常
业务中断问题
"" 处理步骤
1 中断业务样本采样: 选 取 1号站第二支路板的第一个2M通道 即 1站的
缺点
➨ 设备指示灯仅反映设备当前的运行状态 对于设备曾 经出过故障 无法表示
➨ 设备每种告警对应的指示灯闪烁情况 可以通过网管 软件进行重新定义 甚至于可以将某种告警屏蔽掉
环回法
➨ 环回法 是SDH传输设备定位故障最常用 最行之有效的 一种方法
支持软件环 操作工 软件环回 回的单板 具 操作类型
环回级别
e1:17
1 w1:17
e3:17
e3:17
e3:17
e3:17
2 w3:17
1
w3:17
5
w3:17
4
w3:17
3 w1:17
t2:1
t1:1
业务中断问题
"" 处理步骤
5 更换3号站东向SL4板 故障仍存在 更换4号站西向SL4板 故障排除 说明该板不能正常
穿通No.3VC4
e1:17
1 w1:17
但建议该处理故障的办法尽量少用 因为该 方法不利于故障原因的彻底查清 遇到这种 情况 除非情况紧急 一般还是应尽量使用 上面介绍的方法 或请求支援尽可能地将故 障定位出来 以消除设备内外隐患
故障处理步骤
1. 排除传输外部设备故障
!分离传输问题还是交换机问题
!光纤故障的排除
!中继线缆故障的排除 !供电电源故障的排除 !接地问题的排除
e1:17
1 w1:17
e3:17
e3:17
e3:17
e3:17
2 w3:17
1
w3:17
5
w3:17
4
w3:17
3 w1:17
t2:1
t1:1
业务中断问题
"" 处理步骤
4 逐段环回 定位故障站点和单板: 在对3号站的东向SL4板No.3VC4做外环回时 发现业务不
通 而对4号站的西向SL4板No.3VC4做内环回时 业务正 常 说明问题在3号站的东向SL4板和4号站的西向SL4板之 间
环回法
其它方法 告警性能分析法 告警性能分析法
3.故障定位到单板并最 终排除
替换法
告警性能分析法 环 回法 更改配置法 配置数据检查法 经
验处理法
分类故障的处理
业务中断问题
"" 常见原因
! 外部原因 ➨ 供电电源故障 如设备掉电 供电电压过低等 ➨ 交换机故障 ➨ 光纤 电缆故障 如光纤性能劣化 损耗过高 纤损断 中继电缆脱落 损断或接触不良等
更改配置法
➨ “更改配置法”所更改的配置内容包括 时隙配置 板位配置等
该方法适用于没有备板的情况下 初步定位故障 类型 并暂时排除故障 恢复业务
配置数据分析法
查询 分析设备当前的配置数据 例如
➨ 时隙配置 ➨ 复用段的节点参数 ➨ 线路板和支路板通道的环回设置 ➨ 支路通道保护属性
分析以上的配置数据是否正常 来定位故障
误码问题
"" 处理步骤:
➨ 通过对上报的性能事件分析 可判断为3站东 向光板收有问题或4站西向光板发有问题
故障定位
"" 故障定位的原则
! 先外部 后传输 ➨ 在定位故障时 应先排除外部的可能因素 如 光纤断 交换故障或电源问题等
! 先单站 后单板 ➨ 在定位故障时 要尽可能准确地将故障定位到 单站
故障定位
! 先线路 后支路 ➨ 从告警信号流中可以看出 线路板的故障常常会 引起支路板的异常告警 因此在故障定位时 应 按“先线路 后支路”的顺序 排除故障
➨ 掌握SDH常用开销字节功能 告警信号流 (告警--帧结构--逻辑功能块--单板硬件)
➨ 熟练掌握所维护传输设备的基本操作 ➨ 熟悉所维护局的情况
(组网拓扑 保护属性 业务分配 命令行配置) ➨ 作好现场数据的采集与
故障定位
"" 故障定位的确关键:
将故障点准确地定位到单站
➨ 由于传输设备站与站之间 的距离较远 在进行故障 定位时 首先就应将故障 点准确地定位到单站
MSP环
w
w4 e
5e w
! 组网配置 ➨ 某局Optix 622复用段保护环 组网图所示 1号站为网管中心站
! 故障现象 ➨ 某日 维护人员发现 2站 3站相连的线路板出现RLOS告警 各站 交叉板均有保护倒换告警 查询各节点倒换状态正常 但3号站与1号 站的业务中断(N0.1个VC4) 其它站业务正常
t2:1 2 保护倒换前 样本业务1号站的t2:1走的路径如图所示
1 w1:17 w1:17 2 e1:17 w1:17 3
t2:1
t1:1
业务中断问题
"" 处理步骤
3 逐段环回 缩小故障范围: 在1号站第二支路板的第一个2M通道上挂表测试然后通
过网管逐段进行如下的环回操作 当站点数较多时 可采用二分法 进行环回操作
若环回后业务不通 则说明该板有故障 通过更换该板 排除此处故障 若此处故障排除后 业务恢复正常 则故障处 理完毕 否则继续作逐段环回
7.到达3号站 对3号站作单站测试 通过尾纤将西向线路 板环回 发现业务不正常 更换3号站西向线路板 故障排 除
业务中断问题
"" 复用段环
w e2w
e
3
OptiX
1
e
4.分别对1号站西向线路板 2号站东向线路板 3号站东 向线路板作内环回
业务中断问题
5.若环回2号站东向线路板业务正常 环回3站西向线路板 业务不通 则可能3站有故障或2站的东向线路板有故障
6.到达2号站 通过尾纤将东向线路板环回 若此时1站挂 表测试的业务正常 则说明2站东向线路板没有问题 故障点 在3站或光缆有问题,直接转第7步
环回法
二 画业务路径图
画出所采样业务一个方向的路径图 在路径图中表示出 该业务的源和宿 该业务所经过的站 点 该业务所占用的VC4通道和时隙
例 如
1 w2:17 w2:17 2 e2:17 w2:17 3
t2:1
t1:1
环回法
三 逐段环回 定位故障站点
依据中断业务的路径图 在1号站第2块支路板的第1个 2M通道外接一个2M误码仪 监测业务好坏
➨ 线路板接收侧信号衰减过大 对端发送 电路有故障 本端接收电路故障
➨ 时钟同步性能不好 ➨ 交叉板与线路板 支路板配合不好 ➨ 支路板故障 ➨ 风扇故障 ➨ 板失效或性能不好
误码问题
"" 常用方法:
! 告警性能分析法 ! 逐段环回法 ! 互换 替换法
"" 处理步骤:
! 分析线路板误码性能事件 排除线路误码 ! 分析支路误码性能事件 排除支路误码
1 w2:17 w2:17 2 e2:17 w2:17 3
t2:1
t1:1
替换法
➨ “替换法”就是使用一个工作正常的物件去替换一个 怀疑工作不正常的物件 从而达到定位故障 排除 故障的目的 这里的物件 可以是一段线缆 一个 设备 一块单板 一块模块或一个芯片
➨ “替换法”适用于排除传输外部设备的问题 如光 纤 中继电缆 交换机 供电设备等 或故障定位 到单站后 用于排除单站内单板或模块的问题
业务中断问题 "" 无保护链型组网
1 w w 2 e w3 e w4
! 组网配置 ➨ 图5-1为四个站组成的一条无保护链 务 即每个站均与1站有2M业务
1站为网管中心站
集中型业
! 故障现象 ➨ 4站支路板有TU-AIS告警 1站支路板对应通道有LP-RDI告警 1 站和4站的2M业务中断
业务中断问题
"" 处理步骤
1.在1号站挂一2M误码表 监测1号站与4号站的2M业 务
2.通过网管对4号站的支路板作软件内环回 若仪表显示 业务正常 则说明是4号站有问题 进入第三步 若仪表显示 业务中断 则说明传输设备有问题 进入第四步
3.在4号站的DDF配线架上 再作一个对传输设备的硬件 内环回 若此时仪表仍显示业务正常 则说明传输设备没有 问题 需排除交换机或中继电缆的问题
e3:17
e3:17
e3:17
e3:17
2 w3:17
1
w3Hale Waihona Puke Baidu17
5
w3:17
4
w3:17
3 w1:17
t2:1
t1:1
误码问题
"" 常见原因
! 外部原因
➨ 光纤性能劣化 损耗过高 ➨ 光纤接头不清洁或连接器不正确 ➨ 设备接地不好 ➨ 设备附近有强烈干扰源 ➨ 设备散热不好 工作温度过高
! 设备原因
环回法
"" 采用环回法应注意的问题
1 软件环回是一种不彻底的环回 只能初步定位故障的位 置
2 对远端站点线路板第一个VC4作环回操作时,一定要确认 环回后ECC通信不会中断 才可进行操作
一旦远端站点的ECC通信中断 则只能到远端站点现场才 能解开环回 恢复ECC通信
3 “环回法”会导致正常业务的暂时中断 一般只有在出现 业务中断等重大事故时 才使用环回法进行故障排除
或光
! 人为原因 ➨ 误操作设置了光路或支路通道的环回 ➨ 误操作更改 删除配置数据
! 设备本身故障 ➨ 单板失效或性能不好
业务中断问题
"" 常用方法
! 告警分析法 ! 逐段环回法 ! 互换 替换法
"" 处理步骤(对于网管维护人员)
! 检查各站登录是否正常 各站光路上是否 有危急告警
! 检查业务中断站点支路板上业务通道 ! 逐段环回
OptiX光传输设备故障处理
Lecturer: Dai Zhibao
课程内容和目标
❏ 内容 ! 传输故障分析方法 ! 传输分类故障的处理
❏ 目标 ! 掌握OptiX传输设备常用的故障分析方法 ! 掌握OptiX传输设备典型故障业务中断 误 码 ECC的处理方法
传输故障分析方法
故障处理告警
"" 故障处理对维护人员的要求
仪表测试法
“仪表测试法”指采用各种仪表 如误码仪 万用 表光功率计 SDH分析仪等 检查传输故障
如 ➨ 用误码仪测试业务通断 误码 ➨ 用万用表测试供电电压 检查电压过高或过低问题
“仪表测试法”分析定位故障 说服力比较强 但需 要采用仪表
经验处理法
➨ 在一些特殊的情况下通过复位单板 单站掉 电重启 重新下发配置等手段可有效及时的 排除故障 恢复业务
误码问题
"" 典型故障(线路板故障导致的误码)
➨ 四个站组成的一条无保护链 1站为网管中心站 集中 型业务 即每个站均与1站有2M业务
"" 组网配置:
1 w w 2 e w3 e w4
误码问题
"" 故障现象:
! 1站2M支路板有LPBBE误码 ! 3站东向光板有RSBBE MSBBE HPBBE误码 ! 4站西向光板有MSFEBBE HPFEBBE误码 ! 4站2M支路板有LPFEBBE误码
三 通过换板 排除故障问题
告警 性能分析法
! 通过网管获取告警和性能信息 进行故障定位
全面性
不仅是一个站 一块板的故障信息 而且是全网设备 的故障信息
详实性
可以知道当前设备存在的告警是什么时间发生的 以 前曾经发生过什么历史告警 性能不好时 误码 指 针调整有多少
告警 性能分析法
! 通过设备上的指示灯获取告警信息 进行故障定位 一 通过机柜顶部的告警指示灯查看告警 二 通过单板告警指示灯查看告警
环回法
"" “环回法”的步骤 1.环回业务通道采样 2.画业务路径图 3.逐段环回 定位故障站点 4.初步定位单板问题
环回法
一 环回业务通道采 样
1 从多个有故障的站点中选择其中的一个站 点
2 从所选择一个站点的多个有问题的业务通道 中选择其中的一个业务通道 由于自环第一 个VC4通道 可能会影响ECC通信 因此尽 量不要选择第一个VC4通道内的业务