近期IP承载网故障及波分维护经验交流

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

替换法
替换法就是使用一个工作正常的物件去替换一个怀疑工作不正常的物
件,从而达到定位故障 排除故障的目的。
这里的物件,可以是一段尾纤、一块单板、一个法兰盘或一个衰耗器。
R-LOS
排除OTU故障,可 能是尾纤或SDH发 送端故障。
R-LOS
Page 17
责任就是成就
环回法
• 分段环回法(软件环回或硬件环回)定位 故障
1.5 光功率测试
1.6 更换单板
Page 3
软件环回
外环回
â Í · » Ø »
OTU客户侧外环回
OTU ¨· ² Ö ² à
Í » ¿ §² à
OTU波分侧外环回
OTU Í » ¿ §à ²
â Í · » Ø »
¨Ö ² ·² à
Page 4
责任就是成就
软件环回
内环回
Ú Ä · » Ø »
机柜单板指示灯
缺乏告警详细信息。
说明: 某些故障发生时,可能没有明显的告警或性能事件上报,有时甚至查不到任何告 警或性能事件。这种情况下,告警、性能分析法是无能为力的。
Page 15
仪表测试法
• 仪表测试法一般用于排除传输设备外部问题以及与其它设备的对接问题 。 • DWDM系统常用测试仪表有:光功率计、光谱分析仪、SDH测试仪、信 号分析仪等。
Page 31
责任就是成就
误码问题
• 定位技巧
1、判断误码涉及的通道
所有通道出现误码 个别通道出现误码
2、巧用B1字节
A
DWDM 侧
O U O T U
B DWDM 侧
O T U O T U
B1字节检测 T
B1字节检测
客户端
3、替换法
如果系统仅单方向出现误码,而另一方向没有出现误码,建议采用替换法 。 替换的对象可以是光纤,OTU单板或光放大板等等。
1、和网管的光功率数据做比较。
光功率计
O K
MON
2、避免业务中断,一般使用“MON”- 在线检测口,对光功率进行测试。 1、和原始数据做比较。
光谱分析仪
光功率计
光板
2、测试单板“MON”口输出的光谱,可 以直接得到每个通道的信号波长、光功率 和OSNR,并可以分析放大器的增益平坦 度。
Page 16
作方法; 注意单板上跳线、拨码开关的设置; 注意光接口板的输入光功率的范围; 如果单板的拉手条有纤缆,应先移去; 注意拉手条的宽度。
更换前
详细的单板信息可以 从条 形码中获得。
更换中
戴防静电手腕;
防止短路;
正确拔插单板。
避免单板激光对人眼的伤害。
更换后
检查单板是否正常工作, 对于SCC板,要将网管上的配置文件 并在网管上重新下发配置。 备份到SCC板中。
业务中断
• 某日维护人员发现OTM1站点28波业务中断,出现紧急告警。
Page 40
业务中断
• 故障处理步骤 1、此时检查本端LWF单板的性能事件,看是否异常
Page 41
业务中断
2、 查看本端OAU性能是否正常
Page 42
业务中断
3、对端OBU及LWF性能
Page 43
业务中断
• 利用告警性能分析法,分析本端OAU及对断OBU、LWF皆正常,怀疑接入 LWF的光纤故障或LWF单板故障; • 利用测试法测试LWF收端光功率正常,光纤无故障,更换LWF问题解决。
Page 32
责任就是成就
误码问题
• 故障排除分析步骤
–1、排除外部原因如设备温度过高 ,及接地问题 –2、逐一排查设备系统原因
• • • •
通过性能事件来查看光功率和其它指标,比较标称值
光功率大小和平坦度 进行在线测量,可以测试出平坦度、频偏和信噪比 信噪比OSNR 中心波长漂移(频偏) 非线性效应 通过单站信噪比低并不能完全说明问题,最后要通过替换法来解
Page 44
业务中断
• 814站点及816站点多条业务中断,所在OTU 上报R-LOS告警。
Page 45
责任就是成就
业务中断
• 故障分析
– 从告警可知合路信号中断,故障点在813站点的OAU板 – 查看OAU性能事件,可知OAU中PA模块良好,BA模块输入为零,可能电可调 衰减失效导致故障 – 更换OAU故障解决
站点 A
站点 B
站点 C
OTM1
Page 29
OADM
OTM2
责任就是成就
光功率异常
• 故障处理步骤
– – – – 查询NE816-4-LWF接受端光功率为-14.6dBm趋进输入下门限-16dBm。 查询接收端其他OTU光功率都偏低,但没有FEC纠错出现。 可能是合路信号问题,查询收端OAU光功率,发现PA模块输入功率过小,通过测量对比发现 PA前端光纤老化衰减过大导致故障产生。 更换光纤故障解除。
Rx Tx
Í » ¿ §² à
IN OUT
¨· ² Ö ² à
í ¼ È þ » ·» Ø
² ¼ Ó þ » ·» Ø
Rx
Ð Å º Å ½ Ó Ê Õ Ä £ ¿ é
IN OUT
¨· ² Ö ² à
Tx
Í » ¿ §² à
注意:加光衰减器
Page 6
单板复位
复位SCC主控
利用网管系统对SCC板进行软复位; 按下SCC板上的复位按钮,对SCC板进行硬复位; 拔插SCC板,对SCC板进行硬复位。
Page 30
责任就是成就
误码问题
• 故障分析——误码问题是故障处理之中最难 处理的一类
与误码相关的告警和性能事件:
告警:B1_EXC, B2_EXC, B1_SD, 和 B2_SD 告警,BEFFEC_EXC 和 BEFFEC_SD 告警 性能事件:RSBBE, RSES, RSSES, RSUAS 和 RSCSES ,MSBBE, MSES, MSSES, MSUAS,和 MSCSES
• • • • 监控通道和主光信道同时出现R_LOS告警 监控通道业务没有出现R_LOS告警,但主光信道 双向出现R_LOS告警 监控通道业务没有出现R_LOS告警,但主光信道 单向出现R_LOS告警 按照信号流的方向,依次检查各点信号是否有光功率 跳变和瞬断
故障类型
线路原因 设备原因
原因
光纤中断或光纤性能劣化 单板故障或单板上光模块接触不良
复位其它单板
利用网管系统对其它单板进行软复位和硬复位;
拔插单板,对单板进行硬复位。
Page 7
清洁光口及连接器
确认要清洁的光纤与有源器件断开,是完全无光的;
手持光纤连接器 ,用擦纤纸擦拭陶瓷插针的端面 ,慢慢地把擦纤纸向一个;
方向拖过插针端面,该操作可重复2-3次 ; 待插针表面干燥后,利用压缩气体喷射插针表面; 检查连接器端面。
Page 12
基本故障定位原则
先定位外部,后定位内部
先分析高级告警,后分析低级告警 先定位网络,后定位网元
为什么会有故障?
关键:准确地把故障定位到某段光纤或某个单站或某块单板。
Page 13
责任就是成就
第2章 故障定位的基本思路和方法
2.1 告警和性能分析法
2.2 仪表测试法
2.3 替换法 2.4 环回法
责任就是成就
误码问题
• 故障处理
本端及对端光功率皆正常; 长时间在线测试OSNR及波长漂移也正常; 采用逐段环回定位为OTU故障,更换解决。
Page 35
责任就是成就
业务瞬断
• 故障分析及技巧 1、排除波分侧以外的问题,如SDH信号问题。 2、检测设备内部线路是否存在故障。 3、检查设备硬件是否存在故障。
–3、以上方法皆不能排除,考虑逐段环回定位到单板。(环回法)
故障类型
原因
尾纤衰耗过大(弯曲、挤压、绑扎 连接头脏) 尾纤连接错误 线路性能劣化 OTU单板失效或性能劣化 光放大板失效或性能劣化
Page 28
外部原因
设备原因
光功率异常
• 某日维护人员寻检发现OTM2站点NE816网 元4-LWF有大量的FEC纠错事件产生,并且 数量不断累加,相应单板没有告警及误码 上报。
2.5 经验处理法
Page 14
告警性能分析法
• 通过网管查询设备当前或者历史的告警和性能事件。 • 通过设备机柜和单板的运行指示灯、告警指示灯的状态,了解设备当前的 运行状况。
111
优点
全面性 :能够获取全网设备的故障信息 。
缺点
当网管通信阻塞或ECC 不通时无法监控。
网管
准确性:能够获取设备当前告警、历史告警、告 警发 生时间和设备性能事件的具体数值。 操作简单直观。
故障类型
电源故障 外部原因 设备硬件 光功率异常 误码 设备对接
原因
环境异常(温度、湿度) 光纤或接头异常 单板性能劣化或失效 光功率异常导致业务中断 误码过多导致业务中断 DWDM设备和其它设备对接异常
Page 39
提示 设备出现 R_LOS、 R_LOF、 R_OOF等告警 时,说明业务 已经中断
决问题,而且需要观察很长一段时间才能最终确定问题解决。
–3、通过环回定位到硬件单板
误码数量随机变化不恒定,提高发送光功率,查看接收端的误码情况,如果 误码减少,原因是光功率,如果误码没有显著减少,那么就可能是色散。
Page 33
误码问题
• 某日维护人员发现NE812-4-LWF有误码持续 出现。
Page 34
注意:
Page 18
10dB光衰减器
责任就是成就
经验处理法
• 通过网管复位单板 • 硬件拔插单板 • 重新下发配置
建议该处理故障的办法尽量少用,因为该方法不利于故障 原因的彻底查清。
Page 19
第3章 分类故障处理
3.1 故障概述 3.2 光功率异常 3.3 误码问题 3.4 业务瞬断 3.5 业务中断
Page 10
第1章 常用维护操作 第2章 故障定位的基本思路与方法 第3章 分类故障处理
Page 11
对维护人员的基本要求
熟悉波分系统及系统告警的产生原因
熟悉波分系统的基本操作 熟悉一般测试工具的使用 了解所维护局的基本情况(组网拓扑,网络保护,波长分配) 平时做好设备数据的采集和保存 良好的心里素质
Page 24
责任就是成就
故障概述
• OADM站点信号流
Page 25
故障概述
• 东向OTM2站点硬件配置
Page 26
责任就是成就
故障概述
• OTM2信号流
Page 27
光功率异常
• 故障分析
–1、排除设备外部因素如接地、电压等。 –2、可能的内部因素——光功率问题。
• 排查同端接收侧OTU告警及性能事件是否有类似性能上报 • 分离故障原因是合路信号还是单波信号。 • 通过网管查询各检测点光功率。(告警性能分析法、测试法、替换法)
3.6 ECC问题
3.7 其他故障
Page 20
故障概述
• 本章节我们将模拟不同的故障环境,以下系列故障皆采用相同环境, 如图所示:
Page 21
故障概述
• 西向OTM1站点硬件配置:400G系统,使用3波。
Page 22
故障概述
• OTM1信号流
Page 23
故障概述
• 中间OADM站点硬件配置,利用MR2 从东西向各上下1波。
业务瞬断是指信号在传输过程出现了秒级的瞬间信号丢失现象 业务瞬断对话音业务影响不大,但是对数据业务的影响很大
Page 36
业务瞬断
• 某日网管工程师发现设备业务出现瞬断, 对应36波出现R_LOF及R_OOF告警。
Page 37
责任就是成就
业务瞬断
• 故障处理
利用告警性能分析法可知,随着NE816-4-LWF客户接收端RX产生OOF对应对端
第1章 常用维护操作 第2章 故障定位的基本思路与方法 第3章 分类故障处理
Page 1
知识点回顾
链型组网,左边 定义成西向,右 边定义成东向。
西 东
西

西

东 西 东
西
环型组网,逆时针方向 被定义成主环方向。
Page 2
责任就是成就
第1章 常用维护操作
1.1 软件环回
1.2 硬件环回
1.3 单板复位 1.4 清洁光口及连接器
Page 8
光功率测试
OTM OTM ODF IN IN IN IN ODF IN IN IN IN

MUX/ OA DEMUX
FIU
FIU OA
MUX/ OTU DEMUX
光功率计
OUT
MON
测试端口
IN
光功率计 Page 9
光板
光功率计
光板
更换单板
检查单板版本; 熟练掌握”通用注意事项”中的各项操
OTU客户侧内环回
OTU ¨Ö ² ·² à
Í » ¿ §à ²
OTU波分侧内环回
OTU Í » ¿ §² à
Ú Ä · » Ø »
¨· ² Ö ² à
Page 5
责任就是成就
硬件环回
硬件自环是指用一根尾纤(或者实现和尾纤同样功能的通光器件),
将一块单板上的接收和发送光接口连接起来。
Å º Ð Å · ¢ É ä Ä £ ¿ é
NE812-4-LWF产生OOF及误码;
定位为客户侧SDH设备问题或光纤问题; 对端OptiX 10G交叉板问题。
Page 38
责任就是成就
业务中断
• 故障分析 –根据紧急故障处理流程进行操作 –先将业务导到冗余的通道上,在进行分析 –查询各检测点的性能时间及光功率值 –结合测试法、替换法、环回法进行处理
相关文档
最新文档