全光网下流氓光网络单元检测排查探索与实践
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
全光网下流氓光网络单元检测排查探索与实践
吕卫东
【摘要】流氓ONU(光网络单元)引发的大面积故障越来越多,当前没有有效手段进行排查.对流氓ONU检测及排查进行深入分析,形成排查指南,通过IP(网际协议)综
合网管系统固化检测流程,并通过OLT(光线路终端)远程隔离流氓ONU,有效实现流氓ONU引发大面积故障的快速定位和处理.
【期刊名称】《江苏通信》
【年(卷),期】2016(032)002
【总页数】3页(P63-65)
【关键词】流氓;光网络单元;检测;排查
【作者】吕卫东
【作者单位】中国电信有限公司江苏分公司操作维护中心
【正文语种】中文
由于PON(无源光网络)属于时分复用,在上行方向,ONU(光网络单元)根据OLT(光线路终端)分配的时间戳向上行方向发送数据包。
当某个ONU在没有分配时间戳的时候发光的话,就会与其他ONU的发光信号发生冲突。
我们把这种不按照分配的时间戳向上发送光信号的ONU叫流氓ONU(rogue ONU)。
见图1。
上行1 310 nm光波长的所有上行时隙,导致其他ONU无法上传信息和数据流,此时下行还能正常下发指令。
2.2 非长发光流氓ONU
2.1 长发光流氓ONU
任意时刻都在发光的ONU。
当某个ONU长发光,将占用
在非OLT指示的时间段发光,可能是提前发光,或者延迟关断等。
非长发光流氓ONU当前没有有效手段进行排查。
某个ONU在“不该”发光的时候发光,影响其他某个ONU或者所有ONU的正常通信。
如果该ONU已上线,会导致同一PON端口下其他某个ONU或者所有ONU下
线或者频繁上下线。
如果该ONU未配置,会导致其他未配置的ONU无法正常自动发现。
不同场景下流氓ONU典型故障见表1。
流氓ONU案例:设备进水。
【故障现象】某局点的某端口下所有ONU开始反复掉线。
【处理措施及结果】现场分析之后,认为水灾只淹没了部分ONU,不应该导致端口所有ONU反复掉线,怀疑个别ONU因为水浸导致光模块发光异常,成为流氓ONU。
在分光器处逐个排查,发现有1个ONU上行长发光,更换该ONU之后系统业务恢复正常。
流氓ONU案例:ONU生产加工问题。
【故障现象】新ONU在用户装机注册时,接上OLT后,OLT上同一PON端口
下的其他ONU掉线,业务中断,拔掉此ONU后,其他ONU可恢复上线和业务。
【处理措施及结果】定位发现引起此问题的是新安装的ONU是流氓ONU,长发
光导致其他正常的ONU掉线。
分析该ONU,发现其PCB(印制电路板)管脚间焊接短路导致其变成的流氓ONU。
ONU的生产过程中,光模块是手工焊接的,焊接烙铁温度极高,为380℃,若焊接手法不切当,烙铁头有可能刮伤PCB绿油层,并造成管脚间短路,导致长发光型流氓ONU。
5.1 OLT针对流氓ONU的处理过程
5.1.1 检测(check)
检测就是定时对PON端口进行测试,检查是否存在流氓ONU。
检测过程不影响ONU的业务转发,但是也无法确定具体哪个ONU是流氓ONU。
5.1.2 排查(detect)
排查过程就是确定具体哪个ONU是流氓ONU的过程。
排查过程是会影响ONU 的正常业务转发的。
5.1.3 隔离(isolate)
隔离对流氓ONU下发指令〔PLOAM(物理层操作管理维护)或OAM(操作管理维护)消息〕,关闭ONU光模块的发送电源,消除流氓ONU对PON端口下其他ONU的影响。
5.2 流氓ONU的检测原理
1)通过系统稳定的有光检测机制,见图2,如果检测到有长发光的ONU,则说明存在流氓ONU。
华为OLT发出告警:0x2e314021 端口下存在非法入侵的流氓ONU。
2)当发现PON端口下存在长发光的流氓ONU后,需排查哪个ONU是流氓ONU。
华为OLT发出告警:0x2e314022 ONU是流氓ONU。
流氓ONU的排查原理如图3所示。
5.3 华为OLT流氓ONU处理相关命令
xpon anti-rogueONU autodetect switch:config模式命令,用于设置是否自动隔离检测到的流氓ONU。
打开开关时,系统自动隔离检测到的流氓ONU,处
于隔离状态的流氓ONU只能接收信息,不能发送。
anti-rogueONU manual-check portid :单板模式命令,用于手动检测指定PON端口下的流氓ONU。
缺省情况下,系统会定时会检测设备上是否有流氓ONU。
当需要即时检测流氓ONU时,使用此命令。
执行成功后,使用display port state命令查询检测结果。
anti-rogueONU manual-detect portid :单板模式命令,用于手动排查和隔离指定PON端口下的流氓ONU。
anti-rogueONU isolate frameid/slotid/portid [ONUid ] (undo anti-rogueONU isolate frameid/slotid/portid [ONUid ] ):diagnose模式命令,用于设置使能、去使能ONU的隔离状态。
display rogueONU { frameid { [ slotid { [ portid | all ] } | all ] } | all }:config 模式命令,用于查询系统、PON单板、或某个PON端口下的流氓ONU列表。
6.1 系统支持的OLT的流氓ONU检测功能
6.1.1 自动排查
使用anti-rogueONU autodetect命令开启长发光流氓ONU自动排查功能。
当长发光流氓ONU自动排查功能开关开启时,会对长发光流氓ONU进行检测、排查和隔离;当长发光流氓ONU自动排查功能开关关闭时,仅会对长发光流氓ONU进行检测,不会进行排查和隔离。
由于排查过程中会中断该PON端口下的所有ONU的业务,所以一般不建议打开系统的自动排查功能,建议使用系统缺省值“off”,即关闭流氓ONU自动排查开关。
6.1.2 手动排查
使用anti-rogueONU manual-detect命令对某个端口下的长发光流氓ONU进行一次性手动检测、排查和隔离。
6.2 流氓ONU手动排查指南(推荐方式)
1)如果系统中一个ONU已上线,同一PON端口下其他ONU下线或者频繁上下线,或者在OLT上产生0x2e314021 端口下存在非法入侵的流氓ONU告警,或使用display port state命令表明系统中可能存在流氓ONU,请根据下面步骤进行排查。
2)使用anti-rogueONU manual-detect命令,对长发光流氓ONU进行一次性手动检测、排查和隔离。
检查系统是否产生0x2e314022 ONU是流氓ONU或0x2e314021 端口下存在非法入侵的流氓ONU告警。
如果是,表明该PON端口下可能存在长发光流氓ONU,否则表明该PON端口下可能存在非长发光流氓ONU。
3)请根据产生的告警进行处理。
0x2e314022 ONU是流氓ONU,需要更换ONU。
0x2e314021 端口下存在非法入侵的流氓ONU。
4)使用ONU reset或者ONU deactivate命令对PON端口下ONU逐个进行复位或者去激活操作。
检查其他故障的ONU是否正常上线。
如果是,表明该ONU为流氓ONU,需要更换ONU;否则可能由于光模块损坏导致无法使用命令复位或者去激活流氓ONU。
5)对流氓ONU进行手工排查。
在分光器处,逐个拔出ONU的上行光纤,检查其他故障的ONU是否正常上线。
如果是,表明该ONU为流氓ONU,需要更换ONU。
6.3 流氓ONU自动排查指南(不推荐)
由于流氓ONU自动排查过程中会中断该PON端口下的所有ONU的业务,所以一般不建议打开系统的自动排查功能,建议使用系统缺省值“off”。
当收到流氓ONU告警时,请根据产生的告警进行处理。
0x2e314022 ONU是流氓ONU,需要更换ONU。
0x2e314021 端口下存在非法入侵的流氓ONU。
使用ONU reset或者ONU deactivate命令对PON端口下ONU逐个进行复位或者去激活操作。
检查其他故障的ONU是否正常上线。
如果是,表明该ONU为流氓ONU,需要更换ONU;否则可能由于光模块损坏导致无法使用命令复位或者去激活流氓ONU。
对流氓ONU进行手工排查。
在分光器处,逐个拔出ONU 的上行光纤,检查其他故障的ONU是否正常上线。
如果是,表明该ONU为流氓ONU,需要更换ONU。
检测到同一PON端口下一个ONU已上线其他ONU下线或者频繁上下线,或者在OLT上产生非法入侵的流氓ONU告警,参照上述流氓ONU手动排查流程启动排查,并通过OLT远程隔离流氓ONU,有效实现流氓ONU引发大面积故障的快速定位和处理。