光传输设备误码问题分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
光传输设备误码问题分析
[提要]误码问题是传输设备维护中经常碰到的问题。本文首先介绍一些光传输设备误码检测原理,以及误码产生的原因等原理知识,然后结合案例讲述光传输设备误码问题的处理思路和方法。
关键词:SDH;光传输;误码检测;误码处理
一、误码机理
(一)误码检测。SDH光传输系统对误码的检测,是以“块”为单位的,所谓“块”,是指一系列与通道有关的连续比特。当同一块内的任意比特发生差错时,就称该块为误码块。
SDH光传输设备中按分段分层的思想对误码进行全面系统的检测。具体有再生段误码B1、复用段误码B2、高阶通道误码B3、低阶通道误码V5。它们之间的关系可以用图1表示。(图1)图1中,RST、MST、HPT、LPT分别表示再生段终端、复用段终端、高阶通道终端和低阶通道终端;B1、B2、B3以及V5误码分别在这些终端间进行监测。由图1可以看出,如果只是低阶通道有误码,则高阶通道、复用段和再生段将监测不到该误码;如果再生段有误码,则将导致复用段、高阶通道、低阶通道出现误码。所以,一般来说,有高阶误码则会有低阶误码。例如,如果有B1误码,一般就会有B2、B3和V5误码;反之,有低阶误码则不一定有高阶误码。如有V5误码,则不一定会有B3、B2和B1误码。
由于高阶误码会导致低阶误码,因此在处理误码问题时,我们应按照先处理高阶误码后处理低阶误码的顺序来进行处理。
(二)误码相关的性能和告警事件。光传输系统本端检测到误码时,除本端上报误码性能或告警事件外,本端还将误码检测情况通过开销字节通知对端。根据本端和对端上报的这些性能和告警事件,可以方便地定位是哪一段通道或哪一个方向出现误码。表1给出了与误码相关的性能和告警事件列表。(表1)
二、误码问题常见原因
误码产生的原因很多,但归结起来有两大类,外部原因和设备原因。
(一)外部原因。(1)光纤性能劣化、损耗过高。接收光功率低于接收灵敏度;(2)传输距离过短、未加衰减器,导致接受光功率过载;(3)光纤接头不清洁或连接不正确;(4)设备附近有强烈干扰源;(5)设备接地不好;(6)设备散热不良、工作温度过高。
(二)设备原因。(1)线路板接收侧信号衰减过大、对端发送电路故障、本端接收电路故障;(2)时钟同步性能不好;(3)交叉板与线路板、支路板配合不
好;(4)支路板故障;(5)风扇故障,导致设备散热不良。
三、误码问题处理方法
(一)常用方法。对于误码问题的处理,常用的方法是先分析、二环回、三替换等,重点是告警性能分析法。
1、告警性能分析法。处理误码问题时,通过对表1列出的误码性能、告警事件仔细分析,定位出故障点,再通过环回或替换法进行验证和排除故障。分析内容包括:性能/告警事件的名称:通过网管查询BBE、FEBBE、指针调整性能事件,REI、B1OVER、B2OVER、B3OVER、BIP-EXC、SD、SF等告警事件,告警/性能信息之间是否存在对告关系。产生性能/告警时间的网元/单板/通道:检查告警/性能事件发生在哪些网元、哪些单板、哪些通道上,最好能给出受误码影响的业务通道路径图,尤其是那些运行质量极不稳定(出现过业务中断现象)的业务通道业务路径图。性能/告警事件发生的时间:对网管上报的性能/告警事件,要查询是何时上报的,尤其是对由于瞬间误码过大而引起的业务瞬断,要查询告警/性能事件的产生时间,由于北方凌晨、午夜、中午、傍晚这4个时间点是气温变化比较大的时间点,对于架空或裸露的光纤影响比较大,如果光纤质量不好或敷设不好,在光纤的接头处,受气温变化影响比较大,会发生短暂的突发性大误码,导致有规律性的业务瞬断。性能/告警事件发生的频度:通过查询15分钟和24小时的寄存器,可以看出性能/告警事件发生的频度,是否有大致规律,这样也有利于下一步的故障处理操作。如果是大误码频繁出现,导致业务不可用,将不得不采取紧急措施进行环回、倒换、换板处理。如果是偶发性大误码,则需要摸清规律,在大误码出现时才能进行相关故障的定位处理。
2、逐段环回法。由于环回法尤其是对VC4和STM-N接口进行环回,会造成VC4和STM-N通道内其他业务的中断,一般比较少用。但若条件允许,可使用环回法快速定位出故障站点。但环回的时间不能太长,以免造成通道内其他正常业务长时间中断。在出现误码过量导致业务中断情况时,可以对出现误码过量的单板通道进行环回,如果本端做外环回后误码数量有明显变化,则可以认为本站或后续站点的单板存在问题。如果故障已经定位到单站后,可以进一步进行光板、支路板或交叉板环回,定位出故障单板。由于环回法对正常业务有影响,因此此种方法慎用。
3、替换法。对于设备器件性能不良或性能劣化的情况,替换法通常都是故障定位的好方法。通过单板对调、光纤对调、交叉板主备倒换或网络保护倒换,查看误码是否发生变化,进而定位和排除故障。替换的对象可以是一段光纤、一个设备、一块单板、一个业务通道或一个光器件等。替换法适用于排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等;或故障定位到单站后,用于排除单站内单板、通道、模块或纤芯的问题。
4、经验处理法。在一些特殊的情况下,通过复位单板、掉电重启等手段可有效排除故障、恢复业务。但因为该方法不利于故障原因的彻底查清,所以除非情况紧急,一般尽量少用。
(二)处理步骤
第一步:首先排除外部的故障因素,如接地不好、工作温度过高、线路板接收光功率过低或过高等问题。
第二步:分析线路板误码性能事件,排除线路误码。
观察线路板误码情况,若某站所有线路板都有误码,则可能是该站时钟板问题,更换时钟板;若只是某块线路板报误码,则可能是本站线路板问题,也可能是对端站或光纤的问题。若定位出是单板的故障,可通过更换相应单板解决;若定位出是光纤的故障,可通过更换相应单板光纤解决。