SDH设备故障定位之告警和性能分析法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SDH设备故障定位之告警和性能分析法

告警和性能分析法是SDH设备定位故障的方法之一。

SDH信号的帧结构里定义了丰富的、包含系统告警和性能信息的开销字节。因此,当SDH系统发生故障时,一般会伴随有大量的告警和性能事件信息,通过对这些信息的分析,可大概判断出所发生故障的类型和位置。

获取告警和性能事件信息的方式有以下两种:

∙通过网管查询传输系统当前或历史发生的告警和性能事件数据。

∙通过设备机柜和单板的运行灯、告警灯的状态,了解设备当前的运行状况。

通过网管获取告警信息,进行故障定位

通过网管获取故障信息,定位故障的特点是:

∙全面:能够获取全网设备的故障信息。

∙准确:能够获取设备当前存在哪些告警、告警发生时间,以及设备的历史告警;能够获取设备性能事件的具体数值。

∙如果告警和性能事件太多,可能会面临无从着手分析的困难。

∙完全依赖于计算机、软件、通信三者的正常工作,一旦以上三者之一出问题,通过该途径获取故障信息的能力将大大降低,甚至于完全失去。

下面通过举例,对告警和性能数据分析法给予说明。

在如图1所示的链形组网中,网管计算机设在NE1站。

图1 链形组网图

故障现象:NE1站和NE4站间的E1业务中断,从NE1站无法登录NE4站,且NE3站东向光板有MS_RDI告警和HP_RDI告警,NE1站与NE4站间的业务所对应的E1通道有LP_RDI告警。

分析判断:通过分析告警,可知NE4站没有正确接收到NE3站发出的信号,而NE3站能正确接收到NE4站发出的信号。可能的故障原因包括:

∙NE3站东向光板发送信号有问题。

∙光缆线路问题(包括光纤和光纤接头)。

∙NE4站光板的接收信号问题。

故障定位:借助于网管软件,可以通过修改业务配置、人工插入告警等方法,对故障进行定位。例如,若我们怀疑图1中NE2站与NE3站间光纤接反(即NE2站的东向光接口板误接NE3站的东向光接口板),则可以通过网管在NE2站东向光接口板人工插入HP_RDI,然后通过网管观察NE3站告警上报情况:

∙若是西向光接口板上报HP_RDI告警,则说明NE2站的东向发送端接的是NE3站的西向接收端,光纤连接正确。

∙若是NE3站的东向光接口板上报了HP_RDI告警,则说明NE2站东向发送端接到了NE3站的东向接收端,光纤接反,需要纠正。

注意:

通过网管获取告警或性能信息时,应注意保证网络中各网元当前时间与网管时间同步,倘若网元当前时间与网管时间不同步,将会导致告警、性能信息上报错误。在维护过程中,对某网元重下配置后,应特别注意将该网元的网元当前时间与网管时间同步,否则网元会工作在缺省时间里,而缺省时间并不是当前时间。

通过设备上的指示灯获取告警信息,进行故障定位

OptiX设备上有不同颜色的运行和告警指示灯,这些指示灯的状态,反映出设备当前的运行状况或存在告警的级别。

指示灯的状态及含义参见本产品的《硬件描述》。

两种获取故障信息途径的比较

从上面的介绍可以看出,通过网管与通过观察设备指示灯这两个途径获取设备故障信息,各有其优点。因此,在实际的故障定位过程中,这两种手段要结合起来使用。

排除故障时,需要网管中心的维护人员与各站的设备维护人员共同参与,一般由网管中心的维护人员协调指挥,各站的设备维护人员密切配合,统一行动。

两种途径的比较如表1所示。

告警和性能分析法的局限性

∙在组网、业务以及故障信息比较复杂的情况下,伴随故障的发生,可能会产生大量的告警和性能事件;由于告警和性能事件太多,使得维护人员无从着手分析。

∙某些故障发生时,可能没有明显的告警或性能事件上报,有时甚至查不到任何告警或性能事件。这种情况下,告警、性能分析法是无能为力的。

相关文档
最新文档