OptiX OSN1500设备对接故障定位与排除
OptiX OSN1500以太网故障定位与排除
OptiX OSN1500以太网故障定位与排除一.检查是否存在SDH故障处理以太网故障时,首先要排除SDH故障。
1.背景信息处理以太网故障时,首先要在T2000上查询告警,并要覆盖到SDH侧和以太网侧。
如果是SDH侧告警,按SDH 故障进行处理。
2.操作步骤1)在T2000主视图的网元图标上单击右键,选择“当前告警浏览”。
查看是否有导致业务中断或劣化的告警。
2)判断告警类型,如果是SDH侧告警,进行SDH故障处理操作。
二.判断是否存在异常性能事件处理以太网故障时,在T2000中进行RMON性能分析,可知业务是否异常。
1.操作步骤1)在网元图标上单击右键,选择“网元管理器”。
2)选中以太网单板,在“功能树”中选择“性能 > RMON性能”。
3)点击“告警组”,单击“查询”,弹出“操作结果”的对话框,单击“关闭”。
4)查看告警名称。
如果出现的告警名称较多,需要重点关注以下几个:1)如果有“FCSErrors”的告警名称,说明CRC校验错。
2)首先检查端口工作模式是否匹配,不能一端为全双工,一端为半双工。
3)其次是网线质量是否较差。
4)最后可定位为网口是否存在硬件故障。
如果有“AlignmentErrors”的告警名称,说明对齐错误。
1)首先检查是否存在业务碰撞的现象,如果端口的实际工作模式是半双工,建议全部调整到全双工模式。
2)检查对端设备是否故障,如果存在故障,建议更换故障的部件。
如果有“DropEvent”的告警名称,说明硬件异常导致丢包。
1)先硬复位单板。
2)如果丢包现象持续,则更换单板。
三.检查最大传输包长MTU是否过小如果单板设置的MTU值小于设备的实际传输包长,将导致业务劣化。
1.操作步骤1)通过仪表测试查出网络最大的MTU。
2)如果单板设置的MTU比测试的值要小,重新设置单板上的MTU。
四.检查是否存在丢包现象通过PING测试,检查业务是否存在丢包现象。
1.操作步骤1)在T2000上配置一条以太网业务。
OptiX OSN1500复用段保护倒换故障原因及定位方法
OptiX OSN1500复用段保护倒换故障原因及定位方法一.常见故障原因保护倒换故障的发生原因,可以是外部原因、数据配置或者设备原因。
保护倒换故障,是指在全网正常状态下突然发生不明原因的倒换,或者在应该发生保护倒换时,全网未进入保护倒换状态,或进入保护倒换后,全网或部分业务发生中断的情况。
复用段保护倒换的常见故障现象是如表1所示,可分为外部原因、数据配置原因以及设备故障原因三大类。
复用段保护倒换故障可能是其中的某一故障引起的,也可能是由于其中某些故障共同引起的。
所以要根据具体的情况,采用基本的故障定位方法逐个分析。
表1 复用段保护倒换故障的常见原因故障类别故障原因外部原因光纤连接错误倒换协议异常人为插入了R_LOS、MS_AIS告警数据配置全网业务配置不正确复用段参数配置不正确设备原因线路板故障交叉板故障母板故障二.常用定位方法复用段保护倒换故障常用两种方法定位:环回法;配置数据分析法三.故障定位步骤复用段故障定位需要遵循一定的流程进行。
复用段故障定位流程如图1所示。
图1复用段故障定位流程1.检查复用段参数、状态对复用段保护环,业务异常时应先检查各个节点的复用段状态是否正常;并检查线路质量、确认引起复用段倒换的原因。
对复用段保护环,日常维护时应注意检查环上各个网元的节点参数设置是否正确,协议是否已启动,各个网元的协议状态是否为正常状态。
2.按照链型网,逐段环回定位故障如果APS协议的状态正常,但业务仍然不通,可以通过分析业务中断时的业务流向,将复用段环当作一条链来进行故障定位。
这种方法定位故障起来比较简单,可以迅速定位出故障点。
将复用段环当作一条链之后,可以用逐段环回的方法来定位故障。
这里逐段环回时APS协议仍保持启动状态,逐段环回的手段和前面讲述的有所区别:因为倒换发生后业务可能不但要经过主用通道,还要经过备用通道,因此我们环回的VC-4可能既有主用通道的VC-4,也有备用通道的VC-4,视业务经过的路径而定。
OptiX OSN1500业务中断故障原因及处理方法
OptiX OSN1500业务中断故障原因及定位方法导致故障的常见原因包括外部原因、数据配置、设备硬件、误码、指针调整、设备对接和保护倒换等。
表1业务中断问题的常见原因故障类别故障原因外部原因电源异常光纤、电缆、接头异常交换或其它接入设备异常环境(温度、湿度)异常接地异常、雷击数据配置配置错误误操作运行过程中的软件问题设备硬件单板失效或性能劣化误码误码过多导致业务中断指针调整指针调整过大导致业务中断设备对接对接设备失配或设置不正确导致业务不通保护倒换保护倒换功能异常导致业务中断一.常用定位方法OptiX OSN设备常用的故障定位方法有告警分析法、逐段环回法和替换法。
告警分析法发生业务中断故障时,设备通常会有告警指示。
通过分析这些告警,可以将故障定位到较细、较准确的程度。
逐段环回法如果通过观察告警事件一时无法定位故障点时,则可使用环回法进行处理。
替换法二.故障定位步骤业务中断类故障处理步骤如下。
业务中断的故障点定位过程,见图1所示。
图1 业务中断故障处理流程1.检查有无设备告警发生业务中断故障时,首先检查是否有以下设备告警:POWER_FAIL(电源故障);FAN_FAIL(风扇故障) ;BD_STATUS (单板不在位);NO_BD_SOFT(单板无软件)这些告警指示设备或单板有故障,应当首先排除这些故障。
2.检查保护倒换是否正常对于保护组网,应检查业务中断是否由于保护倒换失败引起的。
保护倒换失败的故障现象通常表现为:1)SNCP保护组网,在业务中断的站点,无SNCP倒换性能事件上报。
2)复用段保护组网,有任一网元没有上报PS告警,或有任一网元上报了APS_FAIL告警。
3.检查各站登录是否正常若某站登录不上,且该站相邻站点的线路上有R_LOS等紧急告警,则可能是该站电源故障或与该站相连的光纤或线路板故障。
4.其它故障原因的定位对于无配置错误,无R_LOS、R_LOF、TU_AIS等告警,有误码或指针调整的业务中断故障,请参考本手册的第5章、第6章内容来定位、排除故障。
第8章 设备对接故障处理
设备在进行线路对接时,如果对接设备的开销字节J1、C2设置不一致,将有HP_TIM(高阶通道追踪字节失配)、HP_SLM(信号标记失配)告警;在产生HP_TIM或HP_SLM时,如果设备下插AIS告警,将导致业务中断,对接失败。
在缺省情况下,OptiX OSN 3500/2500/1500设备的线路板检测到接收的J1、C2字节和其应收值不一致时,一般不会下插AIS。即HP_TIM、HP_SLM告警不影响业务,可以在网管上将告警屏蔽。消除HP_TIM、HP_SLM告警需要统一设置双方设备的J1、C2字节。
如果屏蔽层接地不好,会由于两个地(BGND、PGND)之间存在电位差和交流干扰,影响信号对接时的波形,导致对接不成功。
4. 120端口的接地
对于120平衡端口的2M业务,因为是差分方式传送(采用双绞线进行传输),一般不会存在因为接地原因而导致对接不成功的情况。
8.1.2高阶通道开销C2、J1
与设备对接有关的高阶通道开销主要是C2和J1。
2. DDF接地
当传输设备通过数字配线架(DDF)和其他设备相连时,请检查数字配线架是否已接保护地(PGND)。
3. 75同轴端口的接地
75非平衡式同轴端口的外导体(即屏蔽层)常规的接地方法是发端连接PGND,收端连接PGND或悬空。可用万用表测试同轴端口的屏蔽层与设备PGND之间的电压,就可以大致判断出同轴端口屏蔽层的接地方式。
串行口的定义如表8-3所示。
表8-3接口引脚分配
前视图
端子号
信号
描述
1
RS-422T+
RS-422发送数据差分正端
2
RS-422T-
RS-422发送数据差分负端
OSN1500对端设备端口丢包处理方法
OSN1500对端设备端口丢包处理方法OSN1500对端设备端口丢包导致以太网端口业务中断的可能原因如下:对应现象1:对接设备端口业务中断,且在自协商的一端上报Link_ERR。
原因1:两端端口工作模式不一致。
查询对接端口的工作模式。
如果两端工作模式不一致,则重新设置两端端口工作模式为自协商模式。
保持对接设备两端端口工作模式一致。
原因2:光纤连接错误或断纤。
检查光纤连接是否正确,如果连接错误,则重新正确连接光纤。
如果断纤,则更换新的光纤。
原因3:光模块硬件故障。
检查光模块硬件是否发生故障。
如果光模块硬件故障,则更换新的光模块。
对应现象2:华为OSN1500本端或对端设备的线路侧存在R_LOS告警。
原因1:线路侧故障。
查询两端设备告警。
如果本端或对端设备的线路上存在R_LOS告警,则该段线路故障。
重新正确连接光纤,更换光模块和光纤。
查看业务是否恢复正常,若未恢复,转其他原因。
本端或对端设备的线路上不存在R_LOS告警,转其他原因。
对应现象3:华为OSN1500设备网管无任何告警上报,与对接设备进行Ping 操作时有丢包现象。
原因1:对接设备故障。
(1)在本端站和对端站配置EPL业务,查看进行ping操作时是否有丢包现象。
如果有丢包现象,则继续下一步,如果无丢包现象,则转其他原因。
(2)断开本端站与对端站之间的连接,建立本端站到第三方站点的连接,并配置EPL业务。
重新进行ping操作,如果此时无丢包现象,则判断对端站的计算机感染病毒。
如果此时仍有丢包现象,则判断本端站的计算机感染病毒。
(3)更换感染病毒的计算机后,重新建立本端站与对端站的连接,查看是否还有Link_ERR告警上报。
如果仍然上报Link_ERR告警,则进行相应处理。
(4)检查现场连接的设备,发现接入站点的交换机下游设备有异常。
更换交换机的下游设备,查看业务是否恢复正常。
如果恢复正常,则故障处理结束。
OptiX OSN1500复用段保护倒换故障定位与排除
OptiX OSN1500复用段保护倒换故障定位与排除一.检查并分析外部原因在处理故障时,首先应该检查设备外部的情况。
1)是否人为停止了APS协议,错误设置了强制倒换,人为插入了MS_AIS、MS_RDI告警。
2)是否供电系统出现了问题,如电源故障,蓄电池故障等。
在排除外部原因后,如果故障仍然存在,可采用其他方法进行故障定位。
二.检查APS协议和复用段参数在排除了外部原因后,如果故障仍然存在,需要检查APS协议和复用段参数。
1.保护倒换协议正常启动,但保护倒换不成功检查复用段协议是判断故障时必须进行的步骤。
通过网管对各个网元的当前的状态进行查询,若整个网络中有两个相邻网元的状态为“倒换态”(S),而其他网元均为“穿通态”(P),则说明APS协议正常启动。
若各网元的状态正确,APS正常启动,但业务仍然中断,首先可以考虑通过网管重新启动协议;如果重新启停协议后,业务仍然中断,则须考虑是否是单板存在问题,这时可以按一般的业务中断故障进行处理。
2.保护倒换协议异常,保护倒换不成功APS协议异常通常有两种现象:APS协议不能正常启动/停止;部分/全部网元的站点状态异常。
APS协议异常,会引起K字节的穿通和上报出现问题,从而导致保护倒换不成功。
此时可以先检查各网元的复用段参数是否配置正确,是否有的网元的复用段参数丢失;如果参数设置没有异常,可以检查光板和交叉板是否工作正常。
参数设置时需要注意:逆时针方向、主环方向逆时针方向为主环方向。
将网元上相邻光板的左边板位称为西向,右边板位称为东向。
逆时针组环要求环上各节点的东向板位光板与下游站西向板位的光板相连,西向板位的光板与上游站网元东向板位的光板相连。
复用段环的数据设定复用段参数包括:复用段节点号、等待恢复时间。
复用段参数设置必须准确,否则可能导致复用段倒换失败。
复用段节点号环上复用段节点号,节点号小于16。
建议从“0”开始,按主环方向逐站递增。
等待恢复时间一般设置为600秒。
OSN1500单板光功率异常解决方法
OSN1500单板光功率异常解决方法
若OSN1500业务板的光功率发生异常将导致误码产生和帧丢失,还可能导致业务中断。
其产生的可能原因及处理方法如下:
现象1:收发光的光功率值异常。
原因:华为OSN1500设备硬件故障。
处理方法:检查光纤是否发生故障。
如果光纤故障,更换故障光纤,查看收发光的光功率值是否恢复正常。
检查可插拔光模块是否发生故障。
如果可插拔光模块故障,更换故障光模块,查看收发光的光功率值是否恢复正常。
如果恢复正常,则故障处理结束。
检查光衰是否发生故障。
如果光衰故障,更换光衰,查看收发光的光功率值是否恢复正常。
检查华为OSN1500设备单板是否发生故障。
如果单板故障,硬复位或直接插拔故障单板,查看单板是否正常开工,若未开工,请选取单板参数与故障单板完全相同的备板,更换单板。
若正常开工,则故障处理结束。
对应现象2:无法通过华为OSN1500设备网管查询单板的光功率信息,也不能查询单板制造信息中的光模块参数信息,且无相关告警和性能事件上报。
原因1:光模块问题导致无法查询性能。
更换光模块,再次查看是否可以通过华为OSN500设备网管查询单板的光功率信息,且光功率值是否在正常范围内。
如果可以通过网管查询单板的光功率信息,且光功率值在正常范围内,SDH设备故障处理结束。
现象3:单板激光器开、关操作失败。
原因:版本不配套。
处理方法:升级单板软件,保证单板软件与主机软件版本匹配。
查看单板激光器开、关操作是否恢复正常,如果仍然操作失败,转其他原因。
OptiX OSN1500时钟保护倒换故障定位与排除
OptiX OSN1500时钟保护倒换故障定位与排除一.检查全网的光纤连接关系
当时钟保护失败时,应检查全网中各个网元的光纤连接关系是否正确,是否与时钟源的设置相匹配
二.分析网元时钟优先级
当时钟保护失败时,需要检查全网中各个网元的时钟优先级配置是否正确。
由于时钟保护倒换涉及到全网时钟配置方式,因此在进行故障分析时,应结合时钟倒换协议,分析各个网元的时钟跟踪方式是否正确,是否出现由于优先级配置错误,导致网元时钟跟踪混乱
三.查询时钟子网的设置
当时钟保护失败时,在网管上,需要进一步查询相关网元的时钟保护倒换协议是否予以正常启动。
由于各个网元的时钟参数设置正确,并不能保证时钟保护子网正常工作。
需要在网管上,查询各个网元是否已经正确添加到相应的时钟保护子网中,此时网元的时钟保护倒换协议才启动。
并且,由于只有在时钟保护协议启动后,网元才可依靠接收到的S1字节信息来判断时钟的质量。
四.查询外接时钟源时钟信号是否正常输出
当时钟保护失败时,有时需要查询外接时钟源时钟信号是否正常输出。
首先,确认外接时钟源输出的时钟信号质量和SSM信息的时隙位置。
其次,判断相应的外接时钟是否携带有SSMB信息,因为只有配置有SSMB信息的时钟源,设备才能够提取相应的时钟信息。
然后,确认相应的“sa”字节是否设置正确,设备是否能够通过相应的字节提取出相应的时钟。
五.排除故障
按照不同的故障原因,制订相应的故障解决方案,即可排除故障。
OptiX OSN1500故障定位的基本原则与常用方法
OptiX OSN1500故障定位的基本原则与常用方法一.故障定位的基本原则故障定位时要遵循定位的基本原则。
1.故障定位关键是:将故障点准确地定位到单站。
2.故障定位的一般原则可总结为四句话:先外部,后传输;先网络,后网元;先高速,后低速;先高级,后低级。
1)先定位外部,后定位传输。
在定位故障时,应先排除外部的可能因素,如光纤断,对接设备故障或电源问题等。
2)先定位网络,后定位网元。
在定位故障时,要尽可能准确地定位出是哪个站的问题。
3)先高速部分,后低速部分。
从告警信号流中可以看出,高速信号的告警常常会引起低速信号的告警,因此在故障定位时,应先排除高速部分的故障。
4)先分析高级别告警,后分析低级别告警。
在分析告警时,应首先分析高级别的告警,如紧急告警、主要告警,然后再分析低级别的告警,如次要告警和提示告警。
二.故障判断与定位的常用方法故障定位的常用方法可简单地总结为:一分析,二环回,三换板。
当故障发生时,首先通过对告警、性能事件、业务流向的分析,初步判断故障点范围。
然后,通过逐段环回,排除外部故障或将故障定位到单个网元,以至单板。
最后,更换引起故障的单板,排除故障。
对于较复杂的故障,需要综合使用表1所示的方法进行故障定位和处理。
表1复杂故障的定位和处理常用方法适用范围操作特点告警、性能分析法通用把握全网信息;初步定位故障点;不影响正常业务;依赖于网管环回法分离外部故障,将故障定位到单站、单板不依赖于告警、性能事件的分析;快捷有效替换法将故障定位到单板,或分离外部故障简单;对备件有需求;需要与其它方法同时使用配置数据分析法将故障定位到单站或单板可查清故障原因;定位时间长;依赖于网管更改配置法将故障定位到单板风险高;依赖于网管仪表测试法分离外部故障,解决对接问题通用,具有说服力,准确度高;对仪表有需求;需要与其它方法同时使用经验处理法特殊情况处理快速;易误判;需经验积累。
OptiX OSN1500指针调整故障原因及定位方法
OptiX OSN1500指针调整故障原因及定位方法指针调整的常见故障包括三大类:外部原因、设备原因和数据配置错误。
指针调整的常见故障原因主要如表1所示,可分为外部原因、数据配置原因以及设备故障原因三大类。
指针调整可能是其中的某一故障引起的,也可能是由于其中某些故障共同引起的。
所以要根据具体的情况,采用相应的故障定位方法逐个分析。
表1指针调整的常见原因故障类别故障原因外部原因外部时钟性能劣化(如BITS等设备提供的外时钟)光纤接反,造成两个网元间时钟互跟。
外部温度过高/低(如风扇长期未清扫或风扇故障或机房空调故障)。
时钟网规划不合理(如时钟跟踪链路过长)。
数据配置同一个SDH组网中配置了多个独立的时钟源。
时钟源级别配置错误,出现两个网元间时钟互跟的情况。
未正确启用SSM(Synchronization Status Marker)保护功能(应该启用的没有启用、启用的没有正确设置)。
设备原因时钟板失效或性能劣化。
线路板失效或性能劣化。
交叉板失效或性能劣化。
一.常用定位方法介绍定位指针调整原因的常用方法。
定位指针调整原因的常用方法包括:告警、性能分析法;更改配置法;替换法二.故障定位步骤介绍定位指针调整原因的标准流程。
导致指针调整的根本原因就是时钟不同步,所以应当主要围绕时钟方面的问题进行故障定位。
故障的定位原则是:根据业务方向、时钟跟踪方向、指针调测检测上报的位置、指针调整产生的位置定位故障点。
指针调整故障定位流程如图1所示。
图1 指针调整故障处理流程图注1:第1站是指沿时钟跟踪方向,在与时钟方向相同的业务方向上,第一个上报指针调整的站。
注2:第1站没有AU指针调整,即只有TU指针调整。
此时要处理的是TU指针调整问题。
检查并分析告警在故障处理过程中一般遵循优先处理其它告警,因为指针调整有可能是伴随SYN_BAD、LTI、SYNC_C_LOS、EXT_SYN_LOS等与时钟有关的告警产生的,当告警处理后指针调整一般也会消失。
OptiXOSN1500故障应急处理流程
OptiXOSN1500故障应急处理流程OptiX OSN1500故障应急处理流程在中断业务时,需要采取应急措施进行处理。
系统应急处理流程是指设备在出现业务中断情况下的故障处理过程。
在此过程中,除了遵照故障处理流程外,还应尽可能采取其它的应急措施(如提供备用电路),减少业务中断时长。
在故障处理前,要进行业务调离。
就是通过网管配置,将故障路由的业务倒换到可用路由中。
一流程图通过流程图对OptiX OSN设备的应急处理过程进行说明。
图1应急处理流程图二.流程说明1.检查设备告警发生业务中断故障时,首先检查设备是否存在如表1所示的告警,应先排除告警指示的设备或单板故障。
表1 OptiX OSN设备故障告警说明告警名称告警说明操作POWER_FAIL 电源故障检查电源盒或外部电源FAN_FAIL 风扇故障导会致设备温度高,影响正常运行检查风扇开关是否开启;或更换风扇BD_STATUS 单板不在位更换单板或主控板NO_BD_SOFT 单板无软件更换单板HARD_BAD 单板硬件故障更换单板W_R_FAIL 单板硬件故障更换单板NESTATE_INSTALL 网元进入安装态重新下发配置SYN_BAD 时钟同步源劣化更换本站或其它站时钟板启动主备倒换更换外时钟源注意:1)重启、交换或更换单板,重新下发配置可能造成业务中断,尽可能减少业务中断的时间,不要在操作过程中扩大故障。
2)更换主控板后,重新下发网元的配置。
2.检查保护倒换保护倒换故障包括网络级保护倒换(如通道保护、SNCP保护或复用段保护等)故障和设备级保护倒换(如交叉、时钟主备倒换或TPS倒换)故障。
对于网络级保护的网络,应先检查业务中断是否由于保护倒换失败引起。
对于设备级保护的网元,在工作板故障后出现的业务中断,应检查是否由于保护倒换失败引起。
3.检查线路故障线路上有R_LOS、R_LOF等告警或再生段误码时,可通过网管查询光板激光器性能事件或通过光功率计测试收、发光功率,判断光功率是否在光板的正常工作范围之内,排除对端站故障和光缆故障。
OptiX OSN1500指针调整故障定位与排除
OptiX OSN1500指针调整故障定位与排除1.检查时钟配置数据时钟配置错误,会导致时钟不同步。
可采用时钟配置数据分析法和更改配置法,保证配置数据的正确性,进行故障定位。
操作步骤1)检查同一传输网中,是否配置了两个以上时钟源,导致指针调整。
2)检查配置跟踪的时钟源精度是否较低,如接入交换时钟精度较低,或者跟踪站点数过多。
3)检查是否没有配置时钟保护子网,主时钟丢失后(或断纤),时钟无保护引起指针调整。
4)检查是否时钟源级别设置错误,时钟保护倒换后引起互跟现象,导致指针调整。
5)检查主时钟网元的内部时钟源是否没有配置时钟源ID(Identity)。
当高级别时钟源丢失后,网元进入自由振荡状态,其它网元不会和中心站同步,导致该时钟子网中所有的站都处于自由振荡状态,导致指针调整。
6)检查是否没有启动SSM时钟保护,当时钟质量劣化时,不能够根据时钟质量进行保护倒换,引起指针调整。
7)当没有启动SSM时钟保护时,SSM质量输出设为禁止,所以其向其他网元传递的时钟质量为不可用。
此时,某网元重新启动SSM,检测到所有线路时钟源质量为不可用,就会转而跟踪内部时钟,进入自由振荡状态,引起指针调整2.检查环境温度传输设备工作温度过高也能够引起指针调整,所以在将故障定位到单站后,需检查该网元的环境温度。
操作步骤1)检查子架风扇是否出现故障。
2)检查子架风扇防尘网积尘过多,设备通风是否通畅。
3)检查机房内空调,是否能正常调节机房温度。
3.检查设备对接的同步情况不同类型的设备对接或不同厂家的设备对接时,应当检查对接设备之间的时钟是否同步。
全网时钟不同步,不一定是传输设备本身有问题,可能是全网的时钟同步规划不合理。
比如说对接设备跟踪一个时钟基准源,传输设备又跟踪另一个时钟基准源,造成两个网络的时钟有一定的偏差。
应当将SDH设备与其它设备设置使用同一个时钟源,否则也会引起指针调整。
说明:SDH在与其它设备如路由器、ATM(Asynchronous Transfer Mode)设备、交换机或微波设备对接时,都可能由于时钟不同步而产生指针调整。
OptiX OSN1500SNCP保护倒换故障定位与排除
OptiX OSN1500SNCP保护倒换故障定位与排除一.判断SNCP业务的路径
根据故障现象,需要判断故障发生时,SNCP业务的传输路径。
具体判断点包括:判断SNCP业务是否已经发生保护倒换或是否工作在保护路径上,如果SNCP业务没有倒换到保护路径上,则判断SNCP现在的工作路径。
通过以上判断点,可以初步确定SNCP业务的传输路径。
二.确定故障站点
对SNCP业务的传输路径,采用逐站点环回法,确定SNCP业务传输路径上的故障站点。
三.检查故障站点的光纤连接
在故障站点,需要判断该站点的光纤连接是否都已经连接正确。
对于SNCP保护,由于采用“双发选收”的保护机理,因此在正常工作状态下,光纤连接方向的错误,不会对业务的收发产生影响;而当SNCP保护倒换发生时,由于SNCP工作在保护路径,光纤误连接对业务的影响就会表现出来。
四.检查故障站点的配置数据
故障站点的配置数据的检查,需要结合全网的配置数据综合分析,判断配置数据的正确与否。
具体检查点包括:
1.检查相关站点是否正确设置SNCP倒换启动条件,是否接收到触发SNCP保护倒换的告警事件。
2.检查SNCP业务,在相关的环、链相交站点是否正确配置了SNCP的保护属性。
3.检查SNCP业务,在业务的源、宿站点是否按照各自的网络结构正确配置相关的保护属性。
4.检查SNCP业务,在网络的相关中间站点是否配置了穿通。
五.检查故障站点的单板工作状态
由于某些单板工作状态会影响相关SNCP业务的的收发情况,因此需要检查故障站点的单板工作状态。
SNCP保护需要设备中的交叉板、线路板的参与,也有必要对交叉板、线路板的工作状态予以检查。
OptiX OSN1500故障定位之PRBS功能测试法
OptiX OSN1500故障定位之PRBS功能测试法一.概述伪随机码测试(PRBS)模块相当于一个简单的自发自收的非成帧业务的仪表。
在开局或问题定位时,可以做到无仪表测试,一般用于网络的自检和维护。
实现了PRBS(Pseudo Random Bit Sequence)功能的网元,可以作为一个简单的仪表,分析业务通道是否有故障。
既可以分析本网元,也可以分析整个网络的情况。
二.PRBS功能测试法应用PRBS测试法分为低阶业务PRBS功能测试和高阶业务PRBS功能测试。
启用低阶或者高阶PRBS功能后,在相应位置进行环回,就可以进行交叉方向、支路方向、线路方向测试。
根据是否检测到误码判断相应测试通道的工作状态。
低阶业务PRBS功能测试:PRBS模块集成在支路板实现,如图1所示。
图1低阶业务PRBS测试信号流由支路板发起的PRBS功能测试,可以向两个方向发送。
向电口侧发送:经电缆或别的网元环回,可检测支路板发送方向的端口是否工作正常。
单板向该支路的发射(Tx)端口方向发送固定的伪随机码,在该支路端口的接收(Rx)端口接收伪随机码,如图2所示。
图2低阶业务支路方向PRBS测试向交叉方向发送:经高阶交叉芯片,从低阶交叉芯片返回,也可经低阶交叉芯片调度到其他单板(可以是支路板或线路板),从其他单板环回。
返回到交叉板后,再回到发起PRBS测试的支路板校验结果。
可检测高、低阶交叉芯片以及其他业务单板(支路板或线路板)通道是否正常。
如图3所示,单板在该通道向交叉方向发送固定的伪随机码,在该通道的下行方向接收伪随机码。
图3低阶业务交叉方向PRBS测试高阶业务PRBS功能测试:PRBS功能模块集成在线路板实现。
由线路板实现:由线路板发起的线路方向高阶PRBS测试用于检测线路板的某一高阶通道是否工作正常,可以向光口侧发送,经光纤或别的网元环回,可检测线路板发送方向的通道是否可用,如图4所示。
图4 线路方向高阶PRBS测试(由线路板发起)三.PRSB功能测试法小结由支路板完成的低阶业务PRBS功能测试可实现对系统所有单板的低阶通道的监视。
OSN1500设备单个以太网端口对接故障
OSN1500设备单个以太网端口对接故障本内容介绍华为OSN1500设备单个以太网端口对接故障时的现象、对系统的影响、可能原因,排除该故障时需要的工具、注意事项以及处理步骤等。
故障现象∙现象1:以太网单板单个以太网端口出现ETH_LOS或LINK_ERR告警,业务中断。
∙现象2:以太网单板没有上报任何告警,业务中断。
对系统的影响该以太网端口的业务中断。
可能原因∙对应现象1:以太网单板单个以太网端口出现ETH_LOS或LINK_ERR告警,业务中断。
▪原因1:以太网端口工作模式不匹配或接口速率不一致。
▪原因2:光纤连接错误或断纤。
▪原因3:光模块硬件故障。
∙对应现象2:以太网单板没有上报任何告警,业务中断。
▪原因1:以太网端口的TAG属性和对端设备不匹配。
▪原因2:以太网单板硬件故障。
▪原因3:以太网端口的VLAN ID设置错误。
工具、仪表和材料∙U2000操作步骤1.对应现象1:以太网单板单个以太网端口出现ETH_LOS或LINK_ERR告警,业务中断。
a.原因1:以太网端口工作模式不匹配或接口速率不一致。
i.查询本端端口工作模式设置是否与对端一致。
ii.查询本端接口速率与对端接口速率是否一致。
b.原因2:光纤连接错误或断纤。
i.检查光纤连接是否正确。
c.原因3:光模块硬件故障。
i.检查光模块硬件是否发生故障。
2.对应现象2:以太网单板没有上报任何告警,业务中断。
a.原因1:以太网端口的TAG属性和对端设备不匹配。
i.查看设备是否配置了VLAN业务。
ii.查询以太网端口的TAG属性。
b.原因2:以太网单板硬件故障。
i.选取配件,更换故障单板。
ii.查看业务是否恢复正常,若未恢复,请联系华为工程师。
c.原因3:以太网端口的VLAN ID设置错误。
i.查看设备是否配置了VLAN业务。
ii.查看以太网内部端口和外部端口的TAG属性是否符合规范。
iii.查看以太网端口和交换机配置的VLAN ID是否保持一致。
OSN1500电源故障处理方法
OSN1500电源故障处理方法本内容介绍供电电源故障导致业务中断时的现象、对系统的影响、可能原因,排除该故障时需要的工具、注意事项以及处理步骤等。
故障现象某站点设备的大量单板同时复位,且业务中断。
对系统的影响供电电源故障会导致业务中断。
可能原因∙原因1:网元功耗超过网元门限功耗。
∙原因2:单板电源异常。
∙原因3:电源线接头松动或接触不良。
∙原因4:外部电源供电中断或电源波动异常。
∙原因5:设备电源板故障。
∙原因6:直流配电盒故障。
工具、仪表和材料∙U2000∙万用表∙螺丝刀操作步骤1.原因1:网元功耗超过网元门限功耗。
网元如果长期处于功耗越限状态,网元配套的电源板也将长期工作于高负荷状态,会导致电源板故障。
a.在U2000上浏览当前告警。
b.处理NE_POWER_OVER告警(表示网元功耗越限告警)。
c.查看业务是否恢复正常,若未恢复,转其他原因。
2.原因2:单板电源异常,导致业务中断。
a.在U2000上浏览当前告警。
b.处理POWER_ABNORMAL告警。
c.查看业务是否恢复正常,若未恢复,转其他原因。
3.原因3:电源线接头松动或接触不良,导致业务中断。
a.检查连接外部供电设备、直流配电盒和设备电源单板的电源线接头的连接情况。
b.查看业务是否恢复正常,若未恢复,转其他原因。
4.原因4:外部电源供电中断或电源波动异常,导致业务中断。
a.断开直流配电盒上电源开关,将万用表的正极接在直流配电盒的电源端子NEG(-)上,将负极接在电源端子RTN(+)上。
测量电源端子RTN(+)与NEG(-)之间的电压,应符合下列要求。
∙如果输入电源的标准电压为-48V,电源电压应该在-41V~-60V之间。
∙如果输入电源的标准电压为-60V,电源电压应该在-51V~-72V之间。
b.需电源工程师协助处理外部电源故障。
5.原因5:设备电源板故障,导致业务中断。
a.更换设备电源板。
b.查看业务是否恢复正常,若未恢复,转其他原因。
OptiX OSN1500ECC故障定位与排除
OptiX OSN1500ECC故障定位与排除一.排除外部故障网线、网卡、网管计算机、HUB、路由器等外部设备故障都会造成网管无法登录所有网元。
二.排除人为原因造成的故障人为原因造成的故障主要包括ECC路由规划不合理以及网关网元IP地址和网管计算机IP地址不在同一个网段中等。
ECC路由规划不合理会造成网管速度较慢,且经常出现若干个网元颜色突然变灰又恢复的现象。
在设备组网调测的时候,就应该合理地规划ECC路由。
如果由于ECC路由规划不合理,造成ECC通信异常,应该重新规划ECC 路由。
网关网元IP地址和网管计算机IP地址不在同一个网段中,就会造成网管计算机无法登录所有网元。
重新设置正确IP,可以排除故障。
在设备安装调测或升级扩容中,一些设置上的错误也会导致ECC问题。
比如,新增网元的ID和老网元的ID重复。
特别应该注意检查系统管理域设置,确认已经将不能够登录的网元加入系统管理域。
查询是否存在人工路由,有时候由于人工路由的存在,在正常情况下,ECC通信正常,在发生断纤故障的时候,常常会发生ECC通信故障。
三.将故障定位到单站或两个站之间对于ECC问题,将故障定位到单站或两站之间是比较容易的。
一般来说,将问题定位到距离网关网元最近的ECC 故障网元以及相邻网元之间。
如图1所示的链形组网中,NE1为网关网元,连接网管。
故障现象:现在NE3、NE4站登录不上。
图1 链形组网如果NE3、NE4都不能登录,则故障基本可以定位到NE2和NE3。
对于ECC问题,不但要分析登录不上的站点,还要分析其上游站。
如上所述如果网管不能登录NE3,则对NE2、NE3都应分析。
四.检查单板如果还没有定位出单站内的ECC故障,就要对相应的单板进行检查了。
1.检查主控板首先检查相关站点的主控板是否硬件故障。
以上例子中,此项需要NE2、NE3的机房维护人员配合,主要是查看主控板的指示灯是否正常。
STAT指示灯红灯长亮则主控板硬件故障。
OptiX OSN1500误码故障定位与排除
OptiX OSN1500误码故障定位与排除一.检查光功率光功率异常是引起误码的常见原因。
1.光功率常见故障原因以线路板光功率为例,当光功率过大或过小,都会导致接收光模块接收光信号不正常,并引起B1、B2、B3或BIP误码。
所以,设备上报大量各种类型的误码时,我们首先要测试本站接收光功率是否正常。
2.操作步骤1)光功率过大的处理步骤:A、检查线路板的类型是否与传输距离匹配,更换为匹配的线路板。
B、如果没有合适的线路板更换,在接收端加上适当的光衰减器。
2)光功率过小的处理步骤:1、对端站的发光功率异常,更换对端站的故障线路板。
2、检查ODF、衰减器、法兰盘、线路板的接口连接是否紧密。
3、检查ODF、衰减器、法兰盘、线路板的接口是否清洁。
4、检查光纤的弯曲度是否在允许的范围内:弯曲半径≤60mm。
5、如果是线路板光功率异常,检查本站的线路板类型。
若接收灵敏度与传输距离不匹配,更换为匹配的线路板。
二.检查电缆对于采用电缆传输的业务,电缆故障是产生误码的常见问题。
1.电缆常见故障原因连接到传输设备电缆劣化,通常会引起误码。
检查连接到设备上的电缆是否正确,防止电缆的漏焊、虚焊、接触不良。
在OptiX OSN1500与其他设备对接时,如果对接设备报误码,应该检查对接电缆是否正常。
2.操作步骤1、检查电缆是否有老化、外皮脱落现象。
2、检查电缆的连接点是否接触良好。
3、检查对接设备的电缆是否有老化、外皮脱落现象。
三.检查外部干扰外部的各种电磁干扰也可能导致误码故障。
1.外部干扰常见故障原因1)外界电子设备产生电磁干扰。
2)设备供电电源产生的电磁干扰。
3)雷电和高压输电线产生的电磁干扰。
2.操作步骤1)检查是否有外界电子设备带来的电磁干扰,如传输机房内的开关、风扇、空调、各种射频器等。
2)检查是否有来自设备供电电源的电磁干扰,如浪涌电压、工频干扰等。
3)检查是否有雷电和高压输电线产生的电磁干扰。
四.检查接地设备接地不良也可能导致误码故障。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
OptiX OSN1500设备对接故障定位与排除
一.检查业务配置
业务配置错误会导致设备对接故障。
查询、分析对接设备的配置数据,包括:物理设备参数、逻辑设备参数、支路板参数、时钟参数、复用段倒换参数等。
可采用配置数据分析法和更改配置法,保证配置数据的正确性。
另外,如果支路或线路设置了环回,必然会造成业务不通。
可在网管上检查并解除环回。
二.检查物理连接
光纤、电缆连接不正确也可导致设备对接故障。
检查对接设备之间的电缆、光纤连接是否正确;防止电缆的漏焊、虚焊、接触不良,特别是要防止电缆的混线。
说明:所谓混线,举个例子说明,如图1所示。
交换的2M端口A接到了传输设备的2M端口B上,而交换的
2M端口B接到了传输设备的2M端口A上。
这种情况下,在网管上看不到有T_ALOS告警上报,因为该告警只是对接收端口中是否有信号输入进行检测,而对该信号的正确性不作检测。
图1 2M信号对接
三.检查光功率或接地
对于光接口的线路对接,要检查光功率是否在正常的范围内。
使用仪表测试对接设备的光功率,并参考工程资料和《OptiX OSN1500智能光传输系统产品描述》,确认光功率是否满足要求。
检查对接设备的接口板是否匹配,包括光模块类型、接收灵敏度、发光功率等。
必要时,可以测试接口的抖动、频偏是否满足指标要求。
检查对接时的光纤类型是否匹配。
单模光纤和多模光纤不可混用。
四.检查接地
对于电接口的对接,需要检查双方设备和线缆的接地和共地情况。
使用仪表测试BGND、PGND的接地电阻值是否符合指标要求,DDF是否按要求接地;检查双方设备的75欧姆同轴接口屏蔽层的接地方式是否一致,接地是否良好。
排除接地故障的最好方法是使用示波器检查对接信号的波形是否变形、失真。
也可以使用万用表测试:将对接设备间的信号连接线全部断开,用万用表测量OptiX OSN 1500的收、发端同轴电缆屏蔽层间的电平,然后测量对接设备侧的收、发端同轴电缆屏蔽层间的电平。
两次测量的电位差都应小于20mV。
如果有较大的电位差,则应引起重视,判断是否是因为该原因而导致业务的对接不成功。
五.检查电缆距离和信号衰减
当采用电缆对接时,中继电缆距离过长有时会导致业务对接失败,表现为业务不通或者开通的业务经常出现中断。
75欧姆的2M中继信号的最大传送距离为300米,75欧姆的34M/45M中继信号最大传送距离为140米(需要加均衡)。
中继距离过长会因阻抗不匹配、受到干扰、对端设备可靠性等原因而导致接口波形产生失真,特别是当干扰变大时更加容易出现业务中断。
可以采用仪表检查对接信号的波形是否变形、失真。
六.检查对接信号的结构
SDH信号对接时,需要检查对接双方设备的时隙排列、开销、指针以及保护组网的兼容性。
1.时隙排列
SDH信号对接时,应检查VC-4映射结构中对应到支路板通道上的时隙排列顺序。
2.开销和指针
SDH信号对接时,检查对接设备的开销和指针是否一致,包括:J0、J1、C2、H1、H2。
因信号结构不匹配引起的对接失败,通常伴随有相应的告警,如J0_MM、HP_TIM、HP_SLM、AU_LOP、HP_RDI。
开销字节的定义不一致,需要修改其中一方设备的开销定义。
OptiX OSN1500的J0、J1、C2字节可以在网管中修改其定义;H1、H2字节不可修改。
3.保护组网时的对接
复用段保护功能在不同厂家的传输设备间是不兼容的。
因此,通常情况下,不同厂家的复用段保护功能不能进行对接。
子网连接保护功能由于不涉及保护协议,不同厂家的设备通常可以相互兼容。
七.检查网络的时钟同步
设备对接后,不仅要求SDH传输网内的时钟保持同步,而且对接后形成的网络也应保证时钟同步。
时钟不同步在SDH线路对接和PDH支路对接的故障现象是不同的。
1.SDH线路对接时的时钟同步
OptiX传输网内时钟是否同步,可以通过指针调整性能事件反映。
如果有大量的指针调整事件,或出现误码告警,则很可能是OptiX OSN 1500本身存在问题,可参见指针调整故障处理排除该问题后再作其它处理。
如果传输设备运行正常,应检查对接设备的时钟处理性能是否正常。
2.PDH支路对接时的时钟同步
OptiX OSN 1500与其它设备在PDH支路对接时,如果时钟不同步,在OptiX OSN 1500上通常不会有告警和性能事件出现,在PDH设备上则会有误码或业务时断时续的现象。
3.时钟不同步的处理
全网时钟不同步,不一定是传输设备本身有问题,可能是全网的时钟同步规划不合理。
比如说交换设备跟踪一个时钟基准源,传输设备又跟踪另一个时钟基准源,造成两个网络的时钟有一定的偏差。
这时,首先要确保OptiX OSN 1500组成的传输网内时钟同步。
如果还有问题,可以适当地调整全网的时钟同步方案,使全网时钟同步;比如使主站的交换设备和OptiX OSN 1500都跟踪高精度的BITS时钟信号,以提高系统的传输性能。
一般情况下,在传输网络内,中心站网元采用内置时钟源,其他网元跟踪此基准源,即可满足传输的同步要求,和大部分交换、移动设备对接都正常。
常用解决方法:更改配置法。
说明:要注意PDH设备和SDH设备传输时钟信号的差异:由于PDH设备的复用结构采用比特间插方式,对所传输的时钟信号基本上无损伤;而SDH设备由于引入指针调整技术,对所传输的时钟信号不可避免的引入了抖动和漂移,产生相位差异。
因此,通过SDH设备2M通道传送的时钟信号质量理论上劣于通过PDH传送的时钟信号质量。
所以建议不要通过OptiX OSN1500的支路口来传送2M时钟信号。
可以使用OptiX OSN1500的时钟输入输出端口来传送时钟。
八.根据需要,更换单板
若定位为单板故障,则可通过更换单板的方法确认。
在采用逐段环回等方法将故障点定位到某块单板后,可以采用更换单板的方法,确认故障点。