传输故障分析与处理方法(华为设备)
SDH光传输设备的维护技术分析
SDH光传输设备的维护技术分析近年来随着我国经济的快速发展,电力的发展也十分迅速。
SDH光传输设备是光传送网络中的重要组成部分,其关系着光传送网络是否能安全稳定的运行。
所以,在SDH光传输设备的日常运行中,要加大对维护检修力度,及时采取有效措施排除故障,以保证整个光传送网络能够稳定可靠的运行。
本文对SDH 光传输设备常见故障及检修进行分析,并就其维护策略进行探讨。
标签:SDH;光传输设备;维护技术引言随着电力通信网络的到较快发展。
光纤通信技术也不断发展,SDH传输网已经成为电力通信网的主要组成部分,承担着越来越多的重要业务。
因此大多数电力生产信息、管理信息及调度信息均需通过SDH光传输网络进行传输。
1SDH光传输设备故障类型(1)通信类型故障。
此种故障主要表现在网络管理员无法登录网元,能够登录的网元处于混乱状态,稳定性相对较差;(2)业务中断类型故障。
此种故障主要包括人为误操作或者配置错误所造成的业务中断;外部原因所引发的业务中断,表现为:交换机故障、光纤或电缆中断、供电电压较低等等;单板自身故障问题等等。
(3)误码类型故障。
此种故障可以细分为“设备故障”以及“外部因素故障”等类型。
其中“设备故障”主要指线路板接收信号的衰耗较大,本端接收问题、对端发送电路故障等引发的误码故障,而“外部因素故障”主要是由于光纤信号传输损耗较大、接口周边存在较强干扰信号、散热问题引发温度较高等造成的误码故障;(4)时钟同步类型故障。
此类型故障主要表现为:时钟板故障、外部时钟源丢失、时钟源配置错误等等。
2SDH光传输网络设备故障处理2.1设备故障分析运维人员首先要从设备的告警灯来查看设备告警的原因,所以在日常的维护过程中,要时刻关注告警灯的颜色和闪烁变化情况。
当机柜告警灯闪烁时说明SDH设备发生紧急故障,需要从UPS电源、设备电源、设备风扇等方面查找出现问题的原因并快速解决,当设备出现次要告警灯闪烁时,则表明设备具有故障的隐患,例如温度持续升高、对端设备有问题等。
TA000301故障分析与处理方法ISSUE11-精选文档
华为机密,未经许可不得扩散
文档密级:内部公开
二、画业务路径图:
画出所采样业务一个方向的路径图。 在路径图中表示出:该业务的源和宿,该业务所经过的站 点,该业务所占用的VC4通道和时隙。 例如:
华为机密,未经许可不得扩散
文档密级:内部公开
三、逐段环回,定位故障站点
依据中断业务的路径图,在1号站第2块支路板的第 1个 2M通道外接一个2M误码仪,监测业务好坏。
一、通过机柜顶部的告警指示灯查看告警 二、通过单板告警指示灯查看告警
缺点
设备指示灯仅反映设备当前的运行状态,对于设备曾 经出过故障,无法表示; 设备每种告警对应的指示灯闪烁情况,可以通过网管 软件进行重新定义,甚至于可以将某种告警屏蔽掉。
文档密级:内部公开
华为机密,未经许可不得扩散
环回法,是 SDH 传输设备定位故障最常用,最行之有效 的一种方法。
支 路 板
网 管 、 自 环 线
按 业 务 通 道 环 回
交 叉 板
网 管 、 命 令 行 线 路 环 回
按 业 务 通 道 环 回
华为机密,未经许可不得扩散
文档密级:内部公开
采用环回法应注意的问题:
1、软件环回是一种不彻底的环回,只能初步定位故障的位 置。 2 、对远端站点线路板第一个 VC4 作环回操作时 , 一定要确 认环回后ECC通信不会中断,才可进行操作。
一旦远端站点的ECC通信中断,则只能到远端站点现场才
能解开环回,恢复ECC通信。 3、“环回法”会导致正常业务的暂时中断,一般只有在出 现业务中断等重大事故时,才使用环回法进行故障排除。
华为机密,未经许可不得扩散
文档密级:内部公开
5.华为交换机故障定位及处理方法
常用的调试命令(二)
– display task 该命令必须在隐藏模式下执行,占用CPU时间CPU Time : 10/135 ,分子10为当前占用的时间,分母135为启动以来占 用CPU最长的时间;如果在CPU占用率高的情况时当前占用CPU 时间最长的任务就是有问题的任务。 [Quidway-hidecmd]display task ID Name Priority Status CPU Time 1 WEIL 10 Ready 3/10 2 STmr 225 Ready 1/4 3 SYST 180 Ready 0/2
案例1:速率不匹配导致链路时断时 通(二)
• 可能原因分析 – 网线问题,需检查网线的好坏; – 检查Sun E450网卡的好坏和3026E 接口的好坏; – 从告警可以估计到与传输速率有关,需进行配置分析。因 为3026E以太网口默认情况是自适应的,而SUNE450的网 卡也是自适应的,两者很可能因为速率不匹配,造成网络 的物理连接时通时断。 • 处理过程 – 监测网线,正常 – 监测Sun E450网卡,正常
常用的调试命令(四)
– display hwfib 该命令在系统模式下执行,显示硬件中的最长匹配转发表, 即配置或学习的缺省路由、间接网段路由和虚接口网段 (路由较多时,只有部分虚接口网段写入最长匹配转发 表)。 [Quidway]display hwfib Hardware fib entry information: Destination/Mask RtIf VTag Port Mac 0.0.0.0/1 2 2 Ethernet0/2 00e0-fc05-07c0 128.0.0.0/1 2 2 Ethernet0/2 00e0-fc0507c0 这时,要注意3526e的规格,3526e硬件路由表项只有16 条,超过16条则未解析的报文上cpu处理。
(new)华为ONU常见故障处理流程及步骤
(new)华为ONU常见故障处理流程及步骤华为ONU常见故障处理流程及步骤处理故障需要网管组和现场的故障处理人员之间互相配合和有效的沟通才能顺利的分析故障,解决故障。
要做到这点,首先就要学习和了解现场接入设备的硬件知识。
下面简单介绍一下华为ONU设备的槽位分布情况:MA5680T(华为OLT):1-6,9-16槽位是业务板槽位,7-8槽位是主控板,一主一备,17-18为上行板。
MA5612(华为ONU):1-4槽位是业务板槽位,0槽位是上行板。
0 1 24 3MA5616(华为ONU):1-4槽位是业务板槽位,1-4槽位宽带板,语音板都能插。
1234处理故障通常需要现场人员配合检查光路,设备硬件。
华为ONU1.看RUN/ALARM灯,正常应该是绿灯或黄灯,如果亮红灯,则设备有故障。
2.看link灯是否长亮,如果link灯不亮,则光路不通。
(例外:四口的ONU的link灯只在插光纤的时候闪一下,然后就灭了)3.看link灯旁边的reg灯(或auth灯),数据没有配置时,它是闪烁的(1秒3次),数据配置完后变成长亮或慢闪(3秒1次)4,接电脑或AP的网线口,正常状态宽带板上的link灯应为亮,不亮则网线不通。
(ADSL设备业务板卡上没有指示灯)5. 语音板上如果alarm灯亮红灯,可能是语音数据没有配置或硬件故障。
现场人员查看设备硬件的同时,我们登录到设备上通过命令查看设备状态是否和现场反馈的一致。
1、先查看ONU所有的单板是否正常(Normal 为正常):yiliankeji_ma5612 (config)#display board 0-------------------------------------------------------------------------SlotID BoardName Status SubType0 SubType1 Online/Offline-------------------------------------------------------------------------0 H831CCFE Active_normal EP1A ASDA1 H848ASNB Normal2 H848ASNB Normal34 H831EPFB Normal-------------------------------------------------------------------------2、先查看ONU某块单板的端口状态:CZJT-S240YUDONGCUNDONGLU-ONU01-HW-MA5612#display board 0/4 ---------------------------------------Board Name : H831EPFBBoard Status : Normal---------------------------------------------------------------------------------------------------------------------Port Port Optic MDI Speed Duplex Flow- Active Link Type Status (Mbps) Ctrl State------------------------------------------------------------------------------0 GE - auto auto auto off active offline1 GE - auto auto auto off active offline2 FE - auto auto_100 auto_full off active online3 FE - auto auto auto off active offline4 FE - auto auto auto off active offline5 FE - auto auto auto off active offline6 FE - auto auto auto off active offline7 FE - auto auto auto off active offline------------------------------------------------------------------------------Note: For a 1000 M, electrical port in the full-duplex mode, setting MDI toany value is invalid如果link状态为online,物理链路正常,如果为offline,物理链路不通,查看网线,网卡,或更换ONU端口测试。
传输故障分析与处理方法
传输故障分析与处理方法
传输故障是指在光纤通信系统中,由于光纤线路、光模块、光纤接口
等各个环节的故障所引起的通信中断或通信质量下降的情况。
本文将针对
华为设备的传输故障进行分析与处理方法的介绍。
一、故障分析方法
1.故障现象分析:对传输系统中出现的问题进行观察和记录,包括连
线状态、报错信息、光模块指示灯状态等,以便后续的故障诊断。
2.检查网络拓扑结构:查看整个传输网络的拓扑结构,确定各个设备
的连接关系,包括网元间的物理连接和逻辑关系。
3. 路由追踪分析:通过Ping命令或网络管理软件,对故障设备进行
路由追踪,确定故障所在位置。
4.光功率分析:使用光功率表或光纤仪对光纤的传输功率进行检测,
判断是否存在光功率衰减过大的情况。
5.故障排除法则:根据故障排除法则,从整体到局部、从简单到复杂、从外部到内部,逐层分析并排除可能的故障原因。
二、故障处理方法
1.重新插拔光模块:对光模块进行重新插拔,确认模块连接是否松动
或有污染,确保模块的正常工作。
2.更换光模块:如果通过重新插拔光模块无法解决问题,考虑更换光
模块,确保新的光模块的质量和兼容性。
3.更换光纤接口:如果故障发生在光纤接口处,可以尝试更换光纤接口来解决问题。
4.检查光纤线路:使用光纤测试仪对故障光纤进行检测,判断是否存在光纤损坏或光纤连接不良的情况。
5.重启设备:在排除故障的可能原因后,可以尝试重启设备,以清除缓存和恢复正常配置。
7.故障记录与总结:对故障原因进行记录和总结,以便今后类似故障的排除和预防。
总结。
传输故障排除案例集锦(HUAWEI)
1 业务中断的处理1.1 更换光板类型错误导致对端收光不正常【系统概述】某传输组网如图1所示,4个OptiX 2500+设备组成双向复用段保护环;1号站为业务中心点,连接网管。
其中,3号站和2号站之间距离较长,使用了BPA光放板。
图1 系统组网图【故障现象】某日机房维护人员发现2号站接收3号站方向的S16有R-LOS告警,全网正常倒换,业务未受影响,用网管查询2号站的告警,PA有IP-FAIL(无输入光)告警,3号站的BA有IP-FAIL告警。
【故障分析及排除】BPA板光口1对应的是BA(功放,将S16的输出光信号放大14或17dBm);光口2为PA(前放,当输入光功率在-22dBm ~-32dBm 之间时,光口OUT2输出光功率变化范围在-7dBm~-21dBm)。
光信号经过BPA的尾纤连接及信号流向如图2所示:图2 BPA光信号流向(1) 根据光信号经过BPA的信号流可以看出,由于3号站光放板的BA未收到光信号,导致了2号站的PA、S16报收无光。
可以判断故障点在3号站;(2) 维护人员带S16、BPA、尾纤、光功率计到3号站;(3) 在3号站测试S16板的输出光功率值,光功率计显示无光信号。
可以判断是S16板故障;(4) 将带的S16板插上,测试S16输出光功率为0dBm,恢复尾纤连接;(5) BA板告警消失,但S16仍有红灯一闪告警,查询为MS-RDI;(6) 查询2号站S16,仍有R-LOS告警;(7) 在3号站,将换上去的S16板发光功率衰减到-15dBm做自环,告警消失。
判断新换上去的S16并没有损坏;(8) 为什么仍有告警呢?分析原因是3号站的S16板使用有错,SS62S1605与SS62S1604波长是一样的,而色散受限距离不同,可能是色散过大导致对端收光不正常。
(9) 查看3号站原来使用的S16的光板类型,为SS62S1605;刚换上去的S16类型为SS62S1604;(10) 更换同类型的S16,故障消除。
传输故障分析与处理流程
OptiX设备的操作注意事项
四、网管系统维护注意事项
1、网管软件在正常工作时不应退出,尽管退 出网管系统不会中断网上的业务,但会使网管 在关闭时间内对设备失去监控能力,破坏对设 备监控的连续性。
2、严禁在网管计算机上运行与设备维护无关 的软件,特别注意严禁玩电脑游戏;定期杀毒。
华为机密,未经许可不得扩散
检测接收到的低阶通道开 销字节V5(bit8)=1.一般是 TU-AIS告警的对告。
华为机密,未经许可不得扩散
文档密级:内部公开
155/622/2500+单板常见告警分析
二.支路板:
PQ1、PD1、PL3板(PL4、PD4板的告警与线路 板类似,参见教材)
3.TU-LOP 告警:
检测到TU指针V1、V2字 节非法。一般在下时隙 配置或新增时隙配置时 发生时隙冲突。
3、电源维护注意事项严禁设备带电安装、拆除。
华为机密,未经许可不得扩散
文档密级:内部公开
OptiX设备的操作注意事项
三、 单板机械安全注意事项
1、单板在运输中要避免震动,震动极易 对单板造成损坏。
2、更换单板时要小心插拔,更换单板应 严格遵循插拔单板步骤。
华为机密,未经许可不得扩散
文档密级:内部公开
文档密级:内部公开
常见告警分析
SDH线路板常见告警
华为机密,未经许可不得扩散
文档密级:内部公开
常见告警分析
SDH线路板常见告警
华为机密,未经许可不得扩散
文档密级:内部公开
常见告警分析
SDH线路板常见告警
华为机密,未经许可不得扩散
文档密级:内部公开
常见告警分析
SDH线路板常见告警
华为机密,未经许可不得扩散
华为传输设备常见告警含义及处理方法
华为传输(chuán shū)设备常见告警含义及处理方法AU_AIS AU告警指示(1)由MS_AIS、R_LOS、R_LOF 告警引发的相应VC4 通道的AU_AIS 告警;(2)业务配置错误;(3)对端站发送AU_AIS;(4)对端站发送部分故障;(5)本站接收部分故障。
(1)由本站MS_AIS、R_LOS、R_LOF 等告警引发的相应VC4通道的AU_AIS 告警,检查方法可通过对MS_AIS、R_LOS、R_LOF 的分析来定位故障;(2)还有一个可能原因是相应VC4 通道的业务有收发错开的现象,导致收端在相应通道上出现AU_AIS 告警,在这种情况下,该AU_4 中相应的TU 上也会伴随出现TU_AIS 告警。
这时,请检查出现AU_AIS 的站和它的互通业务站,以及中间业务穿通站的业务时隙配置是否错误;(3)更换对端站对应的交叉板和线路板;(4)更换本站的线路板和交叉板。
AU_LOP AU指针丢失(1)对端站发送部分故障;(2)对端站业务配置错误;(3)本站接收误码过大。
(1)检查对端站及本站业务配置是否正确,如果不正确,重新配置业务; (2)对于155M 光接口板一般无此故障,若有的话多为此光板配置有误。
而622M 和2500M光接口板接收到AU_LOP 告警,应检查对方时钟板是否正常工作、交叉板是否检测到了时钟;(3)如业务为140M 业务,检查业务是否正确接入;(4)依次更换对端站对应的交叉板和线路板,定位故障点;(5)更换本站的线路板和交叉板。
MS_AIS 复用段告警指示(1)对端站发送MS_AIS 信号;(2)对端站时钟板故障;(3)本板接收部分故障。
(1)检查对端站线路板是否存在问题,可通过复位或更换单板的方法检查告警是否消失;(2)检查本站线路板,同样可通过复位或更换单板的方法来检查告警是否消失。
MS_RDI 复用段远端接收失效指示(1)对端站接收到R_LOS/R_LOF/MS_AIS 信号;(2)对端站接收部分故障;(3)本站发送部分故障。
华为U2000网管常见故障分析
华为U2000网管常见故障分析【摘要】华为SDH传输网是一种多业务传送平台,承载的常见有通道业务和以太网业务。
在业务开通和维护过程中,华为SDH传输网网管系统会上报一些常见告警,这些告警信息反映了通道业务的运行情况。
【关键词】网管;光端机;光纤;告警;故障分析华为SDH传输网络能够支持多业务接入,满足大带宽传输,提供了可靠的通信环境。
SDH传输网丰富的维护字节信息,使其具有良好的自愈能力。
加上华为强大的网管系统,一般的业务故障,通过华为U2000网管系统的告警信息,就可快速定位故障,组织开展消缺。
本文将对华为U2000网管常见的几个典型故障案例及相应的排除方法加以分析。
案例一:因光功率过载导致光路出现误码(一)系统组网4端华为Metro3000设备组成2.5G的两纤双向复用段保护环,1 号站为网管站,1 号站和4 号站距离为10km,使用8 芯光缆的1、2芯,第1芯为1号站的收。
(二)故障现象1号站至4号站的S16 板上报R-LOS告警,4号站至1号站的S16板上报MS-RDI告警。
用光功率计在1号站ODF测试收4号站的光功率,为收无光,在4号站测试至1号站的S16输出光功率为0dBm。
判断是4号站发往1号站的第1芯光纤出现了问题。
对光缆里的其它纤测试,发现第3芯可用。
将尾纤由第1芯换到第3芯后告警消失,但性能事件上报RS、MS误码。
(三)故障分析及排除换纤后,在网管上查询1号站收4号站的光功率为-3dBm,光功率实测也在-3dBm附近。
怀疑是光功率过载导致误码产生。
检查工程文档中的光功率记录表,发现工程期间记录的值为-13dBm ,但是注明在1号站收端加了一个10dB的光衰耗器,而且使用的是长距的SS62S1603板。
经查,在1号站ODF第3芯到S16之间并未找到光衰耗器,在ODF第1芯上将“法兰盘”卸下来观察,发现一面写有S10 ,另一面写有1550nm 的字样,该连接器为光衰耗器。
用这个光衰耗器替换3 号纤在ODF上的法兰盘后,S16 收光功率恢复到-13dBm,误码消失。
华为SDH传输网两种常见业务常见告警分析
华为 SDH 传输网两种常见业务常见告警分析【摘要】华为SDH传输网是一种多业务传送平台,承载的常见有通道业务和以太网业务。
在业务的开通和维护过程中,华为SDH传输网网管系统会上报一些常见告警,这些告警信息反映了通道业务的运行情况。
【关键词】SDH;E1业务;以太网业务;告警;故障处理方法0 引言华为SDH传输网络能够支持多业务接入,满足大带宽传输,提供了可靠的通信环境。
SDH传输网丰富的维护字节信息,使其具有良好的自愈能力。
加上华为强大的网管系统,一般的业务故障,通过华为U2000网管系统的告警信息,就可快速定位故障,组织开展消缺。
1 华为SDH传输网通道业务类型本文所述业务是指SDH传输网络运行的常见且主要业务——E1业务和以太网业务。
1.1E1业务SDH传输网络上的E1业务是指由E1业务接口板或者处理板承载网的通道业务。
早些年,SDH传输网络承载的业务大部分都是E1业务,1×2M或2×2M的E1业务足以满足客户的使用,最大的时候也仅为5×2M。
1.2以太网业务在SDH传输网上,以太网业务是指有以太网板承载的业务,业务带宽比较自由,可根据客户的需求具体确定,从2M到千兆均可。
2 常见告警常见告警是指SDH传输网U2000网管系统上常见的,出现频率比较高的与E1业务和以太网业务相关的告警,且这些告警是由某些造成业务中断的故障而引发上报的。
2.1 E1业务主要告警分析与E1业务相关的,影响客户使用的常见告警主要有:T_ALOS、UP_E1_AIS、DOWN_E1_AIS。
2.1.1 T_ALOS告警T_ALOS告警是指E1接口信号丢失。
最常见的原因是E1接口输出端口脱落或松动。
其他可能的原因有:未接入E1业务或者对端站未发送E1业务、对端站设备出现故障、电缆等故障。
当出现多条E1业务同时产生T_ALOS告警时,通常原因为接口板发生故障或单板故障。
2.1.2 UP_E1_AIS告警UP_E1_AIS告警是E1上行信号告警指示。
传输理论模拟试题题库(1)【华为】【答案】
传输(华为)模拟试卷(一)一、填空题:(每空1分,共15分)1、SDH的含义是__同步数字体系_____。
2、如果人能够感觉到静电,那么这时的电压至少为3000V,而传输单板属于静电敏感器件,所以在任何时刻只要涉及到拔插单板或手持单板时必须______ 戴防静电手镯。
3、在二纤单向通道保护环中,出现TU-12 AIS告警会进行TU-12通道的倒换。
4、告警R-LOS的含义是:信号丢失。
5、支路板收不到电信号会产生R-LOF告警。
6、如果设备温度过高,应该检查 _风扇是否正常防尘网是否干净,应该如何处理清洗防尘网。
7、-48V电源线为蓝色,工作地线为黑色,保护地线为黄绿色。
8、光纤利用光的全反射光纤通信原理完成光信号的传导。
9、标准化机房要求的三种接地分别为工作地、保护地和防雷地。
10、工程中进行光板的过载光功率、接收灵敏度测试时,应注意在光板的收、发光口间加入扰码后再进行测试。
二、单选题(每题1分,共25分)1、SDH光接口线路码型为(B)。
A、HDB3B、加扰的NRZC、mBnBD、CMI2、以下从时钟的几种工作模式、精度最高的是哪一种(A)A、跟踪同步模式B、同步保持模式C、内部自由振荡模式D、伪同步3、一个VC-4时隙包含个VC-3时隙, 可以容纳个34M信号。
(D )A、1, 3B、1, 1C、3, 1D、3, 34、用于环形网络和链形网的中间节点,可以双向上下业务的网元类型是:( B)A、TMB、ADMC、 DXCD、REG5、在中国,大面积敷设的是哪一种光纤?( A )A、 G、652B、 G.653C、 G.654D、 G.6556、G.652光纤的零色散点位于__ __处,因此在此波长处,其色散最小,但衰耗较大。
( C)A、1550nmB、1330nmC、1310nmD、850nm7、关于SDH描述错误的是( D )。
A、SDH信号线路接口采用世界性统一标准规范;B、采用了同步复用方式和灵活的映射结构,相比PDH设备节省了大量的复接/分接设备(背靠背设备)C、由于SDH设备的可维护性增强,相应的频带利用率也比PDH要低;D、国标规定我国采用北美标准;8、常用的光功率单位为(D )。
E1故障处理方法总结
传输E1故障处理方法总结摘要:E1故障告警会影响基站的业务性能和质量,严重则会引起基站断站。
处理前可以根据故障相关告警分析其可能原因,并作出故障的定位和故障处理方法。
处理E1方法主要是检查该E1的头有没有问题,E1线好与坏,传输有无问题,数据配置有无问题等,并根据不同症状及处理方法逐一排除故障。
关键词:告警;故障;数据;环回测试;误码。
1.概述W-NODEB基站与传统2G基站的一个不同之处是NODEB基站需配置的传输物理链路数要多,这样才能满足3G无线高速上网所需的传输带宽,同时,多条传输也减少了基站断站的几率,但也因此提高了传输E1的告警故障几率。
从目前的日常告警清理中,有很大的一部分告警为传输E1 故障。
下面为处理不同E1告警故障后累积的经验,用于快速定位出故障的原因,帮助维护人员更快的处理好故障。
(本文主要针对华为BSC6810和BTS3900设备,虽然本文描述的问题为普遍现象,但对于不同型号或厂家的设备,故障处理方法可能会有所差别,本文谨供参考。
)2.处理E1告警的步骤1)收到E1故障信息,首先联系监控查看有无该站的E1相关告警,确定有无E1告警,根据告警及定位信息分析可能故障原因。
基站原因,由代维上站解决。
转3)。
传输原因,跟传输配合解决。
转7)。
基站数据原因,跟无线配合解决。
转8)。
无E1相关告警,转9)。
3)用PC机通过主控板ETH口登陆NODEB进行近端维护,打开告警查询面板查看基站有什么告警,根据告警信息可以定位那条E1故障。
在MML下用DSP E1T1可以查看E1的状态,从而找到故障端口。
4)从DDF找到故障端口,环回E1到基站端,用DSP E1T1查看端口链路状态是否显示为正常。
正常,则 DDF到主控板正常。
转5)。
故障或有其他告警信息,则DDF到主控板故障,检查E1线和头。
查看故障是否恢复。
恢复转9);未恢复转6)。
5)从DDF环回E1到RNC,联系监控查看基站端口状态。
从电源方面去解决华为Metro1000光传输设备异常的探讨
从电源方面去解决华为Metro1000光传输设备异常的探讨摘要:就佛山供电局光传输网络应用比较普遍的华为Metro1000设备,通过分析典型故障范例的形式,探讨了如何从电源方面去解决华为Metro1000光传输设备的一些相关异常现象,保证电力光传输网络的可靠、稳定运行。
关键词:电源;光传输设备;Metro1000;故障;范例1 前言在全球信息化进程明显加快,人类社会从工业社会向信息社会演进的今天,随着光纤通信网络应用的迅速发展,在电力系统中,光传输网络的应用越来越广泛,规模越来越大,其承载的业务也与日俱增,而且业务的重要性越来越突出,光传输网络的可靠、稳定运行直接关系到了电力系统的安全生产。
在光传输网络的实际运行维护中,对于设备的故障处理,更多地是从光传输介质、设备单板、设备软件几个方面去考虑,而忽视了电源方面。
虽然随着近年来通信行业的飞速发展,通信供电的质量、种类、稳定性、可靠性得到了很大提高,但在实际运行中,电源方面引起的设备故障往往是比较严重的,轻则影响通话和信息传递质量,重则中断通信,导致通信系统全阻,直接影响电力生产,因此设备故障时,应作全面的分析,避免对电源方面的疏忽。
下面就佛山供电局光传输网络应用比较普遍的华为Metro1000设备,探讨一下如何从电源方面去解决日常出现的一些异常现象。
2 设备基本情况目前佛山供电局华为光传输网络共有网络节点221个,其中Metro1000设备类型节点64个,占用比例约29%。
华为Metro1000原名为OptiX 155/622H,又叫“紧凑型SDH”、“盒子式SDH”,其采用盒式集成设计,由机盒、风扇板、电源滤波板(电源模块)、插板区和防尘网构成,满足IEC297 19英寸2U标准插箱设计规范。
机盒除了金属框架外,内部还配带有电源母板,主要是为单板提供接口,以及为设备提供各种所需电压等级的电源。
电源模块位于Metro1000设备背面板的右侧,配置有-48V电源模块或+24V电源模块两种类型,在实际运行中,考虑到通信站一般配置的蓄电池和通信电源的直流部分都是-48V,佛山供电局目前运行中的Metro1000设备均采用-48V电源模块。
华为SDH设备主控板常见故障及处理
华为SDH设备主控板常见故障及处理当前,因光纤通信技术具有抗干扰能力强,传输速度快、传输信息量大等优点,广泛应用于通信行业,越来越多的单位配置各类光端机,运用光纤技术来传输图像、声音、数据和其它信息,目前华为SDH设备的应用比较普便,有Metro1000、Metro3000、OSN3500、OSN7500、OSN1800等型号,然而应用过程中不可避免的会出现一些故障,有光路问题、设备数据接口问题、设备板卡故障问题等等,本文以华为SDH设备Metro系列主控板常见故障为例进行分析。
一、主控板性能介绍(一)主控板的概念主控板也叫系统控制及通信板(System Conrtol&Communication unit),简称SCC板,具备完成主控与公务的功能,主控是完成设备的系统控制及通信功能,提供设备与网络管理系统的接口。
公务是提供公务功能和开销处理,主要完成公务字节E1和E2,通道字节F1及四个未用字节X1、X2、X3和X4的提取和插入、交换和处理。
(二)主控板的主要功能1.协同网络管理系统对网元的各单板进行管理,实现对设备网元及整个同步设备网络的实时监控、维护和管理。
2.转化、处理和存贮来自设备其它各功能模块的性能事件和告警,同时将控制、管理信息传递给设备各功能模块。
3.处理D1-D12字节,实现网元之间的通信。
DCC的处理有多种方式,如只处理D1-D3或D4-D12或D1-D12;并方便不同厂家设备对接,可以实现DCC的透传。
4.提供设备与网络管理系统连接的F接口和Q接口,实现设备与网络管理系统之间的通信。
F接口采用RS-232接插件,Q接口采用RJ-45接插件。
5.可通过网线直连、局域网、广域网等多种方式建立网管终端与设备间的连接。
6.完成开销字节E1、E2、F1及其它四个用户字节的提取、交换、插入。
7.通过主备环重复利用E1、E2 字节,单站最多可提供三路公务电话,接插件采用RJ-11。
华为设备常见故障汇总
华为软交换常见故障故障简单分析和处理1.磁盘空间告警告警信息: IGWB介质空间不足。
告警分析:主用IGWB在剩余磁盘空间小于15%的时候就会出磁盘空间告警,省公司要求话单保存时间:原始话单15天(D盘),格式转换后的话单15天(E盘),最终话单90天。
告警处理:删除部分格式转换后的话单(E:\backsave\Second\X3KM\),剪切部分最终话单到应急工作站(暂时),建议增加IGWB硬盘空间。
2. 备用IGWB磁盘空间不足故障现象:备用IGWB磁盘空间不足故障分析:备用IGWB是实现话单双备份的组成,并且如果备用IGWB磁盘剩余空间过小,主用IBWG异常的时候将无法倒换。
故障处理:清理备用IGWB磁盘空间。
3. 单板故障告警信息:例如WSMU 板故障;单板CPU自检故障。
告警分析:无告警处理:1.复位 2.拔插 3.更换4. 电源故障告警信息:-48V 电压过高告警。
告警分析:告警产生原因:1. 动力进行例行放电测试,导致电压临时过高.2.电压已恢复正常,但告警未自动消除,出现假告警.3. 电压过高导致.根据指令DSP PDB可以查询到系统的电压正常范围是-42V~-57V,经常观察如果电压过高后,告警会在电压降到-54V 的时候消除。
如果告警长时间未自动恢复,可以用万用表测电压,看是否在正常范围内,如果电压已正常,可以手动把电压的门限值进行调高,使告警恢复后再把门限值调到正常范围内。
告警处理:1.联系动力专业,确认是否在进行电池放电测试,如是,在测试完成后观察告警是否消除.2. 根据指令DSP PDB可以查询到系统的电压正常范围是-42V~-57V,经常观察如果电压过高后,告警会在电压降到-54V的时候消除。
如果告警长时间未自动恢复,可以用万用表测电压,看是否在正常范围内,如果电压已正常,可以手动把电压的门限值进行调高,使告警恢复后再把门限值调到正常范围内。
(现在配电框监控板默认的告警上限目前定义为57V,产品设置时,可在此基础上加3V,设置为60V比较合适。
华为eNodeB_LTE常见故障分析指导
eNodeB对报文处理流程是先根据IP Route查询对应的下一跳的MAC地址(对应ARP表项),只有 在有ARP表时,才直接把此报文发送出去(ICMP,SCTP,UDP等等);如果eNodeB上没有此ARP表 时,则先会发一个ARP请求的广播报文,来请求下一跳的MAC地址。
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 14
ARP/IP层故障排查
在出现IPPATH、SCTP等告警信息时,需要排查传输链路是否可用。 总体思路:检查基站告警信息、检查配置、Ping/TraceRT问题隔离、抓包。
1. ARP不通问题处理思路
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 3
LTE传输故障关注点
Router
Access Network LanSwitch
IP/MPLS Aggregation
Router/ 安全网关
Router
SAE/M2000
Page 2
LTE传输常见问题现象
类别
通断 类 性能 类 安全 类 证书类 常见问题现象
物理端口/链路等电气化故障导致闪断„„ VLAN、路由错误、ARP无法获取或老化导致链路不通 IP冲突、路由冲突等导致IP链路闪断 上层应用链路不通(SCTP、IPPATH、OMCH、CMPV2、时钟„) TCP数传吞吐量不达标 上层应用体验差(VOD、HTTP„) IKE/IPSec协商/重协商失败 IPSec性能类:TCP吞吐量异常„„ OM安全(SSL、FTPS、HTTPS) 安全开站和网络改造类(PnP、USB、网络改造) PKI系统无法访问 证书申请、更新失败(CMPV2) 证书过期、证书撤销等
E1故障处理方法总结
传输E1故障处理方法总结摘要:E1故障告警会影响基站的业务性能和质量,严重则会引起基站断站。
处理前可以根据故障相关告警分析其可能原因,并作出故障的定位和故障处理方法。
处理E1方法主要是检查该E1的头有没有问题,E1线好与坏,传输有无问题,数据配置有无问题等,并根据不同症状及处理方法逐一排除故障。
关键词:告警;故障;数据;环回测试;误码。
1.概述W-NODEB基站与传统2G基站的一个不同之处是NODEB基站需配置的传输物理链路数要多,这样才能满足3G无线高速上网所需的传输带宽,同时,多条传输也减少了基站断站的几率,但也因此提高了传输E1的告警故障几率。
从目前的日常告警清理中,有很大的一部分告警为传输E1 故障。
下面为处理不同E1告警故障后累积的经验,用于快速定位出故障的原因,帮助维护人员更快的处理好故障。
(本文主要针对华为BSC6810和BTS3900设备,虽然本文描述的问题为普遍现象,但对于不同型号或厂家的设备,故障处理方法可能会有所差别,本文谨供参考。
)2.处理E1告警的步骤1)收到E1故障信息,首先联系监控查看有无该站的E1相关告警,确定有无E1告警,根据告警及定位信息分析可能故障原因。
基站原因,由代维上站解决。
转3)。
传输原因,跟传输配合解决。
转7)。
基站数据原因,跟无线配合解决。
转8)。
无E1相关告警,转9)。
3)用PC机通过主控板ETH口登陆NODEB进行近端维护,打开告警查询面板查看基站有什么告警,根据告警信息可以定位那条E1故障。
在MML下用DSP E1T1可以查看E1的状态,从而找到故障端口。
4)从DDF找到故障端口,环回E1到基站端,用DSP E1T1查看端口链路状态是否显示为正常。
正常,则 DDF到主控板正常。
转5)。
故障或有其他告警信息,则DDF到主控板故障,检查E1线和头。
查看故障是否恢复。
恢复转9);未恢复转6)。
5)从DDF环回E1到RNC,联系监控查看基站端口状态。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设备原因
常用方法:
告警性能分析法 逐段环回法 互换、替换法
处理步骤:
分析线路板误码性能事件,排除线路误码。 分析支路误码性能事件,排除支路误码。
典型故障(线路板故障导致的误码)
四个站组成的一条无保护链,1站为网管中心站,集中
型业务,即每个站均与1站有2M业务。
故障定位的常用方法
一分析 二环回 三换板
一、当故障发生时,首先通过对告警事件、性能事件、 业务流向的分析,初步判断故障点范围; 二、通过逐段环回,排除外部故障,并最终将故障定位 到单站,乃至单板; 三、通过换板,排除故障问题。
通过网管获取告警和性能信息,进行故障定位
全面性
不仅是一个站、一块板的故障信息,而且是全网设备 的故障信息;
如: 用误码仪测试业务通断、误码 用万用表测试供电电压,检查电压过高或过低问题
“仪表测试法”分析定位故障,说服力比较强。但 需要采用仪表。
在一些特殊的情况下通过复位单板、单站
掉电重启、重新下发配置等手段可有效及 时的排除故障、恢复业务。
但建议该处理故障的办法尽量少用,因为该 方法不利于故障原因的彻底查清。遇到这种 情况,除非情况紧急,一般还是应尽量使用 上面介绍的方法,或请求支援尽可能地将故 障定位出来,以消除设备内外隐患。
处理步骤
3、逐段环回,缩小故障范围: 在1号站第二支路板的第一个2M通道上挂表测试然后通 过网管逐段进行如下的环回操作。 当站点数较多时,可采用二分法,进行环回操作。
处理步骤
4、逐段环回,定位故障站点和单板: 在对3号站的东向SL4板No.3VC4做外环回时,发现业务不 通,而对4号站的西向SL4板No.3VC4做内环回时,业务正常, 说明问题在3号站的东向SL4板和4号站的西向SL4板之间。
采用环回法应注意的问题:
1、软件环回是一种不彻底的环回,只能初步定位故障的位 置。 2、对远端站点线路板第一个VC4作环回操作时,一定要确 认环回后ECC通信不会中断,才可进行操作。
一旦远端站点的ECC通信中断,则只能到远端站点现场才
能解开环回,恢复ECC通信。 3、“环回法”会导致正常业务的暂时中断,一般只有在出 现业务中断等重大事故时,才使用环回法进行故障排除。
“环回法”的步骤:
1.环回业务通道采样; 2.画业务路径图;
3.逐段环回,定位故障站点;
4.初步定位单板问题。
一、环回业务通道采样:
1、从多个有故障的站点中选择其中的一个站点; 2、从所选择一个站点的多个有问题的业务通道 中选择其中的一个业务通道。由于自环第一 个VC4通道,可能会影响ECC通信,因此尽 量不要选择第一个VC4通道内的业务。
熟练掌握所维护传输设备的基本操作 熟悉所维护局的情况
(组网拓扑、保护属性、业务分配、命令行配置)
作好现场数据的采集与
故障定位的确关键:
将故障点准确地定位到单站
由于传输设备站与站之间
的距离较远,在进行故障
定位时,首先就应将故障 点准确地定位到单站。
故障定位的原则
先外部,后传输
在定位故障时,应先排除外部的可能因素,如
故障现象
复用段保护倒换后业务正常的必要条件:
1、线路板正常监测到告警,正常传递K1、K2字节。
2、主控板正确处理K1、K2字节,保护倒换协议正常。 3、交叉板接受主控板发来指令,正常倒换。 4、保护倒换的备用通道正常。
处理步骤
1、中断业务样本采样:
选取1号站第二支路板的第一个2M通道,即1站的t2:1。 2、保护倒换前,样本业务1号站的t2:1走的路径如图所示
复用段环 w 3 e e 2 w OptiX MSP环 w 4 e w e
1
w
5 e
组网配置
某局Optix 622复用段保护环,组网图所示,1号站为网管中心站。 某日,维护人员发现,2站、3站相连的线路板出现RLOS告警,各站 交叉板均有保护倒换告警,查询各节点倒换状态正常。但3号站与1 号站的业务中断(N0.1个VC4),其它站业务正常。
1. 排除传输外部设备故障: 分离传输问题还是交换机问题 光纤故障的排除 中继线缆故障的排除 2.故障定位到单站 供电电源故障的排除 将故障定位到单站,最 接地问题的排除 常 用 的 方 法就 是 “ 环 回 法”。 另外,告警性能分析法, 也是将故障定位到站点 3.故障定位到单板并最终 比较常用的方法。 排除 故障定位到单站后 , 进一步定位故障位置 最常用的方法就是替 换法。
e
1 w
故障现象
1号站、3号站、4号站相应的2M业务通道报LPBBE、 LPFEBBE误码;2号站东向板、3号站东西向光板、 4号站西向光板报大量RSBBE、MSBBE、HPBBE以 及MSFEBBE、HPFEBBE误码,一些光板还存在大 量指针调整。
处理步骤
从误码性能事件分析,3号站的时钟单元故障。 到达3号站,更换交叉板,误码消失,故障排除。
光纤断,交换故障或电源问题等。
先单站,后单板
在定位故障时,要尽可能准确地将故障定位到 单站。
先线路,后支路
从告警信号流中可以看出,线路板的故障常常 会引起支路板的异常告警,因此在故障定位时, 应按“先线路,后支路”的顺序,排除故障;
先高级,后低级
在分析告警时,应首先分析告警级别高的告警, 如危急告警、主要告警;然后再分析低级别的 告警,如次要告警和一般告警。
组网配置:
故障现象:
1站2M支路板有LPBBE误码 3站东向光板有RSBBE、MSBBE、HPBBE误码 4站西向光板有MSFEBBE、HPFEBBE误码 4站2M支路板有LPFEBBE误码
处理步骤:
通过对上报的性能事件分析,可判断为3站东 向光板收有问题或4站西向光板发有问题。
处理步骤
5、更换3号站东向SL4板,故障仍存在。 更换4号站西向SL4板,故障排除,说明该板不能正 常穿通No.3VC4。
常见原因
外部原因
光纤性能劣化、损耗过高 光纤接头不清洁或连接器不正确 设备接地不好 设备附近有强烈干扰源 设备散热不好、工作温度过高 线路板接收侧信号衰减过大、对端发送 电路有故障、本端接收电路故障 时钟同步性能不好 交叉板与线路板、支路板配合不好 支路板故障 风扇故障 板失效或性能不好
到达3号站,通过尾纤自环3站的东向光板,3
站东向光板误码和1站2M支路板误码消失,说 明是4站西向光板问题。
到达4站,更换西向光板,误码问题解决。
典型故障(时钟板故障导致的误码问题)
四个站组成的一个复用段保护环,1站为网管中心站, 每个站均与1站有2M业务。
组网配置:
w 3 e
e 2 w MSP环 w 4 e
二、画业务路径图:
画出所采样业务一个方向的路径图。 在路径图中表示出:该业务的源和宿,该业务所经过的站 点,该业务所占用的VC4通道和时隙。 例如:
三、逐段环回,定位故障站点
依据中断业务的路径图,在1号站第2块支路板的第1个 2M通道外接一个2M误码仪,监测业务好坏。
“替换法”就是使用一个工作正常的物件去替换一个
分类故障的处理
常见原因
外部原因 供电电源故障,如设备掉电、供电电压过低等 交换机故障 光纤、电缆故障。如光纤性能劣化、损耗过高,或 光纤损断;中继电缆脱落、损断或接触不良等 人为原因 误操作设置了光路或支路通道的环回 误操作更改、删除配置数据 设备本身故障 单板失效或性能不好
故障现象
4站支路板有TU-AIS告警,1站支路板对应通道有LP-RDI告警, 1站和4站的2M业务中断。
处理步骤
1.在1号站挂一2M误码表,监测1号站与4号站的2M业务。 2.通过网管对4号站的支路板作软件内环回。若仪表显示 业务正常,则说明是4号站有问题,进入第三步。若仪表显 示业务中断,则说明传输设备有问题,进入第四步。 3.在4号站的DDF配线架上,再作一个对传输设备的硬件 内环回,若此时仪表仍显示业务正常,则说明传输设备没有 问题。需排除交换机或中继电缆的问题。 4.分别对1号站西向线路板、2号站东向线路板、3号站东 向线路板作内环回。
5.若环回2号站东向线路板业务正常,环回3站西向线路板 业务不通,则可能3站有故障或2站的东向线路板有故障。 6.到达2号站,通过尾纤将东向线路板环回,若此时1站挂 表测试的业务正常,则说明2站东向线路板没有问题,故障点 在3站或光缆有问题,直接转第7步。 若环回后业务不通,则说明该板有故障。通过更换该板, 排除此处故障,若此处故障排除后,业务恢复正常,则故障处 理完毕。否则继续作逐段环回。 7.到达3号站,对3号站作单站测试,通过尾纤将西向线路 板环回,发现业务不正常,更换3号站西向线路板,故障排除。
SDH网元之间传递信息是通过ECC通信来实 现. ECC的物理层就是DCC通道,即SOH中的D1 -D12字节。OptiX 系列产品使用其中的D1- D3字节,即再生段DCC,速率为192Kbit/s。
故障分析与处理方法
杭州纵横
内容
传输故障分析方法
传输分类故障的处理
目标
掌握OptiX传输设备常用的故障分析方法
掌握OptiX传输设备典型故障业务中断、误
码、ECC的处理方法