网元告警处理流程图
PTN告警处理情况
恢复设备供电或修复链上设备的光缆后消除
未处理自行恢复 恢复设备供电或修复链上设备的光缆后消除 未处理自行恢复
直接清除告警
检测现网设备电源正常,怀疑为误报,已告知中移和华为人员进行检查分析, 部分告警自行恢复 现网检查告警均为LTE业务的工作或保护PW 失效导致,目前检查处理约20条 业务后发现重新配置业务的TUNNEL并更换至PW 后可消除告警,但原 TUNNEL也正常。部分告警自行恢复或闪报。需要华为进行分析故障原因 检查PW 中断原因并处理,多为光缆或停电导致的TUNNEL中断故障导致 未处理自行恢复 处理MPLS_PW_LOCV、PW_APS_DEGRADED、PW_APS_OUTAGE等告 警后消除
次要 次要 重要 次要 重要 紧急 重要 重要 总数
安全管理员组用户修改其他用户密码告警 任务执行失败告警 数据库备份 数据库表记录数达到阈值 数据库日志异常 数据库占用率过高告警(次要) 数据库自增长失效 隧道组断开 总数
告警原因 网管服务器提示告警---性能值越限事件日志越限
TUNNEL两端设备的一端不支持MPLS OAM Y.1731模式
设备掉电导致的设备通信中断或脱管
网元反复复位5次上报该告警 设备掉电导致的设备通信中断或脱管 输出光功率过高或过低
网元默认密码未修改的提示告警
设备电源模块故障或只接一路电源
带保护业务的工作或保护业务中断导致保护降级
PW APS保护业务中的一条PW 中断 PW APS保护业务的主备通道均中断 PW APS保护业务未配置保护通道,现网告警多为 MPLS_PW_LOCV、PW_APS_DEGRADED、 PW_APS_OUTAGE的伴随告警
联系华为人员后反馈不影响业务,可直接清除,彻底解决需要软件升级
5G网络告警分析处理
目录 1、射频类故障处理流程
射频类告警处理流程
1、判断BBU到RRU光纤故障,可以使用光功率计测试收光功率, 接收光功率下限-14dBm。 2、判断光模块故障,可以使用替换法,即把好的小区的光模块 与故障小区光模块互换。
射频类告警处理1-离线类
射频单元维护链路异常告警、射频单元交流掉电告警、射频单元CPRI接口异常告警、射频单元光模块收 发异常告警、BBUIR光模块收发异常告警等
3、干扰排查。确认GPS配置和设备硬件无故:
令DSP GPSSNR查询 提取主控
卫星的信噪比,大部分 板一键式
都为0;因此,怀疑
日志送研
GPS天线周围存在干扰; 发进行分
析,分析
报告显示,
卫星信噪
比较低,
进一步确
认干扰存
在;
步骤三:现场 步骤四:因为该站点
➢ 功分器故障定位步骤 跳过功分器设备,把GPS天馈直接接到其中一台主设备,查询GPS状态,判断功分器是否 故障。
18
4G时钟类故障处理案例-星卡锁星不足告警
问题描述
同一物理站点泸水三 河村委会站点,同时 开通TDD泸水县三河 村委会-LHHN及FDD 泸水县三河村委会FHHN站点,查看基 站告警,两个站点同 时上闪断上报“星卡 锁星不足告警”;
4G时钟类故障处理案例-星卡锁星不足告警
告警处理过程
1、GPS配置检查。使用MML命令DSP GPS/LST GPS查询GPS状态发现,GPS工作模式、天线掩角配置等 均正常。因此,排除因GPS配置错误导致“星卡锁星不足告警”;
2、硬件检查。现场排查主控板、GPS、接头以及他们之间的馈线均连接完好,并查看当前告警也无硬件相 关告警。因此,排除因硬件故障导致“星卡锁星不足告警”;
5G网络典型告警分析和问题处理方法
可能原因:电源柜、电源线故障;DCDU/电源柜空开不足;市电电压不足
处理建议及方法:
电
1. 检查DCDU空开、电压 2. 检查电源柜空开
力 3. 检查市电电压
类 2、射频单元维护链路异常告警
告警解释:BBU和射频单元之间电缆或者光纤中断
可能原因:射频单元交流掉电、射频单元直流掉电、未上电或运行异常;BBU与射频单元之间或者上下级射频单
故障处理流程图
历时故障处理
新增告警处理
联系后台确认故障
配置类告警先 处理
未处理恢复
确认详细故障和工 具,上站处理
处理恢复
现场处理故障
处理恢复
未处理恢复
联系后台确认故 障是否全部解决
详细记录故障无 法处理原因,为 下次上站做好准
备
检查设备标签、 维护资料
处理结束
故障的定位排查
故障定位常用办法
定位方式
查野战光缆、跳纤或者光模块(光模块波长与无源波分端口是否匹配、光模块 硬件)问题 3. 如部分光路出告警,优先排查野战光缆、跳纤或者光模块(光模块波长与无源 波分端口是否匹配、光模块硬件)问题,再排查无源波分部分端口故障
CPRI接口故障涉及的硬件组成
BBU侧常见的故障
2、传输光接口异常告警、传输光接口性能恶化告警
BBU侧常见的故障
常见故障
BBU直流输出异常告警、单板下电告警、gNodeB退服告警、网元连接中断
1、BBU直流输出异常告警
告警解释:BBU内UPEU单板输出过压或欠压 、UPEU单板功率不足
可能原因:UPEU单板硬件故障、UPEU未上电、UPEU供电不足、电源或电缆连接不正确、输入配电不正常 UPEU电源板供电异常
光网络告警处理
1.APS_FAIL1.概述APS_FAIL告警表示保护倒换失败指示(APS Protection switching failed),为主要告警,ASCC板会上报此告警。
2.告警原因●复用段保护倒换过程失败。
3.处理步骤步骤操作1检查复用段环上的业务配置是否正确,修改错误配置后,查看告警是否排除。
2.APS_INDI1.概述APS_INDI告警表示复用段保护协议状态指示告警(APS State indicatealarm),为主要告警,ASCC板会上报此告警。
2.告警原因●发生复用段保护倒换。
3.处理步骤步骤操作1本告警表示发生了复用段倒换,排除复用段保护故障后,查看告警是否排除。
3.APS_MANUAL_STOP1.概述APS_MANUAL_STOP告警表示复用段协议人工停止(APS Manual stop),为次要告警,ASCC板会上报此告警。
2.告警原因●停止了复用段协议。
3.处理步骤步骤操作1启动复用段协议。
4.AU_AIS1.概述AU_AIS告警表示AU告警指示(AU Alarm indication),为主要告警,SL64,SF64,SL16,SL16A,SD16,SD16A,SLQ4,SLQ4A,SLH1,SLO1,SP16,SP08,GE02,FE08,EGT2板会上报此告警。
2.告警原因●对端站发送AU_AIS;●对端站发送部分故障;●本站接收部分故障。
3.处理步骤危险:如果交叉时钟没有热备份,复位、更换该单板,会导致业务中断,属危险操作。
更换线路板,需要保证线路板的传输距离与原线路板一致。
步骤操作1在网管上查看是否有高级别的R_LOS、R_LOF、B1_EXC、B2_OVER告警,优先处理这些高级别告警后,查看告警是否排除。
2检查网元是否处于保护倒换运行状态,排除倒换故障后,查看告警是否排除。
3检查网元的业务配置是否正确,修改错误的配置后,查看告警是否排除。
4利用告警分析法和环回法,定位故障发生的网元。
传输设备常见告警解释及处理建议
传输设备常见告警解释及处理建议LianLv一、 LOS 告警:信号丢失1、正常情况下两个网元之间要通信,中间的信号流必须是畅通的,如下图;2、从上图可以看书信号从MSC 发出2M 信号,经过SDH 设备复用后传递给下一个设备,最后末端SDH 设备解复用出2M 信号给另一端的MSC 。
也就是说,产生信号源的设备是发出信号的设备,当相邻的设备收不到对端发出的信号时就会上报LOS 告警,即信号丢失;A 、上图中由于SDH2发出的光信号SDH1收不到所以SDH1的收光口会上报LOS 告警;B 、上图中MSC2发出的2M 信号由于2M 线中断导致SDH2的2M接口收不到信号,所以SDH2的2M 接口会上报LOS 告警;C 、 上图是MSC1收不到信号的情况;说明:在通信标准中信号丢失的告警名都为LOS,但是不同厂家在编写网管软件时其有所不同,比如:华为公司传输设备,光口收不到信号上报告警为R-LOS ,支路口(2M 口)收不到信号时报T-ALOS;二、 LOF 告警:帧丢失1、当收到的信号功率太大或太小时都会上报OOF 告警;2、是指可以收到信号,但是检测不到信号的开始位置。
一般在波分和SDH 相连时,由于中继段线路中断,造成SDH 设备收到的信号为非调制光。
四、 AIS 告警:全1指示告警举例:SDH2收不到BTS 发来的2M 信号,SDH2会上报LOS 告警,并下插“1”码,当BSC1收到的2M 信号为全要“1”的时候就会上报AIS 告警。
这个故障我们日常维护中经常碰到,如果基站发送处理的2M 信号在中间传输环节中中断,BSC 的dip 端口都会上报AIS 告警。
五、 RDI 告警:远端告警指示举例:当BTS 收到的2M 信号在传输途中中断,但是BSC 可以收到BTS 发送的信号,那么BTS 就会发送AIS 信号给BSC ,当BSC 收到AIS 信号时就会上报RDI ,即远端告警指示说明故障点在BTS 端。
网管系统告警产生和处理机制
网管系统告警产生和处理机制1.1.1告警来源和产生机制1、SYSLOG日志(被动接收方式)通过采集服务器的SYSLOG服务,接收网元发送上来的SYSLOG日志记录。
告警采集程序通过rules将SYSLOG日志记录解析为告警记录。
一条典型的华为端口DOWN告警解析过程:Jul 15 19:54:11 133.63.254.190 2008 yaan-DC-R-N40 IFNET/5/UPDOWN:Interface Ethernet1/0/5 Turns into DOWN state针对上面的告警,通过rules,主要解析出如下内容告警来源IP:133.63.254.190告警类型:IFNET/5/UPDOWN告警对象:Ethernet1/0/5告警原始级别:5告警描述:Interface Ethernet1/0/5 Turns into DOWN state2、Snmp Trap告警(被动接收方式)告警采集在162端口监听并接收网元发送过来的TRAP通知,通过加载相应MIB里的TRAP定义或者厂家提供的TRAP告警翻译规则,转换为相应的告警记录。
举例说明:10.102.16.2:TRAP[requestID=0, errorStatus=Success(0), errorIndex=0,VBS[1.3.6.1.2.1.1.3.0 = 229 days, 12:07:02.00;1.3.6.1.6.3.1.1.4.1.0 = 1.3.6.1.4.1.3902.1015.1010.1.10.1.17;1.3.6.1.2.1.2.2.1.1 = 808584704]]根据中兴提供的TRAP告警定义:(1)1.3.6.1.4.1.3902.1015.1010.1.10.1.17代表zxAnEponOnuErroredSymbolPeriodEvent,即ONU错误符号间隔事件,级别是主要。
(2)808584704 代表索引信息,可进一步定位到具体的ONU设备,如F820(0/4/4/5)。
网元断链告警处理案例
➢网元断链告警处理案例1.故障现象描述✧在双模站点开通过程中,部分站点在初期会有断链情况。
告警显示“网元断链告警(198099803)”这样的话,后台就无法监控到断链站点的状态。
2.故障分析排查思路1、只有个别基站在所属网管服务器上面断链,可以排查网管服务器故障;2、大批基站集中断链,可以排除基站本身硬件、供电故障;3、如果个别站点在正常运行,排除基站无硬件、供电故障后,出现断链,一般为传输问题,需要联系移动传输室来联合排查定位;3.传输网络结构介绍✧LTE基站OMC维护网络从IP传输网络架构来看,可分为3段,依次是:基站------基站网关------网管服务器网关------网管服务器。
整个传输网络结构如下图所示:4.网元断链故障处理流程5.故障排查总结通过上述的排查总结如下:1、首先确认BBU设备是否运行正常,站点传输设备是否正常,基站供电系统是否正常。
2、然后检查下站点的配置数据,确保站点配置无误,可能由于传输割接导致站点断链。
网管配置参数如下图所示:网元中配置的OMC操作维护地址:基站传输网络→IP传输→IP层配置中的OMC操作维护地址:基站传输网络→IP传输→OMC链路服务器地址:3、关于ping命令,有两种使用情况:a)从后台ping前台基站的话:直接在网管服务器上:ping ip地址。
b)从前台基站上ping后台服务器:需要通过使用LMT工具来,下面简单介绍其使用方法:启动EDMS登录基站---Ping包检测—设置ping的包大小,次数及相应的IP地址---再点击对应的按钮开始测试。
Ping包检测开始后,会在ping包信息区域显示每次ping包的详细信息。
Ping包结束后,会在ping包统计区显示统计信息,包括是否存在丢包、延时等等。
SDH告警分析与故障处理
SDH告警分析与故障处理1.告警名称:信号丢失(R-LOS)告警产生的原因:断纤;线路损耗过大,导致收光功率超出灵敏度值;对端站发送方向无系统时钟;对端站激光器损坏,线路发送失效;对端站交叉板没有时钟输出;对端站时钟板工作不正常. 告警处理步骤:测试告警单板的接收光功率,如果光功率正常则检查板上接头有无松动,如果接头良好则更换告警单板;如果光功率很小或接近0mW,检查对端至本站的光缆是否松动;如果光缆线路正常,检查对端站光发送板接头是否松动,如果接头良好则更换对端站光发送板。
2.告警名称:帧丢失(R-LOF)告警产生的原因:光损耗过大;对端站发送信号无帧结构;本端接收方向有故障。
告警处理步骤:检查告警单板接收光功率,如果光功率正常则检查告警单板是否存在问题;如果光功率超出正常范围,则检查对端站至本站光纤及其接口是否损坏;如果光纤及告警单板都正常,则检查对端站光发送板设法存在问题。
3.告警名称:帧失步(R-OOF)告警产生的原因:接收信号损耗偏大;传输过程误码过大;接收方向器件有故障;对端站发送有故障。
告警处理步骤:检查告警单板接收光功率,光功率正常则检查告警单板是否存在问题;如光功率超出正常范围,则检查对端站至本站光纤及其接口是否损坏;如光纤及告警单板都正常,则检查对端站光发送板是否存在问题。
4.告警名称:发送失效(TF)告警产生的原因:光发送模块损坏;告警处理步骤:更换故障单板5.告警名称:再生段误码过量指示(B1-EXC)告警产生的原因:接收信号损耗偏大;对端站光发送电路高频部分有故障;光纤不清洁或与连接器不正确;本站接收电路部分故障。
告警处理步骤:如果同时也出现B2、B3告警,故障往往是线路损耗过大或由光接口板的故障引起,定位方法同出现R-LOS的情况;检查设备工作温度是否过高;如无以上情况,更换故障单板。
6.告警名称:复用段告警指示(MS-AIS)告警产生的原因:对端站发线路AIS信号;对端站发站发方向无时钟或无信号告警处理步骤:检查对端站线路板(ASP等)是否存在问题,可通过复位或更换单板的方法检查告警是否消失;检查本站线路板,先更换光接收板,如未解决再更换ASP板。
通信传输设备故障汇报处理流程图
通信传输设备故障汇报处理流程一、华为传输设备(一)当TMS中发现根告警所属系统为华为SDH传输系统时,根据告警原始原因分为以下几种处理情况:1、R_LOS(接收线路侧信号丢失告警)(1)TMS告警定位查看流程:当告警原始原因为R_LOS时,查看告警对象为XX站点XX设备X槽XX网元号XX框XX槽XX板XX端口,右键此条告警选择告警定位后进入传输拓扑图,若能直接定位到网元可直接双击进入设备面板图查看告警,若无法定位,点击分层加载图标将所有网元加载完毕后,在搜索一栏输入站点名称,选择告警对象中的网元型号进行定位,选择网元双击直接进入设备面板图,双击告警对象中的槽位进入板卡试图,选择告警对象中的端口查看对端站点设备槽位及端口。
(2)R_LOS告警描述及原因:告警描述:R_LOS告警表示线路接收侧信号丢失(Receive loss of signal)。
该告警产生后,业务中断,并向下游下插AIS信号。
产生该告警后,系统会自动向上游站点回告MS_RDI,上游站点会产生MS_RDI 告警。
告警原因:①断纤(干线光缆故障或局间光缆故障引起);②连接件故障(与该单板相连的波分系统的连接件,连纤);③线路衰耗过大或光功率过载;④对端站发送部分故障,线路发送失效;⑤对端站交叉板故障或不在位;⑥对端站时钟板故障;⑦本站接收部分故障(本端SDH设备的连接件,连纤,单板)⑧对端站设备停电。
(3)告警通知流程:①当告警对象站点设备与对端站点设备为同一管辖围,调度值班员通知相关管辖运维分部生产值班员核查告警原因,并告知在45分钟之反馈告警原因及影响的重要业务(保护、稳控、自动化、调度数据网、视频会议、广域网)。
②当告警对象站点设备与对端站点设备不在同一管辖围时,调度值班员应查看告警对象站点设备和对端站点设备是否同时发生R_LOS告警,若同时发生R_LOS告警,调度值班员通知两个站点相关管辖运维分部生产值班员核查告警原因,并告知在45分钟之反馈告警原因及影响的重要业务;若对端站点设备未发生R_LOS告警,调度值班员通知告警对象设备管辖运维分部生产值班员核查告警原因,并告知在45分钟之反馈告警原因及影响的重要业务。
故障排查流程图
是否该原因引起?
是
否 可能原因2:UDC时钟单板硬件故障;
是否该原因引起?
是
否
可能原因3:UDC网元与NTP服务器之间传输 故障;
是否该原因引起?
是
否 可能原因4:NTP服务器侧数据配置错误;
是否该原因引起?
是
否 可能原因5:NTP服务器侧单板硬件故障;
是否该原因引起?
是
是
提供解决方案经验总结 Nhomakorabea结束爱立信新建网元UDC设备NTP同 步不可用故障告警
故障可能原因: 1、UDC网元侧NTP时间同步数据配置错误; 2、UDC时钟单板硬件故障; 3、UDC与NTP服务器之间传输故障; 4、NTP服务器侧数据配置错误; 5、NTP服务器侧单板硬件故障;
可能原因1:UDC网元侧NTP时间同步数据配 置错误;
精品文档_5G单板硬件故障告警处理
5G单板硬件故障告警处理案例目录一、问题描述 (3)二、分析过程 (4)三、解决措施 (5)四、经验总结 (7)5G单板硬件故障告警处理案例【摘要】在现网5G网元中,单板硬件故障告警导致的业务体验下降及业务异常等问题时有发生。
导致异常可能是因为单板硬件故障或单板未插紧等。
本案例针对5G单板出现硬件故障到解决问题的处理过程分析,从而快速高效的恢复业务。
【关键字】UBBPg7a、UBBPg7b、单板硬件维护【业务类别】BBU硬件维护一、问题描述在蚌埠电信新小蚌埠局机房中5G BBU04、BBU05的0槽位均出现单板硬件故障并伴随单板软件运行异常告警,见图1-1、1-2;图1-1 BBU04设备面板图图1-2 BBU05设备面板图但是0槽位基带板所连接的AAU设备面板图出现不一样的状态,见图1-3、1-4;图1-3 BBU04 AAU设备面板图图1-4 BBU05 AAU设备面板图二、分析过程2.1 告警信息核对新小蚌埠局BBU04、BBU05同一时间段内出现单板硬件故障告警,相同的槽位和相同的时间是否存在关联信息。
告警信息见图2-1;图2-1 网元当前告警2.2 MML配置状态查询BBU04设备面板查询该板件所带AAU状态正常,查询小区业务是否正常。
在MML执行ACTNRCELL/ACT NRCELL,紧查询所带业务不可用,查询结果如图2-2;图2-2 BBU04 0槽位所带AAU小区状态BBU05设备面板查询该板件所带AAU状态异常,所带业务不可用。
综述,BBU04、BBU05两块基带板异常。
三、解决措施1、首先远端下电复位两台0槽位故障基带板,设备面板上执行下电复位单板指令,执行后故障未恢复。
见图3-1;图3-1 下电复位单板2、然后,闭塞单板通知工程人员在近端插拔单板或者跟换单板。
工程人员到达现场先拆卸故障单板和线缆重新插入。
BBU04故障的单板正常一段时间后又出现故障;BBU05故障的单板已恢复正常,所连接的AAU设备同时恢复正常。
课程04:常见告警
课程4:常见告警4.1目的1、告警和开销字节之间的关系,以及可能原因2、TU-AIS告警产生流程图3、SDH设备各功能块的告警流程图4.2 告警和开销字节4.2 TU-AIS 产生流程TU—AIS告警产生流程图在维护设备时还有一个常见的原因会产生TU—AIS,那是将业务时隙配错,使收发两端的该业务时隙错开了。
图5-6为例:业务时隙配错导致TU—AIS发端A有一个2Mb/s的业务要传与B,A将该2Mb/s的业务复用到线路上的第48个VC12中,而B下该业务时是下的线路上的第49个VC12,若线路上的第49个VC12未配置业务的话,那么B端就会在相应的这个通道上产生TU—AIS告警。
若第49个VC12 配置了其它2Mb/s的业务的话,B端就会现类似串话的现象(收到了不该收的通道信号)。
从以上告警流程图可以知道许多危急告警可以下插TUAIS,因此处理TUAIS告警必须先解决危急告警,比如RLOS、RLOF等。
4. 3 SDH 设备各功能块产告警维护信号的相互关系。
告警流程图上图要多看,做到烂记在心时,处理故障就迎刃而解了。
H4.5 工程中常见告警以及处理方法4.5.1 R-LOS 告警告警级别:紧急告警指示:单板告警灯每隔一秒闪烁三次英文名称:Loss of signal中文名称:接收线路侧信号丢失可能原因:(1)断纤;(2)线路衰耗过大或光功率过载;(3)对端站发送部分故障,线路发送失效;(4)对端站交叉板故障或不在位;(5)对端站时钟板故障。
处理方法:(1)一般是光纤断、光纤衰耗太大、接收光功率过载、单板故障等原因;(2)检查光缆是否完好、光接头是否接触良好、清洁光缆连接器;(3)如接收光功率过载加入衰耗器;(4)如是单板故障,更换单板。
4.5.2 TU-AIS 告警告警级别:主要告警指示:单板告警灯每隔一秒闪烁两次英文名称:TU alarm indication中文名称:TU告警指示可能原因:(1)业务配置错误;(2)对端站对应通道失效;(3)由更高阶告警如R-LOS引起;(4)交叉板故障。
E300网管告警性能处理流程小结!
告警预投入
(告警反转)
(1)MCU LOS告警产生,检查该支路是否被设置为反转,若是则只记录但告警不上报,不点灯,否则检查是否被屏蔽,若是记录告警不上报,不点灯,否则上报告警产生;LOS消失,检查该支路是否被设置为反转,若是,上报该支路反转消失,清本地库LOS告警,否则检查是否被屏蔽,若没有则应当上报告警消失,若屏蔽则清本地LOS告警。1.1 MCU上报告警给Agent, Agent参照告警主动上报处理,(2)Agent上报告警给Manager, Manager参照告警主动上报处理,(3)Manager上报告警给GUI,GUI参照告警主动上报处理,结束.
1.2 MCU报给Agent ,Agent告警反转消失,Agent修改告警反转库中的记录;上报告警反转消失,(2)Agent报给Manager ,Manager告警反转消失,Manager修改告警反转库中的记录;上报告警反转消失(3)Manager报告警反转消失给GUI.结束.
1.9
Agent板点灯
2、若是清除24小时性能计数,则清空相应性能数据,并将相应的性能越门限告警上报消失;(3) 3.1 Agent发清空命令给MCU,MCU1、清空相应的性能计数;
2、将相应的15分钟性能越门限告警上报消失;(4)MCU上报告警消失给Agent ,Agent参考主动上报告警处理,(5)Agent上报告警消失给Manager, Manager参考主动上报告警处理,(6)Manager上报告警消失给GUI,GUI参考主动上报告警处理,结束.3.2 Agent上报告警消失给Manager.
到Agent和MCU取
1.3
查询历史告警
(1)GUI按时间段发查询命令给Mananger, (2)Manager转发给Agent,Agent查询,(3)上报查询结果给Manager(空也上报),将上报报文中不在数据库中的记录存入库;将符合条件的历史告警数据上报;若没有收到AGENT的数据,应当上报本地符合条件的历史告警数据,(4)Manager上报查询结果给GUI,GUI显示.
PTN典型故障解决
目录目录目录 (1)典型故障及处理方法 (2)1.1 带内DCN故障处理 (2)1.2 MPLS Tunnel故障处理 (6)1.3 PW故障处理 (7)1.4 CES业务故障处理 (9)1.5 以太网业务故障处理 (13)1.6 时钟故障处理 (16)1.7 QoS故障处理 (17)1.8 LAG故障处理 (21)典型故障及处理方法1.1 带内DCN故障处理介绍带内DCN出现故障时的现象、对系统的影响、可能原因、排除该故障时需要的工具、注意事项以及处理步骤等。
A、前提条件:查看工程文档,确认网元各个单板均使用配套版本。
B、故障现象:处理带内DCN的故障时,通常会遇到以下故障现象。
✧网管与网元通信中断,网管上网元图标变灰色,网元脱管。
✧网管操作命令没有响应。
若响应中断时间持续超过2分钟,网管与网元通信中断。
✧网管查询信息部分丢失。
C、故障处理流程图:带内DCN故障处理流程图如下图所示。
图带内DCN故障处理流程图D、对系统的影响✧网元和网管通信中断后,通过该网元来保持与网管通信的网元,若无其它方法连接网管,也将处于脱管状态。
其它网元则无影响。
✧若承载带内DCN的物理通道故障,则会影响该物理通道上承载的其它业务。
E、可能原因:对应故障处理流程图,带内DCN故障原因如下✧全网内的网元ID、网元IP或者子网掩码存在冲突。
✧故障网元的带内DCN端口未使能,或对接端口参数配置不一致。
✧故障网元与网管之间的物理连接中断。
✧接收信号丢失或接收光功率过低,无法提取DCN报文。
✧单板故障。
✧DCN穿越的第三方网络不健康,引入DCN风暴或DCN中断。
✧带内DCN通道带宽配置过低。
✧故障网元主控板正在复位或发生了主备倒换,带内DCN报文得不到响应。
a)处理带内DCN故障时✧如果网元通信中断,先处理网关网元的故障,再处理非网关网元的故障。
✧如果网元通信未中断,先处理非网关网元的故障,再处理网关网元的故障,避免造成非网关网元脱管。
lte常见告警处理讲解
1【网元链接中断】 (2)2【29243:小区服务能力下降】 (2)3【19240:小区不可用告警】 (5)4【29207:基站控制面传输中断告警】 (8)5【26233:BBU IR光接口性能恶化告警】 (9)6【29201:S1接口故障告警】 (10)7【25888: SCTP链路故障告警】 (12)8【26260:系统时钟不可用告警】 (14)1 【网元链接中断】●告警解释:网元与OMC网管之间的链接中断,一般来讲,为断电或传输问题●对系统的影响对该网元无法控制4结束2 【29243:小区服务能力下降】●告警解释当基站射频资源或基带资源不能满足当前小区的配置规格时,产生此告警●对系统的影响告警小区提供给客户可用的无线空口资源会减少。
●告警处理9结束查询RRU配置通道:查询基站当前告警信息:查询驻波:查询光模块型号,速率:3 【19240:小区不可用告警】●告警解释当基站检测到小区不能提供业务时,产生此告警。
●对系统的影响告警小区不能提供业务。
●告警处理查询小区是否可用:查看RRU是否有告警:查询光路是否OK:查询GPS是否可用:查看是否有License告警:4 【29207:基站控制面传输中断告警】(注:由于网元断链,网管无法对基站控制)●告警解释当基站所有SCTP链路状态都异常时,产生此告警。
●对系统的影响基站所有承载S1Interface、X2Interface的SCTP链路(链路个数不少于2条)状态都异常,导致基站所有S1接口、X2接口无法建立成功,小区无法激活,用户无法入网。
5 【26233:BBU IR光接口性能恶化告警】●告警解释当BBU的IR端口上的光模块的接收或发送性能恶化时,产生此告警。
●对系统影响1、光模块的收发性能严重恶化,可能导致IR链路承载的业务质量严重下降,或导致下级射频单元业务中断。
2、光模块的收发性能轻微恶化,可能导致射频单元该IR链路承载的业务质量出现轻微恶化。
常见光传输设备故障原因及处理流程
常见光传输设备故障原因及处理流程排除光传输设备的故障,最关键的一步是根据网管和设备架、板告警的具体情况,将光传输设备的故障点准确地定位到单站,这是维护人员在现场维护工作中必须牢固树立的观念。
我们都知道,光传输设备的故障定位的一般原则是“先外部,后传输;先单站,后单板;先线路,后支路;先高级,后低级”。
如何在实践中根据光传输设备的网管告警及利用仪表等,在最短时间内落实并处理故障,是每一位维护人员应该具备的业务素质。
1 从功能块告警流程图分析判断光传输设备的告警及原因(1)对于相邻两个网元,在网管上都有R-LOS、R-LOF告警,而没有MS-RDI、MS REI,说明光缆很可能中断,因为远端劣化指示和远端误码指示无法回传.(2)如果相邻两网元本端有R—LOS、R-LOF 告警,另一端有MS-RDI、MS REI,说明远端劣化指示和远端误码指示能够回传,可能是光纤单断或尾纤头脏、衰耗大,或本端收光板或对端发光板有故障.(3) 如果当前网元的东、西两个相邻网元都有相应的R-LOS和R-LOF,并且当前网元无法登陆,一般情况为当前网元掉电,造成两个方向光路不通。
2 单站中光传输设备的常见故障及原因2.1光传输设备的网元无法登录,ECC不通(1) 如果一个或部分网元无法登录,那么其原因可能是:(a)光路衰耗大,误码过量,导致ECC通路不通;(b)主控板故障;(c) SCC板ID拔码不正确;(d) 网元掉电、断纤。
(2)如果全部网元不能登录,则原因可能有:(a) 网管网元SCC主控板故障;(b) 网线、网卡故障;(c) 计算机IP地址和网关网元IP地址不正确. 2.2公务电话不通及其原因(1)如果在设备调测开通期间公务不通,原因可能有:(a)公务电话参数配置错误;(b)开销板配置不正确;(c) 光纤连接不正确。
(2)如果在运行中公务突然不通,原因可能有:(a)铃流板故障;(b) 公务电话损坏;(c)公务电话P/T和RING开关错误。
SDH告警管理说明
SDH告警管理说明SDH告警的上报过程说明告警的上报过程如下:1、单板检测到告警,并上报给主机软件。
2、主机软件将告警上报给T2000 Server。
3、用户通过T2000 Client 从T2000 Server中查询告警。
在这个过程中,告警需要通过三层过滤,才最终被T2000保存下来,这三个过滤分别是:1、告警屏蔽2、告警自动上报3、告警过滤另外,告警反转也影响告警的上报。
一.告警屏蔽对网元或网元的某块单板,可以设置所有告警的屏蔽状态。
如果某告警被设为屏蔽状态,相应的网元或单板将不再监视该告警。
二.告警自动上报在网元上设置了允许告警的自动上报,则设备侧告警产生后立即上报给网管。
网管上弹出告警板,用户可在告警板中查看此条告警信息,不需要主动进行查询。
对一些不必要的告警可以设置为不自动上报,以减少大量的告警信息对网管性能产生影响。
三.告警过滤告警过滤是在网管上实现的,不会影响网元侧告警。
根据告警过滤的配置,对上报的告警进行接收或丢弃。
对告警过滤的设置是针对某个网元进行的。
如果设置告警过滤的状态为“使能”,则网管将丢弃该告警,不记入网管数据库中;如果设置为“禁止”状态,则接收该告警并记入网管告警数据库中。
四.告警反转告警反转有两种级别:网元级别和端口级别。
告警反转有三种模式:不反转、自动恢复、人工恢复。
下面分别进行介绍。
1、不反转模式即告警正常监视状态,为缺省值。
在告警模式设置为不反转时,设置某端口告警反转使能会返回失败,即不能在不反转模式下使能某一端口的告警反转。
2、自动恢复模式下设置某端口告警反转使能,只有该端口当前实际有告警,才能设置成功,进入反转模式。
此时如果告警结束,则该端口的告警反转允许状态自动结束,转为告警反转禁止。
自动恢复模式下设置某端口告警反转禁止,不论该端口当前告警状态如何,该端口的上报告警状态恢复到与实际告警状态一致。
3、人工恢复模式下设置某端口告警反转使能,不论该端口当前告警状态如何,该端口的上报告警状态都立即转变为与实际告警状态相反。
华为OSN2500设备TU_AIS告警
华为OSN2500设备TU_AIS告警华为OSN2500设备TU_AIS告警为TU告警指示。
如果单板检测出TU通道全为1时,上报此告警。
告警参数在华为OSN2500网管中浏览告警时,选中该告警,在“告警详细信息”中会显示该告警的相关参数。
告警参数的格式为“告警参数(16 进制):参数1 参数2…参数n”。
每个参数的含义说明参见下表。
对系统的影响该告警会造成华为OSN2500设备单板通道上的业务中断。
常见故障现象若无对应故障现象,或者故障现象不在本内容列举的故障现象内,请按“处理步骤”中推荐的操作顺序处理。
告警TU_AIS产生的常见故障现象如表所示。
可能原因告警TU_AIS产生的可能原因如下:•原因1:上游网元告警下插至下游网元的AIS信号。
图1 TU_AIS告警的检测1•原因2:业务交叉配置异常。
图2 TU_AIS告警的检测2•原因3:对端发送单板故障(包括交叉时钟板故障)。
•原因4:本端接收单板故障(包括交叉时钟板故障)。
处理步骤1.在华为OSN2500网管上查询告警。
确定产生该告警的单板,并根据告警确定上报告警的通道。
2.原因1:上游网元告警下插至下游网元的AIS信号。
a.沿着业务流向,在本网元及上游网元查询是否存在导致TU_AIS下插高级别告警。
3.原因2:业务交叉配置异常。
a.沿着业务流向,查询业务交叉配置是否正确。
如图2所示,检查NE1与NE2网元间的业务配置。
若NE1与NE2传送一个2Mbit/s业务。
NE1将该2Mbit/s业务复用至线路的第48个VC12时隙中,NE2下载业务时配置到线路的第49个VC12时隙中。
当NE2的该时隙未配置业务,则NE2该通道产生TU_AIS告警。
当NE2该时隙配置了其他2Mbit/s业务,则NE2产生串线问题。
4.使用环回法沿业务信号流定位最初产生TU_AIS告警的网元。
环回操作会导致业务中断。
如果上游网元配置的其他业务使用的通道和本网元上报告警的通道为相同的VC4通道,上游网元不能使用环回法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、半永久连接状态告警A2/APT "WHMSC8*57/GB/0/" 926 020820 0627SEMIPERMANENT CONNECTION FAULTNAMEMSC3-0此告警出现多伴随有信令中断以及DIP中断告警,多为传输故障引起。
如果没有半永久连接所在设备的DIP告警出现,可以先拆除此半永久连接,再按原有定义数据重新定义激活,即可。
若激活不成功,仍有告警,则说明信令终端设备也许有故障,可以另换一个新的C7ST2C设备定义(用STDEP:DEV=C7ST2C-0&&-200;找出状态为IDLE的)。
若告警仍出现,则注意观察与此有关的DIP是否有传输质量告警。
具体步骤为:1、EXSCP:NAME=MSC3-0;找到对应的UPD设备及信令中断C7ST2C-xx2、EXSCE:NAME=MSC3-0,DEV=UPD-xx;拆除该半永久连接3、EXSPI:NAME=MSC3-0;重新定义EXSSI:DEV=UPD/C7ETC4/MALT-xx;EXSSI:DEV=C7ST2C-xx;4、EXSCI:NAME=MSC3-0,DEV=UPD-**;二、SIZE调整告警A2/APZ "WHHLR3*57/GB/0/" 263 020826 1034SIZE ALTERATION OF DATA FILES SIZE CHANGE REQUIRED此告警出现说明有部分FUNCTION BLOCK的SAE值需增加,可根据提示查看需要调整的SAE 值,向爱立信工程师确认此FUNCTION BLOCK SAE值是否可以扩大1、<DBTSP:TAB=SAACTIONS;通过查看SAACTIONS表,找到引起告警的FUNCTION BLOCKDATABASE TABLEBLOCK TAB TABLE WRAPPEDSAFTAB1 SAACTIONS YESACTNUM SAE BLOCK TYPE CNTRTYP CURRNI NEWNI0 700C7OMASE LOCAL CONS1 00NIE NIR STATUS0 0 REGEND通过该例,可以发现需要调整的为SAE=700,BLOCK=C7OMASE,当前值为0,希望增加到的值仍为0,这是一个特例。
可以通过参考同类其他网元的相同BLOCK值。
如果当前和希望增加到的值相同,则可以通过指令<SAALI;RESET此告警。
2、<SAAEP:SAE=700,BLOCK=C7OMASE;SIZE ALTERATION OF DATA FILES INFORMATIONSAE BLOCK CNTRTYP NI NIU NIE NIR700 C7OMASE CONS1 0END3、<SAALI;WO WHHLR3*57/GB/0/1/06/06 NVT-495 TIME 020827 1343 PAGE 1SIZE ALTERATION OF DATA FILES RESULTSAE BLOCK NI NIE NIR700 C7OMASEFAULT CODE 97NI INCREASE TO ZERO REQUESTEDEND注:1、SAALI指令应慎用,因为该指令的作用是自动将BLOCK扩大到系统所期望的值,为避免引起不必要的SIZE调整,仍建议手工调整SAE值。
2、HLR中如果出现SAE=501,BLOCK=ASD以及SAE=261 的SIZE调整告警,不要盲目调整,这两个SIZE的NI值与系统的设计容量有关,最好以释放资源的方式消除告警。
三、IOG卷容量超过门限值告警A2/APZ "WHHLR*57/FC/0/1" 273 020826 0607VOLUME LIMIT EXCEEDEDSPG VOLUME LIMIT0 CHARVOLUME 80%此告警出现说明卷容量超过总容量的门限值,由卷多余文件占用硬盘存储空间引起,确认该告警产生的门限值大小,通常为总容量的80%左右。
删除部分多余文件既可。
但删除文件时应确认该文件是否有用。
<INMCT:SPG=0;:INFIP:VOL=CHARVOLUME; 查看该卷的文件FILE TABLEFILE FCLASSICIFILE00 CMPICIFILE01 CMPRELFSW0 CMPRELFSW8 CMPTTFILE00 CMP经确认,RELFSW8文件为CP DUMP文件,不应存储在该卷中,可以删除。
A2/APZ "WHMSC1*57/FC/0/1" 273 020826 0607VOLUME LIMIT EXCEEDEDSPG VOLUME LIMIT0 EXCHVOLUME 2%此告警虽然也说明卷容量超过总容量的门限值,但显而易见,该告警产生的门限值太小,只有2%。
类似这类告警产生的门限值低于50%的告警,可以通过调整告警门限的方法来消除告警。
inmct:spg=0; :invop:vol=exchvolume; 确认告警门限值大小VOLUME ATTRIBUTES STATUSREV DATE TOTSIZE(KB) USEDSIZE(KB) LIMIT1 201231 10938448 321475 2AVAILSIZE(%) USEDSIZE(%)97 3NODE1 IO1 SIZE1(KB)A HD-1 10938448NODE2 IO2 SIZE2(KB)B HD-1 10938448ENDINVOC:VOL1=EXCHVOLUME,LIMIT=80;修改告警门限值。
END;四、CP故障告警A3/APZC "WHMSC6*57/GB/0/" 806 020825 0222CP FAULT此告警出现说明CP存在硬件临时或永久性错误,CP故障告警根据其严重性分为A1、A2、A3级别,告警出现后应先用指令<DPWSP;查看CP工作状态,通常A3级别告警不影响CP工作状态。
具体诊断修复过程如下:1、<REPCI; 诊断CP故障ORDERED< CP DIAGNOSISTEST RESULTFAULTFAULTTYPETEMPORARYMAG PCB REPLACED REASONCPU-B STUD-2CPU-B POWCEND此例诊断结果为一临时性错误,由DSU板故障引起,通常A3 CP FAULT告警诊断结果与此类似。
临时性错误可以用指令修复或插拔板解决。
<REMCI:MAG=CPU-B,PCB=STUD-2; 根据诊断结果指令修复或插拔换板ORDERED< CP MANUAL INTERVENTIONINTERVENTION PREPARATIONSUCCESSFUL<RECCI; 指令修复CP,使执行侧备用侧并边ORDERED< CP REPAIRSUCCESSFUL注:A1、A2级别的CP FAULT须换板修复,应尽量在晚上话务量较低时执行。
五、FORLOPP告警O1/APZ "WHMSC4*57/GB/0/" 530 020819 1133SYSTEM STATELONG DURATION TIME FOR FORLOPPINF1 INF2 INF3 INF4H'3E3 H'2C H'18<syfap:hours=1;ORDEREDWO WHMSC4*57/GB/0/1/06/06 NVT-534 TIME 020823 1047 PAGE 1ACTIVE FORLOPPSFORLOPP-ID STATUS NACT NPASS FLPROTYPE START BLOCKH'0256 000D NORMAL 3 0 H'0000 0002 020820 AOTH'03EE 0019 ABORTED 10 4 H'0000 0000 1133 C7TCP H'02E1 002F ABORTED - - H'0000 0000 1133 MRRM H'02AF 001D NORMAL 1 26 H'0000 0008 020821 JOBH'03E3 002C NORMAL 3 0 H'0000 0002 020816 AOTH'012A 0030 NORMAL 3 0 H'0000 0002 020819 AOTEND<syfip:fid=h'3e3-h'2c; ORDERED<WO WHMSC4*57/GB/0/1/06/06 NVT-534 TIME 020823 1047 PAGE 1 HBWO WHMSC4*57/GB/0/1/06/06 NVT-534 TIME 020823 1049 PAGE 1 INDIVIDUALS CONNECTED TO FORLOPPSEARCHYESFORLOPP-ID STATUS FLPROTYPE DATE TIMEH'03E3 002C NORMAL H'0000 0002 020816 1134BLOCK FILENUMBER INDIVIDUAL STATUS FID-VARAUE H'0001 H'0000 0000 ACTIVE1 H'0051ADE H'0001 H'0000 0000 ACTIVE1 H'0064AOT H'0001 H'0000 0000 ACTIVE1 H'0090LAD H'0011 H'0000 007A ACTIVE2 H'016BLAD H'0012 H'0000 0075 ACTIVE2 H'016FLAD H'0012 H'0000 006A ACTIVE2 H'016FLAD H'0013 H'0000 0152 ACTIVE2 H'0166END<SYFRI:FID=H'3E3-H'2C,BLOCK=AOT,IND=H'0,FILENUM=H'1;EXECUTED六、软件应用错误告警A3/APZ "WHMSC1*57/GB/0/" 444 020822 0841APPLICATION DETECTED SOFTWARE ERROR此告警出现多由于FORLOPP非正常释放引起,该告警仅仅只是告知维护人员此问题出现过。