华为告警处理-入门篇
华为TD 告警处理
常见故障维护TD一般故障主要就几种,下面将一一介绍(处理方法仅供参考,各故障还须根据具体情况具体而定。
)1)传输问题,会出现类似下图告警(E1T1的或者IMA的):可以登陆对应基站,如图所示为CZTD3002基站,第一条上报来源CZHRNC01-820,对应的RNC侧IUB接口的传输是1框,25槽,27号链路,所属NODEB是CZTD3002。
我们可以在RNC的维护终端上或者直接在OMC上查看该条E1T1的状态。
如下图示(OMC上):输入命令如下图示:执行后我们会看上方窗体出现我们可以看到我们执行了DSP E1T1: SRN=1, SN=25, BT=AOU, LNKN=27;这条命令,下面的链路状态信息中链路运行状态为链路故障,另外在下方我们可以看到该条传输是被CZTD3002站点占用。
如果传输状态是好的,应为链路运行状态=链路可用。
在基站侧看往往显得更加直观,当我们需要判断传输问题是属于基站侧还是RNC侧时或开站时,我们就可能需要在RNC侧看传输。
可以让基站侧施工人员环回到RNC侧,这时如果链路状态变为可用则说明从RNC到基站传输设备没有问题,而问题出现在基站端。
如果链路仍然不可用,就须通知传输班或者让基站侧督导直接和传输人员联系。
下面介绍如何在基站端看传输状态如上图所示出现传输故障的是7槽1,2,3三个端口(NODEB BBU上的单板都是在0柜0框),由于我们定义的端口是从0开始的,也就是说该站的第二,三,四条传输有问题。
进入该站的MML命令窗口,查询传输状态:我们可以看到端口号1,2,3的链路运行状态是“存在信号丢失告警”,使用标志为“是”。
该站就需上站处理传输问题,当然由于是维护建议先让传输班看下,然后看是否需要上站处理。
一般传输问题都是传输头有问题或者传输端子有问题。
让基站侧代维先处理,如果处理不好,再让他环回给你看。
一种是向RNC侧环,前面已经讲过了,一种是向NODEB侧环,当向RNC环回可用的情况下,向NODEB侧环回链路运行状态变为物理环回,这种情况基本上把头子接好了就没有问题了,如果链路运行状态还是信号丢失告警的话,可能原因有几种,首先让代维重做传输头子,看是否存在虚焊等情况。
华为PTN告警处理规范
华为PTN告警处理规范1.ETH_LOS告警解释:ETH_LOS为以太网端口连接丢失告警。
该告警表示以太网端口接收不到以太网信号。
产生原因:以太网端口的电缆或光纤没有连接好。
电缆或光纤故障。
本端网元接收光功率过低。
单板故障。
处理步骤:检查以太网端口的电缆或光纤是否接好,插紧松脱的电缆或光纤。
检查电缆或光纤是否存在故障,更换故障的电缆或光纤。
检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。
更换上报告警的处理板。
若告警未消除,更换对端网元对应的处理板。
2.MPLS_TUNNEL_LOCV告警解释:MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。
连续3个周期内没有收到希望的CV/FFD报文时出现此告警。
产生原因:PW对端停止CV/FFD。
物理链路故障。
PW对端单板正在复位。
业务接口配置错误。
网络出现严重拥塞。
处理步骤:在网管上查看PW对端是否停止了CV/FFD。
在网管上检查该链路两端网元是否存在单板或光模块相关的告警。
若告警未清除,查看光纤或电缆是否故障,更换故障的光纤或电缆。
在网管上检查对端单板是否上报COMMUN_FAIL告警。
若存在,说明对端单板可能正在复位。
清除COMMUN_FAIL告警后,查看本告警是否清除。
对照网元规划表,在网管上查看业务接口是否配置错误。
如果是,重新配置业务接口后,查看告警是否消除。
检查故障Tunnel的带宽是否已被完全占用。
如果是,增大Tunnel带宽配置或消除非法发送大数据量的根源。
查看告警是否清除。
3. BD_STATUS告警解释:BD_STATUS为物理单板离线告警。
当用户在网管上配置了逻辑单板而物理子架上却没有插入实际单板时就会上报此告警。
产生原因:单板正在硬复位。
单板未插上,或单板插上,但与母板接触不良。
板间通讯故障。
处理步骤:在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若是,则该单板处于硬复位状态。
等待3至5分钟,该单板的工作状态转成绿色后,查看本告警是否消除。
华为PTN告警处理规范
对照网元规划表,在网管上查看业务接口是否配置错误。如果是,重新
配置业务接口后,查看告警是否消除。
检查故障Tunnel的带宽是否已被完全占用。如果是,增大Tunnel带宽 配置或消除非法发送大数据量的根源。查看告警是否清除。
3.
告警解释:BD_STATU为物理单板离线告警。当用户在网管上配置了逻辑单
板而物理子架上却没有插入实际单板时就会上报此告警。
在网管上查看两端端口是否存在LOOP_AL告警,若存在,优化清除LOOP_AL告警后,查看本告警是否清除。
对照网元规划表, 查看上报告警的端口是否错插了纤缆, 造成两端端口工 作模式不一致。
在网管上查看两端网元的相关单板是否存在HARD_BA等硬件类告警。若 存在,更换存在硬件类告警的单板后,查看本告警是否清除。
产生原因:
单板正在硬复位。
单板未插上,或单板插上,但与母板接触不良。
板间通讯故障。
处理步骤:
在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若 是,则该单板处于硬复位状态。等待3至5分钟,该单板的工作状态转 成绿色后,查看本告警是否消除。
检查相应槽位的单板是否插入。若未插入,请插入相应物理单板,告警 将自动清除。 检查单板与母板是否接触良好, 母板连接器的导针是否歪 斜。修正歪斜的导针,重新插拔单板使之与母板良好接触,告警将自动 清除。
华为分布式HLR告警处理手册
告警处理手册_华为V1.0文档更新记录目录V1.0 (1)一、CGP告警 (10)1. 紧急告警 (10)1ALM-1005 单板CPU过载 (10)2ALM-2413 XPTU与CP通信中断 (11)3ALM-3161 流量失衡 (13)4ALM-3162 IP地址冲突 (15)5ALM-3163 网关探测失败 (16)6ALM-3164 IP泛洪攻击 (19)7ALM-3166 IP不可达故障告警 (21)8ALM-4100--ALM4200 模拟量或数字量传感器告警 (22)9ALM-7403 性能业务指标阈值四级越限 (23)2. 重要告警 (24)1ALM-101 主备模块补丁状态不一致 (24)2ALM-1003 模块故障 (26)3ALM-1009 剩余存储空间不足 (28)4ALM-1015 SDM板不在位 (29)5ALM-1016 NTP请求超时 (30)6ALM-1022 本地RAID1故障 (31)7ALM-1023 单板端口故障 (33)8ALM-1030 本地存储介质故障 (37)9ALM-1039 框号冲突 (39)10ALM-2001 单板故障 (41)11ALM-2015 电源输入模块故障 (44)12ALM-2037 ATM端口故障 (46)13ALM-2069 模块间通讯故障 (48)14ALM-2135 风扇故障 (50)15ALM-2402 OMU与LIG/LIC通信中断 (52)16ALM-2411 XPTU逻辑驱动器空间不足 (53)17ALM-2414 XPTU与GSOSM连接中断 (54)18ALM-3010 单板温度二级越限 (55)19ALM-3013 单板扳手打开 (56)20ALM-3015 空气过滤网不在位 (57)21ALM-3017 SMM板与框内设备硬件监控总线故障 (58)22ALM-3077 单板电压二级越限 (60)23ALM-3095 风扇温度二级越限 (61)24ALM-3101 电源输入模块温度二级越限 (62)25ALM-3107 风扇电压二级越限 (63)26ALM-3113 电源输入模块电压二级越限 (64)27ALM-3160 主备SMM板的框号不一致 (65)28ALM-3802 E1T1端口故障 (66)29ALM-3807 OMU与TDM扣板程序校验不一致 (68)30ALM-3808 窄带接口板故障 (69)31ALM-3810 TDM扣板时钟故障 (70)32ALM-3814 TDM扣板硬件故障 (73)33ALM-4402 OMU与单板单平面连接故障 (75)34ALM-4403 OMU与单板通信故障 (76)35ALM-4405 OMU与机框双平面通信故障 (77)36ALM-4421 S3100磁盘阵列故障 (78)37ALM-4501 LAN Switch冷启动 (79)38ALM-4503 LAN Switch端口故障 (80)39ALM-4507 LAN Switch输入电源失效 (83)40ALM-4508 LAN Switch风扇失效 (84)41ALM-4509 LAN Switch端口处于去激活状态 (85)42ALM-4601 SMM板与配电盒通讯故障 (85)43ALM-4602 配电盒管理功能失效 (86)44ALM-4603 配电盒输入电压异常 (86)45ALM-4605 配电盒输出电源开关关闭 (88)46ALM-4606 配电盒外接开关传感器警报 (89)47ALM-4670 扣板故障 (90)48ALM-4671 扣板不在位 (91)49ALM-4752 格式化失败 (91)50ALM-4754 联机设定失败 (92)51ALM-4756 数据表自动CRC校验错误 (94)52ALM-5008 鉴权失败 (95)53ALM-5009 非法登录 (96)54ALM-5010 普通用户执行特通专用命令鉴权失败 (97)55ALM-5102 特通退出服务 (97)56ALM-5201 配置事务即将超时 (98)57ALM-5203 配置事务超时自动回滚 (99)58ALM-5230 MOD MAXT命令发送失败 (100)59ALM-5301 SMM板主备通讯故障 (100)60ALM-5401 主机运行版本和OMU不一致 (101)61ALM-5521 S2600磁盘阵列故障 (102)62ALM-6402 文件加载失败 (103)63ALM-6416 安装失败 (105)64ALM-6417 单板操作系统重新安装 (106)65ALM-7404 性能业务指标阈值三级越限 (107)66ALM-7407 CHR上传单据故障重要告警 (108)67ALM-8301 OMU与RMU设备通信故障 (109)68ALM-8302 OMU与交换板通信故障 (110)69ALM-8304 OMU与RAID设备通信故障 (113)70ALM-8305 OMU与LSW设备通信故障 (114)71ALM-8306 OMU与SMM板管理单元通讯故障 (115)72ALM-8308 SMM板文件加载失败 (117)73ALM-8502 OMU双机数据库同步失败 (118)74ALM-8504 OMU双机通信故障 (118)75ALM-8505 OMU双机文件同步失败 (119)76ALM-8510 单板运行文件与OMU不一致 (120)77ALM-8600 OMU资源异常 (121)78ALM-8601 OMU双机主备倒换 (123)79ALM-8605 主备OMU倒换失败 (124)80ALM-8610 OMU浮动IP冲突 (125)81ALM-8702 OMU向NTP服务器同步时间失败 (126)82ALM-8706 RTC故障 (127)83ALM-9004 创建SNMP会话实体失败 (128)84ALM-9996 SMM板倒换失败 (129)3. 次要告警 (131)1ALM-102 补丁激活后未确认 (131)2ALM-753 告警箱处于离线状态 (132)3ALM-2010 风扇转速越限 (133)4ALM-2375 同一类型模块确认的补丁个数不一致 (134)5ALM-3001 CPU报错 (135)6ALM-3009 单板温度一级越限 (137)7ALM-3076 单板电压一级越限 (138)8ALM-3094 风扇温度一级越限 (139)9ALM-3100 电源输入模块温度一级越限 (140)10ALM-3106 风扇电压一级越限 (141)11ALM-3112 电源输入模块电压一级越限 (141)12ALM-4404 OMU与机框单平面通信故障 (142)13ALM-4502 LAN Switch热启动 (144)14ALM-6415 软件包损坏 (144)15ALM-7405 性能业务指标阈值二级越限 (146)16ALM-8307 SMM主备板软件版本不一致 (147)17ALM-8503 OMU双机连接故障 (147)18ALM-8703 OMU与特定的NTP服务器通信故障 (148)19ALM-8704 OMU与NTP服务器时间偏差超出同步阈值 (150)4. 提示告警 (151)1ALM-3165 端到端质量检测超标 (151)2ALM-4766 帐户锁定 (152)3ALM-4790 帐户锁定 (153)4ALM-7406 性能业务指标阈值一级越限 (153)二、USCDB告警 (155)1. 紧急告警 (155)1ALM-5217 License特征段限制业务 (155)2ALM-5218 License文件限制业务 (156)3ALM-11000 磁阵与服务器单板的连接状态异常 (156)4ALM-11001 数据库表空间不足 (162)5ALM-11003 数据库连接异常 (167)6 ALM-11007 双机信任关系异常 (179)7ALM-11008 CRS资源状态异常 (182)8ALM-12011 容灾故障 (190)9ALM-12012 流控开始 (193)10ALM-12015 License用户数已经达到容量限制 (195)11ALM-22005 加载LDAP SCHEMA文件失败 (196)2. 重要告警 (198)1ALM-101 主备模块补丁状态不一致 (198)2ALM-371 节点内存不足 (199)3ALM-794 禁止格式化转换 (200)4ALM-2069 模块间通讯故障 (201)5ALM-4488 配置进入脱机状态 (203)6ALM-4752 格式化失败 (203)7ALM-4754 联机设定失败 (204)8ALM-4756 数据表自动CRC校验错误 (206)9ALM-5215 License特征段已经失效 (207)10ALM-5216 License文件已经失效 (208)11ALM-5221 License文件无效 (209)12ALM-5401 主机运行版本和OMU不一致 (210)13ALM-11002 物理数据库备份或恢复失败 (211)14ALM-11004 硬盘空间占用率超过90% (225)15ALM-12001 节点心跳超时 (227)16ALM-12007 节点加载失败 (229)17ALM-12008 节点备份失败 (236)18ALM-14002 DPU同步文件数目超出上限 (242)19ALM-14003 DPU与远端DPU连接失败 (244)20ALM-14007 PGW流控启用 (245)21ALM-22001 DSG SCTP链路传输质量下降 (247)22ALM-22002 DSG SCTP链路负荷过载 (248)23ALM-22003 DSG SCTP链路拥塞 (250)24ALM-22004 DSG SCTP链路故障 (251)3. 次要告警 (253)1ALM-102 补丁激活后未确认 (253)2ALM-369 节点内存使用率过高 (254)3ALM-1043 模块备份开关关闭 (255)4ALM-3451 License宽限保护打开 (256)5ALM-10000 PCDR缓冲区溢出 (257)6ALM-14004 PGW同步静态数据出错 (258)7ALM-14009 DPU文件传输失败 (259)8ALM-14011 PGW节点与物理库连接异常 (261)9ALM-22000 DSG SCTP路径故障 (262)4. 提示告警 (264)1ALM-5213 License特征段即将失效 (264)2ALM-5214 License文件即将失效 (265)3ALM-12014 License用户数即将达到容量限制 (265)三、HLR-FE告警 (267)1. 紧急告警 (267)1ALM-1701 MTP目的信令点不可达 (267)2ALM-1713 MTP路由不可用 (268)3ALM-1815 M3UA路由不可用 (270)4ALM-1817 M3UA目的实体不可达 (271)5ALM-2752 SCCP目的信令点不可达 (272)6ALM-2758 远端SCCP故障 (273)7ALM-5217 License特征段限制业务 (274)8ALM-5218 License文件限制业务 (275)2. 重要告警 (276)1ALM-101 主备模块补丁状态不一致 (276)2ALM-743 主用FE和容灾FE动态数据同步心跳超时 (277)3ALM-794 禁止格式化转换 (279)4ALM-1705 MTP链路故障 (280)5ALM-1707 MTP缓冲区拥塞 (286)6ALM-1709 MTP二层拥塞 (289)7ALM-1715 MTP链路发送负荷过载 (291)8ALM-1717 MTP链路接收负荷过载 (293)9ALM-1728 MTP链路故障自环检测 (296)10ALM-1762 M3UA SCTP路径故障 (297)11ALM-1768 M3UA链路传输质量故障 (298)12ALM-1793 M3UA链路集不匹配 (301)13ALM-1809 M3UA链路拥塞 (304)14ALM-1811 M3UA链路故障 (307)15ALM-1831 M3UA链路负荷过载 (310)16ALM-2069 模块间通讯故障 (312)17ALM-2754 SCCP子系统禁止 (314)18ALM-2756 SCCP子系统故障 (316)19ALM-3228 信令点拥塞 (317)20ALM-4488 配置进入脱机状态 (318)21ALM-4752 格式化失败 (318)22ALM-4754 联机设定失败 (319)23ALM-4756 数据表自动CRC校验错误 (321)24ALM-5215 License特征段已经失效 (322)25ALM-5216 License文件已经失效 (323)26ALM-5221 License文件无效 (324)27ALM-5401 主机运行版本和OMU不一致 (325)28ALM-12001 节点心跳超时 (326)29ALM-22001 DSG SCTP链路传输质量下降 (327)30ALM-22002 DSG SCTP链路负荷过载 (329)31ALM-22003 DSG SCTP链路拥塞 (331)32ALM-22004 DSG SCTP链路故障 (332)33ALM-125300 特通消息缓冲区满 (334)3. 次要告警 (335)1ALM-102 补丁激活后未确认 (335)2ALM-1043 模块备份开关变化告警 (336)3ALM-2763 SCCP消息环回错误 (337)4ALM-3451 License宽限保护打开 (338)5ALM-22000 DSG SCTP路径故障 (339)6ALM-125301 特通消息缓冲区占用空间超过阈值 (340)4. 提示告警 (341)1ALM-5213 License特征段即将失效 (341)2ALM-5214 License文件即将失效 (342)四、DX80磁盘阵列告警处理 (343)1. J类型告警 (343)1J 0ASSMM0p Controller Module#m(zz xxHz) BE Expander Port#p Warning <pppppsssss rrrrr> (343)2J 0CSSMM00 Controller Module#m(zz xxHz) Flash ROM Warning <ppppp sssss rrrrr> (344)3J 0ESSMM00 Controller Module#m(zz xxHz) NAND Flash Warning <ppppp sssss rrrrr> (346)4J 01SSMM00 Controller Module#m(zz xxHz) Warning factor(ww) <ppppp sssss rrrrr> (347)5J 06SSMM00 Controller Module #m(zz xxHz) BE Expander Warning <ppppp sssss rrrrr> (349)6J 08SSMM0p Controller Module#m(zz xxHz) DI Port#p Warning <ppppp sssss rrrrr> (350)7J 09SSMM00 Controller Module#m(zz xxHz) SAS Port#nn Warning <ppppp sssss rrrrr> (351)8J 80SSMMnn Disk Drive DE#MM-Disk#nn(SAS xxxGB yykrpm ccccc) SMART(Warning)<ppppp sssss rrrrr> (353)9J 900xMM0n Expander DE#MM/EXP#n Warning <ppppp sssss rrrrr> (354)10J 910xMMnp Expander Port DE#MM/EXP#n/Port#p Warning <ppppp sssss rrrrr>35611J C1MM0000 Controller Module#m(zz xxHz) Reboot <ppppp sssss rrrrr> (357)12J C3SSMM00 Controller Module#m(zz xxHz) Cache(MEM) Correctable Error <pppppsssss rrrrr> (358)13J D20xMM0n Power Supply Unit DE#MM/PSU#n Warning <ppppp sssss rrrr> (360)14J DA0xMM00 DE Exhaust temperature (sensor) DE#MM Warning (361)15J DB0xMM00 DE Intake temperature DE#MM Warning (362)2. M类型告警 (363)1M 21810xxx RAID Group#0xxx REBUILD to HS(DV)(Recovered end) (363)2M E005nxxx WRITE BAD DATA (364)3M E10300xx PINNED DATA (365)4M E207000B NOT READY(11:Power Off/Fail Incomplete) (366)5M E207000C NOT READY(12:Backup Fail) (367)6M E207000D NOT READY(13:Multi CM Down) (367)7M E207000E NOT READY(14:Machine Down Recovery End) (368)8M E207000F NOT READY(15:Machine Down Recovery Failed) (368)9M E2070001 NOT READY(01:Configuration Error) (369)10M E2070002 NOT READY(02:CM F/W Version Error) (369)11M E2070004 NOT READY(04:Restore Fail) (370)12M E2070010 NOT READY(16:DE Build Error) (370)13M E2070011 NOT READY(17:CM Memory Shortage) (371)14M E2070015 NOT READY(21:Configuration Data restored from System Disk) (371)15M E2070016 NOT READY(22:No Version) (372)3. P类型告警 (372)1P 0ASSMM0p Controller Module#m(zz xxHz) BE Expander Port#p Fault <ppppp sssss rrrrr> (372)2P 0BSSMM00 Controller Module#m(zz xxHz) Cache(MEM) Fault <ppppp sssss rrrrr> (373)3P 0CSSMM00 Controller Module#m(zz xxHz) Flash ROM Falut <ppppp sssss rrrrr> 374 4P 0ESSMM00 Controller Module#m(zz xxHz) NAND Controller Fault <ppppp sssss rrrrr> (375)5P 0FSSMM00 Controller Module#m(zz xxHz) SCU Fault <ppppp sssss rrrrr> (376)6P 1A00MM0p FC SFP Controller Module#m Port#p Fault <ppppp sssss rrrrr ooooo> (377)7P 1C00MM0p FC SFP+ Controller Module#m Port#p Fault <ppppp sssss rrrrr ooooo> (378)8P 01SSMM00 Controller Module#m(zz xxHz) Fault <ppppp sssss rrrrr> (379)9P 06SSMM00 Controller Module#m(zz xxHz) BE Expander Fault <ppppp sssss rrrrr> (380)10P 08SSMM0p Controller Module#m(zz xxHz) DI Port#p Fault <ppppp sssss rrrrr> 381 11P 09SSMM00 Controller Module#m(zz xxHz) SAS Port Fault <ppppp sssss rrrrr> .. 382 12P 11SSMM0p Controller Module#m(zz xxHz) Port#p Fault <ppppp sssss rrrrr> (383)13P 12SSMM00 Controller Module#m(zz xxHz) FE Expander Fault <ppppp sssss rrrrr> (384)14P 13SSMM0p Controller Module#m(zz xxHz) FE Expander Port#p Fault<ppppp sssss rrrrr> (385)15P 80SSMMnn Disk Drive DE#MM-Disk#nn(SAS xxxGB yykrpm ccccc) Fault (Failed Usable)<ppppp sssss rrrrr> (386)16P 88SSMMnn Disk Drive DE#MM-Disk#nn(SAS xxxGB yykrpm ccccc) Fault <ppppp sssss rrrrr> (387)17P 900xMM0n Expander DE#MM/EXP#n Fault <ppppp sssss rrrrr> (388)18P 910xMMnp Expander Port DE#MM/EXP#n/Port#p Fault <ppppp sssss rrrrr> (390)19P D20xMM0n Power Supply Unit DE#MM/PSU#n Fault <ppppp sssss rrrrr> (391)20P DA0xMM00 DE Exhaust temperature (sensor) DE#MM Fault (392)21P DB0xMM00 DE Intake temperature sensor DE#MM Fault (393)4. R类型告警 (394)1R 06SSMM00 Controller Module#m(zz xxHz) BE Expander Normal <ppppp sssss rrrrr> (394)2R 900xMM0n Expander DE#MM/EXP#n Normal<ppppp sssss rrrrr> (395)3R D20xMM0n Power Supply Unit DE#MM/PSU#n Normal <ppppp sssss rrrrr> (396)4R DA0xMM00 DE OUT TEMP Normal (396)5R DB0xMM00 DE IN TEMP Normal (397)一、CGP告警1. 紧急告警1ALM-1005 单板CPU过载告警解释当系统检测到CPU的占用率大于过载告警的门限(可由用户设置)时,上报此告警。
华为告警处理手册1.0
目录1. MSC SERVER处理分册 (3)1.1 告警箱处于离线状态 (3)1.2、FE端口故障 (3)1.3、WCKI时钟参考源丢失 (4)1.4、控制框与业务框通信失败 (5)1.5、BAM到主机通讯失败 (6)1.6、BAM到主机连接中断 (7)1.7、与NTP服务器断连 (8)1.8、Q922链路故障 (9)1.9、TCP链路故障 (11)1.10、CPU过载 (12)1.11、单板网口协商失败 (13)1.13、许可证文件即将失效 (14)1.14、计费中心长时间未取话单 (16)1.15、心跳中断 (17)1.16、双机倒换 (18)1.17、私网中断 (19)1.18、IP资源失效 (20)1.19、备份连接失败 (21)1.20、单板故障 (22)1.21、许可证即将过期告警 (23)1.22、许可证已经过期告警 (24)1.23、电源输出开关关闭 (25)1.24、H.248 SCTP链路故障 (26)1.25、MGW退出服务 (28)1.26、MTP目的信令点不可达 (29)1.27、MTP路由传输禁止 (31)11.28、MTP链路故障 (32)1.29、MTP缓冲区拥塞 (34)1.30、M2UA链路故障 (35)1.31、SCCP目的信令点禁止 (37)1.32、SCCP子系统禁止 (38)N => 联系对端局点确认其子系统是否恢复。
(40)2. MGW处理分册 (40)2.1 FE级联网口故障 (40)2.2 风扇框通讯故障 (42)2.3 NET单板时钟检测异常 (44)2.4 NET单板时钟失锁 (47)2.5 GE级联光口故障 (48)2.6 NET单板时钟失锁 (50)2.7 NET单板时钟配线故障 (52)2.8 级联光口故障 (54)2.9 GE通道光模块故障 (56)2.10 TDM通道光模块故障 (58)3.11 BLU时钟检测异常 (60)2.12 信令链路故障告警 (62)2.13 SPF扣板链路故障 (64)2.14 L2UA链路组故障 (67)2.15 L2UA链路故障 (68)2.16 单板软件异常告警 (70)2.17 SIWF故障告警 (72)2.18 控制平面拥塞 (74)2.19 单板故障 (75)2.20 告警箱断链 (77)2.21 单板上存在故障的半永久 (78)2.22 参考源丢失 (80)2.23 虚拟媒体网关迁移出业务态 (82)1. MSC SERVER处理分册1.1 告警箱处于离线状态告警含义1. 告警解释当BAM与告警箱之间通信中断时间超过10秒钟后,系统将产生该告警。
华为硬件告警及故障处理培训
•Interface Processing Unit
•CPRI0 •CPRI1
•ANT1 •DU P
•ANT2 •DU P
PPT文档演模板
2020/11/1 星期日
华为硬件告警及故障处理培训
DRFU单板发射模式-发分集模式
u 发分集模式下,DRFU工作于单载波模式。 u 发分集模式可以基站提高下行信号的质量。 u 发分集模式下,同一个载波的下行信号从通道1和通道2进行2路发射。
•Interface Processing Unit
•CPRI0 •CPRI1
PPT文档演模板
2020/11/1 星期日
•ANT1 •DU P
•ANT2 •DU P
华为硬件告警及故障处理培训
DRFU单板接收模式-主分集接收
u 主分集模式下,DRFU板可以工作于双载波模式。 u 每一个载波的接收信号分别来自于2个天馈。 u 下图中,1个载波的接收信号来自于本DRFU的A和B通道。但是在双拼方案里,
上下行不平衡定义标准
华为总部定义上下行不平衡标准为: ➢上下行平衡等级1的比例大于等于30% 则认为不平衡(下行偏弱或上行偏强) ➢上下行平衡等级11的比例大于等于 30% 则认为不平衡(下行偏强或上行偏弱)
PPT文档演模板
华为硬件告警及故障处理培训
上下行链路平衡等级和接收电平的关系
上下行链路平衡等级
PPT文档演模板
华为硬件告警及故障处理培训
各种场景载频数据配置-S3/3
PPT文档演模板
华为硬件告警及故障处理培训
•内容提要
•第一讲 3900硬件和数据配置 •第二讲 3900常见告警处理 •第三讲 上下不平衡故障处理
PPT文档演模板
华为GSM告警原因及处理步骤
E1/T1信号丢失告警
GSM小区退出服务告警
光口支路滑帧告警 光口支路滑帧告警 时钟参考源异常告警
E1/T1信号丢失告警
光口支路远端告警
光口支路远端告警
射频单元接收通道异常告警 射频单元接收通道异常告警 光口支路告警指示信号告警 光口支路告警指示信号告警
1、人工闭塞:执行了人工闭塞小区或者主BCCH载频的操作。 2、其它OM操作:人工复位基站或小区、动态数据配置操作(如修改主B 频点)引起BSC对BTS进行复位操作。 3、基站掉电:基站无电源输入。 4、其他原因:LAPD链路或载频属性调整导致的BTS短时不可用、BSC复 位引起基站复位、基站自动复位、单板故障、传输故障、数据配置错误 、人工复位BTS单板等原因。 0 0 0 1、E1/T1配置错误。 2、E1/T1传输线路连接异常。 3、本端设备异常。 4、E1/T1传输中继问题。 5、对端设备异常。 1、光纤没有插牢固。 2、本端设备和对端设备的帧格式配置不一致。 3、本端设备的发送故障。 4、对端设备的接收故障。 5、传输设备故障或传输线路故障。 1、光纤没有插牢固。 2、本端设备和对端设备的帧格式配置不一致。 3、本端设备的发送故障。 4、对端设备的接收故障。 5、传输设备故障或传输线路故障。 1、连接载频的主集或分集接收口的射频电缆松动或者损坏。 2、载频损坏。 1、连接载频的主集或分集接收口的射频电缆松动或者损坏。 2、载频损坏。 1、对端设备没有信号输出到传输设备。 2、传输设备故障。 1、对端设备没有信号输出到传输设备。 2、传输设备故障。 1、E1/T1配置错误。 2、E1/T1传输线路连接异常。 3、本端设备异常。 4、E1/T1传输中继问题。 5、对端设备异常。 1、光纤没有插牢固。 2、本端设备和对端设备的帧格式配置不一致。 3、本端设备的发送故障。 4、对端设备的接收故障。 5、传输设备故障或传输线路故障。 1、光纤没有插牢固。 2、本端设备和对端设备的帧格式配置不一致。 3、本端设备的发送故障。 4、对端设备的接收故障。 5、传输设备故障或传输线路故障。
华为LTE告警原因与处理建议
华为LTE常见告警处理建议2017-8-15华为LTE常见告警目录1射频单元业务不可用告警32小区不可用告警43射频单元维护链路异常告警44BBU IR接口异常告警55网元断连66传输光接口异常告警67S1接口故障告警68射频单元IR接口异常告警79License试运行告警710以太网链路故障告警811用户面故障告警812射频单元时钟异常告警913基站S1控制面传输中断告警914射频单元交流掉电告警915BBU IR光模块收发异常告警1016射频单元驻波告警1017远程维护通道故障告警1118小区服务能力下降告警1119射频单元光模块收发异常告警1120射频单元光接口性能恶化告警1221交流掉电告警1222时钟参考源异常告警1323射频单元硬件故障告警1324射频单元输入电源能力不足告警1425配置数据超出License限制告警1426射频单元ALD电流异常告警1427RRU组网级数与配置不一致告警1528射频单元发射通道增益异常告警1529星卡锁星不足告警1530星卡天线故障告警1531BBU IR光模块/电接口不在位告警1632天线设备维护链路异常告警1633制式间通信异常告警1634配置数据不一致告警1735系统时钟不可用告警1736时间同步失败告警1837射频单元软件运行异常告警1838BBU直流输出异常告警1839单板温度异常告警1940射频单元光模块/电接口不在位告警1941射频单元接收通道RTWP/RSSI过低告警19 42BBU单板维护链路异常告警2043BBU光模块收发异常告警2044RRU组网拓扑类型与配置不一致告警2145证书失效告警2146远程维护通道配置与运行数据不一致告警22 47系统无License运行告警2248单板不在位告警2249未配置时钟参考源告警2350MAC错帧超限告警2351单板下电告警2352单板硬件故障告警2453版本自动回退告警2454单板类型和配置不匹配告警2455单板软件运行异常告警2556机框类型配置与实际不一致告警2557射频单元工作模式与单板能力不匹配告警2558License Feature不可用告警2659传输光模块不在位告警2660单板软件同步失败告警2661射频单元CPRI接口异常告警2762射频单元光模块类型不匹配告警2863小区重配置失败告警2864BBU IR光接口性能恶化告警2865单板时钟输入异常告警2966射频单元过载告警2967射频单元温度异常告警2968星卡维护链路异常告警301 射频单元业务不可用告警故障原因:1、配置原因:小区配置与设备支持规格冲突;射频模块在共模SDR配置下, 制式间载波频率间隔、功率规格、载波数规格、带宽规格等配置错误;CPRI速率配置错误;SFN跨框场景下,扇区设备配置错误;ODI配置错误;2、软件原因:License资源不足;3、单板不可用:小区使用的CPRI链路故障;小区使用的基带单元故障;小区使用的射频单元收发通道故障;CPRI带宽不足;CPRI MUX场景单板不支持;数据链路故障;控制链路故障;时钟精度不足;处理建议:1、检查小区和设备规格,更换型号匹配设备;核查配置参数是否有误,调整正确参数配置;2、核查小区LICENSE,增加LICENSE。
华为硬件故障告警解释及处理
第一节 DBUS告警 (2)一2170 DBUS告警 (2)二3108 DBUS告警 (3)三3628 DBUS告警 (4)四4158 DBUS告警 (5)第二节 DBUS时钟告警 (7)一2132 DBUS时钟告警 (7)二4120 DBUS时钟告警 (8)第三节无线链路提示告警 (10)一2134 无线链路提示告警 (10)二3072 无线链路提示告警 (12)三4122 无线链路提示告警 (14)第四节时钟参考源异常 (16)一2208 时钟参考源异常 (16)二3146 时钟参考源异常 (17)三3666 时钟参考源异常 (18)四4708 时钟参考源异常 (20)第五节 13M时钟校准维护告警 (22)一2260 13M时钟校准维护告警 (22)二3718 13M时钟校准维护告警 (23)三4760 13M时钟校准维护告警 (24)第六节反向功率告警 (25)一3614 反向功率告警 (25)第一节 DBUS告警一2170 DBUS告警告警解释当机架内部的数据总线出现问题时,上报该告警。
对系统的影响告警发生时,部分或者全部TRX的业务彻底中断。
系统自处理过程无可能原因·E1传输线故障;·机架内部数据总线故障;·TMU板故障.处理步骤1.查看其他相关告警查看LMT是否同时上报2214 E1本地告警的处理方法处理,观察告警是否恢复。
Y=>告警恢复,告警处理结束.N=>告警未恢复,转步骤2.若没有上报上述告警, 转步骤2.2.检查E1线是否单端接地检查TMU的拨码开关是否正确,如果有错,修改拨码开关状态,保证E1线单端接地,观察告警是否恢复。
Y=>已恢复,处理结束;N=>告警未恢复,转步骤3.如果TMU拨码开关正确,转步骤3.3.更换TMU更换TMU,观察是否恢复。
Y=>已恢复,处理结束;N=>告警未恢复,故障原因可能为机架整套配线故障,联系华为技术中心。
华为GSM告警原因及处理步骤
BBU光模块收发异常告警
BBU光模块收发异常告警
射频单元维护链路异常告警
射频单元维护链路异常告警
0 1、CPRI链路故障 2、BSC到BTS之间传输有问题 3、主控单板或载频单板故障 1、CPRI链路故障 2、BSC到BTS之间传输有问题 3、主控单板或载频单板故障 1、BBU CPRI端口上的光纤接头或光模 块未插紧,或光模块故障。 2、BBU CPRI端口上的光纤接头不洁 净,存在灰尘等异物。 3、BBU的CPRI端口和下级射频单元CPRI 端口上的光模块的型号(单模/多模、 速率)不匹配。 4、下级射频单元的CPRI端口上的光模 块型号(单模/多模、速率)和射频单 元支持的型号不匹配。 5、BBU的CPRI端口的光模块和光纤的型 号(单模/多模、速率)不匹配。 6、BBU上的CPRI接口单板故障。 7、下级射频单元未上电。 8、下级射频单元上的光纤接头或光模 块未插紧,或光模块故障。 9、下级射频单元CPRI端口上的光纤接 头不洁净,存在灰尘等异物。 10、下级射频单元上的光模块的型号 (单模/多模、速率)不匹配。 11、BBU与下级射频单元之间的光纤线 路故障。 1、BBU CPRI端口上的光纤接头或光模 块未插紧,或光模块故障。 2、BBU CPRI端口上的光纤接头不洁 净,存在灰尘等异物。 3、BBU的CPRI端口和下级射频单元CPRI 端口上的光模块的型号(单模/多模、 速率)不匹配。 4、下级射频单元的CPRI端口上的光模 块型号(单模/多模、速率)和射频单 元支持的型号不匹配。 5、BBU的CPRI端口的光模块和光纤的型 号(单模/多模、速率)不匹配。 6、BBU上的CPRI接口单板故障。 7、下级射频单元未上电。 8、下级射频单元上的光纤接头或光模 块未插紧,或光模块故障。 9、下级射频单元CPRI端口上的光纤接 头不洁净,存在灰尘等异物。 10、下级射频单元上的光模块的型号 (单模/多模、速率)不匹配。 11、BBU与下级射频单元之间的光纤线 路故障。 1、射频单元与BBU或上级射频单元之间 的CPRI链路中断。 2、射频单元未上电或运行异常。 3、射频单元硬件故障。 1、射频单元与BBU或上级射频单元之间 的CPRI链路中断。 2、射频单元未上电或运行异常。 3、射频单元硬件故障。
华为常见告警处理建议
华为常见告警处理建议华为常见告警目录4102 LAPD告警 (5)4104 载频配置告警 (6)4106 载频处理器告警 (8)4108 无线链路严重告警 (9)4110 载频降功率告警 (10)4112 主控模块关功放告警 (11)4114 内部收发通道告警 (13)4116 载频电压异常告警 (14)4118 四收分集接收告警 (15)4120 DBUS时钟告警 (16)4122 无线链路提示告警 (18)4124 测试锁相环告警 (20)4126 载频单板ID错误告警 (21)4128 锁相环提示告警 (22)4130 CBUS2链路告警 (23)4132 四收分集通道故障告警 (24)4136 载频硬件告警 (26)4140 功放温度告警 (27)4144 载频驻波告警 (28)4154 载频主时钟告警 (30)4156 载频副时钟告警 (31)4158 DBUS告警 (32)4168 频点与载频类型不一致告警 (34)4176 主集接收通道告警 (35)4178 分集接收通道告警 (36)4180 功率类型不支持告警 (38)4184 时钟严重告警 (39)4186 锁相环严重告警 (40)4192 载频单板通信告警 (42)4194 载频单板类型配置错告警 (43)4708 时钟参考源异常告警 (44)4710 E1远端自环测试告警 (46)4714 E1本地告警 (46)4716 E1远端告警 (48)4722 主控模块通信告警 (50)4726 基站维护告警 (51)4760 13M时钟校准维护告警 (52)4772 主控模块主时钟故障 (53)4794 主控模块硬件严重告警 (54)4798 主控模块内部电源告警 (55)4800 主控模块硬件提示告警 (57)5292 单板通讯告警 (58)5312 合分路器单板类型配置错告警 (59)5314 合分路器频段与频点不匹配告警 (60)5318 DDPU电压异常告警 (61)5320 DDPU时钟异常告警 (62)5324 DDPU硬件告警 (64)5326 DDPU驻波告警 (65)5328 DDPU驻波严重告警 (66)5330 DDPU低噪放告警 (67)6156 DEMU/EAC单板通信告警 (68)9732 NFCB风机盒通信告警 (70)9733 NFCB传感器故障告警 (71)9734 NFCB风扇故障告警 (72)9735 NFCB 温度异常告警 (73)9736 NFCB风机盒硬件故障告警 (75)9737 NFCB在位检测电路故障告警 (75)BTS3012基站告警:4102 LAPD告警告警含义1. 告警解释当LAPD链路断链时,将导致载频无法与BSC通信,上报本告警。
华为GPON设备ONU常见告警及处理
华为GPON设备ONU常见告警及处理随着GPON方式接入的逐步应用,GPON设备的维护工作也开始进入维护日程,了解GPON设备的故障处理方法,掌握维护技巧,势在必行,结合平顶山管内移动GPON设备的维护及铁通GPON设备的维护工作,对发生的故障进行整理分类,并得出一点维护心得:1、设备掉电告警名称:ONT掉电(DGi) 告警描述:OLT接收到ONT的掉电消息时发生此告警,OLT在测距阶段接收到ONT的PLOAM消息时告警恢复,发生此告警时ONT下线。
告警原因:ONT电源出现异常修复建议:检查ONT电源,保证ONT电源正常工作2、光信号丢失告警名称:ONT信号丢失(LOSi)告警描述:OLT连续几帧无法收到ONT有效的光信号,ONT下线,业务中断告警原因:(1)光通路质量差(2)光衰减不正常(3)ONT发生异常修复建议:(1)依次检查分支光纤连接和主干光纤连接,清洁光纤接头,必要时更换光纤(2)保证光路的光衰减正常(3)可能是ONT异常,复位该ONT3、主干光路告警告警名称:OLT GPON光信号丢失(LOS) 告警描述:OLT连续多帧收不到任何光信号,PON口下所有ONT下线告警原因:(1)光通路故障(2)PON口激光器没有被打开修复建议:(1)依次检查主干光纤连接和分支光纤连接,清洁光纤接头,必要时更换光纤(2)检查PON端口激光器是否打开,如果没有打开,打开激光器(3) OLT光模块松动或未插到位,重新插拔,并确认链接良好。
4、出现流氓ONT告警名称:端口下存在非法入侵的流氓ONT告警描述:端口下存在非法入侵的流氓ONT,可能阻断其他ONT的业务告警原因:端口下存在非法入侵的流氓ONT 修复建议:人工排查非法入侵的流氓ONT,然后替换它在OLT上查看告警的命令式display alarm history all。
如果对英文命令不好理解的话可以转换成中文switch language-mode目前维护中遇到的告警大都是常见告警,要么设备掉电,要么光路不好,很常见,只要电源和光路及时恢复,设备告警就会清除,业务就能恢复;不常见的是PON口下出现流氓ONU,这个不好处理,得逐一排查,在分光器侧逐个拔插跳纤,然后在OLT上观察告警的消除情况,拔掉一根跳纤,观察一下告警是否消除,直到告警消除,判断最后拔的那个跳纤连接的ONU就很有可能是故障设备,关闭电源重启看是否能恢复,最好是设备更换来解决。
华为传输设备常见告警含义及处理方法
华为传输(chuán shū)设备常见告警含义及处理方法AU_AIS AU告警指示(1)由MS_AIS、R_LOS、R_LOF 告警引发的相应VC4 通道的AU_AIS 告警;(2)业务配置错误;(3)对端站发送AU_AIS;(4)对端站发送部分故障;(5)本站接收部分故障。
(1)由本站MS_AIS、R_LOS、R_LOF 等告警引发的相应VC4通道的AU_AIS 告警,检查方法可通过对MS_AIS、R_LOS、R_LOF 的分析来定位故障;(2)还有一个可能原因是相应VC4 通道的业务有收发错开的现象,导致收端在相应通道上出现AU_AIS 告警,在这种情况下,该AU_4 中相应的TU 上也会伴随出现TU_AIS 告警。
这时,请检查出现AU_AIS 的站和它的互通业务站,以及中间业务穿通站的业务时隙配置是否错误;(3)更换对端站对应的交叉板和线路板;(4)更换本站的线路板和交叉板。
AU_LOP AU指针丢失(1)对端站发送部分故障;(2)对端站业务配置错误;(3)本站接收误码过大。
(1)检查对端站及本站业务配置是否正确,如果不正确,重新配置业务; (2)对于155M 光接口板一般无此故障,若有的话多为此光板配置有误。
而622M 和2500M光接口板接收到AU_LOP 告警,应检查对方时钟板是否正常工作、交叉板是否检测到了时钟;(3)如业务为140M 业务,检查业务是否正确接入;(4)依次更换对端站对应的交叉板和线路板,定位故障点;(5)更换本站的线路板和交叉板。
MS_AIS 复用段告警指示(1)对端站发送MS_AIS 信号;(2)对端站时钟板故障;(3)本板接收部分故障。
(1)检查对端站线路板是否存在问题,可通过复位或更换单板的方法检查告警是否消失;(2)检查本站线路板,同样可通过复位或更换单板的方法来检查告警是否消失。
MS_RDI 复用段远端接收失效指示(1)对端站接收到R_LOS/R_LOF/MS_AIS 信号;(2)对端站接收部分故障;(3)本站发送部分故障。
华为SDH告警文档
华为SDH告警文档目录第3章告警处理ALM_ALSALM_NOLSRPARAFILEALM_SUBCARD_ABNAPS_FAILAPS_INDIAPS_MANUAL_STOPAU_AISAU_CMMAU_LOPAU_SQUELCHINGB1_E某CB1_SDB1B_E某CB2_E某CB2_SDB3_E某CB3_E某C_VC3B3_E某C_VC4B3_SDB3_SD_VC3B3_SD_VC4BD_STATUSBIP_OVERBIP_SDCOMMUN_FAILCONCAT_某C_LMTCOOL_CUR_OVERDBMS_ERRORDBMS_PROTECT_MODEDPS_BDVER_DIFETH_LOSE某T_SYNC_LOSFAN_FAILFCS_ERRFPGA_ABNGFP_DCSFGFP_DLFDGFP_DSSFHARD_BA DHARD_FAILHDLC_FAILHP_CROSSTRHP_LOMHP_RDIHP_REIHP_SLMHP_TIMHP_UNEQILL_MFI_VC12ILL_MFI_VC3 IN_PWR_ABNIN_PWR_FAILIN_PWR_HIGHIN_PWR_LOWJ0_MMK1_K2_MK2_M LASER_CLOSEDLASER_NOT_E某ISTLCAS_BAND_DECREASEDLINK_ERRLOCK_CUR_FAILLOOP_ALMLP_CROSSTRLP_RDILP_RDI_VC12LP_RDI_VC3LP_REILP_REI_VC12LP_REI_VC3LP_RFILP_SLMLP_SLM_VC12LP_SLM_VC3LP_TIMLP_TIM_VC12LP_TIM_VC3LP_UNEQLP_UNEQ_VC12LP_UNEQ_VC3LSR_COOL_ALMLSR_NO_FITEDLSR_WILL_DIE LSRPARA_MISMATCHLTIMS_AISMS_APS_INDI_E某MS_CROSSTRMS_RDIMS_REIMSAD_CROSSTRNEBD_某C_DIFNESF_LOSTNESTATE_INSTALLNO_BD_PARANO_BD_SOFTOUT_PWR_ABNPASSTHROUGHPDU ALMPOWER_FAILPOWERALMPROTOCOL_MMPUM_BCM_ALMPUM_COOL_ALMPWR_MAJ_ALMPWR_MIN_ALMR_LO CR_LOFR_LOSR_OOFRELAY_ALARMRS_CROSSTRS_BADS1_SYN_CHANGESCC_CHANGESECU_ALMSENSOR_FAILSNCP_FAILSYN_BADSY NC_C_LOSSYSBUS_FAILT_ALOST_LOCT_LOSTEM_HATEM_LATEMP_ALARMTEMP_OVERTEST_STATUSTFTHUNDERALMTU_AISTU_AIS_VC12TU_AIS_VC3TU_LOPTU_LOP_VC12TU_LOP_VC3VC_DELAY_TLW_OFFLINEW_R_FAILUREWORK_CUR_OVERWRG_BD_TYPE某C_NONDUALTRANS第3章告警处理ALM_ALS1.概述ALM_ALS告警表示ALS告警(ALSAlarmignal),为次要告警。
华为MSC告警知识百科(1)
2、二级告警2.1 GCPC链路故障告警原始信息:当提供七号信令链路时,每块GCPC板可以提供四条信令链路,完成MTP 二层所有功能。
如果管理该链路的SPM模块检测到GCPC上报的单板复位消息,或者与GCPC握手超时时,产生此告警。
告警参数参数个数:7参数分别为:场地号;行号;列号;框号;槽号;板号;设备类型号。
例如:告警参数场地号=0,行号=1,列号=1,框号=20,槽号=10,板号=0,设备类型号=38;其含义为:0号场地上,第1行、第1列的机柜内,20号框、10号槽GCPC链路故障。
标准化网管告警ID:007-001-00-000087告警原因解释:告警原因:GCPC上报的单板复位消息,或者与GCPC握手超时。
影响范围:GCPC板可处理4条七号信令链路,当GCPC板链路故障,而该条链路对应的局向话务量又很大时,会造成一定的呼叫损失。
如果到某一局向的所有信令链路都在该板上时,将会导致到该局向的业务中断。
GCPC板可处理4条七号信令链路,当GCPC板链路故障,而该条链路对应的局向话务量又很大时,会造成一定的呼叫损失。
如果到某一局向的所有信令链路都在该板上时,将会导致到该局向的业务中断。
工程对告警的影响参考:网元割接预处理建议:1、告警真实性核实登陆相关告警平台,查询相关告警情况。
若告警存在,则表示该告警真实存在。
2、判断告警有效性根据网络调整、割接、工程实施计划信息或电话联系相关专业维护人员得到的信息,若无相关工程等调整信息,确认为有效告警,需处理。
3、故障定位步骤查告警信息,根据告警消息中的告警参数定位信息,确定故障单板的模块及位置,假设为20框10槽GCPC板。
观察是否有同框BCC故障告警,若有参照404 BCC故障告警处理。
指令如:DSP BRD: MN=0, F=20, SN=10;RETCODE = 0 执行成功单板信息--------设备类型 = CPC(MTP)单板状态 =正常//其它结果均为异常单板序号 = 0电路数量 = 1单板信息--------单板状态所属模块号上级GMHI板框号上级GMHI板槽号起始HW号正常 1 16 2 30链路状态--------链路号链路状态0 链路未配置1 业务工作状态2 链路未配置3 业务工作状态若DSP告警单板当前状态为非正常,说明单板当前状态不正常,4、故障预处理方法复位故障单板(执行前请先进行确认并通知各地市监控机房)RST BRD: MN=0, F=20, SN=10;复位后观察10-15分钟后再次使用DSP BRD指令查看单板状态。
华为告警处理-入门篇
要求:熟练掌握“中继链路分配表”,这样就不需要用几个命令组合去查找相应的中继信息。
11月份开始进行华为端局升级,新版本的MSOFTX3000上告警显示的直接是到某个局向的CIC号,这样直接就可以知道是到哪个局向的第几条中继故障(0-31是第一条,32-63是第二条,依次类推)。
直接查找“中继链路分配表”就很直接。
在MSOFTX3000或者UMG上通过端口环回操作确认不是本端问题后联系传输处理或者联系对局确认是否对方做什么操作了。
常用手段就是通过端口环回确认问题出在本端:MSOFTX3000侧命令:环回STR PORTLOP: ; 取消环回STP PORTLOP: ;这上面主要是到LSTP和本地HLR的直连中继和信令.注意:老版本的MSOFTX3000(V100R003C07B016)到各个局向的逻辑链路也在上面,新版本(V100R005C10B019)没有UMG8900侧命令:环回和取消环回都是LOP E1:;这上面主要是到各个局向的中继和信令,出现告警后,查看详细告警信息,然后查“中继链路分配表”。
了解是到那个局向的第几条中继以及上面是否带链路。
MSOFTX3000常见告警:一:sccp 目的信令点禁止、MTP路由传输禁止、 MTP目的信令点不可达、sccp子系统禁止首先查看目的信令点编码了解是哪个局向(本例中编码为AFE10)指令为LST N7DSP:;输出界面:由此我们初步判断是:本端局至JNRZHLR的相关告警由于JNRZHLR至本地端局经常出现此告警,可采用手动恢复,并清除告警。
若是至其他局向出现此告警,则需立即通知维护人员。
(此告警属于严重告警须重视)当出现一条链路故障的告警,确认是否同时伴有中继告警,是则一般是中继故障引起,然后通过环回确认是否本端设备故障,然后联系对局确认传输或者对局是否存在问题。
一般出现到sccp 目的信令点禁止、MTP路由传输禁止、 MTP目的信令点不可达这些告警时,并且我其他大量异常告警,一般是对局在做操作或者设备故障导致。
华为PTN 950的告警处理流程
告警处理通用流程
处理华为PTN 950设备的告警时,请参照以下流程。
华为PTN 950告警处理的一般原则
处理告警时,一般需要遵循以下原则:
●先根源告警,后衍生告警。
根据常见告警的相关性规则,先处理由故障或异常事件直接引发的告警(根源告警),后处理其它衍生出来的告警。
●先网管,后网元。
先在网管上远程实施告警原因的排查操作,后对实际网元实施排查。
●先排查常见原因,后排查特殊原因。
根据告警处理的经验和其它告警相关信息,先排查告警的常见原因,后排查告警的特殊原因。
●先软件,后硬件。
告警原因为华为PTN 950设备故障时,先排查软件故障(如复位单板),后排查硬件故障(如更换单板)。
注意:
文中涉及到拔插单板和硬复位的操作,若经过该板的业务没有保护,都将中断业务,请根据实际情况慎重进行此项操作。
说明:
告警处理过程中如存在任何问题,可联系华佳慧科技专业技术工程师处理。
1-华为T2000网管告警处理手册0815
华为T2000网管告警处理手册辽宁移动网管中心监控室2008年8月目录一、告警处理原则 (3)二、常见告警处理方法 (4)■NE_NOT_LOGIN 网元未登录告警 (4)■NE_COMMU_BREAK 网元通讯中断 (4)■GNE_CONNECT_FAIL 网关连接失败 (4)一、告警处理原则1、总体原则:如果出现告警处理手册中未提及的告警内容,处理方法为升级成问题单(在有业务网申告的情况下,同时电话通知专业负责人);2、对于某一故障引发的大量传输告警,依照先线路后设备、先单站后单板、先高级后低级的原则进行处理,同时参照附件中的告警关联原则进行初步判断,进行故障处理和定位,需要派发工单至市公司进行处理的,原则上每个地市只派发一个工作单即可,按照《工单填写规范》写清楚告警信息、故障信息、需地市操作工作内容等信息,不用一个告警对应一个工作单;3、监控值班人员发现故障后,先派发故障单给相应监控组,再按手册进行初步处理,需现场工程师进行后续处理的,派发故障配合工单至市公司故障处理组;对于不能独立解决的,应升级为问题单转往技术支持组;已派发故障配合工作单但仍无法解决的,由地市升级为问题单进行处理。
4、对于瞬报的告警可暂不用处理,但应密切注意网络及设备运行情况;对于多次瞬报或闪报的告警,应按照该告警的处理流程进行处理。
5、对于网络改造、工程割接、扩容、新建及系统调测产生的告警,网络部已经下发了公文或监控室接到了传输室的通知邮件,此类告警不需要处理;6、对于已升级为问题单的故障,在专业责任人无法到现场的情况下,监控人员应该在专业责任人允许和指导下,进行故障处理;7、故障处理过程中,涉及到派发集团EOMS工单的相关内容,按照集团EOMS工单填写要求进行工单填写。
二、常见告警处理方法■NE_NOT_LOGIN 网元未登录告警告警原因:NE_NOT_LOGIN为网元未登录告警,当用户退出登录或登录失败时上报此告警,将会导致网元脱管,无法进行故障、性能监控。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
要求:
熟练掌握“中继链路分配表”,这样就不需要用几个命令组合去查找相应的中继信息。
11月份开始进行华为端局升级,新版本的MSOFTX3000上告警显示的直接是到某个局向的CIC号,这样直接就可以知道是到哪个局向的第几条中继故障(0-31是第一条,32-63是第二条,依次类推)。
直接查找“中继链路分配表”就很直接。
在MSOFTX3000或者UMG上通过端口环回操作确认不是本端问题后联系传输处理或者联系对局确认是否对方做什么操作了。
常用手段就是通过端口环回确认问题出在本端:
MSOFTX3000侧命令:环回STR PORTLOP: ; 取消环回STP PORTLOP: ;这上面主要是到LSTP
和本地HLR的直连中继和信令.注意:老版本的MSOFTX3000(V100R003C07B016)到各个局向的逻辑链路也在上面,新版本(V100R005C10B019)没有
UMG8900侧命令:环回和取消环回都是LOP E1:;这上面主要是到各个局向的中继和信令,出现告警后,查看详细告警信息,然后查“中继链路分配表”。
了解是到那个局向的第几条中继以及上面是否带链路。
MSOFTX3000常见告警:
一:sccp 目的信令点禁止、MTP路由传输禁止、 MTP目的信令点不可达、sccp子系统禁止
首先查看目的信令点编码了解是哪个局向(本例中编码为AFE10)
指令为LST N7DSP:;
输出界面:
由此我们初步判断是:本端局至JNRZHLR的相关告警
由于JNRZHLR至本地端局经常出现此告警,可采用手动恢复,并清除告警。
若是至其他局向出现此告警,则需立即通知维护人员。
(此告警属于严重告警须重视)
当出现一条链路故障的告警,确认是否同时伴有中继告警,是则一般是中继故障引起,然后通过环回确认是否本端设备故障,然后联系对局确认传输或者对局是否存在问题。
一般出现到sccp 目的信令点禁止、MTP路由传输禁止、 MTP目的信令点不可达这些告警时,并且我其他大量异常告警,一般是对局在做操作或者设备故障导致。
联系对局确认。
UMG8900相关告警
二:E1/T1 远端告警
此类告警为传输电路告警,表示本端局至某局向电路中断或闪断
首先:双击红色圈中的信息会弹出如下对话框:
该告警我们可以通过E1环回来确认是否本端故障:LOP E1: FN=1, SN=13, LOC=PORT, MODE=INERLOP, PN=31;环回以后如果告警消失,说明是设备之外部分出现问题,通知传输进行处理或者连续对局是否在做一些中继操作。
另外,如果是晚上传输暂时无法处理,又要将告警消除:请关闭该中继的告警输出(SET E1ALM: FN=1, SN=13, SPN=31, EPN=31, SW=DISABLE;),并手工回复该告警。
但需要做好标记,等第二天值班人员交班时记着打开告警(SET E1ALM: FN=1, SN=13, SPN=31, EPN=31, SW=ENABLE;),后面有该操作的附图
如果问题出在MSOFTX3000上:也有端口环回命令STR PORTLOP: ; (环回命令)STR PORTLOP: ;(解开环回命令)
下图是在MSOFT3000上查看电路状态,一般不需要。
可以了解一下
其次:根据框、槽、端口号,可以查找电路文档信息得出进一步详细信息:
1)对端局向为:JNIGM3,TID:2016 模块号:29 起始电路:5408 终止电路:5439
2)交换ddf (对应传输ddf要传输人员再次确认)
以上信息均为手工录入信息,其中TID(终端标示)信息是最准确的,为确保电路文档信息正确,可在相应server下进
行如下操作来进行验证:LST TKCBYTID (类似于exdep)
会出现如下相关信息:(包括局向、中继群、模块号、起始电路号)
第三:根据以上信息可以进行以下预处理:
1)查看该电路状态:DSP N7TKC(类似于爱立信的stdep)
会出现如下信息:
电路状态是:空闲、忙均代表正常,若是其他状态如:闭塞、锁定、故障、未知均为故障状态2)根据ddf,联系传输处理
3)如果出现传输闪断现象,或者传输人员正在处理该电路时,需要输入如下指令以防止告警不断出现,造成不必要的扣分。
(类似于dtfse)。
切忌:将告警屏蔽后,一定要在文档中标注!
4)如何配合传输查看电路
一般传输人员为排查线路故障,会要求我们配合查看电路状态
一般可以从面板中直接查看电路是好是坏,或者用指令DSP E1PORT(类似于dtstp)
如图所示:查看1框13槽23端口
绿色:代表wo,红色:代表abl 说明电路是故障的
三:提高篇:链路故障SPF扣板链路故障
此告警是比较重要的告警,类似于爱立信的C7 link 告警
首先双击红色圈中的定位信息,进行初步定位:查找相应的电路、ddf等信息
(mgw的告警)
1)以上红色圈中的三个参数信息是比较重要的信息:
链路名称:JIG4-1这是说明是对端局向是到jig4的
接口班组号+E1端口号:确定该链路所在电路,以及相关ddf信息
根据以上信息,联系传输处理该电路。
一般是由于闪断、故障等原因,导致链路故障。
2)链路故障时,在server侧也会出现相关告警
(server会出现相关告警)
用指令dsp n7lnk (类似c7stp),查看链路状态
输入界面会有以下信息
信令链路选择码如果是一串序列号,表示链路状态是是好的,如果是<null>表示该链路不正常,需继续处理
去激活链路指令:DEA N7LNK
激活链路指令:ACT N7LNK
另外还有一些告警:计费中心长时间不取话单、话单服务器心跳中断、话单文件备份失败,性能统计丢失等告警,应急工作站连接失败或者数据备份失败等。
1、出现计费中心不取话单:并且无其他话单服务器的告警时,一般是计费网络问题或者账务中心话单采集设备在做操作或者故障导致。
如果不是账务中心出问题请及时通知维护人员,在维护人员的指导下做一些恢复操作
2、话单服务器心跳中断:话单服务器之间有两条心跳,断一条时基本上无影响。
可以暂时手工恢复该告警等第二天维护人员上班后处理。
如果两条都中断的话应该也会伴有服务器故障,主机到服务器中断的告警,这种情况一般是其中一套服务器故障引起。
请及时通知维护人员。
3、话单文件备份失败:如果开局后备份正常,后来突然出现问题。
一般情况是备份话单的电脑出现问题,磁盘空间不足,或者关机了,或者网卡故障(很少),或者FTP进程因为病毒停掉了(很少)。
该问题不严重,可以手动恢复。
第二天等维护人员上班后处理
4、性能统计丢失(NSP告警平台出):一般是局点BAM服务器的性能统计进程异常或者bam服务器死掉。
也可能是上级网管出现问题或者中间的维护网络出现问题。
通过如下操作可以确认是否前一种:看能否PING通相应局点的维护IP地址或者登陆,可以的话表示BAM服务器正常。
然后登陆性能统计平台,如果一直无法登陆表明是统计进程异常,请通知维护人员。
其他情况一般就是上级网管问题或者网络不通,联系相关人员处理
5、应急工作站连接失败或者数据备份失败:该问题不严重,可以手工恢复该告警,第二天请维护人员处理。
6、凌晨出现一些数据加载等告警:这种告警不必关注,这是设备为了前后台数据一致进行的单板软件复位进行数据程序重新加载。
属于正常。
7、告警箱未连接:手动恢复,第二天等维护人员处理
8、单板故障:查看是否有其他相关的紧急、重要告警请及时联系维护人员。
如果可以的话,请进行单板的硬件复位操作在设备维护面板将显示红色的单板进行复位(一定要是硬件复位),看是否可以正常运行。