华为交换机告警处理手册

合集下载

华为PTN告警处理规范

华为PTN告警处理规范

华为PTN告警处理规范1.ETH_LOS告警解释:ETH_LOS为以太网端口连接丢失告警。

该告警表示以太网端口接收不到以太网信号。

产生原因:以太网端口的电缆或光纤没有连接好。

电缆或光纤故障。

本端网元接收光功率过低。

单板故障。

处理步骤:检查以太网端口的电缆或光纤是否接好,插紧松脱的电缆或光纤。

检查电缆或光纤是否存在故障,更换故障的电缆或光纤。

检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。

更换上报告警的处理板。

若告警未消除,更换对端网元对应的处理板。

2.MPLS_TUNNEL_LOCV告警解释:MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。

连续3个周期内没有收到希望的CV/FFD报文时出现此告警。

产生原因:PW对端停止CV/FFD。

物理链路故障。

PW对端单板正在复位。

业务接口配置错误。

网络出现严重拥塞。

处理步骤:在网管上查看PW对端是否停止了CV/FFD。

在网管上检查该链路两端网元是否存在单板或光模块相关的告警。

若告警未清除,查看光纤或电缆是否故障,更换故障的光纤或电缆。

在网管上检查对端单板是否上报COMMUN_FAIL告警。

若存在,说明对端单板可能正在复位。

清除COMMUN_FAIL告警后,查看本告警是否清除。

对照网元规划表,在网管上查看业务接口是否配置错误。

如果是,重新配置业务接口后,查看告警是否消除。

检查故障Tunnel的带宽是否已被完全占用。

如果是,增大Tunnel带宽配置或消除非法发送大数据量的根源。

查看告警是否清除。

3. BD_STATUS告警解释:BD_STATUS为物理单板离线告警。

当用户在网管上配置了逻辑单板而物理子架上却没有插入实际单板时就会上报此告警。

产生原因:单板正在硬复位。

单板未插上,或单板插上,但与母板接触不良。

板间通讯故障。

处理步骤:在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若是,则该单板处于硬复位状态。

等待3至5分钟,该单板的工作状态转成绿色后,查看本告警是否消除。

华为PTN告警处理规范

华为PTN告警处理规范
检查单板是否存在TR_LO(告警,指示单板收到的38M系统时钟故障。若 存在,优先清除TR_LO告警。检查单板是否存在POWER_ABNOR告AL,指示单板电压异常。若存在,优先清除POWER_ABNOR告AL检查单板 是否存在HARD_BA告警,指示单板硬件故障。若存在,硬复位单板后, 查看告警是否清除。若告警未清除,更换上报HARD_BA告警的单板,并
对照网元规划表,在网管上查看业务接口是否配置错误。如果是,重新
配置业务接口后,查看告警是否消除。
检查故障Tunnel的带宽是否已被完全占用。如果是,增大Tunnel带宽 配置或消除非法发送大数据量的根源。查看告警是否清除。
3.
告警解释:BD_STATU为物理单板离线告警。当用户在网管上配置了逻辑单
板而物理子架上却没有插入实际单板时就会上报此告警。
在网管上查看两端端口是否存在LOOP_AL告警,若存在,优化清除LOOP_AL告警后,查看本告警是否清除。
对照网元规划表, 查看上报告警的端口是否错插了纤缆, 造成两端端口工 作模式不一致。
在网管上查看两端网元的相关单板是否存在HARD_BA等硬件类告警。若 存在,更换存在硬件类告警的单板后,查看本告警是否清除。
产生原因:
单板正在硬复位。
单板未插上,或单板插上,但与母板接触不良。
板间通讯故障。
处理步骤:
在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若 是,则该单板处于硬复位状态。等待3至5分钟,该单板的工作状态转 成绿色后,查看本告警是否消除。
检查相应槽位的单板是否插入。若未插入,请插入相应物理单板,告警 将自动清除。 检查单板与母板是否接触良好, 母板连接器的导针是否歪 斜。修正歪斜的导针,重新插拔单板使之与母板良好接触,告警将自动 清除。

华为分布式HLR告警处理手册

华为分布式HLR告警处理手册

告警处理手册_华为V1.0文档更新记录目录V1.0 (1)一、CGP告警 (10)1. 紧急告警 (10)1ALM-1005 单板CPU过载 (10)2ALM-2413 XPTU与CP通信中断 (11)3ALM-3161 流量失衡 (13)4ALM-3162 IP地址冲突 (15)5ALM-3163 网关探测失败 (16)6ALM-3164 IP泛洪攻击 (19)7ALM-3166 IP不可达故障告警 (21)8ALM-4100--ALM4200 模拟量或数字量传感器告警 (22)9ALM-7403 性能业务指标阈值四级越限 (23)2. 重要告警 (24)1ALM-101 主备模块补丁状态不一致 (24)2ALM-1003 模块故障 (26)3ALM-1009 剩余存储空间不足 (28)4ALM-1015 SDM板不在位 (29)5ALM-1016 NTP请求超时 (30)6ALM-1022 本地RAID1故障 (31)7ALM-1023 单板端口故障 (33)8ALM-1030 本地存储介质故障 (37)9ALM-1039 框号冲突 (39)10ALM-2001 单板故障 (41)11ALM-2015 电源输入模块故障 (44)12ALM-2037 ATM端口故障 (46)13ALM-2069 模块间通讯故障 (48)14ALM-2135 风扇故障 (50)15ALM-2402 OMU与LIG/LIC通信中断 (52)16ALM-2411 XPTU逻辑驱动器空间不足 (53)17ALM-2414 XPTU与GSOSM连接中断 (54)18ALM-3010 单板温度二级越限 (55)19ALM-3013 单板扳手打开 (56)20ALM-3015 空气过滤网不在位 (57)21ALM-3017 SMM板与框内设备硬件监控总线故障 (58)22ALM-3077 单板电压二级越限 (60)23ALM-3095 风扇温度二级越限 (61)24ALM-3101 电源输入模块温度二级越限 (62)25ALM-3107 风扇电压二级越限 (63)26ALM-3113 电源输入模块电压二级越限 (64)27ALM-3160 主备SMM板的框号不一致 (65)28ALM-3802 E1T1端口故障 (66)29ALM-3807 OMU与TDM扣板程序校验不一致 (68)30ALM-3808 窄带接口板故障 (69)31ALM-3810 TDM扣板时钟故障 (70)32ALM-3814 TDM扣板硬件故障 (73)33ALM-4402 OMU与单板单平面连接故障 (75)34ALM-4403 OMU与单板通信故障 (76)35ALM-4405 OMU与机框双平面通信故障 (77)36ALM-4421 S3100磁盘阵列故障 (78)37ALM-4501 LAN Switch冷启动 (79)38ALM-4503 LAN Switch端口故障 (80)39ALM-4507 LAN Switch输入电源失效 (83)40ALM-4508 LAN Switch风扇失效 (84)41ALM-4509 LAN Switch端口处于去激活状态 (85)42ALM-4601 SMM板与配电盒通讯故障 (85)43ALM-4602 配电盒管理功能失效 (86)44ALM-4603 配电盒输入电压异常 (86)45ALM-4605 配电盒输出电源开关关闭 (88)46ALM-4606 配电盒外接开关传感器警报 (89)47ALM-4670 扣板故障 (90)48ALM-4671 扣板不在位 (91)49ALM-4752 格式化失败 (91)50ALM-4754 联机设定失败 (92)51ALM-4756 数据表自动CRC校验错误 (94)52ALM-5008 鉴权失败 (95)53ALM-5009 非法登录 (96)54ALM-5010 普通用户执行特通专用命令鉴权失败 (97)55ALM-5102 特通退出服务 (97)56ALM-5201 配置事务即将超时 (98)57ALM-5203 配置事务超时自动回滚 (99)58ALM-5230 MOD MAXT命令发送失败 (100)59ALM-5301 SMM板主备通讯故障 (100)60ALM-5401 主机运行版本和OMU不一致 (101)61ALM-5521 S2600磁盘阵列故障 (102)62ALM-6402 文件加载失败 (103)63ALM-6416 安装失败 (105)64ALM-6417 单板操作系统重新安装 (106)65ALM-7404 性能业务指标阈值三级越限 (107)66ALM-7407 CHR上传单据故障重要告警 (108)67ALM-8301 OMU与RMU设备通信故障 (109)68ALM-8302 OMU与交换板通信故障 (110)69ALM-8304 OMU与RAID设备通信故障 (113)70ALM-8305 OMU与LSW设备通信故障 (114)71ALM-8306 OMU与SMM板管理单元通讯故障 (115)72ALM-8308 SMM板文件加载失败 (117)73ALM-8502 OMU双机数据库同步失败 (118)74ALM-8504 OMU双机通信故障 (118)75ALM-8505 OMU双机文件同步失败 (119)76ALM-8510 单板运行文件与OMU不一致 (120)77ALM-8600 OMU资源异常 (121)78ALM-8601 OMU双机主备倒换 (123)79ALM-8605 主备OMU倒换失败 (124)80ALM-8610 OMU浮动IP冲突 (125)81ALM-8702 OMU向NTP服务器同步时间失败 (126)82ALM-8706 RTC故障 (127)83ALM-9004 创建SNMP会话实体失败 (128)84ALM-9996 SMM板倒换失败 (129)3. 次要告警 (131)1ALM-102 补丁激活后未确认 (131)2ALM-753 告警箱处于离线状态 (132)3ALM-2010 风扇转速越限 (133)4ALM-2375 同一类型模块确认的补丁个数不一致 (134)5ALM-3001 CPU报错 (135)6ALM-3009 单板温度一级越限 (137)7ALM-3076 单板电压一级越限 (138)8ALM-3094 风扇温度一级越限 (139)9ALM-3100 电源输入模块温度一级越限 (140)10ALM-3106 风扇电压一级越限 (141)11ALM-3112 电源输入模块电压一级越限 (141)12ALM-4404 OMU与机框单平面通信故障 (142)13ALM-4502 LAN Switch热启动 (144)14ALM-6415 软件包损坏 (144)15ALM-7405 性能业务指标阈值二级越限 (146)16ALM-8307 SMM主备板软件版本不一致 (147)17ALM-8503 OMU双机连接故障 (147)18ALM-8703 OMU与特定的NTP服务器通信故障 (148)19ALM-8704 OMU与NTP服务器时间偏差超出同步阈值 (150)4. 提示告警 (151)1ALM-3165 端到端质量检测超标 (151)2ALM-4766 帐户锁定 (152)3ALM-4790 帐户锁定 (153)4ALM-7406 性能业务指标阈值一级越限 (153)二、USCDB告警 (155)1. 紧急告警 (155)1ALM-5217 License特征段限制业务 (155)2ALM-5218 License文件限制业务 (156)3ALM-11000 磁阵与服务器单板的连接状态异常 (156)4ALM-11001 数据库表空间不足 (162)5ALM-11003 数据库连接异常 (167)6 ALM-11007 双机信任关系异常 (179)7ALM-11008 CRS资源状态异常 (182)8ALM-12011 容灾故障 (190)9ALM-12012 流控开始 (193)10ALM-12015 License用户数已经达到容量限制 (195)11ALM-22005 加载LDAP SCHEMA文件失败 (196)2. 重要告警 (198)1ALM-101 主备模块补丁状态不一致 (198)2ALM-371 节点内存不足 (199)3ALM-794 禁止格式化转换 (200)4ALM-2069 模块间通讯故障 (201)5ALM-4488 配置进入脱机状态 (203)6ALM-4752 格式化失败 (203)7ALM-4754 联机设定失败 (204)8ALM-4756 数据表自动CRC校验错误 (206)9ALM-5215 License特征段已经失效 (207)10ALM-5216 License文件已经失效 (208)11ALM-5221 License文件无效 (209)12ALM-5401 主机运行版本和OMU不一致 (210)13ALM-11002 物理数据库备份或恢复失败 (211)14ALM-11004 硬盘空间占用率超过90% (225)15ALM-12001 节点心跳超时 (227)16ALM-12007 节点加载失败 (229)17ALM-12008 节点备份失败 (236)18ALM-14002 DPU同步文件数目超出上限 (242)19ALM-14003 DPU与远端DPU连接失败 (244)20ALM-14007 PGW流控启用 (245)21ALM-22001 DSG SCTP链路传输质量下降 (247)22ALM-22002 DSG SCTP链路负荷过载 (248)23ALM-22003 DSG SCTP链路拥塞 (250)24ALM-22004 DSG SCTP链路故障 (251)3. 次要告警 (253)1ALM-102 补丁激活后未确认 (253)2ALM-369 节点内存使用率过高 (254)3ALM-1043 模块备份开关关闭 (255)4ALM-3451 License宽限保护打开 (256)5ALM-10000 PCDR缓冲区溢出 (257)6ALM-14004 PGW同步静态数据出错 (258)7ALM-14009 DPU文件传输失败 (259)8ALM-14011 PGW节点与物理库连接异常 (261)9ALM-22000 DSG SCTP路径故障 (262)4. 提示告警 (264)1ALM-5213 License特征段即将失效 (264)2ALM-5214 License文件即将失效 (265)3ALM-12014 License用户数即将达到容量限制 (265)三、HLR-FE告警 (267)1. 紧急告警 (267)1ALM-1701 MTP目的信令点不可达 (267)2ALM-1713 MTP路由不可用 (268)3ALM-1815 M3UA路由不可用 (270)4ALM-1817 M3UA目的实体不可达 (271)5ALM-2752 SCCP目的信令点不可达 (272)6ALM-2758 远端SCCP故障 (273)7ALM-5217 License特征段限制业务 (274)8ALM-5218 License文件限制业务 (275)2. 重要告警 (276)1ALM-101 主备模块补丁状态不一致 (276)2ALM-743 主用FE和容灾FE动态数据同步心跳超时 (277)3ALM-794 禁止格式化转换 (279)4ALM-1705 MTP链路故障 (280)5ALM-1707 MTP缓冲区拥塞 (286)6ALM-1709 MTP二层拥塞 (289)7ALM-1715 MTP链路发送负荷过载 (291)8ALM-1717 MTP链路接收负荷过载 (293)9ALM-1728 MTP链路故障自环检测 (296)10ALM-1762 M3UA SCTP路径故障 (297)11ALM-1768 M3UA链路传输质量故障 (298)12ALM-1793 M3UA链路集不匹配 (301)13ALM-1809 M3UA链路拥塞 (304)14ALM-1811 M3UA链路故障 (307)15ALM-1831 M3UA链路负荷过载 (310)16ALM-2069 模块间通讯故障 (312)17ALM-2754 SCCP子系统禁止 (314)18ALM-2756 SCCP子系统故障 (316)19ALM-3228 信令点拥塞 (317)20ALM-4488 配置进入脱机状态 (318)21ALM-4752 格式化失败 (318)22ALM-4754 联机设定失败 (319)23ALM-4756 数据表自动CRC校验错误 (321)24ALM-5215 License特征段已经失效 (322)25ALM-5216 License文件已经失效 (323)26ALM-5221 License文件无效 (324)27ALM-5401 主机运行版本和OMU不一致 (325)28ALM-12001 节点心跳超时 (326)29ALM-22001 DSG SCTP链路传输质量下降 (327)30ALM-22002 DSG SCTP链路负荷过载 (329)31ALM-22003 DSG SCTP链路拥塞 (331)32ALM-22004 DSG SCTP链路故障 (332)33ALM-125300 特通消息缓冲区满 (334)3. 次要告警 (335)1ALM-102 补丁激活后未确认 (335)2ALM-1043 模块备份开关变化告警 (336)3ALM-2763 SCCP消息环回错误 (337)4ALM-3451 License宽限保护打开 (338)5ALM-22000 DSG SCTP路径故障 (339)6ALM-125301 特通消息缓冲区占用空间超过阈值 (340)4. 提示告警 (341)1ALM-5213 License特征段即将失效 (341)2ALM-5214 License文件即将失效 (342)四、DX80磁盘阵列告警处理 (343)1. J类型告警 (343)1J 0ASSMM0p Controller Module#m(zz xxHz) BE Expander Port#p Warning <pppppsssss rrrrr> (343)2J 0CSSMM00 Controller Module#m(zz xxHz) Flash ROM Warning <ppppp sssss rrrrr> (344)3J 0ESSMM00 Controller Module#m(zz xxHz) NAND Flash Warning <ppppp sssss rrrrr> (346)4J 01SSMM00 Controller Module#m(zz xxHz) Warning factor(ww) <ppppp sssss rrrrr> (347)5J 06SSMM00 Controller Module #m(zz xxHz) BE Expander Warning <ppppp sssss rrrrr> (349)6J 08SSMM0p Controller Module#m(zz xxHz) DI Port#p Warning <ppppp sssss rrrrr> (350)7J 09SSMM00 Controller Module#m(zz xxHz) SAS Port#nn Warning <ppppp sssss rrrrr> (351)8J 80SSMMnn Disk Drive DE#MM-Disk#nn(SAS xxxGB yykrpm ccccc) SMART(Warning)<ppppp sssss rrrrr> (353)9J 900xMM0n Expander DE#MM/EXP#n Warning <ppppp sssss rrrrr> (354)10J 910xMMnp Expander Port DE#MM/EXP#n/Port#p Warning <ppppp sssss rrrrr>35611J C1MM0000 Controller Module#m(zz xxHz) Reboot <ppppp sssss rrrrr> (357)12J C3SSMM00 Controller Module#m(zz xxHz) Cache(MEM) Correctable Error <pppppsssss rrrrr> (358)13J D20xMM0n Power Supply Unit DE#MM/PSU#n Warning <ppppp sssss rrrr> (360)14J DA0xMM00 DE Exhaust temperature (sensor) DE#MM Warning (361)15J DB0xMM00 DE Intake temperature DE#MM Warning (362)2. M类型告警 (363)1M 21810xxx RAID Group#0xxx REBUILD to HS(DV)(Recovered end) (363)2M E005nxxx WRITE BAD DATA (364)3M E10300xx PINNED DATA (365)4M E207000B NOT READY(11:Power Off/Fail Incomplete) (366)5M E207000C NOT READY(12:Backup Fail) (367)6M E207000D NOT READY(13:Multi CM Down) (367)7M E207000E NOT READY(14:Machine Down Recovery End) (368)8M E207000F NOT READY(15:Machine Down Recovery Failed) (368)9M E2070001 NOT READY(01:Configuration Error) (369)10M E2070002 NOT READY(02:CM F/W Version Error) (369)11M E2070004 NOT READY(04:Restore Fail) (370)12M E2070010 NOT READY(16:DE Build Error) (370)13M E2070011 NOT READY(17:CM Memory Shortage) (371)14M E2070015 NOT READY(21:Configuration Data restored from System Disk) (371)15M E2070016 NOT READY(22:No Version) (372)3. P类型告警 (372)1P 0ASSMM0p Controller Module#m(zz xxHz) BE Expander Port#p Fault <ppppp sssss rrrrr> (372)2P 0BSSMM00 Controller Module#m(zz xxHz) Cache(MEM) Fault <ppppp sssss rrrrr> (373)3P 0CSSMM00 Controller Module#m(zz xxHz) Flash ROM Falut <ppppp sssss rrrrr> 374 4P 0ESSMM00 Controller Module#m(zz xxHz) NAND Controller Fault <ppppp sssss rrrrr> (375)5P 0FSSMM00 Controller Module#m(zz xxHz) SCU Fault <ppppp sssss rrrrr> (376)6P 1A00MM0p FC SFP Controller Module#m Port#p Fault <ppppp sssss rrrrr ooooo> (377)7P 1C00MM0p FC SFP+ Controller Module#m Port#p Fault <ppppp sssss rrrrr ooooo> (378)8P 01SSMM00 Controller Module#m(zz xxHz) Fault <ppppp sssss rrrrr> (379)9P 06SSMM00 Controller Module#m(zz xxHz) BE Expander Fault <ppppp sssss rrrrr> (380)10P 08SSMM0p Controller Module#m(zz xxHz) DI Port#p Fault <ppppp sssss rrrrr> 381 11P 09SSMM00 Controller Module#m(zz xxHz) SAS Port Fault <ppppp sssss rrrrr> .. 382 12P 11SSMM0p Controller Module#m(zz xxHz) Port#p Fault <ppppp sssss rrrrr> (383)13P 12SSMM00 Controller Module#m(zz xxHz) FE Expander Fault <ppppp sssss rrrrr> (384)14P 13SSMM0p Controller Module#m(zz xxHz) FE Expander Port#p Fault<ppppp sssss rrrrr> (385)15P 80SSMMnn Disk Drive DE#MM-Disk#nn(SAS xxxGB yykrpm ccccc) Fault (Failed Usable)<ppppp sssss rrrrr> (386)16P 88SSMMnn Disk Drive DE#MM-Disk#nn(SAS xxxGB yykrpm ccccc) Fault <ppppp sssss rrrrr> (387)17P 900xMM0n Expander DE#MM/EXP#n Fault <ppppp sssss rrrrr> (388)18P 910xMMnp Expander Port DE#MM/EXP#n/Port#p Fault <ppppp sssss rrrrr> (390)19P D20xMM0n Power Supply Unit DE#MM/PSU#n Fault <ppppp sssss rrrrr> (391)20P DA0xMM00 DE Exhaust temperature (sensor) DE#MM Fault (392)21P DB0xMM00 DE Intake temperature sensor DE#MM Fault (393)4. R类型告警 (394)1R 06SSMM00 Controller Module#m(zz xxHz) BE Expander Normal <ppppp sssss rrrrr> (394)2R 900xMM0n Expander DE#MM/EXP#n Normal<ppppp sssss rrrrr> (395)3R D20xMM0n Power Supply Unit DE#MM/PSU#n Normal <ppppp sssss rrrrr> (396)4R DA0xMM00 DE OUT TEMP Normal (396)5R DB0xMM00 DE IN TEMP Normal (397)一、CGP告警1. 紧急告警1ALM-1005 单板CPU过载告警解释当系统检测到CPU的占用率大于过载告警的门限(可由用户设置)时,上报此告警。

华为防火墙预处理手册

华为防火墙预处理手册

华为防火墙预处理手册华为技术服务有限公司版权所有侵权必究修订记录1、子卡整体功能失效2、子卡不在位3、单板被拔出时产生此告警4、单板整体功能失效5、单板局部功能失效6、冷启动-需电话通知7、热启动&数据通道故障9、电源不可用10、补丁的某种操作第一次没有成功,在下一级操作中又成功了这种操作包括:通过patch load 命令执行补丁加载操作;通过patch active 执行补丁激活操作。

11、SPU的单个CPU内存利用率超过上限告警阈值12、SPU单个CPU利用率的最大值超过设定的阈值。

13、SPU的单个CPU会话建立速率超过上限告警阈值14、SPU的单个CPU会话总数超过上限告警阈值15、双机热备心跳状态变更16、防火墙的主备状态发生切换17、风扇整体功能失效18、风扇局部功能失效19、风扇被拔出时产生此告警20、物理实体变成主用状态21、物理实体退出主用状态22、系统配置不合理告警23、子卡局部功能失效24、电源整体功能失效25、电源被拔出时产生此告警26、电源局部功能失效27、单板,子卡温度过高严重告警28、当备主控板CF卡不能读和写时产生此告警29、当主主控板CF卡不能读和写时产生此告警30、当加载补丁失败时产生此告警31、主机软件升级失败通知32、配置文件指定错误33、清除加载补丁包失败告警34、tunk物理口变化通知35、风扇不可用36、内存使用率过高告警37、自定义alarm告警通知38、OSPF邻居状态改变39、物理实体发生复位--本文结束。

远端模块异常告警的处理方法

远端模块异常告警的处理方法

远端模块异常告警的处理方法宣钢公司在用的数字程控电话交换设备由一个中心模块和两个远端模块组成,中心模块与远端模块通过光端机及光缆主干进行连接,由于公司对厂区的规划改造或设备供电系统故障等,远端模块便会出现告警,本文重点对远端模块发生告警的现象、原因等多方面进行分析,力求快速解决问题。

标签:电话交换设备远端模块故障告警宣钢电话通信系统的核心设备,使用的是华为32模C&C08数字程控电话交换机。

由于宣钢公司办公及生产区域较分散,从节约的角度考虑,在中心生产区域设置一个6000线中心模块,在另外两个办公区域各分设一个远端模块,共同组成宣钢语音电话的通信网络,保障宣钢公司各处室、二级单位的生产调度及生产经营工作的正常开展。

一、程控电话交换机告警系统简介华为数字程控电话交换机的告警系统由告警检测、告警处理和告警输出三大部分组成,它通过检测程控交换机设备运行中产生的各种软件、硬件异常或故障,经维护软件处理后,将故障信息通过告警灯、告警箱、告警台等终端设备以声、光、屏幕显示等形式发出可视、可闻信号,以便通知维护人员及时发现并解决处理。

告警灯、告警箱可以直观地告诉设备维护人员设备存在需要处理的问题或故障,而华为的故障信息告警台是一个设备告警输出信息报告的平台,更为详细地显示出告警类别、告警原因、告警部位、处理建议等信息,从而使维护人员能更快捷的解决设备存在的故障。

华为C&C08程控交换设备故障告警,按故障的紧急和重要程度分为以下四类:1.紧急告警(一级告警)紧急告警是特别重要的告警级别,这种告警大部分情况是具有全局性的故障,一般地会导致设备瘫痪,全局电话通信中止。

2.重要告警(二级告警)重要告警是相对较重要的告警级别,会影响重要功能的实现。

3.一般告警(三级告警)一般告警,指一般性的、描述设备各单板或线路工作的状态故障告警和事故告警;用来提醒及时消除存在的隐患故障。

4.警告告警(四级告警)警告告警是提示性告警,只作提示性的故障告警和事故告警,这种告警不会影响系统性能。

交换机故障处理手册

交换机故障处理手册

常见交换机故障处理手册一.小区用户拨号678故障主要原因:1.设备问题2.环路问题3.数据出错4.线路问题处理步骤:1. 首先从上联的设备登录,查看下联口数据收发。

1.1 如果端口DOWN,则是上联设备网线松动或光猫坏。

1.2 如果端口UP,数据收发都有,则检查该端口是否有MAC地址上来。

1.2.1有MAC地址的话就可能是端口吊死或是环路,shutdown端口再undoshutdown端口即可解决端口吊死。

环路可以通过dis log来查看下联设备是否存在环路,一层一层查找到环路端口,环路可能由设备端口坏,物理线路成环,以及用户端网卡坏造成。

1.2.2无MAC地址的话也可能是端口吊死引起,shutdown端口再undoshutdown端口即可解决。

1.3 如果端口UP,数据有发无收,则是下联设备故障,需要到现场检查。

1.3.1 首先查看设备有无电源.1.3.2 如是户外缆级联,则查看设备端口是否UP,如设备端口DOWN,则更换设备端口确认是否端口坏或用测线仪测试线路是否正常,如线路不通则转交线路部门处理。

1.3.3如是光缆级联,首先查看光猫是否正常,光路指示灯是否正常,如指示灯不正常,则用光源测试线路是否正常。

线路通则通过更换光猫,将尾纤收发互反来解决或通过光源发光来确认线路是否不通,如线路不通则转交线路部门处理。

1.3.4 光猫如正常,则查看交换机是否正常,通过console口登录设备,首先查看设备上联口是否有MAC地址透传。

1.3.4.1如有MAC地址透传,还不能拨号上网的,一般为设备吊死,重启后可恢复。

如设备重启仍无法连接,则查看本端以及上联设备数据是否配置正常,有无数据丢失。

1.3.4.2如无MAC地址透传,则要检查上联端口连接是否正常,如线路正常则更换上联口测试。

如若不行,则直接连户外缆或光猫测试,可以成功拨号则说明问题在设备端。

如本端以及上联设备数据配置正常,则说明设备坏需更换新设备。

华为交换机MGW维护作业计划操作指导书

华为交换机MGW维护作业计划操作指导书

华为交换机MGW维护作业计划操作指导书目录第1项告警管理系统的各种告警信息检查 (3)第2项:各种单板运行状态检查 (3)第3项:IP承载路由状态检查 (5)第4项:时钟状态检查 (5)第5项:MGW状态检查 (7)第6项:H248、M2UA、M3UA链路状态检查 (9)第7项:CPU占用率检查 (11)第8项:基本呼叫功能测试(包括特服号码) (12)第9项:配置文件备份 (12)第10项:机房环境检查、设备状况检查及清洁 (14)第11项:口令及操作权限清理 (14)第12项:系统主备倒换 (15)第13项:电源及地线检查、地阻测试 (15)第1项告警管理系统的各种告警信息检查要求:实时进行,每天对告警信息进行浏览,对异常告警进行必要的分析和处理。

操作部门:网管监控部、分公司操作步骤:1.对实时告警窗口中的告警进行浏览,是否有严重故障告警、重要故障告警、紧急重要事件告警、其他事件告警;2.分公司应注意每日对历史告警进行分析总结,点击“故障管理”菜单下“告警日志查询”,输入告警时间,有必要还可输入相关告警编号、告警级别等,确定;3.在查询出的历史告警中,进行逐项检查,对某些异常告警进行重点查看,双击该告警信息,在弹出的详细解释中查询具体告警参数,以及帮助信息、修复参考建议等。

第2项各种单板运行状态检查要求:每日进行,每天对单板运行状态进行检查,确保交换机各单板正常。

操作部门:网管监控部、分公司操作步骤:1.使用DSP BRD指令查看单板状态⏹命令:DSP BRD:;⏹原始报告:+++ HUAWEI UMG8900 2006-10-22 09:58:13O&M #15%%DSP BRD:;%%RETCODE = 0 执行成功槽位记录表----------框号槽号位置板类型硬件类型板组号备份状态主备状态管理状态安装状态操作状态1 7 前插 OMU FOMU 0 1+1备份主用 <NULL> 安装正常1 8 前插 OMU FOMU 0 1+1备份未知 <NULL> 安装正常(结果个数 = 2)--- END输出报告中,如果单板状态均显示为主用正常、备用正常、正常,无故障态即OK,2.使用DSP BRDSTART指令查看单板是否设置从FLASH加载⏹命令:LST BRDSTART:;⏹原始报告:+++ HUAWEI UMG8900 2006-10-22 09:58:13O&M #15%% LST BRDSTART:;%%RETCODE = 0 执行成功单板加载方式表----------========================================================机框号槽位号板位置单板类型加载方式========================================================0 0 前插FLU FLASH0 1 前插FLU FLASH0 2 前插FLASH0 3 前插FLASH0 4 前插FLASH0 5 前插FLASH0 6 前插FLASH0 7 前插MPU FLASH0 8 前插MPU FLASH0 9 前插FLASH0 10 前插FLASH0 11 前插FLASH0 12 前插FLASH0 13 前插FLASH--- END输出结果中,如果单板的加载方式为FLASH即为正常。

华为软交换常见告警

华为软交换常见告警

本局设备不能发送承载于M3UA 当本局到达M3UA目的实体没有配置M3UA路由或 的业务消息到产生告警的目的 所有M3UA路由均故障时,系统产生该告警。 实体。 故障的M3UA链路退出服务并且 当M3UA链路故障时,系统产生此告警 不能用于承载信令业务 对于主备配置的单板,如果备 板单板故障,则对业务无影 响,但是会严重影响系统可靠 性,备板故障必须及时修复。 对于主备配置的单板,如果主 板单板故障,系统会自动发生 主备倒换,从而使备板升为主 板,对业务只有微小影响,如 在倒换瞬间正在接续的业务建 立失败,但是会严重影响系统 可靠性,单板故障必须及时修 复。 当单板检测到自身运行故障或WSMU检测到与其 对于主备配置的业务单板,如 他业务板之间的通讯异常时,产生此告警。 果主板和备板同时故障,则该 单板所属的模块将无法承载任 何业务。注:业务单板指处理 业务的前插板,如:WCCU、 WCSU、WIFM、WVDB、WCDB、 WMGC等。 对于主备配置业务单板单配情 况,如果单板故障,则该单板 将无法承载任何业务。 对于负荷分担的单板,该单板 故障会导致该单板上的业务转 移到其他单板上,增加其他单 板的负荷。
SCTP路径,即使用SCTP协议作为传输协议的链 路(如M3UA/M2UA/IUA/H248/BICC链路等), 如果在一条SCTP路径上传输数据或者心跳信息 时,没有收到证实消息,从而导致重传,当重 系统将不能通过该SCTP路径传 传次数达到“路径最大重传次数”(使用ADD 输相关的业务数据。
M3LNK/ADD M2LNK/ADD IUALNK/ADD H248LNK/ADD BICCSCTPLNK命令设置)时,系统认为这条SCTP路径不可 用,系统产生此告警。
计费中心长时间不取 iGWB话单
故障告警

G网告警预处理手册(华为G9MGW)

G网告警预处理手册(华为G9MGW)

中国移动通信集团湖北有限公司网管中心预处理手册(华为MSC-MGW)【设备型号】:UMG8900【设备类型】:MGW【硬件平台】:OSTA【软件版本】:UMG8900V200R003/ UMG8900V200R005【预处理手册版本】:V1.1【本次版本更新时间】:2007年7月目录目录 (1)1、严重告警 (4)§1.1虚拟媒体网关迁移出业务态(ALM:1802) (4)§1.2主备倒换失败(ALM:0001) (6)§1.3 单板硬件故障(ALM:0007) (7)§1.4 单板硬件模块故障(ALM:0021) (9)§1.5 单板故障(ALM:0040) (10)§1.6 单机框不可用(ALM:0041) (11)§1.7 硬盘空间拥塞(ALM:1412) (12)§1.8 SPF扣板故障(ALM:3902) (13)§1.9 接口芯片异常(ALM:2633) (14)§1.10 逻辑工作不正常(ALM:2634) (15)§1.11 SDH信号丢失LOS(ALM:1201) (15)§1.12 SDH帧定位丢失(ALM:1202) (16)§1.13 接口故障(ALM:3209) (17)§1.14 M3UA目的实体路由无效(ALM:3991) (19)§1.15 M3UA路由无效(ALM:3992) (20)§1.16 M3UA目的信令点不可达(ALM:3993) (22)§1.17 MTP3目的信令点不可达(ALM:3980) (23)§1.18 L2UA链路组故障(ALM:3905) (25)2、重要告警 (27)§2.1 接收信号丢失(ALM:2601) (27)§2.2 接收时钟丢失(ALM:2602) (28)§2.3 CPU拥塞(ALM:1402) (30)§2.4 硬盘空间过载(ALM:1411) (31)§2.5 MBLU单板芯片故障(ALM:2001) (32)§2.6 FLU故障(ALM:2006) (33)§2.7 SPF扣板CPU过载(ALM:3850) (34)§2.8 配电框电路电源故障告警(ALM:317) (35)§2.9 TC U或VPU或ECU单板硬件告警(ALM:1613) (35)§2.10 BAM系统文件损坏告警(ALM:270) (36)§2.11 FE级联网口故障(ALM:0026) (37)§2.12 单板控制网口故障(ALM:37) (38)§2.13 GE级联光口故障(ALM:605) (39)§2.14 级联光口故障(ALM:807) (40)§2.15 级联链路连接与配置不符(ALM:818) (41)§2.16 级联链路连接错误(ALM:819) (42)§2.17 GE通道故障(ALM:1606) (43)§2.18 GE通道光模块故障(ALM:2002) (44)§2.19 GE通道CDR故障(ALM:2003) (45)§2.20 TDM通道光模块故障(ALM:2004) (45)§2.21 参考源丢失(ALM:2202) (46)§2.22 恒温晶体输出信号丢失(ALM:2204) (48)§2.23 时分交换芯片时钟丢失(ALM:2631) (50)§2.24 时分交换芯片时钟未锁定(ALM:2632) (51)§2.25 单板时钟故障(ALM:804) (52)§2.26 NET板主用时钟失锁(ALM:808) (53)§2.27 BLU时钟故障(ALM:2007) (54)§2.28 DDS输出信号丢失(ALM:2206) (55)§2.29 时钟丢失(ALM:2407) (57)§2.30 38M时钟故障(ALM:2524) (58)§2.31 34M/45M时钟故障(ALM:2527) (58)§2.32 12M时钟故障(ALM:2528) (59)§2.33 77M时钟丢失(ALM:2635) (59)§2.34 32M时钟丢失(ALM:2636) (60)§2.35 2K时钟丢失(ALM:2637) (61)§2.36 38M时钟丢失(ALM:3258) (61)§2.37 SPF时钟丢失(ALM:3900) (62)§2.38 SCTP信令链路拥塞(ALM:407) (64)§2.39 信令链路故障告警(ALM:409) (66)§2.40 信令半永久连接故障(ALM:802) (68)§2.41 M3UA链路故障(ALM:1250) (69)§2.42 M3UA链路故障(ALM:3990) (70)§2.43 SPF扣板链路故障(ALM:3851) (72)§2.44 L2UA链路拥塞(ALM:3904) (73)§2.45 MTP链路(ALM:3981) (74)§2.46 M3UA链路SCTP拥塞(ALM:3994) (75)3、次要告警 (77)§3.1 E1/T1时钟信号丢失(ALM:2401) (77)§3.2 E1/T1告警指示(ALM:2402) (78)§3.3 E1/T1远端告警(ALM:2403) (79)1、严重告警§1.1虚拟媒体网关迁移出业务态(ALM:1802)【告警标题(网管呈现)】:虚拟媒体网关迁移出业务态【告警标题含义】:当虚拟媒体网关因某种外界原因迁移出业务态时产生此告警。

华为硬件故障告警解释及处理

华为硬件故障告警解释及处理

第一节 DBUS告警 (2)一2170 DBUS告警 (2)二3108 DBUS告警 (3)三3628 DBUS告警 (4)四4158 DBUS告警 (5)第二节 DBUS时钟告警 (7)一2132 DBUS时钟告警 (7)二4120 DBUS时钟告警 (8)第三节无线链路提示告警 (10)一2134 无线链路提示告警 (10)二3072 无线链路提示告警 (12)三4122 无线链路提示告警 (14)第四节时钟参考源异常 (16)一2208 时钟参考源异常 (16)二3146 时钟参考源异常 (17)三3666 时钟参考源异常 (18)四4708 时钟参考源异常 (20)第五节 13M时钟校准维护告警 (22)一2260 13M时钟校准维护告警 (22)二3718 13M时钟校准维护告警 (23)三4760 13M时钟校准维护告警 (24)第六节反向功率告警 (25)一3614 反向功率告警 (25)第一节 DBUS告警一2170 DBUS告警告警解释当机架内部的数据总线出现问题时,上报该告警。

对系统的影响告警发生时,部分或者全部TRX的业务彻底中断。

系统自处理过程无可能原因·E1传输线故障;·机架内部数据总线故障;·TMU板故障.处理步骤1.查看其他相关告警查看LMT是否同时上报2214 E1本地告警的处理方法处理,观察告警是否恢复。

Y=>告警恢复,告警处理结束.N=>告警未恢复,转步骤2.若没有上报上述告警, 转步骤2.2.检查E1线是否单端接地检查TMU的拨码开关是否正确,如果有错,修改拨码开关状态,保证E1线单端接地,观察告警是否恢复。

Y=>已恢复,处理结束;N=>告警未恢复,转步骤3.如果TMU拨码开关正确,转步骤3.3.更换TMU更换TMU,观察是否恢复。

Y=>已恢复,处理结束;N=>告警未恢复,故障原因可能为机架整套配线故障,联系华为技术中心。

完整版)华为交换机日常维护手册

完整版)华为交换机日常维护手册

完整版)华为交换机日常维护手册例行维护简介:设备稳定运行需要完备的网络规划和日常维护和监测,以发现设备运行隐患。

设备环境检查:设备运行环境正常是保证设备正常运行的前提。

以下是检查标准和说明:1.机房温度状况:机房的长期工作环境温度应在℃~45℃之间,短期工作环境温度应在-5℃~55℃之间。

机房的长期工作环境相对湿度应在5%RH~85%RH之间,不结露;短期工作环境相对湿度应在0%RH~95%RH之间,不结露。

如果机房的环境温度长期不能满足要求,应考虑检修或更换机房的空调系统。

如果机房的相对湿度过大,应考虑为机房安装除湿设备;如果机房的相对湿度过小,应考虑为机房安装加湿设备。

2.清洁状况:所有项目都应干净整洁无明显尘土附着。

注意防尘网的清洁状况,及时清洗或更换,以免影响机柜门及风扇框的通风、散热。

设备正常工作时,要求保持风扇正常运转(清理风扇期间除外),擅自关闭风扇会引起设备温度升高,并可能损坏单板。

不要在设备子架上通风口处放置杂物,还应定期清理风扇的防尘网。

3.线缆布放:电源线与业务线缆要分开布放。

电源线布放整齐、有序。

业务线缆布放整齐、有序。

线缆标签清晰、准确,符合规范。

4.机框散热:机框进风口没有过多灰尘堵塞,不影响设备正常散热。

如果防尘网上灰尘较多,需要及时清洗。

机框的防尘网清洗建议一季度进行一次。

设备基本信息检查:检查设备的基本信息,如软件版本、补丁信息、系统时间等是否正确。

1.设备运行的版本:Quidway>display startupQuidway>display n2.检查License文件是否已激活:Quidway>display XXX3.检查补丁信息:Quidway>display n补丁文件必须与实际要求一致,建议加载XXX发布的该产品版本对应的最新的补丁文件。

补丁数量必须与已生效的补丁数量一致。

同时,设备时间应与当地实际时间相符,以便在故障时通过时间精度检查系统时间。

TD-LTE站点华为设备常见故障告警处理

TD-LTE站点华为设备常见故障告警处理

T D-L T E(4G)站点华为设备常见故障告警处理(总11页)本页仅作为文档封面,使用时可以删除This document is for reference only-rar21year.MarchFAQ-TD站点常见故障告警处理一、射频单元RRU类告警....................................................... 错误!未定义书签。

、射频单元驻波告警................................................... 错误!未定义书签。

、射频单元通道异常告警........................................... 错误!未定义书签。

、射频单元校准通道异常告警................................... 错误!未定义书签。

、射频单元通道幅相一致性告警............................... 错误!未定义书签。

、射频单元发射通道增益异常告警........................... 错误!未定义书签。

、射频单元下行输出功率异常告警........................... 错误!未定义书签。

、射频单元硬件故障告警........................................... 错误!未定义书签。

、射频单元时钟异常告警........................................... 错误!未定义书签。

、射频单元光接口性能恶化告警............................... 错误!未定义书签。

、BBU连接的射频单元交流掉电告警........................ 错误!未定义书签。

、射频单元配置但不可用告警................................... 错误!未定义书签。

华为传输设备常见告警含义及处理方法

华为传输设备常见告警含义及处理方法

华为传输(chuán shū)设备常见告警含义及处理方法AU_AIS AU告警指示(1)由MS_AIS、R_LOS、R_LOF 告警引发的相应VC4 通道的AU_AIS 告警;(2)业务配置错误;(3)对端站发送AU_AIS;(4)对端站发送部分故障;(5)本站接收部分故障。

(1)由本站MS_AIS、R_LOS、R_LOF 等告警引发的相应VC4通道的AU_AIS 告警,检查方法可通过对MS_AIS、R_LOS、R_LOF 的分析来定位故障;(2)还有一个可能原因是相应VC4 通道的业务有收发错开的现象,导致收端在相应通道上出现AU_AIS 告警,在这种情况下,该AU_4 中相应的TU 上也会伴随出现TU_AIS 告警。

这时,请检查出现AU_AIS 的站和它的互通业务站,以及中间业务穿通站的业务时隙配置是否错误;(3)更换对端站对应的交叉板和线路板;(4)更换本站的线路板和交叉板。

AU_LOP AU指针丢失(1)对端站发送部分故障;(2)对端站业务配置错误;(3)本站接收误码过大。

(1)检查对端站及本站业务配置是否正确,如果不正确,重新配置业务; (2)对于155M 光接口板一般无此故障,若有的话多为此光板配置有误。

而622M 和2500M光接口板接收到AU_LOP 告警,应检查对方时钟板是否正常工作、交叉板是否检测到了时钟;(3)如业务为140M 业务,检查业务是否正确接入;(4)依次更换对端站对应的交叉板和线路板,定位故障点;(5)更换本站的线路板和交叉板。

MS_AIS 复用段告警指示(1)对端站发送MS_AIS 信号;(2)对端站时钟板故障;(3)本板接收部分故障。

(1)检查对端站线路板是否存在问题,可通过复位或更换单板的方法检查告警是否消失;(2)检查本站线路板,同样可通过复位或更换单板的方法来检查告警是否消失。

MS_RDI 复用段远端接收失效指示(1)对端站接收到R_LOS/R_LOF/MS_AIS 信号;(2)对端站接收部分故障;(3)本站发送部分故障。

华为交换机配置及故障处理

华为交换机配置及故障处理

• SW2配置 ip route-static 192.168.1.0 24 10.1.1.1 ip route-static 192.168.2.0 24 10.1.1.1
ip route-static 192.168.3.0 24 10.1.1.1
HUAWEI TECHNOLOGIES CO., LTD.
network-address是想要开启RIP路由协议的接口的地址网络
HUAWEI TECHNOLOGIES CO., LTD.
All rights reserved
Page 13
华为交换机RIP路由协议配置举例
• SW1配置 rip 1 version 2 network 10.0.0.0 network 192.168.1.0 network 192.168.2.0 network 192.168.3.0
All rights reserved
Page 8
华为交换机三层互联配置
• 华为交换机无法在接口上直接配置IP地址,需要通过在vlanif上配置IP地址,再将接 口配置成access接口模式,并把接口配置到相应vlan中实现三层接口的功能。 • 全局模式下创建用于互联的vlan vlan vlan-id • 配置vlanif接口地址
[Quidway-aaa] local-user huawei level 3
[Quidway-aaa] quit [Quidway] user-interface vty 0 4 [Quidway-ui-vty0-4] authentication-mode aaa
HUAWEI TECHNOLOGIES CO., LTD.
Internal
华为交换机配置及故障处理

01-26 EOAM_Y1731

01-26 EOAM_Y1731

26 EOAM_Y1731关于本章26.1 EOAM_Y1731_1.3.6.1.4.1.2011.5.25.136.1.6.23 hwCfmVlanOnewayDelay26.2 EOAM_Y1731_1.3.6.1.4.1.2011.5.25.136.1.6.24hwCfmVlanOnewayDelayRecovery26.3 EOAM_Y1731_1.3.6.1.4.1.2011.5.25.136.1.6.25 hwCfmVlanTwowayDelay26.4 EOAM_Y1731_1.3.6.1.4.1.2011.5.25.136.1.6.26hwCfmVlanTwowayDelayRecovery26.5 EOAM_Y1731_1.3.6.1.4.1.2011.5.25.136.1.6.30 hwY1731AisDefectAlarm26.6 EOAM_Y1731_1.3.6.1.4.1.2011.5.25.136.1.6.31hwY1731AisDefectAlarmRecovery26.7 EOAM_Y1731_1.3.6.1.4.1.2011.5.25.136.1.6.48 hwY1731AisExceedMaxPktNum26.8 EOAM_Y1731_1.3.6.1.4.1.2011.5.25.136.1.6.49hwY1731AisExceedMaxPktNumCleared26.9 EOAM_Y1731_1.3.6.1.4.1.2011.5.25.136.1.6.58 hwY1731TestIdStatistic26.10 EOAM_Y1731_1.3.6.1.4.1.2011.5.25.136.1.6.59 hwY1731TestIdStatisticClear 26.1 EOAM_Y1731_1.3.6.1.4.1.2011.5.25.136.1.6.23 hwCfmVlanOnewayDelay告警解释EOAM_Y1731/4/VLAN_1DM_EXCEED_THRESHOLD:OID [OID] The result of one-way delay-measure exceeded the threshold. (MdIndex=[GAUGE],MaIndex=[GAUGE], RemoteMacAddress=[OPAQUE], Timestamp=[TIMETICK],DelayValue=[GAUGE], ThresholdValue=[GAUGE])VLAN场景下的Y.1731单向时延统计并且配置了预期的告警门限,这时如果网络时延超过告警门限时就会产生该告警。

华为传输设备T_ALOS告警概念及处理方法

华为传输设备T_ALOS告警概念及处理方法

华为传输设备T_ALOS告警概
念及处理方法
一.T_ALOS中文名称:2M接口模拟信号丢失
二.含义及产生原因
(1)2M 业务未接入;
(2)DDF 架侧2M 接口输出端口脱落或松动;
(3)本站2M 接口输入端口脱落或松动;
(4)单板故障;
(5)电缆故障;
(6)交换机复位。

三.处理方法
可通过逐级自环的方法层层细化告警区段,定位出告警点。

(1)从网管上确认告警发生的板位和通道号;
(2)将此通道在2M 接口板上进行自环,自环后如告警未结束,则检查接口板是否接触良好,如接触良好则更换2M 支路板;
(3)如果在接口板上自环后,此告警消失,则可以确定不是传输设备故障。

在机房DDF 架上向传输设备方向做自环,确认是否是DDF 架到传输设备之间这段电缆的问题。

自环后如告警未结束,则肯定是配线架接头和从配线架到接口板的连接电缆有问题;
(4)如在配线架进行自环后告警结束,则在DDF 架上向交换设备做自环,以确定是否是DDF 到交换机或交换机本身的问题。

LTE告警梳理:小区退服告警T2现场处理手册-华为

LTE告警梳理:小区退服告警T2现场处理手册-华为

LTE告警梳理:小区退服告警T2现场处理手册-华为一、目的作用本手册针对华为TD-LTE基站设备出现的“ALM-29240 小区不可用告警”提供常规处理思路与方法,适用于告警处理一线工程师,以进行告警处理或进一步分析处理办法。

二、处理思路及步骤针对T1预处理后归纳原因及反馈信息,结合现场情况,分类处理:A.传输类告警:29201 S1接口故障告警25888 SCTP链路故障告警处理建议:对于出现的传输类告警,主要是因为基站到核心网之间不通导致小区无法建立,T1预处理无法恢复,可定位为传输问题,需要分公司处理。

1)协调传输部门配合处理;2)上站进行掉电复位、重新插拔主控板UMPT的尝试,建议掉电及插拔持续时间大于3分钟;3)更换主控板UMTP。

B.硬件类告警:26264 系统时钟失锁告警处理建议:对于时钟类告警,需要上站检查GPS问题,根据T1反馈信息,分类处理:1)“GPS开路”为GPS与主控板断开,主要检查主控板侧GPS接口与时钟线是否接触不良,或避雷器侧两端RG8U馈线是否接触不良,或蘑菇头处是否有松动或接触不良;2)“GPS短路”为GPS的RG8U馈线内蕊与外蕊有短接,可以用万用表进行测量,分段检查,重点检查接口处是否有铜丝或金属异物导致;3)“GPS搜星不足”为GPS搜星数量少于4颗,无法提供准确的时钟信息,需要站点工程师上站检查蘑菇头位置是否被遮挡、或蘑菇头周围有较大磁场或干扰,需要变更蘑菇头位置;4)更换主控板UMTP。

26200 单板硬件故障告警处理建议:根据T1反馈定位信息,确定故障单板。

1)后台工程师执行MML命令“RST BRD”进行单板复位;2)站点工程师上站对该单板进行重新插拔;3)更换单板。

26230 BBU CPRI光模块故障告警处理建议:根据T1反馈定位信息,确定光模块故障。

1)请现场工程师上站更换光模块。

26205 BBU单板维护链路异常告警处理建议:根据T1反馈定位信息,确定对应单板位置。

01-19 ENTMIB

01-19 ENTMIB

参数名称 OID
参数含义 该告警对应的MIB节点号。
对系统的影响

可能原因
设备中有实体插入或拔出,复位或注册。
文档版本 09 (2020-04-15)
版权所有 © 华为技术有限公司
240
S2750, S5700, S6720 系列以太网交换机 告警处理
处理步骤
步骤1 提示信息无需处理。 ----结束
参考息

19 ENTMIB
文档版本 09 (2020-04-15)
版权所有 © 华为技术有限公司
241
S2750, S5700, S6720 系列以太网交换机 告警处理
19 ENTMIB
19 ENTMIB
关于本章
19.1 ENTMIB_1.3.6.1.2.1.47.2.0.1 entConfigChange
19.1 ENTMIB_1.3.6.1.2.1.47.2.0.1 entConfigChange
告警解释 告警属性
ENTMIB/4/TRAP: OID [oid] Entity MIB change. 设备中有实体插入或拔出,复位或注册时,导致MIB信息改变,产生此告警。
告警ID 1.3.6.1.2.1.47.2.0.1
告警级别 Warning
告警类型 equipmentAlarm(5)
告警参数
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

华为端局告警处理手册目录1. MSC SERVER处理分册 (3)1.1 告警箱处于离线状态 (3)1.2、FE端口故障 (3)1.3、WCKI时钟参考源丢失 (4)1.4、控制框与业务框通信失败 (5)1.5、BAM到主机通讯失败 (7)1.6、BAM到主机连接中断 (8)1.7、与NTP服务器断连 (9)1.8、Q922链路故障 (10)1.9、TCP链路故障 (11)1.10、CPU过载 (12)1.11、单板网口协商失败 (14)1.13、许可证文件即将失效 (15)1.14、计费中心长时间未取话单 (16)1.15、心跳中断 (17)1.16、双机倒换 (18)1.17、私网中断 (19)1.18、IP资源失效 (21)1.19、备份连接失败 (22)1.20、单板故障 (23)1.21、许可证即将过期告警 (24)1.22、许可证已经过期告警 (25)1.23、电源输出开关关闭 (26)1.24、H.248 SCTP链路故障 (27)1.25、MGW退出服务 (29)1.26、MTP目的信令点不可达 (30)1.27、MTP路由传输禁止 (32)11.28、MTP链路故障 (33)1.29、MTP缓冲区拥塞 (35)1.30、M2UA链路故障 (37)1.31、SCCP目的信令点禁止 (38)1.32、SCCP子系统禁止 (40)N => 联系对端局点确认其子系统是否恢复。

(42)2. MGW处理分册 (42)2.1 FE级联网口故障 (42)2.2 风扇框通讯故障 (43)2.3 NET单板时钟检测异常 (46)2.4 NET单板时钟失锁 (49)2.5 GE级联光口故障 (51)2.6 NET单板时钟失锁 (53)2.7 NET单板时钟配线故障 (54)2.8 级联光口故障 (56)2.9 GE通道光模块故障 (58)2.10 TDM通道光模块故障 (61)3.11 BLU时钟检测异常 (63)2.12 信令链路故障告警 (65)2.13 SPF扣板链路故障 (67)2.14 L2UA链路组故障 (70)2.15 L2UA链路故障 (71)2.16 单板软件异常告警 (73)2.17 SIWF故障告警 (75)2.18 控制平面拥塞 (77)2.19 单板故障 (78)2.20 告警箱断链 (81)2.21 单板上存在故障的半永久 (82)2.22 参考源丢失 (84)2.23 虚拟媒体网关迁移出业务态 (85)1. MSC SERVER处理分册1.1 告警箱处于离线状态告警含义1. 告警解释当BAM与告警箱之间通信中断时间超过10秒钟后,系统将产生该告警。

2. 告警参数无。

对系统的影响告警箱无法正常运行,不能对BAM发送的告警做出正确响应,如不能发出声光告警。

系统自处理过程无。

相关告警无。

告警处理1. 可能原因BAM与告警箱之间链路中断。

2. 处理建议通知分公司维护人员检查BAM和告警箱的连接。

1.2、FE端口故障告警含义1. 告警解释系统监测到FE端口出现故障,将产生此告警。

2. 告警参数对系统的影响如果FE端口故障,通过该端口连接的设备之间通信中断。

系统自处理过程系统的FE通信基于双平面,如果一个端口故障,将另一端口进行通信。

相关告警无。

告警处理1. 可能原因硬件故障。

2. 处理建议对于WSMU和WIFM板,需要检查网线的连接情况。

对于其它单板,需要检查WHSC板的运行情况。

DSP BRD: FN=1, SLN=2;(输入单板的框号槽号)1.3、WCKI时钟参考源丢失告警含义1. 告警解释当WCKI时钟参考源丢失时而产生此告警。

2. 告警参数对系统的影响可能使系统不能正常工作。

系统自处理过程时钟参考源丢失,可能导致时钟系统不能正常工作。

相关告警无。

告警处理1. 可能原因∙外部时钟源工作不正常。

∙连接外部时钟源的时钟线有问题、或时钟连线不正确2. 处理建议1.观察设备面板CKI单板BITS时钟输入端口是否正常。

2.检查外部时钟源是否工作正常,如果不正常,更换时钟源。

3.检查时钟线连接是否正确,如果连线正确,请更换时钟线。

1.4、控制框与业务框通信失败告警含义1. 告警解释当控制框和业务框之间的通信中断时产生此告警。

2. 告警参数对系统的影响控制框和业务框之间的通信中断。

系统自处理过程无。

相关告警无。

告警处理1. 可能原因∙可能控制框与业务框的HSC之间连线不正确∙可能业务框工作不正常。

∙可能业务框没有及时发心跳消息给控制框。

2. 处理建议1.检查控制框与业务框的HSC之间的连线是否正确,或更换网线,如果问题解决,这说明是连线有问题。

2.观察业务框的WSMU板是否运行正常,如果不正常,更换WSMU单板看问题是否解决,如果仍然没有解决更换HSC板,如果仍然没有解决,那可能是背板有问题,需更换背板解决。

3.检查CPU是否被某个任务长时间占用,导致没有发送心跳消息,或者有网络风暴,导致控制框无法正常接受到消息1.5、BAM到主机通讯失败告警含义1. 告警解释当BAM到主机通讯失败时,系统发出此告警。

2. 告警参数对系统的影响BAM与主机之间无法通讯。

系统自处理过程无。

相关告警该告警由ALM-2364 BAM到主机连接中断引发,ALM-2364 BAM到主机连接中断表示BAM 和交换机断连,因此必然导致该告警的产生。

告警处理1. 可能原因交换机有一个框的两个连接都断了。

2. 处理建议1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。

2、检查BAM机器网卡和LAN switchs:3、检查BAM机器网卡和LAN switchs是否工作正常。

并保证所有网线连接正常。

告警是否恢复?1.6、BAM到主机连接中断告警含义1. 告警解释当BAM与主机中断时,系统发出此告警。

2. 告警参数对系统的影响BAM与主机之间无法通讯。

系统自处理过程无。

相关告警该告警连带产生 ALM-2362 BAM到主机通讯失败。

告警处理1. 可能原因交换机某一个框的一个连接断开。

2. 处理建议1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。

2、检查BAM机器网卡和LAN switchs:3、检查BAM机器网卡和LAN switchs是否工作正常。

并保证所有网线连接正常。

告警是否恢复?1.7、与NTP服务器断连告警含义1. 告警解释时间同步进程与NTP服务器断连,时间同步已停止。

2. 告警参数无。

对系统的影响系统时间无法和NTP服务器同步。

系统自处理过程无。

相关告警无。

告警处理1. 可能原因∙NTP服务器被停止或服务被关闭。

∙系统和NTP服务器之间的网络断连。

2. 处理建议(1)、在MSOFT3000跟踪维护中用PING NTP服务器IP地址,检查网络是否正常。

(2) 检查NTP服务器是否被停止,NTP服务器的时间服务是否被关闭。

(3) 检查系统和NTP服务器之间的网络是否断连。

1.8、Q922链路故障告警含义1. 告警解释系统单板之间通过Q.922链路进行通信,底层为FE。

当两个单板间的Q.922链路发生故障时,产生该告警。

当WSMU启动时,WHSC板会自动被复位,此时也会产生该告警。

2. 告警参数对系统的影响∙使用该链路通信的两个模块之间通信中断。

∙该链路传输的业务发生中断。

系统自处理过程无。

相关告警无。

告警处理1. 可能原因∙Q.922链路发生故障。

∙WSMU启动。

2. 处理建议1.检查是否复位了WSMU板?Y=> 正常告警,不用处理N=> 转步骤(2)2.检查FE网口的状态是否正常?观察设备面板HSC端口状态。

Y=> 转步骤(3)N=> 更换不正常状态网口所在的单板3.检查单板的运行状态,如果单板发生故障,更换单板。

DSP BRD: FN=1, SLN=2, PSN=FB;(输入HSC单板框号、槽号、前后插板)1.9、TCP链路故障告警含义1. 告警解释系统监测到TCP链路出现故障时产生该告警。

WSMU板通过TCP链路与BAM和iGWB进行通信。

2. 告警参数对系统的影响∙告警模块与目的模块之间的通信中断;∙基于该TCP链路的业务中断。

系统自处理过程无。

相关告警无。

告警处理1. 可能原因∙网络连接网线故障;∙网卡故障。

2. 处理建议(1) 检查WHSC单板工作状态是否正常?Y=>可能为对端设备如BAM、iGWB网卡故障。

N=>更换故障单板。

DSP BRD: FN=1, SLN=2, PSN=FB;(输入HSC单板框号、槽号、前后插板)(2) 根据告警参数确认故障链路位置,检查TCP链路两端网卡的指示灯是否正常?Y=>请联系华为当地办事处技术支援人员。

N=>可能是网线连接问题。

(3) 判断是否网线松脱,拔插一下两端的网线接头,确保网线连接正常,检查故障是否排除?Y=>网线连接问题,结束。

N=>可能是网卡故障。

1.10、CPU过载告警含义1. 告警解释单板CPU占用超过设定的阈值(使用命令SET CPUTHD设置)时,产生该告警。

2. 告警参数对系统的影响部分呼叫会丢弃,产生呼损。

系统自处理过程系统启动流量控制机制,降低CPU占用率。

相关告警无。

告警处理1. 可能原因∙系统容量不足;∙处理模块分配不合理。

2. 处理建议(1) 根据告警参数确认发生CPU过载告警的单板,确认是否大部分同类型单板都CPU占用率偏高?检查该单板的CPU大小:DSP CPUR: LT=MN, MN=2;(输入该单板模块号)(2) 调整业务配置,将过载单板部分业务的调整到其它单板。

1.11、单板网口协商失败告警含义告警解释当单板的内网口或外网口以半双工模式工作时产生此告警。

告警参数3.举例参数“框号=0, 槽号=0, 端口号=2”表示位于0框0槽WIFM板的第2个网口(外网口)协商失败。

注意:系统板和WIFM板配置有3个内部端口,即端口0、1和2。

其他单板配置有两个外部端口,即端口0和1。

对系统的影响BAM与主机之间的以太网数据包不正常丢失,可能导致系统从BAM加载文件失败。

系统自处理过程无。

告警处理1.可能原因单板起来之后,会和LAN Switch进行网口工作模式协商,如果LAN Switch工作在半双工模式,单板端口也会工作在半双工状态。

2.处理建议检查LAN Switch设置,将其设为全双工。

1.13、许可证文件即将失效告警含义1. 告警解释许可证在X天后到期。

当以下两种情况中的任意一种发生时将产生此告警:∙MSC服务器运行在试用许可证模式下。

∙许可证文件在30天之内到期。

2. 告警参数对系统的影响许可证文件很快到期。

当许可证到期,MSC服务器运行在默认许可证配置下。

相关文档
最新文档