华为告警处理手册
华为TD 告警处理

常见故障维护TD一般故障主要就几种,下面将一一介绍(处理方法仅供参考,各故障还须根据具体情况具体而定。
)1)传输问题,会出现类似下图告警(E1T1的或者IMA的):可以登陆对应基站,如图所示为CZTD3002基站,第一条上报来源CZHRNC01-820,对应的RNC侧IUB接口的传输是1框,25槽,27号链路,所属NODEB是CZTD3002。
我们可以在RNC的维护终端上或者直接在OMC上查看该条E1T1的状态。
如下图示(OMC上):输入命令如下图示:执行后我们会看上方窗体出现我们可以看到我们执行了DSP E1T1: SRN=1, SN=25, BT=AOU, LNKN=27;这条命令,下面的链路状态信息中链路运行状态为链路故障,另外在下方我们可以看到该条传输是被CZTD3002站点占用。
如果传输状态是好的,应为链路运行状态=链路可用。
在基站侧看往往显得更加直观,当我们需要判断传输问题是属于基站侧还是RNC侧时或开站时,我们就可能需要在RNC侧看传输。
可以让基站侧施工人员环回到RNC侧,这时如果链路状态变为可用则说明从RNC到基站传输设备没有问题,而问题出现在基站端。
如果链路仍然不可用,就须通知传输班或者让基站侧督导直接和传输人员联系。
下面介绍如何在基站端看传输状态如上图所示出现传输故障的是7槽1,2,3三个端口(NODEB BBU上的单板都是在0柜0框),由于我们定义的端口是从0开始的,也就是说该站的第二,三,四条传输有问题。
进入该站的MML命令窗口,查询传输状态:我们可以看到端口号1,2,3的链路运行状态是“存在信号丢失告警”,使用标志为“是”。
该站就需上站处理传输问题,当然由于是维护建议先让传输班看下,然后看是否需要上站处理。
一般传输问题都是传输头有问题或者传输端子有问题。
让基站侧代维先处理,如果处理不好,再让他环回给你看。
一种是向RNC侧环,前面已经讲过了,一种是向NODEB侧环,当向RNC环回可用的情况下,向NODEB侧环回链路运行状态变为物理环回,这种情况基本上把头子接好了就没有问题了,如果链路运行状态还是信号丢失告警的话,可能原因有几种,首先让代维重做传输头子,看是否存在虚焊等情况。
华为PTN告警处理规范

对照网元规划表,在网管上查看业务接口是否配置错误。如果是,重新
配置业务接口后,查看告警是否消除。
检查故障Tunnel的带宽是否已被完全占用。如果是,增大Tunnel带宽 配置或消除非法发送大数据量的根源。查看告警是否清除。
3.
告警解释:BD_STATU为物理单板离线告警。当用户在网管上配置了逻辑单
板而物理子架上却没有插入实际单板时就会上报此告警。
在网管上查看两端端口是否存在LOOP_AL告警,若存在,优化清除LOOP_AL告警后,查看本告警是否清除。
对照网元规划表, 查看上报告警的端口是否错插了纤缆, 造成两端端口工 作模式不一致。
在网管上查看两端网元的相关单板是否存在HARD_BA等硬件类告警。若 存在,更换存在硬件类告警的单板后,查看本告警是否清除。
产生原因:
单板正在硬复位。
单板未插上,或单板插上,但与母板接触不良。
板间通讯故障。
处理步骤:
在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若 是,则该单板处于硬复位状态。等待3至5分钟,该单板的工作状态转 成绿色后,查看本告警是否消除。
检查相应槽位的单板是否插入。若未插入,请插入相应物理单板,告警 将自动清除。 检查单板与母板是否接触良好, 母板连接器的导针是否歪 斜。修正歪斜的导针,重新插拔单板使之与母板良好接触,告警将自动 清除。
华为分布式HLR告警处理手册

告警处理手册_华为V1.0文档更新记录目录V1.0 (1)一、CGP告警 (10)1. 紧急告警 (10)1ALM-1005 单板CPU过载 (10)2ALM-2413 XPTU与CP通信中断 (11)3ALM-3161 流量失衡 (13)4ALM-3162 IP地址冲突 (15)5ALM-3163 网关探测失败 (16)6ALM-3164 IP泛洪攻击 (19)7ALM-3166 IP不可达故障告警 (21)8ALM-4100--ALM4200 模拟量或数字量传感器告警 (22)9ALM-7403 性能业务指标阈值四级越限 (23)2. 重要告警 (24)1ALM-101 主备模块补丁状态不一致 (24)2ALM-1003 模块故障 (26)3ALM-1009 剩余存储空间不足 (28)4ALM-1015 SDM板不在位 (29)5ALM-1016 NTP请求超时 (30)6ALM-1022 本地RAID1故障 (31)7ALM-1023 单板端口故障 (33)8ALM-1030 本地存储介质故障 (37)9ALM-1039 框号冲突 (39)10ALM-2001 单板故障 (41)11ALM-2015 电源输入模块故障 (44)12ALM-2037 ATM端口故障 (46)13ALM-2069 模块间通讯故障 (48)14ALM-2135 风扇故障 (50)15ALM-2402 OMU与LIG/LIC通信中断 (52)16ALM-2411 XPTU逻辑驱动器空间不足 (53)17ALM-2414 XPTU与GSOSM连接中断 (54)18ALM-3010 单板温度二级越限 (55)19ALM-3013 单板扳手打开 (56)20ALM-3015 空气过滤网不在位 (57)21ALM-3017 SMM板与框内设备硬件监控总线故障 (58)22ALM-3077 单板电压二级越限 (60)23ALM-3095 风扇温度二级越限 (61)24ALM-3101 电源输入模块温度二级越限 (62)25ALM-3107 风扇电压二级越限 (63)26ALM-3113 电源输入模块电压二级越限 (64)27ALM-3160 主备SMM板的框号不一致 (65)28ALM-3802 E1T1端口故障 (66)29ALM-3807 OMU与TDM扣板程序校验不一致 (68)30ALM-3808 窄带接口板故障 (69)31ALM-3810 TDM扣板时钟故障 (70)32ALM-3814 TDM扣板硬件故障 (73)33ALM-4402 OMU与单板单平面连接故障 (75)34ALM-4403 OMU与单板通信故障 (76)35ALM-4405 OMU与机框双平面通信故障 (77)36ALM-4421 S3100磁盘阵列故障 (78)37ALM-4501 LAN Switch冷启动 (79)38ALM-4503 LAN Switch端口故障 (80)39ALM-4507 LAN Switch输入电源失效 (83)40ALM-4508 LAN Switch风扇失效 (84)41ALM-4509 LAN Switch端口处于去激活状态 (85)42ALM-4601 SMM板与配电盒通讯故障 (85)43ALM-4602 配电盒管理功能失效 (86)44ALM-4603 配电盒输入电压异常 (86)45ALM-4605 配电盒输出电源开关关闭 (88)46ALM-4606 配电盒外接开关传感器警报 (89)47ALM-4670 扣板故障 (90)48ALM-4671 扣板不在位 (91)49ALM-4752 格式化失败 (91)50ALM-4754 联机设定失败 (92)51ALM-4756 数据表自动CRC校验错误 (94)52ALM-5008 鉴权失败 (95)53ALM-5009 非法登录 (96)54ALM-5010 普通用户执行特通专用命令鉴权失败 (97)55ALM-5102 特通退出服务 (97)56ALM-5201 配置事务即将超时 (98)57ALM-5203 配置事务超时自动回滚 (99)58ALM-5230 MOD MAXT命令发送失败 (100)59ALM-5301 SMM板主备通讯故障 (100)60ALM-5401 主机运行版本和OMU不一致 (101)61ALM-5521 S2600磁盘阵列故障 (102)62ALM-6402 文件加载失败 (103)63ALM-6416 安装失败 (105)64ALM-6417 单板操作系统重新安装 (106)65ALM-7404 性能业务指标阈值三级越限 (107)66ALM-7407 CHR上传单据故障重要告警 (108)67ALM-8301 OMU与RMU设备通信故障 (109)68ALM-8302 OMU与交换板通信故障 (110)69ALM-8304 OMU与RAID设备通信故障 (113)70ALM-8305 OMU与LSW设备通信故障 (114)71ALM-8306 OMU与SMM板管理单元通讯故障 (115)72ALM-8308 SMM板文件加载失败 (117)73ALM-8502 OMU双机数据库同步失败 (118)74ALM-8504 OMU双机通信故障 (118)75ALM-8505 OMU双机文件同步失败 (119)76ALM-8510 单板运行文件与OMU不一致 (120)77ALM-8600 OMU资源异常 (121)78ALM-8601 OMU双机主备倒换 (123)79ALM-8605 主备OMU倒换失败 (124)80ALM-8610 OMU浮动IP冲突 (125)81ALM-8702 OMU向NTP服务器同步时间失败 (126)82ALM-8706 RTC故障 (127)83ALM-9004 创建SNMP会话实体失败 (128)84ALM-9996 SMM板倒换失败 (129)3. 次要告警 (131)1ALM-102 补丁激活后未确认 (131)2ALM-753 告警箱处于离线状态 (132)3ALM-2010 风扇转速越限 (133)4ALM-2375 同一类型模块确认的补丁个数不一致 (134)5ALM-3001 CPU报错 (135)6ALM-3009 单板温度一级越限 (137)7ALM-3076 单板电压一级越限 (138)8ALM-3094 风扇温度一级越限 (139)9ALM-3100 电源输入模块温度一级越限 (140)10ALM-3106 风扇电压一级越限 (141)11ALM-3112 电源输入模块电压一级越限 (141)12ALM-4404 OMU与机框单平面通信故障 (142)13ALM-4502 LAN Switch热启动 (144)14ALM-6415 软件包损坏 (144)15ALM-7405 性能业务指标阈值二级越限 (146)16ALM-8307 SMM主备板软件版本不一致 (147)17ALM-8503 OMU双机连接故障 (147)18ALM-8703 OMU与特定的NTP服务器通信故障 (148)19ALM-8704 OMU与NTP服务器时间偏差超出同步阈值 (150)4. 提示告警 (151)1ALM-3165 端到端质量检测超标 (151)2ALM-4766 帐户锁定 (152)3ALM-4790 帐户锁定 (153)4ALM-7406 性能业务指标阈值一级越限 (153)二、USCDB告警 (155)1. 紧急告警 (155)1ALM-5217 License特征段限制业务 (155)2ALM-5218 License文件限制业务 (156)3ALM-11000 磁阵与服务器单板的连接状态异常 (156)4ALM-11001 数据库表空间不足 (162)5ALM-11003 数据库连接异常 (167)6 ALM-11007 双机信任关系异常 (179)7ALM-11008 CRS资源状态异常 (182)8ALM-12011 容灾故障 (190)9ALM-12012 流控开始 (193)10ALM-12015 License用户数已经达到容量限制 (195)11ALM-22005 加载LDAP SCHEMA文件失败 (196)2. 重要告警 (198)1ALM-101 主备模块补丁状态不一致 (198)2ALM-371 节点内存不足 (199)3ALM-794 禁止格式化转换 (200)4ALM-2069 模块间通讯故障 (201)5ALM-4488 配置进入脱机状态 (203)6ALM-4752 格式化失败 (203)7ALM-4754 联机设定失败 (204)8ALM-4756 数据表自动CRC校验错误 (206)9ALM-5215 License特征段已经失效 (207)10ALM-5216 License文件已经失效 (208)11ALM-5221 License文件无效 (209)12ALM-5401 主机运行版本和OMU不一致 (210)13ALM-11002 物理数据库备份或恢复失败 (211)14ALM-11004 硬盘空间占用率超过90% (225)15ALM-12001 节点心跳超时 (227)16ALM-12007 节点加载失败 (229)17ALM-12008 节点备份失败 (236)18ALM-14002 DPU同步文件数目超出上限 (242)19ALM-14003 DPU与远端DPU连接失败 (244)20ALM-14007 PGW流控启用 (245)21ALM-22001 DSG SCTP链路传输质量下降 (247)22ALM-22002 DSG SCTP链路负荷过载 (248)23ALM-22003 DSG SCTP链路拥塞 (250)24ALM-22004 DSG SCTP链路故障 (251)3. 次要告警 (253)1ALM-102 补丁激活后未确认 (253)2ALM-369 节点内存使用率过高 (254)3ALM-1043 模块备份开关关闭 (255)4ALM-3451 License宽限保护打开 (256)5ALM-10000 PCDR缓冲区溢出 (257)6ALM-14004 PGW同步静态数据出错 (258)7ALM-14009 DPU文件传输失败 (259)8ALM-14011 PGW节点与物理库连接异常 (261)9ALM-22000 DSG SCTP路径故障 (262)4. 提示告警 (264)1ALM-5213 License特征段即将失效 (264)2ALM-5214 License文件即将失效 (265)3ALM-12014 License用户数即将达到容量限制 (265)三、HLR-FE告警 (267)1. 紧急告警 (267)1ALM-1701 MTP目的信令点不可达 (267)2ALM-1713 MTP路由不可用 (268)3ALM-1815 M3UA路由不可用 (270)4ALM-1817 M3UA目的实体不可达 (271)5ALM-2752 SCCP目的信令点不可达 (272)6ALM-2758 远端SCCP故障 (273)7ALM-5217 License特征段限制业务 (274)8ALM-5218 License文件限制业务 (275)2. 重要告警 (276)1ALM-101 主备模块补丁状态不一致 (276)2ALM-743 主用FE和容灾FE动态数据同步心跳超时 (277)3ALM-794 禁止格式化转换 (279)4ALM-1705 MTP链路故障 (280)5ALM-1707 MTP缓冲区拥塞 (286)6ALM-1709 MTP二层拥塞 (289)7ALM-1715 MTP链路发送负荷过载 (291)8ALM-1717 MTP链路接收负荷过载 (293)9ALM-1728 MTP链路故障自环检测 (296)10ALM-1762 M3UA SCTP路径故障 (297)11ALM-1768 M3UA链路传输质量故障 (298)12ALM-1793 M3UA链路集不匹配 (301)13ALM-1809 M3UA链路拥塞 (304)14ALM-1811 M3UA链路故障 (307)15ALM-1831 M3UA链路负荷过载 (310)16ALM-2069 模块间通讯故障 (312)17ALM-2754 SCCP子系统禁止 (314)18ALM-2756 SCCP子系统故障 (316)19ALM-3228 信令点拥塞 (317)20ALM-4488 配置进入脱机状态 (318)21ALM-4752 格式化失败 (318)22ALM-4754 联机设定失败 (319)23ALM-4756 数据表自动CRC校验错误 (321)24ALM-5215 License特征段已经失效 (322)25ALM-5216 License文件已经失效 (323)26ALM-5221 License文件无效 (324)27ALM-5401 主机运行版本和OMU不一致 (325)28ALM-12001 节点心跳超时 (326)29ALM-22001 DSG SCTP链路传输质量下降 (327)30ALM-22002 DSG SCTP链路负荷过载 (329)31ALM-22003 DSG SCTP链路拥塞 (331)32ALM-22004 DSG SCTP链路故障 (332)33ALM-125300 特通消息缓冲区满 (334)3. 次要告警 (335)1ALM-102 补丁激活后未确认 (335)2ALM-1043 模块备份开关变化告警 (336)3ALM-2763 SCCP消息环回错误 (337)4ALM-3451 License宽限保护打开 (338)5ALM-22000 DSG SCTP路径故障 (339)6ALM-125301 特通消息缓冲区占用空间超过阈值 (340)4. 提示告警 (341)1ALM-5213 License特征段即将失效 (341)2ALM-5214 License文件即将失效 (342)四、DX80磁盘阵列告警处理 (343)1. J类型告警 (343)1J 0ASSMM0p Controller Module#m(zz xxHz) BE Expander Port#p Warning <pppppsssss rrrrr> (343)2J 0CSSMM00 Controller Module#m(zz xxHz) Flash ROM Warning <ppppp sssss rrrrr> (344)3J 0ESSMM00 Controller Module#m(zz xxHz) NAND Flash Warning <ppppp sssss rrrrr> (346)4J 01SSMM00 Controller Module#m(zz xxHz) Warning factor(ww) <ppppp sssss rrrrr> (347)5J 06SSMM00 Controller Module #m(zz xxHz) BE Expander Warning <ppppp sssss rrrrr> (349)6J 08SSMM0p Controller Module#m(zz xxHz) DI Port#p Warning <ppppp sssss rrrrr> (350)7J 09SSMM00 Controller Module#m(zz xxHz) SAS Port#nn Warning <ppppp sssss rrrrr> (351)8J 80SSMMnn Disk Drive DE#MM-Disk#nn(SAS xxxGB yykrpm ccccc) SMART(Warning)<ppppp sssss rrrrr> (353)9J 900xMM0n Expander DE#MM/EXP#n Warning <ppppp sssss rrrrr> (354)10J 910xMMnp Expander Port DE#MM/EXP#n/Port#p Warning <ppppp sssss rrrrr>35611J C1MM0000 Controller Module#m(zz xxHz) Reboot <ppppp sssss rrrrr> (357)12J C3SSMM00 Controller Module#m(zz xxHz) Cache(MEM) Correctable Error <pppppsssss rrrrr> (358)13J D20xMM0n Power Supply Unit DE#MM/PSU#n Warning <ppppp sssss rrrr> (360)14J DA0xMM00 DE Exhaust temperature (sensor) DE#MM Warning (361)15J DB0xMM00 DE Intake temperature DE#MM Warning (362)2. M类型告警 (363)1M 21810xxx RAID Group#0xxx REBUILD to HS(DV)(Recovered end) (363)2M E005nxxx WRITE BAD DATA (364)3M E10300xx PINNED DATA (365)4M E207000B NOT READY(11:Power Off/Fail Incomplete) (366)5M E207000C NOT READY(12:Backup Fail) (367)6M E207000D NOT READY(13:Multi CM Down) (367)7M E207000E NOT READY(14:Machine Down Recovery End) (368)8M E207000F NOT READY(15:Machine Down Recovery Failed) (368)9M E2070001 NOT READY(01:Configuration Error) (369)10M E2070002 NOT READY(02:CM F/W Version Error) (369)11M E2070004 NOT READY(04:Restore Fail) (370)12M E2070010 NOT READY(16:DE Build Error) (370)13M E2070011 NOT READY(17:CM Memory Shortage) (371)14M E2070015 NOT READY(21:Configuration Data restored from System Disk) (371)15M E2070016 NOT READY(22:No Version) (372)3. P类型告警 (372)1P 0ASSMM0p Controller Module#m(zz xxHz) BE Expander Port#p Fault <ppppp sssss rrrrr> (372)2P 0BSSMM00 Controller Module#m(zz xxHz) Cache(MEM) Fault <ppppp sssss rrrrr> (373)3P 0CSSMM00 Controller Module#m(zz xxHz) Flash ROM Falut <ppppp sssss rrrrr> 374 4P 0ESSMM00 Controller Module#m(zz xxHz) NAND Controller Fault <ppppp sssss rrrrr> (375)5P 0FSSMM00 Controller Module#m(zz xxHz) SCU Fault <ppppp sssss rrrrr> (376)6P 1A00MM0p FC SFP Controller Module#m Port#p Fault <ppppp sssss rrrrr ooooo> (377)7P 1C00MM0p FC SFP+ Controller Module#m Port#p Fault <ppppp sssss rrrrr ooooo> (378)8P 01SSMM00 Controller Module#m(zz xxHz) Fault <ppppp sssss rrrrr> (379)9P 06SSMM00 Controller Module#m(zz xxHz) BE Expander Fault <ppppp sssss rrrrr> (380)10P 08SSMM0p Controller Module#m(zz xxHz) DI Port#p Fault <ppppp sssss rrrrr> 381 11P 09SSMM00 Controller Module#m(zz xxHz) SAS Port Fault <ppppp sssss rrrrr> .. 382 12P 11SSMM0p Controller Module#m(zz xxHz) Port#p Fault <ppppp sssss rrrrr> (383)13P 12SSMM00 Controller Module#m(zz xxHz) FE Expander Fault <ppppp sssss rrrrr> (384)14P 13SSMM0p Controller Module#m(zz xxHz) FE Expander Port#p Fault<ppppp sssss rrrrr> (385)15P 80SSMMnn Disk Drive DE#MM-Disk#nn(SAS xxxGB yykrpm ccccc) Fault (Failed Usable)<ppppp sssss rrrrr> (386)16P 88SSMMnn Disk Drive DE#MM-Disk#nn(SAS xxxGB yykrpm ccccc) Fault <ppppp sssss rrrrr> (387)17P 900xMM0n Expander DE#MM/EXP#n Fault <ppppp sssss rrrrr> (388)18P 910xMMnp Expander Port DE#MM/EXP#n/Port#p Fault <ppppp sssss rrrrr> (390)19P D20xMM0n Power Supply Unit DE#MM/PSU#n Fault <ppppp sssss rrrrr> (391)20P DA0xMM00 DE Exhaust temperature (sensor) DE#MM Fault (392)21P DB0xMM00 DE Intake temperature sensor DE#MM Fault (393)4. R类型告警 (394)1R 06SSMM00 Controller Module#m(zz xxHz) BE Expander Normal <ppppp sssss rrrrr> (394)2R 900xMM0n Expander DE#MM/EXP#n Normal<ppppp sssss rrrrr> (395)3R D20xMM0n Power Supply Unit DE#MM/PSU#n Normal <ppppp sssss rrrrr> (396)4R DA0xMM00 DE OUT TEMP Normal (396)5R DB0xMM00 DE IN TEMP Normal (397)一、CGP告警1. 紧急告警1ALM-1005 单板CPU过载告警解释当系统检测到CPU的占用率大于过载告警的门限(可由用户设置)时,上报此告警。
华为LTE基站告警处理手册(传输、时钟类)v1.0

一、业务通、管理断。
1.1相关告警、拓扑断站截图相关告警:在网管“当前告警浏览”里筛选OSS的告警,即可查到网元连接中断的告警,出现此告警的站点,即为管理断的站点。
拓扑图上的断站显示:站点图标的左上角出现小红点即为断站站点。
1.2配置查询方法,查询命令截图因为维护链路断链,所以无法从网管上对站点进行维护,因此无查询方法和命令。
1.3处理建议找传输人员配合处理,查询传输侧配置的VLAN、IP和路由是否和调单一直。
二、管理通、业务断1.4相关告警、拓扑断站截图管理通、业务端的站点因为维护链路正常所以在主拓扑上和正常站点的图标没有差别,所以只能通过告警来识别。
相关告警:a.S1接口故障告警b.SCTP链路故障告警c.小区不可用告警d.用户面承载链路故障告警2. 配置查询方法,查询命令截图a.查询命令 DSP S1b.查询命令 DSP SCTPLINK1.4.1C.查询命令 DSP CELLd.查询命令 LST ALMAF1.5 LST ALMAF:;天津西青投资中心F-HLH[132887]+++ 天津西青投资中心F-HLH[132887] 2014-07-31 14:46:00O&M #173864%%/*35446265*/LST ALMAF:;%%RETCODE = 0 执行成功ALARM 2251 故障重要告警eNodeB 25952 中继系统告警同步号= 4534告警名称= 用户面承载链路故障告警告警发生时间= 2014-07-31 13:56:37定位信息= 用户面本端对象标识=0, 对端IP地址=100.72.92.80, 描述信息=eNB:MCC_460 MNC_00 GlobaleNBId_460-00-132502, 业务类型=X2附加信息= 基站制式=L, 影响制式=L, 部署标识=NULL附加信息1 = AF_L=天津西青投资中心F-HLH[132887]ALARM 2252 故障重要告警eNodeB 25952 中继系统告警同步号= 4535告警名称= 用户面承载链路故障告警告警发生时间= 2014-07-31 13:56:37定位信息= 用户面本端对象标识=0, 对端IP地址=100.72.52.235, 描述信息=eNB:MCC_460 MNC_00 GlobaleNBId_460-00-132527, 业务类型=X2附加信息= 基站制式=L, 影响制式=L, 部署标识=NULL附加信息1 = AF_L=天津西青投资中心F-HLH[132887]ALARM 2253 故障重要告警eNodeB 25952 中继系统告警同步号= 4536告警名称= 用户面承载链路故障告警告警发生时间= 2014-07-31 14:16:38定位信息= 用户面本端对象标识=0, 对端IP地址=100.72.72.164, 描述信息=eNB:MCC_460 MNC_00 GlobaleNBId_460-00-132609, 业务类型=X2附加信息= 基站制式=L, 影响制式=L, 部署标识=NULL附加信息1 = AF_L=天津西青投资中心F-HLH[132887](结果个数= 3)--- END注:但这里需要区别一下描述信息中的业务类型,只有显示业务类型=S1时,才会影响业务。
华为GSM告警原因及处理步骤

E1/T1信号丢失告警
GSM小区退出服务告警
光口支路滑帧告警 光口支路滑帧告警 时钟参考源异常告警
E1/T1信号丢失告警
光口支路远端告警
光口支路远端告警
射频单元接收通道异常告警 射频单元接收通道异常告警 光口支路告警指示信号告警 光口支路告警指示信号告警
1、人工闭塞:执行了人工闭塞小区或者主BCCH载频的操作。 2、其它OM操作:人工复位基站或小区、动态数据配置操作(如修改主B 频点)引起BSC对BTS进行复位操作。 3、基站掉电:基站无电源输入。 4、其他原因:LAPD链路或载频属性调整导致的BTS短时不可用、BSC复 位引起基站复位、基站自动复位、单板故障、传输故障、数据配置错误 、人工复位BTS单板等原因。 0 0 0 1、E1/T1配置错误。 2、E1/T1传输线路连接异常。 3、本端设备异常。 4、E1/T1传输中继问题。 5、对端设备异常。 1、光纤没有插牢固。 2、本端设备和对端设备的帧格式配置不一致。 3、本端设备的发送故障。 4、对端设备的接收故障。 5、传输设备故障或传输线路故障。 1、光纤没有插牢固。 2、本端设备和对端设备的帧格式配置不一致。 3、本端设备的发送故障。 4、对端设备的接收故障。 5、传输设备故障或传输线路故障。 1、连接载频的主集或分集接收口的射频电缆松动或者损坏。 2、载频损坏。 1、连接载频的主集或分集接收口的射频电缆松动或者损坏。 2、载频损坏。 1、对端设备没有信号输出到传输设备。 2、传输设备故障。 1、对端设备没有信号输出到传输设备。 2、传输设备故障。 1、E1/T1配置错误。 2、E1/T1传输线路连接异常。 3、本端设备异常。 4、E1/T1传输中继问题。 5、对端设备异常。 1、光纤没有插牢固。 2、本端设备和对端设备的帧格式配置不一致。 3、本端设备的发送故障。 4、对端设备的接收故障。 5、传输设备故障或传输线路故障。 1、光纤没有插牢固。 2、本端设备和对端设备的帧格式配置不一致。 3、本端设备的发送故障。 4、对端设备的接收故障。 5、传输设备故障或传输线路故障。
华为PTN告警处理规范

华为PTN告警处理规范华为PTN告警处理规范1.ETH_LOS告警解释:ETH_LOS为以太⽹端⼝连接丢失告警。
该告警表⽰以太⽹端⼝接收不到以太⽹信号。
产⽣原因:以太⽹端⼝的电缆或光纤没有连接好。
电缆或光纤故障。
本端⽹元接收光功率过低。
单板故障。
处理步骤:检查以太⽹端⼝的电缆或光纤是否接好,插紧松脱的电缆或光纤。
检查电缆或光纤是否存在故障,更换故障的电缆或光纤。
检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过⼤。
更换上报告警的处理板。
若告警未消除,更换对端⽹元对应的处理板。
2.MPLS_TUNNEL_LOCV告警解释:MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。
连续3个周期内没有收到希望的CV/FFD报⽂时出现此告警。
产⽣原因:PW对端停⽌CV/FFD。
物理链路故障。
PW对端单板正在复位。
业务接⼝配置错误。
⽹络出现严重拥塞。
处理步骤:在⽹管上查看PW对端是否停⽌了CV/FFD。
在⽹管上检查该链路两端⽹元是否存在单板或光模块相关的告警。
若告警未清除,查看光纤或电缆是否故障,更换故障的光纤或电缆。
在⽹管上检查对端单板是否上报COMMUN_FAIL告警。
若存在,说明对端单板可能正在复位。
清除COMMUN_FAIL告警后,查看本告警是否清除。
对照⽹元规划表,在⽹管上查看业务接⼝是否配置错误。
如果是,重新配置业务接⼝后,查看告警是否消除。
检查故障Tunnel的带宽是否已被完全占⽤。
如果是,增⼤Tunnel带宽配置或消除⾮法发送⼤数据量的根源。
查看告警是否清除。
3. BD_STATUS告警解释:BD_STATUS为物理单板离线告警。
当⽤户在⽹管上配置了逻辑单板⽽物理⼦架上却没有插⼊实际单板时就会上报此告警。
单板正在硬复位。
单板未插上,或单板插上,但与母板接触不良。
板间通讯故障。
处理步骤:在⽹管的“运⾏态”槽位视图中查看该单板的⼯作状态是否为蓝⾊,若是,则该单板处于硬复位状态。
等待3⾄5分钟,该单板的⼯作状态转成绿⾊后,查看本告警是否消除。
G网告警预处理手册(华为G9MGW)

中国移动通信集团湖北有限公司网管中心预处理手册(华为MSC-MGW)【设备型号】:UMG8900【设备类型】:MGW【硬件平台】:OSTA【软件版本】:UMG8900V200R003/ UMG8900V200R005【预处理手册版本】:V1.1【本次版本更新时间】:2007年7月目录目录 (1)1、严重告警 (4)§1.1虚拟媒体网关迁移出业务态(ALM:1802) (4)§1.2主备倒换失败(ALM:0001) (6)§1.3 单板硬件故障(ALM:0007) (7)§1.4 单板硬件模块故障(ALM:0021) (9)§1.5 单板故障(ALM:0040) (10)§1.6 单机框不可用(ALM:0041) (11)§1.7 硬盘空间拥塞(ALM:1412) (12)§1.8 SPF扣板故障(ALM:3902) (13)§1.9 接口芯片异常(ALM:2633) (14)§1.10 逻辑工作不正常(ALM:2634) (15)§1.11 SDH信号丢失LOS(ALM:1201) (15)§1.12 SDH帧定位丢失(ALM:1202) (16)§1.13 接口故障(ALM:3209) (17)§1.14 M3UA目的实体路由无效(ALM:3991) (19)§1.15 M3UA路由无效(ALM:3992) (20)§1.16 M3UA目的信令点不可达(ALM:3993) (22)§1.17 MTP3目的信令点不可达(ALM:3980) (23)§1.18 L2UA链路组故障(ALM:3905) (25)2、重要告警 (27)§2.1 接收信号丢失(ALM:2601) (27)§2.2 接收时钟丢失(ALM:2602) (28)§2.3 CPU拥塞(ALM:1402) (30)§2.4 硬盘空间过载(ALM:1411) (31)§2.5 MBLU单板芯片故障(ALM:2001) (32)§2.6 FLU故障(ALM:2006) (33)§2.7 SPF扣板CPU过载(ALM:3850) (34)§2.8 配电框电路电源故障告警(ALM:317) (35)§2.9 TC U或VPU或ECU单板硬件告警(ALM:1613) (35)§2.10 BAM系统文件损坏告警(ALM:270) (36)§2.11 FE级联网口故障(ALM:0026) (37)§2.12 单板控制网口故障(ALM:37) (38)§2.13 GE级联光口故障(ALM:605) (39)§2.14 级联光口故障(ALM:807) (40)§2.15 级联链路连接与配置不符(ALM:818) (41)§2.16 级联链路连接错误(ALM:819) (42)§2.17 GE通道故障(ALM:1606) (43)§2.18 GE通道光模块故障(ALM:2002) (44)§2.19 GE通道CDR故障(ALM:2003) (45)§2.20 TDM通道光模块故障(ALM:2004) (45)§2.21 参考源丢失(ALM:2202) (46)§2.22 恒温晶体输出信号丢失(ALM:2204) (48)§2.23 时分交换芯片时钟丢失(ALM:2631) (50)§2.24 时分交换芯片时钟未锁定(ALM:2632) (51)§2.25 单板时钟故障(ALM:804) (52)§2.26 NET板主用时钟失锁(ALM:808) (53)§2.27 BLU时钟故障(ALM:2007) (54)§2.28 DDS输出信号丢失(ALM:2206) (55)§2.29 时钟丢失(ALM:2407) (57)§2.30 38M时钟故障(ALM:2524) (58)§2.31 34M/45M时钟故障(ALM:2527) (58)§2.32 12M时钟故障(ALM:2528) (59)§2.33 77M时钟丢失(ALM:2635) (59)§2.34 32M时钟丢失(ALM:2636) (60)§2.35 2K时钟丢失(ALM:2637) (61)§2.36 38M时钟丢失(ALM:3258) (61)§2.37 SPF时钟丢失(ALM:3900) (62)§2.38 SCTP信令链路拥塞(ALM:407) (64)§2.39 信令链路故障告警(ALM:409) (66)§2.40 信令半永久连接故障(ALM:802) (68)§2.41 M3UA链路故障(ALM:1250) (69)§2.42 M3UA链路故障(ALM:3990) (70)§2.43 SPF扣板链路故障(ALM:3851) (72)§2.44 L2UA链路拥塞(ALM:3904) (73)§2.45 MTP链路(ALM:3981) (74)§2.46 M3UA链路SCTP拥塞(ALM:3994) (75)3、次要告警 (77)§3.1 E1/T1时钟信号丢失(ALM:2401) (77)§3.2 E1/T1告警指示(ALM:2402) (78)§3.3 E1/T1远端告警(ALM:2403) (79)1、严重告警§1.1虚拟媒体网关迁移出业务态(ALM:1802)【告警标题(网管呈现)】:虚拟媒体网关迁移出业务态【告警标题含义】:当虚拟媒体网关因某种外界原因迁移出业务态时产生此告警。
华为硬件故障告警解释及处理

第一节 DBUS告警 (2)一2170 DBUS告警 (2)二3108 DBUS告警 (3)三3628 DBUS告警 (4)四4158 DBUS告警 (5)第二节 DBUS时钟告警 (7)一2132 DBUS时钟告警 (7)二4120 DBUS时钟告警 (8)第三节无线链路提示告警 (10)一2134 无线链路提示告警 (10)二3072 无线链路提示告警 (12)三4122 无线链路提示告警 (14)第四节时钟参考源异常 (16)一2208 时钟参考源异常 (16)二3146 时钟参考源异常 (17)三3666 时钟参考源异常 (18)四4708 时钟参考源异常 (20)第五节 13M时钟校准维护告警 (22)一2260 13M时钟校准维护告警 (22)二3718 13M时钟校准维护告警 (23)三4760 13M时钟校准维护告警 (24)第六节反向功率告警 (25)一3614 反向功率告警 (25)第一节 DBUS告警一2170 DBUS告警告警解释当机架内部的数据总线出现问题时,上报该告警。
对系统的影响告警发生时,部分或者全部TRX的业务彻底中断。
系统自处理过程无可能原因·E1传输线故障;·机架内部数据总线故障;·TMU板故障.处理步骤1.查看其他相关告警查看LMT是否同时上报2214 E1本地告警的处理方法处理,观察告警是否恢复。
Y=>告警恢复,告警处理结束.N=>告警未恢复,转步骤2.若没有上报上述告警, 转步骤2.2.检查E1线是否单端接地检查TMU的拨码开关是否正确,如果有错,修改拨码开关状态,保证E1线单端接地,观察告警是否恢复。
Y=>已恢复,处理结束;N=>告警未恢复,转步骤3.如果TMU拨码开关正确,转步骤3.3.更换TMU更换TMU,观察是否恢复。
Y=>已恢复,处理结束;N=>告警未恢复,故障原因可能为机架整套配线故障,联系华为技术中心。
华为常见告警处理建议

华为常见告警处理建议华为常见告警目录4102 LAPD告警 (5)4104 载频配置告警 (6)4106 载频处理器告警 (8)4108 无线链路严重告警 (9)4110 载频降功率告警 (10)4112 主控模块关功放告警 (11)4114 内部收发通道告警 (13)4116 载频电压异常告警 (14)4118 四收分集接收告警 (15)4120 DBUS时钟告警 (16)4122 无线链路提示告警 (18)4124 测试锁相环告警 (20)4126 载频单板ID错误告警 (21)4128 锁相环提示告警 (22)4130 CBUS2链路告警 (23)4132 四收分集通道故障告警 (24)4136 载频硬件告警 (26)4140 功放温度告警 (27)4144 载频驻波告警 (28)4154 载频主时钟告警 (30)4156 载频副时钟告警 (31)4158 DBUS告警 (32)4168 频点与载频类型不一致告警 (34)4176 主集接收通道告警 (35)4178 分集接收通道告警 (36)4180 功率类型不支持告警 (38)4184 时钟严重告警 (39)4186 锁相环严重告警 (40)4192 载频单板通信告警 (42)4194 载频单板类型配置错告警 (43)4708 时钟参考源异常告警 (44)4710 E1远端自环测试告警 (46)4714 E1本地告警 (46)4716 E1远端告警 (48)4722 主控模块通信告警 (50)4726 基站维护告警 (51)4760 13M时钟校准维护告警 (52)4772 主控模块主时钟故障 (53)4794 主控模块硬件严重告警 (54)4798 主控模块内部电源告警 (55)4800 主控模块硬件提示告警 (57)5292 单板通讯告警 (58)5312 合分路器单板类型配置错告警 (59)5314 合分路器频段与频点不匹配告警 (60)5318 DDPU电压异常告警 (61)5320 DDPU时钟异常告警 (62)5324 DDPU硬件告警 (64)5326 DDPU驻波告警 (65)5328 DDPU驻波严重告警 (66)5330 DDPU低噪放告警 (67)6156 DEMU/EAC单板通信告警 (68)9732 NFCB风机盒通信告警 (70)9733 NFCB传感器故障告警 (71)9734 NFCB风扇故障告警 (72)9735 NFCB 温度异常告警 (73)9736 NFCB风机盒硬件故障告警 (75)9737 NFCB在位检测电路故障告警 (75)BTS3012基站告警:4102 LAPD告警告警含义1. 告警解释当LAPD链路断链时,将导致载频无法与BSC通信,上报本告警。
华为GSM告警原因及处理步骤

1、射频单元与BBU或上级射频单元之间的CPRI链路中断。 2、射频单元未上电或运行异常。 3、射频单元硬件故障。
1、连接载频的主集或分集接收口的射频电缆松动或者损坏。 2、载频损坏。 1、本级射频单元上的光纤接头或光模块安装松动,或光模块老化。 2、本级射频单元上的光纤接头不洁净,存在灰尘等异物。 3、本级射频单元上的光模块的型号(单模/多模、速率)不匹配。 4、对端设备(上级/下级射频单元或BBU)上的光纤接头或光模块安装松 动,或光模块故障。 5、对端设备(上级/下级射频单元或BBU)上的光纤接头不洁净,存在灰 尘等异物。 6、对端设备(上级/下级射频单元或BBU)上的光模块的型号(单模/多 模、速率)不匹配。 7、本级射频单元与对端设备(上级/下级射频单元或BBU)之间的光纤线 路存在弯折、挤压或老化,或光纤线路过长(超过40公里),导致光信 号在长距离传输后出现较大衰减。
告警解释 1、BBU CPRI端口上的光纤接头或光模块未插紧,或光模块故障。 2、BBU CPRI端口上的光纤接头不洁净,存在灰尘等异物。 3、BBU的CPRI端口和下级射频单元CPRI端口上的光模块的型号(单模/ 多模、速率)不匹配。 4、下级射频单元的CPRI端口上的光模块型号(单模/多模、速率)和射 频单元支持的型号不匹配。 5、BBU的CPRI端口的光模块和光纤的型号(单模/多模、速率)不匹配。 6、BBU上的CPRI接口单板故障。 7、下级射频单元未上电。 8、下级射频单元上的光纤接头或光模块未插紧,或光模块故障。 9、下级射频单元CPRI端口上的光纤接头不洁净,存在灰尘等异物。 10、下级射频单元上的光模块的型号(单模/多模、速率)不匹配。 11、BBU与下级射频单元之间的光纤线路故障。 12、下级射频单元故障。 1、射频单元与BBU或上级射频单元之间的CPRI链路中断。 2、射频单元未上电或运行异常。 3、射频单元硬件故障。 1、单板温度异常。 2、单板硬件故障。
华为OMC取全网告警实操手册

第一步:在工作台中选中浏览当前告警
第二步:在浏览当前告警页面中,点击过滤,将提示,未确认已清除,已确认已清楚的勾选掉。
其它保留。
第三步:在告警源页面中,将已有的类型删除掉
第四步:在告警源页面中,点击增加,选择网元类型为BST3900 LTE 和BST 3205E,然后点
击图标,完成后点击确定。
第五步:在浏览当前告警里面右击鼠标,选择保存――>保存所有记录,点击保存,注意,保存的文件类型要选择EXCEL格式,不要用TXT文本。
批注:在保存的时候有些系统盘是OMC服务器的地址,保存之后你很难找到,所以要事先建好一个文件,然后在里面找到对应自己的文件夹保存。
2-华为SDH设备告警处理手册0815

华为SDH设备告警处理手册辽宁移动网管中心监控室2008年8月目录一、告警处理原则 (4)二、常见告警处理方法 (5)■APS_FAIL 复用段保护倒换失败指示告警(SCC ASCC JSCC GXCSA EXCSA) (5)■APS_INDI复用段状态指示告警(SCC ASCC JSCC GXCSA EXCSA) (5)■AU_AIS 管理单元告警指示信号(FE08 EGT6 EGT2 GE06 SEP SP08 D64D SD1 SQ1 SL4 SD4 SQE S16 JLH1 JLHE JLQ4 JL64 JQ16 JD16 JL16 N1SLT1 N1SLD4 N1SLQ1 N1SL16 N1EFS0 N2SL64 SLQ4 SL16 SL16A SLO1 SL64) (5)■AU_LOP AU指针丢失(EGT2 EGT6 FE08 SEP D64D SP08 GE06 JLH1 JLHE JLQ4 JD16 JQ16 JL16 JL64 N1SLT1 N1SLD4 N1SLQ1 N1SL16 N2SL64 SD1 SD4 SL4 SQ1 SQE S16 SLO1 SLQ4 SL16 SL16A SL64) (6)■BD_STATUS单板物理离线告警[(1)JL64 N1SLT1 N2SL64 D64D N1SLD4 N1EFS0 ABA2 SL16 SLO1 SLQ4 SL64 S16 SQ1 SD1 EGT SL4 N1SL16 SP08 SQE JLH1 JLHE SL16A GE06 JQ16 FE08 EGT6 EGT2 JD16 JL16 JLQ4 N1SLQ1 SEP SD4(2)JSCC GSCC ASCC SCC GXCH GXCSA EXCH EXCS XCS AXCS AMXS GXCL EXCSA(3)PQ1 (4)JSTG EMPU JCOM JPBU JPIU JSTI ACOM AFAN AEOW EIPC PMU PIU AUX FAN] (7)■COMMUN_FAIL单板间通信失效告警[(1)JL64 N1SLT1N2SL64 D64D N1SLD4 N1EFS0 ABA2 SL16 SLO1 SLQ4 SL64 S16 SQ1 SD1 EGT SL4 N1SL16 SP08 SQE JLH1 JLHE SL16A GE06 JQ16 FE08 EGT6 EGT2 JD16 JL16 JLQ4 N1SLQ1 SEP SD4(2)JSCC GSCC ASCC SCC GXCH GXCSA EXCH EXCS XCS AXCS AMXS GXCL EXCSA(3)PQ1 (4)JSTG EMPU JCOM JPBU JPIU JSTI ACOM AFAN AEOW EIPC PMU PIU AUX FAN] (8)■ETH_LOS网口连接丢失告警(EGT GE06) (9)■FAN_FAIL风扇故障告警(EMPU FAN AFAN ASCC SCC) (9)■HARD_BAD硬件故障告警[(1)JL64 N1SLT1N2SL64 D64D N1SLD4 N1EFS0 ABA2 SL16 SLO1 SLQ4 SL64 S16 SQ1 SD1 EGT SL4 N1SL16 SP08 SQE JLH1 JLHE SL16A GE06 JQ16 FE08 EGT6 EGT2 JD16 JL16 JLQ4 N1SLQ1 SEP SD4(2)JSCC GSCC ASCC SCC GXCH GXCSA EXCH EXCS XCS AXCS AMXS GXCL EXCSA(3)PQ1 (4)JSTG EMPU JCOM JPBU JPIU JSTI ACOM AFAN AEOW EIPC PMU PIU AUX FAN] (9)■IN_PWR_FAIL光放大单板检测到自身的输入光接口无输入光功率(ABA2) (10)■IN_PWR_HIGH输入光功率过高告警(ABA2) (11)■IN_PWR_LOW输入光功率过低告警(ABA2) (11)■LTI同步源丢失告警(JSTG GXCSA EXCS XCS AXCS AMXS) (12)■M_S_SW交叉板或时钟板发生主备板倒换(GXCH JSTG EXCH XCS GXCL) (12)■MS_AIS复用段告警指示(JLH1 JQ16 JD16 JL16 JLQ4 JLHE JL64 SL16 SLO1 SLQ4 SL64 S16 SQ1 SL4 SEP SD4 SL16A SP08 SQE N1SL16 N1SLQ1 N1SLT1 N2SL64 D64D N1SLD4) (12)■MS_RDI复用段远端接收失效指示(JLH1 JQ16 JD16 JL16 JLQ4 JLHE JL64 N1SL16 N1SLQ1 N1SLT1 N2SL64 D64D N1SLD4 SL16 SLO1 SLQ4 SL64 S16 SQ1 SL4 SEP SD4 SL16A SP08 SQE) (13)■NESTATE_INSTALL网元处于安装态(JSCC) (13)■OUT_PWR_ABN输出光功率异常(JL64 N1SLT1 N2SL64 D64D N1SLD4 ABA2 SL16 SL64 S16 SEP N1SL16 JLH1 JLHE SL16A JQ16 JD16 JL16 JLQ4 N1SLQ1) (14)■PS 发生保护倒换指示告警(PQ1 EIPC XCS SCC) (14)■R_LOS线路接收侧信号丢失(JL16 JLQ4 JL64 JLH1 JD16 JLHE JQ16 N1SLT1 N1SLQ1 N2SL64 N1SLD4 N1SL16 FE08 D64D SL16 SLO1 SLQ4 SL64 S16 SQ1 SL4 SP08 SQE SL16A SEP SD4 SD1) (15)■R_LOF线路接收侧帧丢失(JL16 JLQ4 JL64 JLH1 JD16 JLHE JQ16 N1SLT1 N1SLQ1 N2SL64 N1SLD4 N1SL16 FE08 D64D SL16 SLO1 SLQ4 SL64 S16 SQ1 SL4 SP08 SQE SL16A SEP SD4 SD1) (16)■R_OOF接收线路侧帧失步(JL16 JLQ4 JL64 JLH1 JD16 JLHE JQ16 N1SLT1 N1SLQ1 N2SL64 N1SLD4 N1SL16 FE08 D64D SL16 SLO1 SLQ4 SL64 S16 SQ1 SL4 SP08 SQE SL16A SEP SD4 SD1) (17)■S1_SYN_CHANGE在S1字节模式下时钟源发生倒换(JSTG GXCSA EXCS XCS AXCS AMXS EXCSA) (18)■SECU_ALM有非法用户尝试登录网元失败(JSCC GSCC ASCC SCC) (18)■SLAVE_BAD备用板故障(JL64 GXCH D64D EXCH JLH1 JLHE GXCL GE06 JQ16 EGT6 JD16 JL16 JLQ4) (19)■SLAVE_WORKING表示备板工作态告警(GE06 JQ16 EGT6 JD16 JL16 JLQ4 N1SLQ1 SEP JSCC PQ1 GXCH EXCH JL64 N1SLT1 N2SL64 D64D N1SLD4 N1SL16 JLH1 JLHE GXCL) (19)■SNCP_FAIL SNCP倒换失败(JSCC ASCC) (20)■T_ALOS E1或T1接口模拟信号丢失(PQ1) (20)■TEMP_ALARM激光器温度越限告警(EMPU PMU EGT) (21)■TEMP_OVER单板工作温度越限告警(GXCSA AXCS AMXS EXCSA AFAN EXCS XCS SP08 N1EFS0 ABA2 SL16 SLO1 SLQ4 SL64 SL16A FE08 EGT2) (21)■TPS_ALM TPS保护倒换告警(N1SLT1 PQ1 SQE SEP) (21)■TPS_INDI TPS倒换指示(EXCS) (22)■TU_AIS TU告警指示(PQ1) (22)■TU_LOP TU指针丢失(PQ1) (23)■W_OFFLINE拉手条离位告警(GXCH JSTG JSCC GXCSA EXCH EXCS AMXS GXCL EXCSA) (23)三、告警关联原则 (24)一、告警处理原则1、总体原则:如果出现告警处理手册中未提及的告警内容,处理方法为升级成问题单(在有业务网申告的情况下,同时电话通知专业负责人);2、对于某一故障引发的大量传输告警,依照先线路后设备、先单站后单板、先高级后低级的原则进行处理,同时参照附件中的告警关联原则进行初步判断,进行故障处理和定位,需要派发工单至市公司进行处理的,原则上每个地市只派发一个工作单即可,按照《工单填写规范》写清楚告警信息、故障信息、需地市操作工作内容等信息,不用一个告警对应一个工作单;3、监控值班人员发现故障后,先派发故障单给相应监控组,再按手册进行初步处理,需现场工程师进行后续处理的,派发故障配合工单至市公司故障处理组;对于不能独立解决的,应升级为问题单转往技术支持组;已派发故障配合工作单但仍无法解决的,由地市升级为问题单进行处理。
华为SDH告警文档

华为SDH告警文档目录第3章告警处理ALM_ALSALM_NOLSRPARAFILEALM_SUBCARD_ABNAPS_FAILAPS_INDIAPS_MANUAL_STOPAU_AISAU_CMMAU_LOPAU_SQUELCHINGB1_E某CB1_SDB1B_E某CB2_E某CB2_SDB3_E某CB3_E某C_VC3B3_E某C_VC4B3_SDB3_SD_VC3B3_SD_VC4BD_STATUSBIP_OVERBIP_SDCOMMUN_FAILCONCAT_某C_LMTCOOL_CUR_OVERDBMS_ERRORDBMS_PROTECT_MODEDPS_BDVER_DIFETH_LOSE某T_SYNC_LOSFAN_FAILFCS_ERRFPGA_ABNGFP_DCSFGFP_DLFDGFP_DSSFHARD_BA DHARD_FAILHDLC_FAILHP_CROSSTRHP_LOMHP_RDIHP_REIHP_SLMHP_TIMHP_UNEQILL_MFI_VC12ILL_MFI_VC3 IN_PWR_ABNIN_PWR_FAILIN_PWR_HIGHIN_PWR_LOWJ0_MMK1_K2_MK2_M LASER_CLOSEDLASER_NOT_E某ISTLCAS_BAND_DECREASEDLINK_ERRLOCK_CUR_FAILLOOP_ALMLP_CROSSTRLP_RDILP_RDI_VC12LP_RDI_VC3LP_REILP_REI_VC12LP_REI_VC3LP_RFILP_SLMLP_SLM_VC12LP_SLM_VC3LP_TIMLP_TIM_VC12LP_TIM_VC3LP_UNEQLP_UNEQ_VC12LP_UNEQ_VC3LSR_COOL_ALMLSR_NO_FITEDLSR_WILL_DIE LSRPARA_MISMATCHLTIMS_AISMS_APS_INDI_E某MS_CROSSTRMS_RDIMS_REIMSAD_CROSSTRNEBD_某C_DIFNESF_LOSTNESTATE_INSTALLNO_BD_PARANO_BD_SOFTOUT_PWR_ABNPASSTHROUGHPDU ALMPOWER_FAILPOWERALMPROTOCOL_MMPUM_BCM_ALMPUM_COOL_ALMPWR_MAJ_ALMPWR_MIN_ALMR_LO CR_LOFR_LOSR_OOFRELAY_ALARMRS_CROSSTRS_BADS1_SYN_CHANGESCC_CHANGESECU_ALMSENSOR_FAILSNCP_FAILSYN_BADSY NC_C_LOSSYSBUS_FAILT_ALOST_LOCT_LOSTEM_HATEM_LATEMP_ALARMTEMP_OVERTEST_STATUSTFTHUNDERALMTU_AISTU_AIS_VC12TU_AIS_VC3TU_LOPTU_LOP_VC12TU_LOP_VC3VC_DELAY_TLW_OFFLINEW_R_FAILUREWORK_CUR_OVERWRG_BD_TYPE某C_NONDUALTRANS第3章告警处理ALM_ALS1.概述ALM_ALS告警表示ALS告警(ALSAlarmignal),为次要告警。
华为告警处理-入门篇

要求:熟练掌握“中继链路分配表”,这样就不需要用几个命令组合去查找相应的中继信息。
11月份开始进行华为端局升级,新版本的MSOFTX3000上告警显示的直接是到某个局向的CIC号,这样直接就可以知道是到哪个局向的第几条中继故障(0-31是第一条,32-63是第二条,依次类推)。
直接查找“中继链路分配表”就很直接。
在MSOFTX3000或者UMG上通过端口环回操作确认不是本端问题后联系传输处理或者联系对局确认是否对方做什么操作了。
常用手段就是通过端口环回确认问题出在本端:MSOFTX3000侧命令:环回STR PORTLOP: ; 取消环回STP PORTLOP: ;这上面主要是到LSTP和本地HLR的直连中继和信令.注意:老版本的MSOFTX3000(V100R003C07B016)到各个局向的逻辑链路也在上面,新版本(V100R005C10B019)没有UMG8900侧命令:环回和取消环回都是LOP E1:;这上面主要是到各个局向的中继和信令,出现告警后,查看详细告警信息,然后查“中继链路分配表”。
了解是到那个局向的第几条中继以及上面是否带链路。
MSOFTX3000常见告警:一:sccp 目的信令点禁止、MTP路由传输禁止、 MTP目的信令点不可达、sccp子系统禁止首先查看目的信令点编码了解是哪个局向(本例中编码为AFE10)指令为LST N7DSP:;输出界面:由此我们初步判断是:本端局至JNRZHLR的相关告警由于JNRZHLR至本地端局经常出现此告警,可采用手动恢复,并清除告警。
若是至其他局向出现此告警,则需立即通知维护人员。
(此告警属于严重告警须重视)当出现一条链路故障的告警,确认是否同时伴有中继告警,是则一般是中继故障引起,然后通过环回确认是否本端设备故障,然后联系对局确认传输或者对局是否存在问题。
一般出现到sccp 目的信令点禁止、MTP路由传输禁止、 MTP目的信令点不可达这些告警时,并且我其他大量异常告警,一般是对局在做操作或者设备故障导致。
LTE告警梳理:小区退服告警T2现场处理手册-华为

LTE告警梳理:小区退服告警T2现场处理手册-华为一、目的作用本手册针对华为TD-LTE基站设备出现的“ALM-29240 小区不可用告警”提供常规处理思路与方法,适用于告警处理一线工程师,以进行告警处理或进一步分析处理办法。
二、处理思路及步骤针对T1预处理后归纳原因及反馈信息,结合现场情况,分类处理:A.传输类告警:29201 S1接口故障告警25888 SCTP链路故障告警处理建议:对于出现的传输类告警,主要是因为基站到核心网之间不通导致小区无法建立,T1预处理无法恢复,可定位为传输问题,需要分公司处理。
1)协调传输部门配合处理;2)上站进行掉电复位、重新插拔主控板UMPT的尝试,建议掉电及插拔持续时间大于3分钟;3)更换主控板UMTP。
B.硬件类告警:26264 系统时钟失锁告警处理建议:对于时钟类告警,需要上站检查GPS问题,根据T1反馈信息,分类处理:1)“GPS开路”为GPS与主控板断开,主要检查主控板侧GPS接口与时钟线是否接触不良,或避雷器侧两端RG8U馈线是否接触不良,或蘑菇头处是否有松动或接触不良;2)“GPS短路”为GPS的RG8U馈线内蕊与外蕊有短接,可以用万用表进行测量,分段检查,重点检查接口处是否有铜丝或金属异物导致;3)“GPS搜星不足”为GPS搜星数量少于4颗,无法提供准确的时钟信息,需要站点工程师上站检查蘑菇头位置是否被遮挡、或蘑菇头周围有较大磁场或干扰,需要变更蘑菇头位置;4)更换主控板UMTP。
26200 单板硬件故障告警处理建议:根据T1反馈定位信息,确定故障单板。
1)后台工程师执行MML命令“RST BRD”进行单板复位;2)站点工程师上站对该单板进行重新插拔;3)更换单板。
26230 BBU CPRI光模块故障告警处理建议:根据T1反馈定位信息,确定光模块故障。
1)请现场工程师上站更换光模块。
26205 BBU单板维护链路异常告警处理建议:根据T1反馈定位信息,确定对应单板位置。
华为PTN 950的告警处理流程

告警处理通用流程
处理华为PTN 950设备的告警时,请参照以下流程。
华为PTN 950告警处理的一般原则
处理告警时,一般需要遵循以下原则:
●先根源告警,后衍生告警。
根据常见告警的相关性规则,先处理由故障或异常事件直接引发的告警(根源告警),后处理其它衍生出来的告警。
●先网管,后网元。
先在网管上远程实施告警原因的排查操作,后对实际网元实施排查。
●先排查常见原因,后排查特殊原因。
根据告警处理的经验和其它告警相关信息,先排查告警的常见原因,后排查告警的特殊原因。
●先软件,后硬件。
告警原因为华为PTN 950设备故障时,先排查软件故障(如复位单板),后排查硬件故障(如更换单板)。
注意:
文中涉及到拔插单板和硬复位的操作,若经过该板的业务没有保护,都将中断业务,请根据实际情况慎重进行此项操作。
说明:
告警处理过程中如存在任何问题,可联系华佳慧科技专业技术工程师处理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录1. MSC SERVER处理分册 (3)1.1 告警箱处于离线状态 (3)1.2、FE端口故障 (3)1.3、WCKI时钟参考源丢失 (4)1.4、控制框与业务框通信失败 (5)1.5、BAM到主机通讯失败 (7)1.6、BAM到主机连接中断 (8)1.7、与NTP服务器断连 (9)1.8、Q922链路故障 (10)1.9、TCP链路故障 (11)1.10、CPU过载 (12)1.11、单板网口协商失败 (14)1.13、许可证文件即将失效 (15)1.14、计费中心长时间未取话单 (16)1.15、心跳中断 (17)1.16、双机倒换 (18)1.17、私网中断 (19)1.18、IP资源失效 (21)1.19、备份连接失败 (22)1.20、单板故障 (23)1.21、许可证即将过期告警 (24)1.22、许可证已经过期告警 (25)1.23、电源输出开关关闭 (26)1.24、H.248 SCTP链路故障 (27)1.25、MGW退出服务 (29)1.26、MTP目的信令点不可达 (30)1.27、MTP路由传输禁止 (32)11.28、MTP链路故障 (33)1.29、MTP缓冲区拥塞 (35)1.30、M2UA链路故障 (37)1.31、SCCP目的信令点禁止 (38)1.32、SCCP子系统禁止 (40)N => 联系对端局点确认其子系统是否恢复。
(42)2. MGW处理分册 (42)2.1 FE级联网口故障 (42)2.2 风扇框通讯故障 (43)2.3 NET单板时钟检测异常 (46)2.5 GE级联光口故障 (51)2.7 NET单板时钟配线故障 (54)2.8 级联光口故障 (56)2.9 GE通道光模块故障 (58)2.10 TDM通道光模块故障 (61)3.11 BLU时钟检测异常 (63)2.12 信令链路故障告警 (65)2.13 SPF扣板链路故障 (67)2.14 L2UA链路组故障 (70)2.15 L2UA链路故障 (71)2.16 单板软件异常告警 (73)2.17 SIWF故障告警 (75)2.18 控制平面拥塞 (77)2.19 单板故障 (78)2.20 告警箱断链 (81)2.21 单板上存在故障的半永久 (82)2.22 参考源丢失 (84)2.23 虚拟媒体网关迁移出业务态 (85)1. MSC SERVER处理分册1.1 告警箱处于离线状态告警含义1. 告警解释当BAM与告警箱之间通信中断时间超过10秒钟后,系统将产生该告警。
2. 告警参数无。
对系统的影响告警箱无法正常运行,不能对BAM发送的告警做出正确响应,如不能发出声光告警。
系统自处理过程无。
相关告警无。
告警处理1. 可能原因BAM与告警箱之间链路中断。
2. 处理建议通知分公司维护人员检查BAM和告警箱的连接。
1.2、FE端口故障告警含义1. 告警解释系统监测到FE端口出现故障,将产生此告警。
2. 告警参数对系统的影响如果FE端口故障,通过该端口连接的设备之间通信中断。
系统自处理过程系统的FE通信基于双平面,如果一个端口故障,将另一端口进行通信。
相关告警无。
告警处理1. 可能原因硬件故障。
2. 处理建议对于WSMU和WIFM板,需要检查网线的连接情况。
对于其它单板,需要检查WHSC板的运行情况。
DSP BRD: FN=1, SLN=2;(输入单板的框号槽号)1.3、WCKI时钟参考源丢失告警含义1. 告警解释当WCKI时钟参考源丢失时而产生此告警。
2. 告警参数对系统的影响可能使系统不能正常工作。
系统自处理过程时钟参考源丢失,可能导致时钟系统不能正常工作。
相关告警无。
告警处理1. 可能原因•外部时钟源工作不正常。
•连接外部时钟源的时钟线有问题、或时钟连线不正确2. 处理建议1.观察设备面板CKI单板BITS时钟输入端口是否正常。
2.检查外部时钟源是否工作正常,如果不正常,更换时钟源。
3.检查时钟线连接是否正确,如果连线正确,请更换时钟线。
1.4、控制框与业务框通信失败告警含义1. 告警解释当控制框和业务框之间的通信中断时产生此告警。
2. 告警参数对系统的影响控制框和业务框之间的通信中断。
系统自处理过程无。
相关告警无。
告警处理1. 可能原因•可能控制框与业务框的HSC之间连线不正确•可能业务框工作不正常。
•可能业务框没有及时发心跳消息给控制框。
2. 处理建议1.检查控制框与业务框的HSC之间的连线是否正确,或更换网线,如果问题解决,这说明是连线有问题。
2.观察业务框的WSMU板是否运行正常,如果不正常,更换WSMU单板看问题是否解决,如果仍然没有解决更换HSC板,如果仍然没有解决,那可能是背板有问题,需更换背板解决。
3.检查CPU是否被某个任务长时间占用,导致没有发送心跳消息,或者有网络风暴,导致控制框无法正常接受到消息1.5、BAM到主机通讯失败告警含义1. 告警解释当BAM到主机通讯失败时,系统发出此告警。
2. 告警参数对系统的影响BAM与主机之间无法通讯。
系统自处理过程无。
相关告警该告警由ALM-2364 BAM到主机连接中断引发,ALM-2364 BAM到主机连接中断表示BAM 和交换机断连,因此必然导致该告警的产生。
告警处理1. 可能原因交换机有一个框的两个连接都断了。
2. 处理建议1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。
2、检查BAM机器网卡和LAN switchs:3、检查BAM机器网卡和LAN switchs是否工作正常。
并保证所有网线连接正常。
告警是否恢复?1.6、BAM到主机连接中断告警含义1. 告警解释当BAM与主机中断时,系统发出此告警。
2. 告警参数对系统的影响BAM与主机之间无法通讯。
系统自处理过程无。
相关告警该告警连带产生 ALM-2362 BAM到主机通讯失败。
告警处理1. 可能原因交换机某一个框的一个连接断开。
2. 处理建议1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。
2、检查BAM机器网卡和LAN switchs:3、检查BAM机器网卡和LAN switchs是否工作正常。
并保证所有网线连接正常。
告警是否恢复?1.7、与NTP服务器断连告警含义1. 告警解释时间同步进程与NTP服务器断连,时间同步已停止。
2. 告警参数无。
对系统的影响系统时间无法和NTP服务器同步。
系统自处理过程无。
相关告警无。
告警处理1. 可能原因•NTP服务器被停止或服务被关闭。
•系统和NTP服务器之间的网络断连。
2. 处理建议(1)、在MSOFT3000跟踪维护中用PING NTP服务器IP地址,检查网络是否正常。
(2) 检查NTP服务器是否被停止,NTP服务器的时间服务是否被关闭。
(3) 检查系统和NTP服务器之间的网络是否断连。
1.8、Q922链路故障告警含义1. 告警解释系统单板之间通过Q.922链路进行通信,底层为FE。
当两个单板间的Q.922链路发生故障时,产生该告警。
当WSMU启动时,WHSC板会自动被复位,此时也会产生该告警。
2. 告警参数对系统的影响•使用该链路通信的两个模块之间通信中断。
•该链路传输的业务发生中断。
系统自处理过程无。
相关告警无。
告警处理1. 可能原因•Q.922链路发生故障。
•WSMU启动。
2. 处理建议1.检查是否复位了WSMU板?Y=> 正常告警,不用处理N=> 转步骤(2)2.检查FE网口的状态是否正常?观察设备面板HSC端口状态。
Y=> 转步骤(3)N=> 更换不正常状态网口所在的单板3.检查单板的运行状态,如果单板发生故障,更换单板。
DSP BRD: FN=1, SLN=2, PSN=FB;(输入HSC单板框号、槽号、前后插板)1.9、TCP链路故障告警含义1. 告警解释系统监测到TCP链路出现故障时产生该告警。
WSMU板通过TCP链路与BAM和iGWB进行通信。
2. 告警参数对系统的影响•告警模块与目的模块之间的通信中断;•基于该TCP链路的业务中断。
系统自处理过程无。
相关告警无。
告警处理1. 可能原因•网络连接网线故障;•网卡故障。
2. 处理建议(1) 检查WHSC单板工作状态是否正常?Y=>可能为对端设备如BAM、iGWB网卡故障。
N=>更换故障单板。
DSP BRD: FN=1, SLN=2, PSN=FB;(输入HSC单板框号、槽号、前后插板)(2) 根据告警参数确认故障链路位置,检查TCP链路两端网卡的指示灯是否正常?Y=>请联系华为当地办事处技术支援人员。
N=>可能是网线连接问题。
(3) 判断是否网线松脱,拔插一下两端的网线接头,确保网线连接正常,检查故障是否排除?Y=>网线连接问题,结束。
N=>可能是网卡故障。
1.10、CPU过载告警含义1. 告警解释单板CPU占用超过设定的阈值(使用命令SET CPUTHD设置)时,产生该告警。
2. 告警参数对系统的影响部分呼叫会丢弃,产生呼损。
系统自处理过程系统启动流量控制机制,降低CPU占用率。
相关告警无。
告警处理1. 可能原因•系统容量不足;•处理模块分配不合理。
2. 处理建议(1) 根据告警参数确认发生CPU过载告警的单板,确认是否大部分同类型单板都CPU占用率偏高?检查该单板的CPU大小:DSP CPUR: LT=MN, MN=2;(输入该单板模块号)(2) 调整业务配置,将过载单板部分业务的调整到其它单板。
1.11、单板网口协商失败告警含义告警解释当单板的内网口或外网口以半双工模式工作时产生此告警。
告警参数3.举例参数“框号=0, 槽号=0, 端口号=2”表示位于0框0槽WIFM板的第2个网口(外网口)协商失败。
注意:系统板和WIFM板配置有3个内部端口,即端口0、1和2。
其他单板配置有两个外部端口,即端口0和1。
对系统的影响BAM与主机之间的以太网数据包不正常丢失,可能导致系统从BAM加载文件失败。
系统自处理过程无。
1.可能原因单板起来之后,会和LAN Switch进行网口工作模式协商,如果LAN Switch工作在半双工模式,单板端口也会工作在半双工状态。
2.处理建议检查LAN Switch设置,将其设为全双工。
1.13、许可证文件即将失效告警含义1. 告警解释许可证在X天后到期。
当以下两种情况中的任意一种发生时将产生此告警:•MSC服务器运行在试用许可证模式下。
•许可证文件在30天之内到期。
2. 告警参数对系统的影响许可证文件很快到期。
当许可证到期,MSC服务器运行在默认许可证配置下。
系统性能会降低。
系统自处理过程无。
1. 伴随告警无。
2. 引发告警无。
告警处理1. 可能原因•许可证文件很快到期。