华为PTN告警处理规范

合集下载

华为PTN常见开局故障处理

华为PTN常见开局故障处理
Page 6
PTN OAM 知识-PW OAM
PTN 设备将业务报文进行PW 封装后送到Tunnel 中进行承载。网络中存在Tunnel 和PW两 个层次,MPLS Tunnel 可以通过MPLS OAM 维护和管理,而PW 层则需要通过PWOAM 来 进行维护和管理 PW OAM 的主要检测方式是PW Ping,Ping 报文在Ingress 节点封装进PW 中,沿虚电路 发送,从而实现对PW 的检测
观察主控板的PROG 指示灯是否处于绿灯闪 主控板完成复位,
烁状态,若是,则主控板正处于复位状态
DCN 将自动恢复连接。
Page 12
DCN 故障处理案例1/3
•案例类型-IP 地址冲突导致网元间歇性脱管
•故障现象
两台非网关网元NE10 和NE30,分别通过ML-PPP 连接第三方SDH 设备,再连接到NE08 与网管保持通讯 NE10 和NE08 已配置业务且正常运行,NE30 为新创建的网元,未配置业务 NE30 创建后,NE10 和NE30 一直处于间歇性脱管状态,网管上报NE_COMMU_BREAK 和NE_NOT_LOGIN 告警
•步案骤例3 :类断开型新-G添加E 网端元口与工网管作之模间式的物不理一连致接,导并致将网该网元元间的通子网信掩中码断修改为16 位后,网络正常
故障现象:PTN 网元通过GE 链路互联组网,网元属性及DCN 参数已经正确 规划与配置,现场安装设备时,发现多处相邻网元之间无法通信,但各网元均 无告警上报
2.单向连通性检测(CC),源端MEP 将周期性的发送CC 帧,目的MEP 收到源端发送的CC 帧后,启动CC 检测功能。如果目的MEP 在一定时间之内没有收到源端的CC 报文,则自动上报ETH_CFM_LOC 告警。

华为PTN告警处理规范

华为PTN告警处理规范
检查单板是否存在TR_LO(告警,指示单板收到的38M系统时钟故障。若 存在,优先清除TR_LO告警。检查单板是否存在POWER_ABNOR告AL,指示单板电压异常。若存在,优先清除POWER_ABNOR告AL检查单板 是否存在HARD_BA告警,指示单板硬件故障。若存在,硬复位单板后, 查看告警是否清除。若告警未清除,更换上报HARD_BA告警的单板,并
对照网元规划表,在网管上查看业务接口是否配置错误。如果是,重新
配置业务接口后,查看告警是否消除。
检查故障Tunnel的带宽是否已被完全占用。如果是,增大Tunnel带宽 配置或消除非法发送大数据量的根源。查看告警是否清除。
3.
告警解释:BD_STATU为物理单板离线告警。当用户在网管上配置了逻辑单
板而物理子架上却没有插入实际单板时就会上报此告警。
在网管上查看两端端口是否存在LOOP_AL告警,若存在,优化清除LOOP_AL告警后,查看本告警是否清除。
对照网元规划表, 查看上报告警的端口是否错插了纤缆, 造成两端端口工 作模式不一致。
在网管上查看两端网元的相关单板是否存在HARD_BA等硬件类告警。若 存在,更换存在硬件类告警的单板后,查看本告警是否清除。
产生原因:
单板正在硬复位。
单板未插上,或单板插上,但与母板接触不良。
板间通讯故障。
处理步骤:
在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若 是,则该单板处于硬复位状态。等待3至5分钟,该单板的工作状态转 成绿色后,查看本告警是否消除。
检查相应槽位的单板是否插入。若未插入,请插入相应物理单板,告警 将自动清除。 检查单板与母板是否接触良好, 母板连接器的导针是否歪 斜。修正歪斜的导针,重新插拔单板使之与母板良好接触,告警将自动 清除。

华为PTN故障处理手册v1.0版

华为PTN故障处理手册v1.0版

华为PTN故障处理手册v1.0公司网络维护中心2010年12月目录一、概述 (5)二、网络故障分析定位方法 (5)2.1 告警分析法 (5)2.2 性能统计分析法 (7)2.3 OAM分析法 (9)2.4 配置数据分析法 (13)2.5 仪表测试分析法 (15)2.6 环回法 (16)2.7 排除法 (17)三、业务中断故障和业务恢复 (18)3.1 流程图 (18)3.2 查询误操作 (20)3.3 检查告警 (20)3.4 检查环回和装载 (21)3.5 检查业务配置 (22)3.6 应急恢复方案 (22)3.6.1 倒换 (22)3.6.2 复位 (23)3.6.3 通过更换单板恢复业务 (23)四、常见故障处理方法 (24)4.1 带DCN故障处理 (24)4.2 MPLS Tunnel故障处理 (29)4.3 PW故障处理 (31)4.4 CES业务故障处理 (33)4.5 以太网业务故障处理 (38)4.6 offload故障处理···············错误!未定义书签。

4.7 时钟故障处理 (42)4.8 QoS故障处理 (44)4.9 线性MSP故障处理 (48)4.10 TPS故障处理 (52)4.11 LAG故障处理 (55)4.12 MPLS APS故障处理 (59)五、部件更换注意事项 (63)4.13 部件分类说明 (65)4.14 更换处理板 (66)4.15 更换子卡 (68)4.16 更换接口板 (70)4.17 更换XCS单板 (71)4.18 更换带有1+1保护的SCA单板 (73)4.19 更换没有1+1保护的SCA单板 (76)4.20 更换风扇板 (79)4.21 更换PIU板 (80)4.22 更换可插拔光模块 (81)4.23 更换CF卡 (83)一、概述PTN网络故障处理在日常维护中显得至关重要,为了更好的开展PTN网络的日常维护,特编制PTN网络故障处理手册。

华为PTN配置VPLS业务规范

华为PTN配置VPLS业务规范

在配置完成VPLS业务之后,还需要配置ELAN转发表,水平分割组
1.广播报文抑制
在网元管理器界面里,以太网业务管理,专网业务
将广播报文修改为10% (超过10%即丢失,GE端口的10%就是100M流量)
2.MAC地址学习参数
根据实际情况修改地址表容量,如果值设置小,就会出现FDBSIZEALM_ELAN告警。

这个参数表示能够学习的MAC地址数量;超过这个数量的MAC地址数据包,就会变成广播报文
3.水平分割组
在汇聚点一定要配置水平分割组,把每个PWE3都加进去
对于叶子节点,如果有2个端口,则需要把端口加入水平分割组中
4.配置LAG保护,选择负载分担模式。

PTN告警处理情况

PTN告警处理情况

恢复设备供电或修复链上设备的光缆后消除
未处理自行恢复 恢复设备供电或修复链上设备的光缆后消除 未处理自行恢复
直接清除告警
检测现网设备电源正常,怀疑为误报,已告知中移和华为人员进行检查分析, 部分告警自行恢复 现网检查告警均为LTE业务的工作或保护PW 失效导致,目前检查处理约20条 业务后发现重新配置业务的TUNNEL并更换至PW 后可消除告警,但原 TUNNEL也正常。部分告警自行恢复或闪报。需要华为进行分析故障原因 检查PW 中断原因并处理,多为光缆或停电导致的TUNNEL中断故障导致 未处理自行恢复 处理MPLS_PW_LOCV、PW_APS_DEGRADED、PW_APS_OUTAGE等告 警后消除
次要 次要 重要 次要 重要 紧急 重要 重要 总数
安全管理员组用户修改其他用户密码告警 任务执行失败告警 数据库备份 数据库表记录数达到阈值 数据库日志异常 数据库占用率过高告警(次要) 数据库自增长失效 隧道组断开 总数
告警原因 网管服务器提示告警---性能值越限事件日志越限
TUNNEL两端设备的一端不支持MPLS OAM Y.1731模式
设备掉电导致的设备通信中断或脱管
网元反复复位5次上报该告警 设备掉电导致的设备通信中断或脱管 输出光功率过高或过低
网元默认密码未修改的提示告警
设备电源模块故障或只接一路电源
带保护业务的工作或保护业务中断导致保护降级
PW APS保护业务中的一条PW 中断 PW APS保护业务的主备通道均中断 PW APS保护业务未配置保护通道,现网告警多为 MPLS_PW_LOCV、PW_APS_DEGRADED、 PW_APS_OUTAGE的伴随告警
联系华为人员后反馈不影响业务,可直接清除,彻底解决需要软件升级

PTN简单故障处理

PTN简单故障处理

从网络侧端口检测到乱序CES 报文,当乱序丢包率在一段时间内一直维 持在一个阈值,需要上报错连告警
HUAWEI TECHNOLOGIES CO., LTD.
CES业务性能查看 CES业务性能查看
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 14
BSC
故障原因: 故障原因: 故障原因: 故障原因: 故障原因: 故障原因:
(1)断纤; (2)线路衰耗过大; (3)对端站发送部分故障,线路发送失效; )断纤; )线路衰耗过大; )对端站发送部分故障,线路发送失效; (1)接收到的信号失效;(2)时钟提取模块故障; 接收到的信号失效; 时钟提取模块故障 时钟提取模块故障; (1)接收信号衰减过大; (2)对端站发送信号无帧结构; (3)本板接收方向故障 接收到的信号失效 )接收信号衰减过大; )对端站发送信号无帧结构; )
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 2
故障排查思路
配置检查 业务 Tunnel 物理链路 硬件 告警与性能配合排查
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 3
目录
Huawei Confidential Page 13
网络侧端口在一段时间(默认为2.5s)内接收CES 报文的延时抖动导致 抖动缓冲区上溢的CESoEth 帧所占百分比持续超过一个定义阈值 网络侧端口在一段时间(默认为2.5s)内接收CES 报文的延时抖动导致 抖动缓冲区下溢的CESoEth 帧所占百分比持续超过一个定义阈值 从网络侧端口上报CES 报文的丢包率在一定时内(默认为2.5s)持续超 过一个定义阈值 当畸帧率超过阈值一定时间则上报告警

华为LTE告警原因和处理建议

华为LTE告警原因和处理建议

华为LTE常见告警处理建议2017-8-15华为LTE常见告警目录1射频单元业务不可用告警 (4)2小区不可用告警 (5)3射频单元维护链路异常告警 (6)4BBU IR接口异常告警 (6)5网元断连 (7)6传输光接口异常告警 (7)7S1接口故障告警 (8)8射频单元IR接口异常告警 (8)9License试运行告警 (8)10以太网链路故障告警 (9)11用户面故障告警 (9)12射频单元时钟异常告警 (10)13基站S1控制面传输中断告警 (10)14射频单元交流掉电告警 (10)15BBU IR光模块收发异常告警 (11)16射频单元驻波告警 (11)17远程维护通道故障告警 (12)18小区服务能力下降告警 (12)19射频单元光模块收发异常告警 (12)20射频单元光接口性能恶化告警 (13)21交流掉电告警 (14)22时钟参考源异常告警 (14)23射频单元硬件故障告警 (15)24射频单元输入电源能力不足告警 (15)25配置数据超出License限制告警 (15)26射频单元ALD电流异常告警 (15)27RRU组网级数与配置不一致告警 (16)28射频单元发射通道增益异常告警 (16)30星卡天线故障告警 (17)31BBU IR光模块/电接口不在位告警 (17)32天线设备维护链路异常告警 (17)33制式间通信异常告警 (18)34配置数据不一致告警 (18)35系统时钟不可用告警 (18)36时间同步失败告警 (19)37射频单元软件运行异常告警 (19)38BBU直流输出异常告警 (19)39单板温度异常告警 (20)40射频单元光模块/电接口不在位告警 (20)41射频单元接收通道RTWP/RSSI过低告警 (21)42BBU单板维护链路异常告警 (21)43BBU光模块收发异常告警 (21)44RRU组网拓扑类型与配置不一致告警 (22)45证书失效告警 (23)46远程维护通道配置与运行数据不一致告警 (23)47系统无License运行告警 (23)48单板不在位告警 (24)49未配置时钟参考源告警 (24)50MAC错帧超限告警 (24)51单板下电告警 (24)52单板硬件故障告警 (25)53版本自动回退告警 (25)54单板类型和配置不匹配告警 (26)55单板软件运行异常告警 (26)56机框类型配置与实际不一致告警 (26)57射频单元工作模式与单板能力不匹配告警 (27)58License Feature不可用告警 (27)59传输光模块不在位告警 (27)61射频单元CPRI接口异常告警 (28)62射频单元光模块类型不匹配告警 (29)63小区重配置失败告警 (29)64BBU IR光接口性能恶化告警 (30)65单板时钟输入异常告警 (30)66射频单元过载告警 (30)67射频单元温度异常告警 (31)68星卡维护链路异常告警 (31)1 射频单元业务不可用告警故障原因:1、配置原因:小区配置与设备支持规格冲突;射频模块在共模SDR配置下, 制式间载波频率间隔、功率规格、载波数规格、带宽规格等配置错误;CPRI速率配置错误;SFN跨框场景下,扇区设备配置错误;ODI配置错误;2、软件原因:License资源不足;3、单板不可用:小区使用的CPRI链路故障;小区使用的基带单元故障;小区使用的射频单元收发通道故障;CPRI带宽不足;CPRI MUX场景单板不支持;数据链路故障;控制链路故障;时钟精度不足;处理建议:1、检查小区和设备规格,更换型号匹配设备;核查配置参数是否有误,调整正确参数配置;2、核查小区LICENSE,增加LICENSE;3、排查CPRI链路、基带单元、射频单元收发通道、CPRI带宽、CPRI MUX场景单板故障;排查数据链路、控制链路故障,;校准时钟精度;2 小区不可用告警故障原因:1、配置原因:小区配置与设备支持规格冲突;射频模块在共模SDR配置下, 制式间载波频率间隔、功率规格、载波数规格、带宽规格等配置错误;小区参数修改引起小区重建;UBBP 单板上的基带工作制式没有包含LTE FDD制式、LTE TDD制式或者NB-IoT制式;LBBP单板上的工作模式没有包含LTE FDD制式、LTE TDD制式或者NB-IoT制式;eNodeB基带资源闭塞或者不可用;基站协议类型和RRU链环协议类型配置冲突;单板不支持配置成LTE FDD 制式+LTE TDD制式;CPRI速率配置错误;当两个小区承载在同一个AAS上,频点配置相同且发射虚天线波束参数相同;使用AAS配置V4R和UST小区,未配置虚天线倾角;多模负荷分担组网,出纤单板有UBBP,但UBBP未配置工作制式;NB-IoT小区所在LBBP单板工作模式没有包含NB-IoT模式;配置到射频模块的载波数量超出RHUB CPRI_E口规格限制;修改eNodeBId后没有复位App;2、软件原因:License资源不足;3、单板不可用:单板不可用;小区使用的CPRI链路故障;小区使用的基带单元故障;小区使用的射频单元收发通道故障;S1信令链路故障;时钟资源不可用(LTE TDD);CPRI带宽不足;CPRI MUX场景单板不支持;处理建议:1、检查小区和设备规格;核查配置参数是否有误;2、核查小区LICENSE;3、排查CPRI链路、基带单元、射频单元收发通道、CPRI带宽、CPRI MUX场景单板故障;排查数据链路、控制链路故障;校准时钟精度;3 射频单元维护链路异常告警故障原因:1、配置原因:链环上配置了多余的射频单元;双模CPRI MUX特性的组网,汇聚关系配置冲突;双模CPRI MUX特性的组网,汇聚方基带单板硬件故障、未安装或未上电、未配置;双模CPRI MUX特性的组网,汇聚方和被汇聚方链环配置的协议类型不一致;链环配置的协议类型和实际所连的射频单元的协议类型不一致;链环的“CPRI线速率”配置为MANUAL 时,前级射频单元模块不具备不等速率级联的能力或者本级射频单元配置的“从口线速率”超出了射频单元能力;链环的“CPRI线速率”配置为非MANUAL时,射频单元无法与当前链环运行的CPRI线速率同步;该射频单元所在链环的CPRI端口被闭塞或被设置断点;该射频单元所在链环的CPRI端口在对端制式被闭塞或被设置断点;该射频单元所在链环的CPRI 端口在当前组网中不支持下联功能;2、软件原因:射频单元故障导致射频单元自动复位,或人工操作导致射频单元复位;3、硬件原因:射频单元交流掉电、射频单元直流掉电、未上电或运行异常;BBU与射频单元之间或者上下级射频单元之间的光纤或者电缆故障;BBU或射频单元光模块故障;射频单元或BBU单板硬件故障;双模CPRI MUX特性的组网,汇聚方基带单板光模块故障;双模CPRI MUX特性的组网,被汇聚方与汇聚方之间BBU背板转发链路资源不足或链路故障;双模CPRI MUX特性的组网,汇聚方和被汇聚方基带单板硬件能力不支持背板汇聚;内存软失效处理建议:1、检查小区和设备配置参数是否有误;2、核查核查软件是否人工复位或者自动复位;3、排查电力,馈线接头、电缆、光模块、CPRI链路、基带单元、基带单板硬件能力不支持背板汇聚、内存软;4 BBU IR接口异常告警故障原因:1、配置原因:多模基站场景下配置错误;用户执行了闭塞CPRI端口的命令;2、硬件原因:在BBU和下级射频单元连接链路采用光接口时,可能是BBU或下级射频单元的光纤接头或光模块未插紧,或光纤链路故障;在BBU和下级射频单元连接链路采用电接口时,可能是BBU或下级射频单元的电缆接头未插紧,或电缆故障;多模场景下,BBU互联线缆异常或者BBU互联端口光模块故障;BBU或下级射频单元运行异常或硬件故障;处理建议:1、检查小区和设备配置参数是否有误;2、现场检查BBU与下级射频单元RRU之间的光路,重点排查两端的光纤、光模块是否存在问题;3、不排除RRU软件或硬件故障导致,可尝试先复位RRU观察告警是否恢复,不行则尝试更换;。

PTN 950的告警级别

PTN 950的告警级别

重要告警
次要告警
提示ቤተ መጻሕፍቲ ባይዱ警
该级别告警的产生是由于网络 立即处理。 中的某服务已经受到了严重影 响,并且需要立即进行正确的处 理。例如,某个被管理对象完全 失效,它的功能需要被恢复到正 常运转时的状态,则上报该级别 告警。 该级别告警的产生是由于网络 紧急处理。 中影响服务的条件正在逐渐形 成,并且需要紧急的、正确的处 理。例如,某个被管理对象的功 能产生了严重的衰退,该功能需 要被恢复到正常运转时的状态, 则上报该级别告警。 该级别告警的产生是由于网络 及时查找告警原因,消除隐患。 中出现了一些目前尚未影响服 务的异常状况,但如不进行正确 的处理,则会产生更严重的异常 状况(如业务中断) 。例如,当 检测到的情况并没有使被管理 对象当前的处理能力下降,则上 报该级别告警。 该级别告警的产生是由于在重 经分析后消除潜在威胁。 大异常状况发生之前,系统检测 到了潜在的、会对服务产生影响 的异常状况。在这种情况下,需 要对该异常情况进行判断,并且 解除潜在的威胁,以免发生更严 重的、影响服务的故障。

PTN 950 的告警级别 告警级别用于标识一条告警的严重程度和重要性、 紧迫性, 按告警的严重程度递减的顺序可 以将告警分为以下四个级别:紧急告警、重要告警、次要告警和提示告警。 不同级别的告警及其处理方式如下表所示。 表 1 告警级别 告警级别 紧急告警 定义 处理原则

PTN 告警分析与建议

PTN 告警分析与建议

是否要下 站点 否 否
处理结果
是 否 否

2011-10-26
华为机密,未经许可不得扩散
第2页,共2页
66225048.xls
文档密级:
告警名 DCNSIZE_OVER LAG_MEMBER_DOWN DCN域过大
可能原因
成员端口不能激活也不能作为备用时,上 报此告警,指示原因
ETH_APS_LOST SWDL_PKGVER_MM SWDL_ROLLBACK_FAIL
1、对方没有配置保护; 2、保护通道业务中断; 软件包描述文件中描述的软件版本信息和 实际的软件文件版本信息不一致 网元回滚时有板回滚失败 1、本端物理端口故障; 2、本端没有接收到对端的OAM报文; 3、两端的OAM11-10-26
华为机密,未经许可不得扩散
第1页,共2页
66225048.xls
文档密级:
处理意见 升级SPH505补丁,之后如果还报告警,则 要缩减DCN域 1)检查对端是否配置了保护组,修改配置, 保持两端配置一致; 2)检查保护通道是否存在故障,消除保护通 道的故障; 重新进行一次包加载 重新进行一次包加载 1)检查物理链路是否正常,更换出故障的器 件(比如光纤/单板/光模块等); 2)检查对端设备是否使能了P2P OAM协议, 修改配置,两端配置保持一致;

PTN常见故障处理(阅读)

PTN常见故障处理(阅读)
Page 20
Tunnel常见故障处理方法(续)
原因3:Tunnel 所在的物理链路故障。 1. 查询系统中是否存在HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL 或 MP_DOWN 等告警,指示Tunnel 使用的物理链路故障。 2. 若存在,优先处理HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL 或 MP_DOWN 告警。 3. 查看并处理系统中存在的下列告警:MPLS_TUNNEL_BDI、 MPLS_TUNNEL_Excess、MPLS_TUNNEL_FDI、MPLS_TUNNEL_LOCV、 MPLS_TUNNEL_MISMATCH、MPLS_TUNNEL_MISMERGE、 MPLS_TUNNEL_SD、MPLS_TUNNEL_SF、MPLS_TUNNEL_UNKNOWN 4. 检查对端设备是否存在单板故障或网元复位等异常状况。排除对端设备的异 常情况。 原因4:保护倒换失败。 1. MPLS APS 保护倒换失败,参考保护故障处理。
常见原因
原因1:路由失败。 原因2:交叉创建失败。 原因3:Tunnel 所在的物理链路故障。 原因4:保护倒换失败。
Page 19
Tunnel常见故障处理方法
原因1:路由失败。 1. 对照网络规划,检查Tunnel 两端端口参数配置是否正确,例如端口IP。修正不正 确的端口参数后,再次创建Tunnel。 2. 检查Tunnel 首末节点所在的网元间是否存在完整可达的链路。若不存在,修复链 路中残缺或故障的部分。 3. 可选: 确认动态Tunnel 配置的“Route Constraint”条件和“Color”(亲和属性)是 否正确。修正不正确的参数信息,具体操作请参见使用路径方式创建动态MPLS Tunnel 和FRR 保护。 4. 可选: 如果Tunnel 配置了带宽,检查链路带宽是否满足Tunnel 的要求。 原因2:交叉创建失败。 1. 检查网络中是否存在不同的网元使用相同的网段。如果存在,需要修改端口IP地 址。 2. 检查Tunnel 是否配置了不兼容的保护特性。详细内容请参见《版本说明书》。 3. 查看Tunnel 所经过的网元或单板,确认已创建Tunnel 个数是否已经达到了最大值。 如果是,需要重新规划或删除冗余的Tunnel。

PTN常见故障及处理

PTN常见故障及处理

1、NE_NOT_LOGIN告警解释NE_NOT_LOGIN表示网元未登录对系统的影响无法从网元侧查询该告警的配置数据无法在网管上管理该网元可能原因原因1:网元与网管通讯中断解决网元与网管通讯中断方法,参见NE COMMU BREAK原因2:用户退出登陆或者登陆网元失败以其他正确的网元用户登陆网元查看告警是否结束,若未结束,请进行下一步如果故障依然存在,请联系华为工程师MPLS_TUNNEL_LOCV告警解释MPLS_TUNNEL_LOCV 为TUNNEL连通性丢失告警。

连续3个周期内没有收到希望的CV/FFD报文时出现此告警。

对系统的影响该告警产生时,会触发MPLS APS倒换,将业务倒换到保护TUNNELMPLS_TUNNEL_FDI告警将抑制MPLS_TUNNEL_LOCV告警的上报。

可能原因告警MPLS_TUNNEL_LOCV产生的可能原因如下:原因1:TUNNEL的INGRESS节点停止CV/FFD原因2:物理链路故障原因3:INGRESS节点的单板正在复位原因4:业务借口配置错误原因5;网络出现严重拥塞原因6:CPU占用饱和,无法处理ARP协议报文处理步骤:原因1:原因1:TUNNEL的INGRESS节点停止CV/FFD1、在网管上分别进入上报告警的TUNNEL的INGRESS节点和EGRESS节点的“网元管理器”,在功能树中选择“配置》MPLS 管理》单播TUNNEL管理”。

选择“OAM参数”选项卡。

2、查看两端的“检测方式”和“检测报文类型”参数是否一致如果两端的参数。

则。

不一致修改任一节点的参数配置使两端一致后,单击“应用”。

一致继续下一步3、查看INGRESS节点的“CV/FFD状态”参数如果是。

则。

停止右键单击该条TUNNEL,在弹出的菜单中单击‘启动CV/FFD”.查看告警是否清除启动排查下一原因原因2:物理链路故障1、在网管上查看EGRESS节点是否存在HARDBAD、ETH_LOS、或者ETH LINK DOWN告警,具体操作请参见在U2000上查询当前告警。

PTN业务故障常用的处理方案

PTN业务故障常用的处理方案

PTN业务故障处理方法
故障定位的基本原则为三句话:先主后次、由外而内、逐步深入。

先主后次:障产生时通常伴随着告警,首先需要分析告警,应首先分析高级别的告警(如紧急告警、主要告警),然后再分析低级别的告警(如次要告警和提示告警)。

由外到内:在界定故障类型时,应先排除外部的可能因素,如链路故障、电源故障、温度过高等;其次是排查配置是否正确,如时钟跟踪、对接参数、门限设置等;最后才是具体定位故障点。

逐步深入:在定位故障点时,遵循逐步缩小范围的原则,先确认是网络侧问题还是用户侧问题,然后进一步定位到是某一段链路问题或故障网元的某块单板问题。

首先,核实网管网元告警是否和业务有关的告警。

查询影响的业务或者是tunnel
核实网元tunnel的连通性,查询tunnel的APS是否正常倒换,保护tunnel是否正常。

查看保护组的状态
通过LSP ping测试tunnel是否正常
设置需要测试参数,正向、反向都需要分别配置。

关注:包长:64、512、1400字节,覆盖长短包。

包数:50。

优先级:0、7,覆盖高低优先级。

核查PWE3业务是否故障。

通过以太OAM测试核实PWE3业务连通性
进入以太OAM测试界面,设置LB参数
查看以太OAM测试结果LB测试信息:没有超时,LB统计信息:发送报文个数和接收报文个数相等
可通过VCCV ping来检测PWE3业务的连通性。

查看运行结果,看业务是否故障。

PTN常见故障及告警处理

PTN常见故障及告警处理

HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 19
目录
1
常见故障定位流程 业务故障定位
2
3 4 5 6 7 8
Tunnel故障定位
链路故障定位 保护故障定位 时钟故障定位 带内DCN故障定位 硬件常见告警
9
10
故障定位典型案例
参考文档
Huawei Confidential Page 5
HUAWEI TECHNOLOGIES CO., LTD.
CESGIES CO., LTD.
Huawei Confidential
Page 6
CES业务常见故障现象
HUAWEI TECHNOLOGIES CO., LTD.
HUAWEI TECHNOLOGIES CO., LTD. Huawei Confidential Page 11
CES业务常见告警(二)

CES_LOSPKT_EXC——CES业务丢包告警 原因1:时钟未同步。 原因2:CES业务两端网元参数配臵不一致。 原因3:Tunnel或PW带宽配臵过低,链路拥塞。 原因4:电缆、光纤或光模块故障导致链路信号变差或中断。
臵较大的带宽,查看告警是否清除。 原因3:电缆、光纤或光模块故障导致链路信号变差。 检查并确认电缆或光纤与接口良好连接。清洁光纤或光模块后,查看告警是否清除。若告警未 清除,更换相应的电缆、光纤或光模块。
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential

华为PTN ETH业务故障处理

华为PTN ETH业务故障处理


PW/Tunnel故障:
原因可能是PW/Tunnel down、 业务流经的物理链路中断等等;

报文拥塞:
原因可能是带宽配置过小、同优先级的报文流量过大导致丢包,或网络上流经此端口
的流量超过端口实际的物理流量的范围而丢包等等;

存在物理或逻辑上环路故障(仅针对Elan):
原因可能是网络组网就存在物理环路,或水平分组配置不合理引起逻辑链路上的环 路或报文被环回的情况等等;
Page 9
故障定位流程篇


通用方法介绍
通用流程介绍
(1)硬件故障定位流程
(2)Tunnel/pw故障定位流程
(3)接入侧故障定位流程 (4) ELAN业务层面定位流程 (5)其它故障定位流程
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 10
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 18
ELine业务典型案例分析篇——现象描述

某运营商网络通过在PTN设备上配置专线业务用以传其时钟数据,也就是将
RNC的时钟数据传输到NodeB,但有些站点会出现业务中断后又自动恢复的问
题 . 组网如下图:
而SynLos告警是NodeB的时钟跟踪不上才会上报的。那么,究竟是业务中断 引起eNodeB的时钟跟踪不上而上报SynLos告警,还是时钟跟踪不上后,而 引起业务中断呢? 由于排除前者非常困难,因为还涉及到中间网络的分析。 那相比前者,确认后者是否NodeB时钟跟踪不上就会中止发送数据 ,及 NodeB时钟跟踪有那些性能要求的问题就更容易些。

华为PTN告警处理规范

华为PTN告警处理规范

华为PTN告警处理规范1.ETH_LOS告警解释:ETH_LOS为以太网端口连接丢失告警。

该告警表示以太网端口接收不到以太网信号。

产生原因:以太网端口的电缆或光纤没有连接好。

电缆或光纤故障。

本端网元接收光功率过低。

单板故障。

处理步骤:检查以太网端口的电缆或光纤是否接好,插紧松脱的电缆或光纤。

检查电缆或光纤是否存在故障,更换故障的电缆或光纤。

检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。

更换上报告警的处理板。

若告警未消除,更换对端网元对应的处理板。

2.MPLS_TUNNEL_LOCV告警解释:MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。

连续3个周期内没有收到希望的CV/FFD报文时出现此告警。

产生原因:PW对端停止CV/FFD。

物理链路故障。

PW对端单板正在复位。

业务接口配置错误。

网络出现严重拥塞。

处理步骤:在网管上查看PW对端是否停止了CV/FFD。

在网管上检查该链路两端网元是否存在单板或光模块相关的告警。

若告警未清除,查看光纤或电缆是否故障,更换故障的光纤或电缆。

在网管上检查对端单板是否上报COMMUN_FAIL告警。

若存在,说明对端单板可能正在复位。

清除COMMUN_FAIL告警后,查看本告警是否清除。

对照网元规划表,在网管上查看业务接口是否配置错误。

如果是,重新配置业务接口后,查看告警是否消除。

检查故障Tunnel的带宽是否已被完全占用。

如果是,增大Tunnel带宽配置或消除非法发送大数据量的根源。

查看告警是否清除。

3. BD_STATUS告警解释:BD_STATUS为物理单板离线告警。

当用户在网管上配置了逻辑单板而物理子架上却没有插入实际单板时就会上报此告警。

产生原因:单板正在硬复位。

单板未插上,或单板插上,但与母板接触不良。

板间通讯故障。

处理步骤:在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若是,则该单板处于硬复位状态。

等待3至5分钟,该单板的工作状态转成绿色后,查看本告警是否消除。

(完整word版)PTN传输常见告警

(完整word版)PTN传输常见告警

NE_NOT_LOGIN告警解释NE_NOT_LOGIN表示网元未登录。

告警属性告警参数无。

对系统的影响•无法从网元侧查询该网元的配置数据。

•无法在网管上管理该网元。

可能原因•原因1:网元与网管通讯中断。

•原因2:用户退出登录或登录失败。

处理步骤•原因1:网元与网管通讯中断。

解决网元与网管通讯中断方法,参见NE_COMMU_BREAK。

•原因2:用户退出登录或登录网元失败。

以其他正确的网元用户登录网元。

•查看告警是否结束,若未结束,请进行下一步。

•如果故障依然存在,请联系华为工程师。

MPLS_TUNNEL_LOCV告警解释MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。

连续3个周期内没有收到希望的CV/FFD报文时出现此告警。

告警属性告警参数在网管中浏览告警时,选中该告警,在“告警详细信息”中会显示该告警的相关参数。

告警参数的格式为“告警参数(16进制):参数1 参数2…参数n”,如:告警参数(16进制):0x01 0x08…。

每个参数的含义说明参见下表。

对系统的影响•该告警产生时,会触发MPLS APS倒换,将业务倒换到保护Tunnel。

•MPLS_TUNNEL_FDI告警将抑制MPLS_TUNNEL_LOCV告警的上报。

可能原因告警MPLS_TUNNEL_LOCV产生的可能原因如下:•原因1:Tunnel的Ingress节点停止CV/FFD。

•原因2:物理链路故障。

•原因3:Ingress节点的单板正在复位。

•原因4:业务接口配置错误。

•原因5:网络出现严重拥塞。

•原因6:CPU占用率饱和,无法处理ARP协议报文。

处理步骤•原因1:Tunnel的Ingress节点停止CV/FFD。

1.在网管上分别进入上报告警的Tunnel的Ingress节点和Egress节点的“网元管理器”,在功能树中选择“配置 > MPLS管理 >单播Tunnel管理”。

选择“OAM参数”选项卡。

PTN不常见告警处理

PTN不常见告警处理

13-06382-嘉里中心写字楼M-PTN950;上报BD_NOT_INSTALLED告警
13-02499-朝阳黄草湾T-PTN950;3-EG2-1 上报LSR_NO_FITED告警
13-02499-朝阳黄草湾T-PTN950;3-EG2-1 上报FLOW_OVER告警
13-06870-国宏大厦M-PTN1900;2-73CXP上报COMMUN_FAIL$@$
13-04788-芳城园-PTN950;上报S1_SYN_CHANGE$@$
13-00293-北京第六医院-PTN950;7-CXP 上报POWER_ABNORMAL告警
12-00517-东八里庄/D1-01-PTN3900;上报DCNSIZE_OVER告警
是否影响业务
告警解释
tunnel中断
TUNNEL连通性丢失
光模块故障、未安装光模块(在激光器为打开状态)
该端口接收的流量超出预期流量。具体为该端口承载业务带宽某一时刻的峰值超 过该端口的预警门限导致上报此告警
大部分主控故障,主控未升级造成主控与其他单板通信失败
一般为网元断电或者两侧断纤
单板电源模块失效、电源输入异常、子架电源板故障(可能部分单板的局部电源 故障)
13-07155-重庆饭店M-PTN950;7-CXP 上报BUS_ERR告警
13-00987-青蓝大厦M-PTN950;上报CLK_NO_TRACE_MODE告警
13-07028-新永外文化商城M-PTN950;5-EG2-1 上报ETH_LINK_DOWN告警
13-07155-重庆饭店M-PTN950;上报THUNDERALM告警
设备单板故障引起主用的主控报此告警
未配置物理层时钟、设备故障、主控未升级引起

华为告警处理手册1.0

华为告警处理手册1.0

华为端局告警处理手册目录1. MSC SERVER处理分册 (3)1.1 告警箱处于离线状态 (3)1.2、FE端口故障 (4)1.3、WCKI时钟参考源丢失 (5)1.4、控制框与业务框通信失败 (6)1.5、BAM到主机通讯失败 (7)1.6、BAM到主机连接中断 (8)1.7、与NTP服务器断连 (9)1.8、Q922链路故障 (10)1.9、TCP链路故障 (11)1.10、CPU过载 (13)1.11、单板网口协商失败 (14)1.13、许可证文件即将失效 (15)1.14、计费中心长时间未取话单 (17)1.15、心跳中断 (18)1.16、双机倒换 (19)1.17、私网中断 (20)1.18、IP资源失效 (21)1.19、备份连接失败 (22)1.20、单板故障 (23)1.21、许可证即将过期告警 (24)1.22、许可证已经过期告警 (25)1.23、电源输出开关关闭 (26)1.24、H.248 SCTP链路故障 (27)1.25、MGW退出服务 (29)1.26、MTP目的信令点不可达 (31)1.27、MTP路由传输禁止 (32)11.28、MTP链路故障 (33)1.29、MTP缓冲区拥塞 (36)1.30、M2UA链路故障 (37)1.31、SCCP目的信令点禁止 (38)1.32、SCCP子系统禁止 (40)N => 联系对端局点确认其子系统是否恢复。

(42)2. MGW处理分册 (42)2.1 FE级联网口故障 (42)2.2 风扇框通讯故障 (44)2.3 NET单板时钟检测异常 (46)2.4 NET单板时钟失锁 (49)2.5 GE级联光口故障 (51)2.6 NET单板时钟失锁 (53)2.7 NET单板时钟配线故障 (54)2.8 级联光口故障 (56)2.9 GE通道光模块故障 (58)2.10 TDM通道光模块故障 (61)3.11 BLU时钟检测异常 (63)2.12 信令链路故障告警 (65)2.13 SPF扣板链路故障 (68)2.14 L2UA链路组故障 (70)2.15 L2UA链路故障 (71)2.16 单板软件异常告警 (74)2.17 SIWF故障告警 (75)2.18 控制平面拥塞 (77)2.19 单板故障 (78)2.20 告警箱断链 (81)2.21 单板上存在故障的半永久 (82)2.22 参考源丢失 (84)2.23 虚拟媒体网关迁移出业务态 (86)1. MSC SERVER处理分册1.1 告警箱处于离线状态告警含义1. 告警解释当BAM与告警箱之间通信中断时间超过10秒钟后,系统将产生该告警。

华为PTN 950的告警处理流程

华为PTN 950的告警处理流程

告警处理通用流程
处理华为PTN 950设备的告警时,请参照以下流程。

华为PTN 950告警处理的一般原则
处理告警时,一般需要遵循以下原则:
●先根源告警,后衍生告警。

根据常见告警的相关性规则,先处理由故障或异常事件直接引发的告警(根源告警),后处理其它衍生出来的告警。

●先网管,后网元。

先在网管上远程实施告警原因的排查操作,后对实际网元实施排查。

●先排查常见原因,后排查特殊原因。

根据告警处理的经验和其它告警相关信息,先排查告警的常见原因,后排查告警的特殊原因。

●先软件,后硬件。

告警原因为华为PTN 950设备故障时,先排查软件故障(如复位单板),后排查硬件故障(如更换单板)。

注意:
文中涉及到拔插单板和硬复位的操作,若经过该板的业务没有保护,都将中断业务,请根据实际情况慎重进行此项操作。

说明:
告警处理过程中如存在任何问题,可联系华佳慧科技专业技术工程师处理。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

华为PTN告警处理规范1.ETH_LOS告警解释:ETH_LOS为以太网端口连接丢失告警。

该告警表示以太网端口接收不到以太网信号。

产生原因:以太网端口的电缆或光纤没有连接好。

电缆或光纤故障。

本端网元接收光功率过低。

单板故障。

处理步骤:检查以太网端口的电缆或光纤是否接好,插紧松脱的电缆或光纤。

检查电缆或光纤是否存在故障,更换故障的电缆或光纤。

检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。

更换上报告警的处理板。

若告警未消除,更换对端网元对应的处理板。

2.MPLS_TUNNEL_LOCV告警解释:MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。

连续3个周期内没有收到希望的CV/FFD报文时出现此告警。

产生原因:PW对端停止CV/FFD。

物理链路故障。

PW对端单板正在复位。

业务接口配置错误。

网络出现严重拥塞。

处理步骤:在网管上查看PW对端是否停止了CV/FFD。

在网管上检查该链路两端网元是否存在单板或光模块相关的告警。

若告警未清除,查看光纤或电缆是否故障,更换故障的光纤或电缆。

在网管上检查对端单板是否上报COMMUN_FAIL告警。

若存在,说明对端单板可能正在复位。

清除COMMUN_FAIL告警后,查看本告警是否清除。

对照网元规划表,在网管上查看业务接口是否配置错误。

如果是,重新配置业务接口后,查看告警是否消除。

检查故障Tunnel的带宽是否已被完全占用。

如果是,增大Tunnel带宽配置或消除非法发送大数据量的根源。

查看告警是否清除。

3. BD_STATUS告警解释:BD_STATUS为物理单板离线告警。

当用户在网管上配置了逻辑单板而物理子架上却没有插入实际单板时就会上报此告警。

产生原因:单板正在硬复位。

单板未插上,或单板插上,但与母板接触不良。

板间通讯故障。

处理步骤:在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若是,则该单板处于硬复位状态。

等待3至5分钟,该单板的工作状态转成绿色后,查看本告警是否消除。

检查相应槽位的单板是否插入。

若未插入,请插入相应物理单板,告警将自动清除。

检查单板与母板是否接触良好,母板连接器的导针是否歪斜。

修正歪斜的导针,重新插拔单板使之与母板良好接触,告警将自动清除。

在网管上查询是否上报告警的单板或主控板是否存在HARD_BAD或COMMUN_FAIL告警。

若存在,更换上报告警的单板,查看告警是否消除。

4. HARD_BAD告警解释:HARD_BAD为硬件故障告警。

当单板检测到硬件出现异常且会影响业务运行时,就会上报该告警。

产生原因:外接电源失效。

单板与母板未良好接触。

单板硬件故障。

若接口板上报HARD_BAD告警,可能是对应的处理板出现故障。

处理步骤:确保正常电源接入后,查看告警是否清除。

拔出故障单板,确认背板上的导针无异常。

重新插入单板,使单板与母板良好接触。

硬复位上报告警的单板,查看告警是否清除。

若告警未消除,更换上报告警的单板。

硬复位接口板对应的处理板,参看告警是否清除。

5. ETH_LINK_DOWN告警解释:ETH_LINK_DOWN为网口连接故障告警。

该告警表示以太网连接错误,端口协商失败。

产生原因:本端网元和对端网元的端口工作模式不一致,造成协商失败。

端口内环回。

纤缆连接到错误的端口。

单板故障。

处理步骤:在网管上查看两端网元的以太网端口工作模式是否一致。

若不一致,修改设置,使两端的端口工作模式一致后,查看告警是否清除。

在网管上查看两端端口是否存在LOOP_ALM告警,若存在,优化清除LOOP_ALM告警后,查看本告警是否清除。

对照网元规划表,查看上报告警的端口是否错插了纤缆,造成两端端口工作模式不一致。

在网管上查看两端网元的相关单板是否存在HARD_BAD等硬件类告警。

若存在,更换存在硬件类告警的单板后,查看本告警是否清除。

6. CES_CEBOUND_PKTLOS告警解释:CES_CEBOUND_PKTLOS为CES业务网络侧报文丢失告警。

当网络侧连续丢包超过设置的阈值上限或当连续3s以上没有收到报文,即上报此告警。

产生原因:业务承载层中断。

网络侧链路不稳定。

处理步骤:在网管上查询是否存在ETH_LOS、MP_DOWN或PW_DOWN告警。

若存在,优先清除ETH_LOS、MP_DOWN或PW_DOWN告警后,查看本告警是否清除。

检查并确认电缆或光纤与接口良好连接。

7. CES_LOSPKT_EXC告警解释:CES_LOSPKT_EXC为单位时间内CES业务的报文丢包数超过阈值告警。

当单板检测到一定周期内(10s),每秒平均帧丢失个数超出上限阈值(缺省为100)时,即上报此告警。

产生原因:时钟未同步。

CES业务两端网元参数配置不一致。

Tunnel或PW带宽配置过低,链路拥塞。

电缆、光纤或光模块故障导致链路信号变差或中断。

处理步骤:在网管上查询是否存在LTI告警或其它时钟相关告警,导致时钟没有同步,缓冲区入与出速率不一致。

若存在,优先清除LTI告警和时钟相关告警后,查看本告警是否清除。

在网管上查看CES业务两端网元参数配置是否一致,例如“64K时隙”等。

若不一致,修改配置参数,使两端一致。

在网管上查看业务所在Tunnel或PW的带宽配置是否过低。

如果是,重新为该Tunnel或PW配置较大的带宽,查看告警是否清除。

检查并确认电缆或光纤与接口良好连接。

8.CESPW_REMOTE_LOSPKT告警解释:CESPW_REMOTE_LOSPKT为CES PW远端丢包告警。

当本端网元收到R 比特置位为1的报文时,即上报该告警。

产生原因:网络拥塞。

物理链路存在错连。

处理步骤:在网管上查看业务所在Tunnel或PW的带宽配置是否过低。

如果是,重新为该Tunnel或PW配置较大的带宽,查看告警是否清除。

查看物理链路是否存在错连。

若存在,修正错误的物理链路后,查看告警是否清除。

9. COMMUN_FAIL告警解释:COMMUN_FAIL为单板间通信失效告警。

当主控板和其他单板之间的通信中断时就会上报此告警。

产生原因:单板处于硬复位状态。

单板故障。

38M系统时钟故障。

电源板故障,造成主控板3.3V电压异常。

主控板不在位或故障。

主控板的EXT接口直接连接HUB或者交换机。

处理步骤:查看告警,明确与主控板通信失效的单板。

在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若是,则该单板处于硬复位状态。

等待3至5分钟,该单板的工作状态转成绿色后,查看本告警是否清除。

检查单板是否存在TR_LOC告警,指示单板收到的38M系统时钟故障。

若存在,优先清除TR_LOC告警。

检查单板是否存在POWER_ABNORMAL告警,指示单板电压异常。

若存在,优先清除POWER_ABNORMAL告警。

检查单板是否存在HARD_BAD告警,指示单板硬件故障。

若存在,硬复位单板后,查看告警是否清除。

若告警未清除,更换上报HARD_BAD告警的单板,并查看背板上是否有倒针。

10. ETH_APS_LOST告警解释:ETH_APS_LOST告警表示APS帧丢失。

当没有从保护通道收到APS 帧时出现此告警。

产生原因:对端网元未配置APS保护。

APS保护组两端配置不一致。

APS保护组状态未激活。

保护通道业务中断。

处理步骤:在网管上查询对端网元是否配置了APS保护。

若没有,在对端网元配置与本端网元一致的APS保护组,并使能协议。

在网管上查询APS保护组两端配置是否一致。

若不一致,修改APS保护组配置,使两端配置一致。

检查两端是否都激活了APS保护协议。

将已激活的协议状态设置为“禁止”,再重新激活两端的协议状态。

检查保护通道是否存在信号丢失或业务质量劣化等告警,如ETH_LOS。

存在,优先清除这些告警。

11. LSR_NO_FITED告警解释:LSR_NO_FITED为激光器未安装告警。

该告警表示光口已使能但光口上没有安装光模块。

产生原因:光口使能,但没有安装光模块。

光模块或单板故障,监测不到安装的光模块。

处理步骤:查看光口是否安装了光模块。

更换上报告警端口的光模块,查看告警是否清除。

若告警未清除,更换上报告警的单板,查看告警是否清除。

12. LTI告警解释:LTI为同步时钟源丢失告警。

产生原因:交叉时钟板上外时钟接口接入的外部时钟源丢失。

线路时钟源丢失。

时钟源被设置为不可自动恢复或被锁定,导致当前跟踪的时钟源丢失时,无法自动倒换到其它时正常钟源上。

处理步骤:在网管上查看是否存在EXT_SYNC_LOS告警。

若存在,优先清除EXT_SYNC_LOS告警后,查看本告警是否清除。

在网管上查看是否存在ETH_LOS信号丢失类告警,若存在,则优先清除这些告警后,查看本告警是否清除。

若告警仍未清除,硬复位交叉时钟板,查看告警是否清除。

若告警仍未清除,请更换交叉时钟板,查看告警是否清除。

在网管上查看时钟源是否被设为不可自动恢复,如是,将其设置为自动恢复后,查看告警是否清除。

在网管上查看是否存在SYNC_LOCKOFF告警,若存在,优先清除SYNC_LOCKOFF告警后,查看本告警是否清除。

13. EXT_SYNC_LOS告警解释:EXT_SYNC_LOS告警表示外部时钟源丢失(Loss of External Synchronous Source)。

当系统检测到设备所跟踪的外部时钟源丢失时,就会上报该告警。

产生原因:外部时钟源的配置模式与实际的时钟输入模式不一致。

交叉时钟板故障。

时钟输入电缆连接不正确。

外部时钟源物理接口信号丢失。

处理步骤:在网管上检查外部时钟实际的输入模式与配置的时钟输入模式是否一致。

若不一致,重新配置外部时钟源的模式,确保与实际的时钟输入模式均为2MHz或者2Mbit/s后,查看告警是否清除。

在网管上查看交叉时钟板是否存在HARD_BAD等硬件类告警。

若存在,清除交叉时钟板的硬件类告警,查看告警是否清除。

检查时钟输入电缆是否连接正确。

检查外部时钟设备的输出信号是否正常。

若不正常,更换正常的外部时钟设备后,查看告警是否清除。

14. MPLS_PW_LOCV告警解释:MPLS_PW_LOCV为PW连通性丢失告警。

连续3个周期内没有收到希望的CV/FFD报文时出现此告警。

产生原因:PW对端停止CV/FFD。

物理链路故障。

PW对端单板正在复位。

业务接口配置错误。

网络出现严重拥塞。

处理步骤:在网管上查看PW对端是否停止了CV/FFD。

如果是,重新启动CV/FFD后,查看告警是否清除。

在网管上检查该链路两端网元是否存在单板或光模块相关的告警。

若存在,优先清除这些告警后,查看本告警是否消除。

若告警未清除,查看光纤或电缆是否故障,更换故障的光纤或电缆。

在网管上检查对端单板是否上报COMMUN_FAIL告警。

若存在,说明对端单板可能正在复位。

相关文档
最新文档