华为PTN告警处理规范
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
物理链路存在错连。
处理步骤:
在网管上查看业务所在Tunnel或PW的带宽配置是否过低。如果是,重新 为该Tunnel或PW配置较大的带宽,查看告警是否清除。
查看物理链路是否存在错连。 若存在, 修正错误的物理链路后, 查看告警 是否清除。
9.
产生原因:
单板处于硬复位状态。
单板故障。
38M系统时钟故障。
产生原因:
单板正在硬复位。
单板未插上,来自百度文库单板插上,但与母板接触不良。
板间通讯故障。
处理步骤:
在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若 是,则该单板处于硬复位状态。等待3至5分钟,该单板的工作状态转 成绿色后,查看本告警是否消除。
检查相应槽位的单板是否插入。若未插入,请插入相应物理单板,告警 将自动清除。 检查单板与母板是否接触良好, 母板连接器的导针是否歪 斜。修正歪斜的导针,重新插拔单板使之与母板良好接触,告警将自动 清除。
PW对端单板正在复位。
业务接口配置错误。
网络出现严重拥塞。
处理步骤:
在网管上查看PW寸端是否停止了CV/FFD
在网管上检查该链路两端网元是否存在单板或光模块相关的告警。若告 警未清除,查看光纤或电缆是否故障,更换故障的光纤或电缆。
在网管上检查对端单板是否上报COMMUN_FA告L警。若存在,说明对端 单板可能正在复位。清除COMMUN_FA&警后,查看本告警是否清除。
电缆、光纤或光模块故障导致链路信号变差或中断。
处理步骤:
在网管上查询是否存在LTI告警或其它时钟相关告警,导致时钟没有同 步,缓冲区入与出速率不一致。 若存在, 优先清除LTI告警和时钟相关告
警后,查看本告警是否清除 在网管上查看CES业务两端网元参数配置是否一致, 例如“64K时隙”等。 若不一致,修改配置参数,使两端一致。
在网管上查询是否上报告警的单板或主控板是否存在HARD_BA或
COMMUN_FAIL警。若存在,更换上报告警的单板,查看告警是否消除。
4.
告警解释:HARD_BA为硬件故障告警。当单板检测到硬件出现异常且会影响 业务运行时,就会上报该告警。
产生原因:
外接电源失效。
单板与母板未良好接触。
单板硬件故障。
检查并确认电缆或光纤与接口良好连接。
7.
告警解释:CES_LOSPKT_EXC单位时间内CES业务的报文丢包数超过阈值告 警。当单板检测到一定周期内(10s),每秒平均帧丢失个数超出上限阈 值(缺省为100)时,即上报此告警。
产生原因:
时钟未同步。
CES业务两端网元参数配置不一致。
Tunnel或PW带宽配置过低,链路拥塞。
电源板故障,造成主控板电压异常。
主控板不在位或故障。
主控板的EXT接口直接连接HUB或者交换机。
处理步骤:
查看告警,明确与主控板通信失效的单板。在网管的“运行态”槽位视图 中查看该单板的工作状态是否为蓝色,若是,则该单板处于硬复位状态。 等待3至5分钟,该单板的工作状态转成绿色后,查看本告警是否清除。
在网管上查看业务所在Tunnel或PW的带宽配置是否过低。如果是,重新 为该Tunnel或PW配置较大的带宽,查看告警是否清除。
检查并确认电缆或光纤与接口良好连接。
8
告警解释:CESPW_REMOTE_LOSPCESPW远端丢包告警。当本端网元收到R比特置位为1的报文时,即上报该告警。
产生原因:
网络拥塞。
检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。
更换上报告警的处理板。若告警未消除,更换对端网元对应的处理板。
2
告警解释:MPLS_TUNNEL_LOC\Tunnel连通性丢失告警。连续3个周期内
没有收到希望的CV/FFD报文时出现此告警。
产生原因:
PW对端停止CV/FFD
物理链路故障。
5.
告警解释:ETH_LINK_DOW为网口连接故障告警。该告警表示以太网连接错误, 端口协商失败。
产生原因:
本端网元和对端网元的端口工作模式不一致,造成协商失败。
端口内环回。
纤缆连接到错误的端口。
单板故障。
处理步骤:
在网管上查看两端网元的以太网端口工作模式是否一致。 若不一致, 修改 设置,使两端的端口工作模式一致后,查看告警是否清除。
在网管上查看两端端口是否存在LOOP_AL告警,若存在,优化清除LOOP_AL告警后,查看本告警是否清除。
对照网元规划表, 查看上报告警的端口是否错插了纤缆, 造成两端端口工 作模式不一致。
在网管上查看两端网元的相关单板是否存在HARD_BA等硬件类告警。若 存在,更换存在硬件类告警的单板后,查看本告警是否清除。
6.
告警解释:CES_CEBOUND_PKT为OSES业务网络侧报文丢失告警。当网络侧
连续丢包超过设置的阈值上限或当连续3s以上没有收到报文,即上报此 告警。
产生原因:
业务承载层中断。
网络侧链路不稳定。
处理步骤:
在网管上查询是否存在ETH_LO、MP_DOV或NPW_DOV告警。若存在,优 先清除ETH_LOSMP_DOW或NPW_DOW告警后,查看本告警是否清除。
对照网元规划表,在网管上查看业务接口是否配置错误。如果是,重新
配置业务接口后,查看告警是否消除。
检查故障Tunnel的带宽是否已被完全占用。如果是,增大Tunnel带宽 配置或消除非法发送大数据量的根源。查看告警是否清除。
3.
告警解释:BD_STATU为物理单板离线告警。当用户在网管上配置了逻辑单
板而物理子架上却没有插入实际单板时就会上报此告警。
华为
告警解释:ETH_LO为以太网端口连接丢失告警。该告警表示以太网端口接
收不到以太网信号。
产生原因:
以太网端口的电缆或光纤没有连接好。
电缆或光纤故障。
本端网元接收光功率过低。
单板故障。
处理步骤:
检查以太网端口的电缆或光纤是否接好,插紧松脱的电缆或光纤。
检查电缆或光纤是否存在故障,更换故障的电缆或光纤。
若接口板上报HARD_BA告警,可能是对应的处理板出现故障。
处理步骤:
确保正常电源接入后,查看告警是否清除。
拔出故障单板,确认背板上的导针无异常。重新插入单板,使单板与母 板良好接触。
硬复位上报告警的单板,查看告警是否清除。若告警未消除,更换上报 告警的单板。
硬复位接口板对应的处理板,参看告警是否清除。
检查单板是否存在TR_LO(告警,指示单板收到的38M系统时钟故障。若 存在,优先清除TR_LO告警。检查单板是否存在POWER_ABNOR告AL,指示单板电压异常。若存在,优先清除POWER_ABNOR告AL检查单板 是否存在HARD_BA告警,指示单板硬件故障。若存在,硬复位单板后, 查看告警是否清除。若告警未清除,更换上报HARD_BA告警的单板,并
处理步骤:
在网管上查看业务所在Tunnel或PW的带宽配置是否过低。如果是,重新 为该Tunnel或PW配置较大的带宽,查看告警是否清除。
查看物理链路是否存在错连。 若存在, 修正错误的物理链路后, 查看告警 是否清除。
9.
产生原因:
单板处于硬复位状态。
单板故障。
38M系统时钟故障。
产生原因:
单板正在硬复位。
单板未插上,来自百度文库单板插上,但与母板接触不良。
板间通讯故障。
处理步骤:
在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若 是,则该单板处于硬复位状态。等待3至5分钟,该单板的工作状态转 成绿色后,查看本告警是否消除。
检查相应槽位的单板是否插入。若未插入,请插入相应物理单板,告警 将自动清除。 检查单板与母板是否接触良好, 母板连接器的导针是否歪 斜。修正歪斜的导针,重新插拔单板使之与母板良好接触,告警将自动 清除。
PW对端单板正在复位。
业务接口配置错误。
网络出现严重拥塞。
处理步骤:
在网管上查看PW寸端是否停止了CV/FFD
在网管上检查该链路两端网元是否存在单板或光模块相关的告警。若告 警未清除,查看光纤或电缆是否故障,更换故障的光纤或电缆。
在网管上检查对端单板是否上报COMMUN_FA告L警。若存在,说明对端 单板可能正在复位。清除COMMUN_FA&警后,查看本告警是否清除。
电缆、光纤或光模块故障导致链路信号变差或中断。
处理步骤:
在网管上查询是否存在LTI告警或其它时钟相关告警,导致时钟没有同 步,缓冲区入与出速率不一致。 若存在, 优先清除LTI告警和时钟相关告
警后,查看本告警是否清除 在网管上查看CES业务两端网元参数配置是否一致, 例如“64K时隙”等。 若不一致,修改配置参数,使两端一致。
在网管上查询是否上报告警的单板或主控板是否存在HARD_BA或
COMMUN_FAIL警。若存在,更换上报告警的单板,查看告警是否消除。
4.
告警解释:HARD_BA为硬件故障告警。当单板检测到硬件出现异常且会影响 业务运行时,就会上报该告警。
产生原因:
外接电源失效。
单板与母板未良好接触。
单板硬件故障。
检查并确认电缆或光纤与接口良好连接。
7.
告警解释:CES_LOSPKT_EXC单位时间内CES业务的报文丢包数超过阈值告 警。当单板检测到一定周期内(10s),每秒平均帧丢失个数超出上限阈 值(缺省为100)时,即上报此告警。
产生原因:
时钟未同步。
CES业务两端网元参数配置不一致。
Tunnel或PW带宽配置过低,链路拥塞。
电源板故障,造成主控板电压异常。
主控板不在位或故障。
主控板的EXT接口直接连接HUB或者交换机。
处理步骤:
查看告警,明确与主控板通信失效的单板。在网管的“运行态”槽位视图 中查看该单板的工作状态是否为蓝色,若是,则该单板处于硬复位状态。 等待3至5分钟,该单板的工作状态转成绿色后,查看本告警是否清除。
在网管上查看业务所在Tunnel或PW的带宽配置是否过低。如果是,重新 为该Tunnel或PW配置较大的带宽,查看告警是否清除。
检查并确认电缆或光纤与接口良好连接。
8
告警解释:CESPW_REMOTE_LOSPCESPW远端丢包告警。当本端网元收到R比特置位为1的报文时,即上报该告警。
产生原因:
网络拥塞。
检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。
更换上报告警的处理板。若告警未消除,更换对端网元对应的处理板。
2
告警解释:MPLS_TUNNEL_LOC\Tunnel连通性丢失告警。连续3个周期内
没有收到希望的CV/FFD报文时出现此告警。
产生原因:
PW对端停止CV/FFD
物理链路故障。
5.
告警解释:ETH_LINK_DOW为网口连接故障告警。该告警表示以太网连接错误, 端口协商失败。
产生原因:
本端网元和对端网元的端口工作模式不一致,造成协商失败。
端口内环回。
纤缆连接到错误的端口。
单板故障。
处理步骤:
在网管上查看两端网元的以太网端口工作模式是否一致。 若不一致, 修改 设置,使两端的端口工作模式一致后,查看告警是否清除。
在网管上查看两端端口是否存在LOOP_AL告警,若存在,优化清除LOOP_AL告警后,查看本告警是否清除。
对照网元规划表, 查看上报告警的端口是否错插了纤缆, 造成两端端口工 作模式不一致。
在网管上查看两端网元的相关单板是否存在HARD_BA等硬件类告警。若 存在,更换存在硬件类告警的单板后,查看本告警是否清除。
6.
告警解释:CES_CEBOUND_PKT为OSES业务网络侧报文丢失告警。当网络侧
连续丢包超过设置的阈值上限或当连续3s以上没有收到报文,即上报此 告警。
产生原因:
业务承载层中断。
网络侧链路不稳定。
处理步骤:
在网管上查询是否存在ETH_LO、MP_DOV或NPW_DOV告警。若存在,优 先清除ETH_LOSMP_DOW或NPW_DOW告警后,查看本告警是否清除。
对照网元规划表,在网管上查看业务接口是否配置错误。如果是,重新
配置业务接口后,查看告警是否消除。
检查故障Tunnel的带宽是否已被完全占用。如果是,增大Tunnel带宽 配置或消除非法发送大数据量的根源。查看告警是否清除。
3.
告警解释:BD_STATU为物理单板离线告警。当用户在网管上配置了逻辑单
板而物理子架上却没有插入实际单板时就会上报此告警。
华为
告警解释:ETH_LO为以太网端口连接丢失告警。该告警表示以太网端口接
收不到以太网信号。
产生原因:
以太网端口的电缆或光纤没有连接好。
电缆或光纤故障。
本端网元接收光功率过低。
单板故障。
处理步骤:
检查以太网端口的电缆或光纤是否接好,插紧松脱的电缆或光纤。
检查电缆或光纤是否存在故障,更换故障的电缆或光纤。
若接口板上报HARD_BA告警,可能是对应的处理板出现故障。
处理步骤:
确保正常电源接入后,查看告警是否清除。
拔出故障单板,确认背板上的导针无异常。重新插入单板,使单板与母 板良好接触。
硬复位上报告警的单板,查看告警是否清除。若告警未消除,更换上报 告警的单板。
硬复位接口板对应的处理板,参看告警是否清除。
检查单板是否存在TR_LO(告警,指示单板收到的38M系统时钟故障。若 存在,优先清除TR_LO告警。检查单板是否存在POWER_ABNOR告AL,指示单板电压异常。若存在,优先清除POWER_ABNOR告AL检查单板 是否存在HARD_BA告警,指示单板硬件故障。若存在,硬复位单板后, 查看告警是否清除。若告警未清除,更换上报HARD_BA告警的单板,并