(完整word版)PTN传输常见告警

合集下载

传输常见告警分析及处理-文档资料

传输常见告警分析及处理-文档资料

GE/10GE PTN
PTN
MPLS
PTN
STM-1
PTN BSC
CoreN etwrok
STM-1
PTN
BSC
故障原因: (故故1障)障原断原纤因因;::(2)线路衰耗过大; (3)对端站发送部分故障,线路发送失效;
(1()接1收)到接的收信号失衰效减;过(大2);时钟(提2)取对模端块站故发障送;信号无帧结构; (3)本板接收方向故障
BTS 1 CES
10G/GE
PTN
GE/FE MPLS BTS 2 CES PTN
BTS 3 ETH
10G/GE PTN
PTN
MPLS
PTN
STM-1
PTN BSC
STM-1
PTN
BSC
故障原因: 故故(障1障)光原原纤因因断:;:(2)光模块坏;(3)光衰减过大;
M两A端C层工检作测模到式误不码一越致限,;造线成路协信商号失劣败化;;电光缆纤、性光能纤劣连化接;或光者口对不端洁设净备故障。
➢ 处理方法:
步骤1:查看对端的E1业务是否正常发送。若没有,恢复对端E1业务的正常发送。 步骤2:检查E1电缆是否存在脱落或松动。若存在,插紧脱落或松动的电缆,确保 电缆与端口良好接触。 步骤3:在DDF架处对告警通道做自环(硬件内环回)。优先排除对端设备的故障。 步骤4:若在DDF架处对告警通道做自环后告警未消失,在接口板处对告警通道做 自环(硬件内环回)。 若告警消失,说明E1电缆故障。更换E1电缆。 步骤5:若在接口板处对告警通道做自环后告警未消失,在网管上对告警通道进行 内环回设置。若告警消失,说明接口板故障,更换接口板。
(对1端)有E1告/T警1业;务未接入; (2)DDF架侧E1/T1接口输出端口脱落或松动; (3)本站E1/T1接 口输入端口脱落或松动; (4)单板故障; (5)电缆故障

传输常见告警列表(特选借鉴)

传输常见告警列表(特选借鉴)

目录附录B 告警、性能列表............................................................................................................. B-1B.1 常见告警列表 .................................................................................................................... B-1AU_AIS ............................................................................................................................. B-1 AU_LOP ........................................................................................................................... B-2 B1_EXC ............................................................................................................................ B-3 B2_EXC ............................................................................................................................ B-4 B3_EXC ............................................................................................................................ B-5 DOWN_E1_AIS ................................................................................................................ B-6 FAN_FAIL ......................................................................................................................... B-6 HP_LOM ........................................................................................................................... B-7 HP_RDI ............................................................................................................................ B-8 HP_REI ............................................................................................................................ B-9 HP_SLM ......................................................................................................................... B-10 HP_TIM .......................................................................................................................... B-11 HP_UNEQ ...................................................................................................................... B-12 LP_RDI ........................................................................................................................... B-12 LP_SLM .......................................................................................................................... B-13 LP_TIM ........................................................................................................................... B-13 LP_UNEQ ....................................................................................................................... B-14 LTI .................................................................................................................................. B-15 MS_AIS .......................................................................................................................... B-16 MS_RDI .......................................................................................................................... B-17 MS_REI .......................................................................................................................... B-18 POWER_FAIL ................................................................................................................ B-18 PS ................................................................................................................................... B-19 R_LOF ............................................................................................................................ B-20 R_LOS ............................................................................................................................ B-21 R_OOF ........................................................................................................................... B-22 SYNC_C_LOS ................................................................................................................ B-23 SYN_BAD ....................................................................................................................... B-24 TU_AIS ........................................................................................................................... B-25 TU_LOP ......................................................................................................................... B-26 T_ALOS .......................................................................................................................... B-27 T_DLOS ......................................................................................................................... B-28 UP_E1_AIS .................................................................................................................... B-29B.2 系统性能类别 .................................................................................................................. B-30附录B 告警、性能列表B.1 常见告警列表AU_AIS项目描述告警名称AU_AIS英文名称AU alarm indication中文名称AU告警指示告警级别主要告警分类通信告警告警原因(1)由MS_AIS、R_LOS、R_LOF告警引发的相应VC4通道的AU_AIS告警;(2)业务配置错误;(3)对端站发送AU_AIS;(4)对端站发送部分故障;(5)本站接收部分故障。

华为PTN告警处理规范

华为PTN告警处理规范

华为PTN告警处理规范1.ETH_LOS告警解释:ETH_LOS为以太网端口连接丢失告警。

该告警表示以太网端口接收不到以太网信号。

产生原因:以太网端口的电缆或光纤没有连接好。

电缆或光纤故障。

本端网元接收光功率过低。

单板故障。

处理步骤:检查以太网端口的电缆或光纤是否接好,插紧松脱的电缆或光纤。

检查电缆或光纤是否存在故障,更换故障的电缆或光纤。

检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。

更换上报告警的处理板。

若告警未消除,更换对端网元对应的处理板。

2.MPLS_TUNNEL_LOCV告警解释:MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。

连续3个周期内没有收到希望的CV/FFD报文时出现此告警。

产生原因:PW对端停止CV/FFD。

物理链路故障。

PW对端单板正在复位。

业务接口配置错误。

网络出现严重拥塞。

处理步骤:在网管上查看PW对端是否停止了CV/FFD。

在网管上检查该链路两端网元是否存在单板或光模块相关的告警。

若告警未清除,查看光纤或电缆是否故障,更换故障的光纤或电缆。

在网管上检查对端单板是否上报COMMUN_FAIL告警。

若存在,说明对端单板可能正在复位。

清除COMMUN_FAIL告警后,查看本告警是否清除。

对照网元规划表,在网管上查看业务接口是否配置错误。

如果是,重新配置业务接口后,查看告警是否消除。

检查故障Tunnel的带宽是否已被完全占用。

如果是,增大Tunnel带宽配置或消除非法发送大数据量的根源。

查看告警是否清除。

3. BD_STATUS告警解释:BD_STATUS为物理单板离线告警。

当用户在网管上配置了逻辑单板而物理子架上却没有插入实际单板时就会上报此告警。

产生原因:单板正在硬复位。

单板未插上,或单板插上,但与母板接触不良。

板间通讯故障。

处理步骤:在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若是,则该单板处于硬复位状态。

等待3至5分钟,该单板的工作状态转成绿色后,查看本告警是否消除。

华为PTN告警处理规范

华为PTN告警处理规范
检查单板是否存在TR_LO(告警,指示单板收到的38M系统时钟故障。若 存在,优先清除TR_LO告警。检查单板是否存在POWER_ABNOR告AL,指示单板电压异常。若存在,优先清除POWER_ABNOR告AL检查单板 是否存在HARD_BA告警,指示单板硬件故障。若存在,硬复位单板后, 查看告警是否清除。若告警未清除,更换上报HARD_BA告警的单板,并
对照网元规划表,在网管上查看业务接口是否配置错误。如果是,重新
配置业务接口后,查看告警是否消除。
检查故障Tunnel的带宽是否已被完全占用。如果是,增大Tunnel带宽 配置或消除非法发送大数据量的根源。查看告警是否清除。
3.
告警解释:BD_STATU为物理单板离线告警。当用户在网管上配置了逻辑单
板而物理子架上却没有插入实际单板时就会上报此告警。
在网管上查看两端端口是否存在LOOP_AL告警,若存在,优化清除LOOP_AL告警后,查看本告警是否清除。
对照网元规划表, 查看上报告警的端口是否错插了纤缆, 造成两端端口工 作模式不一致。
在网管上查看两端网元的相关单板是否存在HARD_BA等硬件类告警。若 存在,更换存在硬件类告警的单板后,查看本告警是否清除。
产生原因:
单板正在硬复位。
单板未插上,或单板插上,但与母板接触不良。
板间通讯故障。
处理步骤:
在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若 是,则该单板处于硬复位状态。等待3至5分钟,该单板的工作状态转 成绿色后,查看本告警是否消除。
检查相应槽位的单板是否插入。若未插入,请插入相应物理单板,告警 将自动清除。 检查单板与母板是否接触良好, 母板连接器的导针是否歪 斜。修正歪斜的导针,重新插拔单板使之与母板良好接触,告警将自动 清除。

PTN技术原理与常见故障处理方法

PTN技术原理与常见故障处理方法

需要进行数据恢复。
网络故障
网络故障通常涉及到网络连 接、路由、交换等方面的问 题。
04
2. 路由故障:路由配置错误 或路由协议异常,导致数据 包无法正确转发。
01 03
•·
02
1. 连接故障:设备间物理连 接断开,可能是线缆损坏或 端口接触不良。
04
PTN故障处理方法硬件故障处理源自010203
硬件故障诊断
更加智能化的PTN
通过与AI、机器学习等技术的结合, 实现PTN的智能化管理和控制,提高 网络的自动化和智能化水平。
THANKS
感谢观看
OAM管理
支持丰富的操作、管理和维护 (OAM)功能,提高网络的可靠性。
PTN网络架构
核心层
接入层
负责高速数据传输和大范围的业务调 度。
负责接入用户设备,实现业务的接入 和汇聚。
汇聚层
负责汇聚接入层流量,进行流量管理 和调度。
02
PTN设备介绍
硬件设备
01
硬件架构
PTN设备的硬件架构通常采用模块化设计,包括核心处理器、内存、存
建立故障处理机制与流程
1 2
制定故障处理流程
明确故障处理流程,包括故障报告、故障定位、 故障排除等步骤。
建立故障处理团队
组建专业的故障处理团队,负责故障的定位和排 除。
3
建立故障预防机制
通过定期维护、检查和更新等措施,预防故障的 发生。
06
PTN技术发展趋势与展望
5G网络中的PTN技术
5G网络对传输网络的需求
储、网络接口卡等模块,这些模块协同工作,实现PTN设备的各项功能。
02
性能指标
衡量PTN设备性能的主要指标包括吞吐量、延迟、丢包率等,这些指标

烽火-PTN设备常见告警解析)

烽火-PTN设备常见告警解析)
告警名称 LINK_LOS PK_LOS PTP_LOS CRC_ERR SCK_LOS IOP_LOW IOP_HIGH LASER_TCT 中文解释 连接信号丢失 丢包率过限 PTP同步丢失 CRC校验错 系统时钟丢失 输入光功率不足 输入光功率过载 激光器温度过限
XSJ2单盘告警原因及检查
名称:POWERALM
ESJ1单盘告警原因及检查
名称:PTP_LOS 中文解释:PTP同步丢失
原因:PTP同步丢失 。
检查方法:本地和对端PTP设置是否匹配。
ESJ1单盘告警原因及检查
名称:RX_ERR 中文解释:收坏包过限 原因:交换机接收到的坏包数超过了设定的门限值。 检查方法:检查网管界面上端口的收发包数和门限设置。
XSJ2单盘告警原因及检查
名称:LASER_OFF 中文解释:激光器软关断 原因:激光器被软关断 检查方法:检查网管配置是不是关掉了激光器
XSJ2单盘告警原因及检查
名称:TMC_LOC 中文解释:TMC连接确认信号丢失 原因:当某路TMC的CV帧使能打开,但是又没有从背板接收到TMC 的CV帧时,会有TMC_LOC告警产生 检查方法:
E1J1单盘告警原因及检查
名称:PPI_LOS 中文解释:PDH物理接口信号丢失 原因:E1信号没有正常接入 检查方法:
1、检查E1信号是否正常从端子板前面板接入; 2、读取本盘状态、性能,看是否正常。
E1J1单盘告警原因及检查
名称:LINK_LOS
中文解释:连接信号丢失 原因:系统口没有和交叉盘连接 检查方法:
盘不在位
E1J1单盘告警原因及检查
名称:POWERALM 中文解释:电源故障告警 原因:1.2V 1.5V 1.8V 2.5V 3.3V 5V任何一路检测到电源值不在设 定范围内就产生告警。 检查方法:

传输设备告警符号及含义

传输设备告警符号及含义

(1)检查交叉板或支路板配置是否正确,如配置错误修改并重新下发; (2)利用自环法,检查两端站母板是否有倒针,依次更换对应的支路板和交叉板的板位 。 可通过逐级自环的方法层层细化告警区段,定位出告警点。 (1)从网管上确认告警发生的板位和通道号; (2)将此通道在2M 接口板上进行自环,自环后如告警未结束,则检查接口板是否接触良 好,如接触良好则更换2M 支路板; (3)如果在接口板上自环后,此告警消失,则可以确定不是传输设备故障。在机房DDF 架上向传输设备方向做自环,确认是否是DDF 架到传输设备之间这段电缆的问题。自环后 如告警未结束,则肯定是配线架接头和从配线架到接口板的连接电缆有问题; (4)如在配线架进行自环后告警结束,则在DDF 架上向交换设备做自环,以确定是否是 DDF 到交换机或交换机本身的问题。 可通过逐级自环的方法层层细化告警区段,定位出告警点。 (1)从网管上确认告警发生的板位和通道号; (2)在2M 接口板上将有告警的通道进行自环,判断故障的位置; (3)更换故障单板和2M 电缆; (4)若是交换机的问题,请交换维护工程师解决。
R_LOS
(1)断纤; (2)线路衰耗过大或光功率过载; (3)对端站发送部分故障,线路发送失效; 接收线路侧信号丢失 (4)对端站交叉板故障或不在位; (5)对端站时钟板故障。 (1)接收信号衰减过大; (2)对端站发送信号无帧结构; (3)本板接收方向故障。 (1)接收信号衰减过大; (2)传输过程误码过大; (3)对端站发送部分故障; (4)本站接收方向故障。
TU_LOP
TU指针丢失
T_ALOS
(1)2M 业务未接入; (2)DDF 架侧2M 接口输出端口脱落或松 动; (3)本站2M 接口输入端口脱落或松动; 2M接口模拟信号丢失 (4)单板故障; (5)电缆故障; (6)交换机复位。 (1)2M 业务未接入; (2)DDF 架侧2M 接口输出端口脱落或松 动; 2M接口数字信号丢失 (3)本站2M 接口输入端口脱落或松动; (4)单板故障; (5)电缆故障。

(完整word版)PTN运行维护篇

(完整word版)PTN运行维护篇

PTN运行维护篇目录1.1网络故障处理基本思路和方法 (3)1.1.1PTN与MSTP告警对比 (3)1.1.2常见告警故障处理方法 (5)1.1.3以太网业务丢包类故障处理方法 (7)1.1.4OAM/PING调试法 (7)1.1.5环回逐段定位法 (10)1.2PTN网络例行监控 (11)1.1 网络故障处理基本思路和方法PTN的组网、业务配置愈发复杂,需分组厂商网管尽快做好SDH-Like功能。

为尽快恢复业务,将检测的故障点最小化,需了解SDH原理、IP网络原理知识、告警信号流及告警产生机理、PTN设备和网管基本操作、常用仪表的基本操作,了解网络拓扑,业务配置,设备运行状态。

✓告警、性能分析法✓OAM/PING调试法✓环回法PTN对于Tunnel的故障可用MPLS OAM来检测,MPLS OAM包括CV/FFD、Ping和Traceroute。

通过CV(Connectivity Verification)/FFD(Fast Failure Detection)检测可以检测LSP的连通性。

CV检测和FFD检测的过程基本一致,其不同在于CV检测发送CV报文的频率固定为1帧/s并且不可设置,而FFD检测发送FFD报文的频率是可以自行定义的。

MPLS Ping/Traceroute为用户提供了发现LSP错误、并及时定位失效节点的机制。

MPLS Ping/Traceroute使用MPLS Echo Request和MPLS Echo Reply检测LSP的可用性。

MPLS Echo Request中携带需要检测的FEC(Forwarding Equivalence Class)信息,和其他属于此FEC的报文一样沿LSP发送,从而实现对LSP的检测。

为了更好的理解PTN,我们就把PTN与熟悉的SDH的业务层面告警类比一下,与大家共享。

1.1.1 PTN与MSTP告警对比对应于业务模型,PTN的告警分为物理层、数据链路层、Tunnel层、PW层、仿真业务层五个层次。

PTN常见故障处理(阅读)

PTN常见故障处理(阅读)
Page 20
Tunnel常见故障处理方法(续)
原因3:Tunnel 所在的物理链路故障。 1. 查询系统中是否存在HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL 或 MP_DOWN 等告警,指示Tunnel 使用的物理链路故障。 2. 若存在,优先处理HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL 或 MP_DOWN 告警。 3. 查看并处理系统中存在的下列告警:MPLS_TUNNEL_BDI、 MPLS_TUNNEL_Excess、MPLS_TUNNEL_FDI、MPLS_TUNNEL_LOCV、 MPLS_TUNNEL_MISMATCH、MPLS_TUNNEL_MISMERGE、 MPLS_TUNNEL_SD、MPLS_TUNNEL_SF、MPLS_TUNNEL_UNKNOWN 4. 检查对端设备是否存在单板故障或网元复位等异常状况。排除对端设备的异 常情况。 原因4:保护倒换失败。 1. MPLS APS 保护倒换失败,参考保护故障处理。
常见原因
原因1:路由失败。 原因2:交叉创建失败。 原因3:Tunnel 所在的物理链路故障。 原因4:保护倒换失败。
Page 19
Tunnel常见故障处理方法
原因1:路由失败。 1. 对照网络规划,检查Tunnel 两端端口参数配置是否正确,例如端口IP。修正不正 确的端口参数后,再次创建Tunnel。 2. 检查Tunnel 首末节点所在的网元间是否存在完整可达的链路。若不存在,修复链 路中残缺或故障的部分。 3. 可选: 确认动态Tunnel 配置的“Route Constraint”条件和“Color”(亲和属性)是 否正确。修正不正确的参数信息,具体操作请参见使用路径方式创建动态MPLS Tunnel 和FRR 保护。 4. 可选: 如果Tunnel 配置了带宽,检查链路带宽是否满足Tunnel 的要求。 原因2:交叉创建失败。 1. 检查网络中是否存在不同的网元使用相同的网段。如果存在,需要修改端口IP地 址。 2. 检查Tunnel 是否配置了不兼容的保护特性。详细内容请参见《版本说明书》。 3. 查看Tunnel 所经过的网元或单板,确认已创建Tunnel 个数是否已经达到了最大值。 如果是,需要重新规划或删除冗余的Tunnel。

PTN重要告警类型

PTN重要告警类型

PTN重要告警类型1、BD_STATUS单板不在位。

2、CFCARD_FAILED对CF卡操作失败而产生的告警CF卡故障;主控故障。

3、CLK_LOCK_FAIL时钟同步失败。

或者上游站未配置时钟,可能产生两侧断纤引起4、COMMUN_FAIL当主控板和其他单板之间的通讯中断时就会上报此告警。

可能单板在处于复位状态。

5、CPU_BUSY当主控板检测到CPU占用率超过上门限时,即上报此告警。

6、DCNSIZE_OVER(PTN-3900)当网关网元的主控板检测到DCN子网内非网关网元的数量超过上限值时,即上报此告警。

7、ETH_APS_SWITCH_FAIL表示保护倒换失败告警。

当端口发送的APS(Automatic Protection Switching)帧中请求信号与收到的APS帧中桥接信号不一致并达到50ms时,表示倒换失败,上报该告警。

(tunnel层面工作和保护同时中断发生倒换失败)8、ETH_APS_TYPE_MISMATCHETH_APS_TYPE_MISMATCH为保护类型信息不一致告警。

收到的APS帧中的信息与本端配置的APS保护类型不一致时,即上报此告警。

例如:工作tunnel1和保护tunnel2配置为1:1双端保护,而保护组中工作tunnel1配置为恢复模式而保护tunnel2配置为非恢复模式。

9、FAN_FAIL为风扇故障告警。

当风扇故障时就会上报此告警。

10、LAG_DOWN聚合组不可用告警。

11、LASER_MOD_ERR告警表示单板上可插拔光模块与光口类型不匹配。

12、LTI告警表示时钟同步源丢失。

如果网元的所有同步源丢失,则上报此告警。

13、MEM_OVER为内存使用率过高告警。

当单板检测到内存使用率超过上门限时,即上报此告警。

单板配置了大量业务,并同时启动大量的告警监控和性能统计任务,导致内存使用率过高。

一般为设备软件未升级造成软件不兼容硬件。

14、NE_COMMU_GNE_SWITCH表示网元网关发生倒换,从主用网关倒换备用网关。

PTN常见故障及处理

PTN常见故障及处理

1、NE_NOT_LOGIN告警解释NE_NOT_LOGIN表示网元未登录对系统的影响无法从网元侧查询该告警的配置数据无法在网管上管理该网元可能原因原因1:网元与网管通讯中断解决网元与网管通讯中断方法,参见NE COMMU BREAK原因2:用户退出登陆或者登陆网元失败以其他正确的网元用户登陆网元查看告警是否结束,若未结束,请进行下一步如果故障依然存在,请联系华为工程师MPLS_TUNNEL_LOCV告警解释MPLS_TUNNEL_LOCV 为TUNNEL连通性丢失告警。

连续3个周期内没有收到希望的CV/FFD报文时出现此告警。

对系统的影响该告警产生时,会触发MPLS APS倒换,将业务倒换到保护TUNNELMPLS_TUNNEL_FDI告警将抑制MPLS_TUNNEL_LOCV告警的上报。

可能原因告警MPLS_TUNNEL_LOCV产生的可能原因如下:原因1:TUNNEL的INGRESS节点停止CV/FFD原因2:物理链路故障原因3:INGRESS节点的单板正在复位原因4:业务借口配置错误原因5;网络出现严重拥塞原因6:CPU占用饱和,无法处理ARP协议报文处理步骤:原因1:原因1:TUNNEL的INGRESS节点停止CV/FFD1、在网管上分别进入上报告警的TUNNEL的INGRESS节点和EGRESS节点的“网元管理器”,在功能树中选择“配置》MPLS 管理》单播TUNNEL管理”。

选择“OAM参数”选项卡。

2、查看两端的“检测方式”和“检测报文类型”参数是否一致如果两端的参数。

则。

不一致修改任一节点的参数配置使两端一致后,单击“应用”。

一致继续下一步3、查看INGRESS节点的“CV/FFD状态”参数如果是。

则。

停止右键单击该条TUNNEL,在弹出的菜单中单击‘启动CV/FFD”.查看告警是否清除启动排查下一原因原因2:物理链路故障1、在网管上查看EGRESS节点是否存在HARDBAD、ETH_LOS、或者ETH LINK DOWN告警,具体操作请参见在U2000上查询当前告警。

PTN告警处理情况

PTN告警处理情况

重要 紧急 紧急 紧急 重要 次要 重要
NE_DCN_MODE NE_NOT_LOGIN OUT_PWR_ABN OVERFLOW_MAX_CAPACITY PASSWORD_NEED_CHANGE PATCH_PKGERR POWER_ABNORMAL
重要
PROTECT_LOSS
重要 重要
PW_APS_DEGRADED PW_APS_OUTAGE
次要 紧急
GNE_CONNECT_FAIL HARD_BAD HARD_ERR
重要
IN_PWR_ABN
次要 重要 次要 重要 重要 重要 次要 次要 重要 次要 重要 重要 重要 重要 次要 次要 次要 重要 次要 次要 紧急 重要 次要 次要 紧急 重要 重要 重要 重要 重要 紧急
J0_MM LAG_DOWN LAG_MEMBER_DOWN LASER_MOD_ERR LDP_PEER_DOWN LFA LOCAL_FAULT LP_RDI_VC12 LSR_BCM_ALM LSR_NO_FITED LTI MAC_FCS_EXC MEM_OVER MPLS_PW_LOCK MPLS_PW_LOCV MPLS_PW_RDI MPLS_PW_UNEXPMEG MPLS_TUNNEL_AIS MPLS_TUNNEL_BDI MPLS_TUNNEL_LOCK MPLS_TUNNEL_LOCV MPLS_TUNNEL_MISMERGE MPLS_TUNNEL_OAMFAIL MPLS_TUNNEL_RDI MPLS_TUNNEL_UNEXPMEG MPLS_TUNNEL_UNEXPPER MPLS_TUNNEL_UNKNOWN MRING_OAM_LOCV_E MRING_OAM_LOCV_W NE_COMMU_BREAK NE_COMMU_GNE_SWITCH NE_COMMU_GNE_SWITCH

传输设备常见告警解释及处理建议

传输设备常见告警解释及处理建议

传输设备常见告警解释及处理建议LianLv一、 LOS 告警:信号丢失1、正常情况下两个网元之间要通信,中间的信号流必须是畅通的,如下图;2、从上图可以看书信号从MSC 发出2M 信号,经过SDH 设备复用后传递给下一个设备,最后末端SDH 设备解复用出2M 信号给另一端的MSC 。

也就是说,产生信号源的设备是发出信号的设备,当相邻的设备收不到对端发出的信号时就会上报LOS 告警,即信号丢失;A 、上图中由于SDH2发出的光信号SDH1收不到所以SDH1的收光口会上报LOS 告警;B 、上图中MSC2发出的2M 信号由于2M 线中断导致SDH2的2M接口收不到信号,所以SDH2的2M 接口会上报LOS 告警;C 、 上图是MSC1收不到信号的情况;说明:在通信标准中信号丢失的告警名都为LOS,但是不同厂家在编写网管软件时其有所不同,比如:华为公司传输设备,光口收不到信号上报告警为R-LOS ,支路口(2M 口)收不到信号时报T-ALOS;二、 LOF 告警:帧丢失1、当收到的信号功率太大或太小时都会上报OOF 告警;2、是指可以收到信号,但是检测不到信号的开始位置。

一般在波分和SDH 相连时,由于中继段线路中断,造成SDH 设备收到的信号为非调制光。

四、 AIS 告警:全1指示告警举例:SDH2收不到BTS 发来的2M 信号,SDH2会上报LOS 告警,并下插“1”码,当BSC1收到的2M 信号为全要“1”的时候就会上报AIS 告警。

这个故障我们日常维护中经常碰到,如果基站发送处理的2M 信号在中间传输环节中中断,BSC 的dip 端口都会上报AIS 告警。

五、 RDI 告警:远端告警指示举例:当BTS 收到的2M 信号在传输途中中断,但是BSC 可以收到BTS 发送的信号,那么BTS 就会发送AIS 信号给BSC ,当BSC 收到AIS 信号时就会上报RDI ,即远端告警指示说明故障点在BTS 端。

PTN常见网络故障现象

PTN常见网络故障现象

PTN常见网络故障现象
带内DCN
∙检查网管上有网元图标变灰色,网元脱管。

∙网管操作命令没有响应。

若响应中断时间持续超过2分钟,网管与网元通信中断。

∙网管查询信息部分丢失。

MPLS Tunnel
∙查询系统中是否存在HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL或MP_DOWN 等告警,指示Tunnel使用的物理链路故障。

若存在,优先处理这些告警。

∙查看并处理系统中存在的下列告警。

PW
∙检查PW首末节点间物理链路是否正常,系统中是否存在HARD_BAD、LASER_MOD_ERR、R_LOS或ETH_LOS等告警。

具体操作请参见在U2000上
查询当前告警。

∙若存在,优先处理HARD_BAD、LASER_MOD_ERR、R_LOS或ETH_LOS告警。

∙查询并处理系统中存在的PW_DOWN、PW_DROPPKT_EXC或PW_EXC_TRAFFIC 告警。

∙查看并处理系统中存在的下列告警。

以太网业务
能影响设备接入的其它业务。

线性MSP。

PTN常见网络故障现象

PTN常见网络故障现象

PTN常见网络故障现象
带内DCN
∙检查网管上有网元图标变灰色,网元脱管。

∙网管操作命令没有响应。

若响应中断时间持续超过2分钟,网管与网元通信中断。

∙网管查询信息部分丢失。

MPLS Tunnel
∙查询系统中是否存在HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL或MP_DOWN 等告警,指示Tunnel使用的物理链路故障。

若存在,优先处理这些告警。

∙查看并处理系统中存在的下列告警。

PW
∙检查PW首末节点间物理链路是否正常,系统中是否存在HARD_BAD、LASER_MOD_ERR、R_LOS或ETH_LOS等告警。

具体操作请参见在U2000上
查询当前告警。

∙若存在,优先处理HARD_BAD、LASER_MOD_ERR、R_LOS或ETH_LOS告警。

∙查询并处理系统中存在的PW_DOWN、PW_DROPPKT_EXC或PW_EXC_TRAFFIC 告警。

∙查看并处理系统中存在的下列告警。

以太网业务
能影响设备接入的其它业务。

线性MSP。

(完整word版)PTN传输常见告警

(完整word版)PTN传输常见告警

NE_NOT_LOGIN告警解释NE_NOT_LOGIN表示网元未登录。

告警属性告警参数无。

对系统的影响•无法从网元侧查询该网元的配置数据。

•无法在网管上管理该网元。

可能原因•原因1:网元与网管通讯中断。

•原因2:用户退出登录或登录失败。

处理步骤•原因1:网元与网管通讯中断。

解决网元与网管通讯中断方法,参见NE_COMMU_BREAK。

•原因2:用户退出登录或登录网元失败。

以其他正确的网元用户登录网元。

•查看告警是否结束,若未结束,请进行下一步。

•如果故障依然存在,请联系华为工程师。

MPLS_TUNNEL_LOCV告警解释MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。

连续3个周期内没有收到希望的CV/FFD报文时出现此告警。

告警属性告警参数在网管中浏览告警时,选中该告警,在“告警详细信息”中会显示该告警的相关参数。

告警参数的格式为“告警参数(16进制):参数1 参数2…参数n”,如:告警参数(16进制):0x01 0x08…。

每个参数的含义说明参见下表。

对系统的影响•该告警产生时,会触发MPLS APS倒换,将业务倒换到保护Tunnel。

•MPLS_TUNNEL_FDI告警将抑制MPLS_TUNNEL_LOCV告警的上报。

可能原因告警MPLS_TUNNEL_LOCV产生的可能原因如下:•原因1:Tunnel的Ingress节点停止CV/FFD。

•原因2:物理链路故障。

•原因3:Ingress节点的单板正在复位。

•原因4:业务接口配置错误。

•原因5:网络出现严重拥塞。

•原因6:CPU占用率饱和,无法处理ARP协议报文。

处理步骤•原因1:Tunnel的Ingress节点停止CV/FFD。

1.在网管上分别进入上报告警的Tunnel的Ingress节点和Egress节点的“网元管理器”,在功能树中选择“配置 > MPLS管理 >单播Tunnel管理”。

选择“OAM参数”选项卡。

PTN典型故障解决

PTN典型故障解决

目录目录目录 (1)典型故障及处理方法 (2)1.1 带内DCN故障处理 (2)1.2 MPLS Tunnel故障处理 (6)1.3 PW故障处理 (7)1.4 CES业务故障处理 (9)1.5 以太网业务故障处理 (13)1.6 时钟故障处理 (16)1.7 QoS故障处理 (17)1.8 LAG故障处理 (21)典型故障及处理方法1.1 带内DCN故障处理介绍带内DCN出现故障时的现象、对系统的影响、可能原因、排除该故障时需要的工具、注意事项以及处理步骤等。

A、前提条件:查看工程文档,确认网元各个单板均使用配套版本。

B、故障现象:处理带内DCN的故障时,通常会遇到以下故障现象。

✧网管与网元通信中断,网管上网元图标变灰色,网元脱管。

✧网管操作命令没有响应。

若响应中断时间持续超过2分钟,网管与网元通信中断。

✧网管查询信息部分丢失。

C、故障处理流程图:带内DCN故障处理流程图如下图所示。

图带内DCN故障处理流程图D、对系统的影响✧网元和网管通信中断后,通过该网元来保持与网管通信的网元,若无其它方法连接网管,也将处于脱管状态。

其它网元则无影响。

✧若承载带内DCN的物理通道故障,则会影响该物理通道上承载的其它业务。

E、可能原因:对应故障处理流程图,带内DCN故障原因如下✧全网内的网元ID、网元IP或者子网掩码存在冲突。

✧故障网元的带内DCN端口未使能,或对接端口参数配置不一致。

✧故障网元与网管之间的物理连接中断。

✧接收信号丢失或接收光功率过低,无法提取DCN报文。

✧单板故障。

✧DCN穿越的第三方网络不健康,引入DCN风暴或DCN中断。

✧带内DCN通道带宽配置过低。

✧故障网元主控板正在复位或发生了主备倒换,带内DCN报文得不到响应。

a)处理带内DCN故障时✧如果网元通信中断,先处理网关网元的故障,再处理非网关网元的故障。

✧如果网元通信未中断,先处理非网关网元的故障,再处理网关网元的故障,避免造成非网关网元脱管。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

NE_NOT_LOGIN告警解释NE_NOT_LOGIN表示网元未登录。

告警属性告警参数无。

对系统的影响•无法从网元侧查询该网元的配置数据。

•无法在网管上管理该网元。

可能原因•原因1:网元与网管通讯中断。

•原因2:用户退出登录或登录失败。

处理步骤•原因1:网元与网管通讯中断。

解决网元与网管通讯中断方法,参见NE_COMMU_BREAK。

•原因2:用户退出登录或登录网元失败。

以其他正确的网元用户登录网元。

•查看告警是否结束,若未结束,请进行下一步。

•如果故障依然存在,请联系华为工程师。

MPLS_TUNNEL_LOCV告警解释MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。

连续3个周期内没有收到希望的CV/FFD报文时出现此告警。

告警属性告警参数在网管中浏览告警时,选中该告警,在“告警详细信息”中会显示该告警的相关参数。

告警参数的格式为“告警参数(16进制):参数1 参数2…参数n”,如:告警参数(16进制):0x01 0x08…。

每个参数的含义说明参见下表。

对系统的影响•该告警产生时,会触发MPLS APS倒换,将业务倒换到保护Tunnel。

•MPLS_TUNNEL_FDI告警将抑制MPLS_TUNNEL_LOCV告警的上报。

可能原因告警MPLS_TUNNEL_LOCV产生的可能原因如下:•原因1:Tunnel的Ingress节点停止CV/FFD。

•原因2:物理链路故障。

•原因3:Ingress节点的单板正在复位。

•原因4:业务接口配置错误。

•原因5:网络出现严重拥塞。

•原因6:CPU占用率饱和,无法处理ARP协议报文。

处理步骤•原因1:Tunnel的Ingress节点停止CV/FFD。

1.在网管上分别进入上报告警的Tunnel的Ingress节点和Egress节点的“网元管理器”,在功能树中选择“配置 > MPLS管理 >单播Tunnel管理”。

选择“OAM参数”选项卡。

2.查看两端的“检测方式”和“检测报文类型”参数配置是否一致。

3.查看Ingress节点的“CV/FFD状态”参数。

•原因2:物理链路故障。

1.在网管上查看Egress节点是否存在HARD_BAD、ETH_LOS或ETH_LINK_DOWN告警,具体操作请参见在U2000上查询当前告警。

•原因3:Ingress节点的单板正在复位。

1.在网管上查看Ingress节点是否存在COMMUN_FAIL告警。

•原因4:接口配置错误。

1.对照网元规划表,查看Tunnel是否配置在正确的接口之上,例如查看下一跳IP地址。

•原因5:网络出现严重拥塞。

1.检查故障Tunnel的带宽是否已被完全占用。

2.可选:对于动态Tunnel,查看业务路由是否经过了带宽较低的物理链路。

•原因6:CPU占用率饱和,无法处理ARP协议报文。

1.在网管上查看是否存在CPU_BUSY告警。

2.如果存在,优先清除CPU_BUSY告警后,查看本告警是否清除。

ETH_LINK_DOWN告警解释ETH_LINK_DOWN为网口连接故障告警。

该告警表示以太网连接错误,端口协商失败。

告警属性告警参数无对系统的影响•在数据传输时,网口协商失败,无法接收数据,业务中断。

•ETH_LOS告警将抑制ETH_LINK_DOWN告警的上报。

•ETH_LINK_DOWN告警将抑制LAG_MEMBER_DOWN和MAC_FCS_EXC告警的上报。

可能原因告警ETH_LINK_DOWN产生的可能原因如下:•原因1:本端网元和对端网元的端口工作模式不一致,造成协商失败。

•原因2:端口内环回。

•原因3:纤缆连接到错误的端口。

•原因4:单板故障。

处理步骤•原因1:本端网元和对端网元的端口工作模式不一致,造成协商失败。

1.在网管上查看两端网元的以太网端口工作模式是否一致。

2.若不一致,修改设置,使两端的端口工作模式一致后,查看告警是否清除。

具体操作请参见查询和设置以太网接口工作模式。

•原因2:端口内环回。

1.在网管上查看两端端口是否存在LOOP_ALM告警,具体操作请参见在U2000上查询当前告警。

2.若存在,优化清除LOOP_ALM告警后,查看本告警是否清除。

•原因3:纤缆连接到错误的端口。

1.对照网元规划表,查看上报告警的端口是否错插了纤缆,造成两端端口工作模式不一致。

2.重新正确连接纤缆,清除告警。

•原因4:单板故障。

1.在网管上查看两端网元的相关单板是否存在HARD_BAD等硬件类告警。

2.若存在,更换存在硬件类告警的单板后,查看本告警是否清除。

具体操作请参见部件更换。

ETH_LOS告警解释ETH_LOS为以太网端口连接丢失告警。

该告警表示以太网端口接收不到以太网信号。

告警属性告警参数无对系统的影响•该告警产生时,以太网端口接收不到数据,业务中断。

•LSR_NO_FITED和LASER_MOD_ERR告警将抑制ETH_LOS告警的上报。

•ETH_LOS告警将抑制其它以太网业务的相关告警。

可能原因告警ETH_LOS产生的可能原因如下:•原因1:以太网端口的电缆或光纤没有连接好。

•原因2:电缆或光纤故障。

•可选:原因3:本端网元接收光功率过低。

•原因4:单板故障。

处理步骤•原因1:以太网端口的电缆或光纤没有连接好。

1.检查以太网端口的电缆或光纤是否接好,插紧松脱的电缆或光纤。

•原因2:电缆或光纤故障。

1.检查电缆或光纤是否存在故障,更换故障的电缆或光纤。

•可选:原因3:本端网元接收光功率过低。

1.在网管上查看对端网元是否存在OUT_PWR_ABN告警。

若存在,优先清除该告警后,查看本告警是否清除。

具体操作请参见在U2000上查询当前告警。

2.若告警未清除,清洁接收光口及光纤头表面。

具体操作请参见检查及清洁光纤连接器。

3.若告警仍未消除,检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。

正确使用法兰盘或光衰减器。

4.若告警仍未消除,通过增减光衰减器调整光功率至正常范围内。

•原因4:单板故障。

1.更换上报告警的处理板。

具体操作请参见部件更换。

2.若告警未消除,更换对端网元对应的处理板。

OUT_PWR_ABN告警解释OUT_PWR_ABN告警表示输出光功率异常。

告警属性告警参数无对系统的影响该告警产生时,业务的传输性能受到影响,严重时会造成业务的中断。

可能原因告警OUT_PWR_ABN产生的可能原因如下:•原因1:输出光功率过高或过低。

•原因2:单板故障。

处理步骤•原因1:输出光功率过高或过低。

1.更换上报告警的端口的光模块,查看告警是否清除。

具体操作请参见更换可插拔光模块。

•原因2:单板故障。

1.更换上报告警的单板,查看告警是否清除。

具体操作请参见部件更换。

SWDL_NEPKGCHECK告警解释SWDL_NEPKGCHECK告警表示包加载软件包中某个文件丢失或校验通不过且无法修复。

主机在软件包文件巡检时发现文件丢失或校验通不过时,会自动从其它区的完整软件包进行修复,如果无法修复即上报此告警。

告警属性告警参数无对系统的影响•该告警产生时,网元将不能完成包加载操作。

•若主机在软件包文件巡检时发现文件完整,没有丢失,告警将自动清除。

可能原因SWDL_NEPKGCHECK告警产生的原因如下:文件类型不匹配或丢失。

处理步骤•原因:文件类型不匹配或丢失。

1.检查文件类型是否匹配、文件是否有丢失,如存在不匹配或丢失,重新下载匹配的软件。

2.重新进行软件包加载,更新软件包,查看告警是否清除。

具体操作请参见《升级指导书》。

NE_COMMU_BREAK告警解释网元与网管通讯中断。

告警属性告警参数无。

对系统的影响无法在网管上管理该网元。

可能原因•原因1:该网元所属的网关网元无法与网管通讯,导致该网元通讯失败。

•原因2:该网元主控故障。

•原因3:该网元与网关网元之间的光纤故障。

•原因4:网络规模过大,导致网元间ECC通信的规模超过网元处理能力的极限。

处理步骤•原因1:该网元所属的网关网元无法与网管通讯,导致该网元通讯失败。

1.检查该网关网元是否上报GNE_CONNECT_FAIL告警,若上报该告警,请先结束该告警,参见GNE_CONNECT_FAIL的告警解决方法。

2.在网管上查看当前告警,检查该告警是否结束。

如果告警不能结束,继续下一步。

•原因2:该网元主控故障。

查看SCC单板面板上的指示灯,若指示灯显示异常,说明SCC单板故障。

具体指示灯对应的状态参见表1。

复位SCC单板,若无效,则更换SCC单板。

具体操作参见相应设备的《部件更换》“更换SCC单板”。

•原因3:该网元与网关网元之间的光纤故障。

用OTDR仪表测量光纤,通过分析仪表显示的线路衰减曲线判断是否断纤,并判断断纤大致的位置。

若线路出现断纤现象,则更换光纤。

说明:OTDR仪表的使用方法参见OTDR使用操作指导书。

•原因4:网络规模过大,导致网元间ECC通信的规模超过网元处理能力的极限。

说明:检查ECC路由规划是否合理,当网络规模超过100个网元,则必须对ECC网络进行划分,避免ECC通信负荷过重。

1.将网络规模过大的子网划分为若干个规模较小的子网。

说明:•按分层、分域的管理原则,将相邻网络划分为同一个子网。

•建议各子网内的网元数量小于或等于64个网元。

2.在各子网中选择适当的普通网元,并将其转换为网关网元。

说明:当子网中仍具有多个环路和链路时,将处于最多环路和链路的设备设置为网关网元,以避免大量的管理信息需要通过基于DCC这种窄带宽信道传送,从而减少DCN再次发生拥塞的可能性。

3.关闭冗余子网之间的ECC连接。

•关闭通过扩展ECC(自动/人工)实现的ECC子网之间的互通。

•关闭通过STM-N光/电口实现的ECC子网之间的互通。

•如果故障依然存在,请联系华为工程师。

参考信息MAC_FCS_SD告警解释MAC_FCS_SD为MAC层检测到误码劣化越限告警。

软件定时检测MAC芯片接收字节数和误码字节数,计算误码是否超过劣化门限,超过设置的门限即上报此报警。

告警属性告警参数无对系统的影响•该告警产生时,业务性能下降,甚至中断。

可能原因告警MAC_FCS_SD产生的可能原因如下:•原因1:线路信号劣化。

•可选:原因2:输入光功率不正常。

•可选:原因3:光纤头表面不清洁。

处理步骤•原因1:线路信号劣化。

1.在网管上查看是否存在LOOP_ALM告警。

若存在,优先清除LOOP_ALM告警后,查看本告警是否清除。

具体操作请参见在U2000上查询当前告警。

2.若告警未清除,在网管上检查是否存在DOS攻击等。

若存在,消除非法发送大量数据的根源,查看告警是否清除。

3.若告警仍未清除,查看光纤或电缆是否存在故障。

更换故障的光纤或电缆后,查看告警是否清除。

•可选:原因2:输入光功率不正常。

1.查看上报本告警的端口是否同时上报IN_PWR_ABN告警。

相关文档
最新文档