故障案例样例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
华为软交换端局(SERVER)与华为MGW的M3UA链路故障
作者:XXX 所属单位:XXXX 电话:XXXX
故障现象:
SZS11与MZM02的一半M3UA链路都故障。告警信息
M3UA链路故障
板类型=WBSG, 机架号=2, 框号=6, 槽号=14, 位置号=0, 模块号=145, M3UA链路名称=MZGM02-10(2), 本地IP地址1/IP地址2=10.125.30.10/10.125.30.138, 本地端口号=8102, 对端IP地址1/IP地址2=10.125.113.2/10.125.113.130, 对端端口号=7102, M3UA目的实体名称=MZGM02(2), 告警原因=SCTP偶联异常断链(原因码=48)
M3UA SCTP路径故障
板类型=WBSG, 机架号=2, 框号=6, 槽号=14,位置号=0, 模块号 = 145,链路名称=MZGM02-10(2),本地端口号=8102, 对端端口号=7102, 本地IP地址=10.125.30.138, 对端IP地址=10.125.113.130
板类型=WBSG, 机架号=2, 框号=6, 槽号=14,位置号=0, 模块号 = 145,链路名称=MZGM02-10(2),本地端口号=8102, 对端端口号=7102, 本地IP地址=10.125.30.10, 对端IP地址=10.125.113.2
原因分析:
流程图:
分析判断可能原因:
1、IP层故障所导致。
2、数据配置存在问题。
3、单板软硬件故障。
原因排查:
1、IP层故障分析
先分析M3UA的协议栈:M3UA
SCTP
IP
MZM02是下挂在SZS11下的,这个M3UA是SERVER与MGW之间的。从M3UA 链路故障告警上分析,原因码为48,是SCTP偶联异常断链,从协议栈上看,如
果IP层出现故障,那SCTP层肯定是故障了,先判断是否IP层故障所导致呢?
在MGW上进行PING包操作,华为MGW的本地维护终端提供了命令行和图形操作界面的PING包操作,本案例通过图像操作来进行PING包操作。
在MGW本地维护终端的左下角点击维护,如下图:
在跟踪管理中选择PING接口跟踪:
在下图中机框号、槽位号、板位置是源IP地址所对应的MPU单板。可以通过如下方法检查到MPU所在位置:
+++ HUAWEI UMG8900 2010-05-21 11:33:31
O&M #20
%%LST IPADDR: BT=MPU;%%
RETCODE = 0 执行成功
IP地址配置信息
--------------
IP地址板类型板组号槽位号接口类型接口编号 IP 地址掩码主从标志域标识是否属于VLAN VLAN标识目的IP地址
10.125.113.2 MPU 1 NULL ETH 0 255.255.255.252 主 0 否 NULL NULL
10.125.113.130 MPU 2 NULL ETH 0 255.255.255.252 主 0 否 NULL NULL (结果个数 = 2)
IP地址配置信息续1
-----------------
IP地址检测间隔检测阈值是否是环回IP 是否配置
MPLS MPLS0 MPLS1 MPLS2 MPLS3 IP地址描述
10.125.113.2 NULL NULL 否否
NULL NULL NULL NULL NULL
10.125.113.130 NULL NULL 否否
NULL NULL NULL NULL NULL
(结果个数 = 2)
%%LST BRD: LM=BTBN, BT=MPU, BN=2;%%
RETCODE = 0 执行成功
槽位记录表
----------
机框号 = 2
槽位号 = 7
板位置 = 前插
板类型 = MPU
硬件类型 = MMPU
板组号 = 2
备份状态 = 1+1 备份
主备状态 = 主用
管理状态 = NULL
CPU忙门限 = 90
CPU正常门限 = 80
内存过载阈值 = 90
安装状态 = 安装
操作状态 = 正常
机框号 = 2
槽位号 = 8
板位置 = 前插
板类型 = MPU
硬件类型 = MMPU
板组号 = 2
备份状态 = 1+1 备份
主备状态 = 备用
管理状态 = NULL
CPU忙门限 = 90
CPU正常门限 = 80
内存过载阈值 = 90
安装状态 = 安装
操作状态 = 正常
(结果个数 = 2)
--- END
--- END
在上述指令查询中,可以查到IP地址为10.125.113.130所对应的MPU为板组号是2,其框号是2、槽号是7,前插单板。在点击PING接口跟踪的窗口中输
入相关信息。
结果是可以正常PING通的
证明了IP层状态是正常的。
2、数据配置问题分析:
对M3UA链路配置数据进行检查,SERVER和MGW两端核对配置,对于M3UA 链路,分别有服务端和客户端的配置,其中MGW应该配置为服务器端,SERVER
为客户端,检查数据发现不存在问题。对M3UA链路进行重新删除重定义并在SERVER侧进行激活操作,激活后M3UA链路仍然为故障状态,IP层状态是正常,数据配置也正常。
检查M3LNK配置:
LST M3LNK:;(分别在SERVER和MGW上检查),主要看双方配置IP地址和端口。
SERVER侧:
%%LST M3LNK: LNKNM="MZGM02-10", LTP=LOCAL;%%
RETCODE = 0 操作成功
M3UA链路表
----------
链路名称 = MZGM02-10
WBSG模块号 = 145
链路集名称 = MZGM02
本地IP地址1 = 10.125.30.10
本地IP地址2 = 10.125.30.138
本地端口号 = 8102
对端IP地址1 = 10.125.113.2
对端IP地址2 = 10.125.113.130
对端端口号 = 7102
客户端/服务器端模式 = 客户端
主/备用标志 = 初始主用
优先级 = 0
SCTP偶联最大接收流数 = 17
SCTP偶联最大发送流数 = 17
拥塞开始阈值 = 80
拥塞结束阈值 = 40
RTO最小值 = 500