数通故障案例学习

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

接口速率不同导致接口无法对接
网络环境
NE80E/40E上某光接口单板，需要与对端设备的100M接口对接。

该单板光接口默认速率是1000M。

故障分析
1.在接口视图下执行命令speed 100，出现错误提示信息。

不能将端口
速率改成100M，因此无法与对端设备对接。

[Quidway-GigabitEthernet1/0/0] speed 100
Setting the config fail
Current interface can't support this command
2.执行命令display logbuffer检查路由器的LOG，发现了该GE接口
频繁的出现口Up/Down信息。

操作步骤
步骤1在该接口下执行命令port-type fiber-100,将端口速率改为100M。

步骤2在该接口下配置与对端接口在同一网段的IP地址，能够Ping通，故障解决。

----结束
案例总结
无论什么端口对接需先保证端口速率一致。

如果遇到不能识别的SFP模块，可以使用port-type命令将接口设置为对
应的模式，强制接口在该模式下工作。

Eth-Trunk接口加入到VLAN失败
网络环境
在一台NE40上配置三层Eth-Trunk没有问题，但是在该设备上配置二层
Eth-Trunk加入VLAN时却不成功。

故障分析
步骤1在路由器上配置三层Eth-Trunk没有问题，说明Eth-Trunk的配置也不存在问题。

步骤2配置二层Eth-Trunk加入VLAN时出现错误提示：
[Quidway-Eth-Trunk2] port default vlan 200
Routed VLAN should not have aggregation port
根据提示信息，判断可能是VLAN下配置有问题。

步骤3在路由器上的VLAN视图下执行display this命令，检查VLAN的配置，发现VLAN下没有相关的冲突配置。

[Quidway-vlan200] display this
#
return
步骤4考虑是否是VLANIF接口下的配置导致冲突。

在VLANIF接口视图下执行display this命令，检查VLANIF接口的配置，发现接口下配置了路
由属性。

[Quidway-Vlanif200] display this
#
interface Vlanif200
undo shutdown
property routing
#
return
----结束
处理步骤
在NE40上执行以下操作。

步骤1执行命令system-view，进入系统视图。

步骤2执行命令interface vlanif 200，进入VLANIF接口视图。

步骤3执行命令undo property routing，取消VLAN接口的路由属性。

步骤4执行命令port default vlan 200，配置Eth-Trunk加入VLAN。

步骤5执行命令return退回到用户视图，执行命令save，保存对配置的修改。

----结束
案例总结
在二层Eth-Trunk接口加入VLAN时不要在VLANIF接口下配置property
routing命令。

property routing命令用于配置VLAN接口的路由属性为routing，配置
property routing
采用Eth-Trunk接入，一部分分散用户无法正常访问网络(NE80/40)
网络环境
如图4-2所示，用户使用PPPoE方式拨号上网。

路由器使用Eth-Trunk方
式，将用户的拨号报文送至认证服务器。

图4-1 Eth-Trunk接入组网图
一段时间后，有一部分用户无法正常拨号上网，这部分用户分布很广，
并不是集中在一个地方。

故障分析
步骤1检查出现故障的用户MAC地址，出现故障的用户MAC地址比较分散，没有明显共同特性，排除在路由器或认证服务器上分别对这些用户
进行限制的可能。

步骤2重新安装其中一个用户的客户端，仍然不能正常拨号。

排除客户端故障的可能。

步骤3从用户到认证服务器，执行命令ping，逐条检查每段链路的连通性。

发现从Router到认证服务器的链路上有丢包现象。

步骤4执行命令display interface，发现Eth-Trunk的一条成员链路虽然物理层和链路层状态为Up，但是不能正常转发数据。

Eth-Trunk的成员链路通过Hash算法来分担流量，一个MAC地址按照固
定的Hash算法，会分配到固定的一条链路上。

因此造成分配到同一条故
障链路的用户均无法正常拨号。

----结束
处理步骤
步骤1在故障链路的接口上执行命令shutdown，关闭该故障链路，使
Eth-Trunk能够感知到链路故障。

步骤2更换Router和认证服务器之间的故障链路。

完成后，用户可以正常拨号，故障解决。

----结束
案例总结
在排查Eth-Trunk的故障原因时，应充分考虑到成员链路负载分担的算法
特征。

配置顺序不正确导致Eth-Trunk接口无法配置default-vlan 网络环境
图4-1 Eth-Trunk典型组网图
NE40A配置Eth-Trunk后无法指定该接口的default VLAN，并有如下提
示：
[Quidway-Eth-Trunk2] port default vlan 201
Routed VLAN should not have aggregation port
故障分析
Eth-Trunk接口无法配置default-vlan有如下可能的原因：
●Eth-trunk没有配置成二层特性，即没有在Eth-trunk接口下面执行
portswitch命令。

●NE40A上面没有配置相应的VLAN。

进一步进行分析：
步骤1执行命令display current-configuration，查看NE40A已经配置为二层特性并已经加入到VLAN中。

如下所示：
#
vlan batch 200 to 202
#
interface Eth-Trunk2
undo shutdown
portswitch
#
interface GigabitEthernet1/0/0
undo shutdown
eth-trunk 2
#
interface GigabitEthernet1/0/1
undo shutdown
eth-trunk 2
步骤2进一步查看日志发现原来设备上面曾经配置过VLAN201接口，而且VLANIF201下面配置了property routing参数
具体见如下日志：
%May 11 14:50:47 2007 Quidway SHELL/5/CMD:task:vt0 ip:210.21.6.253
user:panrunkeng command:int vlan 201
%May 11 14:51:17 2007 Quidway SHELL/5/CMD:task:vt0 ip:210.21.6.253
user:panrunkeng command:pro routing
%May 13 03:06:14 2007 Quidway SHELL/5/CMD:task:vt0 ip:210.21.6.253
user:liuweizhang command:undo interface vlanif 201
在删除VLANIF201之前没有删除接口下面的property routing参数导致
VLAN201的property routing属性没有删除，即使新建VLAN201后该
属性依然存在。

该属性存在导致Eth-Trunk无法加入到VLAN中。

----结束
处理步骤
在NE40上执行如下的操作。

步骤1执行命令system-view，进入系统视图。

步骤2执行命令vlan vlan-id，进入VLAN视图。

步骤3执行命令undo property routing，去使能路由属性。

步骤4执行命令return，返回到用户视图。

步骤5执行命令save，保存对配置的修改。

----结束
完成上述操作后，在Eth-Trunk视图下，执行命令port default vlan 201，
可以把Eth-Trunk接口加入到VLAN中。

案例总结
如果在VLANIF接口下面配置了property routing参数的情况下，在删除
这个VLANIF接口时，需要先删除VLANIF接口下面的property routing
参数，然后再删除VLANIF接口。

NE40端口自保护机制明确，当端口在时间段内没有收到数据业务报文，端口会自动的执行up/down的操作。

步骤1执行命令interface ethernet interface-number，进入接口视图。

步骤2执行命令port-self-protect disable，去使能端口自保护功能。

没有使用ARP广播功能导致dot1q终结子接口下挂业务不通
网络环境
图4-1 dot1q终结子接口下挂业务组网图
RouterA通过Eth-Trunk和SwitchA对接，RouterA的Eth-Trunk子接口配
置dot1q终结子接口作为SwitchB下挂PC的网关；在RouterA上先
shutdown RouterA和SwitchA的互连接口，然后und shutdown后发现在
RouterA上PING不通PC。

故障分析
步骤1检查中间SwitchA和SwitchB，没有发现异常。

步骤2执行命令display arp all，发现RouterA没有PC的ARP表项。

RouterA没有学习到PC的ARP表项造成RouterA无法PING通PC。

----结束
处理步骤
在RouterA上执行以下的操作。

步骤1执行命令system-view，进入系统视图。

步骤2执行命令arp broadcast enable，使能终结子接口的ARP广播功能。

步骤3执行命令quit，返回到用户视图。

步骤4执行命令save，保存对配置的修改。

----结束
完成上述操作后，RouterA的ARP表项中有PC的表项。

RouterA可以PING
通PC。

案例总结
arp broadcast enable命令是为了避免大量发送ARP请求报文而影响系统
工作而设计的一条命令，dot1q终结子接口缺省情况不使能该命令。

在端
口上使用了该命令之后可以主动从该端口发送ARP请求报文，去请求对
端的ARP，如果在该端口没有使能此命令，则无法主动发送ARP请求报
文出来，包括主动PING以及ARP-MISS，都不会发送ARP请求报文出
来，并且该端口在协议up之后会打上黑洞路由的标记。

BRAS下的用户可拨号，但打不开网页
网络环境
MA5200F通过155MPOS口与NE40路由器RouterA相连，MA5200F下
接拨号上网用户。

如图5-5所示。

图5-1 BRAS下的用户故障组网图
故障现象为：MA5200F下的拨号用户可以正常拨号，但打不开网页。

故障分析
步骤1从MA5200F的拨号用户进行拨号上网，从用户计算机上ping外网的网站可以ping通，排除上层设备路由问题。

步骤2检查MA5200F和NE40的配置，发现没有配置ACL对报文进行过滤，排除设备配置的问题。

步骤3检查NE40和MA5200F的POS接口状态，发现NE40的POS口的MTU为1024，而MA5200F的POS口的MTU为1500字节，两端不匹配。

步骤4在NE40的POS口上进行本地环回，同时把POS口的MTU值改为1500，插上光纤后，发现NE40的POS的MTU值自动更改为1024。

据
此可以判断是POS口SPF模块故障。

----结束
处理步骤
步骤1取消NE40的POS口上的本地环回。

步骤2更换NE40的POS口的SPF模块。

步骤3检查NE40的POS口的状态，等到接口状态Up。

步骤4从MA5200F的拨号用户登录到外网的网站，可打开网页，故障得以排除。

----结束
案例总结
本次故障现象，ping网站可以ping通，ping大包，小包都没有丢包。

此
时，需要检查有没有配置ACL限制报文，和接口的MTU值是否两端一
致。

CPOS接口的PPP协商正常结束后，无法ping通对端
网络环境
路由器与其他厂商设备通过CPOS接口互连，CPOS接口通道化为E1，
链路层采用PPP协议。

在PPP协商正常结束后，不能正常ping通直连地
址或访问对端设备连接的网络。

故障分析
步骤1使用测试仪器检查链路，排除物理接口和链路故障。

步骤2使用display current-configuration interface serial和display
current-configuration controller cpos命令，检查本端设备，发现其配置
正确而且与对端匹配。

步骤3使用display interface serial命令，结果如下：
<Quidway> display interface serial 3/0/0/8:0
Serial3/0/0/8:0 current state: up
Line protocol current state: up
AU-4 1, TUG-3 2, TUG-2 3, E1 1, ChannelGroup 0, Channel ID 1
Description: "rt-bb-ura1-01 -> cl-rt-ura-uniube-01 (0497509-URA)
Link-2"
Internet address is 201.16.248.18/30
The configured MTU is 1500 bytes, and the negotiated MTU is 0 bytes
TimeSlotList include 1-8,the BandWidth is 512 Kbits
The Max HQOS BandWidth is 448 Kbits
Link-protocol is PPP, loopback not set, clock source master, urpf
disabled
MRU: 1500 bytes, Negotiate Timeout set 3 seconds
Peer MRU: not negotiate, Magic number: 50342202
Peer IP address is 201.16.248.17/32
LCP: Opened
NCP: IPCP Opened, MPLSCP Stopped
Input: 94 Lcps, 0 Ipcps, 0 Ip6cps, 0 Mplscps, 0 Osicps, 0 Invalids
Output:52 Lcps, 0 Ipcps, 0 Ip6cps, 42 Mplscps, 0 Osicps, 0 Invalids Hold time is 10 (sec)
Input: 52 Timerhold Packets
Output:52 Timerhold Packets
Last 5 minutes input rate 36 bytes/sec, 0 packets/sec
Last 5 minutes output rate 11 bytes/sec, 0 packets/sec
Input: 376 packets, 19566 bytes
0 errors, 0 CRC, 0 giants
Output:161 packets, 6068 bytes, 0 underruns
0 CRC, 0 aborted sequences, 0 giants
接口协商的MTU值为0。

初步断定可能是此MTU协商不成功导致的故障。

步骤4使用display current-configuration命令，没有发现配置安全策略而过滤流量。

步骤5进一步了解，发现其他厂商设备在MTU值为1500字节的情况下，不进行MTU协商。

此时，其他厂商设备既不发送MTU协商报文，也拒绝接收对端设备发送
的协商报文。

而路由器在任何情况下都会进行MTU协商，协商的初始值
是0，每次协商以上一次的协商结果为基础，如果协商失败则保持上次协
商结果。

因此，当两端MTU都是1500字节时，路由器发送协商报文给其他厂商
设备后被拒绝，同时也收不到其他厂商设备的协商报文，这样路由器得
到的协商结果就是0，而其他厂商设备则保持自己的1500字节。

路由器在MTU是0的情况下不会转发数据，从而直连不通。

处理步骤
在路由器上执行以下操作：
步骤1执行命令system-view，进入系统视图。

步骤2执行命令interface serial interface-number，进入同步串口视图。

步骤3执行命令mtu 1400，配置同步串口的MTU值。

将MTU值修改为1400字节。

同时，在对端也将MTU值修改为1400字节。

步骤4执行命令shutdown，关闭同步串口。

步骤5执行命令undo shutdown，启用同步串口。

完成后，两端协商的MTU值为1400字节，可以ping通对端，故障解决。

----结束
案例总结
在和其他厂商设备进行互通时，应注意分析路由器和其他厂商设备在一
些协议上的不同实现方式。

光接口发光太强导致NE40的POS接口物理UP协议Down 网络环境
NE80和NE40通过传输设备以POS接口互连。

NE40侧POS接口的状态
为物理UP协议Down。

故障分析
推测有以下几个原因：
两端的C2字节不匹配。

●传输链路不好。

●POS接口模块有问题。

操作步骤
步骤1检查配置确认两端接口参数配置无误。

步骤2通过在设备上面打环测试，接口物理状态能够UP，能够检测到环路，确认单板的芯片没有问题。

步骤3通过尾纤打环，接口物理状态能够UP，能够检测到环路，确认光接口模块没有问题。

步骤4在传输上面向NE40侧打环测试，发现接口无法收到环路，所以怀疑是传输链路问题。

步骤5传输人员检查传输后确认从NE40侧发出的光强度太大，导致传输设备接口故障。

步骤6在NE40与传输设备之间增加光衰后，接口物理及协议状态均变为UP，问题解决。

----结束
案例总结
在处理光接口故障的问题时，应该注意光接口的过载光功率、接收灵敏
度等一些参数是否满足要求。

两对PPP接口的尾纤交叉，导致OSPF邻居无法建立
网络环境
网络拓扑为NE80路由器RouterA通过两个155M的POS链路连接到友
商的路由器，接口之间启用OSPF。

如图5-9所示。

图5-1 两对PPP接口的尾纤交叉组网图
故障现象是链路上没有任何流量，检查OSPF的邻居状态，发现一直停留
在Init状态，如下：
Area 0.0.0.10 interface 10.31.242.17 neighbor(s)
RouterID: 1.1.1.1 Address: 10.31.242.18
State: init Mode: Nbr is Slave Priority: 1
DR: 10.31.242.18 BDR: 10.31.242.17
Dead timer expires in 35s
Neighbor comes up for 122d5h
但是在NE80上能够ping通对端的IP地址。

故障分析
步骤1检查链路两端路由器上的OSPF的配置参数，发现两端的配置是一致，确定不是参数配置错误。

步骤2检查NE80和友商路由器配置的接口的OSPF MTU值也都是1526字节。

步骤3检查友商路由器的POS1/0的IP地址为10.31.242.17/30，与其互连的NE80的POS1/0/0的IP地址分别为10.31.242.21/30，友商路由器的POS1/2
的IP地址为10.31.242.22/30，与其互连的NE80的POS2/0/0的IP地址为
10.31.242.18/30，由此判断是两对尾纤插错。

----结束
处理步骤
步骤1互换NE80的两个POS接口的尾纤。

步骤2检查OSPF邻居状态，发现OSPF邻居的状态的已达到Full，故障得到排除。

----结束
案例总结
PPP协议在协商时不会检查对端的IP地址，由于是点对点协议，即使互
连接口的IP地址不是同一个网段，依然能够ping通对端的IP地址，所
以在配置PPP链路时要注意IP地址或链路交叉等问题。

两台路由器下的同一网段的PC不能互相访问
网络环境
如图6-10所示，PC1和PC2属于同一网段，并通过RouterA和RouterB
相连。

RouterA和RouterB上有到对方网段的静态路由。

图6-1 同网段PC互访组网图
配置完成后，发现PC1 ping不通PC2。

故障分析
在PC1上执行命令arp –a，查看所有ARP表项，发现没有PC2的IP地
址与MAC地址的映射。

说明执行ping命令时，ARP表项并没有自动学
习到。

这是因为RouterA接收到PC1的ARP请求报文后，发现请求报文的目标
IP地址不是本地接口的IP地址，因此将ARP请求报文丢弃。

处理步骤
在RouterA和RouterB上分别执行以下操作。

步骤1执行命令system-view，进入系统视图。

步骤2执行命令interface interface-type interface-number，进入路由器与PC 相连的接口的接口视图。

步骤3执行命令arp-proxy enable，使能接口的Proxy ARP功能。

步骤4在PC1上ping对端PC2的IP地址，即在PC1上执行命令ping
192.168.2.2，然后在PC1上执行命令arp –a，发现PC2的IP地址对应的
MAC地址为RouterA与PC1相连的接口的MAC地址。

----结束
完成上述操作后，在PC1上ping对端PC2，可以ping通，故障排除。

案例总结
中间使用路由器分隔的两台属于同一网段的PC互相访问时，必须在路由
器与PC相连的接口上使能Proxy ARP功能。

否则，即使两台PC属于同
一网段，也不能互相访问。