数通故障案例学习
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
接口速率不同导致接口无法对接
网络环境
NE80E/40E上某光接口单板,需要与对端设备的100M接口对接。
该单板光接口默认速率是1000M。
故障分析
1.在接口视图下执行命令speed 100,出现错误提示信息。
不能将端口
速率改成100M,因此无法与对端设备对接。
[Quidway-GigabitEthernet1/0/0] speed 100
Setting the config fail
Current interface can't support this command
2.执行命令display logbuffer检查路由器的LOG,发现了该GE接口
频繁的出现口Up/Down信息。
操作步骤
步骤1在该接口下执行命令port-type fiber-100,将端口速率改为100M。
步骤2在该接口下配置与对端接口在同一网段的IP地址,能够Ping通,故障解决。
----结束
案例总结
无论什么端口对接需先保证端口速率一致。
如果遇到不能识别的SFP模块,可以使用port-type命令将接口设置为对
应的模式,强制接口在该模式下工作。
Eth-Trunk接口加入到VLAN失败
网络环境
在一台NE40上配置三层Eth-Trunk没有问题,但是在该设备上配置二层
Eth-Trunk加入VLAN时却不成功。
故障分析
步骤1在路由器上配置三层Eth-Trunk没有问题,说明Eth-Trunk的配置也不存在问题。
步骤2配置二层Eth-Trunk加入VLAN时出现错误提示:
[Quidway-Eth-Trunk2] port default vlan 200
Routed VLAN should not have aggregation port
根据提示信息,判断可能是VLAN下配置有问题。
步骤3在路由器上的VLAN视图下执行display this命令,检查VLAN的配置,发现VLAN下没有相关的冲突配置。
[Quidway-vlan200] display this
#
return
步骤4考虑是否是VLANIF接口下的配置导致冲突。
在VLANIF接口视图下执行display this命令,检查VLANIF接口的配置,发现接口下配置了路
由属性。
[Quidway-Vlanif200] display this
#
interface Vlanif200
undo shutdown
property routing
#
return
----结束
处理步骤
在NE40上执行以下操作。
步骤1执行命令system-view,进入系统视图。
步骤2执行命令interface vlanif 200,进入VLANIF接口视图。
步骤3执行命令undo property routing,取消VLAN接口的路由属性。
步骤4执行命令port default vlan 200,配置Eth-Trunk加入VLAN。
步骤5执行命令return退回到用户视图,执行命令save,保存对配置的修改。
----结束
案例总结
在二层Eth-Trunk接口加入VLAN时不要在VLANIF接口下配置property
routing命令。
property routing命令用于配置VLAN接口的路由属性为routing,配置
property routing
采用Eth-Trunk接入,一部分分散用户无法正常访问网络(NE80/40)
网络环境
如图4-2所示,用户使用PPPoE方式拨号上网。
路由器使用Eth-Trunk方
式,将用户的拨号报文送至认证服务器。
图4-1 Eth-Trunk接入组网图
一段时间后,有一部分用户无法正常拨号上网,这部分用户分布很广,
并不是集中在一个地方。
故障分析
步骤1检查出现故障的用户MAC地址,出现故障的用户MAC地址比较分散,没有明显共同特性,排除在路由器或认证服务器上分别对这些用户
进行限制的可能。
步骤2重新安装其中一个用户的客户端,仍然不能正常拨号。
排除客户端故障的可能。
步骤3从用户到认证服务器,执行命令ping,逐条检查每段链路的连通性。
发现从Router到认证服务器的链路上有丢包现象。
步骤4执行命令display interface,发现Eth-Trunk的一条成员链路虽然物理层和链路层状态为Up,但是不能正常转发数据。
Eth-Trunk的成员链路通过Hash算法来分担流量,一个MAC地址按照固
定的Hash算法,会分配到固定的一条链路上。
因此造成分配到同一条故
障链路的用户均无法正常拨号。
----结束
处理步骤
步骤1在故障链路的接口上执行命令shutdown,关闭该故障链路,使
Eth-Trunk能够感知到链路故障。
步骤2更换Router和认证服务器之间的故障链路。
完成后,用户可以正常拨号,故障解决。
----结束
案例总结
在排查Eth-Trunk的故障原因时,应充分考虑到成员链路负载分担的算法
特征。
配置顺序不正确导致Eth-Trunk接口无法配置default-vlan 网络环境
图4-1 Eth-Trunk典型组网图
NE40A配置Eth-Trunk后无法指定该接口的default VLAN,并有如下提
示:
[Quidway-Eth-Trunk2] port default vlan 201
Routed VLAN should not have aggregation port
故障分析
Eth-Trunk接口无法配置default-vlan有如下可能的原因:
●Eth-trunk没有配置成二层特性,即没有在Eth-trunk接口下面执行
portswitch命令。
●NE40A上面没有配置相应的VLAN。
进一步进行分析:
步骤1执行命令display current-configuration,查看NE40A已经配置为二层特性并已经加入到VLAN中。
如下所示:
#
vlan batch 200 to 202
#
interface Eth-Trunk2
undo shutdown
portswitch
#
interface GigabitEthernet1/0/0
undo shutdown
eth-trunk 2
#
interface GigabitEthernet1/0/1
undo shutdown
eth-trunk 2
步骤2进一步查看日志发现原来设备上面曾经配置过VLAN201接口,而且VLANIF201下面配置了property routing参数
具体见如下日志:
%May 11 14:50:47 2007 Quidway SHELL/5/CMD:task:vt0 ip:210.21.6.253
user:panrunkeng command:int vlan 201
%May 11 14:51:17 2007 Quidway SHELL/5/CMD:task:vt0 ip:210.21.6.253
user:panrunkeng command:pro routing
%May 13 03:06:14 2007 Quidway SHELL/5/CMD:task:vt0 ip:210.21.6.253
user:liuweizhang command:undo interface vlanif 201
在删除VLANIF201之前没有删除接口下面的property routing参数导致
VLAN201的property routing属性没有删除,即使新建VLAN201后该
属性依然存在。
该属性存在导致Eth-Trunk无法加入到VLAN中。
----结束
处理步骤
在NE40上执行如下的操作。
步骤1执行命令system-view,进入系统视图。
步骤2执行命令vlan vlan-id,进入VLAN视图。
步骤3执行命令undo property routing,去使能路由属性。
步骤4执行命令return,返回到用户视图。
步骤5执行命令save,保存对配置的修改。
----结束
完成上述操作后,在Eth-Trunk视图下,执行命令port default vlan 201,
可以把Eth-Trunk接口加入到VLAN中。
案例总结
如果在VLANIF接口下面配置了property routing参数的情况下,在删除
这个VLANIF接口时,需要先删除VLANIF接口下面的property routing
参数,然后再删除VLANIF接口。
NE40端口自保护机制明确,当端口在时间段内没有收到数据业务报文,端口会自动的执行up/down的操作。
步骤1执行命令interface ethernet interface-number,进入接口视图。
步骤2执行命令port-self-protect disable,去使能端口自保护功能。
没有使用ARP广播功能导致dot1q终结子接口下挂业务不通
网络环境
图4-1 dot1q终结子接口下挂业务组网图
RouterA通过Eth-Trunk和SwitchA对接,RouterA的Eth-Trunk子接口配
置dot1q终结子接口作为SwitchB下挂PC的网关;在RouterA上先
shutdown RouterA和SwitchA的互连接口,然后und shutdown后发现在
RouterA上PING不通PC。
故障分析
步骤1检查中间SwitchA和SwitchB,没有发现异常。
步骤2执行命令display arp all,发现RouterA没有PC的ARP表项。
RouterA没有学习到PC的ARP表项造成RouterA无法PING通PC。
----结束
处理步骤
在RouterA上执行以下的操作。
步骤1执行命令system-view,进入系统视图。
步骤2执行命令arp broadcast enable,使能终结子接口的ARP广播功能。
步骤3执行命令quit,返回到用户视图。
步骤4执行命令save,保存对配置的修改。
----结束
完成上述操作后,RouterA的ARP表项中有PC的表项。
RouterA可以PING
通PC。
案例总结
arp broadcast enable命令是为了避免大量发送ARP请求报文而影响系统
工作而设计的一条命令,dot1q终结子接口缺省情况不使能该命令。
在端
口上使用了该命令之后可以主动从该端口发送ARP请求报文,去请求对
端的ARP,如果在该端口没有使能此命令,则无法主动发送ARP请求报
文出来,包括主动PING以及ARP-MISS,都不会发送ARP请求报文出
来,并且该端口在协议up之后会打上黑洞路由的标记。
BRAS下的用户可拨号,但打不开网页
网络环境
MA5200F通过155MPOS口与NE40路由器RouterA相连,MA5200F下
接拨号上网用户。
如图5-5所示。
图5-1 BRAS下的用户故障组网图
故障现象为:MA5200F下的拨号用户可以正常拨号,但打不开网页。
故障分析
步骤1从MA5200F的拨号用户进行拨号上网,从用户计算机上ping外网的网站可以ping通,排除上层设备路由问题。
步骤2检查MA5200F和NE40的配置,发现没有配置ACL对报文进行过滤,排除设备配置的问题。
步骤3检查NE40和MA5200F的POS接口状态,发现NE40的POS口的MTU为1024,而MA5200F的POS口的MTU为1500字节,两端不匹配。
步骤4在NE40的POS口上进行本地环回,同时把POS口的MTU值改为1500,插上光纤后,发现NE40的POS的MTU值自动更改为1024。
据
此可以判断是POS口SPF模块故障。
----结束
处理步骤
步骤1取消NE40的POS口上的本地环回。
步骤2更换NE40的POS口的SPF模块。
步骤3检查NE40的POS口的状态,等到接口状态Up。
步骤4从MA5200F的拨号用户登录到外网的网站,可打开网页,故障得以排除。
----结束
案例总结
本次故障现象,ping网站可以ping通,ping大包,小包都没有丢包。
此
时,需要检查有没有配置ACL限制报文,和接口的MTU值是否两端一
致。
CPOS接口的PPP协商正常结束后,无法ping通对端
网络环境
路由器与其他厂商设备通过CPOS接口互连,CPOS接口通道化为E1,
链路层采用PPP协议。
在PPP协商正常结束后,不能正常ping通直连地
址或访问对端设备连接的网络。
故障分析
步骤1使用测试仪器检查链路,排除物理接口和链路故障。
步骤2使用display current-configuration interface serial和display
current-configuration controller cpos命令,检查本端设备,发现其配置
正确而且与对端匹配。
步骤3使用display interface serial命令,结果如下:
<Quidway> display interface serial 3/0/0/8:0
Serial3/0/0/8:0 current state: up
Line protocol current state: up
AU-4 1, TUG-3 2, TUG-2 3, E1 1, ChannelGroup 0, Channel ID 1
Description: "rt-bb-ura1-01 -> cl-rt-ura-uniube-01 (0497509-URA)
Link-2"
Internet address is 201.16.248.18/30
The configured MTU is 1500 bytes, and the negotiated MTU is 0 bytes
TimeSlotList include 1-8,the BandWidth is 512 Kbits
The Max HQOS BandWidth is 448 Kbits
Link-protocol is PPP, loopback not set, clock source master, urpf
disabled
MRU: 1500 bytes, Negotiate Timeout set 3 seconds
Peer MRU: not negotiate, Magic number: 50342202
Peer IP address is 201.16.248.17/32
LCP: Opened
NCP: IPCP Opened, MPLSCP Stopped
Input: 94 Lcps, 0 Ipcps, 0 Ip6cps, 0 Mplscps, 0 Osicps, 0 Invalids
Output:52 Lcps, 0 Ipcps, 0 Ip6cps, 42 Mplscps, 0 Osicps, 0 Invalids Hold time is 10 (sec)
Input: 52 Timerhold Packets
Output:52 Timerhold Packets
Last 5 minutes input rate 36 bytes/sec, 0 packets/sec
Last 5 minutes output rate 11 bytes/sec, 0 packets/sec
Input: 376 packets, 19566 bytes
0 errors, 0 CRC, 0 giants
Output:161 packets, 6068 bytes, 0 underruns
0 CRC, 0 aborted sequences, 0 giants
接口协商的MTU值为0。
初步断定可能是此MTU协商不成功导致的故障。
步骤4使用display current-configuration命令,没有发现配置安全策略而过滤流量。
步骤5进一步了解,发现其他厂商设备在MTU值为1500字节的情况下,不进行MTU协商。
此时,其他厂商设备既不发送MTU协商报文,也拒绝接收对端设备发送
的协商报文。
而路由器在任何情况下都会进行MTU协商,协商的初始值
是0,每次协商以上一次的协商结果为基础,如果协商失败则保持上次协
商结果。
因此,当两端MTU都是1500字节时,路由器发送协商报文给其他厂商
设备后被拒绝,同时也收不到其他厂商设备的协商报文,这样路由器得
到的协商结果就是0,而其他厂商设备则保持自己的1500字节。
路由器在MTU是0的情况下不会转发数据,从而直连不通。
处理步骤
在路由器上执行以下操作:
步骤1执行命令system-view,进入系统视图。
步骤2执行命令interface serial interface-number,进入同步串口视图。
步骤3执行命令mtu 1400,配置同步串口的MTU值。
将MTU值修改为1400字节。
同时,在对端也将MTU值修改为1400字节。
步骤4执行命令shutdown,关闭同步串口。
步骤5执行命令undo shutdown,启用同步串口。
完成后,两端协商的MTU值为1400字节,可以ping通对端,故障解决。
----结束
案例总结
在和其他厂商设备进行互通时,应注意分析路由器和其他厂商设备在一
些协议上的不同实现方式。
光接口发光太强导致NE40的POS接口物理UP协议Down 网络环境
NE80和NE40通过传输设备以POS接口互连。
NE40侧POS接口的状态
为物理UP协议Down。
故障分析
推测有以下几个原因:
两端的C2字节不匹配。
●传输链路不好。
●POS接口模块有问题。
操作步骤
步骤1检查配置确认两端接口参数配置无误。
步骤2通过在设备上面打环测试,接口物理状态能够UP,能够检测到环路,确认单板的芯片没有问题。
步骤3通过尾纤打环,接口物理状态能够UP,能够检测到环路,确认光接口模块没有问题。
步骤4在传输上面向NE40侧打环测试,发现接口无法收到环路,所以怀疑是传输链路问题。
步骤5传输人员检查传输后确认从NE40侧发出的光强度太大,导致传输设备接口故障。
步骤6在NE40与传输设备之间增加光衰后,接口物理及协议状态均变为UP,问题解决。
----结束
案例总结
在处理光接口故障的问题时,应该注意光接口的过载光功率、接收灵敏
度等一些参数是否满足要求。
两对PPP接口的尾纤交叉,导致OSPF邻居无法建立
网络环境
网络拓扑为NE80路由器RouterA通过两个155M的POS链路连接到友
商的路由器,接口之间启用OSPF。
如图5-9所示。
图5-1 两对PPP接口的尾纤交叉组网图
故障现象是链路上没有任何流量,检查OSPF的邻居状态,发现一直停留
在Init状态,如下:
Area 0.0.0.10 interface 10.31.242.17 neighbor(s)
RouterID: 1.1.1.1 Address: 10.31.242.18
State: init Mode: Nbr is Slave Priority: 1
DR: 10.31.242.18 BDR: 10.31.242.17
Dead timer expires in 35s
Neighbor comes up for 122d5h
但是在NE80上能够ping通对端的IP地址。
故障分析
步骤1检查链路两端路由器上的OSPF的配置参数,发现两端的配置是一致,确定不是参数配置错误。
步骤2检查NE80和友商路由器配置的接口的OSPF MTU值也都是1526字节。
步骤3检查友商路由器的POS1/0的IP地址为10.31.242.17/30,与其互连的NE80的POS1/0/0的IP地址分别为10.31.242.21/30,友商路由器的POS1/2
的IP地址为10.31.242.22/30,与其互连的NE80的POS2/0/0的IP地址为
10.31.242.18/30,由此判断是两对尾纤插错。
----结束
处理步骤
步骤1互换NE80的两个POS接口的尾纤。
步骤2检查OSPF邻居状态,发现OSPF邻居的状态的已达到Full,故障得到排除。
----结束
案例总结
PPP协议在协商时不会检查对端的IP地址,由于是点对点协议,即使互
连接口的IP地址不是同一个网段,依然能够ping通对端的IP地址,所
以在配置PPP链路时要注意IP地址或链路交叉等问题。
两台路由器下的同一网段的PC不能互相访问
网络环境
如图6-10所示,PC1和PC2属于同一网段,并通过RouterA和RouterB
相连。
RouterA和RouterB上有到对方网段的静态路由。
图6-1 同网段PC互访组网图
配置完成后,发现PC1 ping不通PC2。
故障分析
在PC1上执行命令arp –a,查看所有ARP表项,发现没有PC2的IP地
址与MAC地址的映射。
说明执行ping命令时,ARP表项并没有自动学
习到。
这是因为RouterA接收到PC1的ARP请求报文后,发现请求报文的目标
IP地址不是本地接口的IP地址,因此将ARP请求报文丢弃。
处理步骤
在RouterA和RouterB上分别执行以下操作。
步骤1执行命令system-view,进入系统视图。
步骤2执行命令interface interface-type interface-number,进入路由器与PC 相连的接口的接口视图。
步骤3执行命令arp-proxy enable,使能接口的Proxy ARP功能。
步骤4在PC1上ping对端PC2的IP地址,即在PC1上执行命令ping
192.168.2.2,然后在PC1上执行命令arp –a,发现PC2的IP地址对应的
MAC地址为RouterA与PC1相连的接口的MAC地址。
----结束
完成上述操作后,在PC1上ping对端PC2,可以ping通,故障排除。
案例总结
中间使用路由器分隔的两台属于同一网段的PC互相访问时,必须在路由
器与PC相连的接口上使能Proxy ARP功能。
否则,即使两台PC属于同
一网段,也不能互相访问。