网络环路故障处理
宽带环路故障处理
第4章宽带环路故障处理随着网络地不断发展,DSLAM设备地应用也越来越广,随之而来地网络故障也越来越复杂,其中网络环路是比较难troubleshooting地一种故障.下面,我们将现网中所能出现地几种环路情况,一一模拟并寻找出解决思路,定出判断故障地关键点.虽然目前地DSLAM版本都已经有环路检测功能,但下面几个案例主要是讲解环路地发生过程,和故障现象,希望让大家在以后处理环路问题时有一个较清晰地思路.4.1 案例分析4.1.1 案例一:单个用户申请两条DSL线路造成环网组网:图4-1城域网中采用L2汇聚各个DSLAM,上行汇聚到同一个三层接口.某网吧用户为了提高上网速度申请了两条DSL线路并接入用户局域网地同一个VLAN.当两条线路同时激活时,上层两个DSLAM上网速度变慢,直至中断.b5E2RGbCAP注意:在同一台DSLAM两条DSL线路接入同一个用户局域网也会造成同样地问题.原因分析:上面地组网是一个典型地环网,其中关键地两个点是1)两台DSLAM采用同一个3层接口,2)用户侧两条DSL线路没有作二层隔离.只要以上两个条件满足,L2上既使将两台DSLAM使用VLAN隔离开,仍然会使业务中断.p1EanqFDPw形成环网业务中断地原因一般有两个:1)上层交换机启动STP后阻塞DSLAM地上行端口导致DSLAM上行链路DOWN掉2)交换机、DSLAM上网关MAC地址漂移造成业务时断时续.上行交换机启动STP后,跟交换机会定时向各个VLAN发送STP监测报文,如果一段时间后交换机从某端口收到了自己发出地STP监测报文,则说明该端口和报文地发送端口<报文中携带了发送端口信息)形成环网,交换机会根据端口优先级将低优先级地端口阻塞掉,就会造成其中一个DSLAM业务中断.正常情况下,交换机CAM中学习到地网关MAC地址对应地是上行到L3地端口,但是形成环网之后,网关发送地广播报文在用户侧环回并从DSLAM上发给L2,导致CAM中网关MAC对应地端口变成连接DSLAM地端口,这样DSLAM上来正常地业务报文<目地地址是网关MAC)就会被丢弃或者错误转发<LSW芯片转发某个报文时,如果查找CAM中报文目地MAC对应地端口和报文地进入端口一致,有两种处理方式,一种是直接丢弃,一种是广播,这取决于LSW芯片地种类,但是这两种方式都会造成严重后果),直到L3网关发过来地报文重新刷新CAM表中对应端口.此时上网业务就表现为时断时续.DSLAM上MAC地址漂移地现象和L2上类似,也是网关地MAC地址在上行端口和下行端口来回漂移,造成用户上行报文大量丢弃.在L2上DSLAM进行VLAN隔离是否能够解决此问题呢?答案是无法解决,因为:1)有一些L2地LSW芯片CAM刷新时是以MAC地址作为第一索引地,而不是以VLAN作为第一索引,也就是说一个MAC地址在CAM中只能占用一个表项,对应一个端口.2)L2上划分VLAN不能解决DSLAM上网关MAC地址漂移地问题,关键是用户侧两条DSL线路是二层互通地,一条线路发下来地广播报文会广播到另外一条线路.解决方法:解决此问题地方法就是解决前面提到地两个关键点:1)两台DSLAM采用同一个3层接口,2)用户侧两条DSL线路没有作二层隔离.这两个条件任意一个不满足都可以解决环路问题,其中第二个条件更为合理一下,将两条DSL线路桥接在用户局域网上不但不能起到增加上网带宽地作用,还会造成广播风暴<用户侧地交换机也会出现网关MAC地址漂移地现象,而且会因为广播报文不断循环造成广播风暴),一定要使用三层设备将两条DSL线路和用户局域网隔离开,一方面解决了以上问题,另外用户地组网问题也不会影响到运营商地城域网.隔离地办法很多,使用代理服务器、路由器或者带路由功能地MODEM都可以,其中使用路由功能地MODEM成本较为低廉.建议设置如下:1)两个MODEM广域网接口采用1483B地PPPOE拨号或者1483B协议地静态IP方式<根据运营模式而定)2)两个MODEM都启动NAT和DHCP,配置地址池,两个MODEM地地址池不要交叉,例如MODEM1采用192.168.0.2-192.168.0.128,MODEM1地址池采用192.168.0.129—192.168.0.254,可以预留部分地址给服务器、打印机、路由器.3)局域网中所有需要上网地计算机配置自动获得IP地址.这样配置之后,计算机就会分别从两个MODEM获取地址和网关,上网业务也就实现了分流,有效地提高了上网速度,同时也实现了用户网络和城域网地隔离.EmxvxOtOco4.1.2 案例二:用户侧ADSL互通时MODEM问题导致环网组网:图4-2为了实现企业和分支机构之间地互通,在DSLAM上做了两个ADSL用户之间地互通,并且两个ADSL 用户还存在有上网地PVC,上图中蓝色线条代表ADSL互通PVC,红色代表两个用户地上网PVC.当建了蓝色PVC后,上行业务就开始中断.SixE2yXPq5原因分析:这个案例中业务中断地原因和上一个例子相同都是环网造成上行端口阻塞或者地址漂移后地报文丢失和广播风暴.我们主要分析一下这种组网是如何构成环网地.上图中可以看出,如果RTU上如果两条桥接PVC能够二层互通,则就构成了一个环网.关键是RTU上是否允许两条桥接PVC之间互通?很不幸,相当多地MODEM都是这样作地,这和MODEM内部软件实现地协议栈有关<特别是采用alcatel解决方案地MODEM),这样作地原因是内部地二层转发模块按照“广播包转发给所有地桥接逻辑端口”地原则转发,而不关心该逻辑端口是广域网PVC还是局域网以太口.6ewMyirQFL解决方法:a. 更换用户侧地RTU由于没有详细地测试那些MODEM不具有以上地问题,所以无法推荐出合适地RTU,不过华为地MT800可以满足要求.kavU42VRUsb. ADSL互通地PVC使用IPOA协议端口间地PVC不使用桥接方式,采用3层接口对接,这样就和上网地PVC无法构成环网,配置举例:RTU1图4-3上网PVC:VPI/VCI=0/35,桥接方式或者PPPOE<RFC2684桥接协议)互通PVC:VPI/VCI=0/36,IPOA方式<RFC2684路由协议),广域网IP=10.71.52.1/24,对端IP=10.71.52.2以太网口地址=192.168.1.1/24用户局域网IP=192.168.1.2---192.168.1.254RTU2上网PVC:VPI/VCI=0/35,桥接方式或者PPPOE<RFC2684桥接协议)互通PVC:VPI/VCI=0/36,IPOA方式<RFC2684路由协议),广域网IP=10.71.52.2/24,对端IP=10.71.52.1以太网口地址=192.168.1.1/24用户局域网IP=192.168.1.2---192.168.1.254广域网IP地址和掩码可以自己随意确定,只要保证本地RTU配置地对端IP和对端RTU地广域IP相等.本地RTU地以太网口IP地址和本地局域网同一网段.DSLAM上建一个ADSL端口到ADSL端口地PVC即可,两端地VP/VCI=0/36.C. 需要互通地ADSL用户采用单独地VLAN在L2上进行互通前面采用IPOA地PVC互通适合于位于同一个DSLAM下地用户互通,如果互通地ADSL用户位于不同地DSLAM上,则必须给用户配置一个二层地VPN用于互通,这种方法安全性比较好.配置方法是:<1) L2上给互通用户做一个单独地VLAN,并修改L2和DSLAM地配置,保证DSLAM和L2端口都是TAG端口.<2)两个DSLAM上都建一个VLAN-ADSL端口地PVC,VPI/VCI = 0/36.<3)两边地RTU上配置VP/VCI=0/36地PVC,协议是桥接协议LLC封装.这种方法由于是二层互通,用户可以方便地实现VPN功能,并且采用单独VLAN,安全性较好.4.1.3 案例三:用户局域网内地环网问题这种现象也比较常见,有以下几种情况:1)用户局域网内交换机成环,这种问题一般都比较好发现,因为此时用户网络也是无法使用地.交换机抓包时可以抓到大量广播包和转发错误地单播报文<转发1端口地报文却在2端口收到)2)网内某个计算机采用了双网卡并使用了网卡绑订软件现在有很多人采用双网卡并使用网卡绑订软件来充当服务器,但是由于网卡工作模式设置不正常<类似于交换机地trunk,有多种工作模式,如果设置模式错误地话会形成环网),就导致广播报文从一个网卡广播到另外一个网卡,这种方式不建议使用.4.2 建议和总结随着技术地发展,各种网络设备和软件层出不穷,组网出问题地几率会越来越大,要解决这些问题,一方面要尽量使用路由方式地MODEM,将用户网络和城域网隔离,另一方面要针对性对网吧、企业用户组网进行指导和监督,规范网络拓扑,在设计时就考虑这方面问题,避免日后维护中遇到此类故障.。
抓包分析解决网络环路的措施
抓包分析解决网络环路的措施随着互联网的发展,网络环路问题逐渐成为网络工程师和管理员们面临的一个重要挑战。
网络环路是指数据在网络中循环传输,导致网络拥堵和性能下降的问题。
解决网络环路问题需要网络工程师具备一定的技术知识和经验。
本文将介绍如何通过抓包分析来解决网络环路问题,帮助读者更好地理解和解决这一难题。
抓包分析是一种常用的网络故障排查方法,通过监视网络数据包的传输过程,分析数据包的头部信息和负载内容,可以帮助网络工程师快速定位网络环路问题的原因。
下面将从抓包分析的基本原理、工具和实际案例等方面进行介绍。
一、抓包分析的基本原理。
抓包分析的基本原理是通过网络抓包工具捕获网络数据包,然后对捕获到的数据包进行解析和分析。
网络数据包是网络通信的基本单位,包括数据包的头部信息和负载内容。
通过分析数据包的源地址、目的地址、协议类型、数据包大小等信息,可以了解网络通信的情况,帮助快速定位网络环路问题。
二、抓包分析的工具。
目前市面上有很多优秀的抓包工具,如Wireshark、tcpdump、Fiddler等,这些工具都可以帮助网络工程师进行抓包分析。
其中,Wireshark是一款功能强大的网络协议分析工具,支持多种网络协议的分析和解码,可以捕获网络数据包并进行详细的分析。
tcpdump是一款基于命令行的抓包工具,可以在Linux和Unix系统上使用,通过简单的命令就可以捕获网络数据包。
Fiddler是一款用于HTTP/HTTPS调试和抓包的工具,可以帮助网络工程师快速定位网络环路问题。
三、抓包分析的实际案例。
下面将通过一个实际案例来介绍如何通过抓包分析来解决网络环路问题。
假设一个公司的内部网络出现了网络环路问题,导致网络拥堵和性能下降。
网络工程师可以通过Wireshark等抓包工具来捕获网络数据包,并进行分析。
首先,网络工程师可以在受影响的网络设备上安装Wireshark,并设置过滤条件,只捕获与网络环路相关的数据包。
网络环路分析全解
2、网络环路的分类、特点与表现
静态路由设置不合理的情况: 设两个路由器RA和RB,其路由表中各有一 条去往相同目的网络的静态路由, 但下一跳彼此指向对方,形成环路。
2、网络环路的分类、特点与表现
动态路由造成的情况: 假设某路由器RA通过RB至网络netb,但RB到netb 不可达了,这时候RB的广播路由比RA先来到,RB 去netb不可达,但RA中有去往netb路由,且下一跳 是RB,这时RB就会从RA那里学习该路由,将去往 netb的指向RA,跳数加1。netb的路由原本是RB传 给RA的,现RB却从RA学习该路由,显然是不对的, 但这一现象还会继续,RA去netb网络的下一路是 RB,当RB的跳数加1的时候,RA将再加1,周而复 反形成环路,直至路由达到最大值数据包才丢弃。
2、网络环路的分类、特点与表现
(2)三层环路 在维护路由表信息的时候,如果在拓扑发生改变后,网络 收敛缓慢产生了不协调或者矛盾的路有选择条目,就会发生 路由环路的问题,这种条件下,路由器对无法到达的网络路 由不予理睬,导致用户的数据包不停在网络上循环发送,最 终造成网络资源的严重浪费。 矢量路由的一个弱点就是可能产生路由环路,产生路由环路 的原因有两种: 一是静态路由设置的不合理,二是动态路由定时广播产生的 误会。
2、网络环路的分类、特点与表现
(5)三层环路的解除 解决路由环路问题的方法,概括来讲,主要分为六种: (1)定义最大值; 距离矢量路由算法可以通过IP头中的生存时间(TTL)自纠 错,但路由环路问题可能首先要求无穷计数。为了避免这个 延时问题,距离矢量协议定义了一个最大值,这个数字是指 最大的度量值 (2) 水平分割 水平分割是过滤掉发送给原发者的路由信息。其规则就是不 向原始路由更新来的方向再次发送路由更新信息 ,具体路由 信息单向传送。
路由器故障:IBGP邻居间路由环路
路由器故障:IBGP邻居间路由环路IBGP邻居间路由环路的故障解决步骤如下:网络环境在下图的网络中,RouterA和RouterC建立EBGP邻居关系,并且通过network方式发布所有路由给RouterC。
RouterB和RouterD的配置与RouterA和RouterC完全对称。
当RouterA和RouterC的互连接口down掉后,在RouterC上发现去往RouterA的所有网段都不通。
图 IBGP邻居间路由环路故障分析步骤 1 在RouterC上执行display current-configuratiion命令查看配置。
RouterC通过route-policy将如下城域网的路由再通告给RR的时候强制指定其下一跳为虚拟下一跳地址202.105.0.5。
.ip route-static 202.105.0.5 255.255.255.255 61.142.140.166..ip route-static 202.105.0.5 255.255.255.255 61.142.140.170..ip route-static 202.105.0.5 255.255.255.255 61.145.84.94这三条静态路由的下一跳地址分别是RouterA和RouterC互连的三条链路接口地址(未指定出接口,RouterA上和RouterC互连的接口是POS1/0/0、POS2/0/0和POS2/1/0)。
在RouterC的ISIS中使用路由策略通过import方式引入这三条静态路由。
.ip ip-prefix virtualaddress index 10 permit 202.105.0.5 32..route-policy virtual-to-IS-IS permit node 10..if-match ip-prefix virtualaddress..IS-IS..cost-style wide-compatible..network-entity 86.xxxx.2020.9702.8090.00..import-route static cost 1 level-1-2 route-policy virtual-to-IS-IS..preference 110步骤 2 当RouterA和RouterC的互连接口down掉后,在RouterC上发现去往RouterA 的路由下一跳还是虚拟下一跳202.105.0.5,但是出接口却指向了RouterE。
网络环路故障应急预案
一、前言网络环路故障是网络通信中常见的一种故障,它会导致网络性能下降,严重时甚至会造成网络瘫痪。
为保障网络通信的稳定性和可靠性,特制定本网络环路故障应急预案。
二、组织机构及职责1. 成立网络环路故障应急处理小组,负责网络环路故障的应急处理工作。
2. 小组成员包括:(1)网络管理员:负责网络设备的监控、维护和故障处理。
(2)技术支持人员:负责对网络环路故障进行技术分析和处理。
(3)信息沟通人员:负责与相关部门、用户沟通,及时发布故障信息和处理进展。
三、应急响应流程1. 故障发现(1)网络管理员发现网络通信异常,立即进行初步排查。
(2)如确认存在网络环路故障,立即向应急处理小组报告。
2. 故障确认(1)技术支持人员对网络环路故障进行技术分析,确认故障原因。
(2)根据故障原因,制定相应的处理方案。
3. 故障处理(1)根据故障处理方案,采取以下措施:①隔离故障设备:断开故障设备与网络的连接,防止故障蔓延。
②调整网络拓扑:重新配置网络拓扑,消除环路。
③修复故障设备:对故障设备进行修复或更换。
④测试网络:测试网络性能,确保故障已排除。
4. 故障恢复(1)故障排除后,恢复正常网络通信。
(2)对故障设备进行检修,确保其正常运行。
5. 故障总结(1)对网络环路故障进行总结,分析故障原因。
(2)完善网络设备配置,防止类似故障再次发生。
四、应急物资及设备1. 应急处理小组应配备以下物资及设备:(1)备用网络设备:交换机、路由器等。
(2)故障诊断工具:网络分析仪、电缆测试仪等。
(3)维修工具:螺丝刀、扳手等。
(4)应急通信设备:对讲机、电话等。
五、应急演练1. 定期组织网络环路故障应急演练,提高应急处理小组的应对能力。
2. 演练内容应包括故障发现、确认、处理和恢复等环节。
六、附则1. 本预案自发布之日起实施,由网络环路故障应急处理小组负责解释。
2. 如有未尽事宜,由应急处理小组根据实际情况进行调整。
交换机二层环路问题处理指南
目录1介绍 (3)2网络业务故障,如何确认存在环路? (3)2.1第一步:是否可以通过端口流量发现数据风暴? (4)2.2第二步:是否可以通过MAC-Flapping检测漂移? (5)2.2.1框式交换机 (5)2.2.2盒式交换机 (7)2.3第三步,是否可以通过环路检测发现环路? (8)2.3.1Loop Detection(框式) (9)2.3.2Loopback Detection(盒式) (10)3环路问题发生后,如何快速破环? (11)3.1第一步:是否理解网络业务并明确拓扑? (11)3.2第二步:是否需要用影响最小的方法破环? (11)3.2.1方法一:端口退出成环VLAN破环 (11)3.2.2方法二:shutdown成环端口破环 (11)3.2.3方法三:通过拔出成环光纤破环 (11)3.3第三步:操作后确认业务是否恢复? (12)4环路问题发生后,如何定位问题根因? (12)4.1第一步:是否由于近期施工操作引入环路? (12)4.2第二步:是否由于近期修改配置引入的环路? (12)4.3第三步:是否典型的常见环路问题? (13)4.3.1交换机自环出现环路 (13)4.3.2交换机下游设备自环出现环路 (13)4.3.3环形组网链路震荡导致环收敛震荡 (14)4.3.4环形组网寄存器下发失败无法破环 (14)4.3.5链路单通引入RRPP网络单向环 (15)4.3.6协议堵塞的端口L2PT(bpdu-tunnel)协议报文成环 (16)4.3.7下游设备报文转发异常导致疑似环路 (17)4.4第四步:收集信息返回研发分析 (17)5环路问题解决后,网络是否需要优化? (19)5.1第一步:是否需要部署适当的破环协议? (19)5.2第二步:是否需要提升链路质量和可靠性? (19)5.3第三步:是否需要部署广播抑制提升网络健壮性? (19)5.4第四步:是否需要部署QoS保证协议报文优先转发? (19)6结束语 (19)1介绍以太网链路由于各种原因,导致数据或协议报文环形转发,导致网络形成数据风暴,最终影响正常业务。
环路危害及解决方案
学校的北楼网络出现故障。
校园网络时通时断,服务器CPU使用率明显上升,汇集交换机工作异常,整个北楼网络多次瘫痪。
经过一番检查、维护后,故障终于得到排除。
在故障排除过程中,发现很多起网络故障都是由于网络环路而引起的。
1.部分同学不慎将一条网线的两端直接插在同一台集线器或者交换机的两个端口上(图1),很显然,网络在此形成了环路。
2.由于对整个网络拓扑结构的不熟悉,用户很可能在使用中不经意地将两根应连接到学校主交换机的网线连到了一台集线器或者交换机上(图2),造成了局部网络的环路。
从以上现象可以知道,由于部分同学局部网络形成环路后,相关的广播报文将沿着网络环路无休止地循环传播,继而形成广播风暴,一旦形成了广播风暴,那么,比较乐观的情况就是网络的利用率明显升高,服务器CPU的使用率迅速上升,可使用的网络带宽变得非常有限,所有广播数据包将被丢弃不再传播以使网络恢复正常,所以就造成了用户访问网络时断断续续的现象发生;最坏的情况则是广播数据包将无休止地繁殖,最终耗尽所有的网络带宽,造成整个网络瘫痪,中心交换机死机,使得用户完全无法访问网络。
图1
图2
上述故障很可能在每个楼层都会出现。
我认为解决这一问题的较好的方法是:首先教育同学不能将同一根网线的两端同时连接到同一台设备上.其次是不能将同一房间的两个设备连山两根网线.第三是尽可能组织相关网络知识的宣传,处分利用学生干部和网络勤工俭学学生学习网络知识,并协助同学正确连接网络.如果再使用中出现网络异常时,首先与网络中心联系,让网管人员到现场进行查看,这样就可以尽可能地避免由于网络环路的出现而使整个网络无法正常运行。
计算机网络常见故障与维护方法9篇
计算机网络常见故障与维护方法9篇第1篇示例:计算机网络在现代社会中起着至关重要的作用,它连接了世界各地的用户,使得信息传输更加便捷和高效。
计算机网络也会出现各种故障,影响用户的正常使用。
在日常维护中,我们需要了解常见的计算机网络故障及其维护方法,以便及时处理问题,保障网络的稳定运行。
一、网络连接故障1.故障现象:无法上网或者网络速度慢可能原因:网络线路故障、路由器故障、IP地址冲突等。
维护方法:- 检查网络线路是否连接正确,确认网线插头是否正常。
- 重启路由器,等待路由器重新连接网络。
- 检查本机IP地址是否与其他设备冲突,可以更改IP地址或者重启网络适配器。
2.故障现象:无法连接局域网可能原因:局域网设置错误、网络防火墙阻碍等。
维护方法:- 检查局域网设置是否正确,确认是否开启了文件共享和打印机共享功能。
- 关闭网络防火墙或者添加相应的例外规则。
1.故障现象:网络被黑客入侵可能原因:网络安全漏洞、密码泄露等。
维护方法:- 及时更新系统和软件补丁,修复已知的安全漏洞。
- 使用复杂且定期更改的密码,避免密码泄露。
- 安装有效的防火墙和杀毒软件,保护网络安全。
2.故障现象:网络受到DDoS攻击可能原因:网络流量异常、服务器负载过高等。
维护方法:- 配置防火墙,限制恶意流量的访问。
- 使用DDoS防护服务,以及时应对大规模攻击。
1.故障现象:路由器重启或者频繁掉线维护方法:- 清洁路由器散热孔,保持通风良好。
- 升级路由器固件,修复已知bug。
- 存放路由器在干燥通风的环境中,避免过热。
可能原因:交换机端口故障、网络线路异常等。
维护方法:- 更换故障的交换机端口。
- 检查网络线路,确保连接正常。
四、其他常见故障及维护方法可能原因:网络拥堵、服务提供商问题等。
维护方法:- 选择合适的网络服务提供商,避免出现网络拥堵。
- 优化网络带宽使用,避免大量流量同时传输。
可能原因:DNS设置错误、DNS服务器故障等。
环路引起网络故障和现象仿真
环路引起网络故障处理和现象仿真目录1. 问题处理过程: (1)2. 现象仿真实验 (3)2.1. 环境: (3)2.2. 正常状态,pc1去ping pc2 (5)2.3. 3,4口自环的情况 (5)2.4. 模拟vlan1数据通过 (7)2.4.1. 两个端口都是access口,pc2去ping pc1互ping正常 (7)2.4.2. 两个端口都是vlan1,相互都能ping通 (8)2.4.3. 2口为trunk,但运行vlan1通过,1口access口属于vlan1 (8)2.4.4. 1,2都是trunk口,都允许vlan1通过 (9)2.4.5. 修改2的native vlanid为4092后,pc1去ping pc2 (10)2.4.6. 过程分析: (11)3. 知识点: (12)1.问题处理过程:一天下午,突然工位的pc192.168.205.201无法ping通机柜汇聚交换机192.168.205.15,ping 的结果是无法访问目标主机。
已知,公司组网如下图:查看arp -a发现没有192.168.205.15的mac地址。
长ping192.168.205.15,用windump跟踪执行windump -i 1 -nne arp[14:4]=0xc0a8cd0f or arp[24:4]=0xc0a0cd0f(跟踪arp 请求源ip和响应的目的ip),发现有如下打印:发现pc发出的arp请求没有得到响应。
奇怪,镜像核心交换机到机柜汇聚交换机的接口发现有下面的打印:看这个每包的时间间隔,发现几乎在0.000002秒,就是说每秒发送50000个包,而交换机设置最大接收arp是100个/秒,显然超出交换机的处理能力,怀疑谁的设备出了问题,询问同事谁的这两个mac地址的设备?判断在不停的发送arp消息。
有同事反馈他在其他网段能登录机柜汇聚交换机,反馈这个00:ac:c9:00:00:02是在图中253交换机上,如图:让他在机柜汇聚交换机上shutdown 1/1/9接口,并清除掉arp表和mac地址表后,用192.168.205.201pc进行ping,发现windump有下面的打印:机柜汇聚交换机响应了arp请求,能够ping通。
网络环路引起的故障汇总
网络环路引起的故障汇总在日常维护中,由于各种原因有时会形成网络环路。
以下汇总了自接手IP 维护工作以来碰到过的各种环路问题,由于水平有限,错误的地方请指正。
1、在调试设备时测试光路形成的环路。
目前DSLAM设备都下挂在L2 S8505。
在调试新DSLAM设备时,我们一般都会先完成数据配置再到现场开局。
有时我们会在远端机房的ODF进行收发环路,通过查看交换机端口是否UP的方法来判断光路是否正常。
事实上这样会造成VLAN 31环路,引起L2 S8505和下带设备的网管通信中断。
如果要采用此方法测试,应提前删除该端口的VLAN 31透传,等设备调试起来后再加入。
2、在配置或取消链路聚合时形成的环路。
为实现二层网络双路由保护或流量分担,链路聚合的应用越来越多。
链路聚合组要求端口的数据配置必须一样,也就是透传的VLAN也一样。
如果端口取消了链路聚合就会形成环路,该环路肯定会影响到业务。
如果端口也透传了VLAN 31,同理也会影响到L2 S8505和下带设备的网管。
2007年张埔IPSU和新局L2 S8505对开链路聚合时,由于有问题取消聚合,聚合取消后不仅引起了PPPOE、IPTV业务阻断,也引起了L2 S8505网管中断。
另外如华为的EPON OLT设备和L2 S8505对开聚合组时,调试人员最初将端口设置为强制模式。
为实现单芯中断时的业务保护,需要将强制改为自协商模式,而OLT设备必须将聚合组删除才能更改,这时就会产生环路。
因此取消链路聚合时应及时将聚合的某个端口SHUTDOWN或将配置数据删除。
3、2007年9月2日新局L2S8505下带设备网管通信频繁瞬告。
新局L2 S8505下带设备网管通信频繁瞬告,更换网管端口无效。
怀疑S8505被攻击,抓包分析发现ARP包偏多,但也不会影响到网管。
在T160G和L2 S8505下带的小L2设备上发现有接收到大量的IGMP报文信息,S3228上的LOG中有非常多的“Receive too many packets of 'igmp' from port gei_3/1”,抓包发现有非常多的IGMP报文(V2 LEAVE GROUP,源MAC地址为0015-EB6A-F186,目标MAC地址0100-5E00-002,源IP为0.0.0.0,目标IP为224.0.0.2,组播地址为239.255.40.14 )。
网络环路故障处理
摘要 :随 着近年 来计算机 网络 的飞速 发展 , 网络在各行各 业得到 了广泛 的应 用, 如何 能够让 网络 平稳运行 , 做 好 网络 的
日常维护 , 成为计算机 网络维护人 员的重要 工作 。网络环路是 我们经常遇到的一种网络故 障 , 一旦发 生环路 , 将造 成整 个网络瘫 痪无法使 用。 文章对 网络环路 的分类、 网络环路避免 方法进行 了介绍 , 并通过网络环路 处理 实例讲 解了网络环
路 的 处理 方 法 。
关键词 : 环路 ; S T P ; S P A 中图分类号 : T P 3 9 3 . 1
文献标识码 : A
文章 编号 : 1 6 7 3 一 l 1 3 1 ( 2 0 1 3 ) 0 7 — 0 0 7 3 - 0 1 况特别复杂 , 应 由专人管理 , 也应在设备上给予可靠性保证 。 案例 中的接入交换机是可管理型 的, 有 S T P功能, 本来事先 已 经在接入交换机上配置了 S T P 功能, 如果网络管理人员在工作 中按 工作流程来操作的话, 这起网络事故是完全可 以避免的。 但 是 因 网络 管 理 员 没 有按 流 程 操 作 , 也无 环 路 防 范 意 识 , 并 没 有配置 S T P功能 。建议在 网络维护 中严格按照 日常 的操作流 程, 采取相应环路防范措施 , 避免 因疏 忽带来不必要 的损失 。
2 0 1 3年第 7期
( 总第 1 2 9期)
信 息 通 信
I NF 0RM ATI oN & C0M M U NI CAT1 0NS
路 故 障处 理
昶晶炜
( 承德 市园林 管理局 , 河北 承德 0 6 7 0 0 0)
一
2 实例 分析 网络环 路 处理 过程
(完整word版)网络环路故障处理(word文档良心出品)
网络环路故障处理方法一、网络环路形成的原因首先,介绍一下造成网络环路原因。
由于机房的交换机都由专业的设备维护人员管理和操作,所以这里我们不考虑机房交换机环路的可能性,而是着重介绍终端用户HUB所造成的环路。
如下图所示是HUB环路示意图:一旦网络中出现上图HUB的连线方法,网络环路就形成了!环路引起的实质问题是广播风暴,而广播风暴只在同一网段内传播,它往往只影响同一网段内的电脑。
但是当一台受到广播风暴影响的交换机配有其他vlan(网段),那么与该交换机连接的所有网段的电脑都将受到影响,因为“广播风暴”会占用大量网络带宽,导致正常业务不能运行,甚至彻底瘫痪,通俗点说就是该交换机“死机”了。
如果该交换机是一台汇聚甚至是核心交换机,那么影响的范围将会更广!二、网络环路的现象接着,介绍一下网络环路的现象。
网络中出现环路后,往往会出现很奇怪并令人费解的现象让设备维护人员很难判断故障原因。
具体现象有:内网、外网网页有时能打开但很卡,有时又打不开;ping网关丢包且丢包率不稳定;与电脑直连的HUB和机房对应的接入层交换机端口灯狂闪。
以上现象出现时,基本可判断是网络环路故障。
三、网络环路的处理方法准确判断故障原因是快速处理故障的先决条件,知道原因后解决它只是时间问题了。
现将网络环路大致的处理流程和方法总结如下:1、了解网络的拓扑结构设备维护人员到现场后,首先要知道或试图了解现场网络的拓扑结构。
简单的说,你要知道电脑是连的哪个HUB,HUB是连到机房哪台接入层交换机上,而接入层交换机又是如何与汇聚层交换相连的。
这里列出我们公司常见两种接入层拓扑结构:拓扑图1:接入层交换机分别与汇聚层交换机直连。
拓扑图2:接入层交换机互相串联后再与汇聚层交换机相连。
2、缩小排查范围无论是何种拓扑结构,我们都应该先用笔记本直连汇聚层或核心层交换机,测试网络是否正常以排除汇聚层或核心层交换机本身的故障导致的问题。
下面我们假设拓扑图1和拓扑图2中的(vlan10:192.168.130.0/24,网关:192.168.130.254)网段中出现了环路。
回溯分析帮助解决用户网络环路故障
CSNA网络分析论坛,网络分析技术学习、交流、分享平台推荐下载:《网络分析案例集2012》、《网络通讯协议图》、《网络故障诊断图》更多资料请登录环路分析故障描述故障背景一天,一个客户打电话说他们部门的内网阶段性掉线,而且频率很高,访问外网非常慢,ping网关,时通时不通,延时较大,部门所有机器都是类似情况!初步判断,有可能是内网异常流量占用,或者广播风暴之类的故障!还好,客户在使用科来回溯产品,可以保存数据,以便于现在回放“录像”。
简单描述一下网络拓扑,比较简单,只是一个部门网络,汇聚交换机——二层交换机——用户。
抓包位置,汇聚交换机作镜像,镜像端口接科来回溯分析系统。
网关地址:192.168.10.1选取时间为28s,总流量16.312M,速率也是比较大的(如图)!概要统计下载数据包分析端点视图:广播和组播流量比较大,几乎占了总流量的98%。
先前的判断的方向是对的!而且还有两个无效地址0.0.0.0,169.254.134.187,没有获取到地址,忘了说了,地址都是自动获得的!看了协议视图,豁然开朗是dhcp 和netbios在作怪!结合dhcp 和netbios的联动性(见注释1),初步确定是dhcp在作怪了,正是由于dhcp的缘故,所以出现了169.254.x.x和0.0.0.0这样的地址。
DHCP的工作原理(见注释2),现在我们只说第一次登录的时候。
根据客户端是否第一次登录网络,DHCP 的工作形式会有所不同。
我们只说第一次登录的时候,当DHCP 客户端第一次登录网络的时候,也就是客户发现本机上没有任何IP 数据设定,它会向网络发出一个DHCP discover 封包。
因为客户端还不知道自己属于哪一个网络,所以封包的来源地址会为0.0.0.0 ,而目的地址则为255.255.255.255 ,然后再附上DHCP discover 的信息,向网络进行广播。
在Windows 的预设情形下,DHCP discover 的等待时间预设为1 秒,也就是当客户端将第一个DHCP discover 封包送出去之后,在1 秒之内没有得到响应的话,就会进行第二次DHCP discover 广播。
网络环路故障应急预案
一、概述网络环路故障是指网络中存在两个或多个网络设备连接形成一个环路,导致数据包在网络中无限循环,从而影响网络性能,甚至导致网络瘫痪。
为保障网络稳定运行,提高网络故障处理效率,特制定本应急预案。
二、适用范围本预案适用于公司内部所有网络设备,包括但不限于交换机、路由器、防火墙等。
三、组织机构及职责1. 应急指挥部:负责组织、协调、指挥网络环路故障应急处理工作。
2. 技术支持组:负责网络环路故障的排查、处理及修复工作。
3. 信息发布组:负责向相关部门及人员发布网络故障信息及应急处理进展。
4. 后勤保障组:负责应急物资的调配、运输及保障工作。
四、应急响应流程1. 网络故障发现(1)当网络用户反映网络异常时,第一时间通知技术支持组。
(2)技术支持组进行初步排查,确认是否存在网络环路故障。
2. 确认故障(1)技术支持组通过ping测试、抓包分析等方法,确定网络环路故障的存在。
(2)将故障情况上报应急指挥部。
3. 启动应急预案(1)应急指挥部接到故障报告后,立即启动应急预案。
(2)技术支持组按照预案要求,展开应急处理工作。
4. 故障排查(1)技术支持组对网络设备进行逐个排查,找出环路故障的具体设备。
(2)针对不同设备,采取以下措施:a. 对于交换机,检查端口状态、链路协议等,排除端口冲突、协议不匹配等问题。
b. 对于路由器,检查路由表、接口状态等,排除路由冲突、接口故障等问题。
c. 对于防火墙,检查规则配置、访问控制列表等,排除规则冲突、访问控制问题。
5. 故障修复(1)针对排查出的故障设备,进行故障修复。
(2)修复过程中,确保不影响其他网络设备正常运行。
6. 故障验证(1)故障修复后,进行网络连通性测试,确保网络恢复正常。
(2)将故障修复情况上报应急指挥部。
7. 应急结束(1)应急指挥部确认网络恢复正常,宣布应急结束。
(2)技术支持组对故障原因进行总结,形成故障分析报告。
五、应急保障措施1. 应急物资:准备应急设备、备件、工具等,确保应急处理工作顺利进行。
交换机二层环路问题处理指南
目录1 介绍..................................................... 错误!未定义书签。
2 网络业务故障,如何确认存在环路?......................... 错误!未定义书签。
第一步:是否可以通过端口流量发现数据风暴?......... 错误!未定义书签。
第二步:是否可以通过MAC-Flapping检测漂移?......... 错误!未定义书签。
框式交换机................................... 错误!未定义书签。
盒式交换机................................... 错误!未定义书签。
第三步,是否可以通过环路检测发现环路?............. 错误!未定义书签。
Loop Detection(框式) ......................... 错误!未定义书签。
Loopback Detection(盒式) ..................... 错误!未定义书签。
3 环路问题发生后,如何快速破环?........................... 错误!未定义书签。
第一步:是否理解网络业务并明确拓扑?............... 错误!未定义书签。
第二步:是否需要用影响最小的方法破环?............. 错误!未定义书签。
方法一:端口退出成环VLAN破环................. 错误!未定义书签。
方法二:shutdown成环端口破环................. 错误!未定义书签。
方法三:通过拔出成环光纤破环................. 错误!未定义书签。
第三步:操作后确认业务是否恢复?................... 错误!未定义书签。
4 环路问题发生后,如何定位问题根因?....................... 错误!未定义书签。
路由器出现环路现象怎么办
路由器出现环路现象怎么办路由器出现环路现象怎么办路由环路,就是数据包不断在这个网络传输,始终到达不了目的地,导致掉线或者网络瘫痪。
造成路由器环路的原因有很多,下面就有店铺分享路由器出现环路现象解决方案,欢迎大家学习!主要分为六大类:1、定义最大值距离矢量路由算法可以通过IP头中的生存时间(TTL)自纠错,但路由环路问题可能首先要求无穷计数。
为了避免这个延时问题,距离矢量协议定义了一个最大值,这个数字是指最大的度量值(最大值为16),比如跳数。
也就是说,路由更新信息可以向不可到达的网络的路由中的路由器发送15次,一旦达到最大值16,就视为网络不可到达,存在故障,将不再接受来自访问该网络的任何路由更新信息。
2、路由环路水平分割一种消除路由环路并加快网络收敛的方法是通过叫做“水平分割”的技术实现的。
其规则就是不向原始路由更新来的方向再次发送路由更新信息(个人理解为单向更新,单向反馈)。
比如有三台路由器ABC,B向C学习到访问网络10.4.0.0的路径以后,不再向C声明自己可以通过C访问10.4.0.0网络的路径信息,A向B学习到访问10.4.0.0网络路径信息后,也不再向B声明,而一旦网络10.4.0.0发生故障无法访问,C会向A和B发送该网络不可达到的路由更新信息,但不会再学习A和B发送的能够到达10.4.0.0的错误信息。
3、路由环路路由中毒(也称为路由毒化)定义最大值在一定程度上解决了路由环路问题,但并不彻底,可以看到,在达到最大值之前,路由环路还是存在的。
为此,路由中毒就可以彻底解决这个问题。
其原理是这样的':假设有三台路由器ABC,当网络10.4.0.0出现故障无法访问的时候,路由器C便向邻居路由发送相关路由更新信息,并将其度量值标为无穷大,告诉它们网络10.4.0.0不可到达,路由器B收到毒化消息后将该链路路由表项标记为无穷大,表示该路径已经失效,并向邻居A路由器通告,依次毒化各个路由器,告诉邻居10.4.0.0这个网络已经失效,不再接收更新信息,从而避免了路由环路。
环路故障和DHCP故障处理
环路故障和DHCP故障处理环路故障故障原因:以太网中的交换机之间存在不恰当的端口相连会造成网络环路,如果相关的交换机没有翻开STP功能,这种环路会引发数据包的无休止重复转发,形成播送风暴,从而造成网络故障。
说通俗点就是交换机自身或互相之间串连起来了,就构成了环路。
所有环路的形XX是由于目的路径不明确导致混乱而造成的。
网络环路也分为第二层环路和第三层环路。
第二层是指,一个播送信息经过两个交换机的时候会不断恶性循环的产生播送,造成环路。
而第三层环路那么是原路由意外不能工作,造成路由通告错误,形成一个恶性循环。
例子:网络192.168.0.0/24--路由1--路由2 正常192.168.0.0/24网络被路由1通告到路由2,当网络出问题不能到达的时候,路由1把192.168.0.0/24路由信息删除,但是路由2通告给了路由1,让路由1误以为路由2的那边能到达192.168.0.0/24网络,结果造成恶性循环(例子建立在RIP,IGRP等路由协议下,只有这两个协议会造成第三层环路)。
我们在日常工作中经常遇到的环路多是属于第二层环路。
环路的危害非常大,重那么导致一个会聚层下的的所有网络中断,轻那么至少一片区域的网络中断,给公司运营带来巨大的损失。
故障排查:使用PING命令查环路通过对环路产生原因的分析,我们了解到如果网络存在环路,那么播送数据将会以2的N次方的数量增加,最终导致网络通信拥塞,网络丢包严重。
通常我们在日常工作判断网络通信质量采用PING命令,如下列图:当我们遇到环路影响的故障时,一般机房里有可网管交换机的,可以查看到是交换机几号口下有环路影响,根本上可能迅速锁定故障点。
但到遇到机房无可网管交换机时,就需要将交换机上的所有线路暂时中断,只保存上联主干线路,一直不断长PING网络。
同时将刚刚拨下的线路逐一插回,每插一根线路的时候等待一到二分钟左右的时间,观测是否出现丢包现象。
当插上一根线路的时候,出现丢包现象,可能判断该线路下存在环路影响。
城域网接入层环路故障处理方法
城域网接入层环路故障处理方法近期城域网环路引起的网络故障爆发较多,已经影响了网络的正常运行,故决定在城域网接入层设备上启用环路检测功能,以及在汇聚交换机上启用BRAS MAC地址绑定来杜绝和规避环路对网络的影响。
启用环路检测功能的地设备原则上应该在尽量靠近用户的接入设备,一般而言指的是楼道级别交换机,DSLAM接入设备,EPON系统ONU设备;6506及T64G汇聚交换机及5680T OLT 设备,原则上不启用环路检测,只启用Bras的MAC地址绑定功能;3928及3906设备原则上不启用环路检测功能。
特别注意,上行口及级联端口务必配置为不受控,受控状态只配置在用户接口上面相关配置模板如下:第一部分:汇聚层交换机及OLT设备在6506上启用MAC地址绑定,规避环路引发的故障;65对PPPOE流量在下行口所在芯片的转发流程比较特殊,上行转发在pvid vlan,下行转发在映射后vlan(svlan-id),这种机制导致城域网优化改造之前没有暴露出的问题暴露了出来。
对于城域网,出现环路的概率是很高的,接入二层交换机和DSLAM上均存在引入环路的可能。
在单层VLAN环境下,65所在位置为二层透传,出现MAC地址漂移后很快就会被后续的报文更新。
在灵活QINQ 环境下,MAC地址漂移问题变得很严重,上下行转发不同VLAN导致后续的报文无法更新MAC,只能采用自然老化。
在网上,表现为上网流量周期性中断。
解决办法为在下行口配置静态MAC,手工把上行BAS的MAC拷贝到下行口的pvid vlan,使得上行流量能够找到MAC进行单播转发,并且保证BAS的MAC地址不会出现漂移。
注意,配置静态MAC一定要指定到下行口的pvid vlan。
配置实例如下:mac-address static 123a-56e2-685f interface GigabitEthernet1/0/2 vlan 4003 mac-address static 123a-56e2-685f interface GigabitEthernet1/0/2 vlan 4006 mac-address static 123a-56e2-785f interface GigabitEthernet1/0/1 vlan 4007 mac-address static 123a-56e2-785f interface GigabitEthernet1/0/1 vlan 4008 mac-address static 123a-56e2-785f interface GigabitEthernet1/0/1 vlan 4009 mac-address static 123a-56e2-785f interface GigabitEthernet1/0/1 vlan 4010 mac-address static 123a-56e2-785f interface GigabitEthernet1/0/1 vlan 4011 mac-address static 123a-56e2-785f interface GigabitEthernet1/0/1 vlan 4012 mac-address static 123a-56e2-785f interface GigabitEthernet1/0/1 vlan 4013 mac-address static 123a-56e2-785f interface GigabitEthernet1/0/1 vlan 4014 mac-address static 123a-56e2-785f interface GigabitEthernet1/0/1 vlan 4015 mac-address static 123a-56e2-785f interface GigabitEthernet1/0/1 vlan 4016第二部分:部分楼道交换机环路检测配置华为2403H:1:全局打开或者关闭环回检测功能[默认打开][undo] loopback-detechtion enalbe2:端口打开或者关闭环回检测受控功能[默认打开][undo] loopback-detechion control enable3:端口打开或关闭环回检测受控功能[默认检测端口下所有能够通过的vlan中的环路] [undo] loopback-detection per-vlan enable4:显示环回检测的状态display loopback-detechtion5:设置环回检测的时间间隔[默认30s检测]loopback-detechtion interval-time [5-300]6:下行端口配置环路受控(发现环路则自动关闭该端口)loopback-detechion control enable7:上行的trunk口配置环路不受控undo loopback-detechion control enable备注:支持系列S3026,S2403H,S2026,S2008,S2016,S2000EI系列,S2000C系列,S3026SI系列,S3026E,S3026CGT,S3026C-PW,S3026EF,S3526E,S3526C,S3526EF,S3526,S3526F,S3026F,S3528/52系列,S3050。
网络环路故障处理
⽹络环路故障处理⽹络环路故障处理⽅法⼀、⽹络环路形成的原因⾸先,介绍⼀下造成⽹络环路原因。
由于机房的交换机都由专业的设备维护⼈员管理和操作,所以这⾥我们不考虑机房交换机环路的可能性,⽽是着重介绍终端⽤户HUB所造成的环路。
如下图所⽰是HUB环路⽰意图:⼀旦⽹络中出现上图HUB的连线⽅法,⽹络环路就形成了!环路引起的实质问题是⼴播风暴,⽽⼴播风暴只在同⼀⽹段内传播,它往往只影响同⼀⽹段内的电脑。
但是当⼀台受到⼴播风暴影响的交换机配有其他vlan(⽹段),那么与该交换机连接的所有⽹段的电脑都将受到影响,因为“⼴播风暴”会占⽤⼤量⽹络带宽,导致正常业务不能运⾏,甚⾄彻底瘫痪,通俗点说就是该交换机“死机”了。
如果该交换机是⼀台汇聚甚⾄是核⼼交换机,那么影响的范围将会更⼴!⼆、⽹络环路的现象接着,介绍⼀下⽹络环路的现象。
⽹络中出现环路后,往往会出现很奇怪并令⼈费解的现象让设备维护⼈员很难判断故障原因。
具体现象有:内⽹、外⽹⽹页有时能打开但很卡,有时⼜打不开;ping⽹关丢包且丢包率不稳定;与电脑直连的HUB和机房对应的接⼊层交换机端⼝灯狂闪。
以上现象出现时,基本可判断是⽹络环路故障。
三、⽹络环路的处理⽅法准确判断故障原因是快速处理故障的先决条件,知道原因后解决它只是时间问题了。
现将⽹络环路⼤致的处理流程和⽅法总结如下:1、了解⽹络的拓扑结构设备维护⼈员到现场后,⾸先要知道或试图了解现场⽹络的拓扑结构。
简单的说,你要知道电脑是连的哪个HUB,HUB是连到机房哪台接⼊层交换机上,⽽接⼊层交换机⼜是如何与汇聚层交换相连的。
这⾥列出我们公司常见两种接⼊层拓扑结构:拓扑图1:接⼊层交换机分别与汇聚层交换机直连。
拓扑图2:接⼊层交换机互相串联后再与汇聚层交换机相连。
2、缩⼩排查范围⽆论是何种拓扑结构,我们都应该先⽤笔记本直连汇聚层或核⼼层交换机,测试⽹络是否正常以排除汇聚层或核⼼层交换机本⾝的故障导致的问题。
下⾯我们假设拓扑图1和拓扑图2中的(vlan10:192.168.130.0/24,⽹关:192.168.130.254)⽹段中出现了环路。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
网络环路故障处理方法
一、网络环路形成的原因
首先,介绍一下造成网络环路原因。
由于机房的交换机都由专业的设备维护人员管理和操作,所以这里我们不考虑机房交换机环路的可能性,而是着重介绍终端用户HUB所造成的环路。
如下图所示是HUB环路示意图:
一旦网络中出现上图HUB的连线方法,网络环路就形成了!
环路引起的实质问题是广播风暴,而广播风暴只在同一网段内传播,它往往只影响同一网段内的电脑。
但是当一台受到广播风暴影响的交换机配有其他vlan(网段),那么与该交换机连接的所有网段的电脑都将受到影响,因为“广播风暴”会占用大量网络带宽,导致正常业务不能运行,甚至彻底瘫痪,通俗点说就是该交换机“死机”了。
如果该交换机是一台汇聚甚至是核心交换机,那么影响的范围将会更广!
二、网络环路的现象
接着,介绍一下网络环路的现象。
网络中出现环路后,往往会出现很奇怪并令人费解的现象让设备维护人员很难判断故障原因。
具体现象有:内网、外网网页有时能打开但很卡,有时又打不开;ping网关丢包且丢包率不稳定;与电脑直连的HUB和机房对应的接入层交换机端口灯狂闪。
以上现象出现时,基本可判断是网络环路故障。
三、网络环路的处理方法
准确判断故障原因是快速处理故障的先决条件,知道原因后解决它只是时间问题了。
现将网络环路大致的处理流程和方法总结如下:
1、了解网络的拓扑结构
设备维护人员到现场后,首先要知道或试图了解现场网络的拓扑结构。
简单的说,你要知道电脑是连的哪个HUB,HUB是连到机房哪台接入层交换机上,而接入层交换机又是如何与汇聚层交换相连的。
这里列出我们公司常见两种接入层拓扑结构:
拓扑图1:接入层交换机分别与汇聚层交换机直连。
拓扑图2:接入层交换机互相串联后再与汇聚层交换机相连。
2、缩小排查范围
无论是何种拓扑结构,我们都应该先用笔记本直连汇聚层或核心层交换机,测试网络是否正常以排除汇聚层或核心层交换机本身的故障导致的问题。
下面我们假设拓扑图1和拓扑图2中的(vlan10:192.168.130.0/24,网关:192.168.130.254)网段中出现了环路。
拓扑图1出现环路:先断图中交换机switch2的电,再在交换机switch1上找一台电脑使用ping 192.168.130.254 –t命令观察网络是否正常。
如果交换机switch2断电后,原本不正常的网络变得正常了,那么表明环路在交换机switch2上的某个HUB上。
如果网络依然不正常,那么表明环路在交换机switch1上。
也可以断交换机switch1的电在交换机switch2上来验证。
接入层交换机有多台时也可以用此方法来一一测试,最终找到有环路的那台接入层交换机。
拓扑图2出现环路:排查顺序就变得尤为重要了,必须自上而下的进行。
即先断交换机switch2的电或断开switch1与switch2的连接线,在switch1用ping 192.168.130.254 –t命令观察网络是否正常,如果正常则表明switch2上有环路,如果网络依然不正常则表明switch1上有环路。
当有多台接入层交换机串联时,依然使用此方法自上而下进行排查。
3、找出有环路的端口
当通过上述方法找到有环路的交换机后,想要找出哪个端口有环路就变得简单了。
具体方法是:先给交换机断电然后再接上电源,认真观察每个端口的亮灯情况,一般要等待1分钟左右端口灯才开始闪烁,一定要观察到第一个开始快速闪烁的端口,那个端口就是有环路的端口,如果没有看清楚,重新断电后再进行观察。
4、排除故障
找出有环路的端口后,可以直接将这个端口的网线拔出,然后测试网络是否正常,网络正常后故障就被排除了。
最后只要找到这个端口对应的房间将接了环路的HUB找到把网线连接正确就可以了。
四、通过交换机命令发现网络环路
我们公司大部分交换机都是华三的,这里就以华三交换机为例,介绍一些有助于排查环路的交换机命令(实验机型H3C S3610)
1、stp enable
display stp brief
我将交换机的端口1和端口2用一根网线连起来,使用命令如下图所示:
我们可以看到ethernet1/0/2处于discarding状态,说明ethernet1/0/2被生成树协议关闭了(具体为何不关闭ethernet1/0/1而关闭ethernet1/0/2是STP协议计算得出的结果,这里不作深究)。
在实际工作中,当一个办公室的两个网络面板上的网口接到了一台HUB时,用这两个命令来排查环路是最适合的。
2、loopback-detection enable
该命令的原理是:环回监测会在相应端口发送检测包,如果能够从发送的端口收到发送的包,即为端口内存在环路,对access端口,会删除mac列表,block端口,对trunk端口会上报,不会禁用端口。
我将端口1下接一个HUB,再用一根网线连接HUB上的任意两个端口形成环路,使用命令如下图所示:
先在全局模式下开启环回监测:
再在端口模式下开启环回监测:
这里我们看到端口ethernet1/0/1有环路,提示需要检查。
也可以使用display loopback-detection直接查看有环路的端口,如下图所示:
得出的结论依然是:端口ethernet1/0/1有环路。
在实际工作中,只有确定了某一台交换机有环路时,才适用该命令,而不能一开始就使用该命令来排查,否则工作量太大难以快速找到有环路的端口。
3、display cpu
当网络中出现环路时,交换机会出现“死机”现象,这必然会使交换机CPU使用率很高。
使用命令如下图所示:
上图CPU值是正常的,如果出现类似:
98% in last 5 seconds
55% in last 1 minute
56% in last 5 minutes
的情况就说明交换机“死机”了,当然交换机“死机”不一定只是环路造成的,但
这可以给我们一定的提示,表明这台交换机有问题。
五、网络环路优化
1、开启生成树协议,常见生成树协议有STP、RSTP、MSTP,由于生成树协议会占用
一定的交换机资源,这里只做了解和排查故障用。
2、风暴抑制命令broadcast-suppression用来在端口下设置广播风暴抑制比,本命令设置
的是端口允许通过的最大广播报文流量,当端口上的广播流量超过设置值后,系统将丢弃超出广播流量限制的报文,从而使端口广播流量所占的比例降低到限定的范围,保证网络业务的正常运行。
默认情况下端口上允许通过的广播流量为100%,即不对广播流量进行限制。
我们将端口ethernet1/0/1的广播风暴抑制比设置为20%,如下图所示:
也可以设一个端口组来一次性对多个端口进行设置,如下图所示:这样就一次性把端口ethernet1/0/10至ethernet1/0/20设置好了。