交换机中网络环路常见问题详解

合集下载

交换机引起的路由环路故障破解

交换机引起的路由环路故障破解

交换机引起的路由环路故障破解交换机引起的路由环路故障破解在小型网络中,在维护路由表信息的时候,如果在拓扑发生改变后,网络收敛缓慢产生了不协调或者矛盾的路由选择条目,就会发生路由环路的问题,这种条件下,路由器对无法到达的网络路由不予理睬,导致用户的数据包不停在网络上循环发送,最终造成网络资源的严重浪费。

如何解决路由环路故障?下文是店铺收集的用实例演示如何破解由于交换机引起的故障,希望对你有帮助。

网络拓扑:某单位采用了标准的三层网络拓扑结构,即核心层、汇聚层、接入层。

接入交换机采用二层交换,汇聚交换机采用了三层交换,划分了多个VLAN,每个部门一个VLAN。

客户端连接24口接入交换机,接入接入交换机上联汇聚交换机,汇集交换机为每个部门分配一个VLAN,每个VLAN一个C段。

如:部门A的VLAN号为10,IP地址段为:192.168.10.0,子网掩码:255.255.255.0,网关:192.168.10.254。

一、故障现象某日接到部门B的电话,说整个部门都不能上网,于是先在自己电脑上进行测试,PING我部门网关显示正常(我部门网关和部门B的网关不同)显示正常,访问Internet也正常,也并没有其他部门反映网络故障,所以排除全网故障。

并不是部门B的某一台电脑不能上网,所以怀疑属于部门B的内部局域网故障。

二、故障排查过程1. 远程登录汇聚交换机,进行网络排查。

登录汇聚交换机,在汇聚交换机中Ping部门B的网关,Ping不通。

查看交换机接口状态,该部门的接口状态显示为:“err-disabled”.经过分析后,认为最可能的原因是环路引起的,但是还不能确定,因此需要现场测试。

2. 现场测试汇集交换机。

在汇聚交换机上拔下该部门的上联线,利用笔记本直接联入汇集交换机,将笔记本的IP地址设置成该部门的IP。

并通过Console口登录交换机,查看状态,发现此接口还是处于“err-disabled”状态,利用命令“shutdown”,再“no shutdown”,重启接口,接口状态变为“connected”。

交换机常见故障解决(word文档良心出品)

交换机常见故障解决(word文档良心出品)

交换机英文:Switch,意为“开关”是一种用于电信号转发的网络设备。

它可以为接入交换机的任意两个网络节点提供独享的电信号通路。

最常见的交换机是以太网交换机。

其他常见的还有电话语音交换机、光纤交换机等。

①网络环路故障Ⅰ.故障现象: 在规模较大的局域网网络中,时常会遇到网络通道被严重堵塞的现象。

Ⅱ.故障原因: 造成这种故障现象的原因有很多,例如网络遭遇病毒攻击、网络设备发生硬件损坏、网络端口出现传输瓶颈等。

不过,从网络堵塞现象发生的统计概率来看,网络中发生过改动或变化的位置最容易发生故障现象,因为频繁改动网络时很容易引发交换机网络环路,而由交换机网络环路引起的网络堵塞现象常常具有较强的隐蔽性,不利于故障现象的高效排除。

Ⅲ.解决方法: 判断交换机网络环路的思路由于现在新买回来的交换机几乎都支持端口环回监测功能,巧妙地利用该功能,我们就能让交换机自动判断出指定通信端口中是否发生了交换机网络环路现象。

一旦我们在指定的以太网通信端口上启用环回监测功能后,交换机设备就能自动定时对所有通信端口进行扫描监测,以便判断通信端口是否存在交换机网络环路现象。

要是监测到某个交换端口被网络环回时,该交换端口就会自动处于环回监测状态,依照交换端口参数设置以及端口类型的不同,交换机就会自动将指定交换端口关闭掉或者自动上报对应端口的日志信息。

日后我们只要查看日志信息或根据端口的启用状态,就能快速判断出局域网中是否存在交换机网络环路现象了。

现在,本文就以H3C S3050型号的交换机为操作蓝本,向各位详细介绍一下利用环回监测功能判断交换机网络环路现象的具体配置步骤。

启用端口环回监测为了能让交换机自动判断出本地局域网中是否存在交换机网络环路现象,我们需要启用交换机的端口环回监测功能,同时还要启用端口环回监测受控功能,不过在默认状态下,这些功能都处于关闭状态,我们需要手工配置交换机,才能将交换机指定端口环回监测功能以及端口环回监测受控功能启用起来。

解决局域网中交换机网络环路问题的经验方法

解决局域网中交换机网络环路问题的经验方法

候 要 及 时进 行 解 决
( 3 ) 在信息化建设过程 中, 要 保 证 信 息数 据 的 录入 是 准确
平 台. 降 低 了就 业 成 本 , 提 高 了 工 作 岗位 与 个 人 的 匹配 度 , 提 无 误 的 . 尤其 是 在 最 近 几 年 来 , 社 会保 障 卡 制作 基 础 信 息 的采
休止重复转发 , 形 成 广 播 风暴 , 从 而 造 成 网络 故 障 。
【 关键词 】 交换 机; 环 路; I P 地址 【 中图分类号 1 T P 3 9 3 . 1 【 文献标识码 】 B 【 文章编号 】 1 0 0 6 — 4 2 2 2 f 2 0 1 3 ) 1 2 — 0 0 4 9 — 0 2
台汇 聚 交 换机 的性 能似 乎 还 行 , 感 觉 不到 有什 么 问题 。 于是 我 通 网络 中心 的 测 试 主机 。 我 们 确认 链 路 没 问题后 , 每 次 将 剩余 们 在 这 台汇 聚 交换 机 上 镜像 这 个 异 常 端 口 ,用 协 议 分 析 工具
S n i f f e r来抓 包 . 最 多时 每 秒 钟 居 然 能抓 到 1 0万 多 个 。 对 这 些 数据 包进 行 简 单分 析 , 我 们 发 现 其 中一 些 共 同特 征 当 时 , 我 们 网 线数 量 的 一 半 插 回 该 交 换 机 ,经 测 试 没 问 题 则 如 是 继 续 下
业 平 台在 收 集 了求 职人 员的 基 本 信 息 以及 需要 的就 业 岗位 之
后 .可 以 利 用 网络技 术 从 数 据 库 中找 出与 求 职 者 比较 匹 配 的
综上所述 , 随 着信 息化 的 不 断发 展 . 为 就 业 服 务提 供 了机 遇, 也 带 来 了挑 战 。 作 为 就 业 管理 和 服 务 单 位 , 我 们要 认 真 看

交换机-路由器 网络环路

交换机-路由器 网络环路

问题1:交换机1能用、路由器2不能用(原因及使用后果。

如何操作路由器才能使用以及原因);原因:校园网安装了独立的DHCP3服务器,而路由器默认开启了DHCP功能,会和校园网的DHCP服务器造成冲突,使得大量用户自动获得的IP地址不正确,导致大量用户不能正常上网,而且学校已针对每个IP地址限制了上网速率,若使用路由器则影响接入该设备用户的网速。

所以在校内网中不能使用路由器,要使用交换机。

后果:大量用户不能上网,严重影响网络传输速率。

解决方法:关闭路由器的dhcp,关闭路由器的路由功能,不要使用wan口4,只使用lan口5上联学校网络,把路由器当做交换设备。

关闭方法:1、以TP LINK路由器为例。

用网线把路由器和电脑连接起来,电脑接在路由器的LAN口。

获取到IP地址以后,在IE中写入http://192.168.1.1 (192.168.1.1为大多数路由器管理ip,若不同请查阅说明书)就会出现登陆界面。

2、输入其访问帐号和访问密码进入路由器的访问界面。

(帐号和访问密码查看说明书,默认为admin)进入管理界面以后,选择DHCP服务,将DHCP服务关闭,选择“不启用”。

3、最后保存并软重起路由器。

重起之后将校园网主线接入LAN口(不使用WAN口)。

电脑也接在LAN口。

重新获取IP地址。

问题2:环路问题:种类,表现,解决。

种类:分为第二层环路和第三层环路,所有环路的形成都是由于目的路径不明确导致混乱而造成的。

第二层:环路通常都是冗余链路造成的,没有冗余链路就不存在环路。

例如一个广播信息经过两个交换机的时候会不断恶性循环的产生广播,造成环路。

第三层:通常指的是路由环路,是由于启用路由协议不当造成的,即使没有冗余链路,也有可能造成环路。

例如正常192.168.0.0/24网络被路由1通告到路由2,当网络出问题不能达到的时候,路由1把192.168.0.0/24路由信息删除,但是路由2通告给了路由1,让路由1误以为路由2的那边能达到192.168.0.0/24网络,结果造成恶性循环(例子建立在RIP6,IGRP7等路由协议下,只有这两个协议会造成第三层环路)表现:二层环路:二层环路将导致二层多播或者广播的数据包的风暴,并不在乎多播或者广播的数据包的数量多少,只要存在二层环路,那么就可以形成对整个二层网络的阻塞。

专题三:交换机网络环路故障处理

专题三:交换机网络环路故障处理

HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
4
display interface brief | include up
[Quidway]display interface brief | in up PHY: Physical *down: administratively down (l): loopback (b): BFD down InUti/OutUti: input utility/output utility Interface PHY Auto-Neg Duplex Bandwidth InUti OutUti Trunk GigabitEthernet0/0/2 up enable full 100M 0% 0.01% -GigabitEthernet0/0/16 up enable full 1000M 76% 76% 1 GigabitEthernet1/0/12 up enable full 1000M 76% 76% 1 MEth0/0/1 up enable half 100M 0.01% 0.01% --
Trunk -1 1
1. 如果只有一台设备的一个端口出入方向流量较大,可能是单端口环回。 2. 如果只有一台设备的两个端口流量较大,可能是本设备两个端口环回,如上所示。 3. 如果某端口只有单方向流量,需要重点排查,该端口下设备可能存在环路。
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
9
第一步:通过流量异常发现环路风暴
还可以通过CPCAR丢包来发现网络异常环路。 通常情况下,ARP报文的交互是有序进行,短时间内不会出现大量ARP报文的丢弃。 当交换机作为汇聚网关时,出现上述情况后,可能是ARP广播报文在网络物理环路 中转发,形成ARP广播风暴冲击交换机,进而被交换机CPU限速(CPCAR)丢弃。 如下所示,arp-request大量丢弃,可能存在网路环路:

以太网交换机环路产生的原因及分析方法

以太网交换机环路产生的原因及分析方法

以太网交换机环路产生的原因及分析方法摘要:现代企业在发展过程中基本都会应用网络,但在长期使用中可能会出现以太网交换机环路,如未能对其及时处理则可能引发严重网络故障,非专业人士会通过插拔网线进行检测,但如果网络环境复杂则难以判断,可见这一传统方式并不适用,基于此下面将对以太网交换机环路产生的原因进行分析,并提出了预防交换机环路的具体方法。

关键词:以太网;交换机;环路;原因分析前言:在网络设备连接中,单一链路连接中可能受到多种原因影响而出现网络中断的问题,因此会选用组网方式完成构建,在备份链路中交换机相互连接,为了能够切实保证网络的稳定性,通过冗余链路提高网络的稳定性,但这样可能在运行过程中出现环路,出现广播风暴造成网络拥塞,导致电力自动化系统无法正确传输电力设备的状态信息,后续工作难以顺利进行,下面将对此进行分析。

1以太网交换机环路原理1.1交换机传输交换机是数据链路层的设备,其从端口接收数据包,能够读取数据包头部中的源MAC地址,从地址表中查找对应的端口,识别数据包中的各类相关信息,并在交换机中维护地址表,将这些MAC地址与对应的端口记录在自身内部的一个地址表中,随后将数据包直接发送到该端口上完成数据传输。

同时,如果在地址表中找不到对应的端口,交换机可以根据MAC地址转发数据包,记录这一目的MAC 地址与哪个端口,获知源MAC地址的设备连接位置,以此将数据包从哪个端口转发出去,在下次传送数据时不再需要对所有端口进行广播,不断循环此过程。

1.2交换机环路交换机环路的场景较为直观,其中设备自环为一根网线分别布置在2个端口上,相互连接形成环路,设备开启时会发出地址解析协议询问,若两台交换机之间只有1条链路,那么报文通过1号端口进入后会从2号端口发出去,此信息记录在交换机的地址表中,设备收到广播信息后发送应答消息,网络中发送的广播报文数据量增加,收到广播后会进行拓展,如此往复循环便会形成广播风暴,最终导致交换机无法正常通信[1]。

华为交换机网络环路识别和问题定位

华为交换机网络环路识别和问题定位

1
GigabitEthernet1/0/12
up enable full
1000M 76% 76%
1
MEth0/0/1
up enable half
100M 0.01% 0.01% --
对于流量出入都异常大的端口,需要特别关注,可能都是网络异常环路上的端口。
display cpu-defend
statistics &l ?
Interface
PHY Auto-Neg Duplex Bandwidth InUti OutUti Trunk
GigabitEthernet0/0/2
up enable full
100M 0% 0.01% --
GigabitEthernet0/0/16
up enable full
1000M 76% 76%
第一步:通过流量异常发现环 路风暴
还可以通过CPCAR丢包来发现网络异常环路。
通常情况下,ARP报文的交互是有序进行,短时间内不会出现大量ARP报文的丢弃。 当交换机作为汇聚网关时,出现上述情况后,可能是ARP广播报文在网络物理环路中 转发,形成ARP广播风暴冲击交换机,进而被交换机CPU限速(CPCAR)丢弃。
如何分析环路的成因
网路环路一般都很网络变动相关,需要先从近期的网络变动排查起。
1. 是否由于近期施工或者客户操作操作引入环路。
如果环路问题是由于近期施工操作引入,可以和施工方确认,了解施工的过程, 特别是新增线路连接的细节,结合拓扑结构,确认后排出物理环路。
2. 是否由于近期修改配置引入的环路,重点检查如下几类端口或环路相关 的操作命令:
交换机网络环路识别和 问题定位
目录
• 诊断工具

交换机在网络中的常见故障及解决方法

交换机在网络中的常见故障及解决方法

交换机在网络中的常见故障及解决方法交换机在网络中的常见故障及解决方法我的机器通过交换机和其他设备相连在同一网段,但是却ping不通,是哪些问题造成的?有可能是硬件故障或是设置故障。

若是硬件故障,应检查交换机的显示灯、电源和连线是否正确,交换机是否正常。

若是设置故障,先检查交换机是否设置了IP地址,如果设置了和其他设备不在同一网段的IP地址,将其删除或设一个和其他设备在同一网段的IP地址;然后再看看是否是VLAN设置的故障,如果交换机设置了不同的VLAN,连接交换机的几个端口属于不同的VLAN,所以不通,此时,您只要将设置的VLAN去除即可。

我想用FEC的功能,当我把2个交换机的两对端口用2条线同时相连时,却发现每个交换机始终是一个端口正常另一个端口显示红灯,是不是交换机的端口有故障?一般来说,这种情况交换机是正常的,因为2个交换机是用2个端口相连,所以交换机认为有LOOP存在,它就自动断掉其中的一根,将相应的端口Down掉(显示红灯的端口)。

解决方法是: 打开Spanning-tree的功能(缺省情况下是打开的),让交换机知道这2个端口是FEC的功能,逻辑上是一个端口。

我的交换机原来连在10/100Mbps自适应网卡的机器上能够非常正常地工作,现在连在100Mpbs网卡的服务器却出现红灯亮的情况,无法通信,是否交换机有问题?这种情况是由于配置不当引起的。

交换机的端口很可能被强制设置成10Mbps,在连到100Mbps端口的情况下才会报错。

解决方法是: 在端口配置下,将端口速度恢复成自适应或强制设置成100Mpbs。

我的交换机设置了若干VLAN,我在同一个VLAN内的机器不在一个网段,它们可以通信吗?不可以。

同一个VLAN只能在同一个网段内,不同网段不可以划在同一个VLAN,否则交换机会报错。

我想把Cisco Catalyst 3524连接到一个由交换机连接的现有网络上。

主交换机是一个Catalyst 6509,它的GBIC已经与Catalyst 4006交换机相连。

局域网用户端交换机环路引起故障

局域网用户端交换机环路引起故障

局域网用户端交换机环路引起故障
只有三口流量不正常,三口所带的用户问题,用户端不停地发包,流量过大造成三层交换机上联口拥塞,从而影响其他用户正常上网。

这是典型的用户端交换机环路故障问题,针对局域网用户端交换机环路故障的原因主要有以下的几个方面。

检查机房三层交换机运行情况的方法来判断故障点的位置,当将用户交换机e2/8端口线路拔出后,机房内人员报告三层交换机运行恢复正常,立刻检查该线路,发现这条线路的另一端连接在第e2/29端口,原来是这条线路两端都连接在交换机上造成环路,导致链路拥塞,用户无法上网。

总结下来就是说明三点问题:
(1).用户交换机走线杂乱,线路未作标签,业务走向不明,是造成环路故障的主要原因。

(2).由于造成环路的端口未使用,没有配置业务,导致交换机无法在13志中产生环路告警,也未能报告出哪个VLAN故障。

(3).环路可造成广播风暴,数据流量猛增,造成汇聚设备上联口拥塞,远程无法登录。

电脑中ARP病毒后不停发包,也能造成设备死机,远程无法登录,两种情况有相似之处。

所以网管们在日常的维护工作中注意机房内的资料整理,确保线路连接整齐规范。

在处理故障时多注意观察三层交换机日志和端口流量,能有效地减少网络故障和处理故障时间。

希望对你们有帮助。

网络环路引起的故障汇总

网络环路引起的故障汇总

网络环路引起的故障汇总在日常维护中,由于各种原因有时会形成网络环路。

以下汇总了自接手IP 维护工作以来碰到过的各种环路问题,由于水平有限,错误的地方请指正。

1、在调试设备时测试光路形成的环路。

目前DSLAM设备都下挂在L2 S8505。

在调试新DSLAM设备时,我们一般都会先完成数据配置再到现场开局。

有时我们会在远端机房的ODF进行收发环路,通过查看交换机端口是否UP的方法来判断光路是否正常。

事实上这样会造成VLAN 31环路,引起L2 S8505和下带设备的网管通信中断。

如果要采用此方法测试,应提前删除该端口的VLAN 31透传,等设备调试起来后再加入。

2、在配置或取消链路聚合时形成的环路。

为实现二层网络双路由保护或流量分担,链路聚合的应用越来越多。

链路聚合组要求端口的数据配置必须一样,也就是透传的VLAN也一样。

如果端口取消了链路聚合就会形成环路,该环路肯定会影响到业务。

如果端口也透传了VLAN 31,同理也会影响到L2 S8505和下带设备的网管。

2007年张埔IPSU和新局L2 S8505对开链路聚合时,由于有问题取消聚合,聚合取消后不仅引起了PPPOE、IPTV业务阻断,也引起了L2 S8505网管中断。

另外如华为的EPON OLT设备和L2 S8505对开聚合组时,调试人员最初将端口设置为强制模式。

为实现单芯中断时的业务保护,需要将强制改为自协商模式,而OLT设备必须将聚合组删除才能更改,这时就会产生环路。

因此取消链路聚合时应及时将聚合的某个端口SHUTDOWN或将配置数据删除。

3、2007年9月2日新局L2S8505下带设备网管通信频繁瞬告。

新局L2 S8505下带设备网管通信频繁瞬告,更换网管端口无效。

怀疑S8505被攻击,抓包分析发现ARP包偏多,但也不会影响到网管。

在T160G和L2 S8505下带的小L2设备上发现有接收到大量的IGMP报文信息,S3228上的LOG中有非常多的“Receive too many packets of 'igmp' from port gei_3/1”,抓包发现有非常多的IGMP报文(V2 LEAVE GROUP,源MAC地址为0015-EB6A-F186,目标MAC地址0100-5E00-002,源IP为0.0.0.0,目标IP为224.0.0.2,组播地址为239.255.40.14 )。

网络环路故障处理

网络环路故障处理

网络环路故障处理方法一、网络环路形成的原因首先,介绍一下造成网络环路原因。

由于机房的交换机都由专业的设备维护人员管理和操作,所以这里我们不考虑机房交换机环路的可能性,而是着重介绍终端用户HUB所造成的环路。

如下图所示是HUB环路示意图:一旦网络中出现上图HUB的连线方法,网络环路就形成了!环路引起的实质问题是广播风暴,而广播风暴只在同一网段内传播,它往往只影响同一网段内的电脑。

但是当一台受到广播风暴影响的交换机配有其他vlan(网段),那么与该交换机连接的所有网段的电脑都将受到影响,因为“广播风暴”会占用大量网络带宽,导致正常业务不能运行,甚至彻底瘫痪,通俗点说就是该交换机“死机”了。

如果该交换机是一台汇聚甚至是核心交换机,那么影响的范围将会更广!二、网络环路的现象接着,介绍一下网络环路的现象。

网络中出现环路后,往往会出现很奇怪并令人费解的现象让设备维护人员很难判断故障原因。

具体现象有:内网、外网网页有时能打开但很卡,有时又打不开;ping网关丢包且丢包率不稳定;与电脑直连的HUB和机房对应的接入层交换机端口灯狂闪。

以上现象出现时,基本可判断是网络环路故障。

三、网络环路的处理方法准确判断故障原因是快速处理故障的先决条件,知道原因后解决它只是时间问题了。

现将网络环路大致的处理流程和方法总结如下:1、了解网络的拓扑结构设备维护人员到现场后,首先要知道或试图了解现场网络的拓扑结构。

简单的说,你要知道电脑是连的哪个HUB,HUB是连到机房哪台接入层交换机上,而接入层交换机又是如何与汇聚层交换相连的。

这里列出我们公司常见两种接入层拓扑结构:拓扑图1:接入层交换机分别与汇聚层交换机直连。

拓扑图2:接入层交换机互相串联后再与汇聚层交换机相连。

2、缩小排查范围无论是何种拓扑结构,我们都应该先用笔记本直连汇聚层或核心层交换机,测试网络是否正常以排除汇聚层或核心层交换机本身的故障导致的问题。

下面我们假设拓扑图1和拓扑图2中的(vlan10:192.168.130.0/24,网关:192.168.130.254)网段中出现了环路。

交换机二层环路问题处理指南

交换机二层环路问题处理指南

交换机二层环路问题处理指南(总18页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--目录1 介绍..................................................... 错误!未定义书签。

2 网络业务故障,如何确认存在环路........................... 错误!未定义书签。

第一步:是否可以通过端口流量发现数据风暴........... 错误!未定义书签。

第二步:是否可以通过MAC-Flapping检测漂移........... 错误!未定义书签。

框式交换机................................... 错误!未定义书签。

盒式交换机................................... 错误!未定义书签。

第三步,是否可以通过环路检测发现环路............... 错误!未定义书签。

Loop Detection(框式) ......................... 错误!未定义书签。

Loopback Detection(盒式) ..................... 错误!未定义书签。

3 环路问题发生后,如何快速破环............................. 错误!未定义书签。

第一步:是否理解网络业务并明确拓扑................. 错误!未定义书签。

第二步:是否需要用影响最小的方法破环............... 错误!未定义书签。

方法一:端口退出成环VLAN破环................. 错误!未定义书签。

方法二:shutdown成环端口破环................. 错误!未定义书签。

方法三:通过拔出成环光纤破环................. 错误!未定义书签。

第三步:操作后确认业务是否恢复..................... 错误!未定义书签。

(完整word版)网络环路故障处理(word文档良心出品)

(完整word版)网络环路故障处理(word文档良心出品)

网络环路故障处理方法一、网络环路形成的原因首先,介绍一下造成网络环路原因。

由于机房的交换机都由专业的设备维护人员管理和操作,所以这里我们不考虑机房交换机环路的可能性,而是着重介绍终端用户HUB所造成的环路。

如下图所示是HUB环路示意图:一旦网络中出现上图HUB的连线方法,网络环路就形成了!环路引起的实质问题是广播风暴,而广播风暴只在同一网段内传播,它往往只影响同一网段内的电脑。

但是当一台受到广播风暴影响的交换机配有其他vlan(网段),那么与该交换机连接的所有网段的电脑都将受到影响,因为“广播风暴”会占用大量网络带宽,导致正常业务不能运行,甚至彻底瘫痪,通俗点说就是该交换机“死机”了。

如果该交换机是一台汇聚甚至是核心交换机,那么影响的范围将会更广!二、网络环路的现象接着,介绍一下网络环路的现象。

网络中出现环路后,往往会出现很奇怪并令人费解的现象让设备维护人员很难判断故障原因。

具体现象有:内网、外网网页有时能打开但很卡,有时又打不开;ping网关丢包且丢包率不稳定;与电脑直连的HUB和机房对应的接入层交换机端口灯狂闪。

以上现象出现时,基本可判断是网络环路故障。

三、网络环路的处理方法准确判断故障原因是快速处理故障的先决条件,知道原因后解决它只是时间问题了。

现将网络环路大致的处理流程和方法总结如下:1、了解网络的拓扑结构设备维护人员到现场后,首先要知道或试图了解现场网络的拓扑结构。

简单的说,你要知道电脑是连的哪个HUB,HUB是连到机房哪台接入层交换机上,而接入层交换机又是如何与汇聚层交换相连的。

这里列出我们公司常见两种接入层拓扑结构:拓扑图1:接入层交换机分别与汇聚层交换机直连。

拓扑图2:接入层交换机互相串联后再与汇聚层交换机相连。

2、缩小排查范围无论是何种拓扑结构,我们都应该先用笔记本直连汇聚层或核心层交换机,测试网络是否正常以排除汇聚层或核心层交换机本身的故障导致的问题。

下面我们假设拓扑图1和拓扑图2中的(vlan10:192.168.130.0/24,网关:192.168.130.254)网段中出现了环路。

交换机连接成环导致网络中断的解决办法

交换机连接成环导致网络中断的解决办法

交换机连接成环导致网络中断的解决办法网络环路导致网络瘫痪或中断是我们网管员们经常遇到的问题,但是在规模较大的网络环境中,这种故障常常具有较强的隐蔽性,让我们无法快速高效地处理。

笔者最近就遇到了一起这样的故障。

一天早晨5点多钟,笔者突然接到电话,说机房的网管系统无法访问网元设备。

披上衣服马上赶往公司。

到了公司机房,查看了一下省网管中心监控软件自动发给机房人员的短信告警信息,信息显示在两点左右,部分BSC和RNC设备脱管。

故障描述笔者单位的网管系统主要分为两部分,一部分是网管系统专用的域内终端系统,另一部分是对网元设备的监控系统。

为了全面排查故障,笔者先检查终端部分,发现各域内终端可以正常获取IP地址,并能正常访问办公、资源管理、电子运维系统(EOMS)等省公司接口服务器(Portal)。

接着检查网元部分,由于网元设备本地无权限监控,必须通过省公司4A认证服务器再访问网元设备。

现在可以访问省公司服务器进行验证,但是无法连接出问题的BSC、RNC等设备,并且也无法Ping通相关设备的IP地址。

网元系统拓扑结构如图1所示。

故障排查通过上面的检查,基本可以判端故障出现在网元部分。

通过查看端口登记发现,出问题的设备主要集中在网元交换机2华为S3952上,于是来到三层的传输机房,发现它与上联的网元汇总交换机Cisco 2960的级联端口存在故障。

这下故障点找到了,笔者认为可能是这条网线坏了或者是端口吊死了这样的小问题。

于是把网线重新插拔一下,然而故障依旧,重新换了一条网线,还是不能解决故障。

分别用网线把笔记本电脑与这两个级联口接上,发现Cisco交换机的级联口一直为Down 状态,而华为交换机的级联口就可以正常的UP。

笔者又判定是Cisco这个级联口存在故障,于是在Cisco交换机上找了一个空口并作了数据,这回将两个交换机连上,端口可用了。

满以为这下可以解决故障了,但谁知没过多久,端口又Down掉了。

静下心来笔者又将网线换回原来的接口,并对该接口进行shut、no shut操作,端口可用了,证明端口没有问题。

交换机串联产生环路的原因_概述及解释说明

交换机串联产生环路的原因_概述及解释说明

交换机串联产生环路的原因概述及解释说明1. 引言1.1 概述交换机是现代网络中至关重要的设备,它能够通过学习和转发数据包来实现局域网内部通信。

然而,在网络设计和配置中,经常会出现交换机串联产生环路的问题,这可能会导致网络故障和性能下降。

因此,了解交换机串联产生环路的原因,并掌握解决该问题的方法变得非常重要。

1.2 文章结构本文将从以下几个方面对交换机串联产生环路的原因进行探讨和解释说明。

首先,我们将介绍交换机的工作原理,了解其在局域网中的作用和功能。

然后,我们将详细讨论环路的定义以及它所带来的影响。

接着,我们将深入研究环路产生的条件和形成过程。

在第3部分中,我们将解释说明当交换机串联产生环路时可能导致的后果。

具体而言,我们将讨论广播风暴与带宽浪费问题、数据包循环转发导致网络延迟增加以及网络拓扑异常导致故障排查困难等方面。

针对交换机串联产生环路问题,在第4部分中提供了一些有效的解决方法。

我们将介绍如何使用生成树协议(STP或RSTP)来防止环路的发生,以及如何配置链路聚合(Trunking)或端口镜像(Port Mirroring)来解决特定情况下的环路问题。

此外,我们还会探讨定期检查和优化网络拓扑设计与布线规划的重要性。

最后,在第5部分中,我们将对现有网络环境中的解决方案进行评价和选择建议,并展望相关技术的未来进展和发展趋势。

此外,我们还会提出一些建议和注意事项,以帮助网络管理员更好地应对交换机串联产生环路问题。

1.3 目的本文旨在全面了解交换机串联产生环路的原因,并提供实用的解决方法。

通过深入研究交换机工作原理、环路定义与影响、环路产生条件与形成过程等方面内容,读者能够掌握防止和解决交换机串联产生环路问题的关键方法。

同时,对现有解决方案进行评估并展望未来发展趋势,为网络管理员提供有益的建议和注意事项。

2. 交换机串联产生环路的原因2.1 交换机工作原理交换机是计算机网络中的重要设备,它负责在局域网中传输网络数据包。

环路带来的问题基解决方法

环路带来的问题基解决方法

Router Y
Segment 1 Unicast
Port 0 Switch B
Port 1
Segment 2
● Host X发送一个单播帧到 Router Y ● 任何一台交换机都没有学到过host X的MAC地址 ● Switch A 和 B 从各自的port 0学到host X的MAC地址
MAC 地址表的不稳定(2)
传统网络在组播分支节点的每一个下联端口上均需要进行组播流的复制,而以太环网则只需在整个环网 上复制一次组播流 ● 是城域宽带接入网优化改造的一种重要的技术选择和解决方案
ZESR的工作方式
LINK DOWN
LINK DOWN
Transit
C
D
Transit Transit
E
Transit
Transit
Switch B
● Host X 发送一个单播帧到 Router Y
Segment 2
● 任何一台交换机都没有学到过Router Y的MAC地址
● Router Y 将收到两个完全一样的重复帧
MAC 地址表的不稳定(1)
Server/host X Unicast Switch A
Port 0 Port 1
Master
B
F
To F
primary
secondary
A
Forwading
ZESR的应用实例
几种环路解决方法的选择
● 星型网络拓扑
-传统的数据网接入方式
● 生成树STP
-用于接入层的交换链路冗余备份,一般采用MSTP
● 单端口环路检测
-怀疑交换机某端口下出现环路时使用
● 以太环网ZESR
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

交换机中网络环路常见问题详解
以太网中的交换机之间存在不恰当的端口相连会造成网络环路,如果相关的交换机没有打开STP功能,这种环路会引发数据包的无休止重复转发,形成广播风暴,从而造成网络故障。

一天,我们在校园网的网络运行性能监控平台上发现某栋搂的VLAN有问题——其接入交换机与校园网的连接中断。

检查放置在网络中心的汇聚交换机,测得与之相连的1 00BASE-FX端口有大量的入流量,而出流量却非常少,显得很不正常。

然而这台汇聚交换机的性能似乎还行,感觉不到有什么问题。

于是,我们在这台汇聚交换机上镜像这个异常端口,用协议分析工具Sniffer来抓包,最多时每秒钟居然能抓到10万多个。

对这些数据包进行简单分析,我们发现其中一些共同特征。

当时,我们急于尽快抢修网络,没去深究这些数据包的特征,只看到第1点就以为网络受到不明来历的Syn Flood攻击,估计是由一种新网络病毒引起,马上把这台汇聚交换机上该端口禁用掉,以免造成网络性能的下降。

故障排除
为了能在现场测试网络的连通性,在网络中心,我们把连接那栋大楼接入交换机的多模尾纤经光电转换器用双绞线连到一台PC上,并将其模拟成那个问题VLAN的网关。

然后,到现场找来大楼网管员,想让他协助我们尽快把感染了未知病毒的主机查到并隔离。

据大楼网管员反映,昨天网络还算正常,不过,当时本大楼某部门正在做网络调整,今天上班就发现网络不行了,不知跟他们有没有关系。

我们认为调整网络应该跟感染病毒关系不大。

在大楼主配线间,我们把该接入交换机上的网线都拔掉,接上手提电脑,能连通网络中心的测试主机。

我们确认链路没问题后,每次将剩余网线数量的一半插回该交换机,经测试没问题则如是继续下去,否则换插另一半,逐渐缩小怀疑有问题网线的数量。

我们最终找到一条会引起问题的网线,只要插上这根网线,该大楼网络就会与模拟网关中断连接。

经大楼网管员辨认,这条网线是连接昨天在做网络调整的那个部门的。

他还说以前该部们拉了一主一备两条网线,应该还有一条,并亲自在那台交换机上把另一条找了出来。

随意插上这两条网线中的一条,网络没问题,但只要同时插上,就有问题,哪有在一台交换机上同时插上两条网线才会激活网络病毒的SYN Flood攻击的?这时我们倒是觉得这种现象更像是网络中有环路。

我们到了那个部门发现有三台非管理型交换机,都是串在一起的,然而其中两台又分别通过那两条网线与接入交换机相连,从而导致了网络环路。

显然是施工人员对网络拓扑不清楚,当时大楼网管员有事外出,就自以为是地把线接错了,从而造成了这起网络
事故。

原因找到就好办了,只需拔掉其中一条上联网线即可恢复网络连通。

经过一番周折,网络恢复了正常,但我们还一直在想,是什么干扰了我们的判断呢?
故障分析
一起典型的网络环路故障,用协议分析工具Sniffer抓了这么多的数据包,经过一番分析却没看出问题来。

显然,第一眼看到大量的SYN包让我们产生了错觉,想当然地就以为是SYN Flood攻击。

事后,我们就这起网络环路故障排除过程做了检讨,重新仔细地分析抓回来的这些数据包,据此解释一下前面提到这些数据包所具有的5个共同特征,以便今后遇到同类问题时能及时作出正确的反应。

先看前4个特征:汇聚交换机是网络层设备,该大楼所属VLAN的网络层接口就设置在这台汇聚交换机上,出于实施网络管理策略的需要,对已注册或没注册的IP地址都进行了MAC地址的绑定。

TCP连接要经过3次握手才能建立起来,在这里发起连接的SYN包长度为28个字节,加上14个字节的以太帧头部和20个字节的IP报头,由Sniffer捕获到的帧长度共为62个字节(不包含4字节的差错检测FCS域)。

恰巧当时访问该VLAN的单播帧是来自外网的TCP请求包,根据以太网桥的转发机制,通过CRC正确性检测后,因已做静态ARP配置,这台汇聚交换机会将该单播帧的源MAC地址转换成本机的MAC地址,其目的MAC地址依据绑定参数来更换,并重新计算CRC值,更新FCS域,经过这样重新封装后,再转发到那栋楼的接入交换机。

再看最后1个特征:网桥是一种存储转发设备,用来连接相似的局域网。

这些网桥在所有端口上监听着传送过来的每一个数据帧,利用桥接表作为该数据帧的转发依据。

桥接表是MAC地址和用于到达该地址的端口号的一个“MA C地址-端口号”列表,它利用数据帧的源MAC地址和接收该帧的端口号来刷新。

网桥是这样来使用桥接表的:当网桥从一个端口接收到一个数据帧时,会先刷新桥接表,再在其桥接表中查找该帧的目的MAC地址。

如果找到,就会从对应这个MAC地址的端口转发该帧(如果这个转发端口与接收端口是相同,就会丢弃该帧)。

如果找不到,就会向除了接收端口以外的其他端口转发该帧,即广播该帧。

这里假定在整个转发过程中,网桥A、B、C和D都在其桥接表中查找不到该数据帧的目的MA C地址,即这些网桥都不知道应该从哪个端口转发该帧。

当网桥A从上联端口接收到一个来自上游网络的单播帧时,会广播该帧,网桥B、C收到后也会广播该帧,网桥D收到分别来自网桥B、C的这个单播帧,并分别经网桥C、B传送回网桥A,到此网桥A收到了该单播帧的两个副本。

在这样的循环转发过程中,网桥A不停地在不同端口(这时已经不涉及上联端口了)接收到相同的帧,由于接收端口在改变,桥接表也在改变“源MAC-端口
号”的列表内容。

前面已经假定网桥的桥接表中没有该帧的目的MAC地址,网桥A在分别收到这两个单播帧后,都只能再次向除了接收端口以外的其他端口广播该帧,故该帧也会向上联端口转发。

就每个单播帧而言,网桥A重复前面提到的过程,理论上,广播一次会收到21个帧,广播两次就会收到22个帧,…,广播到第n次就会收到2n个帧。

总之,网桥A照这样转发下去,很快就会形成广播风暴,这个单播帧的副本最终会消耗完100BASE-X端口带宽。

尽管在这期间上联端口会有许多数据帧在相互碰撞而变的不完整,令Sniffer捕获不到,但可以想象得到这个单播帧的重复出现次数仍然会非常多。

我们再次检查那些抓回来的数据包,几乎都发现有当时没有注意到的重复标志。

按64字节包长来计算,以太网交换机的100BASE-FX端口转发线速可达144000pps。

在这种网络环路状态下,Sniffer完全有可能每秒抓到10万多个包长为66字节的数据包。

基于上述理由,由于当时那4台交换机的桥接表中都没有该包的目的MAC地址,处于上游网络的这台汇聚交换机向该大楼发送了一个TCP请求包后,就会不断地收到由该大楼接入交换机转发回来的该TCP包的副本,而且数量非常地多(形成大流量),然而,它并不会把接收到的这些包重发回去;Internet 的网络应用是基于请求/应答模式的,只有发送/接收两条信道都畅通,才能进行端到端的通信。

一旦本次网络应用中有一条信道被堵塞了,就会使得该应用因无法进行而结束。

网络应用结束后,一般来说,发起请求一方不会就本次应用再次自动发出请求包。

于是,在网络环路状态中普遍会有一条信道有大流量,另一条信道几乎没有流量的现象。

因为VLAN有隔离广播域的功能,这些大流量不会穿越网络层,所以不会对汇聚交换机造成很大压力。

事实上,由于这种网络环路是数据链路层上的故障,只涉及到源MAC地址和目的MAC地址,不管高层封装的是什么类型的包都有可能引起广播风暴。

也就是说,当时用Sniffer抓到各种各样的数据包都是有可能的。

故障预防
校园网的接入层是面向用户的网络界面,有许多不可控的成分,情况很复杂,应由专人管理,也应在设备上给予可靠性保证。

本搂接入交换机是可管理型的,有STP功能,其他交换机都是非管理型交换机,没有STP功能。

本来事先在该接入交换机上配置了STP 功能,这起网络事故是完全可以避免的,但不知何故没有这样做,事后再做只能权当“亡羊补牢”了。

由此可见,即使接入交换机打开了STP功能,下游网络也会因某种原因构成环路,产生广播风暴,造成对上游网络本VLAN的冲击,故该接入交换机还应有广播包抑制功能,以便能将影响限制在局部范围内。

对于下游网络的交换机同样有这些需求,只是成本问题而
已。

一句话,在网络故障排除时,技术和经验固然重要,但在平时就要注意维护网络的规范连接、落实基本的防范措施更为重要。

相关文档
最新文档