以太网故障如何排除
简要三种以太网交换机故障排除方法和三个原则
简要三种以太网交换机故障排除方法和三个原则随着对信息的依赖性越来越强,对于以太网交换机的需求也越来越大,因为以太网交换机是基于以太网传输数据的交换机,以太网采用共享总线型传输媒体方式的局域网。
以太网交换机的结构是每个端口都直接与主机相连,并且一般都工作在全双工方式。
交换机能同时连通许多对端口,使每一对相互通信的主机都能像独占通信媒体那样,进行无冲突地传输数据。
不过不管是多金贵的交换机都会有故障的产生,希望这三种简单方法与三个原则对您解决故障麻烦有所帮助。
1.替换法替换法是指使用正常的以太网交换机部件来替换可能有故障的部件,从而找出故障点的方法。
它主要用于硬件故障的诊断,但需要注意的是,替换的部件必须是相同品牌、相同型号的同类交换机才行。
2.排除法当我们面对故障现象并分析问题时,无意中就已经学会使用排除法来确定发生故障的方向了。
这种方法是指依据所观察到的故障现象,尽可能全面地列举出所有可能发生的故障,然后逐个分析、排除。
在排除时要遵循由简到繁的原则,提高效率。
使用这种方法可以应付各种各样的故障,但维护人员需要有较强的逻辑思维,对交换机知识有全面深入的了解。
3.对比法所谓对比法,就是利用现有的、相同型号的且能够正常运行的以太网交换机作为参考对象,和故障交换机之间进行对比,从而找出故障点。
这种方法简单有效,尤其是系统配置上的故障,只要简单地对比一下就能找出配置的不同点,但是有时要找一台型号相同、配置相同的交换机也不是一件容易的事。
当然为了使排障工作有章可循,可以在故障分析时,应按照三个以下的原则来分析。
1..先易后难在遇到故障分析较复杂时,必须先从简单操作或配置来着手排除。
这样可以加快故障排除的速度,提高效率。
2..由软到硬发生故障,谁都不想动不动就那螺丝刀去先拆了交换机再说,所以在检查时,总是先从系统配置或系统软件上着手进行排查。
如果软件上不能解决问题,那就是硬件有问题了。
比如某端口不好用,那我们可以先检查用户所连接的端口是否不在相应的VLAN中,或者该端口是否被其他的管理员关闭,或者配置上的其他原因。
常见网络故障的检测与排除方法
操作系统
TTL值
Linux
64 / 255
Windows NT/2000/XP
128
Winodws 98
32
UNIX
255
IPCONFIG
ipconfig 顾名思义,ipconfig用于显示和修改IP协议的配置信息。 用法: ipconfig [/all |/release [adapter] |/renew [adapter]] 参数: /all——显示所有的配置信息; /release——释放指定适配器的IP; /renew——更新指定适配器的IP。 用“ipconfig / renew 0”命令可以更新0号适配器的IP。 用“ipconfig / all”命令可以显示有关本地IP配置的详细信息。显示结果如下:
步骤三:确定是网卡故障还是IP参数配置不当 查看网卡指示灯和系统设备表中网卡状态,确定网卡是否出现故障以及网卡驱动程序是否正确安装,。 使用Ping和ipconfig命令来查看和测试ip参数配置是否正确,主要包括:IP地址与子网掩码、网关地址、DNS服务器地址。
网络故障诊断思路之定位查找方法
步骤四:检查本机软件配置诊断故障 检查是否存在系统安全设置与应用程序之间存在冲突 用户权限限制 组策略配置限制 防火墙策略限制 检查应用程序所依赖的系统服务是否正常 检查应用程序是否与其他程序存在冲突 检查应用程序本身配置是否存在问题
Netstat -r
Ipconfig 结果示例:
网络跟踪工具Tracert和Pathping
Tracert/Pathping是用于数据包跟踪的网络工具。 运行在DOS提示符下,它可以跟踪数据包到达目的主机经过哪些中间节点。一般可用于广域网故障的诊断,检测网络连接在哪里中断。 用法: tracert[-d] [-h maximum_hops] [-j hostlist] [-w timeout] 参数: -d 不解析主机名; -w timeout 设置超时时间(单位:ms)。 tracert 用于跟踪“路径”,即可记录从本地至目的主机所经过的路径,以及到达时间。利用它,可以确切地知道究竟在本地到目的地之间的哪一环节上发生了故障。
动车组以太网通信系统技术原理及故障诊断方法
动车组以太网通信系统技术原理及故障诊断方法摘要:本文通过介绍动车组以太网网络通信系统拓扑结构、运行原理及故障诊断原理方法,过去一年持续跟踪基于以太网通信技术原理的批量动车组网络系统运用状态,故障率保持极低水平,充分体现以太网通信系统数据在传输实时性、抗干扰能力、热备冗余、可扩展性等方面的优势。
关键词:动车组以太网故障诊断0.引言动车组列车通信网络是一种面向控制、连接车载设备的数据通信系统,主要实现车辆信息传输、逻辑控制、画面显示、故障诊断和用户支持等功能,车辆网络通信系统需保障可靠的设备控制、及时的状态监视和完整的故障诊断,确保列车安全可靠地运行。
随着动车组列车不停地更新换代,在可靠性、便捷性、智能化、旅客服务多元化等方面有了更高的要求,既有动车组网络通信系统存在数据传输慢、带宽宽小等缺点,制约着动车组迭代的进程。
以太网具有组网方便、开放性好、通信速率高、带宽高、可靠性高等优势,在因特网中得到长足发展。
国际电工委员会(IEC)1999年颁布IEC61375-3通信标准,把机车通信网络结构划分为三层,即列车控制级、车辆控制级、设备控制级,随后国际电工委员会IEC/TC9 WG43工作组颁布实时列车车载以太网IEC61375-2-5(列车级网络)和IEC61375-3-4(车辆级网络)通信标准,形成列车通信网络标准体系。
该标准确定列车总线采用以太列车骨干网(EthernetTrain Backbone,ETB)技术,以太网技术应用于轨道交通车辆网络通信,能为车辆提供更大的数据传输带宽,增强列车的安全性。
1.动车组网络通信系统1.1通信数据类型:动车组网络通信系统主要传输控制信息、诊断信息、监控信息和其他多媒体信息等数据,实现全列车环境下的信息交换。
根据列车网络数据实时传输性质的特点,将列车通信数据分为三类:(1)管理数据:也称维护数据,为初始化、管理和监控及维护网络本身产生的数据,同时也包括软件升级、故障日志数据下载等数据。
09-以太网故障处理
HUAWEI TECHNOLOGIES CO., LTD.
HUAWEI Confidential
Page 18
维护手段-以太网OAM功能简介
• 以太网OAM主要具有一下几个功能: 以太网OAM主要具有一下几个功能: OAM主要具有一下几个功能 › 故障的自动发现 › 故障的定位 › 故障的隔离 • 提供一些供用户、用服定位问题的手段; 提供一些供用户、用服定位问题的手段; • 替代私有的测试帧功能,解决测试帧和数通设备之间不能互通的问题; 替代私有的测试帧功能,解决测试帧和数通设备之间不能互通的问题; • 二层交换业务不能支持还回功能;现有的专线业务报文环回处理,不 二层交换业务不能支持还回功能;现有的专线业务报文环回处理, 能对报文选择性的环回; 能对报文选择性的环回; • 能够比现有的定位手段发现更低级的错误; 能够比现有的定位手段发现更低级的错误;
以太网单板维护手段
测试帧功能
以太网单板提供一种验证VCTRUNK端口之间互通性的,使用GFP 管理帧实现的测试帧功能.
通过测试帧请求和应答的交互,可以验证单板之间VCTRUNK连 接的配置正确性, 即SDH业务配置和VCTRUNK通道绑定配置,以及 SDH线路侧通断情况.
HUAWEI TECHNOLOGIES CO., LTD. HUAWEI Confidential Page 12
HUAWEI TECHNOLOGIES CO., LTD. HUAWEI Confidential Page 5
以太网单板维护手段
T2000网管告警显示 2000网管告警显示
T2000V002R002版本截图,推荐使用网管F1联机帮助
HUAWEI TECHNOLOGIES CO., LTD. HUAWEI Confidential Page 6
宽带IP以太网用户接入端常见故障及处理
摘
要 :本文总结 了宽带 I 以太网用户上网时,常见故障现 象和解决处理的方法。 I )
接入端 故障 解决方 法
文献标 识码 :B
关键 词 :宽 带以 太网
中图分类 号 :T 9 5 12 N 1 .4
宽带 I 以太 网 络在 设 计 建 造 时 ,核 心 主 干 网 I )
采用的是较高性能的路由交换设备和技术 ,其端到 端间的链路也具有高速率和高可靠性 ,而相比之下 用户 接入 端 的设备 和链路性 能就 比较低 了 ,加之 用 户端 点数也 远 远多 于主干 网络 的节点数 ,呈几何 级 数增加 , 故用户接入端 出现故障的现象和机率比主 干 网络多得 多 。在 网络 的维 护管 理 中 ,绝 大多数 故
障是 出现在 用户 接入端 。 宽带 I 网 中一个 典 型 的用 户 接 入 端 示 意 图如 I )
图 1所示 。
根据实际工作经验 ,总结归纳出以下几种常见 的故 障及其 解决 方法 。
1 )光 电转换 器光 路不 通 ,导致 用 户不 能通 讯 。
故障原因一般为光纤物理性 的折断或损坏 ,可借助 光 时 域 反 射 仪 ( T R)进 行 测 量 并 修 复 光 纤 。另 OD 外 ,尾纤损坏也是最常见故障之一 ,每芯光纤 的两
d m ;另一种情况为其 电接 口损坏 ,电信号指示 B)
灯 (P T )不 亮 。 如 果是 在遭 到 雷击 而 导 致 光 电转
换器损坏时 ,由于 5 类线导电还有可能同 等设 备 的损坏 。
一
5 )设 备 电源 损 坏 。 电源工 作 不 正 常 也有 两 种
. l B 潮
FX
光电转换器拥塞则为光信号指示灯 ( X F )与 电信 号指示灯 (1 1 )虽然均是亮 的 ( 明线路 是正常 P 说
利用LFS机制排除10GE100GE以太网链路故障
利用L FS机制排除10GE/100GE以太网链路故障刘亚峰中国电信股份有限公司江苏分公司摘要:LFS (Link Fault Signaling,链路故障检测)是10GE/100G E以上高速以太网链路中引人的故障检测机制,可 以帮助维护人员快速判断定位物理链路层障碍,不过在实际的网络维护中,由于专业维护界面和职责分工等因素,网维人员极少利用LFS机制去排障,LFS并没有发挥出应有的作用。
本文从专业融合的角度出发,介 绍了在数据和传输网络中如何引人LFS机制联合排障,并针对不同的障碍现象分别给出了相应的障碍处理流程,可以作为网维人员在处理10GE/100G E以太网链路故障时的技术参考,缩短障碍历时。
关键词:链路故障检测;以太网链路故障;数据链路排障〇引言SDH/OTN这样的光传输网络,由于有着丰富的OAM开 销字节,网络监测和管理功能强大,一旦出现网络或设备故障,能够快速地定位障碍,网络自愈能力强。
而由交换机、路由 器组成的数据网络则不一样,它更倾向于简单易用,没有引 人复杂的监测和管理机制,尤其是FE、GE这样的以太网链路, 在 IEEE 802.3ah (EFM) /ITU-T Y.1731 (CFM)技术规范出来 之前,是不具备OAM功能的,缺乏链路层障碍的定位和分析 手段。
近年来高速率大带宽业务呈爆发性增长势头,三大运营 商从汇聚层往上都已经使用10G乃至100G链路,而城域核 心以及骨干层链路则基本以100G为主了。
这就带来了一个问 题,如此大的带宽,一旦发生链路层故障,势必造成流量的 局部拥塞,导致网络的不稳定。
因此如何快速定位10G以上 高速链路的链路层障碍并尽快恢复网络流量至关重要。
为此,在丨EEE 802.3ae ( 10GE)技术规范中引人了链路故障检测机制(Link Fault Signaling,LFS ),并在 100GE(IEEE 802.3ba)中继续沿用了该LFS机制来诊断物理层链路故障。
以太网通信中常见故障原因分析
以太网通信中常见故障原因分析摘要:随着社会的不断发展,以太网通信技术逐渐走入历史的舞台。
通过以太网通信技术能够实现生产过程中的合理控制和实时监控。
但是经过调查发现,相比于其他的发达国家,我国的以太网通信发展较晚,相关技术手段尚未完全。
因此,在以太网运用的过程中仍然存在着一些不容忽视的问题,这些问题导致一些常见故障的发生。
本文主要对这些常见故障进行分析,进而提出相应的解决措施,以期能够改变这一现状,从而促进以太网在我国的进一步推广。
关键词:以太网;通信故障;原因一、前言随着社会的不断进步,为了能够对生产过程进行实时的监控与控制,从而保证生产质量,很多企业都利用以太网技术来达到这一目的。
经过调查研究发现,以太网技术在我国的发展起步较晚,因此相关通信技术仍未达到成熟阶段,因此在实际运用过程中,以太网技术经过会出现一些故障,进而导致设备无法正常工作。
为了能够避免这样的问题再次发生,也为了促进以太网技术在我国的进一步发展,本文主要通过分析以太网技术在通信的过程中常见问题,进而提出针对性的解决措施[1]。
二、网络通信设备使用中常遇到的问题(一)不确定性分析众所周知,以太网技术在通信的过程中实际上是利用了网络的共享性,其核心技术主要为CSMAΠ CD,这一种核心技术的工作原理为使用具有冲突检测功能的载波来侦听多路访问。
然而这一核心技术在实际运用的过程中却容易出现这样的问题:由于这一技术在使用时网络内的任何一个站点都需要相同的信道进行输送,如果在这个过程中存在两个及两个以上的站点同时发送信号,那么就会发生信号冲突,进而导致任何一条信号都出现错误,进而影响到通信系统的传输效率。
虽然以太网技术在设置时规定了网络中的站点发生冲突时,需要等待一定的时间间隔就可以再次发送,但是这段时间间隔是随机的,因此无法满足精确时间的通信需求,这就是以太网通信过程中的不确定性。
(二)不可靠性分析以太网技术最初主要运用在较为简单的办公条件下,但是随着以太网技术的不断推广,越来越多的工业企业在通信过程中使用以太网技术来进行信息传输。
DCN-10-以太网故障排除
物理层
15
分块故障排除法
配置文件分为以下部分:
• • • • • 管理部分(路由器名称、口令、服务、日志等) 端口部分(地址、封装、cost、认证等) 路由协议部分(静态路由、RIP、OSPF、BGP、路由引入等) 策略部分(路由策略、策略路由、安全配置等) 接入部分(主控制台、Telnet登录或哑终端、拨号等)
故障排除过程文档化
8
故障信息收集
故障表现
• • • • • • • • • 什么设备? 什么时间? 发生了什么问题? 结果? 设备型号 版本信息 配置信息 Show、Debug信息 抓包分析
故障信息收集
9
课程内容
• 其他应用部分(语言配置、VPN配置、Qos配置等)
16
分段故障排除法
网络设备若是分段排列,优先将设备分段排查,以便 确定故 障点。 如果故障是周期性发生或在某一时间段后发生。将时间段分 为没有故障和发生故障两个时间段,分别进行排查。找出故 障的触发原因。
17
课程内容
第一章 故障排除概述 第二章 故障排除常用工具
第三章 故障排除常用方法
第四章 对网络维护人员的要求
18
对网络维护人员的要求
熟悉协议运行原理
详细描述故障现象和相关信息
• 什么设备 • 发生了什么问题 • 什么时间发生的
3
课程内容
第一章 故障排除概述 第二章 故障排除常用工具
第三章 故障排除常用方法
第四章 对网络维护人员的要求
4
网络现状
网络应用种类越来越多,对网络要求更快、更稳定 新技术不断出现 新、老网络并存
以太网功能的操作方法
以太网功能的操作方法
以太网是一种常用于局域网的网络协议,它的操作方法主要包括以下几个步骤:
1.连接设备:将以太网电缆插入电脑或其他网络设备的以太网接口。
2.设置IP地址:根据需要,可以手动设置设备的IP地址,也可以通过DHCP自动获取。
3.配置本地区域连接:在操作系统中打开网络连接设置,选择以太网连接,然后点击“属性”或“设置”。
4.启用以太网连接:确保以太网连接处于启用状态,这样设备可以进行数据传输。
5.测试连接:打开网页或进行其他网络操作,验证以太网连接是否正常。
6.故障排除:如果以太网连接有问题,可以尝试重新启动设备、检查电缆连接、重置网络设置等方法进行故障排除。
需要注意的是,以太网的操作方法可能会因不同的设备和操作系统而有所不同,以上步骤仅为一般操作流程,具体操作方法请参考设备和操作系统的说明或者进行相关的网络设置。
实验7.1 物理层及以太网故障排除
实验步骤
③查看主机和路由器的以太网接口的IP地址是否位于同一子网内,即二者的网络地址必须 相同。如果不在同一子网内,请重新设置IP地址。 ④查看链路层协议是否匹配。 ⑤查看以太网接口的工作方式是否正确。
实验步骤
进入G0/0配置模式,执行: [RTA-GigabitEthernet0/0) speed 100 GigabitEthernet0 running on 100M mode 反复出现告警如下: % Line protocol ip on interface GigabitEthernet0/0, changed state to DOWN % Line protocol ip on interface GigabitEthernet0/0, changed state to UP 且RTA的G0/0的link灯忽亮忽灭,问题没有解决。 ②配置G0/0工作在10Mb/s速率下。 进入G0/0配置模式,执行: [RTA-GigabitEthernet0/0) speed 10 GigabitEthernet0/0 running on 10M mode 仅提示如下: % Line protocol ip on interface GigabitEthernet0/0, changed state to UP 没有告警,且RTA上G0/0的link灯常亮。 查看G0/0的状态如下:
(4)处理过程。 断开服务器与RTA,从RTA的G0/0口用同一条网线接到便携机,便携机的网络配置与服务 器的网络配置相同,此时RTA后G0/0的link灯常亮,表明网线是正常的。在超级终端上也 没有先前的告警,仅提示:% Line protocol ip on interface GigabitEthernet0/0, changed state to UP,表明RTA与便携之间的物理连接很稳定。因此表明网线和2FE模块正常。 便携机和服务器直连,可以PING通,排除服务器网卡原因。 对RTA的G0/0接口指定工作速率: ①配置G0/0工作在100Mb/s速率下。
H3C S6800系列以太网交换机 故障处理手册
H3C S6800系列以太网交换机故障处理手册Copyright © 2015杭州华三通信技术有限公司版权所有,保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
本文档中的信息可能变动,恕不另行通知。
目录1简介 (1)1.1 故障处理注意事项 (1)1.2 收集设备运行信息 (1)2硬件类故障处理 (4)2.1 运行过程中设备异常重启故障处理 (4)2.2 电源运行中上报Fault问题处理方法 (5)2.3 新插入电源模块状态异常处理方法 (6)2.4 风扇模块运行中上报Fault或新安装风扇模块后状态异常问题处理方法 (7)3 ACL相关特性故障处理 (9)3.1 ACL下发失败故障处理 (9)4 IRF相关特性故障处理 (12)4.1 IRF建立不成功故障处理 (12)4.2 故障诊断命令 (15)5聚合相关特性故障处理 (15)5.1 聚合不成功故障处理 (15)6端口相关故障处理 (18)6.1光口(万兆SFP+口、40GE的QSFP+口)不UP故障处理 (18)6.2 电口(10/100/1000Base-T千兆电口和1/10GBase-T万兆电口)不UP故障处理 (20)6.3 光模块上报非H3C合法光模块故障处理 (21)6.4 光模块不支持数字诊断故障处理 (22)6.5 端口存在CRC等错误统计故障处理 (24)6.6 端口不接收报文故障处理 (25)6.7 端口不发送报文故障处理 (27)7系统类故障处理 (29)7.1 CPU占用率高问题处理方法 (29)7.2 内存占用率高问题处理方法 (31)7.3 故障诊断命令 (33)8其它常见故障处理 (33)8.1 二层流量转发丢包 (33)8.2 三层转发丢包故障 (38)8.3 协议震荡故障处理 (39)1 简介本文档介绍S6800系列以太网交换机软、硬件常见故障的诊断及处理措施。
05-以太网故障处理
文档密级:内部公开
华为机密,未经许可不得扩散
11
以太网故障处理方法
故障类型---业务全阻的相关查询 故障类型---业务全阻的相关查询 --端口TAG属性(TAG/UNTAG)设置被改变: 端口TAG属性(TAG/UNTAG)设置被改变: 端口工作模式引起的故障 : 查询VC通道捆绑定义 查询VC通道捆绑定义 : 端口的默认Vlan 端口的默认Vlan id : 以太网配置的静态路由错误或者丢失 : 硬件故障(线缆、单板等);
2
3
4
5
6
网线或者光纤出现故障 当双向的以太网业务包长持续相差太大的时,或者全部是短字节包长(64—128字节)时,可能会 造成ET1性能下降较多,造成大量丢包 单板硬件故障
7
8
文档密级:内部公开
华为机密,未经许可不得扩散
5
以太网故障处理— 以太网故障处理—以太网业务的三个界面
MSTP故障可分三个界面来分析定位 故障可分三个界面来分析定位
A
NE80
Metro 3000
Metro 3000
B
NE40
光纤收发器 光纤收发器
文档密级:内部公开
华为机密,未经许可不得扩散
12
以太网故障定位方法
故障类型二---业务异常( 故障类型二---业务异常(业务损伤不明显) ---业务异常
判定故障原因及故障界面
由于此时业务损伤不明显,甚至不能称之为“故障”,因此通 过隔离法往往难以迅速判定故障界面;或故障具有突发性和自愈 性,不能及时抓到故障信息,需要深入分析、长期监测定位。 此类问题,一般有以下几种处理方法: 此类问题,一般有以下几种处理方法: 查验业务正确配置及硬件正常安装(许多故障是由 配置错误\被 配置错误\ 改变,线缆质量等原因引起的,需要大家注意) RMON性能统计 RMON性能统计 替换法,直接更换相应单板,在线长期观察。 搞清楚用户的实际业务类型及需求(对接就是这样,不能只顾自 己哦,要求对接方也进行类似的排查) 不调动业务,使用仪表或软件工具进行在线长期监测,记录并输 出log文件和其他信息,结合RMON性能统计进行分析定位。 log文件和其他信息,结合RMON性能统计进行分析定位。 协调用户调走业务,使用仪表对问题通道进行长期(24~72小时) 协调用户调走业务,使用仪表对问题通道进行长期(24~72小时) 稳定性测试,验证通道的长期可靠性。
02-网络故障排除--物理层及以太网故障排除
目录第1章物理层故障排除 (i)1.1物理层故障排除综述 (i)1.2 Quidway系列路由器升级过程的故障排除 (ii)1.2.1 Quidway系列路由器软件升级指导 (ii)1.2.2 Quidway系列路由器内存升级指导 (vi)1.3 案例分析 (viii)1.3.1 与路由器相连设备的故障导致路由器无法正常启动 (viii)1.3.2 线路阻抗不匹配导致广域网链路无法建立 (x)1.3.3 线路阻抗不匹配导致R3680路由器4CE1/E1口不断Up/Down (xi)1.3.4电源接地不好导致路由器通信不畅通 (xiii)1.3.5 接地和防护方面不合要求,在电压漂移(或雷击)时造成设备损坏 (xiv)1.3.6 交换机和路由器E&M模块间中继线连接错误致使无法打通电话 (xv)1.3.7 RS232线序错误造成华为路由器异步串口与ATM取款机无法连通; (xvii)1.3.8 V.35DTE、DCE电缆混用导致链路层协议不能UP (xix)第2章以太网故障排除.............................................................................................................. 2-12.1以太网故障排除综述.......................................................................................................... 2-12.1.1以太网功能和性能的常见问题................................................................................. 2-12.1.2 由以太网实现形式差异产生的问题.......................................................................... 2-32.1.3 以太网故障排除的一般步骤..................................................................................... 2-42.2与以太网故障相关的show、debug命令介绍..................................................................... 2-52.2.1 Show interface ethernet .......................................................................................... 2-52.2.2 Debug ethernet ....................................................................................................... 2-82.3 以太网故障案例分析 .......................................................................................................... 2-92.3.1速率不匹配导致Sun E450和R2631以太网链路时通时断的问题............................. 2-92.3.2 用户网段广播包过多造成该网段的服务器FTP业务传输速度慢............................. 2-122.3.3 帧格式不匹配导致以太网口状态为Down ............................................................... 2-142.3.4 全双工/半双工不匹配导致网络流量增大时丢包现象较严重................................... 2-15第1章物理层故障排除1.1 物理层故障排除综述Quidway系列路由器的安装和使用注意事项请严格按照安装手册进行。
工业以太网堵塞断网故障的分析与处理
金,2011(10):10-12. [2] 王冰,孟淑敏,刘洋,贾利军.莱钢 3#3200 m3 高炉炉顶系统设计特
点[J].工业炉,2016(9):85-87. [3] 蒲静涛,王仰宏.高炉交流探尺 SINAMICS S120 调速系统[J].电气
工业以太网堵塞断网故障的分析与处理
杨虎涛
(云南中烟再造烟叶有限责任公司,云南昆明 650102)
摘 要:西门子多 PLC 系统与 WinCC 服务器进行通信,在少部分 WinCC 客户机上不连续的出现网络连接丢包严重的情况,导致 WinCC 客户端死机。通过网络结构改造、增加交换机通信能力使网络畅通,WinCC 客户机运行正常无死机、无丢包情况。 关键词:工业以太网通信;西门子 WinCC;通信堵塞;网络结构改造 中图分类号:TP393.11 文献标识码:B DOI:10.16621/ki.issn1001-0599.2019.08.31
编辑李波輪輴设备管理与维修2019翼8上图1dcs系统网络结构型号ip站址网关通讯方式系统位置wincc服务器1075222110752210pndellpc中控室工作台wincc客户端11075222210752210pndellpc中控室工作台wincc客户端21075222310752210pndellpc中控室工作台wincc客户端31075222410752210pndellpc中控室工作台wincc客户端41075222510752210pndellpc制浆车间工艺室led控制计算机1075222610752210pndellpc中控室工作台质检计算机1075222710752210pndellpc抄造车间质检室wincc客户端51075222810752210pn新提取段现场新提取段plc1075224010752210pns73003152eh140ab0新提取段电控室提取plc1075223310752210pns74004122xgo4oabo提取电控柜制浆plc1075223410752210pns74004122xgo4oabo制浆电控柜浓缩plc1075223510752210pns73003152ag10oabo浓缩电控柜抄造plc1075223610752210pns74004122xgo4oabo抄造电控柜后处理1plc1075223710752210pns74004142xg04oabo后处理1电控柜后处理2plc1075223810752210pns73003152ag10oabo后处理2电控柜表1网络地址及硬件配置问所有的plc站点
如何排除以太网故障
如何排除以太网故障故障的种类是非常多样化的,其中有软件故障、有硬件故障,有ISP端的故障,也有用户端的故障。
根据经验,我们发现大多数网络故障是与硬件有关的:比如电缆、Hub、Switch和网卡等。
下面是以太网典型故障的查找过程。
一、故障查找的一般规则以太网的故障查找可分为5个步骤:1.收集所有可以收集到的有价值的信息,分析故障的现象。
2.将故障定位到某一特定的网段,或者是单一独立功能组(模块),也可以是某一用户。
3.确认是特定的硬件故障还是软件故障。
4.定位与修复故障。
5.验证故障的排除。
一般来说,最好的办法是先把故障细分或隔离在一个小的功能段上,即首先排除最大的简单段,从任何一个方便的、靠近问题的站点入手,利用二分法隔离故障,再继续使用二分法直至把故障划分到最小的单位。
网管人员不要过多指望用户会给出完整准确的情况描述,最好由自己来确认一下。
当然也可以让用户演示所发现的问题。
由于网络故障带来的压力和混乱,人们经常忽略一些细节问题。
如果某个部件出了问题,最好不要立即去替换它,除非能肯定故障的来源。
二、故障查找应注意的事项由于以太网采用通用总线拓扑结构以及物理层可扩展的潜在问题,所以某个特定物理层的问题会以不同的方式显示出来,而且由于采用的测试手段、位置和环境不同,显示出的现象还常常有矛盾。
为了避免被假象误导,推荐两个故障查找的步骤:1.沿网段多做几次测试如果故障现象随测试点的不同还保持一样的话,就可以依照所测试出的故障现象去排除。
如果故障现象在一些或所有的测试点都不相同的话,就要把查找故障的方向定在物理层(除非有特别提示),例如去查找坏的电缆、噪声环境、接地循环等故障。
2.要提高测试质量,在测试的同时要把测试仪器设置成至少可同时发送较低的流量。
由于增加了网络流量,微小的和间歇性的物理层问题会被暴露出来。
三、典型的网络故障故障1、不能访问服务器或某项服务在这里设定服务器或某项服务以前是正常的,并且已经做过如下的工作:重新冷启动PC机(热启动不能复位全部的适配卡)。
以太网专线电路常见故障分析
附件3.
以太网专线电路常见故障分析以太网专线故障一般分为三大类:
1. Ping小包正常、Ping大包有丢包或者时延现象
这类故障一般在客户业务开通过一段时间后才发生,故障定位时主要从以下方面检查:
(1)用户业务量或者突发业务量与配置的带宽是否匹配。
(2)局端设备与用户端设备的配置匹配。
(3)查询以太网实时性能,若存在较多CRC错等异常错包,建议检查端口工作模式和连接线缆(网线、光纤)。
2. Ping通、但存在持续丢包或时延现象
故障定位时主要从以下方面检查:
(1)查看网管,若存在信号劣化、误码等告警,检查SDH 线路、以太网端口的发光功率范围等是否正常。
(2)末端使用光Modem或者协议转换器的用户,插拔网线或者检查光Modem的发光功率范围。
(3)检查是否板卡故障。
(4)检查是否LCAS(链路容量调整)配置问题。
3. Ping不通、业务中断
故障定位时主要从以下几方面检查:
(1)查看网管,若存在AIS、TU-LOP等SDH层告警,检查SDH 线路、MSTP设备是否正常。
(2)检查局端的网线、光缆等硬件设施是否正常。
(3)检查两端用户路由器CRC设置是否相同。
以太网接口频繁UpDown故障排查思路(交换机)
切换完成。
Up/Down日志信息中接口处于Down转换到Up间隔时间较长。
正常的信息,对端设备对本端
设备接口存在操作。
无需操作。
端口在不同时间产生了Up/Down,在这期间存在瞬间的Up/Down,并且其间
隔时间小于1秒。
1、用户使用的光模块与硬件
配合不好,光模块对信号的抖动较为灵敏,或者接收光功率过低。
2、对端或本端接口问题。
3、对端设备配置了端口保护
功能。
2、在对端设备接口上进行交
叉验证,通过连接对端设备不同的接口来调测。
3、关闭对端设备配置的端口
保护功能。
执行完上述操作后,如果故障仍然存在请执行步骤4。
4.检查本端和对端设备硬件是否故障。
尝试将线缆连接到其他接口。
如果线缆长度大于100m可以
采用如下方式:
1、缩短设备间距离,以缩短
双绞线长度。
2、如果不能改变设备间的距
离,设备之间可以通过中
继器、HUB或交换机串联。
用测试仪或物理环回方法检查链路两端是否故障。
使用测试仪测试时,测试仪显
示收发正常。
使用物理环回时,可以看到接
口Up。
如果检查出线缆故障,请尝试
更换线缆,如果更换线缆故障
依然存在请尝试更换两端接口光模块。
检查光模块和光纤的对应关系。
检查光纤类型是否正确。光模
类型和光纤类型对应关系请参见硬件描述光模块。
如果对应关系不正确,请根据
实际情况选择更换光模块或光纤。
设备间光纤的长度和光模块支持的传输距离是否匹配。
光纤的长度小于光模块支持的传输距离。光模块支持光纤的传输距离请参见硬件描述光模块。
以太网专线电路故障处理浅析
1以太网专线电路故障处理浅析一、前言随着MSTP 技术的发展与成熟,跨域专线电路采用MSTP 平台传输正呈逐年上升趋势,而MSTP 电路在故障发生时又存在定位困难、处理时间长等问题,给维护工作带来不小压力。
本文主要以华为MSTP 电路故障处理为例,总结日常工作中积累的一些维护经验,望能对后期的MSTP 客户电路维护提供借鉴。
二、MSTP 电路故障处理思路MSTP 电路在开通前期需要通过SDH 层业务配置、端口属性配置、TAG 属性、封装协议等较多设置项目(如图 1 以太网专线电路配置示意图),在故障定位时关注点较多所以并没有一成不变的处理方法,可以根据现场实际情况再结合自己的维护经验和对维护手段的熟悉程度进行处理。
MSTP 电路故障定位可以参照“先告警后性能、先SDH 后以太网、先日志后测试、先内部后外部”的原则,并可从以下几方面进行重点排查。
图1以太网专线电路配置示意图1.业务时隙配置问题由于不同厂家时隙顺序不一致导致对接不通、或者是误操作等其他原因造成原SDH业务配置被更改或丢失,从而导致以太网业务中断情况。
此类情况发生时,一般同时有SDH业务层面的相关告警上报,如TU_AIS、TU_LOP等。
2.以太网单盘端口基本属性配置问题,包括下列内容:(1)端口使能问题:开启与否决定端口是否收发数据和上报告警;(2)端口工作模式问题:主要有auto、10M half、10M full、100M half、100M full、1000M full等六种模式,设置时必须与对接设备的网口工作模式保持一致,避免出现auto对100mfull等类似问题;(3)MTU(最大传送单元)值问题MTU值即一次传送单元的最大长度,取值受硬件限制(一般情况下设置MTU值为1522)。
若端口接收到大于MTU值的数据帧,则无条件丢弃,直接导致业务异常。
可以在了解硬件限制和业务基础上设置最大传送单元。
3. 以太网TAG属性和VLAN ID配置问题以太网TAG属性用以判断对端设备发出的数据帧在本端能否正确的进行识别。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的接线错误引起的。 检查链路层的问题 (1)碰撞问题 如果平均碰撞率大于 10%或是观察到非常高的碰撞,就需要进一步的测试了。如果可
能,试着通过减少网段规模(将网络分成小段)并随时监测碰撞的变化以隔离出发生问题的 区域。为了跟踪碰撞情况,就必须知道网络的流量。可以使用背景流量发生器来加入适量的 流量(100 帧/秒、100 字节长的流量),并同时观察网络的统计显示。某些和介质有关的故 障是与流量的大小成正比的。可以用控制键改变流量同时观察碰撞与错误的改变。这种做法 要特别小心,因为你很容易给网络加入很重的流量。解决与碰撞有关的问题常常是很费劲的, 因为测试的情况在很大程度上取决于观察的位置。也许在同一网段相距几尺远的不同观察点 所看到的情况就不同,要多找几个点来测试并留意所发生的变化。
同的概念。要找到使用这个服务器资源最多的用户,这可以用服务器上的用户监测功能或协 议分析仪来完成。
无论是网络流量高或低时发生的问题,如果是碰撞很少而且是没有帧错误,这类问题 多出自应用软件或与文件服务器有关。服务器可能是 Cache 设置的太小,保留的缓冲不足, 服务器内存不够,服务器硬盘所余空间有限,8-bit 网卡等等,这也可能是另一类软件问题, 他们可能造成不正常的“网络磁盘请求”,这时有必要将某一应用移到另一个服务器上,要么 升级现有的服务器,要么再加入一个新的服务器。
应当考虑安装网桥或路由器以减少在网段中的流量或把网段分成若干小的网段。 客户服务器连接的完整性 如果在链路层上是完好的,那么我们就要来看一下协议方面是否有什么问题会影响服
务器与客户之间的通信。 (1)连通性 使用专业仪表,你可以运行 Server List 或 Novell Ping 测试功能,用来验证从测试点是
过载的网段 如果利用率很高(持续峰值超过 60%)而碰撞又可以接受(平均碰撞小于 10%),那
么网络就饱和了。这时就应该增加网段或用路由器把网段分成较小的可以支持正常流量的网 段。
软件故障 运行网络统计测试,如果是高流量,低碰撞,而且有一点错误帧,就先确定发出错误
帧的站点。也可以由繁忙站点测试来找出有问题的站点。到该站点现场来查看该用户在做什 么。要问明在非高峰时间用户在干什么或把这个用户移到其它网段上,以改善本网段上的其 它用户工作情况。如果利用率、碰撞、错误帧都低,要询问抱怨网络性能不好的用户是使用 哪个服务器和哪个应用软件。检查该服务器是否处在高负载状况下,它和网络的利用率是不
否可以访问服务器或服务功能。如果服务器没有回应,重新冷启动服务器并注意观察所有所 需的驱动软件是否正确加载,有无错误提示。Novell 的 3.11 版本及以前版本,在缺省配置 使用 802.3RAW 的打包,而 3.12 及以后的版本在缺省配置时都使用了 802.2 的打包类
型。 另外也可试着对服务器进行几次 Ping 测试,要确认请求信号与返回的响应信号数目相
(3)网络响应慢或性能差 首先,要确定一下是否是与网络介质有关的故障,是一个工作站的问题还是一个服务
器或是服务的问题。从其它工作站去访问同样的服务器或服务,并询问本段网络或其它网段 上的用户,如果问题不是与介质有关的,要确定问题是否是软件有关,检查网络利用率和软 件错误来查找性能差的网络问题。
运行诸如网络统计这样的测试,看一下是否有高流量和不正常的高碰撞存在,在增加 背景流量后再运行一下这些测试。如果发现碰撞和 PCF 错随着流量的增加而增多话,你就 应运行电缆测试来检查工作站的连接性。
通常来说,在同轴网中的物理层故障会导致灾难性的网络故障。使用 “二分法”来查找 这类故障是可以很快定位解决的。间歇性的故障是比较难以隔离的。 一半的问题来自于电缆
(1)目测连接性 检查连状态灯。如果
是 10BASE5 的电缆,要仔细检查所有的 AUI 电缆是否牢固地连接,划锁要同时锁牢,很多 问题只要简单地把未接牢的部分重新紧一下就解决了。
根据经验发现大多数网络故障是与硬件有关的:比如电缆、中继器、Hub、Switch 和网卡等。 本文描述了以太网典型故障的查找过程。
一、故障查找的一般规则 以太网的故障查找可分为 5 个步骤: 1.收集所有可以收集到的有价值的信息,分析故障的现象。 2.将故障定位到某一特定的网段,或者是单一独立功能组(模块),也可以是某一用 户。 3.确认是特定的硬件故障还是软件故障。 4.定位与修复故障。 5.验证故障的排除。 一般来说,最好的办法是先把故障细分或隔离在一个小的功能段上,即首先排除最大 的简单段,从任何一个方便的、靠近问题的站点入手,利用二分法隔离故障,再继续使用二 分法直至把故障划分到最小的单位。网管人员不要过多指望用户会给出完整准确的情况描 述,最好由自己来确认一下。当然也可以让用户演示所发现的问题。由于网络故障带来的压 力和混乱,人们经常忽略一些细节问题。如果某个部件出了问题,最好不要立即去替换它, 除非能肯定故障的来源。 二、故障查找应注意的事项 由于以太网采用通用总线拓扑结构以及物理层可扩展的潜在问题,所以某个特定物理 层的问题会以不同的方式显示出来,而且由于采用的测试手段、位置和环境不同,显示出的 现象还常常有矛盾。 为了避免被假象误导,推荐两个故障查找的步骤: 1.沿网段多做几次测试 如果故障现象随测试点的不同还保持一样的话,就可以依照所测试出的故障现象去排 除。如果故障现象在一些或所有的测试点都不相同的话,就要把查找故障的方向定在物理层 (除非有特别提示),例如去查找坏的电缆、噪声环境、接地循环等故障。 2.要提高测试质量,在测试的同时要把测试仪器设置成至少可同时发送较低的流量。 由于增加了网络流量,微小的和间歇性的物理层问题会被暴露出来。 三、典型的网络故障 故障 1、不能访问服务器或某项服务 在这里设定服务器或某项服务以前是正常的,并且已经做过如下的工作: 重新冷启动 PC 机(热启动不能复位全部的适配卡)。 确认 PC 机没有本身的硬件故障。 确认所有的网络电缆都连接正确。 确认所有的网卡驱动软件都正常地装入,没有报告错误。 确认服务器或服务没有改变,比如重新配置增加硬? 软件。 要测试一下这一故障是否只影响该工作站(本地故障)还是会影响其它站点(大范围 故障),可以通过其它工作站装入服务器或服务来证明这一点。这些工作站要在同一网段或 Hub 上。如果故障在同一网段或 Hub 上的其它的站点也存在,就试着从其它的 Hub 或网段 上的站点进行测试。 (一)本地故障 在进行硬件故障查找以前,要确认其它用户也不能登录从这台机器上,这就排除了用 户帐号的错误。对一个单一的站点来说,典型的故障多发生在坏的电缆、坏的网卡、驱动软 件或是工作站设置的不正确等问题上。 (二)全局问题
等,结果不一致则表明有时好时坏的网卡或 Hub 的故障导致帧的丢失。临界状态的和已坏 的桥或路由器也可以用此方法很快地定位。
(2)服务器或服务的可达性 如果使用协议分析仪,就要捕获 3 至 4 分钟的数据包来分析。看一下是否有从服务器
发出延时请求,并找出是哪个服务器,如果有延时请求,则表明服务器不能完全处理所加载 的任务,每一个延时请求作废一个任务请求。
硬件故障 如果出现帧错误,利用专业仪表可以找出错误帧的来源。此后的工作就是在 Hub 口、
网卡和电缆中隔离出特定的故障,如果故障是间歇性的,就替换掉有怀疑的网卡。检查一下 服务器/服务是否接在广域网路由器的远端。如果是这样,就用 Ping 测试来测一下响应时 间并与基准测试比较一下。为了保证没丢失帧的情况就要连续运行多次的 Ping 测试,检查 测试请求包与响应包是否相等。如果不相等,远端的介质或互连设备(网桥、路由器等)就 有可能是容量问题或有故障。丢帧也是电缆故障之一。比如: UTP 布线中的线对串绕和同 轴缆由线的环地故障。如果怀疑有丢帧就进行电缆测试。测试接在反应慢的工作站的电缆, 也要测一下服务器方向的电缆。
(2)受损的电缆或连接部件 在你检查物理层的问题时,要注意受损的电缆,不正确的电缆类型(比如在以太网上
用 RG62 或 RG59),未打好的 RJ45 头,未按牢的 BNC 头。对怀疑有问题的电缆可以用一 般的电缆测试仪进行测试。
(3)连接脉冲极性问题 无论是 NIC 还是 Hub 的连接脉冲极性都可以用测试测出,连接极性故障通常是由电缆
碰撞问题 如果碰撞较多,要算一下有多带宽被碰撞损失了。把本地和远端碰撞的损失都加起来,
如果平均碰撞的值大于 5—10%,就要进行进一步的故障查找。同样要检查一下碰撞是否是 突发的,也就是说碰撞明显地增多不是因为流量明显增大引起的,如果是这样就意味着某处 的物理层出现了比较严重的问题。在碰撞与流量之间应是有一定的关系的。这种关系应当在 做网络参照基准测试时收集到。如果碰撞始终是比较多的(但仍是可以接受),可能是太多 站点同时在参与发送,或者网络结构应做一些优化使近距离的站点分在一起。过多的碰撞最 常见是与介质有关的故障导致的。比如:不正确的端接,特性阻抗不连续(坏接点、残留支 缆、残破线缆)等和坏网卡。
(2)帧级错误 如果出现帧级错误,你就要运行错误统计测试,并通过详查功能把有问题的工作站的
MAC 地址找出,然后经过测试把故障确定下来。可以试着将驱动程序用 “干净”的原盘重新 装入工作站,要确认各项配置完全。如果这一切仍不奏效,可以试着把有疑问的网卡换掉。
(3)利用率过高 如果利用率过高(平均值大于 40%,瞬时峰值高于 60%),那么网段负荷就过重了。