通信常见网络故障处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
17
中国电信广东公司 综 合 部
可能原因2:日志服务器A的性能问题。 制定的方案:测试同一网段的主机C和日志
服务器间的FTP传输速度,是6Mbps,正常。 可见问题与服务器A无关。
18
中国电信广东公司 综 合 部
可能原因3:10.11.56.0网络的网关性能问
题。 制定的方案:测试主机C和备份服务器B间 FTP传输速度是7Mbps,正常。排除了网关 因素,因为B、C在不同网段上而速度正常。
由此得知,网段10.11.56.0上广播 包和单播包比例为1:3,确实太大 了。 再次询问用户该网段主要运行的业 务是什么,而得出了故障最终原因 如下:10.11.56.0是普通用户网段, 由于业务原因每个用户需要发送大 量广播包和多播包,随着近期越来 越多的用户接入该网络,在这个网 段上的服务器需要花费更多的资源 来处理越来越多的广播和多播包, 因此其服务的传输速度自然减慢。 这是一个网络布局不恰当的问题, 需要重新安排服务器的位置,将服 务器移动10.15.0.0网段后,故障 解决。
第1节 导言 第2节 命令介绍 第3节 案例分析
21
中国电信广东公司 综 合 部
几个常用诊断工具
ping命令 tracert命令 display命令 debug命令 抓包软件sniffer/ethereal
22
中国电信广东公司 综 合 部
PING命令
命令ping用于检查IP网络连接及主机是否可达。 “ping”这个词源于声纳定位操作,指来自声纳设备的脉 冲信号。ping命令的思想与发出一个短促的雷达波,通过 收集回波来判断目标很相似;即源站点向目的站点发出一 个ICMP Echo Request报文,目的站点收到该报文后回一 个ICMP Echo Reply报文,这样就验证了两个节点间IP层 的可达性--表示了网络层是连通的。 ping和tracert命令不仅是路由器平台的常用网络命令, 也是windows平台上常用的网络命令
25
中国电信广东公司 综 合 部
用ping命令进行故障处理 案例一 连通性问题还是性能问题?
工程师小L,在配置完一台路由器之后执行ping命 令检测链路是否通畅。发现5个报文都没有ping通, 小L断定是连通性问题。 检查双方的配置命令并查看路由表,却一直没有 找到错误所在。最后又重复执行了一遍相同的 ping命令,发现这一次5个报文中有1个ping 通了 --原来是线路质量不好存在比较严重的丢包现 象。
(广播:单播比例=1:270,属于正常。)
Port Rcv-Octet Xmit-Octet -------- -------------------- ----------------------------------6/36 67172587081 4998816809
20
中国电信广东公司 综 合 部
如上述案例,可以向用户提问或自行收集下列相关信息:
网络结构或配置是否最近修改过,即问题出现是否与网络变化有关? 是否有用户访问受影响的服务器时没有问题? 在非高峰期日志服务器和备份服务器间FTP传输速度是多少?
通过该步骤,我们收集到了下面一些相关信息:
最近10.11.56.0网段的客户机不断在增加; 129.9.0.0网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps, 与日志服务器间进行FTP传输时速度慢,只有0.6Mbps; 在非高峰期日志服务器和备份服务器间FTP传输速度正常,大约为 6Mbps;
14
中国电信广东公司 综 合 部
故障处理实例—各种可能原因列表
该步骤列出根据经验判断和理论分析后总结的各 种可能原因。 如上述案例,可能原因如下:
网段10.11.56.0的性能问题,其原因可能为 : 日志服务器A的性能问题 10.11.56.0网络的网关性能问题 10.11.56.0网络本身的性能问题 中间网络性能问题,主要是到网络10.15.0.0的路由不 是最佳路由
19
中国电信广东公司 综 合 部
可能原因4:10.11.56.0网 络本身的性能问题。
制定的方案:在网段10.11.56.0的以太网交换机 上使用命令“show mac”,输出如下:
Port Rcv-Unicast Rcv-Multicast Rcv-Broadcast -------- -------------------- -------------------- ---------------6/32 10317812 0 8665 Port Xmit-Unicast Xmit-Multicast Xmit-Broadcast -------- -------------------- -------------------- ---------------6/32 6667987 286652 2474038
对每一原因实施排错方案
循环1
故障排除?
Y
N
恢复实施方案前的网络状态
故障排除过程文档化
9
中国电信广东公司 综 合 部
该处理流程是网络维护人员所能够采用的排错模 型中的一种 网络故障解决的处理流程是可以变化的,但故障 处理有序化的思维模式是不可变化的 下面我们以一个故障处理的实例来学习如何应用 这些步骤。
23
中国电信广东公司 综 合 部
在Quidway系列路由器上, ping命令的格式如下: ping [-Rdnqrv] [-c count] [-p pattern] [-s packetsize] [-t timeout] host
-a ping报文中使用的源IP地址 -c ping报文的个数,缺省值为5; -t 设置ping报文的超时时间,单位为毫秒,缺省值为2000; -s 设置ping报文的大小,以字节为单位,缺省值为56。
13
中国电信广东公司 综 合 部
故障处理实例—经验判断和理论分析
利用前两个步骤收集到的数据,并根据自己以往的故障处 理经验和所掌握的的知识,确定一个排错范围。通过范围 的划分,就只需注意某一故障或与故障情况相关的那一部 分产品、介质和主机。 如上述案例,我们现在能够确定是一个网络性能下降问题。 那么,是网段10.11.56.0的性能问题?是中间网络的性能 问题?还是10.15.0.0网段的性能问题呢? 根据129.9.0.0网段的机器与备份服务器间进行FTP传输时 速度正常为7Mbps这一事实,我们可以排除掉10.15.0.0网 段的性能问题。
这个问题是连续出现,还是间断出现的? 是完全不能备份,还是备份的速度慢(即性能下降)? 哪个或哪些局域网服务器受到影响,地址是什么? 在网络的高峰期,日志服务器10.11.56.11到集中备份服务器 10.15.254.253之间进行备份时,FTP传输速度很慢,大约是 0.6Mbps。
正确的故障现象描述是:
12
பைடு நூலகம்
中国电信广东公司 综 合 部
故障处理实例—搜集相关信息
搜集有助于查找故障原因的详细信息:
向受影响的用户、网络人员或其他关键人员提出问题; 根据故障描述性质,使用各种工具搜集情况,如网络管理系统、协议 分析仪、相关display和debug命令等; 测试性能与网络正常情况下的记录进行比较。
Port Rcv-Unicast Rcv-Multicast Rcv-Broadcast -------- -------------------- -------------------- ------------6/36 55780287 0 285 Port Xmit-Unicast Xmit-Multicast Xmit-Broadcast -------- -------------------- -------------------- -------------6/36 27879749 190257 119430
该案例组网如上:某校园网的三个局域网,其中10.11.56.0为一个用户网段, 10.11.56.118为一个日志服务器;10.15.0.0是一个集中了很多应用服务器的网 段。
11
中国电信广东公司 综 合 部
故障处理实例—故障现象描述
要想对网络故障做出准确的分析,首先应该了解故障表现 出来的各种现象 用户反映“日志服务器与备份服务器间备份发生问题。” 这就是一个不完整不清晰的故障现象描述。因为这个描述 没有讲述清楚下列问题:
24
中国电信广东公司 综 合 部
在PC机上或Windows NT为平台的服务器上,ping命令的格式 如下: ping [ -n number ] [ -t ] [ -l number ] ip-address
-n -t ping报文的个数,缺省值为5; 持续地ping 直到人为地中断,Ctr+Breack暂时中止ping命令并查 看当前的统计结果,而Ctr+C则中断命令的执行。 -l 设置ping报文所携带的数据部分的字节数,设置范围从0至65500。
(输出的广播:输出的单播比例为1:3,太大了。)
Port Rcv-Octet Xmit-Octet -------- -------------------- ----------------------------------6/32 14094829358 1516443041
在网段10.15.0.0上的以太网交换机上使用命令 “show mac”输出如下:
10
中国电信广东公司 综 合 部
故障处理实例
用户网段广播包过多造成该网段的服务器FTP业务传输速度慢
ETHERNET C:10.11.56.120/24
D:129.9.35.53/16
网云 ETHERNET
B:10.15.254.253/16 A:10.11.56.118/24 ETHERNET
15
中国电信广东公司 综 合 部
故障处理实例—对每种原因逐个实施排错方案
根据所列出的可能原因制定故障排查计划,分析 最有可能的原因,确定一次只对一个变量进行操 作,这种方法使你能够重现某一故障的解决办法。 如果有多个变量同时被改变,而问题得以解决, 那么如何判断哪个变量导致了故障发生呢?
16
中国电信广东公司 综 合 部
【产品系统工程师】数据网技能培训(初阶)之二
常见网络故障处理
网络监控维护中心 2015年1月
1
中国电信广东公司 综中国电信广东公司 合 部
课 程 总 体 思 路 图
2
本课程解决的根本问题是 故障处理的基本步骤及常用诊断工具?
故障处理技术概 述
关键问题
课程模块
常用诊断工具介 绍 故障处理步骤
关键方法 以上模块都遵循课程设计的基本法则: 循序渐进、由浅入深
5
中国电信广东公司 综 合 部
故障分类
连通性问题
性能问题
硬件、媒介、电源故障 配置错误 不正确的相互作用
网络拥塞 到目的地不是最佳路由 路由环路 网络错误
6
中国电信广东公司 综 合 部
第1节 导言 第2节 故障处理思路 第3节 故障处理实例
7
中国电信广东公司 综 合 部
故障处理实例—循环排查过程
可能原因1:网络10.11.56.0到网络10.15.0.0的 路由不是最佳路由。 制定的方案:在10.11.56.0网段的网关上使用 “tracert 10.15.245.253”命令,发现探测报文 返回时长仅为10ms,表明该可能原因并不是造成 故障的原因。我们进入循环排错过程。
2 中国电信广东公司 综 合 部
第一章 故障处理技术概述
第二章 故障处理步骤
第三章 常用诊断工具介绍
3
中国电信广东公司 综 合 部
第1节 导言 第2节 故障分类
4
中国电信广东公司 综 合 部
导言
能够正确地维护网络尽量不出现故障,并确保出 现故障之后能够迅速、准确地定位问题并排除故 障,对网络维护和管理人员来说是个挑战。 这不但要求对网络协议和技术有着深入的理解, 更重要的是要建立一个系统化的故障处理思想, 并合理应用于实际中,以将一个复杂的问题隔离、 分解或缩减排错范围,从而及时修复网络故障。
导言
故障处理系统化是合理地一步一步找出故障原因 并解决的总体原则。它的基本思想是系统地将由 故障可能的原因所构成的一个大集合缩减(或隔 离)成几个小的子集,从而使问题的复杂度迅速 下降。
8
8 中国电信广东公司 综 合 部
故障处理步骤
故障现象观察
故障相关信息收集
循环2
经验判断和理论分析
各种可能原因列表