网络排查故障-知识库

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

网络排查故障--知识库(欢迎更新)

0.1版

1.网络不通

1.1设备不能ping通

设备防火墙有没关掉?

设备有没接到交换机上?要查看交换机灯板?

查看设备IP配置,两个设备IP一定不要配重了,如果是双冗余网卡的加固机,一定要查看它的冗余网络配置,查看它配置的组的IP和mac地址一定不要重了。

如果出现ping的开始可以ping通一包,后面再也不能ping通的情况,一定是设备网络配置问题,好好查查IP MAC有无重复现象。

在交换机上可以用命令:show ip arp | include 192.168.X.X 来查看指定的ip在交换机上存在不存在!

在交换机上可以用命令:show mac address-table 来查看设备mac在交换机哪个端口上出现,以此推导设备连接在交换机哪个端口上面(针对现场连线比较混乱的情况,需要确认连接正确)。

如果上述都正常,设备还是不能ping通,那么只能在交换机上配置镜像进行查看,需要两台pc,一台监听ping包入口(ping包是否上交换机?),一台监听ping包出口(交换机是否把ping包转发给对方),做好计数。保证ping 包没有丢在交换机即可。

ping包从交换机发出后,若对方不回包,不在我们的职责范围内。

1.2设备可以ping通,但是收不到单播业务数据

设备可以互ping通的情况下,网络是通畅的。如果设备接收方不能收到业务数据,请检查业务数据报文(单播及组播)的TTL值,一定不能是1。否则过

交换机就会被丢弃。

如果设备应用软件还是不能收到业务数据,也要交换机进行镜像配置来帮助查看,一般来说,若交换机不进行acl、qos方面的配置,单播通畅情况下,单播业务数据不会收不到,也有可能是设备应用软件的某些问题。

使用交换机镜像功能,明确交换机已经把单播业务数据转发出去了即可。

1.3设备与对端设备跨网段通信,不能ping通

交换机上要针对跨网段进行配置,要检查设备的网关有没配置为指定网关IP。

交换机上检查配置,检查网关地址设置对不对,这个配置检查各个项目不同,不能统一而论。

如果设备的跨网段的ping包没有传给交换机,那就说明设备网络配置还是有问题的,在检查完交换机配置后,要镜像监听设备的传入交换机的报文。

1.4 两台设备与其他设备通信正常,但是两台设备之间不能互通

经典案例:两台双冗余加固机,配置组,组的mac是系统生成的,加固机的系统是镜像方法GHOST烧录的,导致两台加固机的mac地址重复,他们到其他设备均能通信,两者之间不能互通。

与1.1类似,还是要先检查网络ip mac的配置。

2.组播问题

2.1为什么单播可通的情况下,组播收不到包?

设备之间的组播通信建立在单播的基础上,如果单播都不通,组播基本别考虑了。

设备可以互ping通的情况下,网络是通畅的。如果设备接收方不能收到组播数据,可以用命令:show ip igmp snooping groups 来查看接收方所在端口

有没有组播组的加组信息。

如果接收方根本没有加组,那么它就收不到组播数据,在交换机二层组播开启的情况下(默认配置),组播发送方可以不加入组播组内(如果它只发不收的话),接收方一定要加组,否则交换机不会把组播数据转发给相关端口的。

案例:在某现场,设备接收组播数据,但是只能在设备启动时加组一次,后续不会再发加组报文,也不会响应交换机的查询(交换机大约2分20秒左右发组播查询报文,设备加组后的老化时间为4分20秒,响应交换机的查询后再次加组,设备老化时间重新计算)。这样导致该设备后续不能接收组播报文,原因大约定位在操作系统上,经过商讨,对方修改应用程序,每次心跳报文发出的时候就随带一个加组报文,保证对方设备一直在组内,问题解决。

2.3设备正常发出加组报文的情况下,为什么过一会还是会收不到组播数据?

案例:某设备连接交换机后,加组信息正常,运行一段时间后不能接收组播信息,另一台设备同时连入交换机,可以接收组播数据,当另一台设备重启或断开后,第一台设备又可以接收组播数据了。貌似两台有冲突似的。

实际检查后发现,交换机开启了二层组播,但是查询器没有使能,导致第一台在没有继续发加组包后老化退出组播组(另一台因为一直发加组包所以一直在组播组内),另一台重启或断开后会退出组播组,这时候,由于组播组内没有成员了,组播数据的流向有两个配置(默认配置是flood),也可以配置为未知流丢弃处理。

另一台重启或断开后,组播流处于flood状态,所以第一台有能够收到了。

问题解决:交换机上配置组播查询即可。

2.4设备无法发出加组报文的情况下,如何解决

若设备根本无法发出加组报文,想要接收组播数据的话,有两种解决方法:解决方法1:交换机关闭二层组播,no ip igmp snooping 。然后组播数据会在交换机内以flood的方式转发至每个端口。不足之处在于引起带宽的浪费而

且不需要接收组播数据的端口也能接收到组播数据了。

解决方法2:在设备连接交换机的端口上配置静态组播,将组播组静态加入端口上,只要端口link up 组播组就一直在。如果设备涉及多个组播组,就要配置多条。如果交换机涉及到级联或要传输组播数据到其他交换机上,那么传输该组播数据的整个链路上都需要有组播加组信息,无法加组的都需要配置静态组播。配置量比较大,繁琐一些。

2.5组播丢包问题

有一种问题是由于冗余切换导致,详情见4.2节描述。

2.6级联的交换机设备组播配置问题

级联的交换机设备在进行组播通信时,如果单机已经可以满足组播通信的要求,但是级联后不通,要注意查看组播报文是否按预期从级联端口传输?

进行级联端口的配置,将级联端口配置为mroute端口,具体举例:

ip igmp snooping vlan 1 mroute interface eth-0-1

3.网络丢包

3.1 网络丢包的情况

我们交付的交换机都经过测试验证,一般不会发生丢包现象。如果发生此类问题,一定要明确网络拓扑连接,弄清包丢在哪里是关键!

在交换机上可利用端口计数来查看,在查看前可clear counts来清零计数。

3.2 报文检验错的情况

出现过这样的情况,PC发出的报文IP头检验错了,PC自己录取报文的时刻

相关文档
最新文档