最全的网络故障案例分析及解决方案

合集下载

服务器网络故障排除的实际案例与解决方案

服务器网络故障排除的实际案例与解决方案

服务器网络故障排除的实际案例与解决方案近年来,随着互联网的快速发展和技术的不断进步,服务器已成为许多企业和组织中不可或缺的重要设备。

然而,由于各种原因,服务器网络故障问题时有发生,给企业的正常运营带来了严重困扰。

本文通过实际案例分析,探讨了服务器网络故障的解决方案,希望能为读者提供一些有益的参考。

案例一:硬件问题引发的服务器故障某ABC公司的服务器突然无法正常启动,导致了办公网络的瘫痪。

经过初步排查,发现服务器的硬件出现了故障。

为了快速解决问题,该公司采取了以下解决方案:1. 联系供应商:首先,他们联系了服务器的供应商,请求提供技术支持和维修服务。

供应商派遣了专业的工程师上门检修,并且在维修期间提供了临时的替代服务器,以保证企业的运营不受太大影响。

2. 数据备份恢复:为了保护企业数据的安全,该公司定期进行数据备份。

当服务器故障时,他们可以迅速恢复备份的数据,以确保业务的连续性。

3. 质量检测和维护:针对服务器硬件故障的原因进行了深入分析,并制定了更加严格的质量检测和维护计划,以提高服务器的稳定性和可靠性。

案例二:网络攻击导致的服务器崩溃某XYZ公司的服务器在一次网络攻击后突然崩溃,无法恢复正常运行。

为了解决这个问题,该公司采取了以下措施:1. 强化网络安全:对网络进行全面的安全评估,并加强了网络防护措施。

他们安装了防火墙、入侵检测和防护系统,并配置了强密码和访问控制策略,以抵御潜在的网络攻击。

2. 安全备份和恢复:该公司建立了完备的数据备份和恢复系统,确保服务器数据的安全和可靠性。

定期进行备份,并在发生故障时可以快速恢复,以减少损失和停机时间。

3. 灾难恢复计划:制定了灾难恢复计划,明确了重要数据和应用的备份和恢复流程。

在服务器崩溃后,他们能够迅速恢复业务连续性,并最大限度地减少了损失。

总结与展望通过以上两个实际案例的分析,我们可以看出,在排除服务器网络故障时,正确的解决方案对于企业来说至关重要。

网络工程师的网络故障排除和修复案例分析

网络工程师的网络故障排除和修复案例分析

网络工程师的网络故障排除和修复案例分析1. 案例一:路由器故障在一家大型企业的网络中,突然出现了网络连通性问题。

经过初步排查,发现问题主要出现在网络的核心设备——路由器上。

该路由器负责连接各个子网,并提供互联网连接。

在进行网络故障排除前,网络工程师首先检查了路由器的接口状态,发现其中一个接口显示为down状态。

工程师尝试重新启动该接口,但问题并没有解决。

随后,工程师决定进一步深入排查。

通过日志分析,发现路由器出现了高负载和异常错误信息。

工程师怀疑路由器的配置可能存在问题,因此检查了路由器的配置文件。

最终,工程师发现一个错误的路由策略导致了路由器的故障。

为了解决问题,工程师重新配置了路由器,并重新启动了接口。

随后,网络恢复正常,用户的网络连通性得到了恢复。

2. 案例二:交换机故障在一家中小型企业的网络中,部分用户反馈无法访问内部服务器。

经过初步排查,网络工程师发现用户所在的子网无法与服务器所在的子网进行通信。

工程师尝试ping服务器IP地址,发现无法ping通。

工程师进一步检查了交换机的端口状态,并发现用户所在的交换机端口出现了异常。

怀疑是交换机端口故障导致的网络问题,工程师在网络拓扑图上找到了一个备用交换机,并将受影响的用户连接到备用交换机上。

然而,问题并没有解决。

工程师意识到问题可能出在交换机的链路上。

通过检查链路连接状态,工程师发现一根链路线路断开了。

工程师修复了链路,并重新配置了相关端口。

最终,用户恢复了对服务器的访问。

3. 案例三:防火墙配置错误在一家金融机构的网络中,发生了一次重大的网络安全事件。

网络工程师接手了这个案例,试图找出并修复网络安全漏洞。

经过详细调查,工程师发现防火墙的配置存在问题。

防火墙是保护企业网络的第一道安全防线,它负责过滤和检查网络流量。

通过审查防火墙的配置文件,工程师发现了一些不正确的规则和过时的访问控制列表(ACL)。

这些配置问题导致了网络安全漏洞,使得恶意攻击者能够绕过防火墙并访问内部网络。

宽带用户故障案例分析处理

宽带用户故障案例分析处理

宽带用户故障案例分析处理在如今信息化快速发展的时代,宽带已成为大多数家庭和企业不可或缺的重要设备。

然而,宽带使用过程中可能会遇到各种故障,给用户带来诸多困扰。

本文将从一个实际案例出发,对宽带用户故障进行分析和处理,以帮助用户更好地解决问题。

案例描述:某用户在使用宽带上网时,发现网络速度明显变慢,甚至经常出现断网的情况。

拨打宽带运营商客服电话,得到的答复是网络正常,存在问题可能是用户端的原因。

用户通过自我排查后发现电脑硬件及软件都正常,家中其他设备连接宽带也出现类似问题。

分析原因:1. 带宽限制:宽带运营商根据用户不同的套餐购买提供相应的带宽,用户平常使用的网络速度取决于所购买的服务和当时网络状况。

如果带宽限制达到上限,就会导致网速明显变慢以及频繁断网的问题。

2.网络拥堵:网络拥堵是指在某一时间段内有过多的用户同时使用网络,导致网络带宽无法满足需求。

尤其是在高峰时段,如晚上7点到10点,很容易出现网络拥堵的情况。

3.设备故障:宽带连接设备如路由器、网线等可能出现故障,导致网络连接不稳定。

网线老化或连接插头松动可能导致网络速度变慢或频繁断网等问题。

处理方法:1.确认带宽限制:用户可以通过登录宽带运营商提供的管理界面查询本月剩余流量或带宽使用情况。

如果接近或已经超过限制,用户可以考虑升级套餐或在下个月重新分配流量。

2.优化网络使用时间:在拨打宽带运营商之前,用户可以尝试在不同的时间段使用网络,观察网络速度是否有所提升。

如在非高峰时段使用网络,可能会避免网络拥堵导致的速度下降和断网问题。

3.检查设备故障:用户可以检查宽带连接设备是否存在故障。

首先,检查网线连接是否稳定,尝试更换网线或重新插拔网线。

其次,用户可以尝试重启路由器,或者将其恢复到出厂设置,以解决可能由路由器设置问题引起的网络故障。

4.联系宽带运营商:如果上述方法无效,用户可以拨打宽带运营商客服电话,向他们描述问题并提供所做的排查情况。

客服人员可能会进一步检查用户所在地的网络情况,或者发送工作人员到用户家中进行现场排查。

网络故障分析案例

网络故障分析案例
安全策略调整
根据安全威胁分析结果,调整安全策略以增强网络安全防 护能力。例如,加强密码管理、部署防火墙等措施可以降 低安全风险。
03
故障排除过程
初步排查
确定故障范围
通过观察网络设备的指示灯、检查网络连接状 态等方式,初步确定故障范围。
排除物理连接问题
检查网络设备的物理连接是否正常,如网线、 接口等。
检查网络配置
查看网络设备的配置文件,确认配置是否正确。
网络设备重启与替换
重启网络设备
尝试重启网络设备,看是否能够 恢复正常。
替换故障设备
如果重启无效,考虑替换故障设 备,看是否能够解决问题。
网络配置检查
检查IP地址配置
确认网络设备的IP地址配置是否正确,是否存在IP地 址冲突。
检查子网掩码、网关配置
自然灾害(如地震、洪水、飓风等)可能 导致网络设备损坏或通信线路中断。
网络架构优化建议
01
02
03
04
设备选型与备份
根据业务需求选择性能稳定、 质量可靠的设备,并配置备份
设备以防止单点故障。
网络拓扑优化
优化网络拓扑结构,减少网络 层级,提高数据传输效率。
负载均衡
通过部署负载均衡器,将网络 流量分担到多个设备上,提高
网络瓶颈识别
通过分析网络流量和协议,识别出网络瓶颈所在的位置和原因 。例如,某个端口的流量过大可能表示该端口存在瓶颈。
安全威胁分析
安全漏洞扫描
通过扫描网络设备和服务器的安全漏洞,找出可能存在的 安全威胁。例如,某些设备可能存在弱密码或未打补丁等 问题。
恶意攻击检测
通过监控网络流量和协议,检测出可能的恶意攻击行为。 例如,DDoS攻击可能导致网络拥堵或服务不可用。

酒店网络现场维修方案

酒店网络现场维修方案

酒店网络现场维修方案在酒店网络使用过程中,会遇到各种各样的问题,其中一些问题可能需要在现场解决。

本文旨在提供一些针对酒店网络现场维修的方案。

常见问题及解决方案网络连接出现问题网络连接出现问题时,首先需要排除网络硬件故障的可能性。

以下是一些解决方案:1.检查网络设备是否正常工作。

如果网络设备未启动,则必须先启动设备。

2.检查网络线路是否连接。

如果网络线路未正常连接,则必须重新连接。

3.检查网络配置是否正确。

如果网络配置有误,则必须进行手动配置。

网络速度慢网络速度慢可能是网络连通性问题的一种表现,或者是网络拥塞、网络带宽等的其他问题。

以下是一些解决方案:1.检查网络带宽是否满足预期。

如果网络带宽不够,则需要优化网络带宽。

2.检查网络拥塞情况。

如果网络拥塞,则需要增加网络带宽或优化网络拥塞。

3.检查网络性能是否正常。

如果网络性能有问题,则需要优化网络性能。

路由器故障路由器故障是一种较为常见的问题,可能会导致网络瘫痪。

以下是一些解决方案:1.重新启动路由器。

如果路由器出现故障,则可以尝试重新启动路由器。

2.检查路由器是否需要升级。

如果路由器软件需要升级,则需要进行升级操作。

3.更换路由器。

如果路由器出现故障已无法修复,则需要更换路由器。

现场维修步骤以下是一些酒店网络现场维修的步骤:1.观察和分析问题,确定维修方案。

2.通知相关用户和部门,确保维修过程对用户和部门影响最小。

3.停止网络相关服务,如需要升级路由器软件或更换路由器时。

4.实施维修方案,并确保维修后网络恢复正常工作。

5.测试网络连接和速度,确保网络性能符合要求。

6.完成维修后,恢复网络相关服务,并通知相关用户和部门网络已恢复正常。

案例以下是一些酒店网络现场维修的案例:案例1:网络瘫痪某酒店的网络突然出现了瘫痪,无法连接互联网。

经过调查发现是路由器故障导致,路由器需要更换。

维修步骤:1.通知相关用户和部门,停止网络相关服务。

2.停止路由器并拆下路由器。

常见网络故障案例解析

常见网络故障案例解析

【故障解决】 将4口交换机更换为8口交换机,即可解决 故障。
故障3:“COL”指示灯长亮或不断闪烁, 无法实现通信
【故障现象】 局域网中计算机通过集线器访问服务器, 但是某日发现所有客户端计算机无法与服 务器进行连接,客户机之间Ping也时断时 续。检查集线器发现“COL”指示灯长亮或 不断闪烁。
【故障分析】 UpLink端口不能被看作是一个单独的端口, 这是因为它与相邻端口其实就是一个端口,只是 适用的连接对象不同而已。借助UpLink端口,集 线设备可以使用直通线连接至另外一个集线设备 的普通端口,这样就不必使用交叉线。 交换机和集线器的芯片通常为×4,所以集线 设备端口大多为4口、8口、16口、24口等,如果 制作成5口,就会浪费3个模块,从而增加成本。
【故障解决】 如果需要在交换机加电之后迅速实现数 据转发,可以禁用扩展树协议,或者将端口 设置为PortFast模式。不过需要注意的是, 这两种方法虽然省略了端口检测过程,但是 一旦网络设备之间产生拓扑环,将导致网络 通信瘫痪。
故障2:5口交换机只能使用4口
【故障现象】 办公室中有4台计算机,但是只有一个 信息插座,于是配置了一台5口(其中一口 为UpLink端口)交换机。原以为4台计算机 刚好与4个接口连接,1个UpLink端口用于 连接到局域网,但是接入到网络之后,与 UpLink端口相邻的1号口无法正常使用。
【故障分析】 由于这台交换机是一台可网管交换机,为了避免网络 中存在拓扑环,从而导致网络瘫痪,可网管交换机在默认 情况下都启用生成树协议。这样即使网络中存在环路,也 会只保留一条路径,而自动切断其他链路。所以,当交换 机在加电启动的时候,各端口需要依次进入监听、学习和 转发状态,这个过程大约需要3~5分钟时间。 如果需要迅速启动交换机,可以在直接连接到计算机的 端口上启动“PortFast”,使得该端口立即并且永久转换至 转发状态,这样设备可以立即连接到网络,避免端口由监 听和学习状态向转发状态过渡而必须的等待时间。

PING大包丢包网络故障分析案例解决方案

PING大包丢包网络故障分析案例解决方案

PING大包丢包网络故障分析案例解决方案网络故障是在使用网络过程中经常会出现的问题,其中大包丢包是一种常见的网络故障。

大包丢包指的是在网络传输过程中,发生了传输较大包的数据丢失的情况。

接下来我将进行一个关于大包丢包的网络故障分析案例,并提供相应的解决方案。

案例分析:公司A部门反馈在办公网络中使用视频会议时,经常出现画面卡顿和断流的问题。

在进行网络故障排查的过程中,发现了存在大包丢包的情况。

问题分析:大包丢包会导致网络传输不稳定,影响视频会议等带宽需求较高的应用。

造成大包丢包的原因主要有以下几点:1.网络拥塞:当网络带宽使用过高时,可能会造成网络拥塞,从而引发大包丢包问题。

2.路由器配置错误:路由器可能会存在配置错误,导致无法正确转发大包数据,从而引发大包丢包问题。

3.网络设备故障:路由器、交换机等网络设备可能存在故障,导致无法有效处理网络数据,从而引发大包丢包问题。

解决方案:针对以上问题,可以采取以下解决方案:1.网络监控与优化:通过网络监控工具对网络流量进行实时监控,及时发现网络拥塞问题。

在网络拥塞时,可以考虑对网络带宽进行扩容,以保证网络的稳定性。

2.检查路由器配置:对路由器进行检查,确保其配置正确。

可以参考厂商提供的配置文档,根据网络需求合理设置路由器参数。

同时,也可以考虑升级路由器固件,以确保设备的正常工作。

3.检查网络设备故障:定期对网络设备进行巡检,发现故障及时进行修复或更换。

例如,使用专业的网络测试工具对路由器、交换机等设备进行故障检测,确保其正常运行。

4.优化网络拓扑:对网络拓扑结构进行优化,确保网络中的数据传输路径短且流畅。

通过优化网络拓扑,可以减少数据传输的时延,从而降低大包丢包的发生概率。

5.加强网络安全:网络安全问题也可能导致大包丢包问题。

加强网络安全措施,防范网络攻击与入侵。

例如,使用防火墙、入侵检测系统等安全设备,对网络数据进行过滤和监测。

总结:大包丢包是一种常见的网络故障,可能会对网络传输稳定性产生严重影响。

网络故障诊断案例分析:典型故障、诊断过程与解决方案

网络故障诊断案例分析:典型故障、诊断过程与解决方案

• 适用于网络协议故障和网络
• 适用于网络性能优化和网络
情况
性能问题的诊断
故障预防
网络故障诊断的流程与注意事项
故障诊断流程
注意事项
• 收集故障信息
• 保持冷静,不慌乱
• 分析故障现象
• 善于分析和总结故障现象
• 定位故障原因
• 谨慎操作,避免误操作导致
• 制定解决方案
新的故障
• 实施解决方案并验证效果
• Infoblox NetMRI
网络故障诊断手册与资料
网络设备厂商
提供的手册和
资料
网络故障诊断
指南和教程
01
02
• Cisco
• ITU-T
• Huawei
• IEEE
• Juniper
• 网络工程师培训教材
网络故障诊断社区与论坛
网络故障诊断社区
网络技术论坛
• Stak World


⌛️
故障现象
故障原因
解决方案
• 网络传输速度变慢,导致业务响
• 网络拥塞
• 优化网络拥塞情况,如调整网络
应时间延长
• 网络设备性能不足
设备的流量优先级
• 网络时延波动,影响实时业务
• 网络链路质量差
• 升级网络设备,提高处理能力
• 检查并优化网络链路质量
网络安全故障案例分析
故障现象
故障原因
解决方案
网络故障诊断工具与资源
常用网络故障诊断工具介绍
01
02
03
网络监控工具
网络抓包工具
网络故障诊断工具
• Nagios
• Wireshark
• SolarWinds Network

路由器故障典型案例分析

路由器故障典型案例分析

路由器故障1:不堪重负,路由器外网口关闭1、网络环境某单位使用的是Cisco路由器,租用电信30MB做本地接入和l0MB教育网双线路上网,两年来网络运行稳定,路由器也没有发生故障。

随着网络用户数量增加,原来电信30MB已不能满足需要,于是决定租用电信1OOMB来解决带宽问题。

电信采用光纤接入到单位机房后,使用百兆光电转换器经转换后通过双绞线接到路由器外网口上面,该路由器使用是千兆电口作为外网口,由于光电转换器只有1O0MB,该端口连接后速度显示100MB。

2、外网端口流量为零经过几天的运行,管理员发现每天当路由器外网口流量超过50Mbps/s后,该端口就会出现“Receive Errors” ,流量超大,错误信息很多。

突然有一天,出现外网不能上了,Telnet到路由器上面,发现电信对应的外网口没有流量,显示状态为UP,路由器上其他端口工作正常。

第一反映是电信的那边出现问题了,是电话通知电信那边查检一下,对方很快回应说没有什么问题,并询问是否光电转换器死机了。

于是管理员将光电转换器重启后,故障依然。

没有办法,只好将路由器重启一下,故障排除。

谁知,过了不到一个小时,故障又重现。

Telnet到路由器后将该外网口执行shutdown 和undo shutdown后,故障排除。

谁知,将所有有关病毒的安全策略应用到该端口,将tcp mss修改为2048(厂商默认1460),故障依然出现。

3、故障分析管理员发现在故障发生时,CPU显示23%,Memory为33%,不算太高,关键是其他接口都正常工作,看样子问题还是出现在这个端口上面。

可这个端口已用了两年了,升级扩容以前没有出现端口不能正常通讯的情况,端口硬件应该是有什么问题。

通过网管软件对端口关闭前的流量检测,发现该端口关闭前有很大的流量通过(超过80Mbps/s) ,显示端口的错误信息也比较多。

通过分析得知应该是网络流量太大,利用率过高所致。

流量超过80%后,造成端口不能正常。

网络故障处理案例分析

网络故障处理案例分析

网络故障处理案例分析网络故障处理案例分析对网络整体结构的掌握,是处理网络故障的前提,下面是YJBYS收集的网络故障的案例分析,希望对你有帮助!案例二:[网络故障]某大型化工股份有限公司信息中心报告网络故障,新近进行网络的更新升级和扩容,由10M网全部提升为100M以太网,核心交换机为千兆以太网。

完工后系统试机时发现,大部分的网络成员感觉速度慢,有时数据出错,但子网段内拷贝数据速度基本不受影响。

Ping测试检查所有工作站和服务器均正常。

遵照网络医院上周的建议他们对网络布线系统进行严格认证测试,布线施工质量优良,全部电缆光缆链路按超五类标准测试参数均合格,没有发现任何问题。

由于信息中心除了电缆和光缆的认证测试仪外,没有其它测试维护工具,无法对网络进行评测。

虽然仔细进行了网络系统及平台的重新安装,仍无济于事。

由于总公司希望全面提高ERP系统的覆盖范围,新增的网络设备比较多,网上成员也增加了二倍多,工作站从原来的220台猛增至680台,办公区和生产区之间、生产区和生产区之间均用光缆和路由器连接起来,因此洪主任抱怨现在网络的管理成了问题,查找故障不象从前那样容易了,一来网络规模比以前大多了,故障数量和种类增多,二来网络结构变得比以前复杂多了,故障的定位分析和隔离变得比较困难。

该网络各子网段基本上采用核心交换机和工作组交换机作网络骨架,用桌面交换机和集线器混用的方式构成基层用户接入平台,核心交换机之间为千兆以太网连接,用户全部为100M到桌面。

为了便于维护和管理,同时也从安全角度考虑,设计方案中将大多数数据服务器均安装在了网管中心。

[诊断过程]网络为新扩容的网络,从拓扑图上看不出网络结构设计有何不合理之处。

由于在各子网段内拷贝数据时速度基本不受影响,所以分析数据多在跨网段时受阻。

将网络测试仪接入办公区网络的网管中心,打开网段内的全部4个路由器的端口观察,网段间的流量为27%~42%之间,由于网络没有多媒体应用启用,因此如此高的流量记录是不正常的。

LTE核心网常见故障和投诉案例分析

LTE核心网常见故障和投诉案例分析

LTE核心网常见故障和投诉案例分析1.呼叫掉话:呼叫掉话是用户最常见的投诉之一、它可能是由于核心网故障造成的。

可能原因包括:-信号覆盖不足:这可能是由于设备故障或基站问题导致的。

解决方案包括维修设备或增加基站容量。

-呼叫拥塞:当LTE核心网容量超过负荷时,呼叫掉话率可能会增加。

解决方案包括优化网络资源分配和增加容量。

-数据传输问题:LTE核心网的数据传输可能受到故障的影响。

解决方案包括修复故障和优化数据传输。

2.数据速率下降:用户可能投诉在使用LTE网络时遇到数据速率下降的问题。

这可能由以下原因引起:-设备问题:用户设备可能存在故障或配置问题,导致数据速率下降。

解决方案包括检查设备并提供技术支持。

-频谱问题:LTE频谱拥塞可能导致数据速率下降。

解决方案包括优化频谱分配和增加频带宽度。

-核心网负载:LTE核心网负载过高可能导致数据速率下降。

解决方案包括优化网络资源和增加容量。

3.信令延迟:信令延迟是另一个常见的投诉问题。

这可能是由于以下原因引起:-信令丢失:LTE核心网可能会遇到信令丢失问题,导致延迟增加。

解决方案包括修复故障和优化信令传输。

-呼叫拥塞:当LTE网络容量超过负荷时,信令延迟可能会增加。

解决方案包括优化网络资源和增加容量。

-核心网拓扑问题:LTE核心网拓扑设计不合理可能导致信令延迟。

解决方案包括重新设计和优化核心网拓扑。

4.服务不可用:用户可能投诉LTE网络服务不可用。

可能原因包括:-网络故障:当LTE核心网遭遇故障时,服务可能会中断。

解决方案包括快速修复故障和提供备用网络。

-天气影响:极端天气条件可能影响LTE网络的可用性。

解决方案包括增强天气适应性和增加备用设备。

-用户设备故障:用户设备故障可能导致无法使用LTE网络。

解决方案包括检修设备或提供替代设备。

综上所述,LTE核心网常见故障和投诉案例包括呼叫掉话、数据速率下降、信令延迟和服务不可用。

针对这些问题,可以采取一系列解决方案,包括维修设备、优化网络资源、增加容量和重新设计核心网拓扑。

网络丢包分析案例解决方案

网络丢包分析案例解决方案

网络丢包分析案例解决方案网络丢包是指在数据传输过程中,部分数据包未能正常到达目的地。

网络丢包可能导致数据传输速度变慢、网络连接中断以及影响用户体验等问题。

本文将针对网络丢包分析一个案例,并提出解决方案。

案例分析:假设一个中小型企业,拥有自己的局域网和接入互联网的路由器,由于最近网络丢包问题频发,导致员工在办公过程中遇到了困难。

为了解决这个问题,我们需要进行以下步骤:1.判断丢包情况:首先,需要确定是否存在网络丢包问题。

可以通过ping命令检测网络丢包率。

在命令提示符中输入ping目标IP,可以观察到ping的结果,如果出现丢包,则说明存在丢包问题。

2.排除硬件故障:网络丢包问题可能是由于硬件故障引起的。

首先,需要确保路由器和交换机没有故障。

可以尝试更换网络设备进行排错。

3.检查网络拓扑结构:网络拓扑结构可能导致丢包问题。

过多的中转、线路负载不均衡等都可能导致丢包。

需要检查路由器、交换机和服务器的连接情况,确保没有物理障碍。

4.调整MTU和MSS:最大传输单元(MTU)和最大报文段长度(MSS)是数据包大小的两个参数。

过大的MTU或MSS可能导致网络丢包。

可以通过调整这两个参数,减小数据包的大小,以提高网络稳定性。

5.网络流量管理:网络流量过大可能导致网络拥堵和丢包。

可以限制特定应用程序的带宽使用,或者调整路由器的流量控制策略,以减少网络拥堵和丢包。

6.升级网络设备固件:网络设备的固件可能存在漏洞,导致网络丢包。

可以升级网络设备的固件,以修复已知的漏洞,并提高网络性能。

解决方案:针对上述分析结果,我们提出以下解决方案:1.网络设备故障:更换或修复故障的网络设备,确保网络设备正常运行。

2.优化网络拓扑结构:根据实际情况重新设计网络拓扑结构,减少中转节点,确保网络连接稳定。

3.调整MTU和MSS:根据网络情况调整MTU和MSS的参数,保证数据包大小合适。

4.网络流量管理:使用流量管理工具进行网络流量监控和控制,合理分配网络带宽资源,减少网络拥堵。

关于PON网络故障典型案例

关于PON网络故障典型案例

关于PON网络故障典型案例目录1、华为PON网络典型故障案例 (2)1.1、B类ONU上行VLAN透传问题 (2)1.2、ONU参数设置问题 (5)1.3、B类ONU更换PON口 (8)2、阿尔卡特PON网络典型故障案例 (13)2.1、OLT上联口故障 (13)2.2、ONU端口异常 (20)1、华为PON网络典型故障案例1.1、B类ONU上行VLAN透传问题故障描述:接到电话保障一个B类ONU无法上网,网管检查该ONU 状态正常,(该ONU有两个上联口,尾纤接1口时ONU无法登陆,接2口时ONU正常登陆)业务配置正常,ONU上能识别到网口下带电脑的MAC地址,但在OLT上查询不到该MAC地址。

故障诊断:定位及处理过程:1、检查该B类ONU状态正常,无任何异常告警。

2、与现场核对CVLAN,SVLAN与网管上配置一致,检查OLT上service port、线路模板配置正常,检查ONU上service port,以太网端口设置均正常。

3、联系现场,把手提电脑接到对应的网口上,长PING网关。

在网管上,进入ONU的命令行,观察该手提的MAC地址能透传上ONU。

4、进入OLT的命令行,查询不到该MAC地址。

5、双击ONU进入网元管理器,检查VLAN是从0/0/1口透传到OLT 的,而状态正常且在用的是0/0/2口,于是把0/0/2口增加到VLAN 的端口列表中。

6、进入OLT的命令行能够查询到该MAC地址,现场反馈业务正常。

分析情况:1、display mac_address port 0/1/1 查看ONU能否获取手提上的MAC地址。

截图012、display vlan xxx 查看vlan是通过哪个上联口向上透传截图02通过截图看出vlan是从1口向上透传的,而现场在用的是2口。

3、display board x/x 查看板卡上端口的状态。

截图03故障分析为1口是DOWN的,2口为UP的。

VLAN无法从1口透传上去。

PING大包丢包网络故障分析案例、解决方案

PING大包丢包网络故障分析案例、解决方案

PING 大包丢包故障剖析1.1.故障描绘1.故障环境网络构造以下列图所示:如上图所示,两边网络经过光纤相连,中间设施只有光电变换器,到单位 B 的内部网络有一台防火墙2.故障描绘单位 B 在进行网络测试时,在单位 B 的出口路由器处 PING 单位 A 的出口路由器时, PING 大包会出现丢包现象,可是 PING 小包正常。

1.2.故障剖析1.剖析方法主要经过专有的网络剖析工具(科来网络剖析系统)将故障时相应的数据包捕捉下来进行深度剖析,并经过剖析发现相应的异样,进而定位故障原由的方法。

2.部署科来网络剖析系统我们在单位 B 的光电变换器和路由器之间串通一个互换机,利用互换机的端口镜像功能,镜像两个端口的流量,并将科来网络剖析系统部署在互换机的镜像口,以下列图所示:3.剖析数据包经过故障重现,即在路由器接口处进行PING 测试,并同时捕捉数据包,获得的数据包以下列图所示:如上图所示,我们在使用大包PING 对端时,对端返回了一个超时的数据包,查察它详细的数据包解码,以下列图:造成该故障的原由是因为,我们在网络中传输大包时,因为网络中“最大传输单元”的限制,大数据包会发生疏片,当分片数据包都抵达目的端时会发生重组,一旦有一个分片丢掉就会造成数据报重组超时,因此会发送超时的差错提示。

4.剖析结论我们在进行 PING 测试时,数据包只经过了光电变换器和中间链路,因此造成该故障的原由就是光电变换器或中间链路丢包造成的。

1.3.总结当我们在剖析数据包时,发现通讯的数据包中有异样的数据包,那么我们就需要关注它是何种应用的数据包,经过剖析异样的数据包能够帮助我们迅速的找到故障原由,进而解决故障。

移动通信维护故障案例集

移动通信维护故障案例集

移动通信维护故障案例集移动通信维护故障案例集1.引言在移动通信领域,故障案例是非常重要的资源,可以提供宝贵的经验和教训。

本文档旨在汇总整理一些典型的移动通信维护故障案例,供参考使用。

每个案例都会详细介绍故障现象、分析原因和解决方案。

2.硬件故障案例2.1 方式无法开机2.1.1 故障现象:方式无法开机,屏幕显示不出任何内容。

2.1.2 分析原因:可能是电池故障、主板故障或者线路连接问题。

2.1.3 解决方案:更换电池,检查主板和线路连接。

2.2 网络信号弱2.2.1 故障现象:方式在特定区域信号非常弱,无法正常通话或上网。

2.2.2 分析原因:可能是信号塔故障、天线故障或者网络拥塞。

2.2.3 解决方案:检修信号塔、调整天线方向或者加强网络扩容。

3.软件故障案例3.1 应用程序崩溃3.1.1 故障现象:打开某个应用程序后,程序立即崩溃退出。

3.1.2 分析原因:可能是程序本身存在Bug、与其他应用冲突、设备内存不足等。

3.1.3 解决方案:升级应用程序、清理设备内存、检查是否与其他应用冲突。

3.2 网络连接失败3.2.1 故障现象:设备无法连接到互联网。

3.2.2 分析原因:可能是网络设置错误、无线连接问题、运营商服务故障等。

3.2.3 解决方案:检查网络设置、重新连接无线网络、联系运营商检查服务状态。

4.设备故障案例4.1 屏幕显示异常4.1.1 故障现象:屏幕出现颜色异常、闪烁或者出现一些奇怪的图像。

4.1.2 分析原因:可能是屏幕破损、屏幕驱动程序错误、设备散热问题等。

4.1.3 解决方案:更换屏幕、更新驱动程序、保持设备通风良好。

4.2 电池快速耗电4.2.1 故障现象:设备的电池快速耗电,无法维持正常使用时间。

4.2.2 分析原因:可能是应用程序后台运行、屏幕亮度过高、设备老化等。

4.2.3 解决方案:关闭后台应用、调整屏幕亮度、更换电池或设备。

5.附件本文档附带相关案例的详细故障报告和解决方案。

IPRAN故障案例分析

IPRAN故障案例分析

IPRAN故障案例分析IPRAN(Internet Protocol Radio Access Network)是一种将无线网络和IP网络相结合的技术,以提供高速、稳定和可靠的网络连接。

然而,在实际应用中,由于各种原因,可能会出现IPRAN故障。

本篇文章将通过分析一个IPRAN故障案例,探讨故障的原因和解决方法。

案例背景描述:大型电信运营商在一座城市部署了一个IPRAN网络,用于提供移动通信服务。

该网络由多个路由器和交换机组成,通过光纤互联。

近期,该网络出现了一系列故障,导致网络不稳定、传输速度变慢,客户抱怨也随之增加。

故障分析:1.网络拓扑问题:首先,要对网络拓扑进行排查,确保所有设备的连接和配置都正确。

检查光纤连接是否松动或损坏,交换机的端口配置是否正确,路由器之间的邻居关系是否建立。

任何一个拓扑结构失效都可能导致网络故障。

2.传输链路故障:其次,要仔细检查传输链路,包括光纤、光模块和接口等。

使用光纤测试仪,检查链路的物理和光学性能。

如果发现链路损坏或高光损耗,需要进行修复或更换。

3.网络设备问题:还需要检查路由器和交换机的配置文件和运行状态。

查看是否有日志记录错误信息,比如配置错误、冗余路由等。

如果路由表配置错误,可能导致数据包转发错误或循环转发。

此外,还应检查设备的资源利用率,如CPU利用率、内存利用率等。

如果一些设备超负荷运行,可能会导致网络拥塞和延迟。

4.安全问题:由于IPRAN网络通常连接到互联网,网络安全问题也可能导致故障。

检查设备的防火墙设置、访问控制列表和安全策略,确保网络不受到恶意攻击或未经授权的访问。

解决方案:1.拓扑排查和修复:对网络拓扑进行仔细检查,确保所有设备的连接正确并按照要求进行配置。

修复任何松动、损坏的光纤,重新配置交换机的端口。

2.传输链路维护:使用光纤测试仪检查传输链路的物理和光学性能。

如果有问题,及时进行修复和更换。

在链路故障发生时,可以通过使用备用链路或配置冗余链路来提供容错能力。

最全的网络故障案例分析及解决方案

最全的网络故障案例分析及解决方案

第一部:网络经脉篇2[故事之一]三类线仿冒5类线,加上网卡出错,升级后比升级前速度反而慢2[故事之二]UPS电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错4[故事之三]光纤链路造侵蚀损坏6[故事之四]水晶头损坏引起大型网络故障7[故事之五] 雏菊链效应引起得网络不能进行数据交换9[故事之六]网线制作不标准,引起干扰,发生错误11[故事之七]插头故障13[故事之八]5类线Cat5勉强运行千兆以太网15[故事之九]电缆超长,LAN可用,WAN不可用17[故事之十]线缆连接错误,误用3类插头,致使网络升级到100BaseTX网络后无法上网18 [故事之十一]网线共用,升级100Mbps后干扰服务器21[故事之十二]电梯动力线干扰,占用带宽,整个楼层速度降低24[故事之十三]“水漫金山”,始发现用错光纤接头类型,网络不能联通27[故事之十四]千兆网升级工程,主服务器不可用,自制跳线RL参数不合格29[故事之十五]用错链路器件,超五类线系统工程验收,合格率仅76%32[故事之十六]六类线作跳线,打线错误造成100M链路高额碰撞,速度缓慢,验收余量达不到合同规定的40%;34[故事之十七]六类线工艺要求高,一次验收合格率仅80%36第二部:网络脏腑篇39[故事之一] 服务器网卡损坏引起广播风暴39[故事之二]交换机软故障:电路板接触不良41[故事之三]防火墙设置错误,合法用户进入受限44[故事之四]路由器工作不稳定,自生垃圾太多,通道受阻47[故事之五]PC机开关电源故障,导致网卡工作不正常,干扰系统运行49[故事之六]私自运行Proxy发生冲突,服务器响应速度“变慢”,网虫太“勤快” 52[故事之七]供电质量差,路由器工作不稳定,造成路由漂移和备份路由器拥塞54[故事之八]中心DNS服务器主板“失常”,占用带宽资源并攻击其它子网的服务器57[故事之九]网卡故障,用户变“狂人”,网络运行速度变慢60[故事之十]PC机网卡故障,攻击服务器,速度下降62[故事之十一]多协议使用,设置不良,服务器超流量工作65[故事之十二]交换机设置不良,加之雏菊链效应和接头问题,100M升级失败67[故事之十三]交换机端口低效,不能全部识别数据包,访问速度慢70[故事之十四]服务器、交换机、工作站工作状态不匹配,访问速度慢72第三部:网络免疫篇75[故事之一]网络黑客程序激活,内部服务器攻击路由器,封闭网络75[故事之二]局域网最常见十大错误及解决(转载)78[故事之三] 浅谈局域网故障排除81网络医院的故事时间:2003/04/24 10:03am来源:sliuy0 整理人:蓝天(QQ:12015152)[引言]网络正以空前的速度走进我们每个人的生活。

网络故障案例

网络故障案例

网络故障案例在当今信息化社会,网络已经成为人们生活和工作中不可或缺的一部分。

然而,随着网络规模的不断扩大和网络设备的复杂化,网络故障也时有发生。

网络故障不仅会给我们的生活和工作带来诸多不便,还可能导致重大的经济损失。

因此,及时有效地解决网络故障显得尤为重要。

网络故障的种类繁多,可能是硬件故障、软件故障、网络拥堵、网络攻击等多种因素导致的。

在这里,我将结合实际案例,介绍一起网络故障的解决过程,以期能够帮助大家更好地理解和解决网络故障问题。

案例一,企业网络拥堵。

某公司的网络在每天下午的高峰期都会出现网络拥堵的情况,导致员工的工作效率明显下降。

经过排查,发现是因为部分员工在高峰期使用大量带宽的应用程序,导致网络带宽不足而引起的网络拥堵。

解决方案,首先,我们需要对网络流量进行监控和分析,找出高峰期的网络流量分布情况。

然后,通过网络设备的配置,对网络流量进行合理分流,避免某些应用程序占用过多带宽。

同时,可以考虑增加网络带宽,以满足高峰期的需求。

最后,对员工进行网络使用规范的培训,引导他们在高峰期避免集中使用大量带宽的应用程序。

案例二,家庭网络硬件故障。

某用户家庭的无线路由器突然无法连接互联网,经过检查发现是路由器硬件故障导致的无法正常工作。

解决方案,首先,需要对路由器进行重启,看是否能够恢复正常工作。

如果重启无效,可以尝试更新路由器的固件或者恢复出厂设置。

如果这些方法仍然无法解决问题,可能需要更换新的路由器。

在更换路由器之后,还需要重新配置路由器的网络参数,以确保网络能够正常连接。

案例三,网络安全漏洞。

某企业的内部网络遭受了来自外部的网络攻击,导致公司重要数据泄露,给公司的经济利益和声誉带来了严重损失。

解决方案,首先,需要对公司的网络安全设备进行全面检查,确保设备的防护功能正常运行。

同时,可以考虑加强网络安全设备的配置,增加网络入侵检测和防御的能力。

另外,对公司内部员工进行网络安全意识的培训,加强员工对网络安全的重视和防范意识,避免因为员工的疏忽而导致网络安全漏洞。

企业IT网络常见故障案例分析

企业IT网络常见故障案例分析

企业IT网络常见故障案例分析随着信息技术的不断发展,企业IT网络已经成为企业运营的重要基础设施。

然而,由于网络系统的复杂性和规模,网络故障仍然是企业IT运维工作中常见的问题之一、本文将分析企业IT网络常见故障案例,并探讨解决策略。

一、网络连接故障网络连接故障是企业IT网络中最常见的问题之一、该问题通常由以下原因引起:网络线路故障、设备故障、网络配置错误等。

一旦发生连接故障,企业内部的通信和对外部的连通性都会受到影响。

解决策略:1.检查网络线路连接是否正常,确保连接丝插好且紧固。

2.检查设备是否正常工作,例如路由器、交换机、网卡等设备的指示灯是否正常。

3.检查网络配置,如IP地址、子网掩码、网关等是否正确设置。

4. 使用网络故障诊断工具(例如ping命令)检测网络连接是否正常,并根据诊断结果进行相应的调整。

二、网络速度慢解决策略:1.分析网络流量,找出网络拥堵的瓶颈。

可以使用网络监控工具来检测哪些设备或应用程序占用了大量的带宽。

2.扩大带宽,以满足企业的网络需求。

可以与网络服务提供商协商,购买更高带宽的网络连接。

3.升级设备,如路由器、交换机等,以提供更高的性能。

可以通过更换设备或优化设备配置来提升网络速度。

4.对网络流量进行优化,如使用流量控制措施、调整网络访问策略等。

三、网络安全问题随着网络攻击的增多,企业IT网络的安全问题变得越来越重要。

网络安全问题包括入侵、数据泄露、恶意软件等。

一旦出现安全问题,企业的商业机密和数据资产都会受到严重威胁。

解决策略:1.设置防火墙和入侵检测系统,对网络入侵进行实时监控和防护。

2.加强对网络设备的管理和配置,及时修复设备的安全漏洞,并保持设备软件的更新。

3.加强员工网络安全培训,增强员工的网络安全意识,防止社会工程学攻击和网络钓鱼等形式的攻击。

4.定期备份企业数据,并设置访问控制和加密措施,确保数据的安全存储和传输。

四、移动设备接入问题随着移动设备的普及,员工使用移动设备接入企业网络的情况也越来越多。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一部:网络经脉篇2[故事之一]三类线仿冒5 类线,加上网卡出错,升级后比升级前速度反而慢2[ 故事之二]UPS 电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错4 [ 故事之三]光纤链路造侵蚀损坏6[ 故事之四]水晶头损坏引起大型网络故障7[ 故事之五] 雏菊链效应引起得网络不能进行数据交换9[ 故事之六]网线制作不标准,引起干扰,发生错误11[ 故事之七]插头故障13[ 故事之八]5 类线Cat5 勉强运行千兆以太网15[ 故事之九]电缆超长,LAN 可用,WAN 不可用17[故事之十]线缆连接错误,误用3类插头,致使网络升级到100BaseTX 网络后无法上网18 [ 故事之十一] 网线共用,升级100Mbps 后干扰服务器21[ 故事之十二] 电梯动力线干扰,占用带宽,整个楼层速度降低24[故事之十三] “水漫金山”,始发现用错光纤接头类型,网络不能联通27[ 故事之十四] 千兆网升级工程,主服务器不可用,自制跳线RL 参数不合格29[ 故事之十五] 用错链路器件,超五类线系统工程验收,合格率仅76%32[ 故事之十六] 六类线作跳线,打线错误造成100M 链路高额碰撞,速度缓慢,验收余量达不到合同规定的40 %;34[ 故事之十七] 六类线工艺要求高,一次验收合格率仅80%36第二部:网络脏腑篇39[ 故事之一] 服务器网卡损坏引起广播风暴39[ 故事之二]交换机软故障:电路板接触不良41[ 故事之三]防火墙设置错误,合法用户进入受限44[ 故事之四]路由器工作不稳定,自生垃圾太多,通道受阻47[ 故事之五]PC 机开关电源故障,导致网卡工作不正常,干扰系统运行49[故事之六]私自运行Proxy 发生冲突,服务器响应速度“变慢”,网虫太“勤快” 52[ 故事之七]供电质量差,路由器工作不稳定,造成路由漂移和备份路由器拥塞54[故事之八]中心DNS 服务器主板“失常”,占用带宽资源并攻击其它子网的服务器57[ 故事之九]网卡故障,用户变“狂人”,网络运行速度变慢60[ 故事之十]PC 机网卡故障,攻击服务器,速度下降62[ 故事之十一] 多协议使用,设置不良,服务器超流量工作65[ 故事之十二] 交换机设置不良,加之雏菊链效应和接头问题,100M 升级失败67[ 故事之十三] 交换机端口低效,不能全部识别数据包,访问速度慢70[ 故事之十四] 服务器、交换机、工作站工作状态不匹配,访问速度慢72第三部:网络免疫篇75[ 故事之一]网络黑客程序激活,内部服务器攻击路由器,封闭网络75[ 故事之二]局域网最常见十大错误及解决(转载) 78[ 故事之三] 浅谈局域网故障排除81网络医院的故事时间:2003/04/24 10:03am 来源:sliuy0 整理人:蓝天(QQ :12015152)[引言]网络正以空前的速度走进我们每个人的生活。

网络的规模越来越大,结构越来越复杂,新的设备越来越多。

一个正常工作的网络给人们带来方便和快捷是不言而喻的,但一个带病工作的网络也常常给人带来无穷的烦恼甚至是巨大的损失。

网络世界中最忙乱、心里最感底气不足的人恐怕要数网络管理人员和运行维护人员了。

他们时时刻刻都在为他们的网络担心,病毒、黑客、速度变慢、网络崩溃.......................................[小康档案]:三年前负责管理Coneill 公司,一家快速成长的公司的网络,曾自认为是NT 和Novell 、Unix 等平台以及Oracle 方面的专家,擅长协议分析和网管软件的使用,每天忙于安装设置不断加入网络的设备和系统,应付不断增加的各种意外事件、报警和陷井,处理网络设备经常性的增加、删除、更改和系统设置、连接等方面的故障和问题。

至于如何提高网络的运行效率、如何合理调整网络流量并配置网络设备、如何防止网络问题的发生、如何采用宽带网络设备组网及应用等则基本上无暇顾及。

一年前,小康从网络健康学院毕业后到网络医院就职,负责网络的体检(测试)和故障诊断,专门为哪些网络发生严重问题的“病人”提供帮助。

现在他已经是一位经验丰富的网络健康维护的医生,巡诊故事多多。

第一部:网络经脉篇[故事之一]三类线仿冒5 类线,加上网卡出错,升级后比升级前速度反而慢[症状]今天是我第一次巡诊,病人抱怨他的大多数站点上网连接速度比系统升级前还慢,有的站点时断时续,有的则根本不能上网。

原来用的是10M 以太网,工作非常稳定,性能优良。

升级后全部更换为100M 系统,出现上述症状。

用户总数未有增加,也没有启用大型软件或多媒体应用软件。

重装系统软件、应用软件,重新设置服务器和网站,查杀病毒,Reset 所有联网设备均不奏效。

其中,有两台机器换到另一地点后能基本正常工作。

用笔记本连接到这两个不正常链路的集线器端口上网,也能正常工作。

更换这两根网线后现象依旧。

将机器还原到原位置,更换网卡(原卡商标为3COM 卡)后恢复正常,不知何故。

由于以太网大多数用户不能工作,只好暂时退回到10M 以太网系统。

[诊断过程]从10M 系统的网管上观察,网络的平均流量为3% ,低于40%,由于未运行大型软件和多媒体软件,应该不会感到任何速度上的“折扣”。

将FLUKE 的F683 网络测试仪接入Hub 端口,测试网络流量为35%。

碰撞率为23 %,远远高于5%的健康标准。

报告的错误类型有:延迟碰撞、FCS 帧错误、少量本地错误。

基本可以断定是布线系统的严重问题。

遂对线缆进行测试,结果显示除了测试点的两根电缆线外,其余所有布线链路的衰减和近端串扰均不合格,用3 类标准测试这些电缆则显示全部合格。

查看线缆外包装上印有Lucent Cat5 的字样,可以断定是仿冒产品。

测试两台工作站的链路长度分别为78 米和86 米,测试其网卡端口,显示网卡发射能力(信号幅度)不足,并且仪器上没有内置的3COM 厂商标记显示。

[诊断点评]用3 类线外覆5 类线产品标记在假冒伪劣产品中为数不少。

用户在10M 以太网环境中不会出现应用上的问题,一旦升级到100M 环境在只有少数短链路能勉强使用。

对于两台更换地点后能正常工作的网站,查明链路长度只有3 米,且为标准的5 类线(平时此站点用于临时测试)。

原地点测试长度为45 米和37 米,由于网卡发射能力弱,信号在100M系统衰减大,造成上网困难。

改在3 米链路连接时,衰减的影响小,故可以正常上网。

网卡测试显示为仿冒卡。

[后记]一个月后,“病人”打电话告述我,重新布线后网络工作完全正常,即使跑一些多媒体软件也丝毫没有停顿的感觉。

不好的消息是,原来的系统集成商已不知去向,无法索赔了。

[故事之二]UPS 电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错[症状]今天的病人是一家著名的证券公司。

上午9:45,用户来电请求紧急救援,说大户室中的一群声称遭受巨额无端损失的愤怒的股民们正聚集在营业部计算中心的机房门前,质问为什么实时交易的动态信息显示屏幕出现大片空白,数据刷新和交易的速度都极慢,且经常中断,根本无法进行交易。

扬言如果不立即恢复交易,将砸掉证券交易所的计算机。

交易大厅的散户门也开始向机房云集,如果不及时处理,情绪激动的股民们很可能真的会将营业部计算中心的网络设备砸个希巴烂。

放下电话直立即直奔该营业部,途中继续用移动电话了解得知,该网络为10M 以太网,用户数为230 个。

从卫星接收广播的行情数据,并回传交易信息。

由于从卫星接收机监测口观察接收数据完全正常,故网管人员初步判定是网络系统的问题。

两个月前就开始有传输数据错误的现象出现,有时数据更新出现空白,数据更新速度偶尔变慢,有时出现断续。

虽用网管和协议分析仪检查过,但因这种“症状”并不连续出现,且对网络的速度和股民的交易基本没有影响,故一直心存侥幸,没有彻底查找真正的故障根源。

前天参加“第二轮证券系统Y2K 统一认证测试”,顺利通过。

利用剩余时间对硬件设备进行了检测和维护,之后进行联网检查,网络表现正常。

不料今天开市就出现严重问题。

[诊断过程]用F683 网络测试仪监测网络30 秒,观察网络流量为81%(但网管报告为0.2%),错误帧97.6%。

错误类型为Ghosts(占93%)、FCS错误(又称CRC错误)和Jabber,即幻象干扰、帧校验错误和超长帧,这表明网络中有大量的非法数据包存在。

此类症状一般以电磁干扰和接地回路方面的问题居多。

为了确定干扰源的准确位置, 将大部分与工作站相连的集线器组电源关断,服务器继续工作,观察错误率降为87%,仍然很高。

重新打开集线器组电源,用F43电源谐波测试仪观察,发现谐波含量严重超标(最高970mV)。

该网络用一台大型UPS电源给所有网络设备供电,测试UPS输入电源谐波,约为输出电源谐波含量的30%,明显低于输出端的指标,断定为内谐波含量超标。

启动小型备用UPS 后,网络恢复正常工作(为减少负荷,网络设备分批轮换接入),但网络测试仪显示仍有错误存在,错误率(幻象干扰)下降为1.3%。

再次关断集线器组的电源,类型为Ghosts的幻象干扰错误率下降为0.8%, 证实仍存在由接地回路串入的幻象干扰,且应该是从主通道进入。

摇动卫星接收机的数据输出电缆,幻象干扰时有时无,拔下电缆则干扰消失。

网管人员回忆前日维护机器时曾动过该电缆。

由此造成连接不良。

为使股民能继续交易,稳定情绪,在更换电缆后又将原UPS 启动继续工作提供服务。

收市后再更换大型UPS,故障彻底排除。

[诊断点评]故障原因有二,一是UPS 对电源的净化能力下降,网络外谐波容易从电源系统串入网络系统,为重大故障的发生提供了基础,但只是累积的内谐波超标还不足以引发致命问题。

二是接地回路问题,给大量的内谐波串入网络提供了通道。

内谐波是指从电源净化设备的输出端比如UPS 的输出端测得的谐波功率,由各种用电设备产生(网络设备绝大多数都采用开关电源,本身就是一个较大的谐波源)。

本案中,大量的内谐波功率叠加后从卫星接收机数据输出电缆串入交易网络,一方面以幻象干扰的形式侵蚀网络带宽(此时网络测试仪监测到的错误类型即为Ghosts),当以太网的网络总流量高于80%时,会导致绝大多数的网络瘫痪;另一方面,串入的内谐波将干扰正常数据传输(与正常的卫星广播数据叠加,表现为FCS 帧错误和少量长帧),使卫星接收机接收到的数据出错,显示屏出现大片空白或不能实时更新数据。

本故障为累积故障,两个月前因UPS 性能下降就开始出现少量干扰超标,不过这没有引起网管人员的足够重视。

前天维护设备后又增加了电缆接地回路的干扰问题。

但因当时未将卫星接收机连入网络, 网管人员仅检查了网络部分的工作状况, 所以此时的网络表现肯定是正常的。

相关文档
最新文档