常见框式交换机硬件故障排查

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

版权所有:杭州华三通信技术有限公司
常见框式交换机硬件故障排查
一、开始
定位故障思路是:对于常见的设备硬件故障问题的判断,可以分为几个部分去检查,包括设备环境的硬件状态检查、端口故障状态的硬件检查、POE 硬件故障、local logbuffer 的异常记录来判断设备是否存在硬件故障。

检查设备环境状况。

命令:
display environment
Temperature指的是当前温度,LowerLimit指的是温度传感器的低温告警门限,Warni ngLimit指的是温度传感器的一般级(Warning)高温告警门限。

各传感器温度应处于低温告警门限与一般级高温告警门限之间,如出现异常温度告警,比如-
1度,255度等,一般是软件版本问题或温度传感器硬件故障,需要更换单板。

1.2、检
display fan
查设备风扇状况。

命令:
State表示的是风扇的状态,风扇应该显示normal。

如出现Fault或Absent,建议重新插拔后尝试,如问题仍然存在,建议更换风扇。

1.3、检查设备电源状况。

命令: display power
版权所有:杭州华三通信技术有限公司
State表示的是电源的状态,电源状态应该显示normal。

如出现Absent,查看下电源开关是否打开或者电源输入是否正常接入,如出现Fault建议重新插拔后尝试,如问题仍然存在,建议更换电源。

1.4、检查单板状态指示灯状况。

观察单板的状态指示灯运行状况
检查主控板上,单板状态指示灯,如果RUN灯和ALM等常亮,可以主备倒换和替换单板槽位看下,如果现象依旧即为单板故障。

1.5、单板状态异常。

命令: Display device
版权所有:杭州华三通信技术有限公司
所有业务板应该是Normal,主控板为standby、master状态,如果display
device出现Fault或Absent状态,
1)、如果是新加入的主控板,同一设备两块主控板要求为同样型号,如不一致,需要更换解决、同一设备两块主控板要求使用同样版本,否则复发启动、重新上传相同的app文件启动、内存故障:使用备用主控板自身的Console口连接Console线,待主控板启动时使用CRTL T测试,如出现内存FAIl则内存故障,需要更换备用主控板。

2)、如果出现业务板Fault或Absent,故障点有主控板、机框、业务板,一般通过替换测试可以完全确定。

如果双主控设备,可以通过主备倒换确认是否业务板在同一槽位的工作状况确认是否主控板问题,主备倒换后如业务板卡注册正常,则主控板故障肯定性最大。

将该故障板卡替换到别的槽位,依旧无法启动,则业务板故障可能性最大。

如果替换槽位能够正常正常启动,则可能是机框或者是主控板故障,可以替换主控板测试。

2、检查设备端口故障状态
判断端口是否是光口,如果不是光口按照2.1的流程进行分析判断,如果为光口,按照2.5的流程进行分析和判断。

2.1、端口是否协商出了半双工命令: display interface brief 例如:以gigabitethernet 1/0/2端口为例
版权所有:杭州华三通信技术有限公司
如果某个端口状态为half,如interface gigabitethernet 1/0/2
duplex为half,则需要确认是否两端配置看下是否是因为配置不一致导致的双工状态为half。

2.2、是否在没有必要启动流控端口配置流控命令: display this
例如:以gigabitethernet 1/0/2端口为例
如果某个端口不需要开启端口流控,查看该端口下是否配置了flow-
control,在不需要开启流控的端口可以通过命令undo flow-
control来关闭流控配置来观察一下。

2.3、端口出/入方向是否有大量的错误报文
命令: display interface 例如:以gigabitethernet 1/0/1端口为例
版权所有:杭州华三通信技术有限公司
检查设备的出入方向,是否有大量的错误报文,如果确实存在大量的错误包,检查一下本端和对端的配置是相同,有没有存在一端配置为强制,一端配置为自动协商。

检查中间线路,如果有条件最好能够替换网线测试观察,看故障现象是否消失。

错误报文是否还有增长。

2.4、设备是否有比较频繁的端口UP/DOWN 命令: display logbuffer 例如:以gigabitethernet 1/0/1端口为例
版权所有:杭州华三通信技术有限公司
查看设备的logbuffer,检查设备是否存在频繁的端口的up/down信息。

检查一下本端和对端的配置是相同,有没有存在一端配置为强制,一端配置为自动协商。

修改下配置能否恢复,同时检查中间线路,如果有条件最好能够替换网线测试观察,看故障现象是否消失。

2.5、光口两端是否配置一致命令: display current-configuration interface
版权所有:杭州华三通信技术有限公司
检查当前端口的配置和对端的端口配置,是否存在配置不一致的情况,H3C设备与其它厂商设备互连,建议光口速率和双工设置要完全一致。

2.6、端口出/入方向是否有大量的错误报文命令: display interface 例如:以gigabitethernet 1/0/1端口为例
版权所有:杭州华三通信技术有限公司
检查设备的出入方向,是否有大量的错误报文,并且持续增长,如果确实存在大量的错误包,检查一下本端和对端的配置是相同,有没有存在一端配置为强制,一端配置为自动协商。

检查中间线路,检查下光功率,看下是否处于临界值,如果有条件可以通过更换光模块、更换尾纤或清洗光模块连接器的方式解决。

3、POE端口故障检测命令: Poe enable 例如:以gigabitethernet 1/0/1端口为例
如设备本身是支持PoE的设备但却提示“PoE is not supported on the
port”则说明PoE硬件存在问题,可尝试采用冷重启的方式重新复位看能否恢复,如不能恢复则可判断为PoE硬件故障。

4、查看local logbuffer异常记录命令: En_diag local logbuffer display
版权所有:杭州华三通信技术有限公司
如果在local
log看下下列一致的报错,即可确定为硬件故障,其他故障可以联系800热线处理。

unit %d MMU channel 0 cell CRC error unit %d MMU channel 0 packet CRC error unit %d MMU channel 0 next pointer CRC error unit %d MMU channel 0 pointer block CRC error unit %d MMU channel 1 cell CRC error unit %d MMU channel 1 packet CRC error unit %d MMU channel 1 next pointer CRC error unit %d MMU channel 1 pointer block CRC error unit %d MMU ingress buffer overflow unit %d MMU MSYS ingress buffer cell inconsistency unit %d MMU IPMC pointer table parity error unit %d MMU IPMC parity error if no table unit %d MMU ingress statistics parity error unit %d MMU fatal MCU FIFO error\n", unit unit %d MMU fatal ASM FIFO error\n", unit unit %d MMU possibly fatal ASM IGMU error soc_fb_mmu_parity_error:unit = %d," "INTSTATUS = 0x x Fail Count = %d\n", unit = %d, CFAPFAILERROR unit = %d, CFAPPARITYERRORPTR 0x x unit = %d, MMU Soft Reset Error unit = %d, MMU Cell not in progress unit = %d, CBPCELLCRCERRPTR 0x x unit = %d, CBPPKTHDRPARITYERRPTR 0x x unit = %d, CBPCELLHDRPARITYERRPTR
0x x unit = %d, XQPARITYERRORPBM 0x x unit = %d, CCPPARITYERRORPTR 0x x unit=%d, IPMC Over Pre-set Replication Limit _soc_hx_ipipe_parity_error:unit = %d," "L2_ENTRY_PARITY_STATUS = 0x x, " "Bucket = %d Entry Bitmap 0x x\n" Tucana MMU DRAM %s CRC error at 0x x Tucana ARL parity
analysis请拨打热线400-810-0504
版权所有:杭州华三通信技术有限公司。

相关文档
最新文档