IBM硬件故障检测板详解
IBM T4系列开机不显示的维修方法简介诊断卡
IBM T4系列开机不显示的维修方法简介目录在修到这种板子的时候,应该先把所以的电压、频率、复位都量测一遍。
在确认这些信号均无误以后,打北桥到CPU的A/D信号线,BIOS的信号,CLOCK的频率,南桥到北桥的DMI信号线,用示波器量LPC_FRAME#的波形等等。
注:在量打北桥到CPU的A/D信号线的对地阻抗的时候,万用表笔应该和正常量法相反,即黑接地,红笔量。
量测到的阻抗如高的不多,一般是CPU端OPEN;如高的很多,一般是北桥端OPEN。
1.1 VCORE=0V量VCORE是否短路,在这里应该注意VCORE的阻值在2欧姆以上就算OK。
量VCORE_ON是否为3.3V。
量VCORE芯片的工作电压,参考电压,反馈电压电流是否正常。
量VCORE芯片的对地阻抗是否正常。
量VCORE芯片与输出端的上下桥MOS管组成的反馈电路有无问题。
量VID0~VID6的对地阻抗和电压值。
可能不良零件:VCORE芯片,CPU本体,VCORE芯片周围的一些小电容电阻有损件,击穿,错件等制程问题,U4/U5以及输出端上下桥MOS管等等。
1.2.1 CPURST=0V量PCIRST是否等于3.3V。
量CPURST的对地阻抗。
量北桥和CPU的工作电压,参考电压,工作频率。
可能不良零件:北桥,南桥,CPU,CLOCK,电压芯片等等。
1.2.2 CPURST=0.4V量CLOCK发到南北桥的频率是否都为100MHz。
量南北桥之间的DMI信号的对地阻抗,电压。
量1.8V,1.05V,1.25V,1.5V电压(包括B电压和AMT电压)进南北桥的电感是否OPEN。
量PLTRST是否正常。
可能不良零件:北桥,南桥,CLOCK,电压芯片,CARDBUS以及PCB板本体OPEN。
1.2.3 CPURST=0.1V量北桥和CPU的工作频率和工作电压。
量CPURST的对地阻抗。
可能不良零件:北桥和CPU。
1.2.4 CPURST=1.05V如果量到CPURST=1.05V,但是DEBUG还是跑00的话,应该说就比较麻烦了,打北桥到CPU的A/D信号线,BIOS的信号均OK,而且换BIOS TCPA后现象依旧的话,那就开始换桥,一般换桥的顺序是:北桥,南桥,CPU。
IBM小型机硬件及系统检测情况汇总
正常
HACMP 服务
#lssrc –g cluster
正常
HACMP I/O Pacing
#lsattr –El sys0 |grep out
正常
/etc/host文件
#more /etc/hosts
正常
HACMP 日志
#tail –f /tmp/hacmp.out
# sysdumpdev –l
正常
系统备份检查
做vg配置信息的备份
已备份
询问客户有否在系统变更后或每半年做系统备份
询问客户数据库及应用、应用数据是否定期有效
进行备份
系统性能检查
CPU
#topas
正常
Disk
#vmstat
正常
应用程序磁盘
#iostat
正常
交换区
#lsps -a
正常
#bindprocessor -q
The available processors are: 0 1 2 3 4 5 6 7
系统板、CPU、内存、I/O板
#diag
No trouble was found 正常
网卡、SCSI卡、SSA卡
#diag
No trouble was found 正常
系统其他扩展卡
#diag
No trouble was found 正常
硬盘、磁盘阵列
#diag
No trouble was found 正常
磁带机、磁带库
#diag
No trouble was found 正常
网卡的状态、IP地址
#ifconfig –a
正常
网卡通信(ping)
IBM-小型机巡检内容及操作指导
IBM 小型机巡检内容及操作指导1.IBM 小型机小型机机房要求:1.机房的卫生状况,要求清洁,键盘、显示器、机柜上没有灰尘。
2.温度(摄氏℃)10 ℃-40℃湿度(%)8% -80%2.设备故障灯分类:•主机故障灯面板上不能有数字显示,如果有的话,说明系统有故障。
磁盘阵列故障灯告警灯为黄色表示有故障磁带机故障灯告警灯为黄色说明有故障或磁带机太脏,须清洗。
3.系统错误报告(Error Log)的检查:硬件故障检测命令:# errpt -d H -T PERM若有故障执行命令# errpt -a -d H -T PERM>/tmp/harderror.log保存,分析结果报告给客户软件故障检测命令:# errpt -d S -T PERM若有故障执行命令# errpt -a -d S -T PERM>/tmp/softerror.log保存,分析结果报告给客户4.有否发给root用户的错误报告(mail):#mail1.观察所有未读消息,注意有关diagela的消息。
2.常用命令:h [<num>] Display headings of group containing message<num>t [<msg_list>] Display messages in <msg_list> or currentmessage.n Display next message.q Quit3.对发现的问题详细分析,结果报告给客户5.文件系统的检查:命令:# df –k%Used为文件系统的使用率。
所有文件系统的使用率不能大于80%6.磁带机清洁的检查:命令:#/usr/lpp/diagnostics/bin/utape -cd rmt0 -n显示结果为磁带机使用的小时数,若大于72小时,则不论磁带机黄灯是否亮都应用清洁带清洗。
#/usr/lpp/diagnostics/bin/utape -d rmt0 -n 会提示是否需要clean6.信系统的检测:1.网卡的状态命令:#ifconfig –a输出判断:en0:flags=e080863<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GR OUPRT,64BIT>inet 192.9.200.2 netmask 0xffffff00 broadcast 192.9.200.255en1:flags=e080863<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GR OUPRT,64BIT>inet 192.9.201.1 netmask 0xffffff00 broadcast 192.9.200.255主备网卡的flag为UP属正常。
IBM A30笔记本维修及故障表
IBM A30笔记本维修及故障表故障代码机器型号及故障描述可能故障点A01 IBM A30 无声音输出,无声声卡,功放芯片,线路,耳机接口A02 IBM A30 声音左右不均衡声卡,功放芯片,线路,耳机接口A03 IBM A30 喇叭左右声道相反声卡,功放芯片,线路,耳机接口A04 IBM A30 耳机无声音输出声卡,功放芯片,线路,耳机接口A05 IBM A30 麦克风测试不通过声卡,功放芯片,线路,耳机接口A06 IBM A30 耳机杂音声卡,功放芯片,线路,耳机接口A07 IBM A30 麦克风测试有杂音声卡,功放芯片,线路,耳机接口A08 IBM A30 音量无法调整声卡,功放芯片,线路,耳机接口A09 IBM A30 喇叭杂音声卡,功放芯片,线路,耳机接口A10 IBM A30 外接麦克风测试不良声卡,功放芯片,线路,耳机接口A11 IBM A30 调整vr1时喇叭杂音声卡,功放芯片,线路,耳机接口A12 IBM A30 插上耳机喇叭有杂音输出声卡,功放芯片,线路,耳机接口A13 IBM A30 line in 测试不良声卡,功放芯片,线路,耳机接口A14 IBM A30 Optical audio 测试不良声卡,功放芯片,线路,耳机接口B01 IBM A30 电池不能冲放电电芯老化,电芯失效,线路版损坏,主板故障B02 IBM A30 电池电量不足电芯老化,电芯失效,线路版损坏B03 IBM A30 变压器无输出电源线,电源适配器损坏B04 IBM A30 辅助电池无输出电芯老化,电芯失效,线路版损坏,主板故障B05 IBM A30 无法暖开机主板接口,主板故障,电源适配器故障B06 IBM A30 无电源主板接口,主板故障,电源适配器故障B07 IBM A30 自动开机主板故障,电源适配器故障B08 IBM A30 自动重复开机主板故障,电源适配器故障B09 IBM A30 开机后断电主板接口,主板故障,电源适配器故障B10 IBM A30 不开机主板接口,主板故障,电源适配器故障B11 IBM A30 无法关机主板故障B12 IBM A30 无法由电池开机电芯老化,电芯失效,线路版损坏,主板故障B13 IBM A30 机器死机主板故障,内存故障C01 IBM A30 无法由CD-ROM开机光盘损坏,光驱损坏C02 IBM A30 CD-ROM有杂音光盘损坏,光驱损坏C03 IBM A30 DVD测试不良光盘损坏,光驱损坏C04 IBM A30 CD-ROM/DVD 托盘自动弹出光驱损坏C05 IBM A30 CD-ROM/DVD 托盘无法弹出光驱损坏C06 IBM A30 CD-ROM放音乐有杂音光盘损坏,光驱损坏D01 IBM A30 键盘失效,报警主板故障,键盘故障D02 IBM A30 触摸板失效触摸板损坏,主板故障D03 IBM A30 触摸板漂移触摸板损坏D04 IBM A30 指点杆失效指点杆失效,主板故障D05 IBM A30 指点杆漂移指点杆失效D06 IBM A30 外接键盘无效键盘接口损坏,主板故障D07 IBM A30 外接鼠标无效鼠标口损坏,主板故障D08 IBM A30 键盘缺键,报警键盘损坏F01 IBM A30 开机后软驱报错软驱损坏,主板故障F02 IBM A30 无法从软驱启动软驱损坏,主板故障F03 IBM A30 软驱读盘杂音软驱损坏F04 IBM A30 软驱挡板脱落软驱损坏G01 IBM A30 屏幕有光无显示,白屏主板故障,lcd故障,屏线故障G02 IBM A30 屏幕显示不稳定主板故障,lcd故障,屏线故障G03 IBM A30 屏幕无图像主板故障,lcd故障,屏线故障G04 IBM A30 屏幕图像抖动主板故障,lcd故障,屏线故障G05 IBM A30 幕图像扭曲主板故障,lcd故障,屏线故障G06 IBM A30 屏幕显示乱码主板故障,lcd故障,屏线故障G07 IBM A30 屏幕亮点过多lcd故障G08 IBM A30 屏幕有线条lcd故障G09 IBM A30 屏幕亮度不均匀lcd故障G10 IBM A30 屏幕有水平亮线lcd故障G11 IBM A30 屏幕有垂直亮线lcd故障G12 IBM A30 屏幕破裂lcd故障H01 IBM A30 开机后硬盘无法识别硬盘故障,主板故障H02 IBM A30 硬盘有杂音硬盘故障F01 IBM A30 主机温度过高风扇故障F02 IBM A30 风扇不转风扇故障,主板故障F03 IBM A30 风扇有杂音风扇故障M01 IBM A30 网卡口失效网卡接口损坏,主板故障M02 IBM A30 FAX/MODEM口失效接口损坏,主板故障P01 IBM A30 PC卡插槽无效PC卡插槽损坏,主板故障P02 IBM A30 PC卡无法推出PC卡插槽损坏P03 IBM A30 开机有密码,解密主板Q01 IBM A30 COM口无效接口损坏,主板故障Q02 IBM A30 打印口无效接口损坏,主板故障Q03 IBM A30 外接显示口无效接口损坏,主板故障Q04 IBM A30 USB接口无效接口损坏,主板故障Q05 IBM A30 红外口无效主板故障Q06 IBM A30 1394口无效主板故障Q07 IBM A30 记忆卡插槽无效主板故障R01 IBM A30 开机报警主板故障R02 IBM A30 开机cmos时间丢失cmos电池失效R03 IBM A30 cmos时间不准cmos电池失效,主板故障R04 IBM A30 操作系统故障软件故障R05 IBM A30 系统受病毒感染软件故障R06 IBM A30 驱动程序丢失软件故障R07 IBM A30 机器太脏清洁服务U01 IBM A30 屏幕外壳破裂(1号壳,A壳)修补U02 IBM A30 屏幕内壳破裂(2号壳,B壳)修补U03 IBM A30 机器掌托破裂(3号壳,C壳)修补U04 IBM A30 机器底壳破裂(4号壳,D壳)修补U05 IBM A30 屏幕左屏轴损坏修补U06 IBM A30 屏幕右屏轴损坏修补。
IBMX3650M4主板故障
IBMX3650M4主板故障故障描述:今天突然接到报警,⼀台服务器⽆法连通,⽆法登录、⽆法 ping 通。
打电话到 IDC ,授权⼯程师查看服务器状态,返回结果如下:1、服务器关机状态2、⽆法开机 ( 电源灯亮 ),按开机键没反应。
3、尝试拔掉电源,等待⼏分钟后再次开机,结果还是不⾏。
这是⼀台宿主机,上⾯开了 5 个虚拟机,⼀下⼦全狗带了... 关键数据还在⾥⾯。
好在,受影响的业务不是主要业务,但也处于⽆法提供服务的状态。
解决⽅法:第⼆天去机房把服务器拉回公司 ( 机房在外地 ),通电发现还真是⽆法开机,还发现⼀点就是,服务器诊断⾯板上 BOARD 亮黄灯!基本断定是主板故障了吧?下⾯是搞数据:1、好在公司机房机架上还有⼀台同型号的服务器 IBM X3650 M42、这台服务器跟坏掉的服务器机器型号、RAID卡信息、硬盘数量等都⼀致3、唯⼀的区别就是,公司的这台服务器没有做 RAID,坏掉的这台是 RAID104、机柜服务器关机 ( 最好先备份⼀下数据 ),拔出硬盘 ( 8块硬盘,顺序不能乱 )5、将坏掉的服务器硬盘按顺序拔出,插⼊机柜中这台好的服务器中 ( 顺序不能乱 )6、开机,根据提⽰导⼊ RAID 信息( 输⼊ C、是否导⼊ Y、选择配置⽂件,其实就⼀个,选 all 即可,Start、同意导⼊ import,退出 exit,reboot 重启服务器 )7、很顺利,由于线上服务器密码极度复杂,这⾥重启的时候顺便重置⼀下 root ⽤户密码8、进⼊系统配置IP,然后就可以不⽤在机房待着了,备份数据,传到线上,恢复业务9、关机、拔出硬盘,按顺序插⼊原来的坏机器,给机柜上的机器重新按顺序插⼊原硬盘10、执⾏第六步,重启进⼊系统异地备份很重要。
IBM光通路诊断面板中文图文对照说明
IBM光通路诊断面板中文图文对照说明1、OVER SPEC:电源消耗的功率超过它们的最大额定功率,解决办法:1、从服务器卸下可选设备;2、更换发生故障的电源。
2、LOG:表示需要查看时间日志或remote supervisor。
3、LINK:网卡发生故障。
解决办法:更换网卡。
4、PS:电源发生故障。
解决办法:更换发生故障的电源。
5、PCI:PCI总线或系统上发生错误,发生故障的PCI插槽旁的附加指示灯将点亮。
6、SP:服务处理器遇到错误。
7、FAN:风扇发生故障,或是运行过慢,或是卸下风扇,可能会导致TEMP指示灯点亮。
8、TEMP:系统温度超标。
9、MEM:内存条发生故障。
解决办法:查看内存板上指示灯,拔出亮灯内存条,更换内存条位置,重新测试,如果MEM还亮着,就只能更换内存条了。
10、NMI:出现一个不可屏蔽终端。
(具体什么意思我也不知道,没遇到过这问题)11、CNFG:发生硬件配置错误。
解决办法:1、查看是否安装了不兼容的硬件设备;2、还原主板配置。
3、查看系统日志。
12、CPU:CPU处理器出现故障。
13、VRM:微处理器稳压器模块(VRM)上发生错误。
14、DASD:发生硬盘驱动器错误。
解决办法:更换硬盘,更换硬盘前先查看服务器是否做了RAID等。
15、RAID:发生RAID控制器错误。
解决办法:更换阵列卡,看是否是阵列卡出现问题。
16、BRD:主板发生错误。
解决办法:首先检测主板上其它硬件是否有问题,有可能是其它硬件错误,导致BED报错。
反之,其它指示灯报错,也有可能是主板出现问题导致的,所以检查清楚在更换。
IBM 3650光通路指示灯说明
7
CNFG
8
MEM
9 NMI 10 S ER3 RAID 14 FAN 15 TEMP 16 BRD
发生硬盘驱动器错误。 发生 RAID 控制器错误。 风扇发生故障,或者是运行过慢,或者是 已卸下风扇。TEMP 指示灯可能也会点 亮。 系统温度已超出阈值级别。发生故障的风 扇会导致 TEMP 指示灯点亮。 系统板上发生错误。
光通路诊断指示灯 下表描述光通路诊断面板上的指示灯,以及纠正检测到的问题的建议操作 注:更换 FRU 之前,请检查系统事件/错误日志和 BMC 系统事件日志 指示灯 1 2 3 4 5 6 无,但系统 错误指示灯 点亮。 OVER SPEC PS 1 PS 2 CPU VRM 问题 已发生错误但无法诊断,或 Remote Supervisor Adapter II SlimLine 上的高级 系统管理(ASM)处理器发生故障。光 通路诊断指示灯不表示该错误。 电源功率超过最大额定值。 电源托架 1 中的电源发生故障。 电源托架 2 中的电源发生故障。 微处理器发生故障。 微处理器稳压器模块(VRM)上发生错 误。 发生硬件配置错误。 当该指示灯点亮时,表明发生了内存错 误。 发生机器检查错误。 。。
17 PCI
PCI 总线或系统板上发生错误。发生故障 的 PCI 插槽旁的附加指示灯将点亮。
到的问题的建议操作。 系统事件日志,获取其他信息 操作 检查系统错误日志,获取有关错误的信息。 更换发生故障的电源,或从服务器卸下可选设备。 确保该电源已正确安装就位。如果问题仍然存在,请更换发生故障的电 源。 确保该电源已正确安装就位。如果问题仍然存在,请更换发生故障的电 源。 确保由系统板上点亮的指示灯表明的发生故障的微处理器已正确安装。 更换 VRM。如果问题仍然存在,请更换系统板(主板) 检查刚安装的微处理器,确保它们彼此兼容,并与 VRM 兼容 。更换不 兼容的微处理器。 检查系统错误日志,获取有关错误的信息。更换日志所指明的任何组件 。 更换由系统板上点亮的指示灯表明的发生故障的 DIMM。 检查系统错误日志,获取有关错误的信息。 从服务器卸下交流电源;然后将服务器重新连接到交流电源并重新启动 服务器。更新 BMC 上的 firmware。如果已安装 Remote Supervisor Adapter II SlimLine,则更新 firmware;如果问题仍然存在,请更换适配器。如果问题仍然存在,请 更换系统板 检查硬盘驱动器上的指示灯,并更换所指示的(桔黄色的指示灯)驱动 器。 如果问题仍然存在,请更换硬盘驱动器底板。 检查系统错误日志,获取有关错误的信息。或是拔打8008101818 更换由风扇机身上点亮的指示灯表明的发生故障的风扇。 确定是否风扇发生故障。如果是,更换发生故障的风扇。 确保室温不会太高。确保通风孔未堵塞。 检查系统板上的指示灯,确定引起错误的组件。 检查系统错误日志,获取有关错误的信息。
IBM xSeries 336 1879 型和 8837 型 硬件维护手册和故障检修指南
xSeries 3361879型和8837型硬件维护手册和故障检修指南E RserverxSeries 3361879型和8837型硬件维护手册和故障检修指南E Rserver注:v在使用本资料及其支持的产品之前,请阅读第127页的附录B,『安全信息』和第161页的附录C,『声明』。
v可以从/pc/support/获取本文档的最新版本。
第一版(2004年8月)©Copyright International Business Machines Corporation2002.All rights reserved.关于本手册本文档包含IBM®Eserver™xSeries®3361879型和8837型服务器的基本配置信息、诊断信息、错误代码、错误消息、维护信息以及症状到FRU索引。
要点:本文档中的现场可更换部件(FRU)的过程针对熟悉IBM产品的受过培训的服务人员。
客户替换部件(CRU)可由客户来更换。
请参阅第119页的第7章,『部件清单,1879型和8837型』以确定正在替换的组件是FRU还是CRU。
在维护IBM产品之前,请务必阅读第127页的附录B,『安全信息』。
重要的安全信息Be sure to read all caution and danger statements in this book before performing anyof the instructions.Leia todas as instruções de cuidado e perigo antes de executar qualquer operação.Prenez connaissance de toutes les consignes de type Attention etDanger avant de procéder aux opérations décrites par les instructions.Lesen Sie alle Sicherheitshinweise,bevor Sie eine Anweisung ausführen.Accertarsi di leggere tutti gli avvisi di attenzione e di pericolo prima di effettuare qualsiasioperazione.Lea atentamente todas las declaraciones de precaución y peligro ante de llevar a cabocualquier operación.警告:操作本产品上的电源线或与随本产品一起销售的附件相关联的电源线将使您易受铅的伤害,(一种加利福尼亚州已知的导致癌症、生殖缺陷或其它再生性伤害的化学物质)。
IBM系列显示器的检修实例
IBM系列显示器的检修实例对于电子产品故障维修来说,一般分为替换板维修、板级维修以及芯片级维修几种,本文以IBM系列显示器为例,探讨显示器板级维修技巧,以下是故障检修实例四则:硬盘故障一、IBM2248-G03内存故障故障现象:打开显示器电源开关烧断保险。
硬盘维修故障分析:根据故障现象初步判定为显示器电源部分有短路故障,所以着重从显示器电源部分检查。
①安装上一个同型号保险管;②先不要接通电源,打开电源开关用万用表测一下输入220V电压的两端,观测一下阻值是否正常,如果阻值很小,则附近有短路故障。
拔掉消磁线圈,测量一下消滋电阻看是否短路,如果短路更换一个同型号消磁电阻即可。
③检测四个整流二极管,看其中是否有短路故障;如果短路,更换同型号整流二极管即可恢复。
故障解决:针对上述分析首先在本机安上一个同规格保险丝,测量输入220V 电压的两端阻值,结果小于正常值许多,拔掉消磁线圈,测量消磁电阻发现短路,由于手头无同型号消磁电阻,更换为一个结构及阻值类似的其他型号消磁电阻,然后再测试一下四个电源整流二极管及附近电路有无短路故障,测试结果正常;*好消磁线圈,接通电源,故障消除。
一般来说,显示器烧保险的现象很少单独是保险丝本身问题,多为电源部分有短路故障。
因此,遇到此类故障换好保险后,不要急于接通电源,应做进一步测试,以免扩大故障范围。
另外,对于消磁电阻很难买到的同型号,则可以用一般结构类似的消磁电阻替代,它们的效果基本一样。
二、IBM2248-005现象:屏幕满幅红*光栅,且有回扫线。
分析与检修:出现此类故障一般都可以定位问题出在尾板上。
此故障的特点是调整亮度电位器无作用,调R.G.B三*调整电位器而无用,最快捷的方法是用万用表测量R.G.B三只视放管的集电极(C)对地电压,测量结果是R.G.B两管集电极电压为75V左右,而R管集电极电压只有30V,严重偏离正常值75V。
由于该管极电极电压降低,显象管R*的*极电位下降,束电流加大,引起了屏幕满幅红*光栅的故障现象。
IBM服务器指示灯报警说明
IBM 服务器指示灯报警说明
一、光通路诊断面板
提醒按钮:该按钮将前面板上的系统错误指示灯置为提醒方式。在提醒方式下, 系统错误指示灯每 2 秒闪烁一次,直至问题得到纠正、系统重新启动或发生新 的问题。 通过将系统错误指示灯置为提醒方式,可确认您已知道发生的上一个故 障,但暂时不立即采取措施来纠正问题。提醒功能由 IMM 控制。 NMI 按钮:按下该按钮以强制微处理器发生不可屏蔽中断。 它允许您使服务器出 现蓝屏并进行内存转储(仅当由 IBM 服务支持人员指导时,才可使用该按钮)。
信息指示灯:如果该指示灯点亮,表示服务器中有某个方面未达到最佳状态,同 时光通路诊断会示灯和光通路诊断面板上的指示灯才会熄灭。 系统错误指示灯:如果该指示灯点亮,表示发生了系统错误。光通路诊断面板上 的一个指示灯也会点亮,以帮助找出此错误。
二、操作员信息面板
电源控制按钮外盖:将此外盖滑动到电源控制按钮上方可防止服务器被意外关 闭。 电源控制按钮:按下该按钮可手动开启和关闭服务器。。 供电指示灯: 如果该指示灯点亮并且不闪烁, 表示服务器已开启; 如果该指示灯 闪烁,表示服务器已关闭并且仍然连接到交流电源;如果该指示灯熄灭,表示没 有交流电源或者电源或指示灯本身出现故障。。注:如果该指示灯熄灭,并不表 示服务器中没有电源。该指示灯可能已烧毁。要切断服务器的所有电源,必须从 电源插座中拔出电源线。 以太网图标指示灯:此指示灯可点亮以太网图标。。 以太网活动指示灯:如果这些指示灯闪烁,表示在它们指示的端口处存在服务器 和网络之间的活动。 定位器指示灯:使用该指示灯可以用肉眼在众多服务器中找到目标服务器。可以 使用 IBM Director 远程点亮该指示灯,也可以按下定位器按钮手动点亮该指示 灯。在启动期间该指示灯也会点亮。在多节点配置中,如果该指示灯闪烁,表示 与它对应的服务器是主节点。 如果该指示灯持续点亮,表示与它对应的服务器是 辅节点。 定位器按钮:按此按钮可以手动打开或关闭定位器指示灯。 在多节点配置中, 按 该按钮可以打开或关闭配置中所有节点的定位器指示灯。
IBM_服务器故障诊断及排除
MBE DIMM Bank MEM CONTROLLER BP ERROR CPU MCKERR
原因 指定冷却风扇出现故障、未正确安装或不存在。 插槽 1 中未安装微处理器。 微处理器出现故障或未正确安装。 指定内存体中安装的内存模块的类型和大小不一致;内存模块出现故障。 内存模块出现故障或未正确安装;系统板出现故障。 背板出现故障或未正确安装。 计算机检测出错;微处理器出现故障或未正确安装;系统板出现故障。
IBM 服务器故障诊断流程
IBM服务器光通路诊断面板
指示灯
问题
操作
OVER SPEC PCI
PS
RAID
由于某个电源通道上出现电 源超负荷情况,所以关闭了 服务器。电源功率超过最大 额定值。
1 .检查电源指示灯以了解是否有错误指示(交流电源指示灯和直流电源指示 灯未同时点亮,或信息指示灯点亮)。更换发生故障的电源。
钮已禁用。服务器接通交流电源后大约三分钟,电源控制按钮便会激活。
– 缓慢闪烁(每秒一次):服务器已关闭,并且已准备就绪,可以开启。您可以按
电源控制按钮以开启服务器。
– 点亮:服务器开启。
– 逐渐变暗直至熄灭:服务器处于省电状态。要唤醒服务器,请按电源控制按钮或
使用IMM Web 界面。
注:如果该指示灯熄灭,并不表示服务器中不存在电流。该指示灯可能已烧毁。要
● 信息指示灯:当该指示灯点亮时,表示发生了一般性事件。光通路诊断面板上的某 个指示灯也会点亮,以帮助找出错误。
●系统错误指示灯:当该指示灯点亮时,表示发生了系统错误。光通路诊断面板上的 某个指示灯也会点亮,以帮助找出错误。
●释放滑锁:将该滑锁滑向左侧可操作光通路诊断面板,该面板位于操作员信息面板 的后面。
非常详细的IBM小型机故障定位方法
非常详细的IBM小型机故障定位方法IBM, 小型机, 故障定位一故障的定义.弄清楚系统发生了什么问题.系统现在能做什么?不能做什么?.故障什么时候发生的?.有没有做平时不同的操作?.故障有没有规律?定时还是不定时?发生的频率有多高?.是一台机器出现故障还是多台机器故障?故障现象是否相同?.最近有没有做改动?如安装了新的硬件、软件,改变了系统的一些设置。
二故障信息的收集1)收集故障信息对于判断、诊断故障原因,修复系统非常重要。
2)系统故障记录(errorlog)errdemon 进程在系统启动时自动运行记录包括硬件、软件及其他操作信息故障记录文件为/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析errpt 命令的使用(普通用户权限也可使用)#errpt |more 列出简短出错信息ERROR_ID TIMESTAMP T C RESOURCE_NAME ERROR_DESCRIPTION192AC071 0723100300 T 0 errdemon Error logging turned off0E017ED1 0720131000 P H mem2 Memory failure9DBCFDEE 0701000000 T 0 errdemon Error logging turned on038F2580 0624131000 U H scdisk0 UNDETERMINED ERRORAA8AB241 0405130900 T O OPERATOR OPERATOR NOTIFICATION TIMESTAMP: MMDDHHMMYY (月日时分年)论T(类型): P 永久; T 临时; U 未知(永久性的错误应引起重视)C(分类): H 硬件; S 软件; O 用户; U未知#errpt -d H 列出所有硬件出错信息#errpt -d S 列出所有软件出错信息#errpt -aj ERROR_ID 列出详细出错信息# errpt -aj 0502f666 <--- ERROR_ID用大小写均可例:LABEL: SCSI_ERR1ID: 0502F666Date/Time: Jun 19 22:29:51Sequence Number: 95Machine ID: 123456789012Node ID: host1Class: HType: PERMResource Name: scsi0Resource Class: adapterResource Type: hscsiLocation: 00-08VPD: <--- Virtal Product DataDevice Driver Level (00)Diagnostic Level (00)Displayable Message.........SCSIEC Level....................C25928FRU Number..................30F8834Manufacturer................IBM97FPart Number.................59F4566Serial Number (00002849)ROS Level and ID (24)Read/Write Register Ptr (0120)DescriptionADAPTER ERRORProbable CausesADAPTER HARDWARE CABLECABLE TERMINATOR DEVICEFailure CausesADAPTERCABLE LOOSE OR DEFECTIVERecommended ActionsPERFORM PROBLEM DETERMINATION PROCEDURESCHECK CABLE AND ITS CONNECTIONSDetail DataSENSE DATA0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 00003)控制面板上的LED 代码.8 位代码,通常系统故障灯会同时亮起。
ibm服务器故障诊断及排除
ibm服务器故障诊断及排除
第1页
服务器故障诊疗流程
总体诊疗流程 Y 加电问题诊疗 Y 自检问题诊疗 Y 操作系统开启 Y
诊疗 服务器诊疗流 Y
ibm服务器故障诊断及排除
开始诊疗
是否进行总 体诊疗
服务器是否 正常加电
服务器是否 能够完成自
检
操作系统是 否能够正常
开启
服务器是否 有Insight
IBM服务器光通路诊疗面板
指示灯
问题
操作
CNFG
发生硬件配置错误。
CPU
1. 确定CNFG 指示灯是否也 当只有CPU 指示灯点亮时,
才表示微处理器发生故障。
当CPU 指示灯和CNFG 指示
灯都点亮时,表示微处理 器配置无效。
点亮。假如CNFG 指示灯不亮
,表
示微处理器发生故障。
2. 假如CNFG 指示灯点亮, 表示微处理器配置无效。
1. 检验PCI 插槽上指示灯, 第9页
DELL 服务器故障诊疗流程
DELL服务器光通路诊疗
第一行信息 E0000
每二行信息 OVRFLW CHECK LOG
E0119
TEMP AMBIENT
E0119
TEMP BP
ibm服务器故障诊断及排除
原因
LCD 过载信息。 LCD 上最多能够连续显示三则 错误信息。第四则信息显示为 标准过载信息。
IBM 服务器故障诊疗流程
IBM服务器光通路诊疗面板
指示灯
问题
OVER SPEC
因为某个
电源通道
上出现电
源超负荷
情况,所
以关闭了
服务器。
电源功率
IBMP系列小型机故障定位故障排除资料
第三章、故障定位、故障排除根据我们在实际商用系统中碰到问题,我们总结出了以下几种常见故障及其定位方式和解决方法。
3.1硬件故障硬件故障有很多种,对系统产生的影响也不一样,这里按其故障对系统的影响程度分:致命影响的硬件故障和只影响功能的硬件故障两类进行硬件分类:其损坏对系统产生致命影响(将使机器宕机或无法启动)的硬件包括:主板、CPU、I/O柜(包含本地盘、光驱、PCI插槽等的柜子)或CEC柜(包含CPU/MEMORY等的柜子)、I/O柜I/O柜与CEC柜的接线、电源模块、风扇、本地硬盘、内存损坏等等注:I/O柜和CEC柜一般在比较高端的小型机才有,如M80,低端的是合一的。
这些设备的损坏等将使系统无法完成自检、引导和启动,液晶显示屏上都将有错误信息,可根据液晶显示屏上的错误码对照Service Guide查的错误原因,如果是工作状态下出现这些硬件损坏,则系统将被挂起或宕机。
其损坏对仅对系统产生功能影响(机器不会宕机并能正常启动)的硬件包括:网卡、本地硬盘有坏块、显卡、SSA卡和其他外围设备这些设备的损坏只影响特定功能,如网络功能、显示功能、访问磁阵的功能等,对于本地硬盘有坏块的情况,则要看坏块中是否包含了重要的系统文件,如果不是重要系统文件,则系统功能不受影响,但也建议立即更换该硬盘。
故障定位和排除:以上硬件故障信息都可以使用:液晶屏上的错误码或:errpt –dH 查看到根据错误码确定是什么硬件出了故障,对商用系统来讲,由于是双机系统,如果损坏机器是主机可以将此服务器切换成备机,然后修复故障机器,恢复系统。
3.2磁阵故障磁阵引起的故障是目前碰到的最频繁、危害最大的故障,据不完全统计,其故障覆盖到总故障的70%以上,具体来讲,可能引起磁阵故障的环节包括:磁阵硬盘、7133柜子、主机上的SSA卡、连接7133与主机的SSA线、硬盘的位置和ssa线的接线方式、以及盘柜使用的电压及周围磁场、磁阵/硬盘/ssa卡的微码等都可能造成7133的异常。
IBM X335 X345 X235光通路诊断面板上的LED指示灯的说明
IBM X335 X345 X235光通路诊断面板上的LED指示灯的说明在IBM X系列服务器的机箱前面板上x335,x345在主板上,有一个系统错误灯,当系统检测到错误时,上面的LED灯就会亮起来。
如果发现机器前面板的系统错误灯亮起来了,需要打开机箱盖,检查诊断面板上的LED灯。
下面的表格中,列出了诊断面板上面的LED灯对应的解决问题的操作,或者可能有故障的部件,表格里的信息只有当前面板的系统错误灯亮的时候才有效注意:1、如果诊断面板上的LED灯亮了,但是服务器前面板的系统错误灯没有亮,这可能是LED 灯出了问题,运行LED灯的诊断2、在进行更换部件之前,请先检查系统错误日志3、当系统关闭时,内存(DIMM)错误灯,处理器(microprocessor)错误灯,稳压(VRM)模块灯会灭掉诊断面板灯备件/操作(FRU/action)所有的灯都不亮(检查系统的错误日志,找到系统错误后清除系统错误日志) 1. 系统错误日志达到75% 满,清除日志2. PFA(警报),检查日志,清除PFA警报;拔掉电源线,20秒之后,重新连接电源线,开机3. 运行光通路诊断内存(MEMORY)灯亮(内存旁边的LED灯也会亮) 1. 内存2. 系统主板CPU灯亮(处理器旁边的LED灯也会亮) 1. 处理器1或者处理器22. 系统主板PCI BUS 灯亮 1. 拔掉受影响的总线插槽上的PCI适配器(总线信息可以参见硬件维护手册的32页“LEDs for Active PCI slots” 和57页“Adapter considerations”)2. 系统主板稳压模块(VRM)灯亮(失效的稳压模块旁边的LED灯也会亮) 1. 稳压模块LED灯对应的稳压模块2. 微处理器LED灯对应的微处理器DASD灯亮(在安装了失效硬盘的托架旁边的LED也会亮,检查失效硬盘的琥珀色LED 灯) 1. 确认风扇工作正常,并且机箱内的气流正常如果安装有从硬盘背板到主板的I2C线缆,请重新插牢(J10)2. 失效的硬盘,SCSI通道A有故障(这是连接热插拔硬盘的SCSI通道)3. SCSI 硬盘背板SERVICE PROCESSOR 灯亮 1. 拔掉服务器电源线,30秒之后,重新连接2. 重新刷新或者升级高级管理芯片的微码和BIOS3. 系统主板电源1(POWER SUPPLY 1)灯亮 1. 检查电源1的DC灯,如果DC灯不亮,更换电源1 2. 如果安装了电源笼组件,更换电源笼电源2(POWER SUPPLY 2)灯亮 1. 检查电源2的DC灯,如果DC灯不亮,更换电源22. 如果安装了电源笼组件,更换电源笼非冗余(NONREDUNDANT)灯亮 1. 检查电源1(PS1)和电源2(PS2)的LED灯,更换提示有故障的电源2. 再安装一个电源或者从服务器卸掉一些非必要的设备NMI 灯亮 1. 重新启动服务器2. 检查系统错误日志温度(TEMPERA TURE)灯亮 1. 环境温度必须处于正常工作规范要求的范围内,可以查阅硬件维护手册第二页的“Features and specifications”2. 确保风扇工作正常3. 检查系统错误日志4.a. 系统超过了建议的工作温度信息LED面板b. 硬盘超过了建议的工作温度(DASD 灯也会亮)硬盘温度过高硬盘背板c. CPU x(x代表1或者2)温度超过了建议的工作温度(CPU 灯也会亮)CPU x系统主板5. 如果诊断面板上的CPU灯也亮了,说明某个处理器出了故障风扇(FAN)灯亮 1. 检查每个风扇的LED指示灯2. 更换对应的风扇3. 风扇的线缆4. 系统主板5. 如果安装了电源笼,更换电源笼。
IBM PC机硬件故障检测卡
IBM PC机硬件故障检测卡
陈旭
【期刊名称】《实用影音技术》
【年(卷),期】1995(000)005
【摘要】这里介绍的POST卡是一个极实用又便宜的PC机开机自检的硬件故障检测工具。
它适合于IBM PC/AT以上包括80286、80386、80486以及最新的Pentium(奔腾,80586)CPU的微机。
对软件诊断工具无法查的硬件故障,它可以查出。
使用此卡时要做的全部工作,就是对卡给出的信息进行解释说明,这样就可帮助你查清故障。
【总页数】11页(P59-69)
【作者】陈旭
【作者单位】
【正文语种】中文
【中图分类】TP307
【相关文献】
1.利用IBM—PC机的键盘接口通信的新型IC卡读写器 [J], 殷志文;邓忠华
2.APPLEⅡ机与IBM—PC机之间异步通讯的软,硬件设计 [J], 高建华
3.IBM PC机键盘结构原理及故障检测 [J], 吴玉华
4.IBMPC机通用I/O接口的RS232扩展卡 [J], 何明炜
5.自制IBM PC机通用I/O接口的光电输入卡 [J], 可月
因版权原因,仅展示原文概要,查看原文内容请购买。
ibm-判断硬盘故障方法
i b m-判断硬盘故障方法(总5页)-CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除ibm-判断硬盘故障方法.txt懂得放手的人找到轻松,懂得遗忘的人找到自由,懂得关怀的人找到幸福!女人的聪明在于能欣赏男人的聪明。
生活是灯,工作是油,若要灯亮,就要加油!相爱时,飞到天边都觉得踏实,因为有你的牵挂;分手后,坐在家里都觉得失重,因为没有了方向。
硬盘常见问题与故障诊断适用机型:所有服务器文档内容:注意:必须完成硬件检测,任何报错或提示信息的优先级都高于硬盘的问题。
杂音并非硬盘有故障的表现,有些是硬盘固有的声音,相同FRU号的硬盘之间可以比较杂音大小。
1. 开始进行故障排除时,请先确认以下各项问题,如果您的问题在所列出的项中,选择该项链接,否则请继续参考第2步。
* 服务器自检的时候无法识别到IDE硬盘* 硬盘导致系统被锁、挂起、性能低或自动重起* 有杂音的硬盘2. 点击以下链接查看与您的系统相关的硬盘信息以及其他问题,如果没有找到相关信息,请您继续参考第3步。
* 查看系统相关的硬盘信息 - 与IBM系统相关的文章3. 点击以下链接运行自动检测方案进行硬盘故障排除(进一步了解自动解决方案):* 检测您的硬盘如果您的系统不支持上述自动解决方案,请在硬盘上运行诊断程序,注意硬盘以外的其他设备的报错信息。
* 进入您的系统诊断程序下载页面4. 为了进一步判断故障,请选择您的硬盘所属的控制器类型:* SCSI控制器* ServeRAID控制器* ATA-133 RAID控制器* IDE/EIDE控制器系统BIOS中不能正确识别IDE硬盘如果系统BIOS不能正确识别IDE硬盘,请依次确认硬件设备、磁盘、数据线或主板是否全部工作正常。
1. 如果在别的主板上有工作正常的控制器,将硬盘连接到该控制器上,在BIOS中确认是否能识别到硬盘。
2. 重新插拔硬盘的数据和电源连线,如果可能请尝试使用其它数据和电源线缆。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
故障提示:
ps 指示灯:当此指示灯发亮时,表明电源2 出现故障。
temp 指示灯:当此指示灯发亮时,表明系统温度超出阈值级别。
fan:当此指示灯点亮时,表明散热风扇或电源风扇出现故障或运行太慢。
风扇发生故障还会导致over temp 指示灯发亮。
link指示灯:当此指示灯发亮时,网卡出现故障。
vrm 指示灯:当此指示灯发亮时,表明微处理器托盘上的某个vrm 出现故障。
cpu 指示灯:当此指示灯发亮时,表明某个微处理器出现故障。
pci 指示灯:当此指示灯发亮时,表明某个pci 总线发生错误。
mem 指示灯:当此指示灯发亮时,表明发生内存错误。
dasd 指示灯:当此指示灯发亮时,表明某个热插拔硬盘驱动器出现故障。
nmi 指示灯:当此指示灯发亮时,表明出现一个不可屏蔽中断(nmi)。
sp 指示灯:当此指示灯发亮时,表明服务处理器遇到错误。
brd 指示灯:当此指示灯发亮时,表明某个连接的i/o 扩展单元出现故障。
log 指示灯:当此指示灯发亮时,表明您应该查看事件日志或remotesupervisor。
cnfg指示灯:当此指示灯发亮时,表明BIOS配置错误。
raid 指示灯:当此指示灯发亮时,表明阵列卡故障。
over spec 指示灯:当此指示灯发亮时,表明对电源的需求超过了指定的电源供应。
remind 按钮:按下此按钮可重新设置操作员信息面板上的系统错误指示灯并将服务器置于提醒方式。
在提醒方式下,故障并没有清除但系统错误指示灯会闪烁(每2 秒闪烁一次)而不是持续发亮;如果出现另一个系统错误,则系统错误指示灯将会持续发亮。
BRD 主板上发生错误。
CNFG 发生硬件配置错误。
DASD 发生硬盘驱动器错误。
FAN 风扇发生故障,或者是运行过慢,或者是 已卸下风扇。
TEMP 指示灯可能也会点 亮。
LINK 保留。
LOG 已将错误消息写入系统事件日志。
查看IMM 系统事件日志和系统错误日志,获取有关错误的信息。
MEM 当只有MEM 指示灯点亮时,才表示发生 了内存错误。
当MEM 指示灯和CNFG 指示灯都点亮 时,表示内存配置无效。
O V E R SPEC 由于某个电源通道上出现电源超负荷情 况,所以关闭了服务器。
电源功率超过最 大额定值。
PS 电源发生故障。
RAID RAID阵列出错。
SP 服务处理器(IMM)发生故障。
TEMP 系统温度已超出阈值级别。
发生故障的风 扇会导致TEMP 指示灯点亮。
VRM 保留。