IBM宕机处理全过程

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二天早上来看,第二台机器也宕掉了,错误和第一台一摸一样。
这时在IBM工程师的远程支持下,在维护模式下,将错误日志发给了他,
2. 05/04/2004 14:01:47 System Processor Failure
Error code: 4B2A25F4
Priority FRU Location Code
6. Set System Name
99. Exit from Menus
选择3进入系统信息,再选择7,就是对processor的控制,将1和2设置为 manaual deconfig 状态,就是将这两个CPU隔离了。然后重启系统,但是故障依旧。以为是CPU隔离错了,就将3和4号配置成 manaual deconfig,1和2号回复为 manaul config,从启后故障依旧。
MAIN MENU
1. Service Processor Setup Menu
2. System Power Control Menu
3. System Information Menu
4. Language Selection Menu
5. Call-In/Call-Out Setup Menu
B438 800325F40000000000000000
IBM首先怀疑是电源问题,至于为什么不知。
查看后发现确实是有点问题,一个机柜中有两个插排,所有的电源都插在了一个插排上,另一个没有用?(为什么是这样也不得而知了,谁知道这个工程是怎么做得)。关机调整后,重新开机,但是错误依然。
2. chmod +x 70286C4F.BIN
3. ./70286C4F.BIN
4. sum 3R031021.img ---目的:通过检查文件大小,确认升级软件正确的上传到server
The output will look like this ----->; 30735 4907 3R031021.img
最后INM工程师提示,将启动方式改为fast boot,以前为slow boot,再次启动,居然正常了。
之后用snap收集了相关信息发给IBM,具体结果还不得而知。IBM初步给的建议就是微码升级!
/server/mdownload/download.html
MAIN MENU
1. Service Processor Setup Menu
2. System Power Control Menu
3. System Information Menu
4. Language Selection Menu
5. Call-In/Call-Out Setup Menu
用串口登录到维护状态:
Service Processor Firmware
Version: 3K030814
Copyright 2001, IBM Corporation
1033F4A
________________________________
3. Reboot/Restart Policy Setup Menu
4. Power-On System
5. Power-Off System
6. Enable/Disable Fast System Boot:
Currently Fast Boot
7. Boot Mode Menu
word11: 4B2A25F4 word12: 02100011 word13: A2101103
word14: 00000000 word15: 00000000 word16: 00000020
word17: F3820004 word18: 0020FFFF word19: FFFFFFFF
IBM宕机处理全过程
背景描述:P650双机,磁盘阵列7133,4CPU 4G内存,下午一台机器突然宕机了,重启后进入OK状态,然后再按开关,LED显示了错误码,4B2A25F4U0.1-P1-C1,反复试了几次结果都一样。
初步分析:经过咨询IBM人员,错误代码的意思就是,两路CPU故障,有可能是CPU的问题,有可能是CPU卡的问题。初步思路:就是将故障的CPU隔离。
98. Return to Previous Menu
99. Exit from Menus
然后再选择6,就可以更改为快起还是慢起了。
微码升级简单步骤:
### Procedimento para Update do Firmware ###
1. cd /tmp/fwupdate
-------- ------- ---------------
High 00P4050 U0.1-P1-C1
SRC
--------------------------------------------------------------
### Procedimento para Update do Firmware ###
The checksum is ----->; 30735
5. cd /usr/lpp/diagnostics/bin
./update_flash -f /tmp/fwupdate/3R031021.img
6. lscfg -vp | grep -p Platform
用串口连接机器(超级终端速率设成9600)就可以脸上。
主菜单如下:
Service Processor Firmware
Version: 3K040323
Copyright 2001, IBM Corporation
1033F4A
________________________________
6. Set System Name
99. Exit from Menus
选择2
SYSTEM POWER CONTROL MENU
1. Enable/Disable Unattended Start Mode:
Currently Disabled
பைடு நூலகம்
2. Ring Indicate Power-On Menu
相关文档
最新文档