服务器硬件故障应急预案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

服务器硬件故障应

急预案

服务器故障应急预案

有关应急预案

1 服务器硬件故障应急预案

(1)核心服务器双机配置,配置好备用服务器,随时待命。

(2)发生服务器硬件故障后,相关人员应及时查找、确定故障原因,进行先期处理。若故障服务器在短时间内无法修复,相关人员应启动备用服务器,保持局域网系统的正常运行;将故障服务器脱离网络,进行故障排除工作。

2 服务器软件系统故障应急预案

(1)做好服务器软件系统的定时备份,系统崩溃后,能够及时恢复系统。

(2)发生服务器软件系统故障后,相关人员应检查出现故障的原因并尽快排除。

(3)如遇服务器系统崩溃,应启用备份系统进行恢复。

服务器硬件故障预防与排除

1 故障预防

准备相应的应急备用服务器。当服务器出现不可恢复的硬件故障时,马上启动备用服务器,从而减小服务器硬件故障风险。

2 故障排除

当服务器出现硬件故障,经过以下步骤排除:

(1)确定故障原因。依次查看电源、硬盘、内存、主板、处理器等,如条件许可,可使用替换法检测各硬件。

(2)恢复固件缺省配置。比如去除第三方厂商备件和非标配备件;清除CMOS,恢复资源初始配置。

3、故障处理

(1)硬盘故障处理:当硬盘出现黄灯提示预警时,应先查看硬盘数据是否丢失,如数据存在应先做好数据备份,将此服务器各应用迅速转移,然后排查报警具体原因,如由于错误操作或硬盘连接不好引起的报警,可尝试重启服务器,重新插拔硬盘等操作即可解决问题。如硬盘损坏,应及时将备用硬盘替换下故障硬盘,使服务器恢复正常工作。排查过程中,如不能正确判断问题原因,不能随便操作,可向IBM售后服务咨询处理。

(2)内存故障:由于我们的服务器有多组内存,单条内存故障时,会对服务器性能稍有影响,当不会影响整体使用,因此如发现内存条损坏时,安排时间将损坏的内存条替换掉即可(3)RAID卡故障:服务器的RAID卡出现故障时,系统会无法识别出硬盘,服务器不能正常使用,因此应第一时间启动备用服务器。将故障服务器移出生产网络后更换RAID卡,RAID卡经过硬盘重新读取RAID配置信息后即可恢复使用!

相关文档
最新文档