服务器故障应急流程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
服务器故障应急流程
目的及总的原则:
为保证公司业务的正常运行,避免和减少公司各服务器出现严重问题,在出现问题时能根据本方案及以前的备份资料迅速及时恢复系统的正常运行;保证公司数据的完整性,并可随时恢复;减少故障对公司的损失。
电力故障的应急方案:
当发生电力故障时第一时间保证重要服务器、路由器及交换机的电源,关掉业务不是很重要的服务器,这样可以在断电时保证网络的基本运行,确保各分公司正常连接办公网、相关业务系统基本不受影响。并询问人事部故障处理时间,如果断电时间超出UPS使用时间,可通知各部UPS电源可待机时间。在UPS电源只够支撑半个小时的时候,电话通知各部做好文档保存工作,一线营业部门做好手工记帐准备,服务将在15分钟后中断。确定各部做好保存工作后将各组服务器关机,等待电力恢复。电力恢复后,将各服务器和网络设备开机,检查各组服务器和网络运行情况,发现故障及时跟进处理,确认运行正常后,电话各部通知服务已恢复正常运行。恢复后将结果报知部门经理并做好相关记录。
硬件故障应急流程:
当发生硬件故障时第一时间分析故障原因,用排除法找到故障原因.如果是内存、硬盘、电源故障可及时使用备用零件替换.如果是CPU、主板可用备用服务器顶替,以确保服务不中断。如果当值人员无法排除故障,可向本部同事请求技术支持并向本部经理汇报情况,由经理统一协调。发生故障同时电话通知相关业务部门,告知故障原因、处理时间,故障处理结束后电话通知使用部门和部门经理告知处理结果。并将处理结果在《服务器重大事件处理登记表》做好记录.
软件故障应急流程:
当发生软件故障时第一时间分析故障原因,当系统出现崩溃时,可通过系统GHOST备份还原系统。(系统GHOST在本机与文件服务器都做了备份)。当系统中病毒时,可进入安全模式查杀病毒和木马,安全模式无法进入的话可将硬盘外挂到另一台电脑进行查杀。当服务器数据库损坏后,可及时通过SQL恢复本机的备份数据。(数据库在本机与磁带机都有备份)。如果当值人员无法排除故障,可向本部同事请求技术支持并向本部经理汇报情况,由经理统一协调。发生故障同时电话通知相关业务部门,告知故障原因、处理时间,故障处理结束后电话通知使用部门和部门经理告知处理结果。并将处理结果在《服务器重大事件处理登记表》做好记录.
人为及自然损坏应急方案:
当发生人为及自然损坏时,第一时间通知部门经理由经理统一协调,发生服务器被盗和暴力破坏服务器时,可选择报警,追究破坏者刑事责任,从其它公司部门借调服务器,重新恢复相关数据。当发生数据被盗时,查看监控录像或服务器日志。报警追究刑事责任。发生不可抗力服务器自然损坏时, 从其它公司部门借调服务器,重新恢复相关数据。并将处理结果在《服务器重大事件处理登记表》做好记录.