信息系统应急响应计划
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
XXXXX
信息系统应急响应计划
编制部门:人力资源部信息管理室
编制人:
标准化:
审核:
会签:
批准:
编制日期:2012-09-12
1 目的
为进一步加强TCL多媒体集团OEM事业部信息系统安全管理工作,科学应对信息系统突发事件,建立健全信息安全应急响应机制,有效预防、及时控制和最大限度地消除各类突发事件的危害和影响,特制定本应急响应计划。
2基本要求
2.1信息要求
1)关键业务系统的数据需要进行日常备份,定期进行恢复测试,确保备份的可用性和完整性;
2)系统恢复后应核实信息的完整性。
2.2硬件要求
1)发生灾难时要安排提供替换或备用硬件组件;
2)运行关键业务系统的服务器要做到双机热备份。
3)如有可能,现场有备用的同级别设备,如条件不具备,应与服务商签订服务器维保合同以在需要时能获取服务商的专业支持;
2.3软件要求
1)关键应用系统的最新安装程序、安装指导文档必须进行备份,定期进行恢复测试、确保备份的可用性。
2)在更改系统或应用软件之前要先进行备份。
2.4网络要求
1)在通讯网络比较关键的环境下,要保证核心网络设备是冗余架构;
2)如有可能,现场有备用的核心网络设备,如条件不具备,应与服务商签订核心网络设备维保合同以在需要时能获取服务商的专业支持;
3)应定期对核心网络设备的配置进行备份,定期进行恢复测试,确保备份的可用性;
4)场外应安全保存有核心网络配置文档(含网络拓扑图)。
2.5 文件要求
1)场外须安全保存有最新版程序、系统、操作和用户文件;
2)需要以电子格式存放的文件必须定期备份并在场外安全保存。
2.6 人员要求
1)必须对小组成员进行适当的应急响应培训。培训可以通过定期测试应急响应计划来实施;
2)负责启动和实施应急响应程序的小组成员必须获得最新版的应急响应计划。
3 适用范围
TCL多媒体集团OEM事业部信息系统应急响应。
4 应急小组成员及职责
4.1 信息系统应急小组成员•
执行小组监管机构:•信息管理室主管部门领导•
执行小组助长:•信息管理室经理•
执行小组组员:•信息管理室网络工程师、系统工程师、服务器及数据库管理员,其它部门必要成员(如动力工程师、电工等),外包服务商现场支持工程师。
4.2 企业信息系统应急抢修小组成员职责•
执行小组监管机构职责:负责与管理层沟通,就灾害损失情况,应急处理方案,以及灾害恢复的时间进行汇报,并领导信息抢修小组工作。•
执行小组组长职责:负责企业信息系统故障处理的全过程管理,并对处理结果负责。执行小组组长有权根据抢修实际需要,指挥各小组成员的抢修工作。凡执行小组成员必须服从组长的调度安排。负责调度备件、人员支持,协作和配合处理故障,不得以任何理由推诿和延误故障处理。• 执行小组组员职责:根据执行小组组长的安排,负责故障受理、故障原因判断和故障排除工作,并向执行小组组长及时汇报故障处理情况
5 应急处理一般流程
信息管理室工程师在监控过程中发现或收到其他部门反馈不能正常使用办公或业务应用系统
等故障事件,相关技术人员立即行动,初步查明原因(电力、服务器、存储、网络、数据库、应用系统等),并向应急小组组长汇报。
应急小组组长在听取情况汇报后,根据事件的范围、影响和紧急程度启动相应的专题预案。如果没有相应的专题预案,要根据情况迅速采取措施抑制事件的扩散,恢复系统运行。应急小组组长就灾害损失情况,应急处理方案,以及灾害恢复的时间向信息管理室主管领导汇报。
应急小组应尽快通过OA、电话、电子邮件等方式向各中心、部门下发《应用系统暂停通知》或公告。各中心、各部门要做好信息系统出现故障后的应急安排,尽力减小对公司正常业务的影响。
应急小组组员进一步查明故障原因,根据事件的范围、影响程度,采取应急措施,尽快恢复系统运行。应急小组在对系统完成修复后,在完成测试的基础上,经请示小组组长进行系统的启用,同时通过OA、电子邮件、电话等方式向各中心、各部门发布系统恢复公告。
系统恢复正常后,小组组长须对事件及处理过程进行总结并上报信息管理室主管领导,并由信息管理室主管领导上报公司管理层,内容包括:
1)事件现象、影响、处理过程、结果
2)事件原因分析
3)系统损害程度评估
4)向后改善计划
6 事件分类
事件类型按照各种突发紧急事件的影响范围,将信息系统事件分成全局事件和区域事件。
全局事件:公司核心信息系统因火灾、地震、雷击、电力、网络、软硬件等故障原因,导致全厂信息系统无法正常工作)。
区域事件:MES系统、sMES系统、VMI系统、OA系统等系统故障,导致局部范围内的业务无法正常进行。
7 全局事件处理流程
7.1 机房火灾处理流程:
机房FM200消防系统使用流程:
7.2 公司核心信息系统的外部电力中断、UPS故障等导致的大面积停电事件处理流程:
7.3网络线路或网络设备故障导致的大范围内外网中断故障处理流程:
7.3服务器或其他机房设备发生的软硬件故障处理流程:
1)应急小组组长应组织小组成员立即到达事故现场,观察故障现象(操作系统情况、日志信息、硬件报警信息等),如果问题简单,则尝试恢复(对单机系统,尝试使用备用设备恢复)。
2)如果不能自行恢复,则进行电话报修,向服务商对故障情况等信息进行描述,请求服务商现场技术支持。
3)确定向服务商报修的受理回复,以及服务商工程师和备件到场时间。