虚拟化平台安全应急管理办法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

--

Xxxxxx

虚拟化平台安全应急管理办法

2015-A

前言

为提高处置虚拟化平台安全突发事件的能力,形成科学、有效、反应迅速的应急工作机制,确保重要信息系统的运行安全和数据安全,最大限度地减轻平台安全突发事件的危害,维护企业正常的生产经营秩序,特制订本应急预案。

本预案由xxxxx科起草并归口管理。

本预案主要起草人:xxxxxxxxxxxx

本预案2015年12月30日首订发布。

虚拟化平台安全应急管理办法

1 范围

本办法适用于xxxxx厂虚拟化平台的网络故障、数据安全故障、系统故障等安全事件的应急处置工作。

2 规范性引用文件

3 术语和定义

3.1 虚拟化平台:是指基于虚拟化技术的信息系统运行平台,负责虚拟机的托管和管理。目前,大部分厂级信息系统运行在虚拟化平台上。

3.2 虚拟机:是指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。虚拟化平台上每个业务系统就是一个虚拟机。

4 职责

4.1 xxxxx科负责本办法的归口管理;

4.2 各部门负责根据本办法要求履行应急管理职责,完成职责范围内的各项应急管理工作。

5 管理内容和方法

5.1事故类型和危害程度分析

企业建设有信息中心机房,厂级虚拟化平台部署于机房内,平台与工控系统通过光纤直连,平台与办公网通过防火墙安全隔离。厂大部分重要信息系统运行在平台上,平台存在服务器、存储、交换机等基础物理设备故障的可能,以及光纤通信线路的中断的风险。另外,平台也存在被病毒感染和恶意攻击的可能,从而造成数据丢失或系统故障,对企业务系统正常运行造成一定影响。

5.2 组织机构及职责

5.2.1成立虚拟化平台安全应急领导小组。

组长:xxxxx科科长;

副组长:xxxxx科副科长;

成员:xxxxx科信息系统管理员、各部门信息化联络员。

5.2.2应急小组职责

1.组长职责:

总体负责应急响应与应急处理工作,统一调配软硬件应急保障资源,及时、准确处置故障;

对影响重大的事件解决方案给予指导和审核。

2.副组长职责:

负责安排和协调小组技术人员进行现场问题解决;

指导小组技术人员向业务部门汇报处理情况和进度;

3.小组成员职责:

负责落实虚拟化管理平台日常应急工作管理;

负责技术分析,及时查找、解决平台安全事件。

5.3应急汇报机制

当运行在虚拟化平台上的业务系统出现不正常情况时,业务部门或现场人员应及时通知系统管理员,系统管理员立即进行检查、判断,经确认需要启动应急处理措施时,第一时间通知应急小组组长和副组长。组长根据实际情况协调抽调小组人员集中力量解决发平台故障,确保在最短时间内恢复业务系统的正常运行。

事件发生后应急小组副组长安排人员按一定周期向业务部门通报事件处理情况,事件处理完成后形成事件处理报告提交给小组组长。

5.4应急处理流程

1.发生业务中断事件后,业务部门向系统管理员描述故障现象及情况。

2.系统管理员针对故障情况进行初步判断和处理,经确认为平台故障需要启动应急预案时,应第一时间向应急小组组长和副组长汇报。

3.小组组长根据需要抽调技术人员解决虚拟化平台故障,副组长安排向人员业务部门通报故障处理进度。

4.技术人员进行排查、处理直到虚拟化平台恢复正常运行为止。

(1)虚拟化平台物理服务器共有2台,通过vmware vsphere HA软件组建集群,当一台服务器出现故障,运行其上的业务系统虚拟机会自动在另一台服务器上启动运行,业务系统不会长时间中断,若有虚拟机不能正常启动,则进行手工处理,保证所有业务系统虚拟机均可正常运行。

(2)故障服务器需要停机维护,虚拟化平台维护人员先将故障服务器切换至维护模式并从HA集群中移除,然后通知硬件厂家维修直至恢复正常运行。

(3)若服务器硬件24小时内无法恢复,虚拟化平台维护人员需书面报告原因并立即通知业务管理人员进行数据应急备份,防止灾难扩大。

2.物理存储

(1)虚拟化平台物理存储共有4台,均为IBM存储。每台存储均为双控制器配置,通过IBM SVC进行虚拟化,组建存储资源池,并利用磁盘镜像功能实现数据冗余配置。当一台存储上的磁盘出现故障,不影响业务系统的正

常使用。

(2)故障存储需要停机维护,将故障存储设备关机,然后通知硬件厂家维修直至恢复正常运行。

(3)若存储硬件24小时内无法恢复,虚拟化平台维护人员需书面报告原因并立即通知业务管理人员进行数据应急备份,防止灾难扩大。

5.5.2.虚拟化平台系统故障

(1)虚拟化平台通过vmware vsphere HA虚拟软件组建了服务器集群,当一台服务器系统出现故障,运行其上的业务系统虚拟机会自动在另一台服务器上启动运行,业务系统不会长时间中断,若有虚拟机不能正常启动,则进行手工处理,保证所有业务系统虚拟机均可正常运行。

(2)在搭建厂级虚拟化平台的同时,配置了一套虚拟备用平台,随时待命。

(3)若虚拟化平台系统故障在短时间内无法修复,维护人员应将业务系统迁移到备用平台环境中,保持业务系统的正常运行,平台修复完成后,再将业务系统迁回。

5.5.3虚拟机软件系统故障

(1)厂级已建立备份容灾系统,重要业务系统均做定期数据备份。

(2)发生虚拟机系统故障后,虚拟化平台维护人员应及时通知系统管理员检查出现故障的原因并尽快排除。

(3)如遇虚拟机系统故障无法修复的,需启用备份容灾系统进行恢复。系统恢复后与业务系统管理员仔细检查业务是否恢复并做好恢复记录。

5.5.4.机房停电

(1)中心机房配有UPS备用供电系统,当市电断开后,UPS备用供电系统继续为信息化设备提供电源,备用供电系统设计供电4小时。

(2)若为临时停电,时间不超过2小时,由UPS备用供电系统为虚拟化平台提供电源,业务系统可以不中断运行。

(3)若停电时间超过2小时,为保障业务系统数据的安全,需停用业务系统,关门所有虚拟机,停用虚拟化平台。

5.6附则

相关文档
最新文档