平台运行维护

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.1.1.1.日常巡检

项目验收完毕后,定期对用户系统进行巡回检修服务。对用户系统的工作环境、设备运行状态、性能、安全性等方面进行检查。进行必要的预防性维护,及时解决用户系统中存在的问题,以确保整个系统的安全、高效运行。并在每个季度末向业主方提交《系统巡检报告》,详细报告系统的运行状态、发现的问题,解决情况,是否有遗留问题,遗留问题状态等方面的情况。

巡检服务:实施方根据信用平台运行情况,每周对信用平台健康性进行检查并提供巡检报告,巡检内容包括:

●信用平台运行检查;

●错误日志分析;

●检查信用平台相关数据库结构、初始化参数、主要配置文件;

●检查信用平台相关数据库运行状况;

●检查信用平台相关数据库空间的使用情况及规划管理;

●检查信用平台相关数据库备份的及时性;

●检查信用平台相关硬件设备运行状态检查。

并将结果以巡检报告的形式及时反馈给业主信息化管理部门,乙方将定期向甲方提供平台运行情况统计分析、数据质量分析、系统升级、故障处理、系统优化建议等相关报告。主要有:

维护双周报:乙方根据甲方要求提交双周报,内容包括系统平台总体运行情况,软硬件检查,故障处理分析,系统升级情况,数据质量检查,系统使用次数统计,系统优化建议,重大问题进展等。

故障专项报告:每次故障处理后五个工作日内提交故障报告单,内容包括故障时间,故障现象描述,故障处理过程,故障处理结果,预防保障措施。

1.1.1.

2.故障排除

具有远程接入服务、现场支持服务、系统恢复和故障解决服务。

故障排除过程中如遇到紧急情况需要处理,为规范和加强网络重大信息安全事件的信息报告管理工作,及时掌握和评估重大信息安全事件有关情况,协调组织力量进行事件的应急响应处理,降低信息安全事件的损失和影响,根据中共中央办公厅、国务院办公厅转发《国家信息化领导小组关于加强信息安全保障工作意见》的通知(中办[2003]27号)和有关法律、法规的规定,结合公司实际,制定本规范,则全体网络管理员组成网络安全应急团队:

(一)完善各项应急预案的制定和各项措施的落实。

(二)认真搞好各项物资保障,严格按照预案要求积极配备网络安全设施设备,落实网络线路、交换设备、网络安全设备等物资,强化管理,使之保持良好工作状态。

(三)采取一切必要手段,组织各方面力量全面进行网络安全事故处理工作。

(四)调动一切积极因素,全面保证和促进网络安全稳定地运行。

紧急故障应急措施应以快速恢复客户使用为目标,第一时间将客户使用状态恢复到正常,避免或尽量减少因故障而导致的损失。

根据实际情况和需要制定基本的安全管理制度,对重要设备、软件和业务数据的安全性进行规范、可靠的管理,提高本部门信息系统的安全防护能力。包括配合技术部制定机房管理制度、设备管理制度、病毒防治管理制度、数据备份与恢复制度、网站管理制度、安全审计制度和应急响应制度等。

在【问题管理】流程中,当服务主管收到服务台人员或助理提交的《运维工作单》,并判断该问题属于重大事故时,则启动应急处理流程。重大事故包括以下几种情况:

大范围系统中断、区域性系统崩溃、关键业务中断、大范围病毒爆发系统严重破坏、数据严重破坏。

根据重大事故的紧急程度和状态不同,服务主管可采取以下方式启动应急流程:

当紧急事件发生时,我公司的运行人员首先要进行故障分析,确定故障的范围和程度,确认为紧急故障的,在查找原因和解决问题的同时,要同步将故障解决情况通报给部门领导、及向客服中说明事件发生的状况。如需其他部门协助的,需要请求相关部门共同尽快解决故障。

对于系统故障事件,我公司的运维人员首先要启用备份系统,再判断故障类型:硬件损坏、操作系统故障、软件故障。硬件损坏的情况,首先向服务器供应商报障;操作系统故障多数情况都和硬件故障同时出现,处理方式相同;软件故障如果是由购买的软件造成的,立即向软件厂商寻求技术支持;如果是应用系统软件,立即向相关人员联系并排除故障。

对于自然灾害性事件,运维管理人员要尽可能将设备转移到安全地带,将损失降低到最少。

在故障排除之后,运行管理人员要填写故障记录,如果故障是由于项目实施中存在的隐患造成的问题,具体操作请参见上层文件《网络系统维护管理指引》。故障记录汇总到“系统运行故障记录表”,重大事故由故障处理人填写故障报告。

当紧急事件发生时,我公司的运行人员首先要进行故障分析,确定故障的范围和程度,确认为紧急故障的,在查找原因和解决问题的同时,要同步将故障解决情况通报给部门领导、及向客服中说明事件发生的状况。如需其他部门协助的,需要请求相关部门共同尽快解决故障。

1)对于系统故障事件,我公司的运维人员首先要启用备份系统,再判断故障类型:硬件损坏、操作系统故障、软件故障。硬件损坏的情况,首先向服务器供应商报障;操作系统故障多数情况都和硬件故障同时出现,处理方式相同;软件故障如果是由购买的软件造成的,立即向软件厂商寻求技术支持;如果是应用系统软件,立即向相关人员联系并排除故障。

2)对于自然灾害性事件,运维管理人员要尽可能将设备转移到安全地带,将损失降低到最少。

3)对于电力中断事件,由于机房多采用UPS防止断电带来的系统停机现象,

在UPS还能供应电力期间恢复供电,对系统使用不会有影响;但遇到特殊情况导致供电部门在短期内不能恢复供电时,如有备用发电设备要启用备用发电设备供电,否则要关闭所有设备,确保突然断电造成设备损坏。

1.1.1.

2.1问题升级机制

为了平台各种级别的故障时得到相应级别的关注和资源支持,在故障处理过程中,乙方维护工程师和甲方工程师可根据故障处理进度,参照下表逐级升级。

1.1.1.

2.2故障维护

质保期内用户正常使用时出现的软件故障和缺陷,由我方负责任修复。因用户使用不当或者不可抗拒因素所造成的问题,我方全力配合解决,派驻至少1名技术人员现场服务,对软件系统提供免费维护,同时,对接口变更、需求优化等基本模块调整的开发,提供无偿服务。

相关文档
最新文档