IT运维驻场服务内容

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

驻场技术服务内容

为确保甲方相关设备完好,运转正常,驻场技术服务包括规范性日常维护、巡检、变更、故障应急响应、系统问题处理等工作范围,具体内容如下:

一、日常系统巡检

1.进行LINUX系统层面的巡视检查

●包括计算资源CPU/MEM/HD负载及利用率

●内核版本/操作系统版本

●系统运行时间/登入用户信息

●网络接口状态、网络延迟丢包率

●重要端口监听、进程状态

●日志错误信息分析

2.硬件健康状态检查

●IPMI管理界面中信息硬件运行状态

●RAID驱动状态

●CPU温度、风扇、固件等状态

3.重点保障业务的服务检查

●包括SELINUX/FIREWALL/SSH/NTP/Crontab服务

●包括云管平台/Ansible Tower/OSP/Ceph/ITIL/备份系统/脱敏系统等基于

Tomcat/HTTPD/NGNIX的Web应用

●Pacemaker集群服务状态/Ceph OSD状态/计算、存储、网络、控制节点服务

状态

4.常用系统运维工具(示例)

●Ansible Tower自动化运维工具

●Solarwinds监控工具

●ITIL运维管理系统

●身份认证及审计系统

见附件(一)模板

二、监控与分析

1.通过IT资源监控系统,针对业务系统所依赖的网络、硬件、安全、系统、

服务、端口等进行监控,记录保存并按重要性级别分类,形成书面报告;

2.负责对监测和报警记录进行分析、评审,发现可疑行为,形成分析报告,并

采取必要的应对措施;

3.负责运行日志、监控记录的日常维护和报警信息分析和处理工作,提出优

化建议及方案;

4.根据厂家提供的软件升级版本对网络设备进行更新,并在更新前对现有的

重要文件进行备份;

5.定期对系统进行漏洞扫描,对发现的系统安全漏洞进行及时的修补;

6.定期检查违反规定上网或其他违反网络安全策略的行为;

7.专人进行核心服务器的工作压力监控,针对业务的增长定期生成主服务器

的工作压力报表,并且预估业务增长对服务器压力的影响提出合理化建议;

8.专人进行核心数据库的工作压力监控,定期生成报告,并就改进提出合理

化建议。

三、变更/问题管理

1.负责新的业务系统搭建技术支持

●KVM的部署

●基于KVM的各虚拟系统的创建(Windows/Linux)

●网络路由配置

●防火墙配置

●数据库部署

●应用软件部署及配置

2.软件版本升级更新支持

●应用组件RPM包安装、卸载、升级

●系统核心软件包升级

3.系统配置参数调整更新

●HOSTS/DNS/SSH/Crontab/HTTPD/Profile/Env环境变量等参数变更

4.漏洞补丁修复巩固

●系统及软件Bug release修复

●安全补丁更新

四、备份与恢复

1.根据实际应用情况、根据生产相关数据的连接关系、根据应用的业务特点

和软硬件资源,制定详细的系统数据备份计划,确定合理的系统备份策略。

定期备份重要业务信息、系统数据及软件系统等;

2.应根据数据的重要性和数据对系统运行的影响,执行数据的备份,每月提

交数据备份报告,必要时实施数据恢复;

3.按照控制数据备份和恢复过程的程序,对备份过程进行记录,所有文件和

记录应妥善保存;

4.按要求,定期执行恢复程序,检查和测试备份介质的有效性,确保可以在恢

复程序规定的时间内完成备份的恢复;

5.制作备份和恢复的管理规范以及操作步骤手册。

《备份作业清单》

《数据备份与恢复管理规范》

五、资产管理

1.硬件资产及相关设备进行生命周期管理

包括设备品牌、型号、硬件参数、IP地址、维保信息

2.软件资产的统计及其生命周期管理

包括软件名称、厂家、版本、License、维保信息

六、安全事件处置

1.通过现有安全管控系统及时报告所发现的安全弱点和可疑事件;

➢抗DDOS-查看攻击源书和数据量

➢防火墙管控内外网

➢天池云堡垒机安全访问控制

➢综合日志管理提供审计功能

➢大数据分析及综合漏洞扫描提前预防

➢网页防篡改提供安全的网站防护

2.在安全事件报告和响应处理过程中,分析和鉴定事件产生的原因,收集证

据,记录处理过程,总结经验教训,提供防止再次发生的补救措施,过程形

成的所有文件和记录均应妥善保存。

3.制作基线配置文档以及应急响应方案操作指南。

《系统运维基线配置》

《系统故障应急响应方案》

七、服务报告及工作流程整理

1.上述工作内容中要求提交的书面报告之外,驻场人员提供的报告包括:

2.驻场人员及时整理汇总相关操作流程,形成专业指导文档,归档存盘。

➢操作规范类(如双人会同、密码策略、访问控制、备份等级等)

➢故障处理类(通用KB类)

➢记录审计类(记录存档、基线配置类)

八、高级技术咨询顾问

1.对于复杂疑难的问题和故障根本原因分析等需求,提供二线的高级技术咨

询;

2.针对Redhat产品本身,提供原厂技术服务资源支撑。

附件(一):

相关文档
最新文档