IT运维驻场服务内容
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
驻场技术服务内容
为确保甲方相关设备完好,运转正常,驻场技术服务包括规范性日常维护、巡检、变更、故障应急响应、系统问题处理等工作范围,具体内容如下:
一、日常系统巡检
1.进行LINUX系统层面的巡视检查
●包括计算资源CPU/MEM/HD负载及利用率
●内核版本/操作系统版本
●系统运行时间/登入用户信息
●网络接口状态、网络延迟丢包率
●重要端口监听、进程状态
●日志错误信息分析
2.硬件健康状态检查
●IPMI管理界面中信息硬件运行状态
●RAID驱动状态
●CPU温度、风扇、固件等状态
3.重点保障业务的服务检查
●包括SELINUX/FIREWALL/SSH/NTP/Crontab服务
●包括云管平台/Ansible Tower/OSP/Ceph/ITIL/备份系统/脱敏系统等基于
Tomcat/HTTPD/NGNIX的Web应用
●Pacemaker集群服务状态/Ceph OSD状态/计算、存储、网络、控制节点服务
状态
4.常用系统运维工具(示例)
●Ansible Tower自动化运维工具
●Solarwinds监控工具
●ITIL运维管理系统
●身份认证及审计系统
见附件(一)模板
二、监控与分析
1.通过IT资源监控系统,针对业务系统所依赖的网络、硬件、安全、系统、
服务、端口等进行监控,记录保存并按重要性级别分类,形成书面报告;
2.负责对监测和报警记录进行分析、评审,发现可疑行为,形成分析报告,并
采取必要的应对措施;
3.负责运行日志、监控记录的日常维护和报警信息分析和处理工作,提出优
化建议及方案;
4.根据厂家提供的软件升级版本对网络设备进行更新,并在更新前对现有的
重要文件进行备份;
5.定期对系统进行漏洞扫描,对发现的系统安全漏洞进行及时的修补;
6.定期检查违反规定上网或其他违反网络安全策略的行为;
7.专人进行核心服务器的工作压力监控,针对业务的增长定期生成主服务器
的工作压力报表,并且预估业务增长对服务器压力的影响提出合理化建议;
8.专人进行核心数据库的工作压力监控,定期生成报告,并就改进提出合理
化建议。
三、变更/问题管理
1.负责新的业务系统搭建技术支持
●KVM的部署
●基于KVM的各虚拟系统的创建(Windows/Linux)
●网络路由配置
●防火墙配置
●数据库部署
●应用软件部署及配置
2.软件版本升级更新支持
●应用组件RPM包安装、卸载、升级
●系统核心软件包升级
3.系统配置参数调整更新
●HOSTS/DNS/SSH/Crontab/HTTPD/Profile/Env环境变量等参数变更
4.漏洞补丁修复巩固
●系统及软件Bug release修复
●安全补丁更新
四、备份与恢复
1.根据实际应用情况、根据生产相关数据的连接关系、根据应用的业务特点
和软硬件资源,制定详细的系统数据备份计划,确定合理的系统备份策略。
定期备份重要业务信息、系统数据及软件系统等;
2.应根据数据的重要性和数据对系统运行的影响,执行数据的备份,每月提
交数据备份报告,必要时实施数据恢复;
3.按照控制数据备份和恢复过程的程序,对备份过程进行记录,所有文件和
记录应妥善保存;
4.按要求,定期执行恢复程序,检查和测试备份介质的有效性,确保可以在恢
复程序规定的时间内完成备份的恢复;
5.制作备份和恢复的管理规范以及操作步骤手册。
《备份作业清单》
《数据备份与恢复管理规范》
五、资产管理
1.硬件资产及相关设备进行生命周期管理
包括设备品牌、型号、硬件参数、IP地址、维保信息
2.软件资产的统计及其生命周期管理
包括软件名称、厂家、版本、License、维保信息
六、安全事件处置
1.通过现有安全管控系统及时报告所发现的安全弱点和可疑事件;
➢抗DDOS-查看攻击源书和数据量
➢防火墙管控内外网
➢天池云堡垒机安全访问控制
➢综合日志管理提供审计功能
➢大数据分析及综合漏洞扫描提前预防
➢网页防篡改提供安全的网站防护
2.在安全事件报告和响应处理过程中,分析和鉴定事件产生的原因,收集证
据,记录处理过程,总结经验教训,提供防止再次发生的补救措施,过程形
成的所有文件和记录均应妥善保存。
3.制作基线配置文档以及应急响应方案操作指南。
《系统运维基线配置》
《系统故障应急响应方案》
七、服务报告及工作流程整理
1.上述工作内容中要求提交的书面报告之外,驻场人员提供的报告包括:
2.驻场人员及时整理汇总相关操作流程,形成专业指导文档,归档存盘。
➢操作规范类(如双人会同、密码策略、访问控制、备份等级等)
➢故障处理类(通用KB类)
➢记录审计类(记录存档、基线配置类)
八、高级技术咨询顾问
1.对于复杂疑难的问题和故障根本原因分析等需求,提供二线的高级技术咨
询;
2.针对Redhat产品本身,提供原厂技术服务资源支撑。
附件(一):