运维方案-模板
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
WORD格式
XXXX有限公司
服务器平台运维说明书
北京XXX有限公司
1日常运维
1.1服务级别
1、7*24*4(工作时间4小时响应,非工作时间4小时响应),具体为:
服务期间,对于需要现场维修的问题,工程师将在记录了服务请求后的4小时内到达现场,到达现场前电话技术支持;
备件到达现场时间:对于影响设备运行的部件,在判明故障后4小时内运抵用户现场,对于不影响设备运行的需要更换的备件在24小时内运抵现场;(可选,暂不提供) 疑难故障处理时间:若硬件故障不能及时恢复,在8小时内提供不低于原设备配置的备机服务,直到硬件故障解决并正常运行应用。(可选,暂不提供)
2、5*8*NBD(工作时间4小时内响应,非工作日电话响应,工作时间上门响应支持),具体为:
对于电话支持能解决的问题,4小时电话内配合解决问题;
工作时间内,对于需要现场维修的问题,XX工程师将在记录了服务请求后的4小时内到达现场;
非工作时间内,对于需要现场维修的问题,XX工程师将在记录了服务请求后,工作日上班后4小时内到达现场;
备件到达现场时间:对于影响设备运行的部件,在判明故障后,次日运抵用户现场,对于不影响设备运行的需要更换的备件在两天内运抵现场;(可选,暂不提供) 疑难故障处理时间:若硬件故障不能及时恢复,将协商提供不低于原设备配置的备机服务,直到硬件故障解决并正常运行应用。(可选,暂不提供)
1.2日常巡检
XX每周会对所有运维服务器进行现场预防性检查,巡检完毕填写巡检报告,每月提交现场预防性检查报告并通过用户确认;
XX每月对所有服务器的数据库集群及负载均衡运行状况记录性能参数,提出性能优化
建议,每季度提交一次性能优化报告并通过客户确认;
XX每季度对日常巡检提供维护报告和建议,交付用户存档,同时提交半年和全年维护报告。
1.3参与现场值班和重要时段现场维护
如需要,XX可以安排至少一名经原厂认可的工程师不低于一个工作日参与用户现场运维值班服务;
如需要,对于用户业务重要时段或公司安排的敏感日期和重大会议期间,XX派至少一名经原厂认证的工程师全程参与用户现场运维值班服务,具体时间由用户提前通知;
如需长期派驻现场服务,XX会根据用户需求建立项目运维团队,安排专职项目经理进行项目管理,安排多名经原厂认证的工程师参与系统运维,保障系统工作。
1.4Oracle数据库调优服务
需根据具体情况提供优化方案。
1.5数据库健康巡检及LVS负载均衡巡检服务
运维开始,XX将安排资深工程师负责数据库环境及负载均衡信息的获取,建立详细配置档案库,并根据现有配置做出相应分析,提出优化建议方案。
根据应用及服务的运行情况,每月对数据库及负载均衡情况进行巡检,每月巡检结束,编写巡检报告,每季度向用户提供巡检汇报文档。
2运维案例
3提交件列表
一.巡检报告(服务器)
客户名称:报告日期:年月日机器类型:机器序列号:
检查内容具体项目检查结果
电源状况(220±20V)
机
机房温度(24℃±2℃)
机房湿度
(50%±10%)房
零地电压(<1V)
环
卫生状况,对机器做适当的清洁和除尘
检查联线状况是否合理?
境
检查机器硬件配置,首次PM时,打印出相关内容
检查设备故障灯有无异常状况
机检查系统错误日志及mail信息,永久的硬件错误信息需要及时汇报
检查操作系统备份情况,每次系统的改变都要及时备份
检查文件系统空间状况,对于根文件系统、临时文件系统等影响系统
启动及运行性能的重
点关注器
检查机器性能,查看CPU、Memory及内存交换区相关参数,并记录
相关数据,WAIT较大时,察看io性能
检查HA软件的运行状况,在用户业务允许情况下,验证系统资源是
否可以正常
接管状
检查内存交换区使用情况
检查网络配置及性能情况
清除垃圾文件
检查磁盘空间使用情况,调整数据分布
况
查看系统服务资料是否齐全
检查日志文件和跟踪文件记录,确认所有数据库INSTANCE运行状态正数
常
据
检查数据文件状态及表空间的使用情况,对于空间扩展过快的表空间,库
提醒用户扩展或调整应用
运
检查用户的数据库备份及归档,验证用户备份的有效性行
数据库系统健康检查:检查数据库有无无效的或者无用的数据库对象状
况
检查数据库性能,寻找数据库性能调整的机会,并进行调整
备注:
客户签字:XX科技工程师签字:
WORD格式
WORD格式
二.健康检查及服务报告(服务器)
用户信息
客户名称:联系人:联系电话:
服务开始时间:服务结束时间:
维护记录
维护前设备情况描述:
维护后设备情况描述:
检查内容(机房环境及状况)
电源状况(220±20V)检查机器硬件配置,并打印检查HA软件的运行状况
机房温度(24℃±2℃)检查设备故障灯有无异常状况检查网络配置及性能情况机房湿度(50%±10%)检查系统错误日志及mail信息清除垃圾文件
零地电压(<1V)检查操作系统备份情况检查磁盘空间使用情况
卫生状况(灰尘)检查文件系统空间状况查看系统服务资料是否齐全
检查连线状况检查机器性能、CPU和内存交换区参数其它
检查内容(数据库运行情况)
检查日志文件和跟踪文件记录,确认所有数据库INSTANC运E行状态正常
检查数据文件状态及表空间的使用情况
检查用户的数据库备份及归档,验证用户备份的有效性
数据库系统健康检查:检查数据库有无无效的或者无用的数据库对象
检查数据库性能,寻找数据库性能调整的机会,并进行调整
其它
硬件维护记录
故障部件名称故障部件序列号完好部件序列号备注
服务情况反馈(由客户填写,若未填写,则默认为及时、接受或满意)
问题解决是否及时:非常及时及时不及时极慢
备件更换是否及时:非常及时及时不及时极慢
服务工程师的技术熟练程度:非常熟练熟练不太熟不懂
对工程师的服务态度是否满意:非常满意满意不满意极不满意
您认为我们的服务今后应改进些什么:
工程师签字:用户签字:
日期:日期: