系统健康检查服务方案知识分享
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设备健康检查计划
XX集团股份有限公司
2009年
目录
前言 (3)
1. 服务概况 (3)
1.1 客户名称 (3)
1.2 服务时间 (3)
1.3 服务设备 (3)
1.4 服务内容 (3)
2. 服务前期准备工作 (4)
2.1XXX巡检服务的前期准备工作: (4)
2.2 客户方的前期准备工作: (4)
2.3 双方待讨论和协商的问题: (4)
3. 服务具体计划 (4)
4. 应急计划 (5)
5.备件计划 (6)
6. 文档信息 (6)
附录 (7)
SUN系统巡检报告及相关命令说明 (7)
ORACLE数据库巡检报告及相关命令说明 (7)
系统配置信息 (7)
ORACLE 数据库系统维护检查报告 (12)
前言
感谢尊敬的广东XXX用户选择了XXX的服务,XXX公司秉承用户至上宗旨,坚持以技术为先导,严格按照项目流程和规范管理服务项目,竭诚为用户提供一流优质的服务。
本文档的主要内容是对客户信息系统进行系统健康检查(简称:巡检)的计划安排。包括服务概况、服务前期准备工作、服务具体计划、应急计划等等。
1. 服务概况
1.1 客户名称
广东XXX
1.2 服务时间
待定
1.3 服务设备
见设备清单
1.4 服务内容
系统健康检测维护服务的目的在于了解被巡检系统截至到目前系统的性能状态和存在的隐患和运行风险;
检查系统的运行状况、系统配置和连接方式、系统设置的情况、系统使用环境的及系统的日志文件,进行系统的自检和检测,分析已经发现的和潜在的问题,建议必要的措施,提高系统的可用性和可靠性。内容包括如下:
✓检查设备使用环境是否符合要求和发生显著变更,包括湿度、电压、湿度、摆设位置等
✓检查电源,信号线的连接是否牢固;检查、清洁、调节系统硬件,并为需要的设备更换元件;检查系统的硬件和系统环境配置及网络环境配置;针对客户系统现状,提出建议和意见。
✓查阅有关系统信息,检查有无出错信息,如发现出错信息,设法了解问题原因,并后续给出问题的可能原因和解决建议。
✓进行系统分析和检测,及时掌握系统的运行和安全状况,发现系统潜在问题,排除故障隐患和安全漏洞。
✓在完成系统健康检测后,XXX服务工程师将会同XXX技术专家团队一起分析系统状况,并内向客户提交巡检分析报告和有关改进措施建议。
2. 服务前期准备工作
2.1XXX巡检服务的前期准备工作:
1.负责提交巡检方案,获得客户认可
2.负责准备巡检报告模板2份,巡检报告模板请见附录。(注:一机一份,巡检完毕后,现场提交用户)
3.提供服务的工程师在约定时间准时到达现场
2.2 客户方的前期准备工作:
1.负责环境、场地、电源、网线、终端设备等准备工作。
2.负责提供系统主机Root登陆口令(清单)。
3.负责提供系统设备IP地址(清单)。
4.负责下电设备的加电准备工作
5.负责确定下电设备加电后的连网情况
2.3 双方待讨论和协商的问题:
1.Root口令以何种方式提供?
一般可采取两种方式,一是每台设备由客户来输入Root口令,另外一种方式是由客户事先临时修改Root口令,提供给服务工程师,巡检完毕后再由客户改回。
2.下电设备加电后,是否仍然具备连网条件?
如果下电设备加电后不连接网络,则需要采取串口直接连接主机的方式来进行巡检,可能会影响巡检整体速度。
3.确定巡检主机顺序?
系统健康检测不会影响在线设备的运行。
建议巡检顺序为,首先用一台终端依次检测所有连网设备,包括加电后能连网的设备,其次检测所有加电后无法连网的设备。
3. 服务具体计划
4.应急计划
本次巡检服务中的设备为在线系统,理论上讲,巡检只是对系统状态进行查看,本身不会对系统产生影响,只是在极少数情况下,系统本身已经有故障隐患,因为巡检触发,可能会影响系统的运行,必须通过事先充分准备,识别可能的风险,并进行规避和控制。通过以下方法来尽可能减少风险:
✓服务工程师在开始实施巡检时,应首先向客户了解自前一次维护服务以来所发现的异常和问题,并采取必要的措施
✓在对系统采取任何行动之前,应确保已经采取必要的数据信息保护措施,如系统的备份或数据转存等;
✓服务工程师在巡检过程中记录操作步骤,一旦发生突发问题,也有据可查,方便问题的定位。
✓服务工程师在巡检过程中如果发现设备有重大问题,必须尽快进行处理的事件,由现场巡检工程师向本次用户通报,由用户同XXX服务销售进行协商进行处理。5.备件计划
针对本次健康检查服务,我方主要提供对SUN系统以及ORACLE数据库的检查服务为主,如果在检查过程中,发现有备件坏,我们会第一时间跟用户通报,并从XXX广州备件库调相应备件进行更换;
如果备件更换处于合同覆盖范围,我们将不收取备件费用,如果合同未覆盖,我们将收取备件物料成本费;
6. 文档信息
本文档由XXX负责起草
附录
SUN系统巡检报告及相关命令说明ORACLE数据库巡检报告及相关命令说明系统配置信息
SUN系统巡检报告
SUN主机巡检相关命令及说明
存储及冗余软件相关检查及其命令
ORACLE 数据库系统维护检查报告
报告编号:
结论:
1、alert文件:
有无错误?
2、表空间使用情况:
set linesize 300
SELECT upper(f.tablespace_name) "tablespace_name",
d.Tot_grootte_Mb "tablespace(M)",
d.Tot_grootte_Mb - f.total_bytes "used(M)",
round((d.Tot_grootte_Mb - f.total_bytes) / d.Tot_grootte_Mb * 100,2) "use%",
f.total_bytes "free_space(M)",
round(f.total_bytes / d.Tot_grootte_Mb * 100,2) "free%"
FROM
(SELECT tablespace_name,
round(SUM(bytes)/(1024*1024),2) total_bytes,
round(MAX(bytes)/(1024*1024),2) max_bytes
FROM sys.dba_free_space
GROUP BY tablespace_name) f,
(SELECT dd.tablespace_name, round(SUM(dd.bytes)/(1024*1024),2) Tot_grootte_Mb
FROM sys.dba_data_files dd
GROUP BY dd.tablespace_name) d
WHERE d.tablespace_name = f.tablespace_name
ORDER BY 4 DESC
/
3、Shared Pool Size 命中率:
select round((sum(gets)-sum(reloads))/sum(gets)*100,1) "libiary cache hit ratio %" from v$librarycache where namespace
in ('SQL AREA','TABLE/PROCEDURE','BODY','TRIGGER');
4、数据字典命中率:
select round((1-sum(getmisses)/sum(gets))*100,1) "data dictionary hit ratio %" from v$rowcache;
5、锁竞争:
select substr(,1,25) Name,
l.gets, l.misses,
100*(l.misses/l.gets) "% Ratio (STAY UNDER 1%)"