机房运维手册范本
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
机房运维手册
目录
一、机房简介 (1)
二、维护容 (1)
三、维护具体需求 (1)
1、机房监控设备 (1)
2、机房空调与配电设备 (2)
3、消防设备的维护 (3)
4、电路及照明线路的维护 (3)
5、机房基础维护 (3)
6、机房主机设备维护 (3)
7、机房运维管理体系建设 (4)
四、维护服务质量 (4)
1、机房应急预案手册机房事故处理通则 (4)
2、故障类型 (4)
3、机房应急动力预案 (5)
一、机房简介
中心机房是各种计算机(其中包括PIII系列计算机,服务器)通过代理服务器与互连网连接构成的局域网。通常是指在一个物理空间实现对数据信息的集中处理、存储、传输、交换、管理,而计算机设备、服务器设备、网络设备、通讯设备、存储设备等通常认为是数据中心的关键设备。同时,数据信息作为一种资产的表征,从而具有交互性、动态性、完整性、脆弱性、安全性等的特征。
二、维护容
1.机房动力及环境监控的维护:视频监控门供配电监测系统、空调环境检测系统、门禁设备系统、漏水检测、保安监控设备(包含摄像头、硬盘录像机)、监控主机;
2. 机房空调与配电设备维护管理:精密空调机组、新风设备;UPS及电池、主配电柜、UPS配电柜;
3. 机房消防设备维护管理:各种探测器、手动报警按钮和报警控制器,灭火剂的控制装置;
4. 机房电路及照明线路的维护管理:电路管线及接口的检查维修;
5.机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、地板、墙面、吊顶、门窗及有关配套的维护管理;
6.机房主机设备维护管理:计算机服务器(包括PC服务器、存储服务器);网络设备(路由及交换设备等);
7.机房运维管理体系建设:完善机房运维规,优化机房运维体系。
三、维护具体需求
1、机房监控设备
1.1、每季度一次设备的除尘、清理,扫净监控设备显露的尘土,调整摄像头清
晰度,同时检查监控机房通风、散热、净尘、供电等设施。确保各部份设备各项功能良好,能够正常运行。
1.2、对容易老化的监控设备部件每月一次进行全面检查,一旦发现老化现象应及时更换、维修,如视频头、采集模块等。
1.3、对长时间工作的监控设备每月定期维护一次,如硬盘录像机长时间工作会产生较多的热量,一旦其电风扇有故障,会影响排热,以免硬盘录像机工作不正常。
1.4、对监控系统及设备的运行情况进行监控,分析运行情况,及时发现并排除故障。
1.5、提供每月一次的定期信息服务:每月第一个工作日,将上月抢修、维修、维护、保养记录表以电子文档的形式报送处领导。
2、机房空调与配电设备
2.1机房空调及新风维护
2.1.1 从空调系统的显示屏上检查空调系统的各项功能及参数是否正常
2.1.2 如有报警的情况要检查报警记录,并分析报警原因
2.1.3 检查温度、湿度传感器的工作状态是否正常
2.1.4 对压缩机和加湿器的运行参数要做到心中有数,特别是在每天早上的第一次巡检时,要把前一天晚上压缩机的运行参数和以前的同一时段的参数进行对比,看是否有大的变化,根据参数的变化可以判断计算机机房中的计算机设备运行状况是否有较大的变化,以便合理地调配空调系统的运行台次和调整空调的运行参数。
2.2 UPS及电池维护
测试及记录主机运行参数,
2.2.1检查风机及风道情况并清洁,主机外观清洁、部除尘;
2.2.2清洁系统主设备及电池等,
2.2.3查清各参数是否正确或切合实际,能及时发现事故隐患
2.2.4电气设备外壳用手触摸感觉温度异常高;
2.2.5检查有些电气设备的部有无声音异常;
2.2.6清理绝缘子表面沉积了污秽物质等;
3、消防设备的维护
3.1、检查火灾报警控制器的自检、消音、复位功能以及主备电源切换功能;
3.2、检查报警探测器、手动报警按钮、火灾警报装置外观;
3.3、储瓶间环境、气体瓶组或储罐、选择阀、驱动装置等组件外观;
3.4、应急灯和疏散指示标志工作状态。
3.5、火灾报警探测器、手动报警按钮、报警控制器、联动控制设备的试验报警
功能。
3.6、气体灭火控制设备的试验模拟自动启动
4、电路及照明线路的维护
4.1、镇流器、灯管更换;灯盘校正,开关更换,
4.2、线头氧化处理,标签巡查更换,漏保实验;
5、机房基础维护
5.1、吊顶表面清洁;板材松动、翘起修复,变形、损坏更换;龙骨调平等;
5.2、墙面污迹清理,裂缝修补;
5.3、玻璃清洗,不锈钢清洗,玻璃胶修整,地弹簧校正,拉手螺丝加固;5.4、静电地板清洗清洁,地面除尘;缝隙调整;平整度调整;损坏更换;5.5、机柜除尘、清洁;机柜及网络设备整理,包括交换机、配线架和网线的重
新整理、排序,并重新标上统一的编号;
6、机房主机设备维护
6.1、每日上午、下午对机房各设备进行全面巡检,及时发现故障设备并进行登
记处理;每日填写巡检日志;
6.2、每季度对机柜及机柜设备进行除尘清洁;
6.3、安装杀毒软件、病毒防火墙,定期为计算机查杀毒和病毒库升级服务;
7、机房运维管理体系建设
完善机房运维规,优化机房运维体系;
四、维护服务质量
1、机房应急预案手册机房事故处理通则
1.1、凡系统发生故障时,网管运行监控负责人必须立即组织抢修,不得拖延。
1.2、运行监控人员均应熟悉故障紧急处理流程,熟练掌握操作步骤和方法。
1.3、运行监控管理人员应如实上报故障情况,故障报告应当做到时间清、原因
清、结果清。
1.4、重大故障和严重故障要报上级业务主管领导。对已处理的重大故障和严重
故障,事后必须做故障分析,查清故障原因,确定故障性质和责任,采取防措施,避免同类故障再次发生。
1.5、故障处理基本原则:先重点后一般;先调通后维修。
2、故障类型
网管系统的故障等级共分三类:
2.1、重大故障
在系统运行期间,关键设备(包括传输或其它专业所属设备)、软件故障造成所有网管业务中断超过24小时。
2.2、严重故障
在系统运行期间,关键设备(包括传输或其它专业所属设备)、软件故障造成下列情况之一的系统故障:
(1)所有网管业务中断超过12小时但不超过24小时;
(2)网管个别业务中断超过24小时;
2.3、一般故障
除重大故障和严重故障外的其他故障。