IDC机房运维管理办法 ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 罗伯特•希斯(Robert L. Heath)的《危机管理》 (Crisis Management for Managers and Executives):
– 管理者考虑如何减少危机情境的发生、如何做好危机 管理的准备、如何规划以及如何培训员工应对危机局 面、如何从危机中很快复原。
IDC机房运维管理办法
• 进入机房不得带拷贝工具和便携机 • 机房内所有服务器应设有开机密码、系统登录密码 • 机房内所有服务器都应设有带密码的屏幕保护 • 非网管人员不得私自操作任何服务器
IDC机房运维管理办法
• 涉及政务、金融、高科技、网上交易 • 定期集中销毁废弃的涉密纸、物 • 非机房工作人员在机房工作时必须有机房值班人员陪同 • 机房内各类服务器应由专人分类管理 • 建立设备、资料责任制
一. 值班制度 二. 巡视制度 三. 日常管理制度 四. 运行维护制度 五. 安全保密制度
IDC机房运维管理办法
• 机房昼夜要有人值班 • 值班人员要遵守值班守则 • 值班守则
IDC机房运维管理办法
1. 机房环境的巡视 2. 机房设备的巡视
IDC机房运维管理办法
• 机房门窗的关闭情况 • 机房的卫生状况 • 机房的灯光状况 • 机房的空气清新度状况
IDC机房运维管理办法
– 附件 《 机房运行管理制度》
IDC机房运维管理办法
• 史蒂文•芬克(Steven Fink)的《危机管理》(Crisis Management-Planning for the inevitable):
– 组织对所有危机发生因素的预测、分析、化解、防范 等等而采取的行动。
IDC机房运维管理办法
• 机房要设有门禁 • 机房门禁7X24小时保持运行 • 机房门禁的2个作用 • 机房工作人员需持卡进入机房 • 非机房工作人员进入机房需登记
IDC机房运维管理办法
• 防雷击 • 防火、防水 • 防盗 • 防虫害
IDC机房运维管理办法
• 防入侵 • 防病毒 • 涉密网
IDC机房运维管理办法
IDC机房运维管理办法
• 配电柜一年进行至少2次维护检查 • UPS一年进行2次巡检 • 机房专用空调每月进行一次巡检 • 新风机每年2次维护 • 空气净化器每季度维护一次 • 机房消防系统每年一次检测 • 机房防雷设施每年一次检测 • 机房每年进行2次保洁
IDC机房运维管理办法
• 1. 门禁管理 • 2. 防雷击、防火、防水、防盗、防虫害 • 3. 网络运行安全管理 • 4. 系统设备安全管理 • 5. 认真遵守国家的各项保密制度
• 提高可靠性:降低故障率 • 提高可用性:减少宕机时间 • 提高安全性:减少灾害 • 提高经济性:增长设备寿命
IDC机房运维管理办法
• 人员技能的提高
– 技术培训 – 经验交流
IDC机房运维管理办法
• 制度流程的建立、执行
– 机房运维制度的建立 – 机房运维制度的执行 – 管理机制
IDC机房运维管理办法
IDC机房运维管理办法
• 故障预测:防止故障的发生 • 故障报警:缩短故障恢复时间
IDC机房运维管理办法
故障预防
• Prevention(预防)
– 观念、流程
• Preparation(准备)
– 人力物力资源
• Response(响应)
– 应急预案,消除危机的短期影响
• Recovery(恢复)
– 经验总结,消除危机带来的中长期影响
Hale Waihona Puke Baidu
IDC机房运维管理办法
• 事前“马后炮”
– “一旦发生XX事故,管理员应该在XX分钟之 内采取以下措施:一、XX;二、XX;。。。”
– 纵向分级:按各类风险的大小和威胁程度排序,从而建立起风险 管理的优先顺序。比如可将IT系统宕机定为I级风险,而将室温升 高定为II级风险,将湿度过低定为III级风险。
IDC机房运维管理办法
• 第五步:设计针对这些风险的预先和应急处理措 施
– 1.对可以预见且时间和资源允许处理的风险,采取排出 和缩减。
IDC机房运维管理办法
• “危机处理机构组织结构图”的建立
– 预先协调跨部门的资源
• “危机应对表”
– 管理人员根据对各种可能出现的危机设想, 设计出的应对措施。
IDC机房运维管理办法
• 环境监控
– 机房电力质量监测 – 机房温度监测 – 机房湿度监测 – 新风风量监测
• IT微环境监测
– 机架电力质量监测 – 机架温度监测 – 机架湿度监测
IDC机房运维管理办法
• 对网络运行保障设施要经常巡视 • 巡视供电系统、UPS、电池 • 巡视空调的工作状况 • 巡视新风机和空气净化器的工作状况 • 巡视消防报警系统
IDC机房运维管理办法
• 经常注意保持机房的环境卫生 • 不得将食品、饮品带入机房 • 机房内禁止吸烟 • 不得在机房内乱扔物品
IDC机房运维管理办法
• 第一步:列出危机或称风险
– 例如,IT系统宕机、火灾、空调漏水、机房温度超高等。
• 第二步:排除不存在的风险 • 第三步:将各种风险列举在应急预案的风险目录 • 第四步:横向分类与纵向分级
– 横向分类:将目录中类似的风险进行分类,比如可将机房的风险 划分为的灾难风险(如火灾)、生产中断风险(如宕机)、安全 隐患风险(室温过高、接地不良)、财产风险和人力资源风险等 等。
idc wenku1
IDC机房运行维护管理
IDC机房运维管理办法
• 运行维护管理的意义
– 提高可靠性 – 提高可用性 – 提高安全性 – 提高经济性
• 运行维护管理的本质
– 人员技能的提高(技术的掌握) – 制度流程的建立、执行
• 运行维护管理的技术手段
– 环境监控 – 设备监控
IDC机房运维管理办法
– 2.对可以预见但可能发生概率较低的风险,可以进行风 险转移。如,将火灾风险转移给保险公司,将UPS停 机风险转移给UPS厂商或UPS服务商。
– 3.对现在没有表现出来,但其爆发总存在一定征兆的风 险,采取建立预警系统对其监控。
– 4.对那些发生时间完全不可预测的风险,则必须建立起 一个协调人力资源的“危机处理机构组织结构图”以 及一个指导人员操作的“危机应对表”,使运维管理 人员和相关部门、人员能够在危机发生时有组织地、 按部就班地执行。
– 管理者考虑如何减少危机情境的发生、如何做好危机 管理的准备、如何规划以及如何培训员工应对危机局 面、如何从危机中很快复原。
IDC机房运维管理办法
• 进入机房不得带拷贝工具和便携机 • 机房内所有服务器应设有开机密码、系统登录密码 • 机房内所有服务器都应设有带密码的屏幕保护 • 非网管人员不得私自操作任何服务器
IDC机房运维管理办法
• 涉及政务、金融、高科技、网上交易 • 定期集中销毁废弃的涉密纸、物 • 非机房工作人员在机房工作时必须有机房值班人员陪同 • 机房内各类服务器应由专人分类管理 • 建立设备、资料责任制
一. 值班制度 二. 巡视制度 三. 日常管理制度 四. 运行维护制度 五. 安全保密制度
IDC机房运维管理办法
• 机房昼夜要有人值班 • 值班人员要遵守值班守则 • 值班守则
IDC机房运维管理办法
1. 机房环境的巡视 2. 机房设备的巡视
IDC机房运维管理办法
• 机房门窗的关闭情况 • 机房的卫生状况 • 机房的灯光状况 • 机房的空气清新度状况
IDC机房运维管理办法
– 附件 《 机房运行管理制度》
IDC机房运维管理办法
• 史蒂文•芬克(Steven Fink)的《危机管理》(Crisis Management-Planning for the inevitable):
– 组织对所有危机发生因素的预测、分析、化解、防范 等等而采取的行动。
IDC机房运维管理办法
• 机房要设有门禁 • 机房门禁7X24小时保持运行 • 机房门禁的2个作用 • 机房工作人员需持卡进入机房 • 非机房工作人员进入机房需登记
IDC机房运维管理办法
• 防雷击 • 防火、防水 • 防盗 • 防虫害
IDC机房运维管理办法
• 防入侵 • 防病毒 • 涉密网
IDC机房运维管理办法
IDC机房运维管理办法
• 配电柜一年进行至少2次维护检查 • UPS一年进行2次巡检 • 机房专用空调每月进行一次巡检 • 新风机每年2次维护 • 空气净化器每季度维护一次 • 机房消防系统每年一次检测 • 机房防雷设施每年一次检测 • 机房每年进行2次保洁
IDC机房运维管理办法
• 1. 门禁管理 • 2. 防雷击、防火、防水、防盗、防虫害 • 3. 网络运行安全管理 • 4. 系统设备安全管理 • 5. 认真遵守国家的各项保密制度
• 提高可靠性:降低故障率 • 提高可用性:减少宕机时间 • 提高安全性:减少灾害 • 提高经济性:增长设备寿命
IDC机房运维管理办法
• 人员技能的提高
– 技术培训 – 经验交流
IDC机房运维管理办法
• 制度流程的建立、执行
– 机房运维制度的建立 – 机房运维制度的执行 – 管理机制
IDC机房运维管理办法
IDC机房运维管理办法
• 故障预测:防止故障的发生 • 故障报警:缩短故障恢复时间
IDC机房运维管理办法
故障预防
• Prevention(预防)
– 观念、流程
• Preparation(准备)
– 人力物力资源
• Response(响应)
– 应急预案,消除危机的短期影响
• Recovery(恢复)
– 经验总结,消除危机带来的中长期影响
Hale Waihona Puke Baidu
IDC机房运维管理办法
• 事前“马后炮”
– “一旦发生XX事故,管理员应该在XX分钟之 内采取以下措施:一、XX;二、XX;。。。”
– 纵向分级:按各类风险的大小和威胁程度排序,从而建立起风险 管理的优先顺序。比如可将IT系统宕机定为I级风险,而将室温升 高定为II级风险,将湿度过低定为III级风险。
IDC机房运维管理办法
• 第五步:设计针对这些风险的预先和应急处理措 施
– 1.对可以预见且时间和资源允许处理的风险,采取排出 和缩减。
IDC机房运维管理办法
• “危机处理机构组织结构图”的建立
– 预先协调跨部门的资源
• “危机应对表”
– 管理人员根据对各种可能出现的危机设想, 设计出的应对措施。
IDC机房运维管理办法
• 环境监控
– 机房电力质量监测 – 机房温度监测 – 机房湿度监测 – 新风风量监测
• IT微环境监测
– 机架电力质量监测 – 机架温度监测 – 机架湿度监测
IDC机房运维管理办法
• 对网络运行保障设施要经常巡视 • 巡视供电系统、UPS、电池 • 巡视空调的工作状况 • 巡视新风机和空气净化器的工作状况 • 巡视消防报警系统
IDC机房运维管理办法
• 经常注意保持机房的环境卫生 • 不得将食品、饮品带入机房 • 机房内禁止吸烟 • 不得在机房内乱扔物品
IDC机房运维管理办法
• 第一步:列出危机或称风险
– 例如,IT系统宕机、火灾、空调漏水、机房温度超高等。
• 第二步:排除不存在的风险 • 第三步:将各种风险列举在应急预案的风险目录 • 第四步:横向分类与纵向分级
– 横向分类:将目录中类似的风险进行分类,比如可将机房的风险 划分为的灾难风险(如火灾)、生产中断风险(如宕机)、安全 隐患风险(室温过高、接地不良)、财产风险和人力资源风险等 等。
idc wenku1
IDC机房运行维护管理
IDC机房运维管理办法
• 运行维护管理的意义
– 提高可靠性 – 提高可用性 – 提高安全性 – 提高经济性
• 运行维护管理的本质
– 人员技能的提高(技术的掌握) – 制度流程的建立、执行
• 运行维护管理的技术手段
– 环境监控 – 设备监控
IDC机房运维管理办法
– 2.对可以预见但可能发生概率较低的风险,可以进行风 险转移。如,将火灾风险转移给保险公司,将UPS停 机风险转移给UPS厂商或UPS服务商。
– 3.对现在没有表现出来,但其爆发总存在一定征兆的风 险,采取建立预警系统对其监控。
– 4.对那些发生时间完全不可预测的风险,则必须建立起 一个协调人力资源的“危机处理机构组织结构图”以 及一个指导人员操作的“危机应对表”,使运维管理 人员和相关部门、人员能够在危机发生时有组织地、 按部就班地执行。