数据中心基础设施管理系统DCIM整体方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据中心基础设施管理系统(DCIM)
整体方案
目录
1.项目概述及需求理解 (6)
1.1.项目背景简介 (6)
1.2.项目管理范围 (6)
1.3.项目建设原则 (7)
1.4.项目建设目标 (8)
1.5.解决方案概述 (9)
2.系统架构及实现原理 (13)
2.1.系统架构 (13)
2.1.1.采集层 (14)
2.1.2.处理层 (14)
2.1.3.管理层 (15)
2.1.4.交互展现层 (15)
2.2.系统集成 (16)
2.2.1.第三方集成 (16)
2.2.2.短信猫集成 (17)
2.2.3.短信网关集成 (17)
2.3.开发工具及技术介绍 (18)
2.3.1.自定义流程引擎 (18)
2.3.2.成熟的开发标准技术 (19)
2.3.3.分布式通讯调度 (19)
2.3.4.搜索引擎 (20)
3. DCIM系统功能实现 (21)
3.1.基础设施集中监控 (21)
3.1.1.UPS监控 (22)
3.1.2.蓄电池监测 (23)
3.1.3.配电参数监测 (25)
3.1.4.发电机监测 (26)
3.1.5.精密空调(加湿器)监控 (28)
3.1.6.环境监控(温湿度、风速、氢气) (29)
3.1.7.漏水检测 (30)
3.1.8.消防(极早期)监测 (31)
3.2.基础设施管理 (32)
3.2.1.资产管理 (32)
3.2.2.容量管理 (37)
3.2.3.能耗管理 (39)
3.3.集中展现 (42)
3.3.1.展现系统集中化 (42)
3.3.2.展现方式多样化 (49)
3.4.预警及告警 (51)
3.4.1.统一事件展现 (51)
3.4.2.监控指标库 (51)
3.4.3.故障管理 (52)
3.5.运维管理 (56)
3.5.1.服务台 (58)
3.5.2.个人工作台 (60)
3.5.3.值班管理 (63)
3.5.4.事件管理 (66)
3.5.5.问题管理 (69)
3.5.6.配置管理数据库 (74)
3.5.7.变更管理 (76)
3.5.8.服务级别管理 (78)
3.5.9.知识库管理 (84)
3.5.10.可视化流程设计 (88)
3.5.11.角色/权限管理 (94)
3.6.报表分析 (96)
3.6.1.监控报表 (96)
3.6.2.运维管理报表 (98)
1.项目概述及需求理解
1.1.项目背景简介
伴随着数据中心规模的不断扩大,业务量的逐渐增大,对数据中心的运维管理也变的越来越重要。一旦基础设施系统出现问题,而没有及时地得到妥善解决,常常会给企、事业造成很大的损失。怎样能7x24小时保证设备系统的正常运行,避免各种故障的发生,优化和改进传统的运维模式,提高客户服务的及时性和满意度就显得非常重要。
因此,建设一套数据中心基础设施管理系统势在必行。一个完备的运维管理系统能够提供7x24小时检测基础设施运行状态、各种资源状态的信息。运维管理人员依靠流程管理系统可以及时排除故障避免造成重大损失,控制运维质量提高服务水平。
1.2.项目管理范围
项目内容:
➢设施故障发现与警报;
➢记录日常运维日志信息;
➢设施故障统计;
➢设施软硬件信息统计;
➢服务进程管理;
➢将数据信息存储备份,并采用不同方式直观的展示出来;
➢服务人员绩效、考核管理;
➢将数据生成报表;
1.3.项目建设原则
数据中心基础设施管理系统建设指导思想是:“统一规划、分步实施、已有纳入、新建遵循”。
数据中心基础设施管理系统项目建设是要建设一个集中管控资源的运维平台,所以需充分考虑对已有各种产品组件做针对性的开发、整合工作。
在项目建设过程中,除满足系统功能需求外,遵循如下原则:
●安全性原则:系统设计注重安全方面的设计,确保系统的安全运行。系
统提供安全认证技术,确保登录身份认证安全性、有效性。
●稳定性原则:保证系统不间断运行,系统执行监控及操作任务时或出现
自身故障,绝不能影响被监控及操作对象的正常稳定运行。
●开放性原则:系统遵循行业主要的标准化组织所提供的标准或建议,采
用标准的、开放性的技术,能够实现与其他厂商的产品无缝地连接;采
用国际标准化组织及工业界广泛接受的有关标准和基于标准的通用软硬
件平台。
●可扩展性原则:在保持系统的基本体系结构长期稳定的前提下,可以有
效地容纳和支持基础设施规模的不断扩大和复杂、业务种类的增多。同
时,能够在应用体系结构和软件模块划分两个方面支持整个应用的良好
扩展性。在体系结构方面采用多层结构划分,实现各层的高聚合和层间
低耦合。尽量使用模块化和插件化,使得扩展时对原系统的影响最小化。
●用户体验优化原则:具有较高的易用性,界面友好,美观统一,并对人
机交互进行优化设计。
●灵活性原则:系统各子系统及子系统内功能模块具有一定的独立性,同
时具有系统相关性和整体一致性。系统提供自动化升级维护功能,系统
的维护及拓展灵活、方便。
●规范性原则:统一接口标准,规范数据字典。定义监控接入标准,规范
未来新建系统的监控。
1.4.项目建设目标
加强数据中心的维护平台建设,提高数据中心的运行管理水平,通过运维体系的建设,结合构建集中式的服务热线、运维流程、系统监控和综合展示系统,通过系统联动,及时、准确、全面反映与掌握数据中心的运行状态,保障各业务系统的正常运行,并达成如下目标:
(1) 强化主动监控,实现集中管理。
以设施资源可用性监控为主线,构建数据中心统一集成的设施资源及应用服务监控平台,能够主动、及时地发现问题,并调度资源解决问题,形成数据中心运维管理主动服务的新局面。
(2) 帮助定位故障,快速恢复系统运行。
建立集中的告警分析及展现平台,提供灵活、自动化的事件处理能力。当