企业级IT运维可视化监控管理平台技术方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
IT运维可视化监控
管理平台
技
术
方
案
2018年
目录
第1章概述 (1)
1.1 建设背景 (1)
1.2 建设目标 (1)
1.3 建设思路 (2)
第2章系统总体设计 (3)
2.1 总体架构 (3)
2.2 设计原则 (4)
2.3 运维管理体系架构设计 (5)
2.3.1 系统总体架构设计 (5)
2.3.2 监控采集层 (6)
2.3.3 数据处理层 (6)
2.3.4 运行展现层 (6)
2.4 系统技术路线 (7)
2.4.1 采用Java语言开发 (7)
2.4.2 采用J2EE框架 (8)
2.4.3 采用WebService进行数据互连互通 (8)
2.4.4 数据库技术 (10)
2.4.5 性能控制 (11)
2.4.6 开发、运行环境 (11)
2.5 应用接口总体设计 (11)
2.5.1 系统内部集成接口 (11)
2.5.2 与基础运维管理工具的集成接口 (12)
2.5.3 与ITSM系统的集成接口 (12)
2.5.4 与相关外部系统的统一身份认证与单点登录接口 (12)
2.6 系统安全设计及部署 (13)
2.6.1 输入检验 (13)
2.6.2 GET请求和Cookie中的敏感数据 (13)
2.6.3 防通过嵌入标记实现的攻击 (13)
2.6.4 防口令猜测功能 (14)
2.6.5 页面和字段级的权限控制 (14)
2.6.6 系统安全架构 (14)
第3章系统功能设计 (15)
3.1 动环监控 (15)
3.1.1 配电柜监测 (15)
3.1.2 配电开关及电流监控 (15)
3.1.3 发电机监控 (16)
3.1.4 ATS监测 (16)
3.1.5 STS监测 (16)
3.1.6 UPS监控子系统 (17)
3.2 统一门户子系统 (17)
3.2.1 信息主管领导内容展示 (18)
3.2.2 运维人员内容展现 (18)
3.2.3 一般用户内容展现 (19)
3.3 IT运行监控子系统 (19)
3.3.1 基础平台功能 (19)
3.3.2 网络设备管理 (21)
3.3.3 服务器监控管理 (24)
3.3.4 存储监控管理 (27)
3.3.5 数据库监控管理 (27)
3.3.6 中间件监控管理 (28)
3.3.7 web与应用监控管理 (29)
3.3.8 虚拟化监控管理 (30)
3.3.9 IP地址管理管理 (31)
3.3.10 信息点管理 (32)
3.3.11 告警监控管理与转发处理 (33)
3.3.12 综合监控管理 (34)
3.3.13 综合报表管理 (35)
3.4 IT服务管理子系统 (36)
3.4.1 功能特点 (36)
3.4.2 服务台管理 (39)
3.4.3 服务目录管理 (40)
3.4.4 服务请求管理 (40)
3.4.5 事件管理 (41)
3.4.6 问题管理 (41)
3.4.7 变更管理 (42)
3.4.8 值班管理 (42)
3.4.9 公告管理 (43)
3.4.10 IT运维报告 (43)
3.4.11 用户管理 (44)
第4章培训方案 (44)
第5章系统价值 (45)
第6章售后服务 (45)
第1章概述
1.1 建设背景
随着近年来经济的进一步迅速发展,企事业机关单位IT运行环境日趋复杂,运行监控工作难度加大,尤其是随着信息化建设的不断深入,信息系统越来越多,各类系统越来越复杂,系统的关联度也越来越高。
数据处理量成倍增长,而随着互联网应用的发展,网上应用系统也越来越多,使IT 系统运行环境变得更加复杂,造成了机房管理、系统监控、运行维护工作十分困难的局面。
虽然信息中心各科室对已经有各的监控管理手段,但缺乏一个集中、统一的监控平台,及时发现与解决网络、硬件、安全设备、操作系统、数据库、中间件、应用系统、机房空调、UPS 等突然出现的问题。
因服务对象的不同,使用产品混杂。怎样很好地解决以上问题,把各种类型的监控对象进行统一集中监控,并将其格式统一规范,并对其有效处理、分析,以直观的界面展现给各科室管理员、领导,成为目前面临最大的挑战。
1.2 建设目标
加强信息资源的维护平台建设,提高信息资源的运行管理水平,通过运维体系的建设,结合构建集中式的服务热线、运维流程、系统监控和综合展示系统,通过系统联动,及时、准确、全面反映与掌握信息系统的运行状态,保障各业务系统的正常运行,应达成如下目标:
(1)强化主动监控,实现集中管理。
以IT资源可用性监控为主线,构建统一集成的IT资源及应用服务监控平台,能够主动、及时地发现问题,并调度资源解决问题,形成IT运维管理主动服务的新局面。
(2)帮助定位故障,快速恢复系统运行。
建立集中的告警分析及展现平台,提供灵活、自动化的事件处理能力。当故障产生时,可以进行故障的快速定位,发现故障原因,调度资源快速恢复系统服
务,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。
(3)掌握运行质量与效率,合理利用资源。
建立IT运维平台后,可以实时了解全部IT资源的负载与使用情况,根据需要从整体角度考虑资源的使用,同时可以根据业务高峰期的不同来调剂业务系统对资源的使用。
(4)规范运行管理,有序开展维护。
参照ITIL规范,对运维管理工作进行优化,对服务管理进行改善,将管理数据电子化,管理过程规范化。根据相关制度进行运行维护管理,对内完善流程,对外提高服务,加强管理,使流程更规范更合理,使技术人员具备更高的工作效率,提高业务技术能力和解决实际问题的能力。
(5)共享运维经验,完善知识库。
把运维过程中产生的丰富经验进行积累和总结,形成有效的知识库,建立知识的共享机制,提供信息共享和交流的平台,提高运维人员的工作效率。
1.3 建设思路
IT运维管理理论、方法和标准,结合中心实际和建设需要,遵循立足需求、统一规划、保障重点、分步实施、务求实效的原则,建立一套融合组织、制度、流程、人员、技术的IT运维管理体系,建立组织机构,制定规章制度,规范管理流程,明确职责分工,强化技术支撑,实现对网络及信息系统的综合管理监控和日常技术支持,快速响应和及时解决信息系统运行过程中出现的各种问题和故障,确保所维护网络及信息系统正常、稳定、高效运行。