XXIT运维监控管理平台建设方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
XXIT运维监控管理平台建设方案
IT运维监控管理平台建设方案XXXXXXX 目录第1章概述3 1.1 建设背景3 1.2 建设目标3 1.3 建设思路 4 第2章系统总体设计5 2.1 总体架构 5 2.2 设计原则6 2.3 运维管理体系架构设计7 2.3.1 系统总体架构设计7 2.3.2 监控采集层8 2.3.3 数据处理层8 2.3.4 运行展现层8 2.4 系统技术路线9 2.4.1 采用Java语言开发9 2.4.2 采用J2EE框架10 2.4.3 采用WebService进行数据互连互通10 2.4.4 数据库技术12 2.4.5 性能控制13 2.4.6 开发、运行环境13 2.5 应用接口总体设计13 2.5.1 系统内部集成接口13 2.5.2 与基础运维管理工具的集成接口14 2.5.3 与ITSM系统的集成接口14 2.5.4 与相关外部系统的统一身份认证与单点登录接口14 2.6 系统安全设计及部署15 2.6.1 输入检验15 2.6.2 GET请求和Cookie中的敏感数据15 2.6.3 防通过嵌入标记实现的攻击15 2.6.4 防口令猜测功能16 2.6.5 页面和字段级的权限控制16 2.6.6 系统安全架构16 第3章系统功能设计17 3.1 动环监控17 3.1.1 配电柜监测17 3.1.2 配电开关及电流监控17 3.1.3 发电机监控18 3.1.4 ATS监测18 3.1.5 STS监测18 3.1.6 UPS监控子系统19 3.2 统一门户子系统19 3.2.1 信息主管领导内容
展示20 3.2.2 运维人员内容展现20 3.2.3 一般用户内容展现21 3.3 IT运行监控子系统21 3.3.1 基础平台功能21 3.3.2 网络设备管理23 3.3.3 服务器监控管理26 3.3.4 存储监控管理29 3.3.5 数据库监控管理29 3.3.6 中间件监控管理30 3.3.7 web与应用监控管理31 3.3.8 虚拟化监控管理32 3.3.9 IP地址管理管理33 3.3.10 信息点管理34 3.3.11 告警监控管理与转发处理35 3.3.12 综合监控管理36 3.3.13 综合报表管理37 3.4 IT服务管理子系统38 3.4.1 功能特点38 3.4.2 服务台管理41 3.4.3 服务目录管理42 3.4.4 服务请求管理42 3.4.5 事件管理43 3.4.6 问题管理43 3.4.7 变更管理44 3.4.8 值班管理44 3.4.9 公告管理45 3.4.10 IT运维报告45 3.4.11 用户管理46 第4章培训方案46 第5章系统价值47 第6章售后服务47第1章概述1.1 建设背景随着近年来经济的进一步迅速发展,企事业机关单位IT运行环境日趋复杂,运行监控工作难度加大,尤其是随着信息化建设的不断深入,信息系统越来越多,各类系统越来越复杂,系统的关联度也越来越高。数据处理量成倍增长,而随着互联网应用的发展,网上应用系统也越来越多,使IT 系统运行环境变得更加复杂,造成了机房管理、系统监控、运行维护工作十分困难的局面。虽然信息中心各科室对已经有各的监控管理手段,但缺乏一个集中、统一的监控平台,及时发现与解决网络、硬件、安全设备、操作系
统、数据库、中间件、应用系统、机房空调、UPS 等突然出现的问题。因服务对象的不同,使用产品混杂。怎样很好地解决以上问题,把各种类型的监控对象进行统一集中监控,并将其格式统一规范,并对其有效处理、分析,以直观的界面展现给各科室管理员、领导,成为目前面临最大的挑战。
1.2 建设目标加强信息资源的维护平台建设,提高信息资源的运行管理水平,通过运维体系的建设,结合构建集中式的服务热线、运维流程、系统监控和综合展示系统,通过系统联动,及时、准确、全面反映与掌握信息系统的运行状态,保障各业务系统的正常运行,应达成如下目标:
(1) 强化主动监控,实现集中管理。
以IT资源可用性监控为主线,构建统一集成的IT资源及应用服务监控平台,能够主动、及时地发现问题,并调度资源解决问题,形成IT运维管理主动服务的新局面。
(2) 帮助定位故障,快速恢复系统运行。
建立集中的告警分析及展现平台,提供灵活、自动化的事件处理能力。当故障产生时,可以进行故障的快速定位,发现故障原因,调度资源快速恢复系统服务,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。
(3) 掌握运行质量与效率,合理利用资源。
建立IT运维平台后,可以实时了解全部IT资源的负载与使用情况,根据需要从整体角度考虑资源的使用,同时可以根
据业务高峰期的不同来调剂业务系统对资源的使用。
(4) 规范运行管理,有序开展维护。
参照ITIL规范,对运维管理工作进行优化,对服务管理进行改善,将管理数据电子化,管理过程规范化。根据相关制度进行运行维护管理,对内完善流程,对外提高服务,加强管理,使流程更规范更合理,使技术人员具备更高的工作效率,提高业务技术能力和解决实际问题的能力。
(5) 共享运维经验,完善知识库。
把运维过程中产生的丰富经验进行积累和总结,形成有效的知识库,建立知识的共享机制,提供信息共享和交流的平台,提高运维人员的工作效率。
1.3 建设思路IT运维管理理论、方法和标准,结合中心实际和建设需要,遵循立足需求、统一规划、保障重点、分步实施、务求实效的原则,建立一套融合组织、制度、流程、人员、技术的IT运维管理体系,建立组织机构,制定规章制度,规范管理流程,明确职责分工,强化技术支撑,实现对网络及信息系统的综合管理监控和日常技术支持,快速响应和及时解决信息系统运行过程中出现的各种问题和故障,确保所维护网络及信息系统正常、稳定、高效运行。
第2章系统总体设计2.1 总体架构依据对IT运维管理体系的建设经验,以及对用户信息系统现状、需求的分析,我们提出三位一体综合运维管理平台框架图如下:
IT运维管理平台包括:“IT运行集中监控、IT运维流程服务、统一运维门户”三个部分。底层基础平台主要实现对底层数据的采集、存储、分析等工作,为上层监控及流程系统提供基础数据;
IT运行监控主要完成对基础设施故障、性能、配置等方面的全面监控管理,实现主动式的IT管理;
IT运维流程服务主要根据IT服务管理的国际标准ISO2000,并结合ITIL最佳实践,梳理出了事件管理、问题管理、变更管理等运维流程,实现对日常运维工作的流程化、规划范管理,提升IT服务的质量。统一门户主要实现对监控信息、运维流程信息进行集中展示。平台三个子系统关系如下:
(1) 以IT运行监控为“基础” 这部分的功能主要是对被管对象运行的状态以及其配置资产信息进行统一监控、管理、分析,实现对各种故障和性能异常的及时报警,对系统运行性能进行实时监控,对系统运行的各种状态信息进行汇总、分析以及预测。另外,还包括对IT系统的全部配置资产情况进行统一管理,对配置信息的异动提供检查及告警。
IT监控管理除了实现网管的告警、性能、配置几大基本功能以外,还从运维的角度提供丰富的数据综合分析和运维工具,例如综合报表、综合监控、信息点管理等。
(2) 以IT服务管理为“导向” 这部分功能主要依据ITIL架构