综合管理平台框架设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

综合管理平台框架设计

1综合管理平台设计思路

综合管理平台面向不同层次的工作人员,可以满足多角度的管理需求。综合管理平台基于ITIL的流程框架,能够帮助军队从人员、技术和流程三个方面提高IT运维能力,逐步建立并完善、达到以下目标:

标准化——通过ITIL的流程框架,构建最佳实践经验的IT运维流程。

流程化——把大部分的IT运维工作流程化,确保这些工作都可重复,确保

这些工作都能有质量完成。

自动化——替企业有效无误地完成一些日常工作,比如备份,杀毒等。

(一)面向基础设施的管理

(1)全面管理系统资源

提供对网络、主机、操作系统、存储设备、数据库、中间件及应用软件等IT资源的全面管理;包括纵向资源的配置与拓扑管理。

(2)性能管理与优化

面对网络、服务器、数据库、中间件系统等性能进行监控,建立性能处理的基线。定期提供性能报表和趋势表,可以根据趋势分析,提出性能优化的建议,如修改系统参数、系统扩容等。

(3)故障管理

提供一个集中管理故障和事件的中心,能够收集各种管理功能产生的故障事件(例如:网络事件、主机事件、存储备份事件、安全事件等)。完成故障事件收集、过滤、关联和处理等工作,以实现对故障的快速处理。

(二)面向维护管理者

(1)运维服务管理

运维服务管理基于人与流程的结合,提供方便,灵活工作流程的管理功能,使工作人员维护管理工作的自动化和信息化,其中包括帮助台、事件、问题、变更、配置管理以及值班管理等根据客户量身定制的业务管理功能;

(2)资源监控

通过实时动态视图显示管理系统的实际数据,一目了然地看到当前系统的运行状态及趋势。可以综合监控IT 系统中各种资源的实时状态和性能信息等所有运行情况,帮助管理人员快速发现问题,分析和确定问题所在;

(3)知识库

使工程师在处理系统故障的时候,能够参考相关故障处理的方法,让有较低技术水平的工程师也能够进行系统维护,从而降低运维管理对个人的依赖。(三)面向领导决策者

(1)综合报表

对系统运行状况信息进行汇总,并以图表的方式为管理人员提供直观的分析结果,帮助领导更全面的了解网络、主机、数据库、应用系统的运行状况和运行趋势,为领导决策提供支持信息。

(2) 视频监控数据、地理信息、视频会议信息、路由情况、即时通信网络情况等的及时获取,方便领导根据信息做出决策。

2综合管理平台设计架构

综合管理平台服务方案由网络管理NCC、业务应用管理BCC、安全管理SCC、桌面管理DCC 及集中运行管理COSS 五大部分组成。

(一) 网络监控(NCC)

(1)自动、准确、及时地发现各类异构复杂网络的拓扑结构

(2)可持续地监视、报告网络的运行情况

(3)提供网络运行状态和性能的多角度分析与统计

(4)拦截非法接入,保障网络系统安全

(5)监控异常流量及ARP 欺骗等病毒

(二) 应用监控(BCC)

(1)资源监测子系统

监控企业的服务器、中间件、数据库、业务应用、安全设备及基础支撑系统(如机房、空调、UPS 等)的运行状况;建立性能基线;发现系统异常并及时告警。

(2)运行展现子系统

围绕IT 业务和IT 资源,采用人性化多层导航呈现模式,由全局到局部、由粗线条到细颗粒度地逐层展现业务应用的运行状况。

(三) 安全监控(SCC)

(1)对各类安全设备告警事件进行采集和跨类型、跨厂商的分析

(2)可将处理后的告警信息自动精确关联到安全知识库

(3)实时的、翔实的、准确的呈现告警事件及信息

(四) 桌面监控(DCC)

(1)桌面资产统一管理

(2)桌面安全策略的强制执行

(3)终端用户行为审计

(4)补丁发布

(5)实现用户桌面系统的标准化

(五) 集中运行管理(COSS)

(1)IT 资源监测结果综合展现

(2)提供各种报表和视图,呈现IT 资源的运行状况和运行趋势

(3)运维流程化管理

(4)知识库管理

3综合管理平台功能设计

(一)实现对网络的管理

(1) 网络拓扑发现

■自动、准确、及时发现各类大型网络的拓扑结构,持续监视、报告

网络的运行情况。

■直观和自定义化的界面拓扑呈现。

(2) 网络异常监测

通过监测网络系统的各项运行参数,全面全面掌控网络的异常和性能情况,发现异常及时告警。

■ 设备故障与链路阻断告警

■ 设备与链路性能告警

■异常流量告警,如病毒爆发、BT 下载等

(3) 终端合法性监控

内置设备合法性监测引擎,自动监测网内终端设备的基本属性,自动比对资源表,告警非法终端设备。

(4) 网络链路管理

(5) 统计报表

提供了性能、告警、状态、资源多个角度的统计和分析报表。

(二)对业务应用的管理

(1)资源监控

系统不仅能够对网络中的服务器、网络设备进行监测,同时还具有强大的应用监测功能。组合使用它们可以对Email、DNS、FTP、ERP、CRM、MIS、中间件、电子商务等应用系统从应用可用性、系统资源占用和性能指标三个层面进行全面深入的监测管理。

⏹业务系统监测

⏹服务器监测

⏹数据库监测

⏹中间件与群件管理

⏹基础应用监测

⏹存储监测

⏹扩展接口

(2)运行展现

⏹全局展现

⏹全局的健康排名

⏹服务器节点展现

⏹服务器节点展现

(三)运维流程管理

运维流程化管理系统提供了简洁直观地界面,将当前环境的运行情况直观地呈现给值班员,实现服务器、事件管理、问题管理、变更管理、配置管理等服务支撑管理功能。

⏹服务台

服务台能够确保用户找到帮助其解决问题和请求的相关人员。服务台不

仅负责处理事故、问题和客户的询问,同时还为其它活动和流程提供接

口。包括客户变更请求、维护合同、服务级别管理、配置管理、可用性

管理和持续性管理等。

⏹事件管理

所谓事件,是指数据中心IT 运行维护范围内的所有与IT 基础架构和应

用相关的故障报告。这个流程是为了使业务部门和最终客户尽快回到正

常工作状态而设计的。它是事件驱动的,所关心的是对事件的响应速度

和和尽快恢复业务运作。

⏹问题管理

问题管理强调的是找出事故产生的根源,从而制定恰当的解决方案或防

止其再次发生的预防措施。问题管理的主要目标是找到用户IT 系统所

存在的问题、防止事件发生,提升帮助台/事件管理的一线事件/故障解决

率,提升整体服务质量和客户满意度。

⏹变更管理

变更是指环境的各要素(如网络基础设施、主机及操作系统、数据库和

应用软件等)的变动和更改的一切活动。变更管理是指从变更请求的处

理、变更的批准、变更的准备、变更的实施、变更实施后的确认或拒绝、恢复管理、变更的控制和跟踪、发布变更结果,到最终形成变更管理报

告的一系列管理过程和活动。

⏹配置管理

配置管理指对生产环境中的软硬件资产、配置信息及各配置项的相互关

系进行记录,形成集中的配置管理数据库(CMDB),并对生产环境中的

配置信息进行定期审计,以保证配置管理系统中的数据与实际生产环境

一致。

⏹日常作业管理

日常作业管理是指对生产系统的日常运行维护工作进行管理,是信息系

统运维的一些周期性的、相对固定的日常维护作业的管理。其主要目的

是规范日常作业计划、规范日常作业内容、规范维护人员的维护行为、

为人员考核提供基础数据。

⏹知识库管理

相关文档
最新文档