综合管理平台框架设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
综合管理平台框架设计
1综合管理平台设计思路
综合管理平台面向不同层次的工作人员,可以满足多角度的管理需求。综合管理平台基于ITIL的流程框架,能够帮助军队从人员、技术和流程三个方面提高IT运维能力,逐步建立并完善、达到以下目标:
标准化——通过ITIL的流程框架,构建最佳实践经验的IT运维流程。
流程化——把大部分的IT运维工作流程化,确保这些工作都可重复,确保
这些工作都能有质量完成。
自动化——替企业有效无误地完成一些日常工作,比如备份,杀毒等。
(一)面向基础设施的管理
(1)全面管理系统资源
提供对网络、主机、操作系统、存储设备、数据库、中间件及应用软件等IT资源的全面管理;包括纵向资源的配置与拓扑管理。
(2)性能管理与优化
面对网络、服务器、数据库、中间件系统等性能进行监控,建立性能处理的基线。定期提供性能报表和趋势表,可以根据趋势分析,提出性能优化的建议,如修改系统参数、系统扩容等。
(3)故障管理
提供一个集中管理故障和事件的中心,能够收集各种管理功能产生的故障事件(例如:网络事件、主机事件、存储备份事件、安全事件等)。完成故障事件收集、过滤、关联和处理等工作,以实现对故障的快速处理。
(二)面向维护管理者
(1)运维服务管理
运维服务管理基于人与流程的结合,提供方便,灵活工作流程的管理功能,使工作人员维护管理工作的自动化和信息化,其中包括帮助台、事件、问题、变更、配置管理以及值班管理等根据客户量身定制的业务管理功能;
(2)资源监控
通过实时动态视图显示管理系统的实际数据,一目了然地看到当前系统的运行状态及趋势。可以综合监控IT 系统中各种资源的实时状态和性能信息等所有运行情况,帮助管理人员快速发现问题,分析和确定问题所在;
(3)知识库
使工程师在处理系统故障的时候,能够参考相关故障处理的方法,让有较低技术水平的工程师也能够进行系统维护,从而降低运维管理对个人的依赖。(三)面向领导决策者
(1)综合报表
对系统运行状况信息进行汇总,并以图表的方式为管理人员提供直观的分析结果,帮助领导更全面的了解网络、主机、数据库、应用系统的运行状况和运行趋势,为领导决策提供支持信息。
(2) 视频监控数据、地理信息、视频会议信息、路由情况、即时通信网络情况等的及时获取,方便领导根据信息做出决策。
2综合管理平台设计架构
综合管理平台服务方案由网络管理NCC、业务应用管理BCC、安全管理SCC、桌面管理DCC 及集中运行管理COSS 五大部分组成。
(一) 网络监控(NCC)
(1)自动、准确、及时地发现各类异构复杂网络的拓扑结构
(2)可持续地监视、报告网络的运行情况
(3)提供网络运行状态和性能的多角度分析与统计
(4)拦截非法接入,保障网络系统安全
(5)监控异常流量及ARP 欺骗等病毒
(二) 应用监控(BCC)
(1)资源监测子系统
监控企业的服务器、中间件、数据库、业务应用、安全设备及基础支撑系统(如机房、空调、UPS 等)的运行状况;建立性能基线;发现系统异常并及时告警。
(2)运行展现子系统
围绕IT 业务和IT 资源,采用人性化多层导航呈现模式,由全局到局部、由粗线条到细颗粒度地逐层展现业务应用的运行状况。
(三) 安全监控(SCC)
(1)对各类安全设备告警事件进行采集和跨类型、跨厂商的分析
(2)可将处理后的告警信息自动精确关联到安全知识库
(3)实时的、翔实的、准确的呈现告警事件及信息
(四) 桌面监控(DCC)
(1)桌面资产统一管理
(2)桌面安全策略的强制执行
(3)终端用户行为审计
(4)补丁发布
(5)实现用户桌面系统的标准化
(五) 集中运行管理(COSS)
(1)IT 资源监测结果综合展现
(2)提供各种报表和视图,呈现IT 资源的运行状况和运行趋势
(3)运维流程化管理
(4)知识库管理
3综合管理平台功能设计
(一)实现对网络的管理
(1) 网络拓扑发现
■自动、准确、及时发现各类大型网络的拓扑结构,持续监视、报告
网络的运行情况。
■直观和自定义化的界面拓扑呈现。
(2) 网络异常监测
通过监测网络系统的各项运行参数,全面全面掌控网络的异常和性能情况,发现异常及时告警。
■ 设备故障与链路阻断告警
■ 设备与链路性能告警
■异常流量告警,如病毒爆发、BT 下载等
(3) 终端合法性监控
内置设备合法性监测引擎,自动监测网内终端设备的基本属性,自动比对资源表,告警非法终端设备。
(4) 网络链路管理
(5) 统计报表
提供了性能、告警、状态、资源多个角度的统计和分析报表。
(二)对业务应用的管理
(1)资源监控
系统不仅能够对网络中的服务器、网络设备进行监测,同时还具有强大的应用监测功能。组合使用它们可以对Email、DNS、FTP、ERP、CRM、MIS、中间件、电子商务等应用系统从应用可用性、系统资源占用和性能指标三个层面进行全面深入的监测管理。
⏹业务系统监测
⏹服务器监测
⏹数据库监测
⏹中间件与群件管理
⏹基础应用监测
⏹存储监测
⏹扩展接口
(2)运行展现
⏹全局展现
⏹全局的健康排名
⏹服务器节点展现
⏹服务器节点展现
(三)运维流程管理
运维流程化管理系统提供了简洁直观地界面,将当前环境的运行情况直观地呈现给值班员,实现服务器、事件管理、问题管理、变更管理、配置管理等服务支撑管理功能。
⏹服务台
服务台能够确保用户找到帮助其解决问题和请求的相关人员。服务台不
仅负责处理事故、问题和客户的询问,同时还为其它活动和流程提供接
口。包括客户变更请求、维护合同、服务级别管理、配置管理、可用性
管理和持续性管理等。
⏹事件管理
所谓事件,是指数据中心IT 运行维护范围内的所有与IT 基础架构和应
用相关的故障报告。这个流程是为了使业务部门和最终客户尽快回到正
常工作状态而设计的。它是事件驱动的,所关心的是对事件的响应速度
和和尽快恢复业务运作。
⏹问题管理
问题管理强调的是找出事故产生的根源,从而制定恰当的解决方案或防
止其再次发生的预防措施。问题管理的主要目标是找到用户IT 系统所
存在的问题、防止事件发生,提升帮助台/事件管理的一线事件/故障解决
率,提升整体服务质量和客户满意度。
⏹变更管理
变更是指环境的各要素(如网络基础设施、主机及操作系统、数据库和
应用软件等)的变动和更改的一切活动。变更管理是指从变更请求的处
理、变更的批准、变更的准备、变更的实施、变更实施后的确认或拒绝、恢复管理、变更的控制和跟踪、发布变更结果,到最终形成变更管理报
告的一系列管理过程和活动。
⏹配置管理
配置管理指对生产环境中的软硬件资产、配置信息及各配置项的相互关
系进行记录,形成集中的配置管理数据库(CMDB),并对生产环境中的
配置信息进行定期审计,以保证配置管理系统中的数据与实际生产环境
一致。
⏹日常作业管理
日常作业管理是指对生产系统的日常运行维护工作进行管理,是信息系
统运维的一些周期性的、相对固定的日常维护作业的管理。其主要目的
是规范日常作业计划、规范日常作业内容、规范维护人员的维护行为、
为人员考核提供基础数据。
⏹知识库管理