IT运维监控系统白皮书

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、系统概述

系统背景

近年来随着信息技术的迅速发展,IT网络的建设以高于30%的速度逐年递增。通讯、金融、教育、交通、政府、企业等各个行业的迅猛发展都越来越密切的依赖于现代化的IT 信息网络平台。但是高速发展的同时,各行业巨大的IT维护和管理成本也在与日俱增,IT 基础建设的健康性和可管理性越来越让人担忧。

企业现在普遍缺乏一个有效实用的综合监控系统来实现完整的IT架构监控和管理,即便现有各行业已经采用的IT管理工具也大都是从传统的IT网元监测出发,基于各自独立的管理模式,各管各的事:设备管理系统,不同的应用管理系统,各自只能维护自己的产品;系统间信息没有充分的交互,无法分析故障的根源;对IT网络的核心资源不能进行统一有效的管理;IT维护和系统的建设没有提升到面向服务和面向业务的层次。企业缺乏统一集中综合监控系统的局面,使得企业IT运营人员不得不面临许多挑战:学习各种领域知识、学习各种管理系统、熟悉各种操作系统、熟悉各种设备仪器、处理故障时在各种工具间切换等。

产品概述

ForceView IT运维监控系统是东华软件经过多年经验积累、维护实践、自主研发和技术创新的结晶。该系统基于Web的集中管理模式,遵循面向对象的设计结构,具有高度集成化和先进性、安全性、开放性、可扩展性、高效性、高可靠性等系统特点;该系统融合了网络管理、主机系统管理、应用服务管理、业务管理等各种IT因素的统一监控管理平台,并从业务视角出发,实现上述各项管理数据的共享集中、互通互融,从而能够综合量化企业IT基础和企业业务的总体服务品质。

使用该系统,企业运维人员能实现对网络设备、服务器、数据库、应用软件、web服务等进行集中统一的管理,使得对企业IT基础架构管理从被动分散的维护转变为主动集中的控制和管理;使用该系统,企业运维人员能实现从业务角度来管理IT基础架构,使IT基础架构真正成为保障业务服务水平的、可管理、可控制的业务平台,从而构建业务人员和IT 管理人员的共同语言,搭建业务管理与IT运营的沟通桥梁。

系统功能架构图

二、产品功能特色

统一集中的事件管理平台

系统能够对用户网络及系统发出的预警信息和故障信息进行整合和自动化的处理,利用Syslog接收器获取相关设备转发的Syslog信息,利用SNMP Trap接收器获取设备或第三方管理工具的事件告警信息,并实现过滤和相关性分析的处理;利用不同类型的监测器采集系统级和应用级的可用性信息,并在监测器指标测量失败时发送告警事件。系统将上述告警信息进行统一格式化后实现集中统一的监测和管理,使管理员可以迅速确定哪些故障会对服务的可用性构成不良影响。

⏹全面的告警监视

支持对SNMP Trap和Syslog日志信息的自动采集

支持网络设备和其链路状态及可用性类告警

支持对网络设备的端口、流量、负载(CPU、Mem)等各项参数做阀值告警

支持主机、数据库、应用系统等被管理系统的管理参数进行监视、阀值告警

提供建立故障预警管理,通过设置“阀值”,可以不断监测设备负载是否超标(CPU 负载/Mem利用率)、线路流量是否正常,端口是否有持续的错包等现象,

在问题发生前及时了解非正常情况。当网络出现如上所述的安全隐患时,系统会发

出告警信息,分析判断网络的安全状态,分析非法入侵、攻击、病毒、物理故障等

现象

⏹强大的告警分析压缩功能

告警关联:可定义多种告警类型之间的关系如下:告警恢复,定义故障发生和恢复正常的一对告警;相似告警,定义同一故障引起的不同类型的告警

告警压缩:对重复告警进行压缩,提示故障首发时间和最后更新时间以及重复次数。

该压缩只影响活动告警实时显示界面,不影响告警的后台处理

告警定位:通过分析网络配置信息,以图形显示方式或文本显示方式将设备或通信故障定位在板卡或端口上,并给出可能的故障原因

告警影响范围分析:通过分析网络配置信息,确定故障发生时其影响范围,并发出预警

⏹灵活的通知方式

系统提供了丰富的告警通知方式,支持手机短消息、弹出窗口、电子邮件、语音提示、电话告警等,同时支持分时段告警,支持告警输出与第三方程序联动,支持直接的故障源网络隔离操作。

⏹告警显示和统计

提供统一告警监视界面,提供实时和历史告警信息的查看

可按照业务、设备统计异常告警事件的分布

对不同严重级别的告警,以不同的颜色进行显示

可选中某告警查看相关的维护经验

可以查看某告警是由哪些原始事件触发的

支持按照告警类型、级别、告警源、告警时间等不同属性进行告警查询或组合查询统计

各种视图,多维监视

ForceView IT运维监控系统采用多种算法、迅速搜索整个网络内的所有节点,能自动、

准确、及时地勾画各类异构复杂网络的拓朴图――物理拓扑图,包括设备间的冗余连接、备

份连接、均衡负载连接。系统支持SNMP、ICMP、ARP、CDP、FDB、NDP等多种发现

模式,实现跨厂商、多类型设备发现,可发现各种不同品牌、型号的网络设备,包括思科、

华为、3COM、北电、Juniper、Intel、港湾等主流网络设备;支持指定种子节点、种子网

段、种子网段区间、屏蔽的设备、屏蔽的网段、屏蔽的网段区间、屏蔽的设备类型等进行自动发现配置;支持手工方式添加设备节点以及系统自动定期轮询全网发现新节点,并更新到拓扑图上。

基于网络拓扑结构,能展示各类实时网络负载分布、设备连续运行时间、流量分布等多种对管理有价值的信息。网络监控系统能以不同颜色在拓扑图上实时反映网络节点间链路流量、丢包、错包、带宽、链路的通断和网络端口连接等信息,支持对单条线路流采样间隔、刷新速度选择,能对设备间连接进行注释,支持对设备设置中文名称。

系统提供完全WEB方式的拓扑管理操作,直观方便的对全网状态和性能进行监视和操作管理,可在界面上实际操作各种拓扑图的情况。可手动创建示意设备、示意链路,并支持拖拽方式修改拓扑图内容。可按设备类型、名称、IP地址等条件,快速定位网络拓扑图中的设备。支持网络设备分级权限管理,网络拓扑图的查看和修改也是按照用户域和用户角色定义来严格限制的,保持和网络设备的权限的统一。

提供视图定制功能,支持从不同角度不同层次提供多种表现形式的网络拓扑显示:网络逻辑视图、物理连接视图和子网拓扑视图等,支持更换拓扑图背景图。可在拓扑图中制定关联拓扑图,通过关联拓扑图可以使各个拓扑图串联起来。

拓扑图可打印,可导出。

全面监控,集中管理

⏹网络系统监控

实现网络设备、网络安全设备的在线状态、CPU利用率、内存大小、设备日志、设备各种表信息的监控。支持网络设备配置文件的下载备份。对网络线路运行状态监控,包括线路联通性、线路响应时间、线路流量、线路带宽利用率、线路错包率、线路丢包率等信息。对网络设备接口状态进行监管,包括接口面板、接口状态、接口流量性能等信息,并可启动、关闭接口。持续监视、报告网络的运行情况,发现异常及时告警;设备故障与链路阻断告警,设备与链路性能告警,异常流量告警等。

⏹主机系统监控

实现对HP-UX、AIX、Solaris主机、Windows主机、Linux主机运行状况监控,包括主机的在线状态、CPU利用率、内存大小及利用率、磁盘空间大小及利用率、主机上关键进程状态及其对CPU和内存占用情况、提供关键服务状态、提供所安装软件详细列表、主

相关文档
最新文档