IT综合监控平台 技术白皮书
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
IT综合监控平台– APEX IM
APEX IntegrationManager是一款以业务系统的综合监控为核心,全方位的IT综合监控平台,从业务系统视角出发,对IT基础设施(网络、服务器硬件、软件及服务)进行全面监控,保障业务系统正常稳定可靠运行,支持的监控类型超过数十种,支持的监控指标超过数千个。
IM的主要功能:
●网络设备、链路监控
支持交换机、路由器、防火墙等网络设备的监控、支持链路流量、链路带宽利用率、链路丢包率、链路错包率等指标的监控,可以帮助网络管理员实时监控各台网络设备的可用性和负载情况,以及各条链路的当前可用性、流量大小情况,并支持通过曲线图查看链路的历史流量情况。
●服务器监控
支持Windows、AIX、Linux、Solaris、HP-UX等服务器的监控,能够监控服务器的CPU使用率、物理内存/虚拟内存使用率、磁盘分区使用情况、磁盘IO (包括平均每秒IO请求数、平均每秒读字节数、平均每秒写字节数、IO等待队列深度、平均IO完成时间等关键指标)、系统进程与服务的运行情况、系统日志(EventLog与Syslog)、服务器系统时间等。
服务器硬件状态监控
支持IBM、DELL、HP服务器的硬件状态(服务器需支持IPMI协议),包括机箱温度、电源电源、风扇状态和转速
虚拟化监控
支持对Vmware vSphere虚拟机环境进行监控,对虚拟环境的监控方式是通过vCenter Server对ESX/ESXi宿主机间接进行监控,所有的数据均从vCenter Server上获取,不直接与ESX/ESXi宿主机进行通讯。即APEX IT监控系统与vCenter Server通过SOAP/HTTP协议集成,对整个虚拟环境进行监控。
宿主机
对于物理机,也就是宿主机,支持获取该物理机的硬件配置情况,包括:宿主机上安装的ESX/ESXi软件fullName、支持的SDK API的版本号。宿主机的硬件能力属性、宿主机的BIOS信息,包括biosVersion,和releaseDate。
CPU信息,包括CPU个数、CPU核心总数、每核心CPU频率、CPU并发线程数,CPU厂商、物理内存总大小。
网卡个数和网卡背板带宽;磁盘总大小、已使用容量、剩余容量、使用百分比。
自动发现该宿主机上当前已经创建的虚拟机的数量,当虚拟机的数量增加、减少时能够自动感知到这种变化,当虚拟机被删除或被迁移到其它宿主机时能够自动产生告警。
除了静态信息,还需要能够定时采集物理机的动态性能数据,当性能数据超过阈值时能够产生告警,包括:电源状态、可用性、CPU使用率、内存使用率、磁盘使用率、磁盘IO、网卡流量、响应时间。
虚拟机
自动发现每个宿主机中已经创建的虚拟机,包括基础信息与动态历史性能数据,基础数据包括:
创建虚拟机时给虚拟机分配的的硬件资源,包括虚拟机的名称、安装的客户操作系统类型、是否是模版虚拟机、是否支持CPU热插拔、是否支持内存热插拔、分配的物理内存大小、分配的CPU数量、每个CPU的核心数,虚拟机当前的运行状态(GuestInfo#guestState)、虚拟机的网卡信息(GuestInfo#net,包括网卡是否使能、配置的IP地址和掩码、)虚拟机的主IP地址、虚拟机的磁盘信息(GuestDiskInfo,包括磁盘名称、容量、剩余空间)动态历史性能数据包括:虚拟机的启动时间、电源状态、连接状态、CPU使用率、内存使用率、磁盘IO、网卡流量,这些数据需要以趋势图的形式显示,并可以支持自定义时间段。
当虚拟机的动态性能指标超过阈值时,能够产生告警提醒管理人员。
数据中心
能够查询到当前vSphere环境中已经创建的Datacenter,并发现它所包含的其它实体对象,比如Cluster、Folder、Host、VM、Datastore。
支持以树结构的方式展示Datacenter和其它物理/逻辑元素之间的父子关系。
集群
支持发现vCenter中配置的Clustor,包括发现Clustor与宿主机之间的一对多关系,支持在界面上以树结构的方式显示Clustor与Host之间的父子关系。
当Clustor发生变化时,如新增Clustor、删除Clustor,修改Clustor中包含的Host主机时,系统要能够感知到这种变化,并自动更新系统数据库中的相应模型数据,在用户刷新界面时自动反映这种变化,不需要操作人手工进行刷新操作。
数据仓库
支持当前VSphere环境下的Datastore,可能有多个,包括数据仓库的名称、剩余容量(字节为单位)、最大文件大小;支持自动发现Host主机与数据仓库之间的多对多关系。
告警管理
支持获取vSphere环境中的实时告警信息,通过AlarmManager接口实现。
vSphere定义的告警通过对象Alarm及AlarmInfo描述,包括creationEventId、key、lastModifiedTime、lastModifiedUser、description、name、systemName。
支持接收vCenter发送出来的SNMP Trap信息并产生告警、执行告警动作。
自动发现虚拟机
从vCenter Server中读取到宿主机信息的时候,要支持自动发现该宿主机上的虚拟机,当Host主机上的虚拟机发生新增、删除、修改变化时,系统能够自动感知到这种变化并同步更新APEX系统数据库中相应的模型数据。
集成vCenter
支持与vCenter集成,需要输入的参数包括:主机名称(也即运行vCenter Server的服务器的名称,只是为其取个名字,做个标识而已)、IP地址、端口、轮询周期。
添加成功后,需要自动发现vCenter Server中正在管理的宿主机、虚拟机、Datacenter、Datastore、Cluster、Folder信息,并能够发现他们之间的父子关系。
与vCenter Server同步
支持自动、手工两种方式与vCenter Server中的Virtual Component同步,当vCenter Server中添加了新的组件时(比如对Datacenter、Folder、Host、VM等的增删),通过同步的方式,监控系统就能够感知到这种变化,保持与vCenter Server中数据的同步;在自动同步的模式下,同步时间可以配置,比如每X天同步一次;默认的同步模式是手工同步。
存储监控
支持多厂商的存储区域网络(SAN)和网络附加存储(NAS)监控,能够监控HP、IBM、DELL、EMC、NETAPP、日立等主要厂商的Storage Array、光纤交换机、磁带库、HBA等存储设备。
支持多种监控协议实现对高中低端存储的监控,如命令行、 SNMP、SMI-S 协议,支持SNMP Agent或SMI Agent, APEX系统通过对SNMP和SMI-S协议的支持,尤其是SMI-S协议,实现了对存储的颗粒度更细的监控,可以得到更多细化的关键指标。