服务器运行状态监控系统
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
系统目标
本系统的主要功能是对各种服务器进行实时监控,基于Windows系统(包括Windows XP/2003/2008),采用C/S模式,使用VC6.0开发。其中,Client客户端安装在受监控的服务器上,Server服务器端安装在网管人员的PC机上。网管人员可以随时通过Server端获知任意一台受监控服务器的运行状态,并在服务器出现异常的情况下(如:服务器意外down机、存储空间不足、CPU利用率过高等),及时的收到Server端的短信报警信息。
2.1、Client端主要功能
(1)采集服务器的各种性能指标数据,并发送到Server端,使网络管理员能实时查看服务器的状态。主要包括:CPU使用率、内存使用率、进程数量监控、进程运行状况监控等。
(2)采集服务器的相关信息,并保存在服务器的日志文件中,供网络管理员进行定期的数据分析。主要包括:重点分区文件的变动信息、容量大小信息、服务器重新启动信息等。
(3)服务器进程信息的监测。主要包括进程列表的实时扫描、黑名单监测和白名单监测。其中,黑名单监测是指对非正常进程的监测(如病毒进程),当发现监测服务器上运行着这类非正常进程时,便会向Server端发送告警信息,并自动关闭进程。白名单是指对服务器上守护进程的监控,当发现服务器守护进程没有正常运行
时,便会向Server端发送告警信息,并自动重新启动进程。
(4)日志文件监控。此项功能实现对服务器日志文件所占存储空间的监控。当监控的日志文件大小超过其预设阀值时,Client端便会向Server端发送告警信息,通知网络管理人员进行及时处理。
(5)Web服务器监控。对WEB服务器的实时监控,当发现受监控的Web服务器不能正常提供服务时,自动重新启动该服务,使其能够正常运行,并将WEB服务器发生问题的时间和处理信息写入日志文件,以供网络管理人员进行分析。主要提供对
Tomcat、IIS(6.0)等Web服务器的监控。
(6)数据库服务器监控。对服务器上运行的数据库服务器的实时监控,当发现受监控的数据库服务不能正常提供服务时,自动重新启动该服务,以使其能够运行正常,并将问题发生时间和处理信息写入日志文件,以供网络管理人员进行分析。主要提供对SQL Server、Oracle等数据库的监控。
(7)盘符容量监控。选定某一监控盘符后,设置其容量大小,当容量不足时,向Server端发送报警信息。
2.2、Server端主要功能
Server端的主要功能是接收Client端发送的数据,并根据设置阈值在这些海量数据中筛选出异常数据向网络管理员进行告警。
(1)参数设置:对一些基本参数进行设置,保存设置后,Server端按照参数的设定范围对接收的数据进行分析。主要包括:
①告警时间间隔:两次告警间的时间间隔。即在前一次告警发出后,网络管理员没有做出响应的前提下,确定下一次告警的时间。
②CPU使用率:设置CPU使用率正常值的范围,超出该范围,Server端便会将其筛选出来进行告警。
③内存空闲率:设置内存空闲率正常值的范围,超出该范围,Server端便会将其筛选出来进行告警。
④进程数:设置服务器系统在正常情况下进程数的范围,超出该范围,Server端便会将其筛选出来进行告警。
⑤短信猫:设置发送短信的间隔时间和设备管理人员的电话号码,将服务器的各种报警信息自动发送到管理员。
(2)端口扫描:对任意一台受监控的服务器的相关端口进行扫描,以获取其端口状态。此功能既支持对某一特定端口进行扫描,也支持对多个连续的端口进行扫描。
(3)端口分析:显示传输层中各种端口的使用情况,包括listen、Time_wait、Established等状态。列出当前系统中全部使用TCP或UDP协议进行通信的进程和端口状态,当发现异常时,可关闭端口停止进程的运行。
(4)远程监控:当位于Server端的网络管理员发现某台服务器出现异常时,可以通过此项功能在自己的PC机上直接进行处理。
(5)数据库的备份:对Server端收集到的数据进行备份,以供网络管理员对历史数据进行分析。
数据库服务监 控
日志文件监控
服务进程监控
WEB 服务监控
基本信息
进程信息
连接状态信息
磁盘容量
日志采集
数据发送
黑名单
白名单
IIS5.0和6.0
SqlServer
配置信息
设备类型
采集信息
Tomcat
Oracle
(6) 历史数据显示:对收集到的 Client 端的历史告警数据进行
显示。这些告警数据主要包括:CPU 、内存、邮件、黑名单、白名单、
进程数、日志等。
(7)
数据动态波形图:对 CPU 、Mail 、文件变动数等数据动态
生成波形图,将这些数据以直观的图形方式显示给网络管理员。
(8)
告警数据显示:显示问题服务器的列表,并列出这些服务
器的告警信息。
(9)
告警分析:按照监控类型、设备地址、监控时间分别对告
警事件进行图形分析,直观展现报警事件的发生规律,确定重点维
护的服务器和易发生告警事件的时间段。
3、项目研究工作开展情况
Client 端和 Server 端具体的功能模块如下图:
Client 端
图 3-1 Client 端总功能模块图
端口分析 远程控制 工具 端口扫描
打印 按监控时间分析 按设备地址分析 按监控类型分析 告警设置
进程信息 日志浏览
短信设置 文件数据 告警分析 内存数据
CPU 数据 容量监控 图表显示 进程数量监控 历史数据 进程运行监控 内存监控 CPU 监控
告警数据
Server 端
图 3-2 Server 端总功能模块图