智能运维管理系统
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.1智能运维管理系统
1.1.1设计目标
公安将关键业务运行于IT网络系统之上,那么该系统是否能够正常运行直接关系到业务是否能够正常运行的关键之所在。但目前普遍管理人员经常面临的问题是:网络变慢了、设备发生故障、应用系统运行效率很低、想升级改造系统但无法说清问题的真实原因。网络系统的任何故障如果没有及时得到妥善处理都将会导致很大的影响甚至会成为灾难。因此,如何保障网络系统的正常运行,实现:预知故障,即在故障发生之前发现故障;实时告知,即在第一时间将故障情况通知相关的管理人员;有效处理,即在预定的时间内处理故障,若未及时处理将采取升级措施;以上问题简单来说,如何实现“第一时间发现问题”、“第一时间通知相关人员”,“第一时间处理问题”,成为智能运维管理系统主管关注的重点问题。
本系统设计目标是建设一套对平台服务器、服务软件模块、数字视频设备、监控摄像头和图像质量进行定时巡检诊断、故障记录、告警、统计分析、故障旁路、设备和软件模块整合于一体的智能化运维管理系统。
1.1.2系统组成结构
系统由设备巡检服务器、视频信号诊断服务器、报警转发服务器、网管客户端和数据库组成。
设备巡检服务器通过向各本服务器、服务软件模块、数字视频设备发送巡检指令来获取设备运行状态,对于故障设备,按照服务器热备策略自动启动备份服务器(如流媒体服务器),或重启设备和服务模块,以实现故障旁路和自动恢复功能。
视频信号诊断服务器对系统内视频信号轮巡检测,检测结果在数据库自动产生记录并告警;
故障信号通过报警转发服务器向网管客户端、手机和电子邮件发送告警信息。
为了提高故障检测诊断效率,增强故障发现的实时性,设备巡检服务器可以分布部署,设计在每个分局部署一台设备巡检服务器,负责对本网络区域内设备的巡检。
报警转发服务器和数据库仍利用一期的设备,无需另外配置。
系统原理结构图如图4.5所示。
智能运维管理系统原理图
1.1.3设备与工程信息管理
➢可以对前端所有设备的信息进行统一管理,管理人员有针对的进行设备维护,如下图。➢可以对前端所有摄像机设备的信息进行统一管理,管理人员有针对的进行设备安装维护,如下图。
1.1.4设备状态巡检
➢可以对前端所有设备进行实时状态巡检,如下图
1.1.5视频信号巡测
对所有的视频信号轮巡检测,发现信号故障时能够通过网管客户端进行声光报警和故障信息显示,并联动显示故障画面,自动生成故障记录,包括检测时间、监控点名称、故障内容等,能自动抓拍故障图像的图片保存到检测记录中。故障内容包括视频信号干扰、图像过白、过黑、聚焦模糊、画面冻结等质量问题;
1)清晰度检测(Sharpness & Content)
该功能将对实时视频的画面清晰程度(Sharpness)和信息含量(Content)做出评价,从而及时发现以下故障:
2)视频干扰检测(Noise & Snow)
该功能主要的监测对象是:由于线路老化,传输故障,或者接触不良,或受到电磁干扰,而在视频画面上出现的点状,刺状,带状的干扰。由于摄像头的干扰故障形式非常多样,在文安视频诊断系统中将呈带状,网状带有周期性的干扰交由“噪声”检测项监测,而将点状,刺状的随机干扰交由“雪花”检测项监测,从而提高诊断的准确性。
3)亮度异常检测(Brightness & Darkness)
该功能将对视频的明暗程度进行诊断,由于在不同时段可改变诊断计划和监测阈值,亮度异常检测在昼夜都能发挥作用。
4)偏色检测(Color Bias)
该功能对视频的颜色信息进行分析,它的特点是当视频中出现丰富色彩时,能够区分它们是由自然场景带来的,还是由于摄像头自身故障产生的,从而使摄像头偏色检测实用化。
5)PTZ(云台)控制功能诊断
前端的PTZ摄像头在安装一段时间后,可能发生部分或全部PTZ功能异常的情况,例如,左转失灵,上下倒序等等。该功能能够自动对PTZ的各指令进行测试,使管理人员准确及时地把握系统内PTZ的运行情况。不过,此功能需要系统拥有控制前端PTZ的权限。
6)视频冻结检测(Freeze)
发生视频冻结时,监控中心的画面静止,摄像头的实时画面无法被正常纪录,而由于并未发生视频信号丢失,常常难以引起人员注意。通过使用文安视频诊断系统的Freeze 监测功能,就能及时发现这类隐患。
7)视频缺失检测(Freeze)
该功能监测摄像头视频信号中断的故障。
1.1.6网络流量检测
⏹网络流量监测的常用方法
对网络流量监测的常用技术分为:
➢基于流量镜像(在线TAP)的协议分析技术;
➢基于硬件探针的分布式监测技术;
➢基于SNMP的监测技术;
➢基于Netflow的监测技术这四种常用技术。
⏹网络流量监测的原理介绍
1)基于流量镜像协议分析
流量镜像(在线TAP)协议分析方式是把网络设备的某个端口(链路)流量镜像给协议分析仪,通过7层协议解码对网络流量进行监测。与其他3种方式相比,协议分析是网络测试的最基本手段,特别适合网络故障分析。缺点是流量镜像(在线TAP)协议分析方式只针对单条链路,不适合全网监测。
2)基于硬件探针的监测技术
硬件探针是一种用来获取网络流量的硬件设备,使用时将它串接在需要捕捉流量的链路中,通过分流链路上的数字信号而获取流量信息。一个硬件探针监视一个子网(通常是一条链路)的流量信息。对于全网流量的监测需要采用分布式方案,在每条链路部署一个探针,再通过后台服务器和数据库,收集所有探针的数据,做全网的流量分析和长期报告。与其他的3种方式相比,基于硬件探针的最大特点是能够提供丰富的从物理层到应用层的详细信息。但是硬件探针的监测方式受限于探针的接口速率,一般只针对1000M 以下的速率。而且探针方式重点是单条链路的流量分析,Netflow更偏重全网流量的分析。3)基于SNMP的流量监测技术
基于SNMP的流量信息采集,实质上是测试仪表通过提取网络设备Agent提供的MIB(管理对象信息库)中收集一些具体设备及流量信息有关的变量。基于SNMP收集的网络流量信息包括:输入字节数、输入非广播包数、输入广播包数、输入包丢弃数、输入包错误数、输入未知协议包数、输出字节数、输出非广播包数、输出广播包数、输出包丢弃数、输出包错误数、输出队长等。相似的方式还包括RMON。与其他的方式相比,基于SNMP