网络运维方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
网络运维方案
Document serial number【KKGB-LBS98YT-BS8CB-BSUT-BST108】
目录
1 综合管理的必要性
随着IT的不断发展,众多行业从其自身业务发展的角度出发,加强了网络信息化建设力度,在其网络基础上开展电子商务、企业资源计划 (ERP)、办公自动化(OA)等业务内容。而在这一发展过程中,逐步发现除了要依靠网络设备本身和网络架构的可靠性之外,管理和安全成为了关键环节。当前,网络系统的结构复杂和规模庞大,即要保证网络系统的正常运作,又需要保证业务系统的正常工作,传统的各自独立的“分立式”系统已经无法满足复杂的IT系统的管理要求,综合管理平台已经成为大势所趋的方向。
2 系统概述
内网运维综合管理系统是我司完全自主开发的一套全中文网络运维与安全管理系统,是一套在充分调研了国内网络现状以及网络管理方式,采用目前为止最先进的网络管理技术,以用户的网络、线路以及服务器、路由器、交换机、计算机等等的日常运作管理为着眼点,独立研发的完全适应于高、中端网络管理软件领域需求的一套优秀、可靠、先进的网络设备资源与应用服务资源、全中文、通用管理系统,为广大客户从根本上解决了困扰已久的网络管理难的棘手问题,并且很有效的帮助网络管理人员从根本上提高网络利用率和网络服务的质量。
3 系统结构
系统逻辑结构
系统监测层包括网络管理、应用管理、设备管理、桌面管理,是监测底层的被管对象层,实现对网络、主机、存储设备、安全设备、数据库、中间件及应用软件等IT资源的全面监控管理;同时自动收集、过滤、关联和分析各种管理功能产生的故障事件,实现对故障的快速定位和处理;对网络和业务应用等IT资源的性能进行监控,定期提供性能报表和趋势报表,为网络性能优化提供科学依据。
用户层是整个系统呈现,是运维管理平台的人机交互接口,系统集中运行展现提供集中的直观的监控呈现、快速发现和分析各类运行隐患,提供了运行一览、网络拓扑、业务拓扑、负载分析、告警台、统计分析等多种监测视图,通过集中化的有机的组合各种视图,为不同角色的人员提供完整的运维管理工作界面。运维服务管理层将人、技术与流程进行有效地融合,实现日常运维工作的自动化、信息化和
标准化。
而知识库能自动实现运维知识的积累、沉淀和共享,从而降低IT运维管理对个人的依赖。至上而下的IT运维管理平台能为IT服务管理提供足够的管理元素,帮助管理者从不同的角度、不同层面去了解系统运维状况,为领导决策提供科学依据,同时生成多种工作记录,领导可对IT运维管理人员的绩效进行客观的评估,从而帮助用户实现对IT服务基础支撑系统的透彻管控。
监测层和用户层通过统一的资源库和子系统接口来进行有机的融合,同时系统提供了单点登录和统一认证的支持,确保从上到下的操作是必须经过统一登录认证和操作审计的。其他集成接口系统包括系统数据交换接口和分布式数据采集接口,通过系统数据交换接口,可以建立多层系统部署的数据交换,同时也可以和异构系统集成,通过分布式数据采集接口可以实现数据的远程采集。
图1 系统逻辑结构框图
系统组网
系统能够方便地满足用户在网络运维管理中的组网需求。依据目前的管理要求,在网络运维管理系统实施过程中通常采用的组网模式有两种:集中管理模式和分级管理模式。
集中管理模式适用于统一网管中心的网络,这个网络可能规模很大,也可能是一个园区网络,但其只有一个管理中心。
分级管理模式则是针对企业级、电信级网络建设和管理的实际需求提供的一种分布式管理模式,在这种模式中,网络管理不仅有中心,而且还有各级
分中心,管理过程也是实行分级分范围管理,以满足实际运行维护的需
求。
系统很容易实现上述两种网络运维管理的组网模式,依据实际需求构架不同的网管结构,两种组网模式分别如下图所示。
集中管理模式
图2 系统集中管理示意图
分级管理模式
图3 系统分级管理示意图
4 主要功能
网络管理
网络拓扑发现
系统能够采用多种算法、迅速搜索整个网络内的所有节点、自动勾画出整个网络的准确物理拓扑图,包括设备间的冗余连接、备份连接、均衡负载连接,网络用户可以为每条设备间连接加以注释,为每台设备设置中文设备名称,监测网络中每台设备的名称、IP地址、类型、厂商等,并能够自动辨别线路连接类型。提供拓
扑图的编辑功能,可以在已发现的拓扑图上进行编辑修改连接关系。同时,根据拓扑所反应的对象,系统呈现给用户的拓扑分为网络拓扑、物理拓扑和子网拓扑。
网络拓扑是根据网络层的角度来分析和展现的,表达了被管网络各个子网之间的连接关系
图4 系统网络拓扑图示例
物理拓扑是反映被管网络的实际连接的二层网络拓扑图。
图5 系统物理拓扑图示例
子网拓扑是从网络链路层角度进行分析并给出的逻辑拓扑结构。
图6 系统子网拓扑图示例
链路状态显示
系统在网络拓扑发现结束后,会自动地画出设备间的连接关系,即链路,同时对链路的连接状态进行监视和管理,可对指定链路设定告警阈值,如链路带宽占用率阈值、链路速率阈值等,在链路连接发生故障或达到告警阈值时时,链路以颜色的改变提醒网络管理人员,并产生相关告警。
用户可直观的从链路提示信息中获取到该链路的基本信息,包括:该链路的源设备IP地址、源端口、目的设备的IP地址、目的端口以及该链路实时的进出流量、错误率、丢包率等。如下图所示:
图7 系统链路及相关参数显示示例
故障显示
拓扑图上所显示的各被管对象的颜色可以直接反映出其内部被监控对象的状态。如绿色表示用户所关心的对象正常运行,黄色表示警告信息,红色表示严重错误。
图7 系统拓扑图故障显示示例
4.1.4 跨地域的多层网络监控
通过采用多层网络管理机制,可以在总部网络管理中心直接调阅各下属单位的网络实时物理网络拓扑结构,各个层次相对独立,上级部门在需要时可以对下级部门进行管理,保证了整个网络管理的统一性和完整性。
性能监测管理
性能监测管理能够帮助网络管理员监测网络及设备的性能,分析和确定网络及设备的性能瓶颈,为网络及设备的性能优化提供可行的参考。例如可以对指定的端口进行流量监视,从而判断出网络流量瓶颈等问题。
系统能够监视的性能参数包含:
网络设备性能参数:包括路由器、交换机、防火墙等网络设备的CPU、内存
使用率,各端口进出流量、丢包率、错包率、带宽使用率、设备响应时间
等信息;
服务器性能参数:包括各类应用服务器设备的CPU、内存、硬盘空间使用率
等运行信息,以及其上运行的应用程序和相关服务性能信息,如应用和服
务的响应时间、系统资源使用情况、自身性能指标、服务可用性等;
数据库性能参数:包括对各种主流数据库(如ORACLE、DB2、Sybase、SQL
server、Mysql等)的基本参数、文件系统、表空间、碎片、死锁、消耗
大cpu的SQL、占用长时间的SQL等状态信息。
网络设备监测管理
从各个方面对网络设备进行监测和管理,包括网络设备的可用性、设备性能、流量管理和业务分析等。网络设备包括各种类型的交换机、路由器、防火墙、VoIP 网关设备和其他启用了SNMP协议的网络设备。
(1) 设备基本信息
设备的基本信息包括设备名称、设备类型、设备厂商、设备节点合法性(是否登记为合法设备)、IP状态(是否在线)、是否支持SNMP及设备OID等信息不可