技术白皮书:网强网络管理系统(Emaster
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
40088-57597
一、IT管理现状 (3)
二、网管软件发展史 (4)
三、产品定位 (5)
四、系统架构 (6)
五、功能模块 (6)
1、整体 (6)
2、我的 (7)
3、一览 (8)
4、视图 (9)
5、故障 (9)
6、分析 (10)
7、工具 (11)
8、增值 (12)
六、技术特色和优点 (12)
1、管理视角 (12)
(1)自定义页面 (12)
(2)结构化数据(一览) (13)
(3)CMDB (14)
(4)快照 (15)
(5)知识库联动 (15)
(6)报表与分析 (16)
2、架构先进 (19)
(1)智能轮询和指标系统 (19)
(2)自定义指标 (19)
(3)自定义通用指标 (20)
(4)业务和健康度模型(可选功能) (21)
(5)异常/故障管理 (22)
(6)模板管理 (24)
3、人机交互 (27)
(1)Flex拓扑图 (27)
(2)系统运行一目了然(整体) (29)
(3)页面轮换和拓扑轮换 (30)
(4)大屏幕展示(可选功能) (31)
(5)多种告警方法 (31)
4、增值模块(可选功能) (33)
(1)IP- MAC绑定(可选功能) (33)
(2)配置管理(可选功能) (34)
(3)运维管理(可选功能) (35)
(4)机房管理(可选功能) (36)
一、IT管理现状
随着计算机技术和互联网的发展以及我国信息化的普及与应用,各行各业开始大规模的建立网络来推动电子商务和政务的发展,不论是政府、金融、教育、医疗等单位都逐渐将核心业务移植到电子和网络上。
而这些行业用户比以前任何时候都更加依赖于网络、IT基础设施以及应用系统来满足其核心业务需要。
企业IT部门的职责也在潜移默化中转变:由关注建设到关注规划、由关注技术到关注应用、由被动实现业务需求到主动参与业务流程的制定等等。
一言以蔽之,企业正在经历面向业务,优化服务的转变。
而在这个背景下,IT部门却正面临着三个挑战与一个矛盾:
●挑战一:客户满意度
如今通过网络应用后,工作虽方便了,但对网络应用也越来越挑剔,要求也越来越高,要做到让所有人都满意却是越来越困难。
如何保障和提高企业客户(即外部客户)以及IT部门客户(即内部客户)的满意度?
●挑战二:成本控制
现在很多网络管理人员都受网络规模越来越大、复杂度越来越高的网络管理压力,同时还受到企业管理高层要求降低成本和提高效率的压力,一句话,“以最少的资源创造最多的利润。
”控制成本似乎已经成为每个企业运营管理过程中离不开的话题和必修课。
但如何保障IT投资收益,远离投资风险,提升IT投资价值?从而在最有限的IT投入基础上对网络进行有效维护,以保持其最优的性能和可靠性,最大程度发挥网络的价值和提高效率,这将成为IT部门负责人考虑及实现的关键目标。
●挑战三:信息安全
现在企业将核心业务和数据都移植到网络上后,如何保证系统安全和数据安全?防止信息和数据泄密?这又将成为IT部门负责人面临的又一重大挑战。
●矛盾点:IT环境的复杂性与运维人员数量及知识结构的矛盾
通常在一个企业内可以发现随着IT基础设施、应用及业务系统的日益剧增,功能不仅越来越高级,技术上也越来越复杂。
而IT部门的人员数量却不能成倍增加,运维人员的技术水平也不能成倍提高,这无形中将导致运维人数和水平很难有效地维护所有的IT设施与各种业务应用。
可能只会头痛医头、脚痛医脚,导致满意度下降、成本失控,甚至出现信息安全隐患。
二、网管软件发展史
●第一代网管-命令行网管
特点:利用直接的串口或telnet等方式登录到设备上,用命令行方式进行设备管理。
缺点:不能及时、主动的发现网络存在的问题、出现问题不能准确定位问题原因、浪费大量的人力资源。
●第二代网管-厂商网管
特点:利用SNMP或私有协议和设备(网元)进行通讯、着重设备配置、设备级管理、以管理本厂商设备为主。
缺点:不支持跨厂商管理、不支持跨平台管理。
●第三代网管-第三方网管
特点:跨厂商管理、提供跨平台管理(服务器+网络设备)、提供设备级和指标级的管理功能、拓扑发现、性能分析、设备管理 告警、报表等。
缺点:以原始数据和告警报表为主、只是设备级网管,不面向业务管理。
给用户大量数据和告警堆砌、无轻重缓急、没有和用户的业务目标和管理要求相对应、无法解决IT环境日益复杂和运维人员投入的矛盾。
●第四代网管-大型定制网管
特点:在国外第三代网管基础上,根据用户的业务和管理要求,进行大量的项目二次开发,产品化弱,复用性差。
缺点:需要大量的二次开发、建设周期长、投入高、很难保证最终的效果。
●第五代网管-业务智能型综合网管
特点:结合了大型定制网管以用户的业务和管理为导向以及第三代网管的简单易用这两方面的特点,并以非编程扩展的方法,满足了用户不断增加的IT业务管理资源管理的要求。
兼容整合第三代网管和其他工具,专注用户的核心业务管理、服务水平管理、系统健康度管理,保证IT部门的用户的满意度,并通过智能业务模型解决了用户日益复杂的IT业务资源与运维人员数量和专业知识的矛盾。
三、产品定位
网强网络管理系统(中文简称:易管,英文简称:Emaster)是针对解决各行业中、小型企事业单位,目前在IT管理过程中所面临的3个挑战以及所需要克服的1个矛盾(即内、外部客户满意度、成本控制与系统安全之间的挑战;IT系统日益增长的复杂性与运维人数、专业知识结构之间的矛盾)的第五代专家智能型综合网管系统。
Emaster涵盖了网络设备、服务器、安全设备、存储设备、通讯设备、传输设备、数据库应用及中间件应用等管理,它结合了大型定制型网管及第三代网管的简单易用这两方面的特点,并以非编程扩展的方法,满足了用户单位不断增加IT资源管理的要求。
同时系统能兼容整合第三代网管和其它工具,专注于用户各种设备、应用及服务等资源的健康度、可用率和服务水平的管理,保证IT部门用户的满意度,并通过智能化专家系统解决了用户单位日益复杂的IT资源与运维人员数量不足、专业知识结构之间的矛盾,将各种复杂的网络管理工作简易化、便捷化与自动化,有效帮助网络管理人员轻松驾驭网络,提高网络管理效率。
四、系统架构
五、功能模块
1、整体
Emaster整体监控使用户很方便地了解整个网络的当前运行情况和用户所关注的网络设备、服务器、数据库、中间件、网页服务、链路、业务系统的当天信息和历史信息,方便从多方面了解网络的历史和实时运行情况。
包括“系统总览”、“我的秘书”、“异常一览”、“我的关注”、这些模块。
“系统总览”展现给用户的是系统总体情况,让用户了解各类unit,健康数量、亚健康数量、可用数量、不可用数量。
在“系统总览”中用户可以很直观明了的看出当前被监控的网络设备、链路、服务、服务器、业务、应用的数量及其健康度。
在“我的秘书”中将通讯录、在线用户、我的消息、留言栏四个组件合并展现。
用户可以通过“异常一览”中所显示的各种异常信息来监控设备的运行情况。
在“我的关注”中,包含了两个小模块,“当前关注”和“历史关注”,显示当前用户配置信息和历史信息。
“整体”的开发对于用户管理比较复杂的网络环境与服务系统提供了方便,在“整体“的展示中就可以看到日常工作时关注的网络对象的情况,而且操作步骤简单,易于用户接受。
40088-57597
2、我的
“我的”模块让用户以自定义的方式查看自己关心的信息,满足了用户差异化﹑个性化的需要。
页面分“块”以组件的形式展示,用户可以根据自己的需要插入不同类型的组件并配置其类容。
例如,用户想知道哪些设备的CPU 使用率比较高,可以插入一个TopN 组件,配置其内容为CPU 利用率。
该组件会对所有设备按CPU 的使用率从高到低做一个排行,并显示CPU 占用率最高的几个设备。
3、一览
“一览”模块集中显示用户网络中的资源,共分为网络设备﹑服务器﹑应用﹑服务﹑业务﹑其它设备﹑unit 集七类,每一类中列出了该类型的所有资源,用户可以在该分类中查看有哪些资源,还可以查看资源的详细信息。
资源可以以管理一览和实时一览两种类型查看。
管理一览显示该资源的管理方面的信息,实时一览显示资源的实时运行情况和异常状态。
打开资源的详细信息页面,可以查看资源的监控﹑CMDB﹑报表﹑快照﹑知识﹑体验化﹑等信息。
其中CMDB可以详细的配置设备的资产信息,方便用户对设备进行资产方面的管理。
快照将某一时刻该资源的详细信息保存起来,用户可以通过快照方便地查看之前某一时刻该资源的详细信息。
4、视图
系统拓扑图包括物理拓扑图、示意拓扑图及业务拓扑图三种,以图形的形式实时动态展现网络环境中各种设备、服务、应用及业务等资源的当前分布与运行情况,且用不同颜色来表示每个资源的异常等级。
通过右击网元可以查看节点属性和资源的详细信息,并能根据异常信息关联到知识库中寻找解决方案。
另外,除了可以对拓扑图进行新建、保存、编辑、缩放、打印、自动排列、设备统计、资源搜索、等基本操作外,还可以对拓扑图实时动态热键的显示策略、属性、链路样式配置及图例解释等进行自定义与灵活修改。
5、故障
故障模块显示网络中所有资源的异常信息,用户在该模块中可以查看﹑确定﹑删除异常信息。
异常总览以饼状图的方式显示了处于特急﹑较急﹑一般﹑提示﹑恢复异常状态的设备所占的比例,使用户对网络大致的情况一目了然。
类型总览以柱状图显示各类网络资源的数目,每一类资源的柱状图又用不同颜色显示各种异常状态所占的比例。
异常一览列出了网络中的所有的异常,每一条异常包含了异常来源﹑最新等级﹑时间﹑恢复状态﹑异常总数﹑确认人的信息,并且可以进行删除和确认操作。
对所有的异常还可以按时间和关键字进行查询,点异常的指标名称可以打开异常的详细页面。
6、分析
系统提供网络设备、链路、服务器、应用及业务等多种类型的日、周、月、季及年报表,并可以根据不同的关注点和时间段将所关注的各种类型的资源项及其指标项灵活添加至报表内容中。
用户可以通过报表模板,对于发布所形成报表的具体内容可以进行查看,报表以饼状图、柱状图、趋势图、表格等形式灵活展现,且支持打印预览、EXCEL和PDF格式的导出便于发布和提交。
40088-57597 另外,系统还支持统计分析,通过实时分析和历史分析对每次轮询(日)、30分钟平均(周)、2小时平均(月)、日统计(年)等时段进行分析,并对分析的结果以曲线图的形式进行直观展现。
每次轮询(日)分析即对指定资源的某个指标以系统的轮询周期为标准对当日性能进行实时分析;30分钟平均(周)分析即对指定资源的某个指标以30分钟为统计频率对一周的性能进行实时;2小时平均(月)分析即对即对指定资源的某个指标以2小时为统计频率对当月性能进行实时分析;日统计(年)分析即对即对指定资源的某个指标以日为统计频率对当年的性能进行实时分析。
7、工具
系统集成了常用的网络诊断和分析工具,其中包括Ping 、TraceRoute、NetBios、NetSend、IPMAC 定位、链路延时、SNMP 连接测试、TCP 端口扫描、实时表查询、Telnet&ssh、Mibbrowser 及IPMAC 绑定,使管理员无需脱离本系统的操作界面,即可对一些常见的网络故障进行诊断和排除,并更加方便的分析网络运行情况。
另外,系统还提供简单易用的MIB 查看工具,通过这个工具可以便于查看设备的MIB 信息,并可以设置TRAP ,对关心的数据进行采集整理。
8、增值
增值模块提供了一些高级的功能,如:IPMAC﹑配置管理﹑分级管理﹑大屏幕展示﹑知识库﹑管理资源等。
这些模块在标准的功能之外提供了扩展功能,满足部分用户个性化的需求,但是需要用户单独购买。
其中配置管理方便对网络设备的配置信息进行管理,能及时的发现配置信息的变动,并能快速的进行恢复。
大屏幕展示主要面向中﹑大型客户,将各种网络资源以平面化的图像进行实时的展示。
六、技术特色和优点
1、管理视角
(1)自定义页面
系统模块中的“我的”模块为用户提供了一个自定义的页面,用户可以根据自己的需要在这里配置查看相应的内容。
该模块以组件的形式进行配置,组件共分为七种:TopN﹑收藏夹﹑发布信息﹑指标一览﹑指标分析﹑单个资源一览﹑拓扑图。
每种组件对应一种查看方式,例如TopN显示所有设备中某项指标值(CPU占用率﹑内存使用率等)最大的几个资源,单个资源一览显示某一个资源的详细信息,指标分析以图形的形式显示某台设备的CPU﹑内存利用率,ICMP相应时间,可用度/健康度在一段时间里情况。
(2)结构化数据(一览)
Emaster版本对网络中的资源进行统一﹑分类的管理,系统的“一览”模块中按类别显示资源,用户可以方便的进行查看和搜索。
网络中的资源一共分为:网络设备﹑服务器﹑应用﹑服务﹑业务﹑其它设备﹑unit集七大类。
每一类设备有管理一览和实时一览两种查看方式。
管理一览显示设备的管理方面的信息,实时一览显示设备的运行状态信息。
打开某一类资源,会将该类资源全部列出来并显示资源的少量信息,用户可以对该类资源有个大致的了解。
同样也可以查看某一个资源的详细信息。
(3)CMDB
系统提供对设备、链路、服务、应用、业务及Uint集等资源的管理,并能自动搜索与发现网内的设备,对支持SNMP协议的设备能识别设备的类型、型号、生产厂家及设备详细的硬件配置信息。
对不支持标准协议的设备,则支持手动的建立资源档案。
通过资源一览页面能查看系统已发现的资源信息,通过新增功能手动添加新的资源设备,通过资源修改和删除功能可对已有资源信息进行信息变更,以及通过资源删除功能对已有资源进行资源删除。
CMDB管理可以为各种网络设备以及其它相关设备建立硬件资源档案,并可以将系统中的软硬件、人员、业务建立有机的联系。
(4)快照
用户使用Emaster的快照功能可以把设备的某个时刻的信息完整的记录下来,以便于运维人员后期的数据分析。
用户通过点击鼠标的方式就可以快速的将设备此刻的信息记录下来,信息自动保存并可以在资源详细信息的快照模块中查看。
用户在日后需要该信息的时候可以方便的找到,而且是完整的信息。
设备的运行情况是一直发生变化的,当需要记录某个设备在一个时间点上的运行情况,此时就可以生成快照来进行保存,以快照形式进行保存的内容,可以直接在快照页面搜索调出,快照的作用主要是能够进行实时的保存数据,用户可以随时访问快照数据,还可以利用快照进行分析等工作。
快照就成为网管中一个不可或缺的功能,也是新版网管中一大亮点之一。
快照与“历史记录”有类似之处,而且它还具有其他优点:可以命名快照,使它更易于识别;在整个监控的过程中,可以随时存储快照;可轻松比较效果。
例如,若想比较两个时刻设备运行情况可以直接比较两个时刻生成的快照。
(5)知识库联动
Emaster具有强大的知识库功能,知识库提供了各种异常情况所致原因、解决方法与操作步骤等具体参考信息。
当异常发生时,在系统中只需点击该异常信息,打开详细信息页面,即可自动关联到系统的知识库,显示与该异常相关的知识。
网络管理人员可以在知识库中查找与异常有关的条目,寻找解决方案。
随着新的“知识”不断加入,知识库会越来越强大,对用户的帮助也会更大。
40088-57597
(6)报表与分析
系统提供网络设备、链路、服务器、应用及业务等多种类型的日、周、月、季及年报表,并可以根据不同的关注点和时间段将所关注的各种类型的资源项及其指标项灵活添加至报表内容中。
对于发布所形成报表的具体内容可以进行查看,报表以饼状图、柱状图、趋势图、表格等形式灵活展现,且支持打印预览、EXCEL 和PDF 格式的导出便于发布和提交。
另外,系统支持还支持当日性能分析、指定时段分析、资源对比分析、时段对比分析,并分析的结果以折线图和柱状图的形式进行直观展现。
●报表一览
通过报表一览可以查看所有已发布类型报表和详细报表,用户可以直观了解到如报表名称、类型、所属、周期、发布人、生成时间、描述及操作列表等信息。
对于每个报表还可以进行电邮发送、查看报表、查看链接及删除报表等操作,点击“查看”则可以了解报表的基本信息、CPU利用率、MEM利用率、运行状况及性能指标等详细信息。
报表以饼状图、柱状图及表格等多种形式灵活展现,并支持PDF和EXCEL格式的导出便于发布和提交。
另外,用户也可以通过指定报表名称和日期范围等条件进行报表查询,查询到的结果可以了解到报表名称、生成日期,并可以进行手工对之前发布的报表直接查看操作。
●报表模板
通过模版一览可以查看所有已建立的网络设备、链路、服务器、应用及业务等类型的报表模版,如模版名称、类型、所属、时间、周期、创建人、模版描述及操作列表等信息。
用户可以通过手动操作对模板进行开启或关闭、是否所属公用及订阅等操作,也可以对模板类型、模板所属、模板周期、模板状态、模板订阅、模板资源进行自定义筛选,从而有针对性的查看报表模版。
与此同时,系统还提供各种类型的日、周、月及年报表的内建模版,
系统管理员可以手动对内建模版进行启动/关闭、订阅操作,非系统管理员角色的用户登录系统后只能进行订阅操作。
展开某个模板类型,用户还可以直观了解到该类型模板所支持的资源、展示图表、运行报表及性能报表等信息。
统计分析
通过统计分析的实时分析历史分析能完成数据的采集、汇总、分析和公示。
其中包含每次轮询(日)、30分钟平均(周)、2小时平均(月)、日统计(年)各时间段的数据采集、汇总和分析,然后进行整体的汇总并且通过报表系统展示出来。
综合IT管理方案系统能够给用户提供辅助决策能力。
通过技术管理体系来分析现有设备的运行情况,并且能作为设备升级、更新等项目的一个决策依据;比如新增加的业务服务在原有网络负载的情况下能否正常的运行,目前的网络负载情况怎样,网络负载的瓶颈在那,网络设备升级改造的依据在那;通过流程管理体系和绩效管理体系来完成人员的一个决策依据,比如人员是否够,人员的知识结构是否合适,人员的技术能力是否达标等。
2、架构先进
(1)智能轮询和指标系统
Emaster提供智能的轮询机制,对于不同的设备、不同的接口、不同的指标都可以设置不同的轮询或监视周期,让运维人员能够均衡每个设备采集的敏感度、时间间隔与设备性能之间进行有效匹配。
对于用户特别重要的核心设备可以将其监视周期设置的比较短(如10秒,20秒),而对于不太重要设备则可以将监视周期设置的比较长(如3000秒、甚至6000秒)。
一般情况下,核心设备的处理能力比较高,当设备一旦中断运维人员需要及时了解设备的异常情况。
如果轮询周期设的比较短的话,设备一旦出问题可马上通知到运维人员。
对于非核心设备,通常它的处理能力比较低,如果将它的轮询周期设置的比较短,频繁的轮循会对设备的CPU、内存等将产生一定的影响。
另外,非核心设备作为边缘设备,如果发生问题对企业的整个业务影响也并非很大,所以通过智能的轮询机制可以为企业关键的IT资源予以更多的关注,从而保障核心资源服务的持续可用性。
(2)自定义指标
Emaster可以将一个资源本身的指标,通过将若干个大部分用户所关心的内建指标与可能会关心,但也有可能不关心的扩展指标组建在一起,并通过如求“与”、求“或”自定义的任何一个运算表达式得出的新的指标。
同时也可以对此新的指标设置阈值、异常类型、异常过滤等,满足运维人员对IT设备指标的灵活监控需求,省去了传统网管系统高昂的二次开发费用的同时,真正帮助运维人员应对各种网络的变更、调整与扩展等,以不变应万变维护好企业的整体网络。
(3)自定义通用指标
Emaster除了传统的取值方法以外,还包含SNMP、数据库访问、TCP检测、Telnet和SSH等各种方法获取值。
另外,运维人员还可以自定义各种各样的第三方接口来获取日志文件与监控文件信息等。
既满足用户显著的业务需求的同时,可以通过这个方法增加很多监测项。
还满足了用户非编程的需求,当用户单位的IT资源再扩展时,无需进行编程等二次开发,即可将扩展的资源通过自定义通用指标添加到网管系统中进行集中监控。
通过这些方法大大扩充了系统的使用能力,降低了后续因二次开发带来的高昂成本。
(4)业务和健康度模型(可选功能)
健康度模型
Emaster将整个资源的体系结构分为业务、资源和单体资源,而且整个资源体系是可以相互累积与嵌套的。
单体资源即系统可以管理到的IT环境中的一个最小单元,一个资源可以由多个子资源及单体资源所构成,而一个业务则可以由多个子业务、几十个资源,甚至几十个资源内的几百个指标所构成。
Emaster定义一个资源的健康度可以由其各个下属资源的各个指标来构成,则不同的指标对资源的健康度的影响也可以不同。
Emaster通过非编程的方法来设置各项指标对资源的影响程度,并通过各项指标数据不断的实时叠加复合计算出某个资源的健康度。
Emaster引入“健康度”概念,能够很好的反应各个设备的故障对某个网络应用的整体影响,以及整个系统服务的有效性。
(5)异常/故障管理
●异常等级
Emaster将异常分为4个等级,当某个资源的监控指标如平均CPU利用率、ICMP响应时间或平均内存利用率等匹配规则大于系统默认的阈值90%时将产生紧急异常、大于70%时为重要异常、大于50%时为一般异常、而大于30%时则为提示异常。
同时,运维人员也可以按照个人需求通过阈值设置来对异常等级进行自定义,并可根据不同的异常等级分别设置紧急告警、重要告警、一般告警及转发邮件等告警方式,使运维人员可以更加清晰地了解到当前网络中所有异常的轻重缓急,有效处理网络异常。
●异常过滤和告警过滤
通过Emaster的异常过滤设置,当某个资源指定指标超过设定的阈值时,运维人员可以在指定的某个时间。