引入运维网管系统的必要性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
引入运维网管系统的必要性
摘要:随着计算机技术、网络通讯技术及信息化建设的不断深入发展,企业数据中心机房计算机设备及其配套的环境设备数量与日俱增,机房已经成为众多企业数据运转的重要枢纽。
安全、高效、可运营的数据中心,以及其精细化管理成为越来越多企业关注的焦点。
关键词:运维网管; 网络通讯; 企业信息化
Abstract: With the development of computer technology, network communication technology and the development of information construction of development, enterprise data center computer room equipment and its supporting environment equipment room number grow with each passing day, many enterprises have become the important hub of data operation. Safe, efficient, operational data center, as well as its fine management become more and more enterprises focus.
Key words: network management; network communication; enterprise informatization
目前很多数据中心机房的管理不得不采用24小时专人职守,定时巡检机房环境及计算机系统。
通过人为的巡检方式做不到时时刻刻进行,必定存在间隔时差,这样就导致很多时候不能及时发现和排除故障,如果增加人为巡检频率又会加重了人员的工作负担,工作效果也不一定好。
同事,在一定程度下对事故发生的时间及责任无科学管控。
当下国内普遍缺乏数据中心运维的专业管理人员,在很多地方的机房不得不安排不太懂设备或系统维护的人员值班,这对数据中心的整体运行无疑又是一个不利因素。
如何改善并提高信息中心的运营维护水平,实现其高可用性、高可靠性,甚至在一定程度上达到自动运维、无人值守,成为当今各行业数据中心理想化的挑战性课题。
运维的发展
企业信息化建设初期,IT结构简单、设备数量较少,运维工作还停留在简
单网管阶段,仅仅通过最常用的命令行方式,结合一些简单的网络监测工具,它不仅要求使用者精通网络的原理和网络管理概念,还要求使用者了解不同厂商的不同网络设备的配置方法。
随着IT设备逐步增多、IT结构日趋复杂,设备分布却逐渐分散;运维人员有所增加,但人员技能参差不齐。
为了便于运维,第二代网管有了良好的图形化界面。
用户无须过多了解设备的配置方法,就能图形化地对多台设备同时进行配置和监控。
但仍然存在由于人为因素造成的设备功能使用不全面或不正确的问题,工作效率差强人意。
伴随IT环境的高度复杂和日趋完善,企业的运营和业务越来越多的依赖IT,因而也出现了一些数据中心机房的常见痼疾:
机房根据规模和分布不同,存在不能集中管理的问题;很多电源不能提供智能管理或监控功能,设备用电安全存在隐患;各种设备重启、性能检测、安全预警、报警等工作绝大多数都是人工完成,效率低下;大量的数据交换对网络环境性能不断的考验;大量的电子业务往来对硬件稳定性、软件系统高效可用性不断提出挑战;由于时间和空间的限制,很多时候无法远程控制和计划管理,必将产生大量运维费用;整体环境存在很多单点故障;空调、供用等系统不协调,还会导致能源的巨大浪费。
此时,运维被提到一个至关重要的地位。
网络环境结构复杂、计算机设备数量大、运维人员多、业务系统依赖度高,众多管理环节要求新的运维工作趋于自动化、流程化、集中和智能。
此刻,单纯靠人力已不再现实。
必须引入自动化的运维系统协助人员实现IT 高精度管理。
一套高智能运维系统的必要性
引入一套全功能、高智能的运维系统,将机房基础环境、网络环境、服务器设备硬件、系统和应用软件、业务系统、资产、人员等环节集中整合到统一的管理界面中,为遍及全企业的IT设备提供随时随地的全面高密度监控、预警管理、自动管控、资产管理、配置管理、事件管理、变更管理等。
结合上述系统的运维解决方案直指数据中心传统运维痼疾:
不分地域,利用业界通用协议,实现真正意义上的全年无休、全面无死角集中监控管理;针对不同被管对象实现颗粒度指标实时监控和数据记录,从而从最细处及早发现隐患;通过故障记录可以进行根源分析;通过数据记录可以进行趋势分析,从而对故障隐患进行预判;通过对故障分析行程知识库,同时总结应对预案;大大减轻运维人员的劳动强度,提高其工作满意度和工作效率,优化其工
作模式;
国内运维系统发展现状
企业IT网络的可靠性、可用性和易维护性是传统网管非常关心的三大要素。
其中,网络的易维护性很大程度上取决于网管系统。
无论对于哪个行业而言,网管系统都是其提供高服务质量不可缺少的重要保障机制。
判别网管系统存在价值的大小的依据是,它能够在多大程度上辅助企业信息部门的运维活动,降低运维成本,从而为业务服务增值。
目前,各设备提供商的网管系统基本上都能够管理自有全系列产品,现有的网管系统仍然继承和发扬了其传统功能,包括配置管理、性能管理、故障管理、计费管理和安全管理等。
同时,一些国际、国内运营企业纷纷通过通用接口建设起上层的综合网管系统,力图解决“五国六制”的IT环境给整体运维带来的种种弊端,但实施效果远未达到预期目标。
比如,运营商网络中共存着设备提供商的网管系统、集成服务商的网管系统、应用管理的网管系统、综合网管系统等,传输网管机房内因此摆满了各种网管设备。
比较尴尬的是,企业自己开发建设的综合网管系统可以辅助运行维护工作,但离不开各类设备提供商的网管系统。
维护人员的日常工作虽然已经有了较为成熟的模式,但不得不奔忙在各套网管系统之间,距离管理的自动化和简单化目标还很远。
现有网管系统存在的主要问题
(1)日益扩大的网络规模与网管易读性之间的矛盾
(2)越来越复杂的网管和降低维护人力成本之间的矛盾
(3)用户接入的多样性与通过网管快速反应之间的矛盾
(4)集中式网管与分布式处理、设备现场操作之间的矛盾
(5)设备厂商的网管系统与综合网管系统之间的矛盾
对现有网管工作的建议和对未来网管系统的发展方向建议
现有运维网管工作应逐渐形成合理的网管组织形式,充分、有效地发挥综合网管的作用。
现阶段在IT运维大环境里起领头羊、代表性作用的电信运营企业正在寻找新的盈利模式,朝着综合服务运营商转型的过程中,新型的运营模式对网管系统提出了更高的要求,即网管系统的智能化、综合化、简单化和个性化。
网管的智能化是指繁杂的维护工作由网管系统自动完成,降低人为干预的工作量和工作难度。
网管的综合化要求网管系统能够提供面向网络、业务、用户等多个功能的统一管理。
而实现网管的综合化的前提是网管系统必须能够处理更大的信息量和更复杂的业务行为,更便于集中化的管理。
网管的简单化是指通过减少操作人员的工作难度,降低对操作人员的要求,提高运行维护工作的整体运行效率。
网管的个性化管理是企业精细化运营的必然结果,企业需要深入了解用户和业务的细节,提供最贴近用户的深度感知。
这就要求网管系统必须具备灵活的扩展能力,其管理功能可以根据企业管理的设备类型、管理范围、网络规模、管理形式、业务类型等方便地进行界面定制和模块调整。
结束语
运维网管系统发展到今天已经比较完善和成熟,但仍然需要跟着企业转型的步伐,创新网管开发理念,以满足精细化运维管理的需要。