数据中心网络管理详细阐述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据中心网络管理详细阐述
一段时间以来,数据中心网络管理从传统的集中式向分布式进行了卓有成效的探索,但随着大规模专业应用体系的快速上线,使分布式管理成本提高。分有分的道理,合有合的优势,分合两者之间的有机结合才能形成强劲的管理手段。
数据中心网络管理之分布式网络管理
如今,服务于企业自身业务发展的自主网络体系日益扩张,结构更加复杂,呈现出地理分布广、接入方式多、对网络性能要求高等多层次化需求。
如果整个网络的运行过度依赖于一个网管中心,那么,一旦网管中心发生故障就容易导致整个网络管理的无序,甚至瘫痪。所以,这种过度集中式网络管理的模式不适于对大规模网络进行实时性要求较高的监控与管理。在这种大背景下,网络管理的层次化分布部署势在必行。
数据中心网络管理之分担负载明晰责权
大型行业均以省、市、地州或行政大区划定了与其业务特性相符的配套网络架构和管理体系。在这种多分布、逻辑架构复杂,且广域特性涉及BGP(边界网关协议)、OSPF(开放式最短路径优先)、多域、单域等多种环境下,要想在单个管理中心实现有效的监控,是不太现实的。数据采样间隔过大时,不能实时反映性能数据的变化趋势,并及时做出应有的反应;
相反,采样间隔过小,面对大型、复杂的网络又会造成管理信息的交换消耗大量的带宽和计算资源,成为系统的I/O瓶颈,造成存储空间的急速增加。例如,在某行业的大型网络实际运维中,用户发现采样间隔由10分钟变为5分钟后,数据量每天递增了20GB。
因此,依据行业的业务特点和网点的分布情况,CIO需考虑地理环境的优势、运维人员的技术支持能力、网络链路资源及机房场地、交通便利条件等诸多因素,选择与企业业务规模相对称的区域级别的网络运维管理中心。各分支机构依据就近接入、统一管理的原则接入网络运维管理中心。这样大量节省了长途链路的资费,提高了相应的互连带宽,各分支机构也有了技术支持后盾。
由于这种网络管理的层次化划分,加上软件产品对分布式部署的支持,可以有效地将事件和性能数据过滤和归并,通过制定一定的管理策略,把有限的管理信息用于向总运维调控中心汇聚。这样,各区域网络运维中心有效地分担了网络管理对细节因素的追踪,同时又能使总运维调控中心具备宏观的视野,从而顾全整个业务体系的正常运转。
从单一的集中式管理走向层次化分级管理是网络管理发展的一大进步,大型网络从一个大的星形结构逐步过渡到层次化星形结构(树形结构),甚至网状结构,其优势是非常明显的。层次化管理模式明确了运维管理的关注点和与之相应的职责,网络有广域、局域之分,那么管理也必定有差异。
数据中心网络管理之采购分布式网管系统五项注意
在大型行业的运维管理中,运维管理中心往往设立在总部机关所在地,其运维重点在于关注广域链路的通断、长途链路利用率、双链路负载均衡、路由抖动、时延等保证关键业务全网通达的技术参数性能。而各分支机构的日常运维事项又与楼层交换、用户终端、网内异常流量审计等内容密切相关。
那些诸如楼层交换设备、用户端故障、局域网内流量异常、病毒局部侵扰等并非广域运维关心的重点。因此,合理的层次化分级管理会有效地处理好这种管理范围和职责的划分。
利用现今网络管理软件对分布式部署的全方位支持,管理员可在局域范围内把网管工作做细,也可通过过滤策略把关键信息上传到运维管理中心,从而把控全网细枝末节的网络健康状态,保证关键业务的顺畅运行。这种分级化管理的方案选型应关注如下几点。
分布式网管在分支机构进行部署时,不宜求全求大,宜求精求实,最好采用统一的系统平台, 避免各自为政采购大型软件,最后因无实施能力导致搁置。
在实际情况中我们不难发现,由于网络建设并非同步进行,而且缺乏统一的实施标准,许多信息部门虽然很有预见性地采购了网络管理配套软件,但由于未考虑它的实施难度和基层技术人员的运维技术水平,导致采购的大型网管软件并不能发挥其产品宣传所能达到的实际运维功能。所以应在一个大的整体策略下,通过集中评测甄选适合本企业统一部署实施的管理软件。
应加强基层技术人员的技术和管理策略培训,并同步进行配套管理策略和制度建设。通过标准化的流程策略和相关制度约束,保证网管策略自上向下地有效贯彻。
企业采购的软件无论是商品化软件或者自主二次开发的平台,应考虑支持分布部署策略和事件上传过滤、归并机制。实际网管实施过程中,告警事件不是报不出来,而是报得太多,“狼来了”喊多了就没人相信了。这在采用了邮件、短信、声、光、电等多种报警模式的情况下尤显突出。做好告警事件的有效归并,不但能减少告警事件量,而且便于故障根源的快速判断和响应。
总运维控制中心应具备基于业务视角的监控运维管理手段。依据关键业务的特性将相关监控管理技术指标用一个维度综合计量,加快故障根源的快速定位与分析,规避“眉毛胡子一把抓”的无序状态; 也能有效避免出现业务故障时,相互推诿责任的现象。
配套行政手段需落实到位,仅靠单纯的技术手段,管理策略并不能完全落实。需建立有效的机制,落实督促管理策略。分布式管理,并不意味着放任自流,而是要通过有效的机制使网络管理工作更加有效。
在规模不是很大、网上业务应用不是很多的企事业单位,可采用分布式管理模式,在数据采集的及时性、技术细节的把控和响应上都会有较好的保证,而且能起到相互冗余的作用。
数据中心网络管理之集中式网络管理
在层次化分级网络管理的基础上,随着网络管理外延的逐步扩充,基于业务的运维管理模式,特别是基于数据大集中的管理模式,又作为一种新亮点凸现出来。
在传统的分布式处理模式下,业务信息分布在不同地理区域的内部服务器上,业务信息的管理和可用性受到了很大限制,许多应该透明、共享的信息在人为的壁垒下不能充分发挥应有的作用,而且系统的升级和新业务的开发部署也都不能及时响应。
加上新业务系统的逐步上线,分布式部署在机房场地的双路供电、空调、机柜布放空间等一系列问题上都明显陷入捉襟见肘的窘境。要想改变这些局面,企业投资金额势必会远远超出新建一个数据中心的预算,并且发展空间受制约。在这种情形下,以业务信息为主导的集中式网管再次走上了历史舞台。
数据中心网络管理之数据走向集中的需求
随着业务规模的扩大,许多应用都面临着数据大集中的问题。数据信息所体现的时效性价值需求日益提高,数据越能及早汇总,就越能体现出相应的价值,这在股票交易、原油交易、电子化贸易等业务实时性要求较高的行业尤为突出。而这些数据及应用系统的多层次化部署,随着配套设备的逐步老化、数据量的急剧增加,带来了运维成本越来越高、时效性越来越差的诸多弊病。
原本一套运维体系所具备的人力、物力、运维手段、硬件支撑环境,在层次化部署环境中需要复制出若干个大小不一但又“五脏俱全”的拷贝,这无疑增大了运维成本支出,也是一种资源的浪费,而且也不符合业务快速发展的需要。
随着网络管理外延的逐步扩展,从单一的网络设备、链路管理,发展到目前针对业务应用所涉及的服务器性能、存储、网络、关键应用监控、流程管理、服务级别管理等一系列基