动环集中运维管理平台应用探析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据不准:脏数据、垃圾数据、数据丢失,边缘
计算能力较弱。( 误报、漏报、丢失)
Data
图 1 动环基础设施 DIKW 模型分析图
1.2 建设原则 动环集中运维管理平台建设需要围绕易用性、可
扩展性、接口开放性、可维护性、稳定性、先进性等 原则进行建设。 1.2.1 易部署原则
充分利用现有资源进行建设,既可与机房主设备 同步建设,也可对已有机房进行补充建设。可根据现 场的传输资源进行组网,包括 IP 资源、无线、物联网等。 1.2.2 可扩展原则
现网动环管理能力较弱,各省仅靠 OMC 系统进行 基本管理,只能实现告警监控、负载率统计、资产管理 等简单功能。从现网调研分析和统计结果看,当前动环 设施运维管理面临诸多挑战,主要包括以下 3 个方面。
(1)缺少集中化监控管理平台。日常维护管理工 作及指标考核数据收集大部分依赖邮件及 EOMS 系统。
· 64 ·
(3)精细化运维管理手段不足。机楼基础运维不 到位、动环设施超负荷运行、带病入网、性能劣化等 问题,缺乏管理规范、预案和管控手段。
(4)系统接入困难、耦合性高。传统动环厂家在 系统对接设置壁垒,导致数据接入、云端协同、系统 建设难以有效执行。
所以,为补齐短板,实现业界领先的动环运维能力, 参照行业标杆经验,打造总部一级动环设施运维管理 平台,实现对全网动环设施运行情况管控,如图 1 所示。
Key words:power and environment;management of centralized maintenance;overall architecture;function introduction
1 需求分析
中国移动现有 45+4 个数据中心、近千栋核心机楼 以及逾 50 万个存量基站。面对如此庞大的动环基础设 施,急需构建业内领先的动环设施支撑手段能力,实 现全网动环设施资源及能力的集中化、精细化、智能 化的可视、可管、可控。 1.1 手段现状
Abstract:This article systematically introduces the construction of the platform of power and environment centralized monitoring management,from requirement investigation,current method,construction principle and design requirements, in-depth analyzing the system architecture and function architecture of the platform. This article also introduces the platform functional modules in detail and expounds the role,significance and good results of the platform,which can provide reference and practical experience for future power and environment monitoring management.
2020 年 2 月 10 日第 37 卷第 3 期
doi:10.19399/ki.tpt.2020.03.027
Telecom Power Technology
Feb. 10,2020,Vol. 37 No. 3
设计应用
动环集中运维管理平台应用探析
任帅 (中国移动通信集团有限公司,北京 100033)
摘要:通过系统地介绍动环集中运维管理平台的建设情况,从需求调研、手段现状、建设原则、设计需求出发,深入 剖析集中运维管理平台的系统架构、功能架构,详细介绍了平台功能模块,阐述了该平台的作用、重大意义、取得的良好效果, 以期为今后动环运维管理提供可参考的实践经验。
关键词:动环;集中运维管理平台;总体架构;功能介绍
Analysis on the Application of Power and Environment Centralized Monitoring Management Platform
REN Shuai (China Mobile Communications Group Co.,Ltd.,BeiJing 100033,China)
智慧不足:目前基于事后报警,缺乏事前预警、预测性维护、 专家决策、深度学习以及AIOps能力。
wisdom
知识欠缺:支撑性运维(性能管理、资源管理、优化管 理以及运维流程等)能力不足。
Knowledge
信息处理:基于单一维度数据简单上报,缺乏有效处理, ormation
(1)不同厂家 FSU 和 SC 互联互通问题。中国移 动现网已建成的动环监控涉及的厂家众多,新建设备 和老系统接口协议不一致,对接存在困难。
(2)各省动环监控系统组网架构不统一。现网动 环监控架构从 2 ~ 4 层不等,组网复杂,亟需推动省级 SC 架构标准化建设,实现省级架构的扁平化和集中化。
收稿日期:2019-11-09 作者简介:任 帅(1986-),男,硕士,工程师,从事通信 电源与机房环境基础设施运行维护管理工作。
(2)监控覆盖面不足,监控与管理不够紧密。基 础设施监控较弱,对能效、资产、容量管理缺失抓手, 对运维与运营等管理维度指标缺少关注。
(3)智能化程度不高。目前,监控主要是实现动 环的基础数据采集,在历史数据分析、故障根因分析 等方面智能化程度不高。
针对上述挑战,深层次分析其中原因主要包括以 下 4 个方面。
平台接入规模与系统处理能力满足项目需求,支 持平滑升级与弹性扩容能力,以满足业务和管理发展
Copyright©博看网 . All Rights Reserved.
2020 年 2 月 10 日第 37 卷第 3 期