集中性能管理体系
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
面向对象
面向网络 面向客服
价值体现
问题自动定界
提升客户 满意度 提升问题 解决效率 省钱 赚钱 省钱 花钱 定期输出 分析报告
16
4G室分质差小区分 析
面向网络 面向规划
实时人口流量监控分 析
面向社会化服务 面向市场 面向网络
终端与网络业务匹配
面向终端 面向市场
应用一:实时性能监控使得实时客户感知主动保障成为现实
性能管理
实时性能
通过故障 管理落地
资 源 非实时性能 支撑 管 通过网络 理 优化落地 资 源 管 理
支撑
故障管理
网络优化
实时处理
故障管理流程落地
非实时处理(部分)
此外,资源管理是网络运维工作的基础,是支撑集中化 改革和集约化经营的必要条件
代维管理
资源管理
支撑
资源管理
资源管理
支撑
资 源 管 理
主动运维方法(方式)
技术上:在技术体制上福建公司已经建立了“基于五元五阶的样本、空间置换算法是一种高
效的故障定界算法”利器。尺子已经具备,如何发挥杠杆作业? 基于五元的空间维度,周期性调整网络结构(任何粒度如小区级、TAC级、区域级等),在 网络结构组合变化中力求主动发现网元间的协调匹配性及网元潜在的恶化倾向,将潜在的问题
“引导到可控的暴露”。每一步调整前后都紧密依赖尺子度量出的指标,并及时给出评价
管理上:专业间协同作战能力显著增强;主动做事意识增强;全员树立网络端到端能力意识; 网络的灵活性和应急保障能力在日常工作中已经得到强化,做事的严谨性增强。“事前是攻关”
10
主动运维案例一(2015年7月实施)
CMNET
FZBC1 T1600 EBGP
员变动情况,为应急保障提供有力支撑手段。
使用对象:管理人员、网络口各级维护人员
18
应用三:虚拟业务拨测应用
虚拟业务自动拨测系统的主要功能是实现对重要道路沿线小区的各种业务性能指标的监 控,弥补了现场测试采用的终端种类较少以及测试时间受限的问题。将现网用户都作为测 试用户,能够提供该路段及沿路小区级别和用户级别的主要业务性能指标统计结果,帮助 专业人员进行的快速问题定位。 使用对象:网络优化人员、路测人员
劣化),追求网络安全、稳定(不出错)。缺点是当网络质量尤其是客户感知指标出现恶化或劣
化时,运维人员的感知敏感度不高 管理上:这种做法的坏处死水微澜、不求有功但求无过;专业间“好好先生”,缺乏团队协 作精神。团队协同战斗力不佳和主动做事的氛围不好。“事后是问责”
突破 创新
五元五阶的样本空间置换算法可以快速发现网络中各节点之间的性能失衡潜在问题隐患, 运维人员可以根据分析结果有的放矢地进行精确优化,降低运维人力和时间成本,使得 主动运维成为可能。
面向网络 面向客户
省钱 省时 直观 社会责任 省钱 省时 客观 花钱 赚钱 省钱 指导有效花 钱
15
虚拟业务拨测
面向网络 面向规划 面向市场 面向规划 面向网络 面向网络 面向规划
LTE基站与价值品质
微路由应用
应用演示(二)
重要应用
应用说明
基于样本与空间变化,以 用户感知为根本,实现感 知问题快速定界,提升问 题处理效率 构建基于用户感知室分评 估模型,从用户体验反映 室分质量,辅助室分质差 小区优化提升 对人口流动变化实时监测 分析,有力支撑政府服务、 市场业务精细营销,同时 实现小区的驻留能力分析, 辅助网络优化 实现终端与网络的匹配关 联分析,为终端公司投放 终端质量评估提供数据支 撑
“流程管控”,构建生态循环
统一的闭环管控流程,以故障流程 和性能流程为抓手,实现问题快速
解决,应用有效落地,形成各环节
多维联动,促进整个运维生态体系 的健康循环
4
多部门协同合力,打造闭环管理格局
多部门通力协作,以总部的网络运维集中体制改革为契机,“打破”传统的以专业划分的 独立网管系统建设体系,基于大数据中心,通过数据挖掘把网络大数据转化成丰富的场景 应用,支撑网络维护、网络优化、规划建设、市场支撑、客户服务等,切实提升业务质量 和客户感知
数据仓库模型
8
集中性能:树干-树枝-树叶关系图例
按ARPU聚类 年 季度 月 工作日 小区 数据仓库 按年龄聚类 按事件聚类 节假日 按职业聚类 日 用户 时间点 IMEI(终端) 厂家 类型 操作系统小版本 操作系统版本
五元五阶并非5×5 的简 单叠加,而是基于大数据 的多维度数据的上卷与下 钻,实现面向用户感知的 全方位的知识挖掘。
实时性能监控系统采用基于内存预处理技术对精简后的XDR数据进行实时分析统计,得到 小区级1分钟粒度的用户感知密切相关的性能指标,可用于实时性能监控,快速精确定位用户
感知体验较差的小区及业务,实现质差小区的快速排障闭环处理目标。
使用对象:网络口各级维护人员
17
应用二:青运会场馆保障
福建公司基于大数据性能管理平台系统,针对第一届全国青运会,自主开发各大场馆实时 保障系统,实现分钟级别信令数据的实时采集和监视,实时掌握现场场馆业务流量信息和人
目前我省将数据包分为8类(0-10kb、10-50kb、50-100kb、100-500kb、500-1000kb、 1000-5000kb 、 5000-10000kb 、 >=10000kb ),分别统计下载速率和时延,将全省平均
作为衡量标准,高于全省平均的认为达标
取消单一速率评估方法, 采用分数据包大小综合速率评估方法 取消固定阈值评估方法, 采用全省平均作为标准的动态环比评估方法 使用对象:网络口各级维护人员
基于信令的客户投诉分析 高价值客户感知保障功能 用户投诉查询支撑
终端网络业务三维分析 虚拟业务自动拨测 终端/FTP下载分析 13
汇报提纲
1
2
总体思路
工作进展
应用实践
3
14
应Leabharlann Baidu演示(一)
重要应用 介绍说明 面向对象 价值体现
对全省小区分钟粒度实时监控, 精准定位质差用户,实现快速 排障。为实现客户感知主动保 实时性能质量监控分析 障提供重要保障 青运会场馆实时保障 实时监控青运会各主要场馆性 能指标,为青运场馆应急响应 提供有力支撑手段 以大数据为基础,基于真实用 户感知,汇聚路测数据,弥补 路测不足 关联小区价值、流量、服务品 质,指导资源投入方向,保障 网络品质与资源投入的平衡 从微观层面刻画LTE网络路由 信息,全面、高效管控传输网、 无线网、核心网关联信息,实 现问题精准定位
现端到端质量的全流程、无死角分析 涵义
五元:用户、终端、小区、网络、业务 五阶:量化的用户上网的五大步骤(网 络附着、管道建立、域名查询、链接建 立、业务执行)
优势
基于大数据中心的多维度数据上卷与下 钻,实现面向用户感知的全方位的知识 挖掘 体现端到端能力保障和能力运营的最小 变量级,足够完备的保证各应用输出。
闽会资源
21日之前路由如图,厦门局点速率低
XMBC2 T1600 EBGP
XM IDC
厦门EPC问题?
5ms OSPF
FZBR1 NE5000E 2~3ms FW1 E8000E
XMBR2 NE5000E 10-15ms
HRP
OSPF
FW2 E8000E
22日凌晨,路由如图。 调整内容: 调整为XMBR2进,XMBR2出 调整目的: 比较FZBR1和XMBR2不同路由 对LTE下载速率的影响 调整结果:下挂地市速率下降25%,下行 乱序率从21日的3.5%~4%增加到14%, TCP下行重传率从21日的0.55%增加到 1.1% 23日凌晨,路由如图。 调整内容:调整为FZBR1—XMBR2进, XMBR2出 调整目的:定位国干—XMBR2段对下载速 率的影响 调整结果:下载速率没有改善,下行乱序 率从22日的14%增加到19.5%,TCP下行重 传率从22日的1.1%增加到1.85% 7月26日凌晨路由保持不变 调整内容:修改FZBR1到XMBR2方向trunk 链路负载分担模式从逐包为逐流 调整结果:>100k 包速率上涨20%;下行 乱序率从24日的19%降低到3.5%;重传率 从1.7%降低到0.55%,修改后全省各地市 乱序率和重传率基本持平,降低到3.5%。
厦门EPC正常!
厦门BR2问题?
CE1 C7609
CE2 C7609
国干-BR2正常!
XDR探针镜像 S1U接口抓包
FZSAE02BNK
BR1-BR2问题?
PTN
宁 德
南平/三 明/龙岩
莆田
漳州
BR1--BR2参数 调整,大包速 率至少提升 20%以上,部 分档次包提升 40%以上
11
主动运维案例的尺子:下载速率等关键性能质量“标尺”
覆盖指数聚类 干扰指数聚类 切换指数聚类 容量指数聚类
按流量聚类
业务
协议聚类 结构指数聚类 SP服务商聚类 流量流向 数据包特征
重点难点是五阶主 线的“树干-树枝树叶”关系整合
浏览
即时通信
视频
音乐
支付
下载
数据包大小
响应时间
心跳消息频率
9
五元五阶分析法,实现主动运维能力
传统的运维方式 技术上:更多将精力(注意力)放在存量网络的“稳定性”,通常关注指标不恶化(不明显
分数据包下载速率
TCP重传、乱序率
12
应用落地推广,凸显数据价值
拓展现有网元性能管理到端的端的客户体验和业务质量的评估管理,主动发现业务问题和 客户感知问题,围绕服务网络和支撑市场的目标,有效支撑与协同其它部门工作,满足公 司内部全流程管理的面向网络、面向客户、面向规划、面向终端、面向市场五个维度的应 用需求,同时也极力拓展社会化服务应用,如实现对人口流量监控与驻留的动态跟踪(其
跨部门协同合作 网络部 业务支撑 系统部
强闭环:通过技术闭环实现数
据无损传递,达到数据聚合; 通过管理闭环实现知识共享, 达到决策聚合 效率高:确保从前端到后端的 跨部门无缝协作,端到端问题 解决时长大幅缩短
大数据中心 集中 优化
集中 集中 集中 故障 性能 代维
网优中心
网管中心
标准化:统一规范,实现流程、 工单、应用、接口、三标准化, 确保数据无障碍流转
中红色为自主开发,蓝色为诺基亚开发)
实时性能监控 LTE基站与价值评估 基于客户感知指标的TOPN质差小区管控 性能异常自动发现和定界 2G高流量用户迁移 互联网端到端感知分析 高速高铁沿线质量评估 LTE下载速率分析 构建业务微路由,支撑LTE五个面向 CSFB质量分析 4G室分质差小区分析 人口流量监控与驻留分析 栅格化流量分析 精细规划 节日实时保障系统
感知端到端质量、保障端到端能力
推动端到端能力运营
——基于集中性能管理的主动运维体系建设实践
中国移动福建公司
2015年11月
汇报提纲
1
2
总体思路
工作进展
应用实践
3
2
总部关于深化网络运维体制改革指示
“深化网络运维体制改革,推动传统包站式维护向集中管理、统一派单、计次服务 的现代维护模式转变,加快以省为单位的集中故障、集中性能、集中网优和集中代 维管理。”
5
汇报提纲
1
2
总体思路
工作进展
应用实践
3
6
集中性能:我省性能管理愿景
7
集中性能:运用新方法,实现端到端全流程分析预判
以大数据分析为基础,提出五元五阶分析法(FEFP),通过捕捉基于信令的 业务全流程完整记录,获取“五个任何”(任何小区、有任何用户、持任何
终端、使用任何应用获得的任何量化的效果和品质)的关键信息,第一次实
3
我省总体思路
以性能管理为驱动力,以故障管理为基础,实现优化管理、代维管理等各环节联动,促进
网络运维从基于网元的管理向基于客户感知的端到端业务感知的一体化保障体系转变,实现端
到端能力运营
“性能管理”,驱动各环节联动
重点打造性能管理为核心的带头作
用,各环节协同工作,拓展了针对 网络运营数据的分析,始于客户感 知、终于客户感知,打造面向未来 的核心能力
按核心网聚类
出场时期 价格 按网元聚类
制式(5模10频, 3模6频,… )
按商业特征聚类 按地理特征聚类 按厂家聚类 按无线性能聚类
五元五阶一方面体现端到 端能力保障和能力运营的 最小变量级,另一方面足 够完备的保证各项输出。
按MME聚类 按SAE-GW聚类 按用户密度聚类
按POOL聚类 按网元厂家聚类 按DNS聚类 按交换机聚类
——李跃总裁在中国移动2014年工作会议上的讲话
四项改革目标一致、息息相关、环环相扣
四项改革关系示意图
资 源 管 理 资 源 管 理支撑 资 源 管 理
延 伸
故障管理 是实时、高效、标准的网络运维流程体系 ,为性能管理和网络优化提供了流程落地的保障 性能管理 是故障管理的延伸,强化了端到端业务质 量及客户感知问题的分析定位 网络优化是解决性能问题的重要途径和有效支撑 代维管理 是其他三项改革的末梢环节,既解决各项 流程的最终落地,又是保障集中化管理效率的重要 因素