北京移动面向5G的技术运营中台实践和AIOps探索
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国移动在14大行业与头部企业开展探索,在2020年 将打造100个标杆示范应用
GOPS 全球运维大会2019·上海站
5G时代电信行业运维面临挑战
01
02
03
04
GOPS 全球运维大会2019·上海站
5G时代ICT融合运维-赋能
GOPS 全球运维大会2019·上海站
业务域技术运营中台, 赋能ICT融合运维:
数据处理和存储
数据服务 异常识别
用户体验分析 生成告警
体验可视化 触发预案
网络升级后诊断
网络数据采集
数据传输和接收
数据处理和存储
数据处理和存储 LTE业务异常识别
隧道LOC告警
触发预案 异常识别 体验优化 调用服务治理 链路告警
故障处理
….
生成告警
….
度量反馈
….
告警消除检测 ….
网络修复预案 ….
GOPS 全球运维大会2019·上海站
技术运营中台设计-能力管控
通过能力开放平台达到中台能力管控的 目标:
GOPS 全球运维大会2019·上海站
技术运营中台-整体框架
前 台
B域运维
M域运维
O域运维
D域运维
监控告警类
采集管理
数据传输
数据接收
数据处理
中
数据存储
数据服务
台
监控可视化 告警管理
实时探测 监控点配置
GOPS 全球运维大会2019·上海站
什么是技术运营中台?
技术运营
技术运营管理过程是技术运营能力建 设的一个过程,它以业务为中心,交 付稳定、安全、高效的技术运营服务, 构建业界领先的技术运营能力,支撑 企业的持续发展和战略成功。技术运 营不仅关注“稳定”、 “安全”、 “可靠”,更要关注“体验”、 “效 率”、 “效益”。
中台能力
监控采集
数据传输和接收
数据处理和存储
异常检测
告警管理
告警管理
预案管理
监控可视化
….
后台应用
云管控
容器PaaS
大数据
机器学习
微服务
5G
需求管理
…
GOPS 全球运维大会2019·上海站
技术运营中台设计-能力复用
• 将能力注册在能力开放平 台上,实现技术运营能力的 开放。
• 前端运维场景通过能力开放 平台调用能力,实现企业级 跨系统的能力复用。
服务流程类
工作流引擎
流程设计
工单管理
待办通知
表单设计 组织角色同步
流程权限
内容模板
流程版本
内容库
值班管理
配置管理类
模型管理 模型关系管理
属性管理 模型自定义
CI管理
自发现
配置数据服务 业务拓扑
监控指标体系服务 CI变更审批
CI变更追溯
运维自动化类
作业编排调度 作业执行
操作审计 作业多主机并发
生产压测 AIOPS
在2018年,中国移动在移动用户、4G用户和宽带用 户均处于Top1
MBBF2019大会上,中国移动宣布将建设高品质5G网 络,赋能千行百业数字化转型:
中国移动提出了5G+战略,包括5G+4G、5G+AICDE、 5G+ECO。通过5G+X,中国移动将赋能各行业数字化
中国移动规划2019年在XX个城市建设XX个5G基站, 2020年将扩大5G网络覆盖到超XX个城市。
CM DB
日志
告警
监控能力规范化
围绕运维对象+指标,将监控覆 盖类型和范围、采集频率、数据 类型等核心属性标准化,并形成 全局唯一编码向告警管理、自动 化操作、事件流转、AIOPS分析 等输出规范化的监控能力
中台建设演变之路
工具化
• 利用工具提升运维效率 • 功能和能力分散,无复用 • 管理松散,一般是团队内共享
STEP
01
GOPS 全球运维大会2019·上海站
STEP
02
STEP
03
中台化
• 企业级能力复用,B域运维 能力赋能ICT
• 更细粒度能力的识别与沉淀 • 更好地支撑前台业务
平台化
• 统一的服务和用户体验 • 有粗粒度的能力复用 • 存在烟囱式建设
参照中国信息通信研究院、高效运维社区制定《研发运 营一体化(DevOps)能力成熟度模型系列标准》
GOPS 全球运维大会2019·上海站
企业级能力复用平台
企业级:站在企业整体视角来审视 业务全景,关注B域、M域、O域、 D域 能力:中台主要承载的对象,从业 务中抽离,梳理技术运营的公共能 力 复用:中台的核心价值,从去重到 复用,对比平台更细粒度的抽离
技术运营中台设计-能力抽象
价值流
5G支撑,ICT融合
故障流程
业务监控采集
数据传输和接收
数据处理和存储
异常识别
生成告警
告警收敛
业务容量管理
服务数据采集
数据传输和接收
数据处理和存储
数据服务
可视化查看
异常识别
用户体验管理 业务连续性保障
体验数据采集 业务监控采集
数据传输和接收
数据处理和存储
数据传输和接收
面向5G的技术运营中台实践和AIOps探索
GOPS 全球运维大会2019·上海站
1 背景介绍 2 技术运营中台 3 技术运营实践 4 AIOps探索 5 未来展望
GOPS 全球运维大会2019·上海站
5G已来,我们也需要下一代运维
到2020年,全球将有500亿设备、无数上层软件及服 务涉及互联网、金融、物联网、智能制造、电信、电 力网络、政府……
• 业务域运维面向通用IT领 域的业务、应用基础设施 等对象,交付运维服务;
• 经历了近20多年的应用 &发展,能够全面赋能、 助推ICT融合转型,实现 全域的运维服务和运营支 撑保障。
5G时代ICT融合运维-进化
GOPS 全球运维大会2019·上海站
数据来源: Gartner @2017
1 背景介绍 2 技术运营中台 3 技术运营实践 4 AIOps探索 5 未来展望
混沌工程
学件管理
场景管理
结束数据导出 数据源配置
后 台
云管平台
容器平台
微服务治理
机器学习平台
大数据平台
GOPS 全球运维大会2019·上海站
1 背景介绍 2 技术运营中台 3 技术运营实践 4 AIOps探索 5 未来展望
GOPS 全球运维大会2019·上海站
技术运营实践-技术运营蓝图
1个愿景 3个核心
5个阶段
3个基石
GOPS 全球运维大会2019·上海站
技术运营实践-基础配置(CMDB)
• 灵活的自定义,提升配置扩展性
Байду номын сангаас
a.自定义模型
c.自定义关系
b.自定义属性
• 支撑多种消费场景
a.业务拓扑
GOPS 全球运维大会2019·上海站
b.资源盘点
d.自定义拓扑 c.资源/监控覆盖率
技术运营实践-系统稳定性保障
GOPS 全球运维大会2019·上海站
技术运营实践-异常发现:监控体系
主机监控 应用监控
1
梳理指标 对指标进行分层,并区
分黄金指标
监控指标体系
2
规范指标定义
形成统一编码,指标属 性等
3
指标体系落地
监控点配置遵循 CMDB里的监控体系
业务监控
.....
GOPS 全球运维大会2019·上海站
监控
APM
GOPS 全球运维大会2019·上海站
5G时代电信行业运维面临挑战
01
02
03
04
GOPS 全球运维大会2019·上海站
5G时代ICT融合运维-赋能
GOPS 全球运维大会2019·上海站
业务域技术运营中台, 赋能ICT融合运维:
数据处理和存储
数据服务 异常识别
用户体验分析 生成告警
体验可视化 触发预案
网络升级后诊断
网络数据采集
数据传输和接收
数据处理和存储
数据处理和存储 LTE业务异常识别
隧道LOC告警
触发预案 异常识别 体验优化 调用服务治理 链路告警
故障处理
….
生成告警
….
度量反馈
….
告警消除检测 ….
网络修复预案 ….
GOPS 全球运维大会2019·上海站
技术运营中台设计-能力管控
通过能力开放平台达到中台能力管控的 目标:
GOPS 全球运维大会2019·上海站
技术运营中台-整体框架
前 台
B域运维
M域运维
O域运维
D域运维
监控告警类
采集管理
数据传输
数据接收
数据处理
中
数据存储
数据服务
台
监控可视化 告警管理
实时探测 监控点配置
GOPS 全球运维大会2019·上海站
什么是技术运营中台?
技术运营
技术运营管理过程是技术运营能力建 设的一个过程,它以业务为中心,交 付稳定、安全、高效的技术运营服务, 构建业界领先的技术运营能力,支撑 企业的持续发展和战略成功。技术运 营不仅关注“稳定”、 “安全”、 “可靠”,更要关注“体验”、 “效 率”、 “效益”。
中台能力
监控采集
数据传输和接收
数据处理和存储
异常检测
告警管理
告警管理
预案管理
监控可视化
….
后台应用
云管控
容器PaaS
大数据
机器学习
微服务
5G
需求管理
…
GOPS 全球运维大会2019·上海站
技术运营中台设计-能力复用
• 将能力注册在能力开放平 台上,实现技术运营能力的 开放。
• 前端运维场景通过能力开放 平台调用能力,实现企业级 跨系统的能力复用。
服务流程类
工作流引擎
流程设计
工单管理
待办通知
表单设计 组织角色同步
流程权限
内容模板
流程版本
内容库
值班管理
配置管理类
模型管理 模型关系管理
属性管理 模型自定义
CI管理
自发现
配置数据服务 业务拓扑
监控指标体系服务 CI变更审批
CI变更追溯
运维自动化类
作业编排调度 作业执行
操作审计 作业多主机并发
生产压测 AIOPS
在2018年,中国移动在移动用户、4G用户和宽带用 户均处于Top1
MBBF2019大会上,中国移动宣布将建设高品质5G网 络,赋能千行百业数字化转型:
中国移动提出了5G+战略,包括5G+4G、5G+AICDE、 5G+ECO。通过5G+X,中国移动将赋能各行业数字化
中国移动规划2019年在XX个城市建设XX个5G基站, 2020年将扩大5G网络覆盖到超XX个城市。
CM DB
日志
告警
监控能力规范化
围绕运维对象+指标,将监控覆 盖类型和范围、采集频率、数据 类型等核心属性标准化,并形成 全局唯一编码向告警管理、自动 化操作、事件流转、AIOPS分析 等输出规范化的监控能力
中台建设演变之路
工具化
• 利用工具提升运维效率 • 功能和能力分散,无复用 • 管理松散,一般是团队内共享
STEP
01
GOPS 全球运维大会2019·上海站
STEP
02
STEP
03
中台化
• 企业级能力复用,B域运维 能力赋能ICT
• 更细粒度能力的识别与沉淀 • 更好地支撑前台业务
平台化
• 统一的服务和用户体验 • 有粗粒度的能力复用 • 存在烟囱式建设
参照中国信息通信研究院、高效运维社区制定《研发运 营一体化(DevOps)能力成熟度模型系列标准》
GOPS 全球运维大会2019·上海站
企业级能力复用平台
企业级:站在企业整体视角来审视 业务全景,关注B域、M域、O域、 D域 能力:中台主要承载的对象,从业 务中抽离,梳理技术运营的公共能 力 复用:中台的核心价值,从去重到 复用,对比平台更细粒度的抽离
技术运营中台设计-能力抽象
价值流
5G支撑,ICT融合
故障流程
业务监控采集
数据传输和接收
数据处理和存储
异常识别
生成告警
告警收敛
业务容量管理
服务数据采集
数据传输和接收
数据处理和存储
数据服务
可视化查看
异常识别
用户体验管理 业务连续性保障
体验数据采集 业务监控采集
数据传输和接收
数据处理和存储
数据传输和接收
面向5G的技术运营中台实践和AIOps探索
GOPS 全球运维大会2019·上海站
1 背景介绍 2 技术运营中台 3 技术运营实践 4 AIOps探索 5 未来展望
GOPS 全球运维大会2019·上海站
5G已来,我们也需要下一代运维
到2020年,全球将有500亿设备、无数上层软件及服 务涉及互联网、金融、物联网、智能制造、电信、电 力网络、政府……
• 业务域运维面向通用IT领 域的业务、应用基础设施 等对象,交付运维服务;
• 经历了近20多年的应用 &发展,能够全面赋能、 助推ICT融合转型,实现 全域的运维服务和运营支 撑保障。
5G时代ICT融合运维-进化
GOPS 全球运维大会2019·上海站
数据来源: Gartner @2017
1 背景介绍 2 技术运营中台 3 技术运营实践 4 AIOps探索 5 未来展望
混沌工程
学件管理
场景管理
结束数据导出 数据源配置
后 台
云管平台
容器平台
微服务治理
机器学习平台
大数据平台
GOPS 全球运维大会2019·上海站
1 背景介绍 2 技术运营中台 3 技术运营实践 4 AIOps探索 5 未来展望
GOPS 全球运维大会2019·上海站
技术运营实践-技术运营蓝图
1个愿景 3个核心
5个阶段
3个基石
GOPS 全球运维大会2019·上海站
技术运营实践-基础配置(CMDB)
• 灵活的自定义,提升配置扩展性
Байду номын сангаас
a.自定义模型
c.自定义关系
b.自定义属性
• 支撑多种消费场景
a.业务拓扑
GOPS 全球运维大会2019·上海站
b.资源盘点
d.自定义拓扑 c.资源/监控覆盖率
技术运营实践-系统稳定性保障
GOPS 全球运维大会2019·上海站
技术运营实践-异常发现:监控体系
主机监控 应用监控
1
梳理指标 对指标进行分层,并区
分黄金指标
监控指标体系
2
规范指标定义
形成统一编码,指标属 性等
3
指标体系落地
监控点配置遵循 CMDB里的监控体系
业务监控
.....
GOPS 全球运维大会2019·上海站
监控
APM