云环境下的企业运维实践
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
私有云
运维管 理平台
公有云
改变成本核算方式, From 设备 to 资源
统一计费
自助化资源申请
提供面向开发人员的自助化资源申请
VM LB
PM
VCS
运维管 理平台
DN S
Mon itor
DB/Ca che/...
LO G
数据化运维
能 耗
优化资源布局 优化网络结构 优化资源分配 优化成本 ......
资源池
端口 绑定
计算资源
云运维自动化
云环境自动部署 云环境一键扩容
申请资源 OA
定制KS
选择物理机 规格 资源预占 提交审批 装机任务 装机完成,推送部署系统 Ansible部 署 云环境部署 部署系统 获取IP 选择镜像
为各个服务 配置对应IP
云运维自动化
故障检查与恢复,提供简单的故障检测与恢复。主要是解决网络配置 带来的VM访问问题。 故障检测: 1. 检查物理链路情况 2. 检查DHCP续约问题 3. 检查宿主机路由配置 4. 检查VM监控信息 ...... 故障检测的方法: 1. 检测脚本 2. 日志分析 3. 监控分析
流 量
运维管 理平台
数据分 析
分 配 ......
云环境下的企业运维实践
目录
01
运维面临的挑战 运维的应对之道
02
03ຫໍສະໝຸດ Baidu
运维管理平台介绍
运维面临的挑战
• • 各种突发需求 资源的多样性 • 运维人员的数量 运维人员的能力 人员培训成本 运维效率
资 源
人 员
• • •
• •
快速变化 资源需求
业 务
技 术
• •
多技术并存 系统架构复杂
•
系统的各种依赖
由国美在线自主研发的数据中心运维管理系统。 是国美在线于私有云实施过程中,结合自身运维需要研发的运维管理平台。
支撑系统
01
CMDB
02
Drone
03
OpenStack
IaaS
04
Tracer
Event Trace
05
Satellite
Workflow Service
06
Keystone
OpenStackKeystone+
获取BMC-IP
生成资源上架规划
生成上架探测 任务
计算资源管理
上架任务 获取基本信息 资源池 ICMP探测 申请资源 装机任务 OA 定制KS
获取IP
裸机管理
pxe安装initramfs 裸机信息
装机完成
选择镜像
部署系统
网络资源管理
上架任务
ICMP探测
资源探测 SNMP
设备信息 转发表 路由表 端口 ...
07
Images
OpenStackGlance+
08
Lycosidae
Network Management
09
ELC
Elastic Logger Cluster
10
PRMS
Physical Resources Management Service
运维管理平台功能
资源规划与感知
选择DC
选择机柜
获取U位
运维面临的挑战
• 开源系统难以 • 与管理流程脱节 效率低下
满足需求
工 具
管 理
•
•
历史记录缺失
平 台
• 标准难统一
标 准
• •
多种平台 各自为政
运维的应对之道
稳定
运维管 理平台 自动化 高效 流程化 标准化 成本
运维管理平台
DCMS(Data Center Management System),
多云管理,混合云支持
API转译 OpenStack
对外提供统一API
运维管 理平台
Endpoints Services Users T enants ... Keystone
VMware API
Vmware
• • • • •
公有云
统一的成本核算
资源由谁提供?No care 计 算 网 络 存 储
运维管 理平台
公有云
改变成本核算方式, From 设备 to 资源
统一计费
自助化资源申请
提供面向开发人员的自助化资源申请
VM LB
PM
VCS
运维管 理平台
DN S
Mon itor
DB/Ca che/...
LO G
数据化运维
能 耗
优化资源布局 优化网络结构 优化资源分配 优化成本 ......
资源池
端口 绑定
计算资源
云运维自动化
云环境自动部署 云环境一键扩容
申请资源 OA
定制KS
选择物理机 规格 资源预占 提交审批 装机任务 装机完成,推送部署系统 Ansible部 署 云环境部署 部署系统 获取IP 选择镜像
为各个服务 配置对应IP
云运维自动化
故障检查与恢复,提供简单的故障检测与恢复。主要是解决网络配置 带来的VM访问问题。 故障检测: 1. 检查物理链路情况 2. 检查DHCP续约问题 3. 检查宿主机路由配置 4. 检查VM监控信息 ...... 故障检测的方法: 1. 检测脚本 2. 日志分析 3. 监控分析
流 量
运维管 理平台
数据分 析
分 配 ......
云环境下的企业运维实践
目录
01
运维面临的挑战 运维的应对之道
02
03ຫໍສະໝຸດ Baidu
运维管理平台介绍
运维面临的挑战
• • 各种突发需求 资源的多样性 • 运维人员的数量 运维人员的能力 人员培训成本 运维效率
资 源
人 员
• • •
• •
快速变化 资源需求
业 务
技 术
• •
多技术并存 系统架构复杂
•
系统的各种依赖
由国美在线自主研发的数据中心运维管理系统。 是国美在线于私有云实施过程中,结合自身运维需要研发的运维管理平台。
支撑系统
01
CMDB
02
Drone
03
OpenStack
IaaS
04
Tracer
Event Trace
05
Satellite
Workflow Service
06
Keystone
OpenStackKeystone+
获取BMC-IP
生成资源上架规划
生成上架探测 任务
计算资源管理
上架任务 获取基本信息 资源池 ICMP探测 申请资源 装机任务 OA 定制KS
获取IP
裸机管理
pxe安装initramfs 裸机信息
装机完成
选择镜像
部署系统
网络资源管理
上架任务
ICMP探测
资源探测 SNMP
设备信息 转发表 路由表 端口 ...
07
Images
OpenStackGlance+
08
Lycosidae
Network Management
09
ELC
Elastic Logger Cluster
10
PRMS
Physical Resources Management Service
运维管理平台功能
资源规划与感知
选择DC
选择机柜
获取U位
运维面临的挑战
• 开源系统难以 • 与管理流程脱节 效率低下
满足需求
工 具
管 理
•
•
历史记录缺失
平 台
• 标准难统一
标 准
• •
多种平台 各自为政
运维的应对之道
稳定
运维管 理平台 自动化 高效 流程化 标准化 成本
运维管理平台
DCMS(Data Center Management System),
多云管理,混合云支持
API转译 OpenStack
对外提供统一API
运维管 理平台
Endpoints Services Users T enants ... Keystone
VMware API
Vmware
• • • • •
公有云
统一的成本核算
资源由谁提供?No care 计 算 网 络 存 储