打造全方位的数据库自动化、自助化平台
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
打造全方位的数据库自动化、自助化平台
目 录 CONTENTS
一、背景与挑战 二、流程管理与上线自动化 三、数据库运维管理自动化 四、总结与展望
背景与挑战——背景
背景
集群规模庞大 业务和流程复杂 架构多样 系统压力大
背单景击与挑增战加——标对应题运维管理解决方案
数据库
流程管
理
系统
性能自
全
监控
动优化
流程管理与上线自动化——上线自动化
常规及BI授权
规则 匹配
应用 获取
授权 申请
授权 审核
执行
基于应用的信息平台
1. 准确的应用分组信息 2. 精细化的部门结构树
规范的审s 核流程
1. 业务部门审核授权需求 2. 数据库部门审核权限
授权信息填写 关联应用平台 多级审核
上线执行
目 录 CONTENTS
切换中任务展示
项目信息
切换类型
源机房
目标机房
任务创建
数据库运维管理自动化——部署与改造
切换中实例展示
跨机房 多集群
按项目
子任务执行
数据库运维管理自动化——部署与改造
研发自助化
集群架构信息查询 集群DNS查询
应用连接情况查询 数据库性能指标查询
数单据击库运增维加管理标自动题化——故障切换
故障切换方案
安装及关联
1.数据库集群安装及 架构信息自动更新
2.集群主机监控自主 添加
3.集群备份设置
数据库运维管理自动化——部署与改造
扩容部署
• 数据源取数据
• 集群数据同步 • 批量校验集群数据
数据获取
安全性
同步及校验 拆分及切换
结果确认
• 备份进程监控 • 同一网段任务数限制 • 压缩传输
• 集群读库拆分扩展 • 从库流量切换
数据持久层
告警处理 数据报表 故障处理 规则匹配 数据处理
代 理 层
数据采集
自定义 日志 网络 数据库 OS 监控项
数据库运维管理自动化——系统监控
监控自动化管理
监控信息 自动添加
资产设备的自主添 加 分组应用的自定义 模板及触发条件添 加
不同应用监控阀 值动态调整
信息获取
告警分级
失效监控自动处理
方
部署
位
改造
自动自 助上线
配置 管理
的 数 据
智能 分析
数据安 全提取
备份 恢复
库
故障
数据
安全
平
切换
结转
审计
台
故障
分布式
自愈
数据库
数据自 助查询
目 录 CONTENTS
一、背景与挑战 二、流程管理与上线自动化 三、数据库运维管理自动化 四、总结与展望
流单程击管理增与加上线标自动题化——流程管理与上线
改造环境部署
1. 项目基础信息 2. 数据库集群架构 3. 研发erp、权限
基础信息
关联系统
1. 集群架构信息批量化更新 2. 监控信息自动添加 3. 备份自动部署
部署
数据核验
1. 基础环境部署 2. 数据库从库的批量部署
批量部署 3. 批量部署中安全性考虑
1. 定时批量的数据校验 2. 异常数据的修复
概要 服务器资源申请分配
数据库上线 数据库授权
数据库 流程 管理
数据库版本升级
…...
统一化 流程化 自动化
流单程击管理增与加上线标自动题化——流程管理与上线
基础模块简图
UI展示 表单模板 工作流引擎 规则引擎 业务模块
语法分析
处理模块 结构化
联合执行
Manager 管理端
CMDB
DNS
BACKUP
自动切换 (dbswitch)
切换平台
• DBA自研发,运用在可自动切换 的数据库集群
• 数据库异常状态监测及自动切换 • 实现数据的自动补齐、校验
• 基于故障点切换 • 基于集群切换 • 基于项目切换 • 基于机房的切换
数据库运维管理自动化——系统监控
监控架构简图 数据展示
资
数
产
据
信
库
息
层
接口层
数据库运维管理自动化——部署与改造
改造切换技术点
数据库集群的批量化切换 切换过程中的数据一致性问题
集群切换异常情况下的回滚
超大集群切换的安全管理
周边关联应用系统的一致化调整
切换
数据库运维管理自动化——部署与改造
改造解决方案
单机切换 按集群切换
无缝切换 多维度切换
按项目切换
切换 系统
数据库运维管理自动化——部署与改造
数据库运维管理自动化——智能分析
性能指标
•数据库及OS性能指标 分析 ຫໍສະໝຸດ Baidu延迟及响应时间监控
容量管理
•性能指标监控 •集群数据汇总 •性能瓶颈分析
性能分析
•数据库日志监控 •慢查询日志
• 扩容是否完成 • CMDB信息是
否更新成功
数据库运维管理自动化——部署与改造
改造中的挑战
挑战
涉及多个机房、几千台数据库,大规模的数据部署 多机房、多核心系统数据库切换不容有失,切换复杂 性能、稳定性的要求,出现的异常情况处理 有大量切换信息沟通,信息沟通的时效性
数据库运维管理自动化——部署与改造
一、背景与挑战 二、流程管理与上线自动化 三、数据库运维管理自动化 四、总结与展望
数单据击库运增维加管理标自动题化——部署与改造
功能要点
定制化的安装策略
支持多版本,单主从,集群部署
自助化下的安全控制 完整部署流程控制 数据库集群改造切换
实现研发自助化权限,DBA权限控制
资产信息关联,数据库批量安装及数据库同步校验, 备份及监控添加
关联资产信息实现 主机扩展信息的实 时获取
多业务应用分组信 息显示
按问题严重性划分 等级
按时间阶段进行告 警升级,持续报警 分级逐级上报
资产过期设备自动 进行监控信息清理
非预处理报警信息 ,未监控项自动汇 总信息并上报处理
数据库运维管理自动化——系统监控
监控功能优化
优化系统监控项,降低监控服务压力,提高监控主机数量 提高监控粒度,优化监控阈值和策略,提高可靠性及时性 不同级别报警信息实现自动恢复,提高故障恢复时效性 优化监控数据的展现,提供对更丰富直观的性能监测数据
切换系统完成数据库集群的改造
批量化资源回收
应用状态查询,数据销毁,资产信息回收
数单据击库运增维加管理标自动题化——部署与改造
安装部署流程简述
信息初始化
主从设置
1.项目及数据库集群 信息获取
2.版本及主机信息配 置批量化设置
3.系统安装环境初始 化
1.数据库集群批量化 添加
2.设置集群数据源 3.集群安全选项设置
基础资源模块
流单程击管理增与加上线标自动题化——上线自动化
要点
信息核对 语法检测 风险评估 数据备份 执行检查
流程管理与上线自动化——上线自动化
步骤说明
1
上线申请
填写上线基础 信息,并进行 基础数据核查
2
语法检测
对提交的SQL 进行语法检测
3
流程审批
流程审批环节
4
预处理
执行状态评估
5
备份及执行
进行可回滚的 基础备份,并 执行及检查
目 录 CONTENTS
一、背景与挑战 二、流程管理与上线自动化 三、数据库运维管理自动化 四、总结与展望
背景与挑战——背景
背景
集群规模庞大 业务和流程复杂 架构多样 系统压力大
背单景击与挑增战加——标对应题运维管理解决方案
数据库
流程管
理
系统
性能自
全
监控
动优化
流程管理与上线自动化——上线自动化
常规及BI授权
规则 匹配
应用 获取
授权 申请
授权 审核
执行
基于应用的信息平台
1. 准确的应用分组信息 2. 精细化的部门结构树
规范的审s 核流程
1. 业务部门审核授权需求 2. 数据库部门审核权限
授权信息填写 关联应用平台 多级审核
上线执行
目 录 CONTENTS
切换中任务展示
项目信息
切换类型
源机房
目标机房
任务创建
数据库运维管理自动化——部署与改造
切换中实例展示
跨机房 多集群
按项目
子任务执行
数据库运维管理自动化——部署与改造
研发自助化
集群架构信息查询 集群DNS查询
应用连接情况查询 数据库性能指标查询
数单据击库运增维加管理标自动题化——故障切换
故障切换方案
安装及关联
1.数据库集群安装及 架构信息自动更新
2.集群主机监控自主 添加
3.集群备份设置
数据库运维管理自动化——部署与改造
扩容部署
• 数据源取数据
• 集群数据同步 • 批量校验集群数据
数据获取
安全性
同步及校验 拆分及切换
结果确认
• 备份进程监控 • 同一网段任务数限制 • 压缩传输
• 集群读库拆分扩展 • 从库流量切换
数据持久层
告警处理 数据报表 故障处理 规则匹配 数据处理
代 理 层
数据采集
自定义 日志 网络 数据库 OS 监控项
数据库运维管理自动化——系统监控
监控自动化管理
监控信息 自动添加
资产设备的自主添 加 分组应用的自定义 模板及触发条件添 加
不同应用监控阀 值动态调整
信息获取
告警分级
失效监控自动处理
方
部署
位
改造
自动自 助上线
配置 管理
的 数 据
智能 分析
数据安 全提取
备份 恢复
库
故障
数据
安全
平
切换
结转
审计
台
故障
分布式
自愈
数据库
数据自 助查询
目 录 CONTENTS
一、背景与挑战 二、流程管理与上线自动化 三、数据库运维管理自动化 四、总结与展望
流单程击管理增与加上线标自动题化——流程管理与上线
改造环境部署
1. 项目基础信息 2. 数据库集群架构 3. 研发erp、权限
基础信息
关联系统
1. 集群架构信息批量化更新 2. 监控信息自动添加 3. 备份自动部署
部署
数据核验
1. 基础环境部署 2. 数据库从库的批量部署
批量部署 3. 批量部署中安全性考虑
1. 定时批量的数据校验 2. 异常数据的修复
概要 服务器资源申请分配
数据库上线 数据库授权
数据库 流程 管理
数据库版本升级
…...
统一化 流程化 自动化
流单程击管理增与加上线标自动题化——流程管理与上线
基础模块简图
UI展示 表单模板 工作流引擎 规则引擎 业务模块
语法分析
处理模块 结构化
联合执行
Manager 管理端
CMDB
DNS
BACKUP
自动切换 (dbswitch)
切换平台
• DBA自研发,运用在可自动切换 的数据库集群
• 数据库异常状态监测及自动切换 • 实现数据的自动补齐、校验
• 基于故障点切换 • 基于集群切换 • 基于项目切换 • 基于机房的切换
数据库运维管理自动化——系统监控
监控架构简图 数据展示
资
数
产
据
信
库
息
层
接口层
数据库运维管理自动化——部署与改造
改造切换技术点
数据库集群的批量化切换 切换过程中的数据一致性问题
集群切换异常情况下的回滚
超大集群切换的安全管理
周边关联应用系统的一致化调整
切换
数据库运维管理自动化——部署与改造
改造解决方案
单机切换 按集群切换
无缝切换 多维度切换
按项目切换
切换 系统
数据库运维管理自动化——部署与改造
数据库运维管理自动化——智能分析
性能指标
•数据库及OS性能指标 分析 ຫໍສະໝຸດ Baidu延迟及响应时间监控
容量管理
•性能指标监控 •集群数据汇总 •性能瓶颈分析
性能分析
•数据库日志监控 •慢查询日志
• 扩容是否完成 • CMDB信息是
否更新成功
数据库运维管理自动化——部署与改造
改造中的挑战
挑战
涉及多个机房、几千台数据库,大规模的数据部署 多机房、多核心系统数据库切换不容有失,切换复杂 性能、稳定性的要求,出现的异常情况处理 有大量切换信息沟通,信息沟通的时效性
数据库运维管理自动化——部署与改造
一、背景与挑战 二、流程管理与上线自动化 三、数据库运维管理自动化 四、总结与展望
数单据击库运增维加管理标自动题化——部署与改造
功能要点
定制化的安装策略
支持多版本,单主从,集群部署
自助化下的安全控制 完整部署流程控制 数据库集群改造切换
实现研发自助化权限,DBA权限控制
资产信息关联,数据库批量安装及数据库同步校验, 备份及监控添加
关联资产信息实现 主机扩展信息的实 时获取
多业务应用分组信 息显示
按问题严重性划分 等级
按时间阶段进行告 警升级,持续报警 分级逐级上报
资产过期设备自动 进行监控信息清理
非预处理报警信息 ,未监控项自动汇 总信息并上报处理
数据库运维管理自动化——系统监控
监控功能优化
优化系统监控项,降低监控服务压力,提高监控主机数量 提高监控粒度,优化监控阈值和策略,提高可靠性及时性 不同级别报警信息实现自动恢复,提高故障恢复时效性 优化监控数据的展现,提供对更丰富直观的性能监测数据
切换系统完成数据库集群的改造
批量化资源回收
应用状态查询,数据销毁,资产信息回收
数单据击库运增维加管理标自动题化——部署与改造
安装部署流程简述
信息初始化
主从设置
1.项目及数据库集群 信息获取
2.版本及主机信息配 置批量化设置
3.系统安装环境初始 化
1.数据库集群批量化 添加
2.设置集群数据源 3.集群安全选项设置
基础资源模块
流单程击管理增与加上线标自动题化——上线自动化
要点
信息核对 语法检测 风险评估 数据备份 执行检查
流程管理与上线自动化——上线自动化
步骤说明
1
上线申请
填写上线基础 信息,并进行 基础数据核查
2
语法检测
对提交的SQL 进行语法检测
3
流程审批
流程审批环节
4
预处理
执行状态评估
5
备份及执行
进行可回滚的 基础备份,并 执行及检查