可视化智能IT运维系统课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
容量状况 巡检
性能状况 巡检
信息安全 巡检
IT基础设施监控模块 操作系统监控 网络设备监控
数据库监控 应用中间件监控
存储设备监控 网络拓扑展现
应用拓扑展现 采集策略框架
告警通知框架 统计分析报表
基础设施监控模块
容量管理 计算 规划 分析 推荐及模拟
能耗管理
PUE
WUE
能耗可视化
节能策略
供 多功能 配 电量仪
监控 中心 智能
资源集中监控 网络/应用拓扑 应用性能监控 应用体验分析
运维门户
配置管理 资产管理
协作
服务流程管理 运维即时协同 远程桌面协助 运维知识库
流程 中心
操作 中心
自动
业务系统自动巡检 应用自动交付部署 基础设施自动体检
三
智能化IT运维平台介绍
智能化IT监控运维平台技术架构
三
自动化巡检平台
自动 知识 主动
信息处理
人工
信息提取
信息
信息采集
被动
S 切实地提高服务质量 IT架构的复杂度不断加深;IT运维部门工作职责越来越重
V 真正地降低系统风险
IT运维人员不足难以应对繁重的运维要求;IT事故将直 接影响业务,责任重大
对智能化IT监控运维的期待(效果)
二
可视
运维可视化展示 运维大数据分析
度量 中心
IT运维 工程师
故障精准定位
SLA遵守情况
运维 主管
工作量统计 持续优化的支撑数据
配置/资产管理 业务可用性 流程运转情况
应用性能监控预警 应用体验分析
应用运维 工程师
应用潜在风险预测 应用可用性巡检
对智能化IT监控运维的期待(管理)
二
智能管理方式
传统管理方式
一体化
信息展现
离散
E 更好地进行业务保障 业务的稳定性、可靠性要求越来越高,业务系统对IT支撑 的依赖性越来越强。
告警风暴
!
一天,轮到小李值班,突 然几个系统同时发出告警(告 警风暴),小李哪里见过这阵 仗,顿时感觉手脚无措,能想 到的就是马上给师傅打电话求 助。
小李按照师傅的建议从服 务器开始慢慢排查,从系统告 警到问题解决,已经过去了几 个小时…
期间,由于用户没法访问 系统服务,信息中心接到很多 投诉电话。
业务巡检 自动盲检 巡检定义
统一访问门户 Portal 统一用户管理
应用性能监控模块
JAVA 应用
.Net 应用
统一配置管理
PHP应用
应用性能 分析
统一权限管理
统一菜单管理
大屏展示系统
预测 分析
用户体验 代码级监
监控
控
机器数据分析 安全合规
业务分析
巡检调度
巡检告警
巡检报告
基础设检施巡 基础设施 巡检
资产申请 资产盘点
变更管理 资产规划
变更管理
配置更新 配置审计
资源分配 维保管理
配置模型维护
三维仿真 运维管理 事件管理 工单管理 问题管理 配置管理 变更管理 发布管理 排班管理
知识库管理
库存管理 报废管理
配置统计分析
智能化IT监控运维平台逻辑功能
一
应用系统自动化测试
三
凌乱的测试任务和报告
自动化测试,从目标系统真实操作环境中 创建测试用例,有效降低开发和测试成本。
• 业务形态更加多种多样,部署环境愈加复杂 • 为了适应发展的需求,业务调整日趋频繁
• 云技术的成熟,一定程度上减少了企业自建 运维团队的需求
• 技术的快速演进,对运维团队提出了更高的 要求
二
对未来IT运维的期待
应用场景
应用系统运维工程师
性能监 测
用户体 验
健康检 查
自动巡检
预测分 析
瓶颈定 位
接口测试 边界测试
单元测试
回归测试 冒烟测试 覆盖率测试
集成测试
恢复测试 安全测试 压力测试 性能测试 部署测试
系统测试
确认测试准则 配置评审 A/B测试
确认测试
网络拓扑及流量追踪
最终的结果是,由于出现 被投诉等不良事件,IT运维部 被内部通报批评,小李也被扣 罚当月奖金…
日志
网络
分析系统 监控系统
云环境 应用性能 监控系统 管理系统
这也只是运维工作中一个
服务器 虚拟化 监控系统 监控系统
基础设施 监控系统
小小的缩影。
客户场景之N
IT资源管理
主机 数据库 中间件 动力环境 存储 网络设备 …..
可视化智能IT运维系统介绍
咨询交流
提纲
一 • 现状与痛点&IT运维管理诉求 二 • 对未来IT运维的期待 三 • 智能化IT运维平台介绍 四 • 智能化IT运维平台带来的改变
一
现状与痛点&IT运维管理诉求
现状与痛点&IT监控运维管理诉求
一
从一个真实的故事开始:
风险根源问题 !
!
!
IT运维人员
!
低效地手动构造测试数据 繁重的环境搭建工作
难于管理庞大的配置文件 高昂的日常维护成本
通过自动化测试手段来有效提高开发效率和降低测试成本
• 可视化用例录制,轻松录制创建测试用例。 • 参数化测试数据,保证测试覆盖度。 • 零编码断言配置,配置选项方式设置断言。 • 无污染事务提交,自动清理测试过程垃圾数据。 • 自动化测试任务,自动化执行定制测试任务。 • 图形化测试报告,按需发布测试报告。
业务应用 中间件 数据库 虚拟化 服务器 存储 网络 基础设施
• IT设备规模大且分散、管 理困难
• 缺少可视化管理&自动化管 理手段
• IT环境异构、业务系统繁 多
• 无法快速适应复杂环境设 备的监管
• 人员能力层次ຫໍສະໝຸດ Baidu齐,服务 范围广
• 缺少规范的、自动的流程 化管理
密室之外痛
• 业务负载逐年增加,无法确定功能完整可用 性
电
ATS
发电 机组
UPS
蓄电池 PDU
第三 方
监控 系统
制 冷机
冷 环
冷塔
精密 空调
新风 漏 排风 水
境 温湿度 CO2 微环境
安视
入
全 频门侵
防 监禁 报
护控
警
消 消气 消 防 防体 防 系 报消 喷 统 警防 淋
IT资产管理系统 资产模型维护 出入库与分发
配置管理
资产统计分析 资产配置变更
配置管理
运维主管
资源总 览
运行统 计
容量规 划
流程优化
业绩考核
决策分析
数据中心
业务系统
二
IT基础设施运维工程师
设备监 管
故障处 理
根源分析
流量分析
运行报 告
告警通 知
对智能化IT监控运维的期待(岗位)
二
战略决策支撑数据 部门运转分析支撑数据
业务优化支撑数据
故障预测/主动预警
故障快照/自动处理
运维知识库 IT设施自动巡检
IT运维部门
业务部门
天花板
?
用户体验指标
用户访问响应时间 用户满意指数 系统吞吐量 系统错误率 用户来源地 系统需求执行时长 网络传输时长 数据库SQL执行时 长 …
一
用户体验管理
功能使用是否方 便 系统访问是否缓 慢 系统故障响应和 排除是否及时 …..
现状与痛点:IT监控运维密室的内与外
一
密室之内痛
性能状况 巡检
信息安全 巡检
IT基础设施监控模块 操作系统监控 网络设备监控
数据库监控 应用中间件监控
存储设备监控 网络拓扑展现
应用拓扑展现 采集策略框架
告警通知框架 统计分析报表
基础设施监控模块
容量管理 计算 规划 分析 推荐及模拟
能耗管理
PUE
WUE
能耗可视化
节能策略
供 多功能 配 电量仪
监控 中心 智能
资源集中监控 网络/应用拓扑 应用性能监控 应用体验分析
运维门户
配置管理 资产管理
协作
服务流程管理 运维即时协同 远程桌面协助 运维知识库
流程 中心
操作 中心
自动
业务系统自动巡检 应用自动交付部署 基础设施自动体检
三
智能化IT运维平台介绍
智能化IT监控运维平台技术架构
三
自动化巡检平台
自动 知识 主动
信息处理
人工
信息提取
信息
信息采集
被动
S 切实地提高服务质量 IT架构的复杂度不断加深;IT运维部门工作职责越来越重
V 真正地降低系统风险
IT运维人员不足难以应对繁重的运维要求;IT事故将直 接影响业务,责任重大
对智能化IT监控运维的期待(效果)
二
可视
运维可视化展示 运维大数据分析
度量 中心
IT运维 工程师
故障精准定位
SLA遵守情况
运维 主管
工作量统计 持续优化的支撑数据
配置/资产管理 业务可用性 流程运转情况
应用性能监控预警 应用体验分析
应用运维 工程师
应用潜在风险预测 应用可用性巡检
对智能化IT监控运维的期待(管理)
二
智能管理方式
传统管理方式
一体化
信息展现
离散
E 更好地进行业务保障 业务的稳定性、可靠性要求越来越高,业务系统对IT支撑 的依赖性越来越强。
告警风暴
!
一天,轮到小李值班,突 然几个系统同时发出告警(告 警风暴),小李哪里见过这阵 仗,顿时感觉手脚无措,能想 到的就是马上给师傅打电话求 助。
小李按照师傅的建议从服 务器开始慢慢排查,从系统告 警到问题解决,已经过去了几 个小时…
期间,由于用户没法访问 系统服务,信息中心接到很多 投诉电话。
业务巡检 自动盲检 巡检定义
统一访问门户 Portal 统一用户管理
应用性能监控模块
JAVA 应用
.Net 应用
统一配置管理
PHP应用
应用性能 分析
统一权限管理
统一菜单管理
大屏展示系统
预测 分析
用户体验 代码级监
监控
控
机器数据分析 安全合规
业务分析
巡检调度
巡检告警
巡检报告
基础设检施巡 基础设施 巡检
资产申请 资产盘点
变更管理 资产规划
变更管理
配置更新 配置审计
资源分配 维保管理
配置模型维护
三维仿真 运维管理 事件管理 工单管理 问题管理 配置管理 变更管理 发布管理 排班管理
知识库管理
库存管理 报废管理
配置统计分析
智能化IT监控运维平台逻辑功能
一
应用系统自动化测试
三
凌乱的测试任务和报告
自动化测试,从目标系统真实操作环境中 创建测试用例,有效降低开发和测试成本。
• 业务形态更加多种多样,部署环境愈加复杂 • 为了适应发展的需求,业务调整日趋频繁
• 云技术的成熟,一定程度上减少了企业自建 运维团队的需求
• 技术的快速演进,对运维团队提出了更高的 要求
二
对未来IT运维的期待
应用场景
应用系统运维工程师
性能监 测
用户体 验
健康检 查
自动巡检
预测分 析
瓶颈定 位
接口测试 边界测试
单元测试
回归测试 冒烟测试 覆盖率测试
集成测试
恢复测试 安全测试 压力测试 性能测试 部署测试
系统测试
确认测试准则 配置评审 A/B测试
确认测试
网络拓扑及流量追踪
最终的结果是,由于出现 被投诉等不良事件,IT运维部 被内部通报批评,小李也被扣 罚当月奖金…
日志
网络
分析系统 监控系统
云环境 应用性能 监控系统 管理系统
这也只是运维工作中一个
服务器 虚拟化 监控系统 监控系统
基础设施 监控系统
小小的缩影。
客户场景之N
IT资源管理
主机 数据库 中间件 动力环境 存储 网络设备 …..
可视化智能IT运维系统介绍
咨询交流
提纲
一 • 现状与痛点&IT运维管理诉求 二 • 对未来IT运维的期待 三 • 智能化IT运维平台介绍 四 • 智能化IT运维平台带来的改变
一
现状与痛点&IT运维管理诉求
现状与痛点&IT监控运维管理诉求
一
从一个真实的故事开始:
风险根源问题 !
!
!
IT运维人员
!
低效地手动构造测试数据 繁重的环境搭建工作
难于管理庞大的配置文件 高昂的日常维护成本
通过自动化测试手段来有效提高开发效率和降低测试成本
• 可视化用例录制,轻松录制创建测试用例。 • 参数化测试数据,保证测试覆盖度。 • 零编码断言配置,配置选项方式设置断言。 • 无污染事务提交,自动清理测试过程垃圾数据。 • 自动化测试任务,自动化执行定制测试任务。 • 图形化测试报告,按需发布测试报告。
业务应用 中间件 数据库 虚拟化 服务器 存储 网络 基础设施
• IT设备规模大且分散、管 理困难
• 缺少可视化管理&自动化管 理手段
• IT环境异构、业务系统繁 多
• 无法快速适应复杂环境设 备的监管
• 人员能力层次ຫໍສະໝຸດ Baidu齐,服务 范围广
• 缺少规范的、自动的流程 化管理
密室之外痛
• 业务负载逐年增加,无法确定功能完整可用 性
电
ATS
发电 机组
UPS
蓄电池 PDU
第三 方
监控 系统
制 冷机
冷 环
冷塔
精密 空调
新风 漏 排风 水
境 温湿度 CO2 微环境
安视
入
全 频门侵
防 监禁 报
护控
警
消 消气 消 防 防体 防 系 报消 喷 统 警防 淋
IT资产管理系统 资产模型维护 出入库与分发
配置管理
资产统计分析 资产配置变更
配置管理
运维主管
资源总 览
运行统 计
容量规 划
流程优化
业绩考核
决策分析
数据中心
业务系统
二
IT基础设施运维工程师
设备监 管
故障处 理
根源分析
流量分析
运行报 告
告警通 知
对智能化IT监控运维的期待(岗位)
二
战略决策支撑数据 部门运转分析支撑数据
业务优化支撑数据
故障预测/主动预警
故障快照/自动处理
运维知识库 IT设施自动巡检
IT运维部门
业务部门
天花板
?
用户体验指标
用户访问响应时间 用户满意指数 系统吞吐量 系统错误率 用户来源地 系统需求执行时长 网络传输时长 数据库SQL执行时 长 …
一
用户体验管理
功能使用是否方 便 系统访问是否缓 慢 系统故障响应和 排除是否及时 …..
现状与痛点:IT监控运维密室的内与外
一
密室之内痛