集中监控管理平台系统功能介绍
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
内容
包含系统状态、 运维管理、资产 管理三大模块
桌面系统首页
系统五大监控对象及其子系统二层Portal标签,下
模块,用于展现当前有无面以基础平台为例进行讲
重大事件。
述。
事件处理周报,帮助和 公息档告和。栏下, 载用系于统展相示关重 说促 管要 明进 控信 文对 。事件处理的整运各运体维运维月维服报单务:位水事平件情处况理情况
高保障
• 主动预警 • 及时告警 • 快速定位(故障) • 实时掌握(被监控对象 的可用性及健康度)
多层级 视图
• 决策视角 • 管理视角 • 运维视角
辅助决策、重在管理、兼 顾运维细节
目录
1 集中监控管理平台的建设目标与特点 2 集中监控管理平台的监控原理 3 集中监控管理平台对管理的支撑
3.1 桌面系统 3.2 双屏系统 3.3 大屏系统
存储
机房
目录
1 集中监控管理平台的建设目标与特点 2 集中监控管理平台的监控原理 3 集中监控管理平台对管理的支撑
3.1 桌面系统 3.2 双屏系统 3.3 大屏系统
桌面系统说明
从以下三方面对桌面系统 进行全面阐释:
作用
监视系统运行状况 快速定位事件 日常管理 的工作台
特点
为管理层和运 维层分别定制 不同展示内容
二、当前资产地理分布情况
帮助了解资源分布情况
规划资源部署 准确找到故障设备位置
资产管理支撑
三、当前资产产生事件情况
帮助了解哪些厂商的设 备问题较多
设备选型依据
目录
1 集中监控管理平台的建设目标与特点 2 集中监控管理平台的监控原理 3 集中监控管理平台对管理的支撑
3.1 桌面系统 3.2 双屏系统 3.3 大屏系统
评价总体运维水平,为改良运维方式、 提升运维效率提供依据
前4周有效事件 及时解决率趋势
目录
1 集中监控管理平台的建设目标与特点 2 集中监控管理平台的监控原理 3 集中监控管理平台对管理的支撑
E\S系统登录人数统计, 从业务角度来表征系统的 健康度情况。
系统运行管理支撑——仪表盘
一、当前各系统运行状况
点击
帮助了解各系统当前实时健 康度状态
表征系统强健度和稳定性, 促进对各系统管控力度
系统运行管理支撑——事件排行
二、日常维护、例行检查规程的支撑
帮助了解多发事件的故 障点与故障类型
建立日常维护、例行检查 维护点、检查点以及规程
当前事件概览
事件详情及处理情况
第一屏
第二屏
无事件时的系统状态图
分析重大故障对登录人数的影响 登录人数的变化曲线宏观表征E\S系统的运行状态
S系统上周登录人数趋势 E系统上周登录人数趋势
第一屏
第二屏
第三屏
统计展现各运维单位事件处理和运维情 况,让领导、管理人员对各单位的运维 服务水平有一个总体上的了解
共9个,总面积5400平方米(包括网
络间)
网络建设:
接入运营商:联通、电信、
教育网,服务于全国互联网用
户和高校教育网用户
网络架设覆盖全国,支持全
国29个代办处
网络设备数量:总计822台
E、S系统基础设施采:集 主机:小型服机务器56台,服务器
244台
数据库:12套,中间件:24
E系统、套S系统局 内及公众大、内机网:2台 网存站储的:基础平台
帮助了解各运维人员的 事件解决情况
评价考核 事件解决能力
运维考核管理支撑
三、对各运维单位运维整体考核
帮助了解各运维单位的 事件处理历史情况
评价考核 总体服务水平
资产管理支撑
一、当前资产使用情况
帮助了解各系统资源分 配、利用和负荷情况
调整、优化 系统结构
资源利用、分配 与系统扩容评估
资产管理支撑
集中监控管理平台系统功能介绍
2020/6/29
目录
1 集中监控管理平台的建设目标与特点 2 集中监控管理平台的监控原理 3 集中监控管理平台对管理的支撑
3.1 桌面系统 3.2 双屏系统 3.3 大屏系统
集中监控管理平台一期工程建设目标
集中监控管理平台架构和运行管理的 整体框架
机房建设:分布北京、武汉两地,
明确日常维护、例行检查 维护点、检查点关键指标
系统运行管理支撑——当前事件列表
三、对事件处理督办、催办的支撑
帮助了解当前未处理事 件情况及超时情况
事件督办、催办的 管理工具
运维考核管理支撑
一、对运维人员服务态度考核指标
帮助了解各运维人员的 事件响应情况
评价考核运维 服务态度
运维考核管理支撑
二、对运维人员事件解决能力考核指标
系统事件处理情况
系统事件运维情况
第一屏
第二屏
第三屏
第四屏
第一屏
第二屏
第三屏
第四屏
第五屏
有效事件的历史统计及趋势,更加真实有效 的评价各运维单位日常运维、例行检查的保 障服务水平
前4周有效事件 数量趋势
前4周有效事件 数量统计表
第一屏
第二屏
第三屏
第四屏
第五屏
第六屏
前4周系统事件及时 事件响应率及有效事件解决率今趋后势,,还要继响续应按率照趋部势领导指示进一步开发!
全局网络
接口 服务器
机房监控
采集 服务器
E系统实审子系统、 S系统局内业务系统
接口 服务器
大机监控
特点
• 集中监控 • 集中维护 • 集中管理 • 统一展现 • 统一告警
• 业务与基础平台的关联 • 业务与业务之间的关联 • 基础平台与基础平台之间
的关联
• 告警关联
集中性
支撑 关联性
特点
形成IT系统整体健康 度评价体系、为故障 快速定位提供支撑。
监控原理
正常
拓扑展现
告警升级规则 (对象、周期)
告警规则 (对象、周期)
告警信息
性集能中阀监值 控管理平台重事要事件或件压紧缩急过滤
事件规则
性能数据
事件数据
告事
警件
清 除
认 领
事事 件件 恢确 复认
E系统实审子系统
性
能
来自百度文库数 据
业务系统
采
集
事
S系统件 数 据 采 集 局内轻事微件
主机服务器 数据库 中基间础件平台 网络
接口 服务器
总容量:NAS 431.11T,
SAN 171.96T
存储架构:NEA系S统、、SASN系统 设备厂商:IB内M网、存N储et监A控PP、
EMC、HDS、Brocade
数据库 服务器
运维考核为目标 统一事件规则为准绳 集中监控平台为基础
数据库 服务器
监控中心 服务器
监控中心 服务器
采集 服务器
双屏系统说明
作为系统实时运行情 况及其运维情况分析 的一个展现平台
定位
展现的内涵
系统实时运行状态 运维单位运维情况
让部领导和管理人员 直观地看到系统运行 状况及运维情况
作用
E系统 基础设施
机房 展现的内容
S系统 网络
双屏系统展示
第一屏
有事件产生时的系统状态图:
内环:5大监控对象 外环:各监控对象的子模块