IT运维管理解决方案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通过事件策略设置可设置声、光、电告警通告规则
www.qzict.com
➢ 建立配置管理数据库 ➢ 基本的资产信息自动获得 ➢ 配置文件的检查、分析及备份 ➢ 资产分类查询与统计 ➢ 设备口令的统一管理 ➢ 故障监测与资产信息有效的关联
资产管理
通过存如到数据库的CMDB配置信息,可管理包括设备型 号、名称、板卡、序列号、合同号、服务商等重要信息。还可 以对资产信息进行分类查询与统计、配置文件检查、设备口令 统一管理等管理。故障监测与资产信息的关联,可将故障第一 时间得知相关人员。
成都勤智数码科技有限公司拥有如 下资质:
➢ (1) 国家双高双软企业、高新技术企业; ➢ (2) ISO9001:2000质量管理体系认证和软件成熟度
CMMI3认证; ➢ (3) AAA级银行信用企业; ➢ (4)中国电信下一代IT运维平台开发合作伙伴; ➢ (5)信息产业部IT运维管理服务平台标准参与制订者 ➢ (6)ISO20000运维服务标准认证 ➢ (7)ISO27001运维安全标准认证
数据库告警数据
数据库状态 表空间状态 有无死锁产生 表空间使用率
数据库配置数据
数据库配置信息 数据库内存配置信息 数据库内表空间的信息 数据库日志空间或回滚段信息
www.qzict.com
ITManager优势
网络基线及基线阀值
✓网络系IT统当M好前处的a健n康a状况ge运r维突经理出: 的优客点户总需求结
主机告警数据
故障告警 性能阀值告警 SYSLOG
主机配置数据
日志配置信息
www.qzict.com
产品优势
数据库性能数据
数据库内存使用信息 数据库内表空间的读写次数 数据库特定表的空间性能信息 数据库表空间的利用情况 数据文件或数据设备的读写次数 数据库碎片的情况 数据库日志空间或回滚段使用情况 数据库锁使用情况 数据库用户占用资源情况 …
www.qzict.com
IT运维管理面临的一些主要问题
➢ 主动式、预警管理的运维系统能力的需要进一步提升,以提高网络系统的 高可用性
✓ 缺乏统一的监控,如能对思科设备、华为设备、主机、数据库等进行集中监控和分析 ✓ 缺乏预警功能 ✓ 缺乏故障的及时检查、故障定位功能 ✓ 缺乏智能的网络健康检查功能 ✓ 缺乏及时通告(短信、Email)功能 ✓ 缺乏SLA监控和评估功能 ✓ 缺乏完善、灵活的报表统计和报表生成功能
www.qzict.com
数据采集
AIX
HP UNIX
Telnet/SSH
Solaris
IT Manager
JDBC
Windows Server
服务器
数据库
DB2
防火墙
SNMP
交换机 路由器
网络设备
www.qzict.com
业务视 图监测
7*24状态监控
拓扑状 态监测
故障状 态监测
www.qzict.com
✓ 运维人员工作量、压力较大
✓ 人员需要不断保持技术更新
➢ 在IT服务管理的质量方面有困惑,业务部门对于IT服务质量或者IT服务 所提供的服务的范围不满意
➢ 希望通过IT分析来减少IT成本
➢ 希望对自己运维实现量化
www.qzict.com
➢ 运维需求理解 ➢ IT Manager解决方案及优势 ➢ IT Manager监控系统介绍 ➢ IT Manager服务管理系统介绍 ➢ IT Manager成功案例
www.qzict.com
公司介绍
勤智数码IT Manager典型案例与客户:
➢ 民生银行总行及全国二十余个分行IT运维管理保障平台 实施中
➢ 贵州省移动公司全省营业厅综合管理系统 实施中
➢ 陕西省全省电子政务运维管理平台 已实施结束
➢ 杭州电信IT管理支撑平台
已实施结束
➢ 河南省网通IT服务管理平台
40% 系统架构和 应用程序故障
➢培训 ➢自动化工具 ➢变更管理 ➢问题管理
➢缺乏明确的IT系统的可用性目 标,即使有,也是通过对软硬件 系统的可用性指标的叠加得到,
而非通过对业务的影响程度所设
Source: Gartner Group
定
•遗忘 •缺乏流程 •培训 •安全意识
➢体系架构和设计 ➢变更管理 ➢问题管理 ➢配置管理 ➢性能管理 ➢容量计划
➢缺乏较好的监控系统及服务管 理系统
被动服务 =〉服务不及时 =〉失望的结果 =〉不满意
www.qzict.com
运维需求理解
➢ 全年只允许53分钟计划的Down机时间, 可用性必须要达到99.99%以上
➢ 但是靠硬件根本无法保障99.99%的可 用性
➢ 需要从整个IT系统的评估、规划、优 化、监控、服务管理再加上基础设施 的服务才能完全保障99.99%的可用性
➢ 勤智数码科技有限公司的主要产品IT Manager,在技术上处于国内领先的地位, 填补了多项国内技术空白。 产品用户涉 及运营商、金融、电力、政府、企业等多 个行业,客户地域范围跨越全国多个省、 市,并保证了优异的运行效果,目前投入 使用的系统获得用户的广泛赞誉。
www.qzict.com
公司介绍
www.qzict.com
解决方案介绍
监控人员、维护人员、管理人员
应用展现层
监控系统
故障监控 拓扑应用 报表展现
数据处理层 监控数据库 告警处理 配置处理 性能处理
数据采集层
告警采集 配置采集 性能采集
服务管理系统
事件管理 变更管理
知识库
问题管理 配置管理 SLA
流程支撑层
服务管理数据库 含CMDB
应用KPI
业务KPI
www.qzict.com
产品优势
路由器 日志文件
邮件系 统
交换机
防火墙
数据库
服务器
集中监控,统一管理
存储设备
设备配置信息
完善的网络 保障措施
统一密码保护 设备资产
用户管理
强大的事件 整合机制
声音
短信
邮件
将复杂的网络运维于ITManager来完成, 全面提高网络运维质量。
www.qzict.com
➢ 运维需求理解 ➢ IT Manager解决方案及优势 ➢ IT Manager监控系统介绍 ➢ IT Manager服务管理系统介绍 ➢ IT Manager成功案例
www.qzict.com
ITManager监控系统介绍
资产报表
www.qzict.com
功能介绍
/
数 据
拓扑 & 监控示图
丰富的数据采集指标
网络设备性能数据
网络设备综合性能指标:CPU、 内存、缓存等
网络性能指标:延迟、利用率、 可用性、端口流入/流出流量、 错包数、丢包数等
网络设备告警数据
故障告警 性能阀值告警 SNMP Trap
网络设备配置数据
设备配置信息
产品优势
主机性能数据
主机CPU管理 主机内存管理 主机磁盘管理 主机文件系统管理 主机进程管理…
➢ 自动化、标准化运维流程系统的缺乏和优化,以提供运维效率、降低运 维压力
✓ 没有知识库积累和自动修复建议功能 ✓ 缺乏完善的突发事件管理、问题管理、配置管理、变更管理流程
➢ 运维人员的短缺,需要增加相关人员或培训,或进行部分运维工作外包, 以便移动运维人员更加关注于核心业务
✓ 运维人员工作人员较少
已实施结束
➢ 浙江省联通IT服务管理平台
已实施结束
➢ 湖南省电信IT服务管理平台
已实施结束
➢ 杭州小网通(广电)综合网络管理平台 已实施结束
➢ 中国移动卓望移动梦网应用监控管理系统 已实施结束
➢ 内蒙古电力生产管理系统
已实施结束
➢ 云南省电信163网络网管系统
已实施结束
➢ 云南省农行网管系统
已实施结束
www.qzict.com
➢ 公司介绍 ➢ IT运行维护需求理解 ➢ IT Manager解决方案及优势 ➢ IT Manager监控系统介绍 ➢ IT Manager成功案例
www.qzict.com
成就高可靠的IT的主要障碍,源于我
们对于系统高可用性各环节上的一
“80%的停机由于人为错误和流程的问题”
✓能否准确的检测到故障发生;
✓能否进行及时告警?
✓能否实现告警的一些策略:压缩、过滤、关联等?
与KVM 设备的集成 ✓便于网络维护,同时减少 故障恢复时间
CMDB
✓便于配置信息的查找及管 理
集成ITmanager服务 ✓包含流程化的服务管理系
管理系统
统
运维人员:
✓能否实现集中的及远程监控及维护呢? 运维人员:
呈 现
报表
数
据
处 理
事件数据库
业 (Event Server)
务
逻
辑
性能阀值
变更
数据库 (DB)
事件/故障
KPI性能采集
配置采集
故障采集
数
SNMP/ICMP
脚本文件 ……… ……… ………
SNMP Trap
据
Rping
SNMP/Telnet
Syslog/Logfile
采 集
网络设备/主机/数据库/中间件
IT系统集中监控及运维 管理解决方案
成都勤智数码科技有限公司
2011年
www.qzict.com
➢ 公司介绍 ➢ IT运行维护需求理解 ➢ IT Manager解决方案及优势 ➢ IT Manager监控系统介绍 ➢ IT Manager成功案例
www.qzict.com
公司介绍
➢ 勤智数码科技有限公司创建于2005年,是 一家为最终用户提供IT运维管理服务基础 平台整体解决方案(包括软件、工具、流 程制定及策略设计以及人员、备件、合同 管理平台等)的高新技术企业。
7*24无间隙的网络性能监控平台
➢7x24 性能KPI监控
对网络提供7x24 CPU/MEM,线路利w用率w等w监.q控zict.com
丰富的设备性能和信息展示:网络设备
www.qzict.com
丰富的设备性能和信息展示:主机设备
www.qzict.com
丰富的设备性能和信息展示:数据库
www.qzict.com
✓衡量网络的使用率
✓网络带宽几容量是否满足?是否 需要扩容?
✓预测潜在的故障,进行预 运维人员:
警
✓能否实现可以进行预警,缩短故障时间;防患于未
然?
SLA的监控、统计 ✓可以更好的监控及管理SLA 运维经理:
✓是否能满足业务的需要?
快速的事件检测、通 告、派发、处理
✓可以大大缩短故障的中断 时间
✓是否能实现给用户的承诺? 运维人员:
主机 网络
应用 数据库
中间件
其他 www.qzict.com
ITManager监控
关键指标数字化采集、监控、分析: ▪ 7*24系统健康、故障监控 ▪ 为量化考核提供依据 ▪ 从业务视图- 资产平台- 故障的定位
桌面KPI 安全KPI
网络KPI
服务器 KPI
Web KPI
数据库 KPI
Mainfram e Events
客服
www.qzict.com
➢ 拓扑的自动发现 ➢ 手动编辑 ➢ 分组显示及分层定位 ➢ 和故障告警、性能阀值和报表相关联
拓扑功能
强大的拓扑自动发现引擎,搜索网络中所有设备。
www.qzict.com
➢ 7X24事件、故障监测 ➢ 事件状态变更及跟踪 ➢ 事件通告 ➢ 事件分析及修复建议 ➢ 事件整合策略 ➢ 事件统计报告
丰富的设备性能和信息展示:中间件
www.qzict.com
灵活周全的性能阀值
❖ 可以对不同设备、不同链路设置静态(固定的)的或动态(根据基线的偏移 值)告警阀值
www.qzict.com
端到端链路SLA监测
通过强大的SLA监测引 擎,真正实现端到端链路级 监控。
www.qzict.com
拓扑管理
些错误认知
•硬件 •操作系统 •网络 •电源、灾难
•未经测试的变更 •负载超额 •较差的问题管理 •不合理的架构
➢冗余技术 ➢服务协约(SLA) ➢可用性监控
➢将信息系统的高可用性看成为 产品质量问题的孤立事件,指望 依赖软硬件产品质量的提升来改
➢面向流程的纪律、 进系统的可用性
规定
百度文库
20% 软硬件故障 40% 人为故障
✓能否实现统一的资产管理呢? 运维经理:
✓流程化,标准管理,提高运维效率 运维人员:
报表及任务定制
✓减轻工作压力 ✓实现所有客户所需的报表 运维经理:
✓考核能否标准化、流程化?
运维人员:
用户、角色管理
✓实现分级及分组等管理
✓能否减轻运维的工作量?
运维经✓理能: 否实现不同角色,有不w同w的w权.限q及z功ic能t.?com
事件监控
对用户网络提供7x24事件及故障监控,包括节点Down、链 路Down、以及超过阀值的事件等。提供对事件的压缩、过滤、 定额、互斥、拍发、跟踪等处理
www.qzict.com
事件监控展现 www.qzict.com
事件处理机制 www.qzict.com
事件策略设置
短信 报警
邮件报警
声音报警
www.qzict.com
资产管理 www.qzict.com
资产管理 www.qzict.com
配置备份 www.qzict.com
➢ 性能报表 ➢ 事件报表 ➢ 资产报表