运维体系及相关管理制度
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
服务目录 服务级别协议(SLA,Service Level Agreements) 运营级别协议(OLA,Operational Level Agreements) 支持合同(UC,Underpinning Contracts) 服务改进计划(SIP,Service Improvement Program)
事件管理
提供配置信息及其 相关的历史服务管理信息
变更容量 影响分析
容量管理
SLA
事件升级
服务级别管 理
合同
变更可用性 与连续性 影响分析
可用性与连 续性管理
SLA 提交RFC SLA
问题管理
配置管理
提供配置信息及其 相关的历史服务管理信息
提交RFC
变更安全 影响分析
安全管理
相关SLA变更信息 SLA信息/RFC 安全事 件 变更请求
南京恒天伟智能技术有限公司
HTW
事件管理
SLA的实施是需要不断完善及量化的过程
知识
帮 助 约束 完善 产 生
产生
问题
减少
配置 CMDB
变更/ 发布
南京恒天伟智能技术有限公司
HTW
问题管理
南京恒天伟智能技术有限公司
HTW
问题管理过程
识别,记 录与归类
创建问题单 收集问题信息 设定等级、分类
问题确定
RF 7 (按需) 客户反馈与确认
请求受理者
标准服务请求
RF 1 请求受理与记录
RF 2 请求分类
变更 需求(待开发)
RF 8 客户确认 关闭?
是
否
RF 6 转需求开发流程
关闭
其他流程
需求开发 流程
变更管理 流程
事件管理 流程
请求完成
南京恒天伟智能技术有限公司
HTW
事件测量过程
可用性与解决时间的关系
OGC负责管理,主要适用于IT服务管理(ITSM)。ITIL为企业的IT服务管理 实践提供了一个客观、严谨、可量化的标准和规范。旨在提高IT资源的利用 效率和质量,帮助企业组织改善他们的IT服务管理。
最佳 实践 指南
南京恒天伟智能技术有限公司
HTW
运维管理体系----企业认证
面向机构的IT服务管理的国际标准,是从 IT 服务管理最佳实践 ITIL 中发展而来 。目的是提供建立、实施、运作、监控、评审、维护和改进IT服务管理体系 (ITSM)的模型。建立IT服务管理体系(ITSM)已成为各种组织,特别是金融机构
SLA
变更/发布管 理
修改变更的配置信息 提供配置信息及其 相关的历史服务管理信息
变更请求
业务关系管理
南京恒天伟智能技术有限公司
HTW
运维管理流程---服务等级管理
服务级别管理是为签署服务级别协议而进行的谈判、定义、 评价、管理及以可接受成本改进IT服务质量的流程。服务级 别管理试图在服务质量的供应与需求、客户关系和IT服务成 本之间找到某个合适的平衡点。对于IT服务团队和内部业务 部门以及外部客户来说,认识到服务是一个供应和接收的过 程这一点是很重要的。
HTW
目录
运维的理解及定位 运维管理体系及要点
1 2
南京恒天伟智能技术有限公司
HTW
运维管理体系----个人认证
IT基础架构库(Information Technology Infrastructure Library, ITIL,信息技术
ITIL:
基础架构库)由英国政府部门CCTA在20世纪80年代末制订,现由英国商务部
HTW
变更及发布
南京恒天伟智能技术有限公司
HTW
变更及发布---关键点
变更准备 变更实施 质量控制
变更来源
• • •
事件升级 问题解决 新需求
•
• •
多部门参与
审核与启动 复核与确认
•
• •
多部门参与
按计划执行 安全保障
• • •
变更回顾 变更成功率 避免新问题产生
•
•
审批与排程
方案与测试
•
•
技术保障
服务级别管理--SLA
服务方式
南京恒天伟智能技术有限公司
HTW
服务级别协议--SLA
服务范围
南京恒天伟智能技术有限公司
HTW
服务级别协议--SLA
服务组织
XX服务团队
服务管理者 服务台工程师 运维工程师 支持团队 外围服务团队
初级工程师
Biblioteka Baidu
初级工程师
中、高级
第三方厂商
中、高级工程师
中、高级工程师
的运营管理。
规范管控,实时监控
以工具、流程为着力点,实现运维的规范管理;以管控为支撑,提供运维过 程的实时监控。
固化流程,强化控制
利用标准化手段,固化流程,强化关键控制点,提高风险管控能力,达成客 户满意度
梯队建设,协同综效
初、中、高级运维技术梯队,协同处理,及时分配,高效运转
南京恒天伟智能技术有限公司
ISO20000:
、电信、高科技产业等管理运营风险不可缺少的重要机制。ISO 20000让IT管理
者有一个参考框架用来管理IT服务。
南京恒天伟智能技术有限公司
HTW
各流程关联关系
供应商管理
供应商合同与付款等信息 合同,SLA 资产信息
变更成本 影响分析
提供数据
预算与核算 管理
SLA
相关SLA事件信息 SLA信息
变更验证
南京恒天伟智能技术有限公司
HTW
变更及发布---标准化流程
实施变更管理的难点和重点并不是工具,而是流程 变更发生的时候,有一个标准化的流程去执行,能够预测到这个变更 对整个系统管理产生的影 响,并对这些影响进行评估和控制。 而变更管理流程自动化的实现关键就是CMDB
南京恒天伟智能技术有限公司
HTW
运维管理体系
南京恒天伟智能技术有限公司
HTW
目录
运维的理解及定位 运维管理体系及要点
1 2
南京恒天伟智能技术有限公司
HTW
运维的理解--什么是运维
1 2
运维
项目
在约定的时间内完成约定的事情,达到预期的目标。
项目的建设达到相定时期的必然产物。
3
运维与项目
运维是对实施项目的继承,本身也是一个项目,更多是 长期为项目提供业务及技术支撑。
评审与分 派
问题经理分析问题对业务的影响并确定是否进行调查工作 分派问题给技术专家 问题专家决定是否接受分派
调查与诊 断
确定并记录问题的根本原因 鉴别已经错误
问题解决 问题解决
调查问题或技术专家,确定已知错误 确定参与解决的人员(厂商,内部人员) 有需要提交RFC
问题关闭 更新知识库
验证
南京恒天伟智能技术有限公司
HTW
问题管理—关键点
问题确认 问题解决 质量控制
问题来源
• • •
事件升级 事件主动分析 巡检发现
•
• •
事件的分析
多部门参与 协调资源
•
• •
多部门参与
方案确定 技术保障
• •
产生新的潜在问题 避免新问题产生
•
问题的确定
•
变更的执行
南京恒天伟智能技术有限公司
HTW
变更及发布
南京恒天伟智能技术有限公司
南京恒天伟智能技术有限公司
HTW
服务级别协议—SLA
服务内容及服务标准
可用性: 系统运行时间-业务中断时间/系统运行时间*100%
南京恒天伟智能技术有限公司
HTW
服务级别协议—SLA(报价)
服务收费
南京恒天伟智能技术有限公司
HTW
配置管理--CMDB
南京恒天伟智能技术有限公司
HTW
配置管理--CMDB
南京恒天伟智能技术有限公司
运维的建设定位 ---运维即服务 + HTW 运营
建设定位
协议清晰,职责明确
服务形式、服务目录、SLA(客户协议)、OLA(内部协议)、UC(伙伴协 议)。 由“技术驱动”向“业务驱动”转变,主动的服务提供者向客户(业务部门)
业务驱动,服务运营
提供赖以支撑组织业务运作的IT服务,促进业务成熟度的提升,达成精细化
南京恒天伟智能技术有限公司
HTW
服务级别管理流程
服务级别管理概要流程
服务级别经理 服务级别管理员 客户/管理层
客户服务 级别需求 市场/业务 策略变化 SLA报 告
客户反馈
SLM1 服务级别管 理规划
SLM2 识别定义服 务级别需求
SLM3 制订、协商 与签署SLA
SLM4 SLA监控与 报告
SLM5 SLA评审与 改进
RFC RFC
其他流程
变更发布 管理流程
事件管 理流程
变更发布 管理流程
南京恒天伟智能技术有限公司
HTW
服务级别管理流程
服务级别协议(SLA)
协议期限 服务方式 服务范围 服务内容及服务标准
服务组织
服务报告 服务收费 双方责任 协议变更
南京恒天伟智能技术有限公司
HTW
HTW
事件测量过程
• • • • • • • • •
事件的测量过程-----等于对SLA的测量 解决时间这一指标横跨整个事件 在服务人员处理事件时,当创建的那一刻开始倒计时以 约束并加快处理进程 运维人员的接单需要考虑事件等级与解决时间剩余。 开单时间、接单时间、 首次解决、完成时间、 关单时间 挂起(例外因素如:因客户或第三方造成的等待时间) OLA进行体系内各岗位对运维的工作支撑 按排适合的人处理相关事件成为策略关键
一年之中只能宕机20个小时 客户不会充许你在同一个时间里把20小时用完 宕机是一级故障 一级故障的解决时间是1小时 会强制把20个小时分散到全年之中,以减少对业务的冲 击 如按时解决率等等这些事实是用于服务管理 站在客户方的立场而言有了这些指标就足够约束服务商
南京恒天伟智能技术有限公司
南京恒天伟智能技术有限公司
HTW
配置管理--CMDB
配置管理流程概览
配置经理
CMDB
CM1 配置管理规 划
CMDB 初始化
CMDB模型或 数据的更新
CMDB数 据审计
配置管理员
CM2 配置项定 义与识别
CM3 CMDB控 制与维护
CM4 CMDB审 计与回顾
CM5 定期生成配置 管理报表
其他流程
其他 CMDB例 外报告
变更/发布 管理流程
例外报告
用户/管理层/其 他流程
CI实体 变更
南京恒天伟智能技术有限公司
HTW
配置与其它流程的关系
南京恒天伟智能技术有限公司
HTW
配置管理常规策略
•只有配置经理和配置管理员有权修改配置信息; •IT组件对应的配置项信息的修订由配置管理流程控制; •所有在配置管理范围之内的IT组件的变更都应该由变 更管理流程来迚行。 •每年定期进行配置项审计,审核和验证CI、CI属性、 CI关系等信息,确保CMDB的正确性和完整性;配置 项审计由配置经理负责实施。建议在每年的资产盘点 后,配置管理人员根据资产盘点结果做配置项审计。
南京恒天伟智能技术有限公司
HTW
CMDB—拓扑展现
南京恒天伟智能技术有限公司
HTW
配置库生命周期
南京恒天伟智能技术有限公司
HTW
事件管理
一约束(SLA)、一中心(CMDB)
南京恒天伟智能技术有限公司
HTW
事件管理—请求管理流程
服务请求管理流程
客户
服务请求
邮件/传真等
电话
故障
RF 3 转事件管理流程 RF 4 转事件管理流程 RF 5 转变更管理流程
事件管理
提供配置信息及其 相关的历史服务管理信息
变更容量 影响分析
容量管理
SLA
事件升级
服务级别管 理
合同
变更可用性 与连续性 影响分析
可用性与连 续性管理
SLA 提交RFC SLA
问题管理
配置管理
提供配置信息及其 相关的历史服务管理信息
提交RFC
变更安全 影响分析
安全管理
相关SLA变更信息 SLA信息/RFC 安全事 件 变更请求
南京恒天伟智能技术有限公司
HTW
事件管理
SLA的实施是需要不断完善及量化的过程
知识
帮 助 约束 完善 产 生
产生
问题
减少
配置 CMDB
变更/ 发布
南京恒天伟智能技术有限公司
HTW
问题管理
南京恒天伟智能技术有限公司
HTW
问题管理过程
识别,记 录与归类
创建问题单 收集问题信息 设定等级、分类
问题确定
RF 7 (按需) 客户反馈与确认
请求受理者
标准服务请求
RF 1 请求受理与记录
RF 2 请求分类
变更 需求(待开发)
RF 8 客户确认 关闭?
是
否
RF 6 转需求开发流程
关闭
其他流程
需求开发 流程
变更管理 流程
事件管理 流程
请求完成
南京恒天伟智能技术有限公司
HTW
事件测量过程
可用性与解决时间的关系
OGC负责管理,主要适用于IT服务管理(ITSM)。ITIL为企业的IT服务管理 实践提供了一个客观、严谨、可量化的标准和规范。旨在提高IT资源的利用 效率和质量,帮助企业组织改善他们的IT服务管理。
最佳 实践 指南
南京恒天伟智能技术有限公司
HTW
运维管理体系----企业认证
面向机构的IT服务管理的国际标准,是从 IT 服务管理最佳实践 ITIL 中发展而来 。目的是提供建立、实施、运作、监控、评审、维护和改进IT服务管理体系 (ITSM)的模型。建立IT服务管理体系(ITSM)已成为各种组织,特别是金融机构
SLA
变更/发布管 理
修改变更的配置信息 提供配置信息及其 相关的历史服务管理信息
变更请求
业务关系管理
南京恒天伟智能技术有限公司
HTW
运维管理流程---服务等级管理
服务级别管理是为签署服务级别协议而进行的谈判、定义、 评价、管理及以可接受成本改进IT服务质量的流程。服务级 别管理试图在服务质量的供应与需求、客户关系和IT服务成 本之间找到某个合适的平衡点。对于IT服务团队和内部业务 部门以及外部客户来说,认识到服务是一个供应和接收的过 程这一点是很重要的。
HTW
目录
运维的理解及定位 运维管理体系及要点
1 2
南京恒天伟智能技术有限公司
HTW
运维管理体系----个人认证
IT基础架构库(Information Technology Infrastructure Library, ITIL,信息技术
ITIL:
基础架构库)由英国政府部门CCTA在20世纪80年代末制订,现由英国商务部
HTW
变更及发布
南京恒天伟智能技术有限公司
HTW
变更及发布---关键点
变更准备 变更实施 质量控制
变更来源
• • •
事件升级 问题解决 新需求
•
• •
多部门参与
审核与启动 复核与确认
•
• •
多部门参与
按计划执行 安全保障
• • •
变更回顾 变更成功率 避免新问题产生
•
•
审批与排程
方案与测试
•
•
技术保障
服务级别管理--SLA
服务方式
南京恒天伟智能技术有限公司
HTW
服务级别协议--SLA
服务范围
南京恒天伟智能技术有限公司
HTW
服务级别协议--SLA
服务组织
XX服务团队
服务管理者 服务台工程师 运维工程师 支持团队 外围服务团队
初级工程师
Biblioteka Baidu
初级工程师
中、高级
第三方厂商
中、高级工程师
中、高级工程师
的运营管理。
规范管控,实时监控
以工具、流程为着力点,实现运维的规范管理;以管控为支撑,提供运维过 程的实时监控。
固化流程,强化控制
利用标准化手段,固化流程,强化关键控制点,提高风险管控能力,达成客 户满意度
梯队建设,协同综效
初、中、高级运维技术梯队,协同处理,及时分配,高效运转
南京恒天伟智能技术有限公司
ISO20000:
、电信、高科技产业等管理运营风险不可缺少的重要机制。ISO 20000让IT管理
者有一个参考框架用来管理IT服务。
南京恒天伟智能技术有限公司
HTW
各流程关联关系
供应商管理
供应商合同与付款等信息 合同,SLA 资产信息
变更成本 影响分析
提供数据
预算与核算 管理
SLA
相关SLA事件信息 SLA信息
变更验证
南京恒天伟智能技术有限公司
HTW
变更及发布---标准化流程
实施变更管理的难点和重点并不是工具,而是流程 变更发生的时候,有一个标准化的流程去执行,能够预测到这个变更 对整个系统管理产生的影 响,并对这些影响进行评估和控制。 而变更管理流程自动化的实现关键就是CMDB
南京恒天伟智能技术有限公司
HTW
运维管理体系
南京恒天伟智能技术有限公司
HTW
目录
运维的理解及定位 运维管理体系及要点
1 2
南京恒天伟智能技术有限公司
HTW
运维的理解--什么是运维
1 2
运维
项目
在约定的时间内完成约定的事情,达到预期的目标。
项目的建设达到相定时期的必然产物。
3
运维与项目
运维是对实施项目的继承,本身也是一个项目,更多是 长期为项目提供业务及技术支撑。
评审与分 派
问题经理分析问题对业务的影响并确定是否进行调查工作 分派问题给技术专家 问题专家决定是否接受分派
调查与诊 断
确定并记录问题的根本原因 鉴别已经错误
问题解决 问题解决
调查问题或技术专家,确定已知错误 确定参与解决的人员(厂商,内部人员) 有需要提交RFC
问题关闭 更新知识库
验证
南京恒天伟智能技术有限公司
HTW
问题管理—关键点
问题确认 问题解决 质量控制
问题来源
• • •
事件升级 事件主动分析 巡检发现
•
• •
事件的分析
多部门参与 协调资源
•
• •
多部门参与
方案确定 技术保障
• •
产生新的潜在问题 避免新问题产生
•
问题的确定
•
变更的执行
南京恒天伟智能技术有限公司
HTW
变更及发布
南京恒天伟智能技术有限公司
南京恒天伟智能技术有限公司
HTW
服务级别协议—SLA
服务内容及服务标准
可用性: 系统运行时间-业务中断时间/系统运行时间*100%
南京恒天伟智能技术有限公司
HTW
服务级别协议—SLA(报价)
服务收费
南京恒天伟智能技术有限公司
HTW
配置管理--CMDB
南京恒天伟智能技术有限公司
HTW
配置管理--CMDB
南京恒天伟智能技术有限公司
运维的建设定位 ---运维即服务 + HTW 运营
建设定位
协议清晰,职责明确
服务形式、服务目录、SLA(客户协议)、OLA(内部协议)、UC(伙伴协 议)。 由“技术驱动”向“业务驱动”转变,主动的服务提供者向客户(业务部门)
业务驱动,服务运营
提供赖以支撑组织业务运作的IT服务,促进业务成熟度的提升,达成精细化
南京恒天伟智能技术有限公司
HTW
服务级别管理流程
服务级别管理概要流程
服务级别经理 服务级别管理员 客户/管理层
客户服务 级别需求 市场/业务 策略变化 SLA报 告
客户反馈
SLM1 服务级别管 理规划
SLM2 识别定义服 务级别需求
SLM3 制订、协商 与签署SLA
SLM4 SLA监控与 报告
SLM5 SLA评审与 改进
RFC RFC
其他流程
变更发布 管理流程
事件管 理流程
变更发布 管理流程
南京恒天伟智能技术有限公司
HTW
服务级别管理流程
服务级别协议(SLA)
协议期限 服务方式 服务范围 服务内容及服务标准
服务组织
服务报告 服务收费 双方责任 协议变更
南京恒天伟智能技术有限公司
HTW
HTW
事件测量过程
• • • • • • • • •
事件的测量过程-----等于对SLA的测量 解决时间这一指标横跨整个事件 在服务人员处理事件时,当创建的那一刻开始倒计时以 约束并加快处理进程 运维人员的接单需要考虑事件等级与解决时间剩余。 开单时间、接单时间、 首次解决、完成时间、 关单时间 挂起(例外因素如:因客户或第三方造成的等待时间) OLA进行体系内各岗位对运维的工作支撑 按排适合的人处理相关事件成为策略关键
一年之中只能宕机20个小时 客户不会充许你在同一个时间里把20小时用完 宕机是一级故障 一级故障的解决时间是1小时 会强制把20个小时分散到全年之中,以减少对业务的冲 击 如按时解决率等等这些事实是用于服务管理 站在客户方的立场而言有了这些指标就足够约束服务商
南京恒天伟智能技术有限公司
南京恒天伟智能技术有限公司
HTW
配置管理--CMDB
配置管理流程概览
配置经理
CMDB
CM1 配置管理规 划
CMDB 初始化
CMDB模型或 数据的更新
CMDB数 据审计
配置管理员
CM2 配置项定 义与识别
CM3 CMDB控 制与维护
CM4 CMDB审 计与回顾
CM5 定期生成配置 管理报表
其他流程
其他 CMDB例 外报告
变更/发布 管理流程
例外报告
用户/管理层/其 他流程
CI实体 变更
南京恒天伟智能技术有限公司
HTW
配置与其它流程的关系
南京恒天伟智能技术有限公司
HTW
配置管理常规策略
•只有配置经理和配置管理员有权修改配置信息; •IT组件对应的配置项信息的修订由配置管理流程控制; •所有在配置管理范围之内的IT组件的变更都应该由变 更管理流程来迚行。 •每年定期进行配置项审计,审核和验证CI、CI属性、 CI关系等信息,确保CMDB的正确性和完整性;配置 项审计由配置经理负责实施。建议在每年的资产盘点 后,配置管理人员根据资产盘点结果做配置项审计。
南京恒天伟智能技术有限公司
HTW
CMDB—拓扑展现
南京恒天伟智能技术有限公司
HTW
配置库生命周期
南京恒天伟智能技术有限公司
HTW
事件管理
一约束(SLA)、一中心(CMDB)
南京恒天伟智能技术有限公司
HTW
事件管理—请求管理流程
服务请求管理流程
客户
服务请求
邮件/传真等
电话
故障
RF 3 转事件管理流程 RF 4 转事件管理流程 RF 5 转变更管理流程