ISO20000服务能力及可用性管理程序
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
能力及可用性管理
1目的
本文件编写的目的是规范本公司所服务客户的相关IT资源的可用性及能力管理,根据当前和未来的业务需求与服务级别,确保在可接受的时间及成本下, 适当充分地提供所需的IT资源与合理的IT服务以实现业务目标和满足服务等级协议的要求。
2适用范围
本文档适用于公司服务部门为用户提供的IT服务进行能力及可用性管理。
3术语定义
3.1服务级别协议(SLA)
SLA(Service Level Agreement)紫光华宇和客户签订的协议,定义了服务类型、服务内容、服务质量、服务指标等内容,规定了服务需要达成的主要目标和双方具体的责任,是有效的衡量考核工具。
3.2能力管理
确保公司一直保持有效的能力去满足用户当前和未来的业务需求。
3.3可用性管理
按照SLA,对服务实际可用时间和承诺服务时间的比率进行控制和管理。
3.4阀值
指对各项能力监测而设置的临界值。
3.5峰值
指资源对象满负荷运行的最大值。
3.6能力及可用性计划
根据能力现状报告和业务能力需求,确定当前资源状况,预测将来资源需求,分析差距,并说明这些资源需求的相关时间表和成本。
3.7能力及可用性监测指标及范围定义表
定义具体的各种可用性监控范围、可用性监控指标、能力监控范围、能力监控指标、监视的工具、方法和记录方式。
3.8能力及可用性运行月报
对采集的数据进行分析,编制数据报表和制定能力评估报告。
3.9IT资源
IT(Information Technology,即信息技术), 本文中IT资源包括公司承担维护的客户信息系统资源,如硬件、软件、网络、IP地址、机房空间、应用系统等。
4岗位与职责
4.1IT服务管理体系领导组
批准《能力及可用性计划》。
4.2能力及可用性经理
●分析能力及可用性现状以及业务需求,制订《能力及可用性计划》
●汇总制订《能力及可用性监测指标及范围定义表》
●汇总制订《能力及可用性运行月报》
4.3技术专家
●参与制订《能力及可用性监测指标及范围定义表》相关内容
●参与制订《能力及可用性运行月报》相关内容
●实施能力及可用性监控
分析监测记录
5工作程序
5.1能力及可用性管理流程图
5.2能力及可用性管理流程描述
5.2.1能力及可用性需求获取
第一次能力及可用性需求获取。
每年的11月至12月,能力及可用性经理首先走访
客户业务和技术庭室,通过座谈会的形式沟通交流下一年的业务和技术工作发展变化,将其转化下一年的服务能力和可用性需求,然后能力及可用性经理跟项目经理沟通交流本年的项目建设转运维对服务工作的要求,将其转化为下一年的能力及可用性需求,最后能力及可用性经理对比本年初制定的服务目标和SLA,总结本年的运维服务工作,评估能力及可用性计划和实践工作的差异。
能力及可用性经理通过以上三方面的工作,同时依据公司战略发展计划整理出年度能力及可用性需求。
第二次能力及可用性需求获取。
转年2月至3月,能力及可用性经理接收所负责运维服务项目预算申报的最终审批,根据最终预算审批裁剪原有的年度能力及可用性需求,形成最终的年度能力及可用性需求。
5.2.2能力及可用性计划制定
能力及可用性经理针对自己负责的服务运维项目的能力和可用性需求,进行能力与可用性的规划,以满足SLA的要求与运维服务项目未来的期望。
服务能力及可用性的规划,必须要能符合SLA及服务目标的最低要求。
能力及可用性经理负责《能力及可用性计划》的撰写,该计划作为运维服务能力及可用性监控、资源分配及持续改善作业的依据。
《能力及可用性计划》需提交IT服务管理体系领导组审批,经IT服务管理体系领导组批准后发布,作为服务团队执行能力和可用性运维服务工作的规范。
《能力及可用性计划》内容包含:
●当前和预测的能力及可用性需求;
●针对新增服务、服务升级和服务改善定义下列内容:目的﹑权责﹑预算﹑阀值
﹑时间表﹑人员安排﹑风险识别及监控﹑应急措施﹑预测性分析所需的数据
和过程﹑相关资源﹑如何管理、审核和改进服务质量等;
●评估预期的服务升级、变更请求、新技术的影响;
●预计外部变更的影响,如法律;
●对数据和相关信息进行趋势分析。
5.2.3能力与可用性监控
能力及可用性经理和技术支持经理根据《能力及可用性计划》,制定《能力及可用
性监测指标及范围定义表》,定义具体的可用性监控指标、能力监控指标、可用性监控范围、能力监控范围以及SLA的计算公式。
5.2.3.1主机设备能力及可用性监控
技术专家通过主机系统日志每日巡检、硬件(包括硬盘空间、中央处理器、内存等)每日巡检、服务器性能监控系统、每季度全方位检查等方式主动发现可能或潜在对能力及可用性产生影响的事件或问题,并采取相关预防措施和应急预案。
5.2.3.2网络设备能力及可用性监控
技术专家通过网管软件对网络设备状态、性能进行监控、每日巡检、每季度的全方位检查等方式主动发现可能或潜在对能力及可用性产生影响的事件或问题,并采取相关预防措施和应急预案。
5.2.3.3安全设备能力及可用性监控
技术专家通过安全设备日志分析、每周巡检、每季度的全方位检查等方式主动发现可能或潜在对能力及可用性产生影响的事件或问题,并采取相关预防措施和应急预案。
5.2.3.4存储设备能力及可用性监控
技术专家通过每日巡检、查看设备报警日志、每季度全方位检查等方式主动发现可能或潜在对能力及可用性产生影响的事件或问题,并采取相关预防措施和应急预案。
5.2.3.5机房辅助设备能力及可用性监控
技术专家通过对机房辅助设备的每日巡检、报警系统检查和每季度全方位检查等方式主动发现可能或潜在对能力及可用性产生影响的事件或问题,并采取相关预防措施和应急预案。
5.2.3.6音视频设备能力及可用性监控
技术专家通过对音视频设备每日巡检、功能检查、状态检查及每季度的全方位检查等方式主动发现可能或潜在对能力及可用性产生影响的事件或问题,并采取相关预防措施和应急预案。
5.2.3.7系统类软件能力及可用性监控
技术专家通过对系统类软件的告警日志分析、进程检查、系统软件补丁公告以及服务器性能监控系统等方式主动发现可能或潜在对能力及可用性产生影响的事件或问题,并采取相关预防措施和应急预案。
5.2.3.8应用类软件能力及可用性监控
技术专家通过对应用类软件的病毒扫描,安装日志分析和软件运行检查,以及应用软件补丁和病毒库升级安装检查等方式主动发现可能或潜在对能力及可用性产生影响的事件或问题,并采取相关预防措施和应急预案。
5.2.3.9业务系统能力及可用性监控
技术专家通过对业务系统每日巡检、登录检查、内容检查和业务功能流转检查等方式主动发现可能或潜在对能力及可用性产生影响的事件或问题,并采取相关预防措施和应急预案。
5.2.4能力及可用性分析与改进
能力及可用性经理应依据《能力及可用性监测指标及范围定义表》所定义的能力及可用性数据,每月度提交《能力及可用性运行月报》,内容必须包括IT服务监测项﹑监测数据的趋势﹑数据分析﹑改进措施(资源能力调适或升级等)。
根据《能力及可用性运行月报》,能力及可用性经理需要适时制定资源能力调整或升级等改进措施。
IT服务管理体系领导组评估资源能力调适或升级的改进措施对其他服务及资源之影响,并将改进措施列入下一年度的《能力及可用性计划》。
变更发生时,特别是如业务环境发生重大变更时,要评估对能力及可用性计划的影响。
5.2.5能力及可用性技术追踪
技术专家定期对所负责知识领域的新产品以及新技术进行调研和追踪。
5.3与其他流程的关系
6相关二级文件
Q2-CS-01《服务事件管理》
Q2-CS-02《服务问题管理》
Q2-CS-03《服务配置管理》
Q2-CS-04《服务变更管理》
Q2-CS-06《服务级别管理》
Q2-CS-08《服务持续性管理》
Q2-CS-10《服务报告管理》
7三级文件
7.1质量记录模板
7.2文档模板
Q3-CS-07-01《服务能力及可用性日常巡检表》
Q3-CS-07-02《服务能力及可用性监测指标和范围定义表》Q3-CS-07-03《服务能力及可用性计划》
Q3-CS-07-04《服务能力及可用性运行月报》
7.3规则、惯例和约定7.4检查单。