运维服务指标体系

合集下载

ITSS-6-3 运维服务能力指标体系-模板6

满意度调查得分/满意度调查总分注：包括通过电话、邮件等各种方式进行的问卷调查
≥90% 招聘到岗人数/计划招聘人数 *100 %
运维部质管部综合部
2.人员 3.资源
2.2 培训计划完成率
≥90% 实际完成的培训次数/计划完成的培训次数 *100 %
2.3 培训人员到场率
2.4
关键岗位储备计划完成率
3.1 服务台请求关闭率
≥90% ≥85% ≥95%
实际培训到场人数/计划培训人员数 *100 % 关键岗位实际储备人数/关键岗位计划到岗人数 *100 % 服务台请求关闭数量/服务记录服务请求数量
3.2 知识条目贡献量
≥10条统计知识库每季度新增的.1
技术研发按计划完成率
5.1
年度重大安全生产事故
5.2
服务报告按计划提交率
≥100% 实际研发完成数/计划需求研发完成总数*100%
技术部
0次／项目
信息安全泄漏或核心业务系统停机、数据丢失等被顾客通报的重大事故数量
运维部
≥90% 当期实际提交服务报告数/计划提交服务报告总数 * 100 %
运维服务能力指标体系
分类序号
指标名称
目标
指标计算公式
部门
1.1 运维年收
≥XX万年度运维收入总额（超保及外接运维业务，不含质保期内服务）
运维部
1.质量目标 1.2 SLA达成率
1.3 客户满意度 2.1 招聘人员到岗率
≥90% ≥90%
当期已达标的项目级SLA数量／当期应达标的项目级SLA总数＊ 100%
考核频率季度年度季度
半年度季度季度季度月度季度季度年度季度季度季度季度

it运维服务管理指标

it运维服务管理指标IT运维服务管理指标随着信息技术的快速发展，IT运维服务管理在企业中扮演着至关重要的角色。

无论是保障系统稳定运行，还是提供优质的技术支持，IT运维服务管理都需要有一套科学有效的指标体系来衡量和评估。

本文将从不同的维度介绍IT运维服务管理的指标，帮助企业更好地管理和优化IT运维服务。

一、服务可用性指标服务可用性是衡量IT运维服务质量的重要指标之一。

它反映了系统或服务在一定时间内可正常使用的能力。

常用的服务可用性指标包括：1.1 系统可靠性：反映系统在一段时间内的故障次数和故障恢复时间。

例如，平均故障间隔时间（MTBF）和平均故障恢复时间（MTTR）。

1.2 服务可用性率：反映系统或服务在一段时间内可用的比例。

例如，99.9%的可用性表示系统每年最多只有8小时的停机时间。

1.3 服务质量指标：反映系统或服务在提供服务过程中的性能表现，如响应时间、吞吐量等。

二、问题管理指标问题管理是IT运维服务管理中的重要环节，它涉及到对故障、变更和事件等问题的有效管理和解决。

以下是常用的问题管理指标：2.1 问题解决率：反映问题解决的效率和质量。

通常以问题解决的平均时间和解决率来衡量。

2.2 问题重复率：反映同一问题在一段时间内的重复发生情况。

较高的问题重复率可能意味着解决问题的根本原因没有得到有效解决。

2.3 问题溢出率：反映无法解决的问题数量。

较高的问题溢出率可能意味着团队的能力不足或问题管理流程不完善。

三、变更管理指标变更管理是IT运维服务管理中的关键环节，它涉及到对系统和服务的变更进行规范、控制和评估。

以下是常用的变更管理指标：3.1 变更成功率：反映变更实施的成功率和质量。

通常以变更成功的比例来衡量。

3.2 变更失败率：反映变更实施的失败率和原因。

较高的变更失败率可能意味着变更管理流程不完善或变更实施缺乏规范。

3.3 变更影响度：反映变更对系统和服务的影响程度。

较高的变更影响度可能意味着变更实施风险较大，需要更加谨慎评估和控制。

运维服务绩效考核指标

运维服务
3.2 发现问题
说明：待完善
1、考核内容按不同职位不同项目，分为五个等级：好、较好、一般、较差、差，总分100分。

2、每名运维人员总分不得低于70分，否则按不合格计。

3、考核指标排在最末的和不达标的，需要以书面形式写出原因及改进方案，并绩效奖金扣？%。

4、当月考核指标达到90分以上，绩效奖金给予奖励？
5、连续6个月考核指标达到90分以上，月薪资提升？%
维服务绩效考核指标（v1.1）
、较差、差，总分100分。

进方案，并绩效奖金扣？%。

10
运用技术问题发现率发现问题次数/运用技术总数
好10 、较好8、一般6、较差4、差2。

信息技术服务运维质量评价指标体系

0≤X≤1 X越接近1越好
数据类
型 A=计数 B=计数 X=数值
及时解决率
咨询服务供方对咨询服务请求的解决速度。
统计并比较及 X=A/B 时解决的咨询 A=解决时间符合需方要求的服务请求服务请求的数数量量与总的咨询 B=总的咨询服务请求数量服务请求数量。
0≤X≤1 X越接近1越好
A=计数 B=计数 X=数值
对服务供方建立并实施保密策略和制度的情况进行检查
供方咨询服务的成果是否满足供需双方确认的要求咨询服务过程记录是否完整
咨询的交付物通过需方验收的比率
过程留存记录数，与咨询服务实施计划中定义的工作内容项进行比较
公式及数据元计算
X=A/B A=获得需方认可的已实现的咨询服务内容项的数量 B=咨询协议中约定的咨询服务内容项总数量 X=A/5，A取值从1，2，3，4，5，其中： 1：既未建立计划，也无风险应对机制，实施不到位； 2：未建立计划，但有一定程度的风险应对机制；3：建立计划和风险应对机制，但实施不到位；4：建立计划和风险应对机制，实施良好；5：建立计划和风险应对机制，实施良好，且全员宣贯到位并定期进行演练 X=1-A/B A=特定时间段内供方流失的咨询人员数量 B=特定时间段内供方的咨询人员数量
咨询服务内容与中约定的咨询服
实现的完整程务数量的比值。
度
评价供方是否对咨询服务的连续
建立了连续性性计划及其准备程
计划及其准备度的建立与实施情
程度
况进行检查
供方为保证咨询协议得到连续实施而保持咨询团队的稳定性测评咨询服务供方是否具备应对保密问题的能力
评价特定时间段内的人员流失率

11-运维指标体系

运维指标体系培训
主讲人：江苏分公司马翼飞 2017年5月
目录
一、运维指标组成二、各专业共性指标三、各专业关键指标
运维指标的组成
运维指标体系分为三个层面，第一层为客户服务类指标，聚焦对客户承诺的设施及服务质量；第二层为运行管控类指标，通过对维护管理关键要素的量化评价，查找短板提升服务质量；第三层为设备运行类指标，重点关注设备层各项运行指标，为精细化管理奠定基础。
4、安全生产事故频次指标定义：发生安全事故的总数，考评各分公司安全生产管理能力；取数来源：省分公司上报或运营商投诉统计时间：年度达标要求：全年安全生产无事故
共性指标
5、资源数据准确率
指标定义：考评各分公司站址资源数据填报完整性、填报内容合理性、数据与实物一致性。计算方法：资源数据准确率=1-资源勘误及资源信息不合格站点数量/运维站址数量×100% 取数来源：运维站址数量：资管有效站址数资源勘误及资源信息不合格站点数量：资管系统→统计分析模块→数据整治→综合指标（如下图），综合评定： 1、无铁塔站址的必填字段缺失（包括：站址名称、经度、纬度、地形、原产权单位、产权性质、业务场景） 2、铁塔信息必填字段缺失（包括：铁塔类型、铁塔产权、产权性质、塔身高度、塔基高度、风压值） 3、机房信息必填字段缺失（包括：机房类型、原产权单位、产权性质、进深、机房净高） 4、开关电源信息必填字段缺失（包括：厂商、型号、启用时间）、蓄电池组信息必填字段缺失（包括：厂商、型号、启用时间、额定容量）统计时间：每月统计（常态化考核）达标要求：100%
机房及动力配套专业（1/7）
平均站址断电退服时长（KPI指标）指标定义：考评各分公司站址资源供电服务保障情况，按照高等级服务、标准等级服务分别取值。计算方法：高等级服务月平均站址断电退服时长=本月高等级服务站址断电退服总时长/高等级服务站址总数。标准服务月平均站址断电退服时长=本月标准服务站址断电退服总时长/标准服务站址总数。已购买发电服务的站址，断电退服总时长=本月 (站址一次下电告警恢复时间 - 站址一次下电告警发生时间）的总时长。未购买发电服务的站址，断电退服总时长=本月[（3小时+站址购买蓄电池额外保障服务时间）- (站址一次下电告警发生时

业务运维指标体系

业务运维指标体系业务运维指标体系是用于评估和监控业务运维活动的关键性能指标。

它可以帮助企业管理者和运维团队了解业务运维的效果和问题，并及时采取相应的措施进行改进。

业务运维指标体系需要综合考虑业务运维的各个方面，包括硬件设施、软件系统、数据库管理等，以确保整个业务运维过程的稳定性和可靠性。

一、硬件设施指标1.响应时间：测量硬件设施的响应速度，包括服务器、网络设备等。

2.可用性：评估硬件设施的稳定性和可靠性，包括硬件故障率、平均无故障时间等。

3.容量利用率：评估硬件资源的利用率，包括磁盘空间利用率、内存利用率、带宽利用率等。

4.故障处理时间：测量硬件故障修复的时间，包括发现故障、排除故障的时间。

二、软件系统指标1.稳定性：评估软件系统的稳定性和可靠性，包括系统崩溃次数、系统运行时间等。

2.响应时间：测量软件系统响应用户请求的速度，包括页面加载时间、事务处理时间等。

3.错误率：测量软件系统出现错误的频率，包括页面404错误、用户操作错误等。

4.更新频率：评估软件系统的版本更新速度和迭代频率，包括功能升级、漏洞修复等。

三、数据库管理指标1.数据安全性：评估数据库的安全性，包括备份策略、访问控制、敏感数据保护等。

2.数据完整性：测量数据库中数据的完整性和一致性，包括数据重复、数据错误等。

3.数据访问速度：测量数据库的查询和写入速度，包括平均查询时间、事务处理时间等。

4.容量利用率：评估数据库的存储容量利用率，包括数据库大小、数据增长率等。

四、运维管理指标1.事故处理效率：评估运维团队处理事故的速度和效果，包括事故发现时间、事故恢复时间等。

2.变更管理效果：评估运维团队变更管理的效果，包括变更成功率、变更引起的故障率等。

3.问题解决效果：评估运维团队解决问题的效果，包括问题解决时间、问题重复率等。

4.运维成本控制：评估运维活动的成本效益，包括人力资源成本、设备维护成本等。

以上仅是业务运维指标体系中的一部分指标，实际指标体系需要根据具体的业务情况和组织需求进行定制。

it运维管理体系指标

it运维管理体系指标IT运维管理体系指标是衡量企业IT运维管理绩效的重要标准，它可以帮助企业评估自身的运维管理水平，发现问题并进行改进。

本文将从IT运维管理体系指标的定义、分类和重要性等方面进行详细介绍。

一、IT运维管理体系指标的定义IT运维管理体系指标是指用于评估和衡量企业IT运维管理绩效的一系列指标。

它可以反映企业在IT运维管理方面的优势和劣势，帮助企业发现问题并制定改进措施。

IT运维管理体系指标通常包括运维效率、运维质量、运维成本等多个方面的指标。

二、IT运维管理体系指标的分类1. 运维效率指标运维效率指标反映了企业IT运维团队的工作效率。

常见的运维效率指标包括平均故障修复时间、平均故障修复率、平均故障处理效率等。

通过监控这些指标，企业可以评估运维团队的响应速度和处理效率，及时发现并解决故障。

2. 运维质量指标运维质量指标衡量了企业IT运维服务的质量水平。

常见的运维质量指标包括故障发生率、故障再发生率、用户满意度等。

这些指标可以帮助企业评估运维服务的可靠性和稳定性，从而提升用户满意度。

3. 运维成本指标运维成本指标反映了企业IT运维管理的经济效益。

常见的运维成本指标包括每台设备的平均运维成本、每个故障的平均处理成本等。

通过监控这些指标，企业可以评估运维管理的经济效益，合理控制运维成本。

三、IT运维管理体系指标的重要性1. 评估绩效IT运维管理体系指标可以帮助企业评估自身的运维管理绩效，发现问题并进行改进。

通过监控和分析指标数据，企业可以了解自身在运维效率、运维质量和运维成本等方面的表现，及时调整运维策略，提升绩效。

2. 改进管理IT运维管理体系指标可以帮助企业发现问题和短板，并制定相应的改进措施。

通过对指标数据的分析，企业可以识别出导致运维效率低下、运维质量不高和运维成本过高的原因，从而采取相应的管理措施，提升运维管理水平。

3. 提升用户满意度IT运维管理体系指标中的运维质量指标可以帮助企业评估运维服务的可靠性和稳定性，进而提升用户满意度。

ITSM运维服务体系介绍

ITSM运维服务体系介绍ITSM（IT Service Management，IT服务管理）是指通过规范和集成各种IT服务管理过程，以提高IT服务质量、降低IT服务成本、提升IT部门效率和响应能力的一种管理方式。

ITSM运维服务体系是在ITSM理念指导下建立的一套完善的IT运维服务管理体系。

本文将从ITSM运维服务体系的概念、原则、架构和实施过程等方面进行详细介绍。

一、ITSM运维服务体系的概念及原则ITSM运维服务体系是指在ITSM理念的引领下，通过规范和集成各种IT运维服务管理流程和工具，构建了一个完整的IT运维服务体系。

它包括了服务战略、服务设计、服务过渡、服务运营和持续改进等环节，以确保IT运维服务的稳定性、高效性和质量。

1.用户至上：将用户需求放在首位，为用户提供满足其业务需求的稳定、高效的IT运维服务。

2.过程导向：通过规范和标准化各个IT运维服务管理流程，确保服务质量和可靠性。

3.持续改进：通过监控、评估和优化IT运维服务，不断提升运维服务质量和水平。

4.可测量性：通过设定衡量指标和指标体系，对运维服务进行定量评估和监控。

二、ITSM运维服务体系的架构1.服务战略：这个环节主要关注IT运维服务的规划和战略目标的制定，包括明确服务目标、制定服务策略、评估服务需求和制定服务策略等。

2.服务设计：在这个环节中，主要进行IT运维服务的详细设计和开发，包括制定服务架构、定义服务流程、确定服务级别协议（SLA）和设计服务目录等。

3.服务过渡：这个环节主要关注将新的或变更的IT运维服务交付给用户，并确保用户顺利使用，包括服务测试、培训和变更控制等。

4.服务运营：在这个环节中，主要进行IT运维服务的实施和运营，包括服务请求管理、事件管理、问题管理和变更管理等。

5.持续改进：这个环节主要是通过不断的监控和评估IT运维服务的性能和效果，以便对运维服务进行优化和改进，包括制定改进计划、实施改进行动和评估改进效果等。

运维服务指标体系

运维服务企业级指标体系
1.人员有关指标
序号
衡量指标
指标计算阐明
目旳值
1
储备计划完毕率
人员储备实际数量/人员储备计划数量×100%
100%
2
人员招聘到岗率
人员招聘实际数量/人员招聘计划数量×100%
90%
3
培训人次完毕率
实际培训人次数量/计划培训人次数量×100%
100%
4
培训课时完毕率
实际培训课时数量/计划培训课时数量×100%
100%
5
培训人员合格率
培训人员合格数量/参见培训人员数量×100%
88%
6
培训计划完毕率
完毕培训项数量/计划完毕培训项数量×100%
95%
2.资源有关指标
序号
衡量指标
指标计算阐明
目旳值
1
运维工具完好率
运维工具完好数量/工具总数量×100%
100%
2
事件回访率
事件准时回访完毕数量/事件总量×100%
< 24小时
响应时间
服务台完毕事件记录到工程师受理事件所花费旳时间
按事件优先级处理原则处理
工程师抵达现场时间
工程师受理时间后抵达乙方现场所需要旳时间
按事件优先级处理原则处理
每月巡检内容
包括协议规定旳所有业务系统旳运行状态检查
1次/月,巡检日期安排在月底进行
服务汇报
6个月向甲方提交六个月旳服务汇报,明确上六个月旳系统运维状况。并对系统提出合理旳整改提议。
信息安全风险控制率
采用控制措施旳风险/已识别旳风险数量×100%
90%
比率:数量/事件或服务祈求总数×100 %
100%

运维服务绩效考核指标(2)

运维服务绩效考核指标运维服务绩效考核是评估运维团队和个体工作表现的重要指标，它能够帮助企业衡量运维团队的工作效率和服务质量。

本文将介绍一些常见的运维服务绩效考核指标，以供参考。

1. 问题解决效率问题解决效率是评估运维团队工作效率的重要指标之一。

它可以通过衡量问题的解决速度和准确性来评估。

运维人员需要及时响应用户的问题，并通过有效的沟通和技术手段快速解决问题。

因此，衡量运维人员每天解决的问题数量和解决问题所花费的时间是评估问题解决效率的关键指标。

2. 服务可用性服务可用性是评估运维团队服务质量的指标之一。

它可以通过衡量系统或应用程序的正常运行时间和故障停机时间来评估。

运维人员需要确保系统和应用程序能够正常运行，随时提供稳定可靠的服务。

因此，衡量故障停机时间和恢复系统的时间可以评估运维人员的服务可用性。

3. 变更管理效率变更管理是评估运维团队变更操作的指标之一。

它可以通过衡量变更的数量、变更的质量和变更操作的准确性来评估。

运维人员需要在保证服务可用性的同时，有效地管理各种变更请求。

因此，衡量变更的成功率、变更的影响范围和变更操作的技术文档质量是评估变更管理效率的重要指标。

4. 客户满意度客户满意度是评估运维团队服务质量的重要指标之一。

它可以通过进行用户满意度调查、收集用户反馈和监控客户投诉情况来评估。

运维人员需要与用户保持良好的沟通，并及时解决用户的问题和需求，以提高用户满意度。

因此，评估用户满意度和处理客户投诉的效率是评估客户满意度的关键指标。

5. 监控与预警监控与预警是评估运维团队监控能力和预警响应的指标之一。

它可以通过衡量监控系统的覆盖范围、监控项的准确性和预警的及时性来评估。

运维人员需要建立完善的监控体系，及时监控系统的各项指标，并在出现异常情况时及时发出警报和采取相应的措施。

因此，衡量监控覆盖率、预警准确性和预警响应时间是评估监控与预警能力的重要指标。

综上所述，运维服务绩效考核指标对于评估运维团队工作效率和服务质量至关重要。

运维服务指标体系

运维服务指标体系1.系统稳定性：系统稳定性是运维服务的基础，可以通过以下指标来评估：系统可用性、系统故障次数、系统恢复时间、系统性能指标等。

这些指标可以通过监控和日志数据来统计和计算，用以衡量系统稳定性的优劣程度。

2.故障处理：故障处理是运维服务中重要的工作内容，应对故障的速度和效果直接影响着系统的稳定性。

可以通过以下指标来评估故障处理能力：故障响应时间、故障修复时间、故障分析和解决率等。

这些指标可以帮助评估运维团队的应急能力和解决问题的能力。

3.变更管理：变更管理是运维服务中的关键环节，对于系统的稳定运行至关重要。

可以通过以下指标来评估变更管理的质量：变更执行成功率、变更计划执行时间、变更后故障率等。

这些指标可以帮助衡量变更管理的效果和变更对系统稳定性的影响。

4.巡检和预防：定期巡检和预防性维护是运维服务中的重要工作内容。

可以通过以下指标来评估巡检和预防的质量：巡检频率、巡检异常发现率、漏洞修复时间等。

这些指标可以帮助衡量巡检和预防对系统安全和稳定性的贡献。

5.客户满意度：客户满意度是评估运维服务的重要指标，反映了客户对运维服务的认可和满意程度。

可以通过客户反馈、调查问卷等方式来获取客户满意度数据，用以评估和改善运维服务的质量。

综上所述，运维服务指标体系是评估运维服务质量的重要工具，可以从系统稳定性、故障处理、变更管理、巡检和预防、客户满意度等多个方面进行考虑和设计，以全面衡量和评价运维服务的能力和质量。

通过合理制定和运用指标体系，可以帮助企业实现高效稳定的运维运营，提升系统的可用性和用户体验。

11-运维指标体系

机房及动力配套专业（1/7）
平均站址断电退服时长（KPI指标）指标定义：考评各分公司站址资源供电服务保障情况，按照高等级服务、标准等级服务分别取值。计算方法：高等级服务月平均站址断电退服时长=本月高等级服务站址断电退服总时长/高等级服务站址总数。标准服务月平均站址断电退服时长=本月标准服务站址断电退服总时长/标准服务站址总数。已购买发电服务的站址，断电退服总时长=本月 (站址一次下电告警恢复时间 - 站址一次下电告警发生时间）的总时长。未购买发电服务的站址，断电退服总时长=本月[（3小时+站址购买蓄电池额外保障服务时间）- (站址一次下电告警发生时
目录
一、运维指标组成二、各专业共性指标三、各专业关键指标
各专业总体指标
各专业所有指标如下表所示，各省可根据《中国铁塔股份有限公司服务质量体系（2017年）》进行学习。本次培训重点介绍机房及动力配套专业6项，室分专业1项，铁塔专业1项需特别关注的单站关键类指标。
所属专业机房专业机房专业机房专业机房专业机房专业机房专业机房专业机房专业机房专业机房专业机房专业机房专业机房专业机房专业机房专业机房专业机房专业机房专业
格率，采用互联网方式对巡检工单进行质检，抽查比例不低于考核周期内已完成巡检工单总数的1% ）取数来源：运维监控系统→运营管理→巡检标准化→巡检计划监控巡检工单统计：统计周期内该站址已执行巡检工单，且巡检工单状态为待归档或已归档状态，视为已完成巡检。（区分铁塔、
机房（含配套）两个专业统计，即统计铁塔巡检完成率、机房（含配套）巡检完成率）统计口径：巡检工单中同时包含“铁塔-环境”模块、“铁塔-防雷接地”模块，即统计为铁塔巡检工单；巡检工单中包含“动力及配套-交流配电”模块，即统计为机房（含配套）巡检工单。注：统计周期内，已完成巡检的站址不重复统计站址数据统计：铁塔专业有效站址数=运维监控系统中全量有效站址数，实时提取；机房（含配套）专业有效站址数=CRM系统中已起租的有塔有房（含机柜、RRU拉远）站址数。统计时间：每月统计（常态化考核）达标要求：≥90%（达标要求以总部定义的达标值为准，各省若有更高要求，请自行培训）

运维服务绩效考核指标(1)

运维服务绩效考核指标现如今，在信息技术发展迅猛的时代，运维服务对于企业的顺利运营和业务的稳定发展起着至关重要的作用。

为了评估和监控运维团队的工作绩效，制定合适的运维服务绩效考核指标至关重要。

本文将介绍一些常用的运维服务绩效考核指标，帮助企业实现高效、稳定的运维服务。

1. 问题响应时间：问题响应时间是衡量运维团队对于用户报告的问题所需的时间。

较短的响应时间可以减少用户的等待并提高用户满意度。

此指标通常以分钟为单位进行计算，一般要求在问题报告后的30分钟内进行响应。

2. 问题解决时间：问题解决时间是衡量运维团队解决问题所需的时间。

当用户遇到问题时，快速解决问题是运维团队的重要任务。

较短的问题解决时间可以减少业务中断时间，并提高运维效率。

此指标通常以小时为单位进行计算，一般要求在问题报告后的4小时内解决。

3. 问题解决率：问题解决率是指解决的问题数量占报告的问题总数的比例。

较高的问题解决率表示运维团队在解决问题方面效率较高。

此指标通常以百分比表示，一般要求在95%以上。

4. 故障处理效率：故障处理效率是指运维团队解决系统故障的能力。

运维团队需要迅速准确地定位故障原因，并采取相应的措施进行修复。

衡量故障处理效率的指标可以是平均修复时间或者修复故障的平均次数。

此指标通常要求在最小化的时间内及时解决故障，减少系统故障对业务的影响。

5. 变更管理效果：变更管理涉及到对系统配置和代码的变更。

良好的变更管理可以确保系统稳定性和安全性。

评估变更管理的指标可以包括变更成功率、变更后的问题率以及恢复时间等。

此指标要求在变更过程中最大限度地减少问题和中断，并最大程度地提高变更的成功率。

6. 安全性和合规性：安全性和合规性是运维服务中不可忽视的方面。

通过评估安全性和合规性的指标，可以确保系统和数据的安全，保护企业利益和用户权益。

相关指标可以包括漏洞修复时间、安全事件响应时间以及合规性审核通过率等。

此指标要求运维团队积极防范安全威胁，及时响应安全事件，并确保符合相关法规和标准。

运维服务指标体系

运维服务指标体系运维服务指标体系是指对于企业的运维服务进行评估和衡量的一套指标体系，旨在提供一个客观、科学的评估体系，帮助企业监控和管理其运维服务的质量和效果。

在实际应用中，运维服务指标体系可以帮助企业识别问题、优化流程、提高服务水平，从而提高整体的运维效率和效果。

一、响应时间响应时间是指从用户提交问题或请求到运维团队给予响应的时间。

用户在运维服务中的体验很大程度上取决于响应时间的快慢。

较短的响应时间可以有效提高用户满意度，并减少用户因等待过长时间而导致的不满情绪。

因此，响应时间是一个非常重要的运维服务指标。

二、故障处理时间故障处理时间是指从故障发生到最终解决该故障所花费的时间。

故障处理时间是评估运维团队处理能力和效率的重要指标。

较短的故障处理时间可以有效降低系统停机时间、提高服务可用性，从而提高用户体验。

三、问题解决率问题解决率是指运维团队解决用户问题的有效率。

包括问题解决次数、解决率等指标。

高问题解决率意味着运维团队具备快速定位和解决问题的能力，可以最大限度地减少用户遇到的问题。

四、问题再次发生率问题再次发生率是指同一问题在一段时间内的再次发生次数。

问题再次发生率可以反映运维团队的问题解决的持久性和稳定性。

较低的问题再次发生率表明运维团队解决问题的措施有效，并且提供的解决方案能够持久稳定地解决问题。

五、变更成功率变更成功率是指变更计划成功实施的比例。

在运维服务中，经常需要进行系统或配置的变更。

高变更成功率意味着变更计划的制定和实施具备科学性和可行性，减少了系统的风险和不稳定性。

六、服务可用性服务可用性是指系统能够提供服务的时间占全部时间的比例。

服务可用性能反映运维团队维护服务的稳定性和可靠性。

高服务可用性可以最大程度地减少系统停机时间，提供持续稳定的服务。

七、客户满意度客户满意度是指客户对运维服务的满意程度。

通过定期进行客户满意度调查、评估，可以了解客户对运维团队的意见和建议，进而优化服务流程和提高服务质量。

业务运维指标体系

1 业务运维管理体系1.1 业务运维成熟度运维管理5级成熟度模型业务运维成熟度自我评估是指运维服务组织已建立并实施了运维服务能力管理体系，根据定期的或临时性的管理要求，对整个运维服务能力管理或特定范围就运维服务能力管理的符合性和有效性所进行的内部检查。

自我评估旨在发现运维服务能力管理和实施中的问题或不足，识别改进点和行动措施，从而促进本组织运维服务能力和服务质量的持续改进。

1.2 运维多层指标体系1.2.1 体系模型构建完善健全的业务层次、多维度监控指标体系模型1.2.2 问题程度划分模型使用了基于5级层次的性能与问题程度划分模型，确保测评的粒度、真实情况及用户可接受性；1.2.3 典型指标体系参考1.2.3.1 业务与一般的面向技术的性能指标不同，业务指标一般是根据不同行业的用户特点来具体分析梳理的，以下以连锁快消行业某个企业的业务举例说明业务指标的梳理与建立。

会员会员总数、新增会员等订单订单数、新增订单、成功订单、订单转化率、客单价等交易交易额、销量统计、销售排行、销售机会、销售漏斗、业务趋势、退款金额、毛利等库存库存总量、库存占用资金、运销率、商品销售排行等门店门店总数、新增门店、关闭门店、优秀门店、问题门店等客户客户总数、新增客户、潜在客户、关注客户等 1.2.3.2 用户体验（前端）1.2.3.2.1 A pp移动性能行为动作影响用户数、错误用户数、崩溃用户数、响应时间、http请求次数、请求错误次数等行为流程用户转化率、事件数、总用户数、平均耗时、错误数、崩溃数等用户分析新增用户数、活跃用户数、HTTP错误用户数、网络失败用户数、崩溃错误用户数、HTTP错误率、网络失败率、崩溃率、会话数等 HTTP请求响应时间、吞吐率、HTTP错误率、网络失败率、请求次数、TCP、DNS、SSL、网络延迟时间、首包时间等错误请求错误率、HTTP错误率、网络失败率、错误次数、影响用户数、POST参数、响应头、响应内容、调用堆栈等 Socket请求建立连接最慢的主机、Read耗时最长的主机、Write耗时最长的主机、异常最多的主机、连接耗时等 Socket异常异常用户、异常次数、使用用户、App版本、影响用户数、异常堆栈等页面加载平均响应时间、平均执行时间、执行次数、首屏时间、白屏时间、吞吐量、耗时、JS错误、JS错误次数、JS错误类型、错误堆栈、响应时间分解图、页面加载资源时序图等 Ajax 平均响应时间、响应时间、执行次数、耗时、Ajax错误、Ajax错误次数、错误类型、响应时间分解图等接入方式响应时间、请求错误率、活跃会话数、新增用户数、活跃用户数、启动次数等运营商响应时间、HTTP错误率、请求错误率、网络失败率、活跃会话数、新增用户数、活跃用户数、启动次数等系统版本响应时间、请求错误率、吞吐率、活跃会话数、HTTP错误率、网络失败率、新增用户数、活跃用户数、启动次数等 App版本响应时间、HTTP错误率、请求错误率、网络失败率、活跃会话数、新增用户数、活跃用户数、启动次数等设备响应时间、活跃会话数、HTTP错误率、网络失败率、新增用户数、活跃用户数、启动次数等地域响应时间、吞吐率、请求错误率、活跃会话数、新增用户数、活跃用户数、系统版本崩溃数等视频流推流信息：直播间、已播放时长、平均帧率、平均码率、瞬时帧率、固定帧率、瞬时码率、错误次数、影响直播错误次数、普通错误次数、推流失败错误占比等观看信息：观看人数、浏览次数、卡顿率、延迟时间、可用率、平均卡顿时长、平均延迟时间、平均卡顿次数、平均错误次数、卡顿分布等崩溃崩溃率、崩溃用户数、崩溃次数、使用用户数、Bug数、已修复Bug数、未修复Bug数、影响用户数、崩溃堆栈等 ANR/卡顿 ANR/卡顿率、ANR/卡顿用户、ANR/卡顿次数、人均ANR/卡顿次数、App版本、影响设备、影响用户数等组合分析响应时间、吞吐率、活跃用户数、HTTP错误率、网络失败率等劫持分析访问量最高的劫持域名、劫持分布、请求次数、吞吐率、劫持占比等交互执行时间、执行次数、耗时、记录时间、操作系统、设备、地理信息、接入方式、剩余电量、屏幕朝向、CPU、Memory、视图、请求数等拓扑图自身服务、外部服务、HTTP错误率、网络失败率、响应时间移动运营新增和启动用户新增用户、新增用户占比、启动用户、启动次数、活跃用户、累计总用户等地域分析新增用户、新增用户占比、活跃用户、活跃用户占比、启动次数、启动次数占比等活跃用户日活跃DAU、周活跃WAU、月活跃MAU、DAU／MAU等留存用户留存用户、新用户、次日留存率、7日留存率、30日留存率等渠道分析新增用户、活跃用户、启动次数、累计用户总数等设备分析新增用户、新增用户占比、活跃用户、活跃用户占比、启动次数、启动次数占比等 1.2.3.2.2 B rowser整体访客数、总IP数、总页面数、浏览量、JS错误率、JS错误页面数、AJAX错误数、吞吐率、Apdex等 Ajax 响应时间、错误类型、Post数据、接收数据、请求次数、调用页面、性能趋势等网页响应时间、吞吐率、JS错误数、AJAX请求数、终端用户响应时间、首屏时间、首字节时间、服务器连接时间、响应可用时间、前端时间、文档准备时间、文档下载时间、文档处理时间、页面渲染时间、页面访问量等浏览器响应时间、吞吐率、JS错误数、AJAX请求数、终端用户响应时间、首屏时间、首字节时间、服务器连接时间、响应可用时间、前端时间、文档准备时间、文档下载时间、文档处理时间、页面渲染时间、页面访问量等运营商响应时间、吞吐率、JS错误数、AJAX请求数、终端用户响应时间、首屏时间、首字节时间、服务器连接时间、响应可用时间、前端时间、文档准备时间、文档下载时间、文档处理时间、页面渲染时间、页面访问量等 JS错误错误类型、错误数量、错误信息、发生时间、IP、地域、浏览器及版本号、UA 数据、错误堆栈等 1.2.3.3 网络网站监控 HTTP/HTTPs监控响应时间、可用率、响应服务器IP、下载字节数、下载速度、HTTP响应头信息等 Ping监控响应时间、可用率、主机IP、数据包大小、TTL、发送的包数、收到的包数、丢包率、Ping快照等 DNS监控响应时间、可用率、DNS解析服务器、主机记录、记录类型、记录值、TTL等 TraceRoute监控响应时间、可用率、最大跳数、数据包大小、跳转路径等 FTP监控响应时间、可用率、FTP报文等 TCP监控响应时间、可用率、主机IP等 UDP监控响应时间、可用率、主机IP、UDP报文等 SMTP监控响应时间、可用率、主机IP、SMTP响应内容、HTTP响应头信息等网页性能监控页面可用性目标IP、DNS服务器、元素瀑布图、网络诊断结果等元素可用性元素类型、状态、元素URL等元素响应时间首屏时间、网络层时间、DNS解析时间、连接建立时间、SSL握手时间、重定向时间、首字节时间等元素性能评估性能评估得分、静态资源CDN使用率、首屏时间、响应时间、请求个数、域名数等 1.2.3.4 应用（后端）业务流程可用率、可用性、故障次数、正确率、正确性、错误次数、响应时间等业务拓扑业务健康度、事务健康度、响应时间、请求数、错误数等 Web应用事务运行状态、每分钟执行次数、响应时间、Apdex值、错误率、错误次数、总执行次数等请求响应时间、吞吐率、错误次数、错误/分钟、错误率、异常率、请求次数、缓慢请求率、非常慢请求率外部服务响应时间、吞吐率、耗时、HTTP错误率、网络错误率等数据库数据库类型、操作类型、访问次数、吞吐量、平均响应时间、最大响应时间和最小响应时间 NoSQL 响应时间、吞吐率、调用者耗时占比、key名称、Value大小、SQL操作执行次数、耗时等错误错误URL、错误时间、错误次数、请求参数、异常URL、异常时间、异常次数等后台任务响应时间、吞吐量、CPU使用率、内存使用情况、访问次数、平均耗时、错误数等运维视图事务健康度、层健康度、节点健康度、响应时间、请求数、错误数等 1.2.3.5 服务1.2.3.5.1 中间件Web/App Server Apache 吞吐率、并发连接数、线程数、运行时间等 Nginx 吞吐率、并发连接数、版本、连接丢失率等 Tomcat JVM内存、线程、处理时间、请求数、网络流量等 Weblogic 空闲HEAP、吞吐量、空闲线程数、JMS连接数等 Varnish 内存、缓存命中数、缓存Object数、过期Object数、线程数等 Jboss JVM内存使用率、服务器应答时间、EJB、线程池、JDBC连接池等 WebSphere CPU使用、内存使用、JVM使用、响应时间、实时会话、JDBC连接池、JMS 队列等 Resin Karaf Netty WildFly Glassfish 内存使用、进程内存、虚拟内存、线程池等 ColdFusion TomEE IIS 当前连接数、运行时间、每秒接收字节数、每秒发送字节数、每秒传输字节数、每秒接收文件数等 Express Gunicorn 请求响应时间、每秒请求数、每秒错误数、每秒异常数、每秒告警数等消息中间件 ActiveMQ 内存使用、存储使用、消费者连接数、生产者连接数、排队消息数、过期消息数等 RabbitMQ 消息总数、每分钟消息数、平均消息发送时间、总流量、每分钟流量数等 JMS ZeroMQ RocketMQ MSMQ 每秒进入消息数、每秒向外消息数、队列会话总数、队列大小、队列消息数等 TXC for MQ ONS MQ 其他 Kafka 最大消费滞后、日志刷新速率、传入字节速率、传出字节速率、延迟consumer请求数等 Docker CPU使用率、内存使用量、运行容器数、停止容器数、顶级容器数等 ElasticSearch 线程总数、排队线程数、活跃线程数、事务日志的大小、索引段使用的内存、GET请求次数等 Solr 每秒缓存驱逐数、每秒缓存命中数、每秒缓存插入数、每秒缓存查找数、每秒平均请求数等 Gearman 队列任务数、运行任务数、注册任务数、workers数量等 HAProxy 每秒错误请求数、每秒HTTP请求数、每秒创建的后端会话数、活跃前端会话数、后端主机数量等 HDFS 总容量、缓存容量、已使用缓存、磁盘容量、磁盘剩余空间、已使用磁盘空间、预估容量损失等Mesos CPU总数、总内存、占用内存、磁盘空间总量、丢弃消息数、活跃框架数、无效任务数等 ZooKeeper 接收的字节数、发送的字节数、客户端连接总数、接收数据包数、发送数据包数等 PHP-FPM 活跃进程数、空闲进程数、最大活跃进程数、总进程数、缓存请求数等 Weblogic Weblogic实例可用性：服务可用性性能：系统CPU利用率、WebLogic CPU利用率、JVM内存利用率、系统内存利用率、提交成功的事务耗费的时间(秒)Workload监控信息： Server名称（隐藏）、IP地址、主机名、MAC地址（隐藏）、版本、操作系统、物理内存容量、当前堆大小、使用的堆大小、丢弃的事务数、应用程序出错回滚的事务数、资源出错回滚的事务数、系统出错回滚的事务数、超时回滚的事务数、当前连接数、总连接数、最高连接数、当前JMS服务数、最高JMS服务数、总JMS服务数 Web应用可用性： Web应用可用性信息：当前Session数、应用名称（隐藏）、会话数最高值、当前活动的Session数 DatabaseConnectionPool 可用性：连接池可用性性能：等待的连接数、连接池使用率信息：连接池名称（隐藏）、连接池大小、当前活动的连接数量、泄漏的连接数、平均活动连接数 Thread Pool 信息：线程池名称（隐藏）、当前空闲线程数、等待的请求数、总线程数、最长等待的请求时间 JMS 信息： JMS Server名称（隐藏）、已接收的JMS消息数、等待处理的JMS 消息数 Jboss JBOSS AS 可用性：服务可用性性能：主机CPU利用率、JBoss CPU利用率、主机内存利用率、JVM内存利用率、JBOSS Session、JBOSS Free Memory、JBOSS Thread 信息：实例名称（隐藏）、显示名称（隐藏）、HomeDir(隐藏)、IP地址、主机名、版本、JNP(JNDI Provider)监听端口（隐藏）、操作系统、主机Mac地址(隐藏)、物理内存容量、堆的总大小、空闲堆大小、已使用内存（隐藏）、最大堆大小、最大线程数、最小线程数、JMS当前连接数、JMS总连接数、JMS最高连接数、JMS允许的最大连接数 Web应用可用性： Web应用可用性信息：应用名称（隐藏）、上下文根 JDBC连接池可用性： JDBC连接池可用性性能：活动的连接数信息：连接池名称（隐藏）、最大连接数、最小连接数 Websphere WebSphere AS 可用性： WebSphere AS可用性性能：系统CPU利用率、WebSphere AS CPU利用率、系统内存利用率、JVM内存利用率、活动的线程、最大百分比、活动线程利用率信息： Pid、主机名、IP地址、操作系统、Cell名称、节点名称、Server名称、Cluster名称、空闲内存、使用的内存、分配总内存、连续运行时间、活动的本地事务、已提交的本地事务数、已回滚的本地事务数、已超时的本地事务数、平均池大小、MacAddress、显示名称配置：版本、构建号、Data Source个数、Web应用个数、JVM允许使用的最大内存、JVM允许使用的最小内存、物理内存容量、HTTP端口、HTTPS端口、最小大小、最大大小 Cluster 可用性： Cluster可用性信息： Cluster名称、Cluster成员、Cluster成员个数 JDBC连接池可用性：连接池可用性性能：平均等待时间、使用百分比、最大百分比信息： Pool_ID、JDBC Provider名称、连接池名称、连接池类型、平均池大小、空闲池大小配置：最大连接数、最小连接数 Web应用可用性： Web应用可用性性能：会话利用率信息： Web应用名称、Web应用J2EE名称、并发活动的会话数、当前在内存中高速缓存的会话数、不再存在的会话的请求数配置：允许创建的最大会话数 1.2.3.5.2 数据库Oracle 并发性能、IO性能、内存进程 MySQL 吞吐率、并发连接数、查询缓存、表锁定、查询速率等 SQLServer 连接数、请求频率（请求/分钟）、执行出错数、磁盘IO请求、锁时间、锁频率、消耗内存数、日志大小、数据库大小等 MongoDB 库锁定、库查询、使用内存、索引命中率等 Redis 占用内存、执行命令数、命中率、即时连接数、请求连接次数、阻塞客户数、Pub/Sub通道数和Pub/Sub模式数等 Memcache 命中率占用内存、即时连接数、每秒请求连接次数、缓存数量、读写命令、内存使用率等 PostgreSQL 数据库容量、数据库连接数、数据库死锁数、数据库缓存命中率、共享缓冲区利用率等 DB2 运行状态、连接时间、日志空间使用率、命中率、表空间等 Sybase 内存利用情况、数据库信息、当前进程、CPU、内存、磁盘利用率等 CouchBase 内存命中率、数据操作、文档数、内存溢出错误、内存监控、磁盘队列、内存中文档值和元数据的存储情况、连接数等 CouchDB 数据库磁盘大小、数据库文档数、文档读写次数、HTTP请求数、视图读取次数、错误响应次数等 Cassandra 缓存请求数、缓存数据量、抛出的异常数、缓存的匹配数、客户端请求数、使用磁盘空间等 MariaDB DRDS Derby HSQL H2 Druid SQLite Oracle 实例可用性、监听器可用性性能：系统CPU利用率、Oracle DB CPU利用率、系统内存利用率、Oracle DB 内存利用率、PGA命中率、库缓存命中率、高速缓冲缓存命中率、物理读速率、物理写速率、数据块获取数/秒、一致性获取数/秒、内存排序比率、当前连接会话数、当前进程数、登陆会话数/秒、当前打开的游标数、当前锁数量、死锁数量、SQL解析次数/秒、事务数/秒、事务回滚率信息：资源名称、版本、操作系统、主机名称、IP地址、主机Mac地址、连续运行时间、实例名称、数据库名称、Domain名称、数据库大小、Open模式、SQL语句TOP10CPUTime、SQL语句TOP10DiskReads、OracleSQLTop10BufferGets、SQL语句TOP10BufferGets、磁盘排序次数、内存排序次数、事务回滚数、事务提交数配置：表空间个数、数据文件个数、Log模式、高速缓冲池、共享池、大型池、Java 池、日志缓冲池、SGA、PGA、物理内存容量表空间： l● 表空间状态 l● 表空间增长率、表空间利用率 l● 表空间名称、表空间大小、表空间已用空间数据文件： l● 数据文件状态 l● 数据文件增长率、数据文件利用率、物理读速率、物理写速率 l● 数据文件名称、数据文件ID、数据文件大小、数据文件已用空间进程： l● 进程状态 l● Oracle实例名称(进程)、进程名称文件系统： l● 文件系统利用率 l● 文件系统名称、文件系统已用空间、文件类型 l● 文件系统大小 SQLServer 服务可用性性能：系统CPU利用率、SQL Server CPU利用率、系统内存利用率、SQL Server 内存利用率、Optimizer Memory (KB)、缓存命中率、缓冲命中率、高速缓存对象所使用的8（KB）页的数目、高速缓存中高速缓存的对象数、连接时间、当前用户连接数占最大连接数的百分比、当前用户连接数、login/sec、logout/sec、阻塞进程数、每秒导致死锁的锁请求数、每秒事务数、活动事务数、每分语句重新编译的次数、每分收到的 Transact-SQL 命令批数、每分的 SQL 编译数、Page Read Rate、Page Write Rate 信息：主机名、IP地址、操作系统、物理内存容量、服务器能够使用的动态内存总量(KB)、数据库个数、版本、Max Server Memory (MB)、服务连续运行时间、安装目录、产品名称数据库： l● 数据库可用性 l● 数据空间使用率、日志空间使用率、每秒事务数、活动事务数 l● 数据库空间、Data File Size、Data Size、Index SizeUnused Space、Unallocated S pace、Log F ile(s) S ize、Unused S ize、Log F ile(s) U sed Size 1.2.3.6 基础资源1.2.3.6.1 系统服务器 CPU、内存、进程、磁盘、网卡信息、TCP等防火墙吞吐量、报文转发率、最大并发连接数、每秒新建连接数、转发时延、抖动等路由器/交换机 CPU、内存、接口状态、流量、带宽占用等负载均衡设备 CPU、内存、端口响应时间、运行状态、可用性、负载状况等 Windows主机主机在线可用性性能： CPU平均利用率、内存利用率、内存错页率、硬盘平均等待队列、硬盘平均磁盘时间、硬盘平均读写速率、分区平均利用率、核心内存利用率、虚拟内存利用率、主机总内存容量、分区总容量、分区总使用容量等信息：连续运行时间、主机基本信息、操作系统、MAC地址、系统版本、进程数、线程数、当前在线用户数、虚拟内存总量、虚拟内存已用量等配置： CPU个数、内存总容量、硬盘个数、硬盘总容量、网卡个数、网卡类型、IP地址、主机名、分区个数、分区总容量等 CPU： l● CPU利用率 l● CPU名称、CPU ID号、CPU型号、CPU频率硬盘： l● 硬盘等待队列、硬盘磁盘时间、硬盘读写速率 l● 硬盘名称、硬盘ID、硬盘容量分区： l● 分区总已用容量、分区利用率 l● 分区名称、分区ID号、分区容量网络接口： l● 管理状态、操作状态 l● 发送利用率、发送的丢包数、发送的错包数、发送速率、接收利用率、接收和发送利用率总和、接收的丢包数、接收的错包数、接收速率、接口带宽 l● 网卡ID号、接口名称、索引、接口类型、接口带宽、MAC地址、IP地址 Linux主机可用性：主机在线可用性性能： CPU平均利用率、CPU平均负载、内存利用率、硬盘平均读写操作速率、硬盘平均读写速率、接收和发送的ICMP包率、Ping时延等信息：网络接口个数、主机说明、连续运行时间、主机操作系统等配置： IP地址、分区总容量、CPU个数、内存总容量、硬盘总容量、硬盘个数等 CPU： l● CPU利用率 l● CPU名称、CPU型号、CPU频率硬盘： l● 硬盘读速率、硬盘写速率 l● 硬盘名称、硬盘ID、硬盘容量分区： l● 分区利用率 l● 分区名称、分区容量、分区已用容量、网络接口： l● 管理状态、操作状态 l● 发送利用率、发送的丢包数、发送的错包数、发送速率、接收利用率、接收的丢包数、接收的错包数、接收速率 l● 索引、接口类型、接口带宽、MAC地址 AIX主机可用性：主机在线可用性性能： CPU平均利用率、CPU平均负载、内存利用率、硬盘平均读写操作速率、硬盘平均读写速率、接收和发送的ICMP包率、CPU用户模式百分比、CPU空闲时间百分比、CPU系统模式百分比、、内存页面调进速率、内存页面调出速率、等待处理队列、内存错页率、Paging Space利用率等信息：主机操作系统的OID、主机操作系统、主机操作系统版本、连续运行时、主机说明、系统SP、进程数、僵死进程数、线程数、当前在线用户数、Paging Space总大小、Paging Space已用大小等 CPU个数、内存总容量、硬盘个数、网卡个数、MAC地址、IP地址、主机名、分区个数、分区总容量、硬盘总容量、主机的所有IP地址等 CPU： l● CPU利用率 l● CPU ID号、CPU名称、CPU型号、CPU频率硬盘： l● 硬盘读速率、硬盘写速率 l● 硬盘名称、硬盘ID、硬盘容量分区： l● 分区总可用容量、分区利用率 l● 分区名称、分区容量、分区ID、网络接口： l● 管理状态、操作状态 l● 发送利用率、发送的丢包数、发送的错包数、发送速率、接收利用率、接收和发送利用率总和、接收的丢包数、接收的错包数、接收速率、接口带宽 l● 网卡ID号、接口名称、索引、接口类型、接口带宽、MAC地址、IP地址路由器可用性：网络设备在线可用性性能： CPU平均利用率、内存利用率、网络设备内存池占用容量、网络设备内存池可用容量、总接收吞吐量、总发送吞吐量、吞吐量、丢包率、接口接收的丢包数、接口发送的丢包数、接收和发送ICMP包率、发送的ICMP包率、接收的ICMP包率信息：网络设备的OID、连续运行时间、网络设备说明、交换机下的IP地址、网络设备MAC地址配置： Config状态、CPU个数、内存总容量、网络接口个数、IP地址、网络设备名称 l● CPU利用率 l● CPU名称、CPU ID号网络接口： l● 管理状态、操作状态 l● ARP包率、接收的ARP包数、发送的ARP包数、单播包率、接收单播包数、发送单播包数、发送利用率、发送的丢包数、发送的错包数、发送速率、广播包率、接收的广播包数、发送的广播包数、接收利用率、接收和发送利用率总和、接口累计接收和发送的包数、接口累计接收的包数、接口累计发送的包数、接收的丢包数、接收的错包数、接收速率、组播包率、发送组播包数、接收组播包数、接口带宽 l● 网卡ID号、接口名称索引、接口类型、接口带宽、MAC地址链路： l● 链路可用性 l● 链路名称、链路ID号、所属网络接口、目标IP 交换机可用性：网络设备在线可用性性能： CPU平均利用率、内存利用率、网络设备内存池占用容量、网络设备内存池可用容量、总接收吞吐量、总发送吞吐量、吞吐量、丢包率、接口接收的丢包数、接口发送的丢包数、接收和发送ICMP包率、发送的ICMP包率、接收的ICMP包率信息：网络设备的OID、连续运行时间、网络设备说明、交换机下的IP地址、网络设备MAC地址配置： CPU个数、内存总容量、网络接口个数、IP地址、网络设备名称 CPU： l● CPU利用率 l● CPU名称、CPU ID号网络接口： l● 管理状态、操作状态 l● ARP包率、接收的ARP包数、发送的ARP包数、单播包率、接收单播包数、发送单播包数、发送利用率、发送的丢包数、发送的错包数、发送速率、广播包率、接收的广播包数、发送的广播包数、接收利用率、接收和发送利用率总和、接口累计接收和发送的包数、接口累计接收的包数、接口累计发送的包数、接收的丢包数、接收的错包数、接收速率、组播包率、发送组播包数、接收组播包数、接口带宽 l● 网卡ID号、接口名称索引、接口类型、接口带宽、MAC地址链路： l● 链路可用性 l● 链路名称、链路ID号、所属网络接口、目标IP 1.2.3.6.2 硬件服务器主板、电源、电压、风扇、温度、功率等机房动力：高压配电、低压配电、UPS、油机、电源、电池组、空调等机房环动机房环境：门禁、烟感、温度、湿度、漏水、安防、消防、防雷等 1.3 运维知识管理1.3.1 运维知识及其重要性随着企业IT设备和信息系统的增多，IT运维服务管理显得越来越重要。

运维服务体系

运维服务体系一、运维服务体系简介随着信息化程度的提高和企业对信息技术的依赖度的增加，运维服务已成为企业的重要组成部分，成为企业信息化建设中不可或缺的环节。

运维服务体系是指运维服务管理的一套系统性方案和规范，它包括实现运维服务质量的管理措施、支持技术工具和运维服务方法论等内容，旨在保障运维服务的稳定性、可靠性和高效性。

二、运维服务体系的架构1、服务理念运维服务体系的核心理念是“客户至上”，即将客户需求作为首要考虑因素，始终以客户体验为中心。

服务理念要求在运维活动中充分考虑用户的实际需求，提供高品质、全面、高效、便捷的服务，提高用户的满意度，保持良好的口碑，进而获得更多的市场份额。

2、服务规范服务规范是指制定运维服务标准和流程，确保提供稳定、高效的服务，并规范从业者的行为准则。

常见的服务规范包括：技术标准、安全条例、服务级别协议等。

服务规范对于提高服务质量、保障服务可靠性和稳定性非常重要。

3、服务人员服务人员是运维服务体系中的关键环节，他们不仅需要具备专业的技术水平和解决问题的能力，还需要具有专业的服务意识和团队协作精神。

服务人员需要不断学习、不断更新技能，以适应不断变化的技术需求以及业务需求。

4、服务方案服务方案是通过合理的技术方案、有效的管理措施和清晰的实施流程来应对客户的运维服务需求，并提供最优解决方案，提高服务质量。

它将涉及技术机房管理、服务器管理、网络管理、数据备份与恢复管理、风险管理、应急响应等，并实现服务管理标准化和精益化。

5、服务管理运维服务体系的运作需要有科学的管理体系来保证服务可靠性和稳定性。

服务管理是管理运维服务的一套系统性方法，包括服务水平管理、质量管理、安全管理、风险管理、成本管理和人员管理。

服务管理可以建立基于合理的指标体系，不断完善服务流程和管理方法，上下联动，确保客户利益最大化。

三、运维服务体系的实施1、确定服务目标和标准在实施运维服务体系之前，需要制定服务目标和标准，以确保清晰地了解业务需求和客户期望，为运维团队提供明确的目标方向。

it运维管理体系指标的标准

it运维管理体系指标的标准
IT运维管理体系的指标标准可以根据具体的目标和需求来确定，但一般包括以下几个方面的指标：
1. 故障率：衡量系统的稳定性和可靠性，通常用每单位时间内发生的故障数量来表示。

2. 平均修复时间（MTTR）：指系统从故障发生到修复完成所需的平均时间。

3. 可用性：衡量系统的可用程度，通常用系统正常运行时间与总运行时间的比值来表示。

4. 响应时间：指系统对用户请求的响应速度，通常以毫秒或秒为单位。

5. 系统容量：指系统能够处理的工作量或负载，通常以并发用户数、吞吐量或处理能力来表示。

6. 变更管理：衡量变更管理过程的有效性和规范性，包括变更申请的及时性、变更记录的完整性等指标。

7. 服务水平协议（SLA）达标率：衡量运维团队能否按照SLA中规定的要求提供服务，包括故障响应时间、故障处理时间等指标。

8. 安全性指标：包括系统的漏洞数量、漏洞修复时间、安全事件的发生频率等。

9. 成本指标：包括IT运维的人力成本、设备成本、软件成本等。

这些指标可以根据实际情况进行具体细化和补充，以满足组织的具体需求和目标。

广州市政务信息化运维服务类项目效能评估指标体系

广州市政务信息化运维服务类项目效能评估
指标体系
广州市政务信息化运维服务类项目是为了提高政务管理的效能而进行的一项重
要举措。

为了评估这些项目的效能，我们需要建立一个科学有效的评估指标体系。

首先，在评估指标体系中，我们需要考虑到项目的整体目标。

政务信息化运维
服务类项目旨在提升政务管理的效能，因此我们可以将项目的目标指标设定为政府部门内部的业务处理效率、服务质量以及服务覆盖范围。

这些指标将帮助我们评估项目是否能够提供高效、及时、精准的服务。

其次，我们可以考虑项目的运维效果。

政务信息化运维服务类项目需要有良好
的运维支持，才能保证系统的稳定运行和及时修复故障。

因此，在评估指标体系中，可以包括服务运行时间、系统可用性、故障响应时间等指标。

此外，我们还应考虑到用户满意度。

政务信息化运维服务类项目的目标是为政
府部门和公众提供高质量的服务。

因此，用户满意度是一个重要的评估指标之一。

我们可以采用用户调查、反馈收集等方式来评估用户对项目的满意程度。

最后，我们还可以考虑到项目的成本效益。

政务信息化运维服务类项目需要投
入一定的经费和人力资源。

在评估指标体系中，可以考虑项目的经济成本、资源利用效率等指标，以评估项目的成本效益。

综上所述，广州市政务信息化运维服务类项目的效能评估指标体系可以包括项
目目标指标、运维效果、用户满意度和成本效益等方面。

通过建立科学有效的评估指标体系，我们可以全面评估项目的效能，为提升政务管理的效能提供科学参考依据。

运维指标体系

运维指标体系您的姓名： [填空题] *_________________________________一、单选题1、运维指标体系分为（）个层面。

[单选题] *A、1B、2C、3(正确答案)D、42、运维指标体系第一层为（）指标 [单选题] *A、运行管控类指标B、客户服务类(正确答案)C、数据统计类指标D、设备运行类指标3、运维指标的共性指标包括（）项KPI指标 [单选题] *A、3B、4(正确答案)C、5D、64、运维指标的共性指标包括（）项一般指标 [单选题] *A、3B、4(正确答案)C、5D、65、(中级)下列属于设备运行类指标的是（） [单选题] *A、铁塔完好率(正确答案)B、设备完整率C、到期合同续签完成率D、断电退服率6、故障处理及时率达标要求:（）。

[单选题] *A、≥95%(正确答案)B、≥93%C、≥98%D、≥90%7、巡检合格率总部定义的达标值为（） [单选题] *A、≥95%B、≥90%(正确答案)C、≥85%D、≥80%8、故障处理及时率统计时间:（） [单选题] *A、每月统计(正确答案)B、每日统计C、每周统计D、每季度统计9、站址拆迁率达标要求（）(达标要求以总部定义的达标值为准 [单选题] *A、≤4%B、≤3%C、≤2%D、≤1%(正确答案)10、资源数据准确率达标要求:（） [单选题] *A、100%(正确答案)B、99%C、98%D、95%11、上站配合及时率的日常上站需提前（）小时(不超过48小时)提出上站申请。

[单选题] *A、8B、12C、24(正确答案)D、3612、(中级)上站配合及时率的紧急上站:需提前（）小时提出上站申请,超过上站约定时间( B )小时后运营商仍未上站,则默认该次上站成功;如运营商仍有上站需求,需重新发起上站申请。

[单选题] *A、4 2B、 2 1(正确答案)C、1 0.5D、1 313、APP使用率达标要求（）(达标要求以总部定义的达标值为准 [单选题] *A、≥95%(正确答案)B、≥90%C、≥85%D、≥80%14、(中级)FSU离线率属于机房专业（）类别的指标 [单选题] *A、电力保障B、监控设备(正确答案)C、服务质量D、防雷设备15、发电及时率达标要求:（）。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

据实记录
评价考核参考指标
14
呼叫总数
据实记录
评价考核参考指标
4. 技术相关指标
序号
衡量指标
指标计算说明
目标值
1
开发数量完成率
完成开发项数量/计划开发项数量×100%
90%
2
开发进度完成率
项目实际开发天数/项目计划开发天数×100%
95%
3
开发质量完成率
开发项目达成指标项/开发项目计划指标项×100%
98%
3
备品备件可用率
可用的备品备件/备品备件总数量×100%
100%
4
知识库访问次数
每月访问知识项次数
400
5
客服满意度
客户满意户数/服务客户总户数×100%
90%
6
客户响应及时率
响应及时次数/响应总次数×100%
98%
3. 服务台相关指标
序号
衡量指标
指标计算说明
目标值
1
呼叫响应及时率
从呼叫到开始
2
事件响应及时率
数量：在事件/服务请求中过滤【是否在规定时间内响应】＝‘是’
比率：数量 / 不同等级事件或服务请求总数 × 100 %
100%
3
事件解决及时率
数量：在事件/服务请求中过滤【是否在规定时间内完成】＝‘是’
比率：数量 / 事件或服务请求总数 × 100 %
100%
4
事件完成率
数量：在事件/服务请求中过滤【是否完成】＝‘是’
衡量指标
指标计算说明
目标值
1
问题总数
用途：当前问题的总数（月、季、年），用于了解统计周期内记录的问题数量
2
问题审批率
数量：在《问题申请表》中，审批意见为“同意”的问题
比例：问题成立的数量/提交问题的数量× 100 %
100%
3
问题解决率
数量：在《问题信息记录表》中过滤【问题状态】＝‘已解决’
比例：数量 / 问题总数 × 100 %
服务报告的内容包括每月事件和问题统计分析，每类事件的趋势分析，可用性和连续性统计、能力监测情况、每月变更情况、配置项的变更统计、以及服务目录的服务项的请求更新统计
各系统可用性
系统或网络的可用性是指在整个承诺的系统运行时间内，系统正常运行的时间占全部承诺的运行时间的比例。
>=95%（补充：系统的承诺运行时间为5*8，“5”表示从周一到周五，“8”表示每天上午8:00-12：00，下午14：00到18:00，其它系统承诺正常运行时间每天24小时，即7*24
10%
3
重大变更的数量比率
重大变更的数量/变更总数*100%
5%
4
变更成功比率
变更成功数量/变更总数*100%
100%
5.发布相关指标
序号
衡量指标
说明
目标值
1
发布总数
周期内（月、季、半年、年）统计发布的数量
2
发布成功的数量比率
发布成功的数量/发布总数*100%
100%
3
发布及时率
计划时间内完成的数量/发布总数*100%
100%
4
开发成本控制率
（计划成本预算额-实际成本发生额）/计划成本预算额
0
5
项目文档齐套率
实际交付文档项/计划交付文档项×100%
100%
6
研发计划完成率
研发实际交付项/研发计划交付项×100%
90%
运维服务项目级指标体系
1.事件相关指标
序号
衡量指标
指标计算说明
目标值
1
事件/服务请求
总数
事件/服务请求总数（周、月、季、半年、年）用途：当前事件/服务请求的总数，用于了解系统中记录的事件数量
100%
4
更新CMDB的数量比率
更新CMDB的数量/发布总数*100%
100%
6.服务级别相关指标
要求
指标计算说明
服务指标
单次最长故障时间
系统单次最长的非计划性不可用时间
< 8小时
重大事件（一级或二级事件）发生个数
在约定的服务时间内，发生重大事件的数量
< 4个/年
系统灾难恢复时间
在发生灾难时，系统通过停机、维修、解决到恢复的整个时间
运维服务公司级指标体系
1.人员相关指标
序号
衡量指标
指标计算说明
目标值
1
储备计划完成率
人员储备实际数量/人员储备计划数量×100%
100%
2
人员招聘到岗率
人员招聘实际数量/人员招聘计划数量×100%
90%
3
培训人次完成率
实际培训人次数量/计划培训人次数量×100%
100%
4
培训课时完成率
实际培训课时数量/计划培训课时数量×100%
100%
4
问题平均解决时间
平均解决时间：累加问题解决时间/解决问题的数量× 100 %
2h
3.配置相关指标
序号
衡量指标
计算方法说明
目标值
1
配置项记录出现错误的比率
数量：记录出现错误的配置项（按配置项类别统计）
比例：记录出现错误的配置项数量/所属类别配置项的数量 × 100 %
1%
2
新增配置项的比率
用途：用于统计不同类别配置项的更新情况
100%
5
培训人员合格率
培训人员合格数量/参见培训人员数量×100%
88%
6
培训计划完成率
完成培训项数量/计划完成培训项数量×100%
95%
2.资源相关指标
序号
衡量指标
指标计算说明
目标值
1
运维工具完好率
运维工具完好数量/工具总数量×100%
100%
2
事件回访率
事件按时回访完成数量/事件总量×100%
比率：数量 / 事件或服务请求总数 × 100 %
100%
5
事件平均
解决时间
累加不同等级事件或服务请求的【解决时间（小时）】/ 不同等级事数量：在事件或服务请求中过滤【满意度调查内容】＝‘满意’
比率：数量 / 事件或服务请求总数 × 100 %
90%
2.问题相关指标
序号
5%
8
事件解决率
解决的事件数/总的事件数
75%
9
客户满意度
按月调查，分：满意、比较满意、一般、不太满意、不满意五档
满意
10
呼叫平均应答时间
各次呼叫振铃次数之和/呼叫总数
2次
11
事件解决平均时间。
各次解决事件时间之和/事件总数
1h
12
一线解决事件百分比
一线解决事件数/事件总数
80&
13
服务坐席处理呼叫数
服务的时间
远程服务
现场服务2h
2
信息发布及时率
从信息确定到告知客户的时间
3
突发事件完成率
处理完成的事件数/事件总数
95%
4
供应商告知及时率
从决定通知供应商到通知到供应商的时间
5
执行服务任务合格率
合格服务次数/服务总数
80%
6
监控客户系统准确率
监控客户系统正确的次数/监控总数
95%
7
呼叫放弃率
振铃25s不接次数/总的电话次数
信息安全风险控制率
采取控制措施的风险/已识别的风险数量×100%
90%
比率：新增配置项的数量/配置项数量（类别）× 100 %
10%
3
修改配置项的比率
用途：用于了解配置项的审计情况
比率：修改配置项的数量/配置项数量（类别）× 100 %
5%
4.变更相关指标
序号
衡量指标
说明
目标值
1
变更总数
周期内（月、季、半年、年）统计变更的数量
2
紧急变更的数量比率
紧急变更的数量/变更总数*100%
< 24小时
响应时间
服务台完成事件记录到工程师受理事件所耗费的时间
按事件优先级处理标准处理
工程师到达现场时间
工程师受理时间后到达乙方现场所需要的时间
按事件优先级处理标准处理
每月巡检内容
包括协议规定的所有业务系统的运行状态检查
1次/月，巡检日期安排在月底进行
服务报告
6个月向甲方提交半年的服务报告，明确上半年的系统运维情况。并对系统提出合理的整改建议。