服务水平管理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
服务水平管理和服务水平协议()
服务水平管理概述
网络公司一直以来都通过构建坚实的网络基础设施及主动处理每个业务问题来满足不断扩展的网络要求。当业务异常中断时,公司将构建新流程、管理功能或基础设施来防止此类故障再次发生。然而,由于快速变更及日益增长的可用性要求,我们现在需要改进模式来预先防止意外故障并快速修复网络。许多服务供应商和企业一直都试图更好地定义服务水平以便实现商业目标。
关键成功因素
的关键成功因素用来定义支持成功构建可获得的服务水平及维护的主要要素。要成为合格的关键成功因素,流程或流程步骤必须可以改进质量并从整体上提高网络的可用性。关键成功因素还应具备可测量性,以便使企业能够判断:与定义的程序相比,它所取得的成功程度。
性能指标
性能指标提供了公司测量关键成功因素的机制。您通常需要每月审查一次,以确保服务水平定义或运行良好。网络运行小组及必要的工具组可实施以下测量标准。
注意:对于没有的公司,我们建议您同时实施服务水平定义、服务水平审核及测量标准。
性能指标包括:
•记录的服务水平定义或,包括可用性、性能、主动业务应答时间、排障目标及问题升级等。
•月度网络服务水平审核会议,审核对服务水平的执行情况并实施改进。
•性能指标测量标准,包括可用性、性能、按优先级划分的业务应答时间、按优先级划分的排障时间以及其他可测量的参数。
服务水平管理流程
面向服务水平管理的高级别流程主要包括两组:
1.定义网络服务水平
2.创建并维护
实施服务水平管理
实施服务水平管理包括十六步,分为以下两个主要范畴:
•定义网络服务水平—步骤1-6
•创建并维护—步骤7-16
定义网络服务水平
网络管理人员需要定义支持、管理并测量网络的主要规则。服务水平为所有网络人员提供目标并可用作整体业务质量的测量标准。您也可将服务水平定义用作网络资源预算工具以及投资于更高服务质量的证据。它们还提供评估供应商及运营商的表现的方法。
如果没有服务水平定义和测量,公司不可能制定明确的目标。服务是否满意由用户决定,在应用、服务器/客户机运行或网络支持方面并无明显差距。由于企业对最终结果没有把握,因此很难作预算。最终,网络公司在提高网络及支持模式方面都趋向于选择被动应答,而非主动预防的方式。
我们建议采取以下步骤来构建并支持服务水平模式:
•分析技术目标及限制因素。
•确定可用性预算。
•创建详细记录关键应用网络特征的应用资料库。
•定义可用性、性能衡量标准及通用术语。
•创建服务水平定义,包括可用性、性能、业务应答时间、排障平均时、故障检测、升级门限及上报途径。
•收集测量标准并监控服务水平定义。
第1步:分析技术目标及限制因素
开始分析技术目标和限制因素的最佳方式是集体讨论或研究技术目标与要求。因为这些人都有特定的业务目标,所以有时这有助于要求其他技术人员参与讨论。技术目标包括可用性级别、吞吐量、抖动、延迟、应答时间、可用性要求、新特性的推出、新应用的推出、安全性、可管理性及成本等。随后,公司应研究限制因素,以便使用可用资源实现这些目标。您可为每个目标创建带有对限制因素解释的工作表。最初看似大多数目标都无法实现。随后划分目标的优先级或降低对仍可满足商业要求的目标的期望值。
例如,您制定的可用性级别可能是99.999%,或每年5分钟的故障停机时间。实现这一目标存在大量限制因素,如硬件的单点故障、远程位置中的故障硬件的平均修复时间()、运营商可靠性、预先故障检测、高变更率及当前网络容量限制等。因此,您需要将这个目标调节到更加易于实现的级别。下个章节中介绍的可用性模式可帮您制定现实的目标。
您可能也考虑在限制因素相对较少的网络领域提供可用性。当网络公司公布业务的可用性标准时,公司中的各业务部门可能发现无法接受这个级别的可用性。这自然而然引发对的讨论,或为可满足商业要求的模式进行投资/做预算。
确定所有限制因素或风险的工作包括要实现技术目标。根据实现理想目标的最大风险或影响方面划分限制因素的优先级。这可帮助公司确定网络改进计划的优先顺序,并确定解决限制因素的难易程度。限制因素分三类:
•网络技术、故障恢复能力和配置
•生命周期方案,包括:规划、设计、实施和运行
•当前的话务负载或应用行为
网络技术、故障恢复能力及配置限制因素是指与当前技术、硬件、链路、设计或配置相关的任何限制因素或风险。技术限制因素指技术本身造成的任何限制。例如,当前没有一种技术允许冗余网络环境中实现少于1秒的聚合时间,而这恰恰是维持整个网络上的话音连接的关键。另一个例子是数据通过地面链路时的原始速度,大约是100英里/毫秒。
网络硬件故障恢复能力风险调查应集中在硬件拓扑、分级体系、模块化、冗余、及定义的路径这几方面。网络链路限制因素应强调企业网络链路及运行商连接。链路限制因素可能包括链路冗余和多样性、媒介限制、布线基础设施、本地环路连接性以及长距离连接性。设计限制因素与网络的物理或逻辑设计相关,包括从为设备可用空间到路由协议实施的可扩展性等各个方面。您应在配置、可用性、可扩展性、性能及容量方面考虑所有协议和媒介设计。动态主机配置协议()、域名系统()、防火墙、协议转换及网络地址转换等网络业务限制因素也应列入考虑之列。
生命周期方案定义用于实现解决方案的统一部署、检测和修复故障、防止容量或性能问题以及配置一致性和模块化的网络流程和管理。您需要认真考虑这个领域,因为专业技术和流程通常是导致不可用性的最大影响因素。网络生命周期指规划、设计、实施和运行周期。在每个阶段中,您都必须了解性能管理、配置管理、故障管理及安全性等网络管理功能。思科高可用性服务部()提供网络生命周期评估服务,确定与网络生命周期方案相关的当前网络可用性限制因素。
当前的话务量或应用限制因素只是指当前话务和应用的影响。
不幸的是,许多应用都带有大量需要慎重管理的限制因素。当前应用的抖动、延迟、吞吐量及带宽要求通常带有许多限制因素。编写应用的方式也可能产生一些限制因素。汇编应用资料库可帮您更好地了解这些问题;下文将介绍这一特性。研究当前的可用性、话务、容量及性能还可帮助网络管理人员了解当前的服务水平目标及风险。这一工作常通过名为网络基准制定的流程来完成,该流程可帮您定义规定时段内(通