故障响应机制1.2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
故障响应机制
北京傻+逼信息技术有限公司
2014年12月
目录
1引言 (1)
1.1编写目的 (1)
1.2适用范围 (1)
2故障 (2)
2.1故障分类 (2)
2.2故障响应时间表 (4)
3故障定级 (5)
3.1故障累积升级 (5)
3.2处理能力不足 (5)
3.3客户关注程度 (5)
3.4客户反馈故障升级 (6)
3.5客户监控出现的问题 (6)
3.6故障定级矩阵 (7)
4现场人员注意事项 (8)
5故障响应人员 (9)
6处理流程 (10)
6.1一级故障 (10)
6.2二级故障 (11)
6.3三级故障 (13)
6.4四级故障 (14)
7事后总结 (16)
1引言
1.1编写目的
由于生产环境中经常会出现各种故障,一般通过两种途径:公司方人员发现、银行方人员告知。现场人员会发现问题不知道如何解决,也不知道该通知谁解决,经常会出现处理延误、沟通不畅等问题,导致客户满意度下降,客户信任度下降。
另外现场人员要加强自身的沟通能力,第一要安抚客户、告知客户公司已经进行处理,第二要能简明扼要的说明现场情况、客户关注程度、问题导致结果等。
本文档旨在提供一个规范化的流程,让现场人员做到有章可循,针对不同的故障级别找到响应的处理人员。
从故障处理上,不仅可以体现公司的专业性,也能提高客户满意度。
1.2适用范围
项目组的所有人员需要了解,在故障出现的时候能第一时间进行处理。
领导组需要进行了解,知道各种级别的领导需要沟通。
2故障
2.1故障分类
故障按照产生的后果进行分类,共分为四类。
2.2故障响应时间表
3故障定级
3.1故障累积升级
按照不同的故障分类需要进行相应的处理,但是有时问题会重复出现或者同类问题出现了多个,进行故障升级。
例如:开发人员发现了一个ui问题,这是一个四级故障,他应该通知他的组长进行统筹处理,在该组长进行处理时发现了十个类似的问题,这个问题直接升级到三级故障,由该组长负责向项目经理通知,并进行全面查找问题,进行统一解决,做到故障的全部解决。
•四级故障数 >= 5,升级为三级故障
•三级故障数 >= 3,升级为四级故障
•二级故障数 >= 2,升级为二级故障
3.2处理能力不足
现场人员如果在接到处理命令后,在两个小时内确认自己无能力处理该故障,那么要求责任人将故障升级,联系更高级别人员,进行统筹工作。
如:发现一个后台日志异常,有明显变坏的趋势,且银行方已经发现了交易量有少量下降,这应该是一个三级故障,在内部响应后项目经理和高级开发人员进行了处理,但是找不到问题所在,那么直接上升故障等级,通知领导协调更高级的技术人员进行处理。
3.3客户关注程度
客户的关注程度较高时,故障等级应做升级,如果现场人员不能确定客户是否关注程度比较高,可以通过以下几点进行判断:
➢客户语气焦急,明显有些不耐烦,明令快速解决
➢客户话语中透露出某某领导派他过来问,或者某某领导等着看,等等
➢客户表明因为这个系统的问题,导致其他系统无法正常运作
➢客户已经直接联系领导反映情况(这是非常糟糕的情况,3.4中会有说明)
如果还不能判断出客户的关注程度,那么直接打电话给项目经理,如果项目经理也不能判断出客户关注程度,则按照客户关注程度一般处理。
客户关注程度高时,故障+1级(如原故障二级,+1后变一级),已经是一级的无法再升级。
关注程度一般时,不做故障升级。
3.4客户反馈故障升级
如客户遇到了故障,没有通知现场人员或者项目负责人员。而是直接联系了部门领导或者公司领导,那么故障响应要做相应升级。
如果故障是用户发现的,故障一般都在三级以上,那么按照用户的响应级别进行故障定级。例如:如果反馈用户是银行总经理级别的,即使是三级故障,也要按照一级故障进行响应。
原则上是找到公司与用户级别对等的领导,该领导在响应机制的哪个级别,故障就升级到哪个级别。
➢银行总经理对应公司总经理,定为一级故障
➢银行科技(信息)部经理对应公司交付中心总经理,定为一级故障
➢银行科长级别对应公司交付中心总监,定为二级故障
如果客户反馈的故障,按照故障标准认定的等级大于用户反馈认定的故障大于,那么以故障标准认定为准。
3.5客户监控出现的问题
银行都有一些监控体系,可以从中查看到各种异常情况,这些异常情况可能是已经出现了问题的,也可能是即将出现问题,这些一般都是由技术人员解决。
此类问题一般按照二级故障处理,如果客户关注程度较高,则需要公司相应人员进行沟通,如果客户关注度不高,直接协调技术人员解决。解决后,须告知银行相关负责人。
标准
3.6故障定级矩阵
颜色说明
文案
标准
4现场人员注意事项
➢遵守银行现场的各项制度管理规范,维护公司声誉和形象,不允许有损公司声誉形象的事情发生。
➢重视自身的沟通,日常工作中不要抱怨,不说一些可能会伤害客户的话,,这样可能让用户积累一些怨气,在出现问题时候一并爆发。做到在现场
的人员工作期间少说些与工作无关的事情
➢在问题出现的时候,现场人员放下手头的原有工作(指原定的任务,与本次故障无关的任务),全心的投入的故障处理工作中。第一,做好沟通
协调员,将现有问题向上汇报。第二,从容不迫应对,安抚客户心情,
告知公司已经处理(人员已经在路上等等)。第三,积极配合客户,做好
现场工作。第四,小心谨慎,不要手忙脚乱,此时不能再犯错误。
➢技术人员提高技术能力,多了解公司的框架、操作系统和一些日常使用的中间件,不要因为自己的粗心大意,导致系统瘫痪。做到修改前先备
份。修改后先检查,备份保留而不删除。
➢重视质量意识,加强代码自查,按照流程规范行事,从自身减少隐患➢现场人员要留有各个内部联系人的电话,邮箱,必要时可以贴在工位上,不要出现问题再去找人问电话号码
➢明确自己的职责,了解其他人员(特别是领导)的职务和职责,了解每级别的责任人和联系人