缩短通信故障的处理时间
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
缩短通信故障的处理时间
[摘要]随着电力通信网规模的不断扩大,如何做到尽量缩短通信故障的处理时间,成为摆在各级管理者面前的一大难题。
通过一个典型的实例,分析了变电站通信故障产生的原因,介绍缩短通信故障时间的处理措施,找出解决问题的方法,供行内参考。
【关键词】通信故障;变电站;处理时间
1、问题现状
我通信公司对2008年里发生的通信故障中最常见的板卡故障处理时间进行统计,如表所示:(单位:分钟)
对上述数据分析可知,除T3之外,T1、T2、T4和T5的极差时间都在10分钟左右,T3的极差达到24分钟。
可以看出,处理故障人员赶赴现场的时间浮动会较大,且很不稳定。
原因分析为运维人员赶赴现场进行故障抢修的时间,受路程、交通状况、个人状况、车辆状况及其他不稳定因素影响,不能较准确地预知该时间,所以不把T3列入缩短通信故障处理时间的考虑范畴。
另外,T1、T4 和T5占整体通信故障处理时间的百分比相近,都在19%左右,占总体时间的比重较大;T2只占总体时间的8%,比重较小。
因此,在通信故障处理时间的影响方面,应以T1、T4和T5为主要影响进行考虑。
由此可以得出以下结论:为缩短通信故障的处理时间,我们应该把以下三段时间作为缩短通信故障处理时间的关键:
*故障发生到接收报障的时间(T1)
*现场分析故障原因制定方案的时间(T4)
*现场解除故障恢复业务的时间(T5)
2、目标定位
I、根据上述的统计数据,可以得到板卡故障处理的总平均时间为:
(分钟)
II、2007年2月12日,我公司数据部收到了备用中心(旧局)思科6509交换机设备故障的告警短信后,立刻召集相关工作人员,配合网管监控系统,对故障的原因进行了快速的定位和分析,并初步判断该交换机引擎板出现了故障。
随后,工作人员立即到物资仓库提取备用的引擎板,并迅速赶到故障现场进行排障
处理。
在数据部工作人员严谨认真的处理下,该故障在接收到告警短信后72分钟内完成故障处理。
III、根据新近颁布的《中国南方电网通信管理暂行规定》中的相关规定:通信电路和设备连续故障时间超过72分钟者视为一级事件,应列入运行考核统计并逐级上报通信管理部门。
因此,我们的目标是把处理板卡故障平均时间缩短到72分钟。
3、要因确定
(1)考核机制不完善
我公司在已有的绩效考核制度基础上,增加了一套管理制度。
把每天的工作任务量化成考核评级的分数,评级的高低直接与奖金挂钩,既规范了考核机制,又能充分调动员工积极性。
所以“考核机制不完善”并非要因。
(2)缺乏故障应急处理的专业培训
过往出现通信故障时,老员工的现场处理故障时间大概在23—38分钟内,而新员工就需要50—66分钟左右。
可见,新员工对通信故障应急处理方面明显经验不足。
所以“缺乏故障应急处理的专业培训”是要因。
(3)故障告警系统无分类筛选功能
目前我们的通信告警平台仍不成熟,在处理数据的过程中需要按故障类型分发,经常会出现假死的现象,这过程大概需耗时10分钟,严重影响了接收故障短讯的时间。
所以“故障告警系统无分类筛选功能”是要因。
(4)视频监控系统未覆盖所有站点
截至2008年底,视频监控系统已经覆盖广州城区重要变电站28个,我们还将在今后的几年内加大视频监控系统的覆盖面,争取到2010年使广州城区所有变电站全部覆盖完毕。
所以“视频监控系统未覆盖所有站点”并非要因。
(5)抢修工具未按需求配备
我公司已按局《生产工具管理办法(暂行)》的相关规定,并根据现场抢修的工作需要,向每位员工派发了一套紧凑型的便携式工具包。
所以“抢修工具未按需求配备”并非要因。
(6)无资料管理制度
我公司已设立专人专岗将设备台帐、逻辑通道等生产运行资料固化到新投产
的通信资源管理系统内,运维人员可以从中简单而快速地找到所需的资料。
所以“无资料管理制度”并非要因。
(7)用户对申报故障的流程不熟悉
以往申报故障,用户需要自己对故障进行分类,再报给对应的班组,班组才可以受障处理。
若用户不懂故障分类,就会出现报障给多个部门之后,才能报给故障对应的部门的想象。
据不完全统计,在08年4—10月期间就发生过28起错报事件,其中最长延时达到34分钟,严重耽搁了处理故障的时机。
所以“用户对申报故障的流程不熟悉”是要因。
(8)人员未按人力资源规定配备
我公司负责运行维护的人员有14人,另外通过通信集约化项目的实施,两区两市的通信运维人员也相继加入到我们的前线队伍中。
所以在人员配备方面基本符合人力资源部的相关要求。
所以“人员未按人力资源规定配备”并非要因。
(9)未能及时更换坏的灯具
根据《广州供电局变电站通信机房管理规定》的有关条例,如机房内的照明回路及灯具发生问题需在24小时内得到更换。
而在08年4—10月的抽样调查中我们发现仅有1起灯具故障违法了上述规定。
所以“未能及时更换坏的灯具”并非要因。
4、具体做法
4.1解决“故障告警系统无分类筛选功能”
2008年底,我公司再次与南京自动化研究院通信公司取得联系,决定对现行的无线语音告警系统进行改造,在原有的软件程序中写入了信息筛选、分类的功能模块,使接收到的所有告警信息能根据不同的站点、不同的报警时间、不同的设备故障类别、不同的中断业务类型排列显示。
其中,无线语音告警系统拓扑图如下所示:
效果检查:通过对系统软件的改进使运维人员能对收到的大量告警信息进行快速筛选和查看,总耗时长也由原来的10分钟缩短到1分钟左右。
4.2解决“用户对申报故障的流程不熟悉”
我公司按照局的部署于2008年9月完成了通信调度室的建设,并相应地成立通信调度班组,实现统一接收公司外部的各种故障、缺陷报告,安排相关运行维护部门及时地排障、消缺,解决了以往业务使用单位通信通道出现问题时,不知道该具体通知什么部门处理,也无法得到有效的信息反馈的难题;使电力通信能够更好地为电力系统的各级用户提供优质服务。
效果检查:自通信调度投入运行以来,再没有发生过一起业务使用单位乱报或错报故障的事件,通信调度班也被我局评为2008年度先进生产班组。
4.3 巩固措施
加强与设备厂商的技术交流和业务联系,为广大职工创造更多的培训机会,并将新员工的岗前培训作为一种长效机制加以贯彻实施。
除统一接收外部故障报告、组织通信网反事故演习外,将通信资源申请审核、计划检修管理、运行方式管理、操作审核管理、风险分析以及编制年度运行计划纳入到通信调度的日常工作内,进一步扩大其职能范围。
将传输网、接入网、数据网、同步时钟网等网管系统以及、环境动力监控系统、无线语音告警系统、通信资源管理系统整合到一综合管理平台上,以提高日常运行管理的自动化和对大量信息的交叉处理和分析速度。
5、企业效益
故障信息系统的建设以提供信息的有序管理为切入点,实际上引入了信息分层管理的概念。
这种信息的分层管理是以电网调度的应用为依据。
以对事故的有序处理为目的,以服务于电网的安全为导向,以适应技术发展为基础。
对信息的规范、有序管理是实现各种高级应用的基础前提,也是提高信息利用价值的重要措施。
并将直接有助于缩短事故处理时间、加快系统的恢复,为电网的安全运行带来明显的综合效益。