故障处理流程
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
故障处理流程
省应急平台系统网管故障管理流程包括如下步骤,形成故障处理的闭环操作:●故障发现:包括设备故障上报、网管定时轮询、网管性能监视、网管配
置文件定期检查等;
●故障接收:根据告警脚本中的事件定义,接收并解析发现的故障;
●故障分析:对接收到的故障进行分析,屏蔽重复告警,支持告警手动确
认和自动确认功能,对于部分次要告警,维护人员可将其设置为自动确认,告警一产生就自动转为已确认状态;对于重要告警,必须经维护人员手工确认。
●故障报告:告警灯、告警音、告警转发(E-mail,短信,其它网管);
●故障修复:告警定位,告警确认,系统预安装修复建议;故障修复后,
系统可自动或手工确认告警,如果该告警已确认,该告警从当前告警列表中转入历史告警表,同时清除拓扑图的相应告警提示。
●故障诊断经验共享:可以保存有价值的维护经验,供后续管理提供参考。
省应急平台系统网管提供告警知识库。告警知识是用户在维护过程中的经验总结,将这些经验输入系统,下次再出现同样的故障时,可以作为参考。用户选中一条告警记录,系统根据用户选中的告警记录,从告警知识库中查询出该条告警记录的维护经验,供用户进行告警处理进行参考。管理员将自己的日常处理经验以及业务信息及时写入数据库、更新告警处理知识对以后的故障诊断与排除非常有益。
故障经验分析