综合监控系统故障处理规程

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

综合监控系统故障处理规程

目录

1 总则 (1)

1.1目的 (1)

2定义 (1)

3服务器故障处理 (1)

3.1服务器设备概况 (1)

3.2服务器主要故障及应急处理措施及程序 (1)

4操作员工作站故障处理 (2)

4.1工作站设备概况 (2)

4.2工作站主要故障及应急处理措施及程序 (2)

5 FEP故障处理 (3)

5.1FEP设备概述 (3)

5.2FEP主要故障及应急处理措施及程序 (3)

6交换机故障处理 (4)

6.1交换机设备概述 (4)

6.2交换机主要故障及应急处理措施及程序 (4)

7 IBP盘故障处理 (5)

7.1设备概述 (5)

7.2IBP盘主要故障及应急处理措施及程序 (6)

8 UPS故障处理 (7)

8.1设备概述 (7)

8.2UPS设备主要故障及应急处理措施及程序 (7)

综合监控系统故障处理指南

1 总则

1.1目的

为了向综合监控系统维护人员在重要设备出现故障后,对其故障排查和检修工作进行指导和规范,提高检修质量和效率,同时保障了运营和员工的安全性。2定义

本标准采用下列定义:

主控系统设备:指维修二部自动化分部所属工作范围内的各种设备:服务器,交换机,操作员工作站,UPS(不间断电源系统),IBP(综合后备操作盘),FEP (前端处理器)、OPS(大屏幕投影系统)。

OCC:控制中心。

3服务器故障处理

3.1服务器设备概况

服务器系统分为车站级服务器和中央级服务器,中央级服务器包括两台实时服务器、两台历史服务器;每个车站的车站级服务器包括两台实时服务器。

3.2服务器主要故障及应急处理措施及程序

网卡模块,内存模块,硬盘模块,CPU模块,显卡模块,基板模块、电源模块等硬件设备的处理措施及程序:

●记录故障发生时间和故障现象。

●提取并保存管理卡片日志,重新启动系统。

●如果故障依旧,则设备断电。

●更换故障模块,并保存损坏模块并做好记录。

●重新启动服务器,使系统运行在双机热冗余状态。

3.2.1操作系统、workbench应用软件、通信组件等软件故障的处理措施及程序:

●提取日志文件,并妥善保存,分析故障原因。

●通过备份,恢复系统。

●重新启动系统。

●系统冗余、系统功能性故障的处理措施及程序:

●提取日志文件,并妥善保存,分析故障原因。

●通过备份,恢复系统。

●重新启动系统。

●若故障依然,则申请系统降级运行。

4操作员工作站故障处理

4.1工作站设备概况

操作员工作站包括:控创iRack工控机主机、输入输出设备,一般用于显示综合监控系统HMI。

4.2工作站主要故障及应急处理措施及程序

4.2.1电源模块、显卡模块、声卡模块、主板模块、CPU模块、硬盘模块、内存模块、鼠标、键盘、显示器等硬件设备故障

应急处理措施及程序:

●记录故障发生时间和故障现象。

●系统运行在冗余工作站单机状态。

●系统断电,更换故障模块。

●如有必要,重新安装系统所需要的软件。(比如,重新安装声卡后,需要

安装该声卡的驱动程序)

●系统加电,恢复系统运行。

4.2.2 windows server 2008操作系统、设备驱动程序、主控应用程序等软件故障

应急处理措施及程序:

●记录故障发生时间和故障现象。

●系统运行在冗余工作站单机状态

●重新安装故障软件。如有必要,重新安装与故障软件相关联的所有软件。

(具体步骤:1安装操作系统,2安装驱动程序,3安装workbench以及

补丁,4安装相关插件,5安装HMI)

●系统恢复运行。

4.2.3系统冗余、系统功能缺失故障

应急处理措施及程序:

●记录故障发生时间和故障现象。

●关闭一台工作站,使其工作在单机状态。

●如果故障依然,则申请系统降级运行。

5 FEP故障处理

5.1 FEP设备概述

FEP(前端处理机)是一个专用计算机,它的功能是完成所有的通信任务,而让服务器主机来进行专门的数据处理,以减轻主机运行应用程序的负担。FEP 负责将各子系统接入主控系统,主要完成数据传送和协议转换功能。FEP将所有子系统的数据进行集中,数据经协议转换后由FEP传送给ISCS服务器;对子系统的控制命令则由ISCS服务器发送到FEP后分发到各子系统。

5.2 FEP主要故障及应急处理措施及程序

5.2.1 FEP死机

引起FEP死机的原因可能有:

(1) FEP需要处理的数据量过大,FEP因响应速度跟不上而死机。

应急处理措施及程序:

●重启FEP。

(2)配置文件错误,导致FEP无法正常启动。(数据点配置错误,包括:监控点配置错误,FEP驱动文件配置错误,FEP部署工程文件的配置错

误。所有配置点表必须与厂商提供监控点表相符,需对以上问题进行

一一排除。)

应急处理措施及程序:

●重新安装正确的配置文件,或重新安装FEP。

(3) FEP主板损坏。

应急处理措施及程序:

●确认关闭该台FEP后,冗余FEP能正常工作。

●关闭并拆卸FEP。

●更换闪存。

●重新配置FEP文件,把FEP重新投入工作。

5.2.2FEP通讯中断

FEP通讯中断的原因可能有:

●连接线故障:使用工具测试两端是否正常连通。

相关文档
最新文档