综合监控系统故障处理规程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
综合监控系统故障处理规程
目录
1 总则 (1)
1.1目的 (1)
2定义 (1)
3服务器故障处理 (1)
3.1服务器设备概况 (1)
3.2服务器主要故障及应急处理措施及程序 (1)
4操作员工作站故障处理 (2)
4.1工作站设备概况 (2)
4.2工作站主要故障及应急处理措施及程序 (2)
5 FEP故障处理 (3)
5.1FEP设备概述 (3)
5.2FEP主要故障及应急处理措施及程序 (3)
6交换机故障处理 (4)
6.1交换机设备概述 (4)
6.2交换机主要故障及应急处理措施及程序 (4)
7 IBP盘故障处理 (5)
7.1设备概述 (5)
7.2IBP盘主要故障及应急处理措施及程序 (6)
8 UPS故障处理 (7)
8.1设备概述 (7)
8.2UPS设备主要故障及应急处理措施及程序 (7)
综合监控系统故障处理指南
1 总则
1.1目的
为了向综合监控系统维护人员在重要设备出现故障后,对其故障排查和检修工作进行指导和规范,提高检修质量和效率,同时保障了运营和员工的安全性。2定义
本标准采用下列定义:
主控系统设备:指维修二部自动化分部所属工作范围内的各种设备:服务器,交换机,操作员工作站,UPS(不间断电源系统),IBP(综合后备操作盘),FEP (前端处理器)、OPS(大屏幕投影系统)。
OCC:控制中心。
3服务器故障处理
3.1服务器设备概况
服务器系统分为车站级服务器和中央级服务器,中央级服务器包括两台实时服务器、两台历史服务器;每个车站的车站级服务器包括两台实时服务器。
3.2服务器主要故障及应急处理措施及程序
网卡模块,内存模块,硬盘模块,CPU模块,显卡模块,基板模块、电源模块等硬件设备的处理措施及程序:
●记录故障发生时间和故障现象。
●提取并保存管理卡片日志,重新启动系统。
●如果故障依旧,则设备断电。
●更换故障模块,并保存损坏模块并做好记录。
●重新启动服务器,使系统运行在双机热冗余状态。
3.2.1操作系统、workbench应用软件、通信组件等软件故障的处理措施及程序:
●提取日志文件,并妥善保存,分析故障原因。
●通过备份,恢复系统。
●重新启动系统。
●系统冗余、系统功能性故障的处理措施及程序:
●提取日志文件,并妥善保存,分析故障原因。
●通过备份,恢复系统。
●重新启动系统。
●若故障依然,则申请系统降级运行。
4操作员工作站故障处理
4.1工作站设备概况
操作员工作站包括:控创iRack工控机主机、输入输出设备,一般用于显示综合监控系统HMI。
4.2工作站主要故障及应急处理措施及程序
4.2.1电源模块、显卡模块、声卡模块、主板模块、CPU模块、硬盘模块、内存模块、鼠标、键盘、显示器等硬件设备故障
应急处理措施及程序:
●记录故障发生时间和故障现象。
●系统运行在冗余工作站单机状态。
●系统断电,更换故障模块。
●如有必要,重新安装系统所需要的软件。(比如,重新安装声卡后,需要
安装该声卡的驱动程序)
●系统加电,恢复系统运行。
4.2.2 windows server 2008操作系统、设备驱动程序、主控应用程序等软件故障
应急处理措施及程序:
●记录故障发生时间和故障现象。
●系统运行在冗余工作站单机状态
●重新安装故障软件。如有必要,重新安装与故障软件相关联的所有软件。
(具体步骤:1安装操作系统,2安装驱动程序,3安装workbench以及
补丁,4安装相关插件,5安装HMI)
●系统恢复运行。
4.2.3系统冗余、系统功能缺失故障
应急处理措施及程序:
●记录故障发生时间和故障现象。
●关闭一台工作站,使其工作在单机状态。
●如果故障依然,则申请系统降级运行。
5 FEP故障处理
5.1 FEP设备概述
FEP(前端处理机)是一个专用计算机,它的功能是完成所有的通信任务,而让服务器主机来进行专门的数据处理,以减轻主机运行应用程序的负担。FEP 负责将各子系统接入主控系统,主要完成数据传送和协议转换功能。FEP将所有子系统的数据进行集中,数据经协议转换后由FEP传送给ISCS服务器;对子系统的控制命令则由ISCS服务器发送到FEP后分发到各子系统。
5.2 FEP主要故障及应急处理措施及程序
5.2.1 FEP死机
引起FEP死机的原因可能有:
(1) FEP需要处理的数据量过大,FEP因响应速度跟不上而死机。
应急处理措施及程序:
●重启FEP。
(2)配置文件错误,导致FEP无法正常启动。(数据点配置错误,包括:监控点配置错误,FEP驱动文件配置错误,FEP部署工程文件的配置错
误。所有配置点表必须与厂商提供监控点表相符,需对以上问题进行
一一排除。)
应急处理措施及程序:
●重新安装正确的配置文件,或重新安装FEP。
(3) FEP主板损坏。
应急处理措施及程序:
●确认关闭该台FEP后,冗余FEP能正常工作。
●关闭并拆卸FEP。
●更换闪存。
●重新配置FEP文件,把FEP重新投入工作。
5.2.2FEP通讯中断
FEP通讯中断的原因可能有:
●连接线故障:使用工具测试两端是否正常连通。