一种冗余装置的切换及自恢复方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一种冗余装置的切换及自恢复方法
1、现状
变电站为提升系统可靠性,机、保护装置、远动终端等均采用双套冗余配置,使系统的可靠性达到先进水平。
目前存在的问题:(1)目前变电站装置种类繁多,很多装置都需双机冗余装置,没有一个统一的所有装置的一个冗余设备。
(2)装置多,没有统一的存储设备,当装置故障读不出数据备份时只能全部重
新配置,风险高,工作量大。
(3)目前双机热备系统无系统自修复功能,目前
双机热备中,未考虑通过综合研判设备故障类型,自动重启设备尝试使系统自恢复。
往往供电局的辖区内都有上百个不同电压等级的变电站,站控层和间隔层装
置的总数有上万台,装置重启均需运维人员到现场进行,响应及时性不够。
2一种基于万能冗余装置的主备切换方法的研究
(一)双机热备系统设计
1、工作原理及系统架构
变电站内装置包括间隔层继电保护装置、测控装置、故障录波装置、稳控装
置以及辅助装置,站控层远动装置、PMU装置、综合应用机等都单台配置,再配
置一台万能冗余装置,该万能冗余装置为所有装置的冗余装置。
当任意一台装置
故障时,站内间隔层与站控层之间的通信、到主站的通信都为网络通信,不需要
重新接线或者重新配置,只需要将故障装置配置拷贝至该万能冗余装置即可切换
至该万能冗余装置运行,该冗余装置可向下兼容。
2、万能冗余装置组成结构
万能冗余装置系统如图2所示,包括五个模块:主控模块、状态监测模块、数据同步模块、存储模块、电源模块。
图2 万能冗余装置设计示意图
(1)状态监测模块负责与其他装置定期进行握手、心跳监测,来判断其他装置工作是否正常;同时当监测到故障装置修复好后自动比对目前在存储器中存储的数据与修复好装置之间的数据。
(2)切换控制模块具有切机及控制其他模块的功能,通过调用状态监测、数据同步等其他模块实现主备装置的状态切换、数据一致性维护等功能;
(3)数据同步模块保证了故障装置与万能冗余装置之间存档数据文件及系统配置参数的一致性;
(4)存储模块为其他间隔层及站控层装置提供配置及参数定期存储更新服务;
(5)供电管理模块负责为其他模块供电,同时当监测到其他装置无心跳报文或故障发送闭锁信号时,当该万能冗余装置切换为主机后启用并通过供电管理模块将故障装置重启进行自修复。
(二)方法部分
(1)状态监测模块。
定期与其他装置进行握手监测心跳报文,例如当万能冗余装置定期发送握手报文,如正常情况下一致重复此步骤,并定期进行简单数据报文监测;但当连续发送握手报文3次,某个装置都没有回复的情况下认为装置故障,则启动数据同步模块同步后将万能冗余装置切换为主机状态运行。
(2)切换控制模块。
装置上电初始化相关参数配置后,根据接收到状态监测模块的报文结果,当装置异常或者管理员操作命令时,由切换控制块模块调用数据同步模块,从异常装置中读取最新备份或者从存储器取出最新备份后进行阶级处理;同时若状态监测模块监测到故障装置无心跳报文或通过其他装置是否发送闭锁信号后,切换控制模块调用供电管理模块对故障装置进行自修复处理。
(3)数据同步模块。
该冗余系统包括间隔层、站控层其他装置及万能冗余装置;当其他装置正常运行时通过万能冗余装置的同步模块,定期读取其他需要冗余装置的配置及数据备份并存于存储器内,定期更新并存储备份,以备装置直接断电无法取得备份的
情况。
当某台装置故障时,同步模块从故障装置中读取相应备份,完成后,将该
装置切为故障装置的主机。
(4)供电管理模块
电源除了给其他模块供电,还可通过其他装置的闭锁信号对故障装置进行重
启完成自修复。
当故障检测模块检测到其他装置发生轻微故障,上送告警信号,
不改变系统工作模式,仍保持主机运行;当其他装置发生严重故障,万能冗余装
置监测到严重故障(当接收到其他装置装置闭锁的信号、无心跳报文、数字量模
拟量信息大量错乱的情况),触发备机的数据同步模块完成同步切为主机运行后,将故障装置切换至备机运行。
根据预先设定的故障类型,针对通讯异常、装置死机、程序卡死、网口无响应、内存软错误等故障,自动重启系统,尝试系统自修复,如果主机恢复正常,监测模块监测到有心跳报文后与故障前的存储的备份数
据进行比对,比对一致则自动将修复好的装置切为主机,冗余装置继续以备用的
方式工作。
3 效果
(1)成倍减少装置数量,减少投资成本还有后期维护成本,减少大量工作量。
站内所有以太网通讯的间隔层及站控层装置统一配置一台万能冗余配置装置。
该
万能冗余装置可向下兼容所有装置,具有多个应用场景,当某个装置故障时只要
将故障装置备份数据同步至该万能冗余装置,可将万能冗余装置切为故障装置的
主机,提高变电站间隔层站控层设备的可靠性。
(2)统一将间隔层设备及站控层设备备份进行存储并定期更新,当任一一台
装置故障都有最新备份。
通过数据同步模块定期备份间隔层及站控层设备备份,
并存储于存储模块中,当设备故障或者发生网络雪崩后可快速恢复备份,减少故
障时间。
定期存储更新备份后,当某个装置故障,灵活选择实时/准实时数据库
同步机制,既可以提供实时数据同步机制,又可以提供准实时数据同步操作,因
此能够兼顾数据访问可靠性和数据访问性能;同时当装置故障硬件死机或者通讯
卡死状态下也能保证存储模块中的备份为最新备份。
(3)对可通过重启恢复的常见硬件故障与软件故障,实现系统自修复,避免
运维人员到现场运维,提升响应及时性。
发生故障的主机修复后,自动作为备机
运行。
通过系统本身的功能检测出系统故障的发生,根据故障发生的类别及严重
程度触发系统告警或闭锁。
根据预先设定的故障类型,针对通讯异常、装置死机、程序卡死、网口无响应、内存软错误等故障,自动重启系统,尝试系统自修复。