板坯连铸机动态轻压下过程控制系统的高可用性实现
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
板坯连铸机动态轻压下过程控制系统的高
可用性实现
阐述了梅钢2#板坯连铸机动态轻压下过程控制系统的高可用性架构过程,提出了一种软件故障自主恢复与硬件热备冗余相结合的高可用性系统架构方案,并结合实际生产过程分析了备机切换过程中检查点数据的可用性,最后给出了系统故障测试结果。
实际说明,系统投产以后运行稳定,到达了预期目标。
连铸过程对连铸坯实施轻压下操作是消除中心偏析、提高连铸坯内部质量的有效手段。
在着力开发此技术的工艺控制核心模型的同时,控制系统的稳定性和安全性问题也显得尤为重要。
针对连铸生产过程的实时性和连续性,在****集团梅山钢铁股份公司2#连铸机动态轻压下过程控制系统开发过程中,通过高可用性架构,将系统故障时间控制在lh∕a 内。
在系统硬件架构方面采用两台服务器和磁盘阵列柜建立双机热备系统;软件架构方面利用系统管理模块,对系统开展监控和管理,增加了软件本身的自主恢复能力。
1系统的高可用性架构
动态轻压下过程控制系统采用双节点群集模式架构:当系统工作时,工作节点对外提供服务,备用节点监控工作节点运行情况,不参与对外服务。
当工作节点出现异常时,备用节点主动接收工作机的工作,继续对外提供服务,从而保证系统的不间断运行。
原来的工作节点开展故障处理后,根据预先设定的配置命令以人工或自动的方式切回系统,经过
与当前工作节点数据同步后,以备用节点身份继续运行,与工作节点开展心跳信息交互。
系统的硬件架构见图1,由两台配置一样的IBMXSerieS 346服务器构成群集服务节点。
节点间通过千兆以太网心跳线直连,传递心跳信息互相检测。
两台服务器在本地磁盘上各自运行操作系统(Windows Sever 20**),用户文件和数据保存在独立于节点之外的IBMDS400磁盘阵列柜中。
此外, 服务器磁盘子系统和DS400内磁盘阵列均按RAID 5方式架构,保证了数据存储的安全性。
二冷水量设定值采用平均拉速控制,平均拉速计算方法为:将二冷区内各跟踪单元的“坯龄”相加,除以该区中间位置距结晶器液面的距离。
以平均拉速作为控制参数计算得出水量设定值,防止了系统恢复前后拉速突变引起的水量突变,因此防止了因水量突变造成铸坯表面温度剧烈变化引发的铸坯质量问题。
系统检查点数据由流线全部跟踪单元的上一周期计算值组成。
系统采用后向恢复技术开展故障恢复,即将数据通信模块读取的当前流线信息与检查点信息比照,选择距当前时刻最近且完整的检查点数据与当前通信信息一同输人工艺模型开展计算。
保证了温度场计算在时间和空间上的连续, 同时降低了平均拉速的计算误差。
生产过程中,计算周期越短计算精度越高,对计算周期5s和IoS两种情况开展仿真比较得出:稳态浇铸条件下,两种情况计算无偏差;在非稳态浇铸条件下,设定铸机在IOS
内拉速从2.0m∕πιin降至0,改变计算周期前后温度场计算偏差4%,水量设定值偏差1%,且对新生成的跟踪单元无影响。
因此可以认为,当备机切换时间小于IOS时,切换过程前后模型计算偏差小于4%,可以忽略。
4系统功能测试与分析
上线调试期间,对系统开展了故障测试,表1给出了测试结果。
故障测试说明:(1)过程控制系统本身的自主恢复功能, 大大降低了双机热备切换次数,使软件引起的故障恢复时间控制在一个通信周期(5s)以内。
(2)系统管理模块的后台处理保证了系统界面的连续性,无异常反应。
(3)在操作系统崩溃、硬件异常、过程控制软件连续无响应、系统管理模块关闭四种情况下开展双机热备切换,系统恢复时间小于两个通信周期(IOs),满足生产要求。
(4)热备系统切换前后,过程控制系统数据计算连续,无异常跳跃。
5结论
梅钢2#板坯连铸机动态轻压下过程控制系统采用软件与硬件相结合的方式实现系统的高可用性。
当控制程序内部模块出现运行错误时,首先开展系统自恢复,恢复时间小于一个通信周期,大大降低了双机热备切换机率。
当操作系统故障、硬件故障或系统管理模块无法完成自主恢复时,系统在两个通信周期内完成热备机切换。
结合工艺控制过程对检查点数据的可用性和系统恢复前后的数据连续性开展了分析,仿真结果说明备机切换引起的系统控制精度误差小于
4%。
在线调试结果说明,系统故障最大恢复时间不超过IOs o 系统投用至今运行稳定、产量已超过50万t。