分散控制系统(DCS)可靠性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分散控制系统(DCS)的可靠性
摘要:分散控制系统(distributed control system),简称dcs的主要作用是对生产过程进行控制、监视、管理和决策,因此要求它必须具有很高的可靠性,这样才能保证工厂的安全、经济运行。为了实现这一点,在分散控制系统中采用了许多提高可靠性的措施。本文主要从可靠性的一般概念、可靠性分析方法、分散控制系统中采用的可靠性措施进行简单的论述。
关键词:分散控制系统(dcs),可靠性
概述:
可靠性的研究工作随着大规模计算机系统和国际性计算机通信网络的不断发展,可靠性问题己经成为一个十分重要的问题,可靠性理论也在这种形势下不断地发展和完善,可靠性技术的研究内容大致分为四个方面:可靠性设计、可靠性分析、可靠性试验、可靠性管理。
可靠性设计旨在按照一定的技术要求,设计和制造出可靠性高、不易损坏的产品;可靠性分析则是通过对有关数据的收集、分析和计算得出一些关于可靠性问题的评价和结论;可靠性试验是验证系统可靠性是否达到规定指标的手段,它能暴露系统设计中可能存在的问题;可靠性管理着眼于从管理方面提高整个系统的可靠性,例如制定合理的检修周期,配备合适的备品备件,安排适量的检修人员等。
在分散控制系统中,采用了许多提高可靠性的技术措施。这些
技术措施是建立在以下四种基本思想上的:一是要使系统本身不易发生故障,即所谓的故障预防;二是在系统发生故障时尽可能减少故障所造成的影响,即所谓的故障保安和故障弱化;三是当系统发生故障时,能够让系统继续运行,即所谓的故障容许;四是当系统发生故障时,可以在不停止系统运行的情况下进行维修,即所谓的在线维修。基于这四种基本思想,分散控制系统中采用了各种各样的可靠性措施。
一、系统硬件的可靠性措施
1、严格进行质量管理和提高系统硬件水平
硬件是系统正常工作的物质基础,也是影响系统可靠性的关键所在。因此,提高硬件的平均故障间隔时间(mtbf)是提高系统可靠性的重要措施。为了实现这一点,分散控制系统的制造厂家采取了许多措施。
(1)对元器件进行严格的筛选和老化
所谓筛选,就是将不符合使用条件的元器件,通过适当的方法予以剔除。所谓老化就是在元器件投入使用之前,将其置于一定的工作条件下,使有可能发生参数漂移的元器件逐步稳定。
(2)元器件的降额使用
电子元器件都有一定的使用条件,这些使用条件是以元器件的某些额定参数值来表示的。实践证明,当元器件的工作条件低于额定值时,其工作比较稳定,发生故障的机会也比较少。所以为了提高可靠性,往往将元器件降额使用。降额的幅度要从可靠性和经济
性两方面综合考虑,因为元器件的额定参数越高,价格也越高。
(3)充分考虑到参数变化的影响
在电路设计上充分考虑到元器件在使用过程中受参数变化造成的影响,使之在各种不利情况下均能正常工作。
(4)采用低功耗元件
低功耗元件的发热量比较少,它们的故障率相对来说比较低。另外,普遍采用低功耗元件可以大大地减轻电源的负担,提高电源的可靠性。
(5)采用噪声抑制技术
在工业控制现场,各种各样的干扰脉冲常常是造成控制系统硬件故障的原因。因此,采用噪声抑制技术是提高系统可靠性的一种行之有效的办法。
(6)耐环境设计
在系统硬件的设计上,充分考虑各种环境因素的影响,采用适当的冷却、抗震、防尘、防腐等技术措施,以提高系统抵御外部环境侵袭的能力。
2、使系统故障时处于安全状态
(1)限制故障范围
系统在工作中不断地进行在线故障检测,一旦发现故障,就将故障设备与系统隔离,使它不致于影响其他设备的正常运行。
(2)“冻结”cpu输出
如果系统检测到cpu故障,则立即“冻结”控制系统的输出信
息,以免造成输出混乱。
3、采用后备措施
(1)手动后备
对于重要的控制回路,可以采用手动后备的方法来提高可靠性。一旦自动控制失灵,可以手动控制生产过程。分散控制系统有三种处于不同层次上的手动操作方式,见下图:
○1运行员操作站上进行手动操作
这种手动操作要求运行员操作站、通信网络、基本控制单元、过程输出通道都能够正常工作时才能进行,因此,具有一定局限性。
○2用手动操作站通过i/o模件进行操作
这种手动操作方式所经过的环节比较少,因此具有较高的可靠性。但它仍然要求i/o模件正常工作,否则手动操作不能进行。
○3用手动操作站直接进行操作
在这种情况下,手动操作站直接输出4~20ma或0~10v的模拟量信号去控制执行机构。因此,即使i/o模件发生故障,手动操作仍然可以进行。这种手动操作也是电厂中经常采用的一种操作。
(2)自动后备
自动后备是采用冗余的方式设置另外一套或几套备用控制装置。当处于运行状态的自动控制装置发生故障时,备用控制装置自动投入,维持系统的自动控制。
二、系统软件的可靠性措施
以上所讨论的是硬件的可靠性,下面简要介绍软件可靠性的一般概念。软件可靠性方面的研究工作起步较晚,但近年来逐渐引起人们的重视。其主要原因是:软件的可靠性不高不仅会影响系统的工作,甚至会导致系统的瘫痪,造成不可挽回的后果。例如:在1963年,一个隐藏的软件错误曾经使美国飞往火星的火箭发生爆炸,造成了巨大的损失。软件可靠性的研究目前还不太成熟,但掌握一些基本概念,对于更好地认识软件可靠性问题是有益的。
1、软件的可靠性
软件的可靠性最初仅仅被认为是软件的准确性。如果软件能够准确无误地完成所要求的功能,人们就认为软件是可靠的。然而,这最起码的要求也常常不能得到满足。有人做过统计,对于初次编出的软件,平均每100--4000条指令就会出现一个错误。这些错误需要在调试、联调、试运,甚至到运行时才能陆续被发现和改正。近年来,人们对软件可靠性赋以更广泛的含义,即便于使用和便于扩展。如果一个软件不便于使用和扩展,就认为这个软件存在着缺陷。软件的质量主要由以下六方面的因素决定:
(1)时间因素
与硬件一样,软件也有mtbf、mttr等指标。除此之外,还有以下时间指标:系统平均不工作间隔时间mtbd(mean time between system downs)、平均停机时间mdt(mean down time)。
(2)缺陷频数
包括软件缺陷数、文件缺陷数、用户提出的补充要求数。