计算机控制系统的可靠性研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机控制系统的可靠性研究
摘要:随着计算机应用水平的不断提高,计算机的依赖已经成为社会的必然。计算机的依赖即对数据的依赖,数据已成为社会文明赖以维持的重要条件。不论是在政府机关企事业单位使用的现代办公系统中,还是在保证企业正常生产的大型集散控制系统中,抑或是在代表现代制造业最新水平的柔性制造系统或计算机集成制造
系统中,如何保障数据的高可靠、持续访问是我们计算机应用者必须面对的主要问题。以计算机应用和数据为中心的理论为依据,建立计算机应用系统高可靠理论与应用推广技术,保障计算机应用系统的数据高可用,避免数据灾难对社会正常秩序的严重破坏,是计算机应用高可靠性研究的主要内容,该研究具有重大的意义。具体来说包括:海量数据存储系统,数据处理通道高可靠性,数据传输通道高可靠性等。
关键词:计算机可靠性容错
1.系统可靠性的定义
在特定时间内和特定条件下系统正常工作的相应程度,即(degree of suitability)。系统的可用性(availability),即利用率。可用性的平均值即平均利用率,其计算方法为:a = mtbf / (mtbf + mttr)。其中:mtbf(meantime between failures),故障间隔平均时间;mttr(meantime to repair),系统平均修复时间。
2.主要的可靠性技术
提高计算机系统可靠性主要有两种方法:避错和容错。所谓避错就是采取各种可能的技术措施避免计算机在使用过程中发生错误;所谓容错就是在系统运行过程中允许某些环节发生某些错误,但是计算机给出的最终结果中不包括由于上述环节中发生的错误所造
成影响。
2.1避错技术
其实就是追求一种完美性。要求组成系统的各个部件、器件具有高可靠性,不允许出错,或者出错率降至最低。
2.1.1硬件的可靠性与完美性
指元器件的完美性、部件的完美性、整机与系统的完美性。例如,电路:规范设计、电路结构合理、时序安排合理;元器件:制造简单、筛选使用、老化处理、保证寿命;部件:pcb板布局合理、器件位置合理、结构和布线合理、焊接和安装牢固、利于散热、机械性能优越;整机:整体一致、结构合理、干扰屏蔽;环境:使用环境满足要求、强弱电分开布置、减少干扰和静电。
2.1.2软件的可靠性与完美性
软件的正确性、可用性、完美性和兼容性。软件可靠性是软件产品在规定的条件下和规定的时间区间完成规定功能的能力。规定的条件是指直接与软件运行相关的使用该软件的计算机系统的状态
和软件的输入条件,或统称为软件运行时的外部输入条件;规定的时间区间是指软件的实际运行时间区间;规定功能是指为提供给定的服务,软件产品所必须具备的功能。
2.2容错技术
即在一定程度上容忍故障的技术。容错系统,采用容错技术的系统。当系统因某种原因出错或者失效,系统能够继续工作,程序能够继续运行,不会因计算机故障而中止或被修改,执行结果也不包含系统中故障引起的差错。
冗余技术是容错技术的重要结构,它以增加资源的办法换取可靠性。由于资源的不同,冗余技术分为硬件冗余、软件冗余、时间冗余和信息冗余。资源与成本按线性增加,而故障概率则可按对数规律下降。
2.2.1硬件容错技术
1)系统级容错
多种系统容错后备模式。双机双工热备份:两机同时运行,分不同作业,各自资处理自己分配的任务;主从热备份:主从式(m/s),m运行,s后备,m故障,s接管并升级为m,原m修复后作为s;热备份:m运行,s后备,m故障,s接管作m,原m修复,s归还m。2)部件级容错
磁盘镜像:将相同的数据分别写入两个磁盘;磁盘双联:为镜像磁盘增加了一个i/o控制器,形成磁盘双联,使总线争用得到改善;raid(独立磁盘冗余阵列):就是将n台硬盘通过raid controller 结合成虚拟单台大容量的硬盘使用。磁盘阵列中针对不同的应用使用不同技术,称为raid level,而每一level都代表着不同技术,用哪个level视用户的操作环境和应用而定;电源:采用双电源,
dc冗余,ac、dc全冗余;i/o卡:双网卡;pci总线:三重对等pci 技术;cpu:多cpu容错系统。
2.2.2软件容错技术
软件容错主要是对计算机应用软件科技人员为某一个特定的工程设计和开发的应使用软件而言。目前实现软件设计的冗余通常都采用重版本程序设计法,这如同硬件静态容错一样,是一种静态屏蔽软件可能造成错误的技术。设计思想是用n个具有相同功能的程序同时或先后执行某项计算,结果通过多数表决来选择。表决程序是n重本程序设计结构的关键。
以n重版本程序设计的方法来实现软件设计的冗余是保证软件可靠性同时也是提高整个系统可靠性的最强有力的措施,但是这种技术措施的采用又反过来要求增加为其运行所需的硬件资源,从而加大了系统的成本和硬件设计的复杂性,另一方面也增加了系统在时间上的开销,从而使系统运行时间增加用户等待时间加长。正是由于这种原因,一般情况下,如果不是在超高可靠性要求的实时系统中可以不必考虑采用这些措施。
结论
多年来广大计算机科技工作者为提高计算机系统的稳定性、可靠性、可维护性而采取硬、软冗余技术来增强系统的避错、纠错、容错等办法,未来将仍是我们可以遵循的技术路线。实际上众多的计算机硬软件制造商、系统集成商,在自己的计算机及其系统中通过采用双多机系统、镜象、热备份多种硬软件结合的冗余技术,大大
提高了其新产品和工程系统的容错能力,使计算机的稳定性、可靠性、可维护性得到了很大的改善。
参考文献:
[1]冯登国.计算机通信网络安全[m].北京:清华大学出版
社.2001
[2]袁津生.计算机网络安全基础[m].人民邮电出版社.2002
[3]冯博琴.计算机安全[m].北京:高等教育出版社.2003