计算机容错技术复习提纲

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算机容错技术

第一章绪论

1、容错系统与高可靠性系统有什么区别?有什么联系

2、为什么说可靠度高的系统其安全度必然高,但安全度高的系统其可靠度不一定高。

答:可靠度定义为:设在时刻t0系统正常运行,则系统在整个时间区间【t0,t】内正常运行的条件概率称为系统在时刻t的可靠度,记为r(t)。

安全度定义为:设在时刻t0系统正常运行,则系统在时刻t的安全度s(t)是指系统在整个时间【t0 ,t】内正常运行的条件概率加上系统在时刻t处于失效安全状态的条件概率。

定义安全度是两个概率之和,其中第一个条件概率就是可靠度。因此,一个可靠度高的系统,其安全度也必然高,反之,一个安全度高的系统其可靠度未必高。

3、可靠度高的系统是否可用度一定高?可用度高的系统是否可靠度一定高,为什么?

答:可用度的概念:系统在时刻t的可用度是指系统在该时刻正确执行其功能的概率,记为a(t)

注意:可用度与可靠度的区别,可用度只考虑时刻t系统正确执行功能的概率,并不关心时刻t以前系统是否发生过时效。而可靠度则要考虑在整个时间区间【t0,t】内系统正常运行的概率。

4、系统的可维度是如何影响系统的可用度的?

A(t)=t0/t0+tf

5、衡量系统可信性的主要指标有哪些?

答:排错与容错

6、实现冗余有哪几种方式?

(1)硬件冗余:应用附加硬件来实现故障检测及容错:典型的列子如双机比较系统,三模表决系统等。

(2)软件冗余:应用附加软件来实现故障检测及容错。典型例子如故障诊断程序、软件实现的比较器、表决器等。

(3)信息冗余:应用附加信息来实现检错或纠错。典型的例子有检错码及纠错码。

(4)时间冗余:应用附加的时间以执行系统的功能,实现检错或容错,典型的例子有指令复制,程序卷回等。

第二章故障及防卫故障的原理

1、举例说明故障、差错与失效的区别

故障:是系统的硬件中发生的物理缺陷,设计制造的不完善或软件中隐含的错误。

硬件故障的例子如线路的短路或开路、晶体管不能正常导通或截止等。软件故障的例子如程序的死循环等。

差错:差错是系统中由于故障而造成的信息或状态的不正确。

故障是差错的原因,而差错是故障的结果。

失效:失效是指系统未能正确提供预先指定的服务。

差错是失效的原因,而失效是差错的结果。

2、有些系统要求高可靠度,而另一些系统则要求高可用度,各举一个列子说明之,试分析故障的四种原因对高可靠度系统的设计及对高可用度系统设计的影响。

答:故障的四个原因:

(1)需求说明错误:包括不正确的算法、不正确的系统结构、不正确的硬件需求说明及不正确的软件需求说明。需求说明错误会造成软件故障或硬件设计故障。

(2)实现错误:包括设计不当、元件选择不当、硬件结构不当或软件编码错误就会

在实现过程中引入故障。实现错误会造成软件故障或硬件设计故障。

(3)外部干扰:包括辐射、电磁干扰、恶劣环境等。外部干扰造成的故障是硬件物理故障

(4)元件缺陷:包括元件制造时的不完善、使用过程中随机发生的元件损坏及元件寿命已尽时的损坏。元件缺陷只会影响硬件的正确工作而导致硬件的物理故障。

7

3、试分析故障掩蔽技术适用于何种情况。它有些什么缺点?

答:故障隐蔽技术是防止系统中故障在该系统的信息结构中产生差错的各种措施。这种技术中最常用的有纠错码、表决技术等。

第三章测试技术及可测性设计

1、证明定理3-1:一个电路中所有单个s-a-1及s-a-0故障都是可测故障,当且仅当该电路是冗余的。

第四章故障掩蔽技术及系统重组技术

故障掩蔽技术是防止故障造成差错的各种技术。这类技术不要求在容忍故障前检测故障,但要求做到故障包容。

系统重组是防止差错导致系统失效的各种技术。系统重组技术要求首先做到故障检测,然后做到故障定位,最后做到系统恢复。

故障掩蔽技术和系统重组技术都是建立在资源冗余的基础上。

第二节硬件冗余

有三种基本的硬件冗余形式:被动冗余,主动冗余和混合冗余

被动冗余 :又称为静态冗余,冗余结构不随故障情况变化的冗余形式

各模块具有相同的程序和数据,在使用前需要同时复位

表决技术 :可用硬件实现也可以用软件实现

硬件实现一般使用同步表决器

硬件表决技术和软件表决的优缺点:

硬件表决技术表决速度快,附加硬件多,技术要求高

软件表决技术恰恰相反,表决表决比较灵活。

2.2主动硬件冗余

又称为动态冗余,是通过故障检测,故障定位以及系统恢复来达到的一种技术。他不防止故障产生差错,但防止差错产生失效。

监督定时器:是一个需要以一定周期重复复位的定时器,用它可以检测系统中的故障。监督定时器不仅能检测硬件故障,也能检测软件故障。

2.3混合硬件冗余

将主动冗余和被动冗余结合起来就是混合硬件冗余,混合硬件冗余成本较高,因此一般用于需要极高可靠度的场合。

带备件的N模冗余:这类系统的基本核心是N个模块构成的表决结构,外加若干备件以替换NMR核心中的失效模块。

自清除冗余:N个相同的模块和一个表决器,每个模块对应一个开关。

原理:各模块将表决的结果和自己的输出进行比较,若结果比较不一致,则该模块将被清除,系统将用N-1个模块工作。

硬件冗余小结:被动硬件冗余:采用掩蔽技术

主动硬件冗余:采用重组技术(故障检测,故障定位及系统恢复)

混合冗余:采用掩蔽技术和采用重组技术。

第三节信息冗余

通过数据中附加冗余的信息,达到故障检测,故障掩蔽或容错的目的,如纠错码和检错码。

汉明距离:任意两个二值码字取值的不同的位数。

码距:一个码中任意两个码字的最小汉明距离。

相关文档
最新文档