计算机系统可靠性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机系统可靠性
第二章计算系机的可靠性统
系
统可靠性(余冗、错容、用专)系统可性用(可正运行、故障可恢常复系)统部一件致性(臵配理合)络互连性(连网和隔通的离矛,布线)环盾安境性(全配电、地接、护)防检验收:查按照准标、范规、合同协和议一第节计机算统的系可靠性与错容
性系统靠可的定义性:在特时定间内和定特条下系件正常统作工的应相程度,(d即greeeofitaublitiy。)可性靠的量方测式系统的:用性可(avilaailbity),即用利。率可用的平性值均平即均利用,率其计算法方为:AM=TFB(/TBF+MTMRT)MTF(BMeaTimenBtweeeFniaurel)故障间隔平均间时MTR(MTeaTimnToeRpeai)r统平系均复修间时
系统靠性的获可得靠性可─┌────┴──────┐容─错性美性完(fuatlotelrane)c(erfpcteino│)┌──┴────┐余技术─┬硬件冗冗余完美件硬完美软件(erudnadcy)├软n件冗余├整机完美性│├时|间冗余├件完部性美可信软|└件信息余冗└器件完性||静态冗美余(件部余冗可)用硬件态重动组|-被-动重(组后备tandb-)|y--动重组主(优美降级grcafuldeegadraitn)o
完
美性避错技与术美完追性一种求避技错,即术避免出。要求组成错系的统个部各、器件件有具可高靠不性许允错,出或者出率错至降最。低硬㈠的件可靠性完与美性电:规范路设、电路计构结、序与竞争时元器:制
造件、筛选、化、容老、寿命差部:PC件B板、布、位局、臵结、布构、线焊接、安装、热散机、性械、能率频机整:体整一、结构致合理、扰干
蔽环境屏:布、局弱强电干、扰静电
美性与完避错技术(续)㈡软件的可靠与完性美性)1确正:性件软正
有性吗确?软完美件?吗确性证正的范畴。2)可用明:软件在一性的环定
条件境和用条应下可件以常运行,正能功正。常3)兼性容软:对运件环
境行运行、平和运行台件条的适性。应4)可性信对:户用来,所说使用
软件值得的赖信对,件软生产的心理依赖。性(
三软件的可)靠与性硬的件靠性可的区(共别点91)最.明的是硬件显
有化损耗老现象;软不件发生变,没化磨损现象有,陈有旧后的问落题。.
硬2可靠性件决的因定是素时,间受设、计产、运用的所生有过程响,影
软件可靠性的定决素是与输因入数有关据软件差的,更错地多定决于人。
3.件的硬错维护纠通可修过复或换失效更系统重新恢复的能,功软只
有通过重件设。计4.对件可采用预硬防性护维术预防故技,障采用开断
效部件失办法诊断故障,而的软则不能件用这采些术技.事先估5可靠性
测试和可靠计性逐步增长等技的
术对软件硬件有和同不的义意。
6.
为高硬件提靠可性采可冗余用技,术而同一件软的余不能提冗高可靠。性7.件硬靠性检验可法方已建立并,已准标化且一整有完套整理论的而,件软靠性验证可法方未仍立,更建没有整完理的论系。体8
.件硬可靠已性有成的产品熟市,而软件场产品场还很新市。9.软件
错是永恒的,误重可的,而现一些瞬的间硬错误件可能被会误为认是软件
误。总的说错,来件可靠软性比硬件靠性更难保可,证即使美是宇航国的
局软件统,系其可靠性仍比件可靠性低一个硬量级数。
容性错容错与技
术㈠错系容的概统念容技错:在一定术度程容忍故障的上技。术错容统:采用系错容术的技统当系统因某种原系因错或出者失效,系统能继够
工续,作序能程够继续行,不会运因算计机障故而中止被或修改执行,结
构不也包含系统中故引起的障错。差容错技术称也故为掩障技术(盖aufltmakig)n。
容性与容错错技(续)术余冗术技是错容术技的重要构,它结增以资源
的办法加取可靠性。换由于源资不同的冗,余技分为术件硬余、软冗冗件、时间冗余和信余冗余。息资与源成按本线性加增,故而障概则率按对数可
规下律降冗余要。耗消源资,当在可应靠与性资消源耗之进行间权和衡折。衷
双CP容错系U统一个当PC板U现故障时出另,个C一UP保持继运续。这个过程行用对户是明透的系,没统有受丝毫到影响,不会更引交易
起的失丢充,分保证数据一的致和性完整。性系统的容错结构够提供能系
统续连运行的能力,任单何点故障不会引起统停系,机统提供系线在维护
的诊断工具在应可继续用运转的况下修复情点单故。障
冗类型余:1.硬冗余件:加线路增、设、部件备,成形份。备.2件
软余:增冗加程,序一个序分程别几用种径途编写,一按定式执方,行分
或多段种表。决 3.间时冗:余指重复执行,程序令回技卷术。4.息信冗:余增信息数加据数位,检错、纠错。
容错㈡统系工方作式.1自侦动(测Aut-Detecot)通专过的用冗侦测余
路线和件软断系统判运行情况,现发可的能误和故错障,行严进的判断与
谨析。分认确主机错后,出动后启备系统侦。测程需序检查主要硬机件处
理器与外(部件设)主、机络、网作操统、系数据库重要、应程用、序部存
外子储系(如磁统盘列)等阵。
为了保证测的侦正性确,止错误判防,断系可以设臵安统侦测全间时
侦测、间间时隔、测侦数次安等系全,数通冗过余通连线,收信集并记录
些数这据作,分析出处理数。据可是切换信的基。
础
.2动切换(自Atuo-witSc)
h当确某一主机认出错时正常主机,除了证自身保原来任的务继续运行,将根据各种不同外容错后备模式,的管预接设定的后先作备业程序进,后续程行及序务服。系统的管工接作括文包件统、系据数库系、环境(操
统作系平台统)、网地址和应络程序用等。如不能确定果统出错系容,错
控监心通中过与理管交互进者有行的效处理。决定切基换础条件、、延时、断
3.自点恢动复(uAto-Recovry)e故障主被机换替后,离进线行障故修。修复复通后过冗通信余线与常主正机连,继而将线来的工原作序程磁和盘
的上数据动切自换回修复完成的机主上这。个自完动的恢复过程成户可用
以预先设臵,可也以设臵半为动自不恢或。
复容㈢系错统与部件包括统级系容错和件部容级错)系统1容级:错
多系种统错后容备式模如例:
某