故障树分析方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
故障树分析方法
在任务通信系统故障处理中的应用
赵鹏通信一团技术室
摘要故障树分析方法是用于大型复杂系统可靠性分析的一种重要方法。航天任务通信系统作为一个复杂的大系统,其系统可靠性影响着任务的成败。本文首先简要介绍了故障树分析
方法,然后运用故障树建模技术,对北京中心通信系统中的重要分系统的故障进行了故障树分析。
关键词通信系统故障树分析方法可靠性
1 引言
应用于载人航天任务的北京中心通信系统是一个复杂的大系统,其可靠性影响着每一次航天任务的成败,因此对系统可靠性的分析尤为重要。故障树分析方法是以故障树作为模型对大型复杂系统的可靠性、安全性进行分析和风险评估的一种重要方法,。故障树分析通过对不希望事件发生的原因逐层进行分析,确定导致不希望事件的各种故障组合、故障影响的程度以及不希望事件的发生可能性,从而为评价和改进设计提供依据。本文首先介绍了故障树建模技术,然后运用该技术对航天测控系统中的应急通信网络系统进行了可靠性分析。
2 基本概念
1)故障(Fault GJB451):
产品或产品的一部分不能或将不能完成预定功能的事件或状态。
2)故障原因(Failure Cause):
故障发生的根原因,直接导致故障或引起性能降低进一步发展为故障的那些物理或化学过程、设计缺陷、工艺缺陷、零件使用不当或其它过程,是制定预防和纠正措施的重要依据,对故障原因关注得越多,消除故障的成功率就越高。
3)故障模式(Failure Mode):
故障的表现形式。
4)故障影响(Failure Effect):
故障对系统、设计、过程或服务所产生的输出结果,故障影响一般分为局部的、高一层次的和最终影响三级。
5)故障率(Failure Rate):
在规定的时间间隔内,故障发生的比率。
6)严酷度(Severity):
故障模式所产生后果的严重程度。
7)故障检测方法(Failure Checkout Method):
系统运行时,操作者能发现故障的方法,或由维护人员采取的专门诊断故障的行动。
8)故障补偿措施(Failure Compensative Action):为消除或减轻故障影响而采取的措施或进行的活动。
3 故障树分析法(Fault Tree Analysis)
故障树的概念:在系统设计过程中通过对可能造成系统失效的各种因素(包括硬件、软件、环境、人为因素)进行分析,画出逻辑框图(失效树),从而确定系统失效原因的各种可能组合方式或其发生概率,已计算系统失效概率,采取相应的纠正措施,以提高系统可靠性的一种设计分析方法。
故障树分析把系统最不希望发生的故障状态作为逻辑分析的目标,在故障树中称为顶事件,继而找出导致这一故障状态发生的所有可能直接原因,在故障树中称为中间事件。再跟踪找出导致这些中间故障事件发生的所有可能直接原因。直追寻到引起中间事件发生的全部部件状态,在故障树中称为底事件。用相应的代表符号及逻辑们把顶事件、中间事件、底事件连接成树形逻辑图,责成此树形逻辑图为故障树。
故障树分析是一种自上而下、逐级演绎的分析方法。它以产品的某个不希望事件为起点,逐级向下分析,最终以一种直观的倒置树状结构描述该事件是如何发生的。进行故障树分析时,首先应根据产品特点和要求选择一个不希望发生的事件(例如某个系统故障事件)作为分析的出发点,然后分析造成这一不希望事件发生的直接原因,这些原因可能是某个单独的事件,也可能是某个事件和条件的组合。接着,再以这些直接原因事件为出发点,分析它们的直接原因,这样逐级递推展开,直至分析到足够低的产品层次,就构成了一个完整的故障树结构。随后,依据一定的分析规则和假设对故障树结构进行定性或定量的分析,就可以获得与该不希望事件相关的各类信息,包括不希望事件发生原因和条件、发生的可能性以及产品各组成部分对整体可靠性的影响程度等,从而为设计评价和设计改进提供依据。
故障树是一种特殊的倒立树状逻辑因果关系图,它用事件符号、逻辑门符号和转移符号描述系统中各种事件之间的因果关系。
故障树分析是从产品整体或较高层次开始的,针对特定分析目标进行的,有选择的多因素分析,它可针对某一特定事件(故障)提供较为全面的、详细的分析信息。故障树分析提供了一种自上而下、由简到繁、逐层演绎的系统的故障分析方法,它适合于分析复杂系统,能够考虑包括人的影响与环境影响对系统失效的作用的多重因素,并可以用图形的方法有层次的逐级描述系统在失效的进程中,各种中间事件的相互关系,从而直观地描述系统是通过什么途径而发生失效的。目前,故障树分析方法已被公认为可靠性、安全性分析的重要工具之一。
4 故障树的建立步骤
1) 选择和确定顶事件:顶事件是系统最不希望发生的事件,或是指定进行逻辑分析的故障事件。
2) 分析顶事件:寻找引起顶事件发生的直接、必要和充分的原因。将顶事件作为输出事件,将所有直接原因作为输入事件,并根据这些事件实际的逻辑关系用适当的逻辑门相联系。
3) 分析每一个与顶事件直接相联系的输入事件。如果该事件还能进一步分解,则将其作为下一级的输出事件。
4) 重复上述步骤,逐级向下分解,直到所有的输入事件不能再分解或不必要再分解为止,即建成了一棵倒置的故障树。
5)定性分析:求出所有导致顶事件发生的系统故障模式。
6)定量分析:在各个底事件相互独立和已知其发生概率的条件下,求出单调故障树顶事件发生的概率和一些重要度指标。
5 故障树分析方法的应用
5.1 调度系统故障树分析
对于试验任务指挥调度系统来说,噪声干扰是较普遍出现的故障模式,下面就产生噪声干扰的各种原因按照故障树的分析方法进行分析,见图2。
5.2 DDN 系统故障树分析(见图3)
6 结束语
通过上面的两个例子,本文得出用故障树分析方法分析系统的故障模式,主要有以下几个步骤:
1)找出任务决不允许系统发生的故障。即是给航天任务带来不可挽回的损失的故障模式;
2)对每一个故障进行故障树分解,找出可能导致故障发生的基本事件;
3)分析所有的基本事件找出导致故障发生的关键部位,该关键部位出现故障导致系统故障的可能性非常高。对关键部位,我们要保证其高可靠性;
4)故障树的逻辑结构可以帮助确定在哪些基本事件或部位进行检测。例如,若故障树中一个不期望的事件是一个或门的输出,则该或门的每一个输入都应被穷举检测,才能避免不期望事件的发生;可是,如果故障树中一个不期望的事件是一个与门的输出,则对其中一个输入的保护就可避免不期望事件的发生。在故障树的低层,检测可以用来避免可以导致系统失效的中间事件的发生,在故障树中接近顶层的检测效率比较高,该方法在一些故障危害性不是很高的系统中应用,可以付出较小的代价达到系统的可靠性要求;
5)若要对故障发生的概率进行定量分析,则需要给出每个部位发生故障的概率。 总之,通过运用故障树分析技术对航天测控系统进行可靠性分析,可以发现存在的薄弱环节,为进一步改进设计提供了有力依据。通过实际应用,也可以看出故障树分析方法是工程中进行安全性、可靠性分析的一种有力方法,值得在工程实际中推广应用,即使在没有太多可靠性数据的情况下,进行故障树分析的定性分析,同样对发现问题、寻找系统的薄弱环节具有重要作用。
图1 故障树分析步骤示意图