系统可靠性理论与工程实践 (精)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
系统可靠性理论与工程实践
2002年8月11日
)
内容安排
1 系统可靠性基础理论
理论体系探讨
2 工程实践
Intersil公司 、Ford公司
3 可靠性工程几个热点问题
发展趋势展望
)
可靠性
一个满意的顾客会告诉8个人,
一个不满意的顾客会告诉20个人, 只有可靠的产品才能带来长期效益和忠诚的顾客!
)
可靠性工程的热点问题三
ห้องสมุดไป่ตู้
加强软件可靠性设计 随着社会日益信息化,系统(或设备)软件 功能较硬件功能占系统功能比例越来越高。 时至今日软件可靠性工程的有关技术还不 够成熟,还有许多问题有待研究。
建立系统可靠性优化的目标函数:
)
1.6
可靠性分配和可靠性优化
例:由三个单元组成的可靠性串联系统,在100小时内的 目标可靠度为0.90,考虑五种情况:
Case 1—三个单元都服从β=1.318、η=312hrs的威布尔 分布,改进可行性中等。 Case 2—同Case 1,但改进可行性不同:单元1—易, 单元2—中,单元3—难。 Case 3—在 100小时内,单元1 、2、3的可靠度分别为 0.7、0.8、0.9,改进可行性相同:易。 Case 4—在 100小时内,单元1 、2、3的可靠度分别为 0.7、0.8、0.9,改进可行性分别为:易、中、难。
)
维修方式:事后维修和预防维修
事后维修的三个典型 预防维修活动包括设 步骤: 备检查,局部或全面 定期检修,换油等。 a)问题诊断; b) 故 障 零 件 的 更 换 或 预防维修可以提高系 统的可靠性、减少停 修理; 机时间和更换费用、 c)维修确认。 优化备用件库存。
)
预防维修 :计划维修和视情维修
)
可靠性指标体系及其验证
早在70年代美国在地面产品广泛地采用故障加权。
在 1980 年美军标准 MIL - STD - 785B 颁布后,故障加 权处理方法被取缔。
产品可靠性指标细化分解,分别验证。 MIL - STD - 7810《工程研制鉴定和生产可靠性试验》正式文本中, 首次提出在可靠性验证中按后果严重程度把发生故障 区分为:致命故障,严重故障和轻度故障三类。 我们国家有标准可查的就有近 20种门类产品对故障进 行加权处理。 目前对故障加权有争议。
)
1 系统可靠性基础理论
系统可靠性基本术语
(1) 系统(System) 一个系统是由一组零 件(元件)、部件、子 系统或装配件(统称为 单元)构成的、完成期 望的功能、并具有可接 受的性能和可靠性水平 的一种特定设计。
)
系统实例
)
对系统可靠性的认识误区
1.在特定的时间内,已知系统所有单元的可靠度为 90%,则系统可靠度为90%。 2. Mechanical engineers know everything. 3. Reliability is a project. 4. The craftsman is only involved in repair, not in reliability. 5. The key to high reliability is speedy repair.
)
无维修使用期(MFOP)
二是改变可靠性工程工作方法:必须把人力、 精力集中于产品研发早期阶段。应做如下工作: 失效物理分析、 开展可靠性研制试验,及早暴露设计缺陷,采
开展高加速应力试验(HAST),暴露产品薄弱环 节予以纠正; 严格设计评审制度, 制订合理预防维修计划并予以实施。
)
1.9 其他相关理论
(3) 制造统计技术:主要包括:统计过程和质量控制(如: SPC,抽样,过程能力分析,改进计划,变差减少),实 验设计(DOE),统计建模(如:SPC,回归分析,方差 分析,时序分析,多元分析,非参数分析)等。
(4) 工业工程:工业工程涉及技术系统的设计、安装、改 进、评估和控制。目标是,在尽可能降低成本的同时优化 系统的资源来提升质量、效率、生产率。工具:数学模型 (对复杂系统应用随机模型)、实验设计、连续过程改进、 生产性研究、计算机模拟、神经网络(处理非线性现象, 减少数据处理时间)、专家系统等。
)
可修复系统
可用度分为瞬时可用度、稳态可用度、 平均可用度、使用可用度等。 维修费用分析:识别主要费用要素。
失效数据分析:对同类的产品或单个产 品进行统计分析,了解MTBF、主要失效 模式等。
)
1.8 可靠性管理
可靠性管理是可靠性工程组成部分,占有很重要地位,有人曾讲; “产品可靠性是设计出来的、制造出来的和管理出来的……”。 可靠性管理工作包括:可靠性设计、试验和管理标准,可靠性大 纲,可靠性管理机构,数据网等。从产品可靠性指标分配、预计、 可靠性设计、可靠性分析、可靠性试验、数据交换等进行系统化 管理。 90年代美国由于以经费为独立变量,废除大量的军用标准,大力 推行健壮设计和并行工程及IPPD管理。首先在美国海军及其相关 工业部门广泛推广“网络化”管理。通过大量标准、规范引入和 支持,为“网络化”管理提供依据和指导,实施程序化、规范化、 系统化的“网络化”管理。 )
)
可靠性方块图 (RBDs—Reliability Block Diagrams)
可靠性方块图 是系统单元及其可靠 性意义下连接关系的 图形表达, 表示单元 的正常或失效状态对 系统状态的影响。在 一些情况下,它不同 于结构连接图。
)
计算机的简化可靠性方块图
可靠性方块
一个方块可以代表零件 (元件)、部件、子系 统或装配件,取决于它 选择的“黑箱”水平 (具体层次)。 系统可靠性评估的第一 步是获取数据(寿命或 成功次数等),估计单 元的可靠性水平。
典型的可靠性增长曲线
)
1.6
可靠性分配和可靠性优化
优化前需要明确规定: a) 成本函数 Cost/Penalty Function
b) 可靠度上限 Maximum Achievable Reliability
)
1.6
可靠性分配和可靠性优化
改进难度和可靠度上限的影响
)
1.6
可靠性分配和可靠性优化
Case 5—在 100小时内,单元1 、2、3的可靠度分别为 0.7、0.8、0.9,改进可行性分别为:难、易、中。
假设在100小时内,MAR均为0.999,则优化结果如右表 1所示。
)
1.7 可修复系统
对于可修复系统,须同时考虑可靠性和 维修性。类似于基于寿命数据的可靠性 建模方法,可以处理修复数据获得维修 性特征量,如:维修度、修复率、平均 修复时间等。可用性综合考虑可靠性和 维修性。
计划维修针对产品老 化情况。 基础工作:维修历史 记录分析、传感器监 测数据分析、备用件 库存优化、维修最佳 间隔期的确定、设备 维修模拟等。
)
视情维修 基础:设备性能退化、 测试技术和诊断技术。
图14 预防维修与事后维修的费用比较
停机时间(维修时间)
停机时间分为等待时 更新理论 间和修理时间。等待 时间主要与后勤工作、 管理工作有关。而修 复时间主要取决于维 修人员和产品的可维 修性设计。基于停机 时间,可以建立维修 图13 系统停机时间为元件停机时间的函数 度函数,统计维修性 (三个元件组成的可靠性串联系统) 特征量。
)
1.5
可靠性设计
在产品开发阶段要尽 早考虑和构造可靠性。
将可靠性和性能一样 设计到产品中去。
)
1.5
(1) (2)
可靠性设计
问题识别:获取改进可靠性的机会。工具:维修数据 分析、用户意见分析、可靠性试验、可靠性分析等。 失效分析。认识失效机理和发现改进措施。工具: FMECA,FTA等。
)
可靠性工程的热点问题二
可靠性指标体系及其验证 在产品可靠性验证与评价中,在确认故障,采 用什么方法对故障数据进行处理,直接关系到 产品的生存和发展。一般都把可靠性验证试验 中产品的存在状态简化为“二元状态(成功、 故障)”处理。故障统计也比较简单,要么为 0,要么为1,对故障既不分类,也不加权,这 在工程实施显然存在问题。如果把这些后果严 重程度不同的故障,等同看待,客观上是不合 理的,与实际情况也是不相符的。
(2) 寿命预测
根据系统可靠度,可以计算 系统的平均寿命、保证寿命、 BX (如: B10 )、可靠寿命 等。此外,可以计算系统的 寿命分布规律、失效率。
)
1.4
系统可靠性分析
(3) 模拟分析 模拟分析可以克服 解析法的缺点,完成复 杂系统的可靠性分析。 其原理:基于the Monte Carlo simulation method, 根据每个单元的失效分 布产生随机失效时间, 模拟系统的工作状态, 然后对系统可靠度作经 验估计。
3. the Path-Tracing Method.
图9 可靠性复杂系统模型示例
)
1.3
单元重要度
分析单元重要度,可以找出系统的薄弱环节。 单元i的概率结构重要度:
关键重要度 FV重要度 BP重要度
)
1.4
系统可靠性分析
(1) 系统可靠度估计
引入单元可靠度函数, 运用上述模型即可计算 系统可靠度。
)
无维修使用期(MFOP)
要做到“无维修使用期”必须作好如下两项工作: 一是改变可靠性设计思路:以自下而上的可靠性 设计方法,取代采用 MTBF 进行自上而下分配方 法。重点可采取如下设计措施:采用状态监控, 故障诊断和故障预测设计;容错设计;可重构性 设计;动态设计;故障软化设计;环境防护设计; 冗余设计;在任务能力不受影响下,留出可接受 的降级水平设计等。
系统可靠度为
Rs 1 (1 Ri )
i 1 n
冗余最大 例:双工系统
图7 可靠性并联系统
)
可靠性并联系统
)
k/n表决系统
特例:1/n—串联系统 n/n—并联系统
系统可靠度:
)
k/n表决系统
)
复杂系统
分析方法:
1. 分解分析方法:选择关键单元, 先分解系统,再组合计算。 2. the Event Space Method.
)
2 工程实践
2.1Intersil 公 司 的 2.2 Ford 公 司 的 Useful Building-In Reliability Life Reliability Process Intersil(网线)公司 为晶片制造商,在无 线网络、电源管理领 域国际领先。
Ford(汽车)公司将 Useful Life Reliability Process 任务作为产品 开发系统的重要工作。
)
3 可靠性工程的几个热点问题
)
可靠性工程的热点问题一
无维修使用期(MFOP) 在国际上早在1995年对传统的可靠性定义提出了 质疑,在欧洲开始用无维修使用期 (MFOP) 取代 原先的MTBF,摒弃随机失效无法避免的旧观念, 故障率浴盆曲线分布规律也就被打破。当前国际 上兴起在可靠工程中推行失效物理方法的新潮流, 目的是设计出不存在随机失效的产品。同时,从 故障修理转换到计划预防维修。
(3)
(4)
寿命周期费用和保修费用分析。
比较研究( Trade-off studies ),可靠性优化,费 用—效益分析。
(5) (6)
可靠性目标确定。工具:QFD等。 可靠性优化分配。
)
1.6
可靠性分配和可靠性优化
有两个方法改进系统的 可靠性:故障避免和 故障容错。 避免故障,要求使用高 质量和高可靠性的元件, 通常比故障容错方法的 成本低些。而故障容错, 需要冗余,导致设计难 度加大,成本、重量、 体积等增加。
1.9 其他相关理论
(1) 供应链分析:企业之间的协作减少提供产品和服务的 供应链时间,减少库存。需求不确定性增大,需要供应链 越敏捷。 (2) 人机工程:考虑人机系统,注意人的能力和局限。包 括:可维修设计(拆卸、装配程序评估),软硬件设计 (人机界面、通讯、显示与控制技术),可操作性试验 (录像分析,方案比较),人操作可靠性分析等。
)
单元可靠性估计的流程
1.2 系统可靠性模型
(1) 串联系统 (2) 并联系统 (3) k/n表决系统 (4) 串并联混合系统 (5) 储备系统 (6)复杂系统
)
可靠性串联系统
系统可靠度为
可靠性串联系统中,可 靠性最差的单元对系统 的可靠性影响最大。
)
可靠性串联系统
)
可靠性并联系统
2002年8月11日
)
内容安排
1 系统可靠性基础理论
理论体系探讨
2 工程实践
Intersil公司 、Ford公司
3 可靠性工程几个热点问题
发展趋势展望
)
可靠性
一个满意的顾客会告诉8个人,
一个不满意的顾客会告诉20个人, 只有可靠的产品才能带来长期效益和忠诚的顾客!
)
可靠性工程的热点问题三
ห้องสมุดไป่ตู้
加强软件可靠性设计 随着社会日益信息化,系统(或设备)软件 功能较硬件功能占系统功能比例越来越高。 时至今日软件可靠性工程的有关技术还不 够成熟,还有许多问题有待研究。
建立系统可靠性优化的目标函数:
)
1.6
可靠性分配和可靠性优化
例:由三个单元组成的可靠性串联系统,在100小时内的 目标可靠度为0.90,考虑五种情况:
Case 1—三个单元都服从β=1.318、η=312hrs的威布尔 分布,改进可行性中等。 Case 2—同Case 1,但改进可行性不同:单元1—易, 单元2—中,单元3—难。 Case 3—在 100小时内,单元1 、2、3的可靠度分别为 0.7、0.8、0.9,改进可行性相同:易。 Case 4—在 100小时内,单元1 、2、3的可靠度分别为 0.7、0.8、0.9,改进可行性分别为:易、中、难。
)
维修方式:事后维修和预防维修
事后维修的三个典型 预防维修活动包括设 步骤: 备检查,局部或全面 定期检修,换油等。 a)问题诊断; b) 故 障 零 件 的 更 换 或 预防维修可以提高系 统的可靠性、减少停 修理; 机时间和更换费用、 c)维修确认。 优化备用件库存。
)
预防维修 :计划维修和视情维修
)
可靠性指标体系及其验证
早在70年代美国在地面产品广泛地采用故障加权。
在 1980 年美军标准 MIL - STD - 785B 颁布后,故障加 权处理方法被取缔。
产品可靠性指标细化分解,分别验证。 MIL - STD - 7810《工程研制鉴定和生产可靠性试验》正式文本中, 首次提出在可靠性验证中按后果严重程度把发生故障 区分为:致命故障,严重故障和轻度故障三类。 我们国家有标准可查的就有近 20种门类产品对故障进 行加权处理。 目前对故障加权有争议。
)
1 系统可靠性基础理论
系统可靠性基本术语
(1) 系统(System) 一个系统是由一组零 件(元件)、部件、子 系统或装配件(统称为 单元)构成的、完成期 望的功能、并具有可接 受的性能和可靠性水平 的一种特定设计。
)
系统实例
)
对系统可靠性的认识误区
1.在特定的时间内,已知系统所有单元的可靠度为 90%,则系统可靠度为90%。 2. Mechanical engineers know everything. 3. Reliability is a project. 4. The craftsman is only involved in repair, not in reliability. 5. The key to high reliability is speedy repair.
)
无维修使用期(MFOP)
二是改变可靠性工程工作方法:必须把人力、 精力集中于产品研发早期阶段。应做如下工作: 失效物理分析、 开展可靠性研制试验,及早暴露设计缺陷,采
开展高加速应力试验(HAST),暴露产品薄弱环 节予以纠正; 严格设计评审制度, 制订合理预防维修计划并予以实施。
)
1.9 其他相关理论
(3) 制造统计技术:主要包括:统计过程和质量控制(如: SPC,抽样,过程能力分析,改进计划,变差减少),实 验设计(DOE),统计建模(如:SPC,回归分析,方差 分析,时序分析,多元分析,非参数分析)等。
(4) 工业工程:工业工程涉及技术系统的设计、安装、改 进、评估和控制。目标是,在尽可能降低成本的同时优化 系统的资源来提升质量、效率、生产率。工具:数学模型 (对复杂系统应用随机模型)、实验设计、连续过程改进、 生产性研究、计算机模拟、神经网络(处理非线性现象, 减少数据处理时间)、专家系统等。
)
可修复系统
可用度分为瞬时可用度、稳态可用度、 平均可用度、使用可用度等。 维修费用分析:识别主要费用要素。
失效数据分析:对同类的产品或单个产 品进行统计分析,了解MTBF、主要失效 模式等。
)
1.8 可靠性管理
可靠性管理是可靠性工程组成部分,占有很重要地位,有人曾讲; “产品可靠性是设计出来的、制造出来的和管理出来的……”。 可靠性管理工作包括:可靠性设计、试验和管理标准,可靠性大 纲,可靠性管理机构,数据网等。从产品可靠性指标分配、预计、 可靠性设计、可靠性分析、可靠性试验、数据交换等进行系统化 管理。 90年代美国由于以经费为独立变量,废除大量的军用标准,大力 推行健壮设计和并行工程及IPPD管理。首先在美国海军及其相关 工业部门广泛推广“网络化”管理。通过大量标准、规范引入和 支持,为“网络化”管理提供依据和指导,实施程序化、规范化、 系统化的“网络化”管理。 )
)
可靠性方块图 (RBDs—Reliability Block Diagrams)
可靠性方块图 是系统单元及其可靠 性意义下连接关系的 图形表达, 表示单元 的正常或失效状态对 系统状态的影响。在 一些情况下,它不同 于结构连接图。
)
计算机的简化可靠性方块图
可靠性方块
一个方块可以代表零件 (元件)、部件、子系 统或装配件,取决于它 选择的“黑箱”水平 (具体层次)。 系统可靠性评估的第一 步是获取数据(寿命或 成功次数等),估计单 元的可靠性水平。
典型的可靠性增长曲线
)
1.6
可靠性分配和可靠性优化
优化前需要明确规定: a) 成本函数 Cost/Penalty Function
b) 可靠度上限 Maximum Achievable Reliability
)
1.6
可靠性分配和可靠性优化
改进难度和可靠度上限的影响
)
1.6
可靠性分配和可靠性优化
Case 5—在 100小时内,单元1 、2、3的可靠度分别为 0.7、0.8、0.9,改进可行性分别为:难、易、中。
假设在100小时内,MAR均为0.999,则优化结果如右表 1所示。
)
1.7 可修复系统
对于可修复系统,须同时考虑可靠性和 维修性。类似于基于寿命数据的可靠性 建模方法,可以处理修复数据获得维修 性特征量,如:维修度、修复率、平均 修复时间等。可用性综合考虑可靠性和 维修性。
计划维修针对产品老 化情况。 基础工作:维修历史 记录分析、传感器监 测数据分析、备用件 库存优化、维修最佳 间隔期的确定、设备 维修模拟等。
)
视情维修 基础:设备性能退化、 测试技术和诊断技术。
图14 预防维修与事后维修的费用比较
停机时间(维修时间)
停机时间分为等待时 更新理论 间和修理时间。等待 时间主要与后勤工作、 管理工作有关。而修 复时间主要取决于维 修人员和产品的可维 修性设计。基于停机 时间,可以建立维修 图13 系统停机时间为元件停机时间的函数 度函数,统计维修性 (三个元件组成的可靠性串联系统) 特征量。
)
1.5
可靠性设计
在产品开发阶段要尽 早考虑和构造可靠性。
将可靠性和性能一样 设计到产品中去。
)
1.5
(1) (2)
可靠性设计
问题识别:获取改进可靠性的机会。工具:维修数据 分析、用户意见分析、可靠性试验、可靠性分析等。 失效分析。认识失效机理和发现改进措施。工具: FMECA,FTA等。
)
可靠性工程的热点问题二
可靠性指标体系及其验证 在产品可靠性验证与评价中,在确认故障,采 用什么方法对故障数据进行处理,直接关系到 产品的生存和发展。一般都把可靠性验证试验 中产品的存在状态简化为“二元状态(成功、 故障)”处理。故障统计也比较简单,要么为 0,要么为1,对故障既不分类,也不加权,这 在工程实施显然存在问题。如果把这些后果严 重程度不同的故障,等同看待,客观上是不合 理的,与实际情况也是不相符的。
(2) 寿命预测
根据系统可靠度,可以计算 系统的平均寿命、保证寿命、 BX (如: B10 )、可靠寿命 等。此外,可以计算系统的 寿命分布规律、失效率。
)
1.4
系统可靠性分析
(3) 模拟分析 模拟分析可以克服 解析法的缺点,完成复 杂系统的可靠性分析。 其原理:基于the Monte Carlo simulation method, 根据每个单元的失效分 布产生随机失效时间, 模拟系统的工作状态, 然后对系统可靠度作经 验估计。
3. the Path-Tracing Method.
图9 可靠性复杂系统模型示例
)
1.3
单元重要度
分析单元重要度,可以找出系统的薄弱环节。 单元i的概率结构重要度:
关键重要度 FV重要度 BP重要度
)
1.4
系统可靠性分析
(1) 系统可靠度估计
引入单元可靠度函数, 运用上述模型即可计算 系统可靠度。
)
无维修使用期(MFOP)
要做到“无维修使用期”必须作好如下两项工作: 一是改变可靠性设计思路:以自下而上的可靠性 设计方法,取代采用 MTBF 进行自上而下分配方 法。重点可采取如下设计措施:采用状态监控, 故障诊断和故障预测设计;容错设计;可重构性 设计;动态设计;故障软化设计;环境防护设计; 冗余设计;在任务能力不受影响下,留出可接受 的降级水平设计等。
系统可靠度为
Rs 1 (1 Ri )
i 1 n
冗余最大 例:双工系统
图7 可靠性并联系统
)
可靠性并联系统
)
k/n表决系统
特例:1/n—串联系统 n/n—并联系统
系统可靠度:
)
k/n表决系统
)
复杂系统
分析方法:
1. 分解分析方法:选择关键单元, 先分解系统,再组合计算。 2. the Event Space Method.
)
2 工程实践
2.1Intersil 公 司 的 2.2 Ford 公 司 的 Useful Building-In Reliability Life Reliability Process Intersil(网线)公司 为晶片制造商,在无 线网络、电源管理领 域国际领先。
Ford(汽车)公司将 Useful Life Reliability Process 任务作为产品 开发系统的重要工作。
)
3 可靠性工程的几个热点问题
)
可靠性工程的热点问题一
无维修使用期(MFOP) 在国际上早在1995年对传统的可靠性定义提出了 质疑,在欧洲开始用无维修使用期 (MFOP) 取代 原先的MTBF,摒弃随机失效无法避免的旧观念, 故障率浴盆曲线分布规律也就被打破。当前国际 上兴起在可靠工程中推行失效物理方法的新潮流, 目的是设计出不存在随机失效的产品。同时,从 故障修理转换到计划预防维修。
(3)
(4)
寿命周期费用和保修费用分析。
比较研究( Trade-off studies ),可靠性优化,费 用—效益分析。
(5) (6)
可靠性目标确定。工具:QFD等。 可靠性优化分配。
)
1.6
可靠性分配和可靠性优化
有两个方法改进系统的 可靠性:故障避免和 故障容错。 避免故障,要求使用高 质量和高可靠性的元件, 通常比故障容错方法的 成本低些。而故障容错, 需要冗余,导致设计难 度加大,成本、重量、 体积等增加。
1.9 其他相关理论
(1) 供应链分析:企业之间的协作减少提供产品和服务的 供应链时间,减少库存。需求不确定性增大,需要供应链 越敏捷。 (2) 人机工程:考虑人机系统,注意人的能力和局限。包 括:可维修设计(拆卸、装配程序评估),软硬件设计 (人机界面、通讯、显示与控制技术),可操作性试验 (录像分析,方案比较),人操作可靠性分析等。
)
单元可靠性估计的流程
1.2 系统可靠性模型
(1) 串联系统 (2) 并联系统 (3) k/n表决系统 (4) 串并联混合系统 (5) 储备系统 (6)复杂系统
)
可靠性串联系统
系统可靠度为
可靠性串联系统中,可 靠性最差的单元对系统 的可靠性影响最大。
)
可靠性串联系统
)
可靠性并联系统