方法培训

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

故障检测
在线故障 诊断
预警
故障隔离 故障恢复
告警
离线故 障诊断
故障修复
PPT文档演模板
可用性计划
可用性模型


更新设计
故障插入计 划
性 工 作 过
FMEA分析
测试和 现场数

故障恢复设 计

故障隔离设
数 据
操作过
故障原因和

影响


操作最简化计 划
操作界 面
故障检测设 计
方法培训
2、故障管理设计
故障检测:发现故障
PPT文档演模板
方法培训
1、概述--可靠性流程
1、系统可靠性设计报告
1 产品概述 2 产品系统结构及可靠性建模 3 系统可靠性分析 4 主控类单板可靠性设计 5 网板(交叉)类单板可靠性设计 6 业务类单板可靠性设计 7 时钟子系统设计 8 电源子系统设计 9 监控及散热系统保护设计 10 存储保护与数据安全 11 系统及单板复位设计 12 系统可靠性设计规格及测试验证
需求汇总
2、板间信号级FMEA分析报告
1 产品构成及功能定义 2 产品功能层次框图 3 产品可靠性框图 4 产品编码原则 5 环境定义 6 严酷度等级定义 7 功能模块(单板)接口信号FMEA分析表格 8 总结
8.1 软件故障管理需求列表 8.2 硬件故障管理需求列表 8.3 测试验证需求列表 8.4 故障降级分析 8.5 分析总结
2、产品元器件降额分析报告
1、系统功能 2、 环境定义 3 、测试环境 4、 单板元器件降额分析
4.1 单板1元器件降额分析 4.2单板2元器件降额分析 5、总结
PPT文档演模板
方法培训
课程目的
可靠性工作介绍 故障管理设计 FMEA分析方法介绍 可靠性验证பைடு நூலகம்试(FIT)
PPT文档演模板
方法培训
2、故障管理设计
《可靠性指标论证报 (可靠性)
告》
详细设计与 实现
单元测试、 SDV、SIT
SVT
Beta 测试
《器件级FMEA分析报告》 《单板硬件详细设计报告》(可 靠性) 《元器件降额分析报告》
FIT可靠性验 证测试
TR4
TR4A
TR1
TR2
TR3
可靠性工程师
硬件/软件开发工程师
可靠性工程师
测试工程师
可靠性工程师
FMEA的基本思想:
遍历性、系统性。
.
PPT文档演模板
方法培训
3、可靠性分析方法--可靠性FMEA
FMEA目的:
能帮助设计者和决策者从各种方案中选择满足可靠性要求的最佳方案 保证所有元器件、单元的各种故障模式及影响都经过周密考虑 能找出对系统故障有重大影响的元器件、元器件故障模式及单元、单元故障模式并分 析其影响程度 有助于在设计评审中对有关措施(如冗余措施)、检测设备等作出客观的评价 能为进一步更改产品设计、定量计算提供资料
故障恢复设计 故障隔离设计 故障检测设计
PPT文档演模板
方法培训
1、概述--可靠性流程
IPD-SE
HCMM 3.0
概念阶段
计划阶段
开发阶段
验证阶段
需求提出
需求分析综 需求分解与
合映射
回溯
规格形成
概要设计
《工程设计调研与设计建议》 可靠性工程基线2.0
《系统可靠性
《板间信号级FMEA分析报 告》
设计报告》 《单板总体设计方案》
故障恢复方法: 1、倒换;(对主备用冗余) 2、重新分配资源(对N+1冗余、资源池) 3、软件复位; 4、重启;
PPT文档演模板
方法培训
2、故障管理设计
故障修复:故障完全排除的过程。
故障修复方法: 1、更换功能单元; 2、调试和诊断(离线) 3、软件补丁; 4、软件升级;
预警方法:
1、趋势图法; 2、多变量综合分析法; 3、专家系统法;
故障定位:把检测到的故障隔离到必须进行
故障检测方法:
修理范围的过程,通常是现场可更换单元。
1、数值范围检查;(如:温度、电压、槽位号、即确保单元的故障不会造成系统的故障。
MAC地址等) 2、数据正确性检查(如:奇偶校验、求检验和、 CRC校验、槽位号异或校验等) 3、比较检查(有冗余输出时) 4、时间检查(如:心跳检测) 5、用户直观检查(如:告警、声光显示)
第一层面 第二层面 第三层面
硬件不出故障
硬件故障,仅对性能 有部分影响,设备的 功能不受损。
硬件故障,设备部分或 全部功能受损。但能尽 快恢复业务。
元器件降额分析
电路应用规范、器件应力降额、 环境适应性、EMC、防护、安 规、HALT试验等
冗余、倒换策略,倒换条件 完善,数据备份策略
故障检测、隔离,定位,维 修性等
F M E A 分 析 步 骤:
PPT文档演模板
方法培训
3、可靠性分析方法--可靠性FMEA
描述系统功能
➢ 从可靠性工程师的角度去理解系统; ➢ 包括对系统完成的功能、工作阶段以及各种工作 方式给出详细的描述; ➢ 网络位置、组网方式和典型配置
系统按照功能划分,通常可 以分为:电源模块、风扇监 控模块、网管模块、功能模 块。对于功能模块,再继续 划分到功能实体上,如主控 功能模块、交换网功能模块、 线路处理功能模块等。
表示系统及系统各功能单元的工作情况和相互关系,以及系统和每 个约定层次的功能逻辑顺序。
PPT文档演模板
方法培训
3、可靠性分析方法--可靠性FMEA
描述可靠性模型框图
目的:表 示系统可 靠性与各 功能模块 可靠性之 间的关系。
可靠性模型框图分为基本可靠性模型框图和任务可靠性模型框图。
PPT文档演模板
主控模块 主控模块 主控模块 主控模块 交换网模块 交换网模块 交换网模块 线路处理模块 线路处理模块
输出异常高电压导致系统功能异常,甚至烧毁 电源模块一路-48V供电故障,且不能检测 电源配电子系统监控电路滤波部分故障,且系统不能检测 电源配电子系统监控电路电压检测部分故障,且系统不能检测 全部风扇停转,导致系统温度过高而不能正常工作甚至烧毁 单个风扇框的所有风扇停转,导致系统温度升高而不能正常工作 风扇框监控电路故障,但系统能够检测,可以控制风扇全速运转 背板总线信号开路、短路故障,导致整个系统故障 主用主控模故障,不能倒换到备用 备用主控模故障,能检测 一路业务同步时钟故障,能检测,且有相应的补偿措施 双路业务同步时钟故障,导致系统无法工作 一个交换网模块故障,故障,不能检测并将业务切换到其它交换网模块 一个模块故障,故障,能将业务切换到其它交换网模块,但交换能力严重下降 一个模块故障能检测,并将业务切换到其它交换网模块,对系统性能基本无影响 一个线路处理模块故障,能检测 线卡个别端口故障,能够通过端口捆绑的负荷分担将业务切换到其它端口
故障定位方法: 1、功能单元隔离(如影响到总线或通信通 道的故障、二路电源的二极管隔离等) 2、禁止功能单元工作; 3、安全值输出(如:参考时钟的自激振荡) 4、重选路由;
故障诊断(定位):确定造成故障的单元 故障恢复(自动):恢复产品执行规定功能 的能力。
故障诊断方法: 1、自诊断(如:电压模块、风扇自带诊断); 2、在线诊断;
器件使用的考虑。如降额、
热设计、器件应用审查;
简化设计等
系统结构的考虑。如冗余、 负荷分担。 其他容错设计 故障检测。重要故障需要 “知情”。检测灵敏度; 故障隔离。能隔离到影响 最小,定位到FRU; 故障恢复。倒换策略、复 位、重启、数据恢复等; 故障测试验证。重要、影 响或措施不明确的故障、 故障模式,FIT模拟测试;
可靠性定量分析 建模预计
PPT文档演模板
故障影响大
可靠性定性分析 FMEA
可靠性分 析方法
方法培训
3、可靠性分析方法--可靠性FMEA Failure Mode Effect Analysis,故障模式影响分析
在产品设计过程中,通过对产品各组成单元潜在的各种故障模式及其对产品功能的影响进行分析, 并把每一个潜在的故障模式按它的严酷度予以分类,提出可以采取的预防改进措施,以提高产 品可靠性的一种设计分析方法。
PPT文档演模板
方法培训
3、可靠性分析方法--可靠性FMEA
定义严酷度类别 给产品故障造成的最坏潜在后果规定一个量度。
I. 这种故障会导致整个系统崩溃或主要功能受到严重影响; II. 这种故障会导致系统主要功能受到影响、任务延误的系统轻度损坏或存在较大的故障 隐患;
III. 系统次要功能丧失或下降,须立即修理,但不影响系统主要功能实现的故障; IV. 部分次要功能下降,只须一般维护的,不对功能实现造成影响(一般告警或指示灯故 障等)。
2、 不同网络层次的设备有不同 的可靠性要求。核心层设备偏重 于HA,中间层设备偏重于成本与 HA的良好结合,终端设备偏重于 成本与返修率;
3、HA不仅仅包括设备软、硬件 的HA,而且包括计划性中断、 人为差错等的HA,所以也要关注 升级、数据配置、补丁等造成的 业务中断;
平台软件 模块HA
交换模 块HA
线路处理 模块HA
主控模 块HA
机电模 块HA
服务器 模块HA
背板 HA
电缆 4、需求的落实需要可靠性工程 HA 师对产品设计方案的了解,需求
硬件 HA
软件 HA
…… …… ……
跟踪,FIT测试验证。更需要开 发人员的并肩作战。
PPT文档演模板
方法培训
1、概述--可靠性的层次
产品的可靠性可以理解为三个规定,即规定条件下、规定时间 内、产品完成规定功能的能力。 从用户的角度考虑,可简单地理解为几个层面的要求:
方法培训
PPT文档演模板
2020/11/15
方法培训
1、概述--通信网的可用性
骨干网
设备层
骨干网
接入层
系统HA
HA 网络级HA
连接设备HA
功能框1HA
功能框2HA
功能框3HA
设备HA
计划性活动HA
人为差错HA
……
1、设备都是通信网络中的一个 接点,网络的可靠性或者说端到 端的可靠性是用户最终关心的。 不能仅仅关注设备可靠性而忽视 组网、网络其他部件对可靠性的 影响;
PPT文档演模板
方法培训
1、概述--可靠性流程
1、器件级FMEA分析报告
1 单板构成及功能定义 2 单板功能层次框图 3 单板可靠性框图 4 编码原则(可选) 5 环境定义 6 严酷度等级定义 7 单板器件级FMEA分析 7.1 单板器件级FMEA分析表格 8 总结
8.1 软件故障管理需求列表 8.2 硬件故障管理需求列表 8.3 测试验证需求列表 8.4 故障降级分析 8.5 故障定位率计算 8.6 冗余单元倒换成功率计算 8.7 分析总结
告警方法:
1、报警; 2、信息文本(如:写入运行日志中) 3、故障分级处理(不同级别的故障采 取不同的告警方法)
PPT文档演模板
方法培训
课程目的
可靠性工作介绍 故障管理设计 FMEA分析方法介绍 可靠性验证测试(FIT)
PPT文档演模板
方法培训
3、可靠性分析方法
系统 薄弱环节
可靠性设计
故障概率高
FMEA的分析层次:
系统级:按各功能模块进行分析 板间信号级:单板的接口信号进行分析 器件级:按各器件的故障模式进行分析
PPT文档演模板
方法培训
3、可靠性分析方法--可靠性FMEA
FMEA的分析方法 :
硬件法:从硬件的角度,对每个器件 管脚输出分别去考虑故障模式、故障 影响、检测补偿措施。
功能法:每个产品可以完成若干功能,而 功能可以按输出分类。这种方法将输出一 一列出,并对它们的故障模式进行分析。 对应系统级、单板级分析。
➢I~II类故障通常称为重 大故障,也即“单点故障 ”; ➢III类故障可简单理解为 需要尽快修复的故障。
➢当一个故障不能被检测 出来时,是“隐患”,级 别上升一级。
➢具体产品具体定义;
功能模块名称
故障模式
电源子系统 电源子系统 电源子系统 电源子系统 风扇监控子系统 风扇监控子系统 风扇监控子系统 背板
严酷度
I II II III I II III I I III III I II II III II III
备注
PPT文档演模板
方法培训
3、可靠性分析方法--可靠性FMEA
描述功能层次框图
目的:为了描 述系统各功能 单元的工作情 况、相互影响 及相互依赖关 系,以便可以 逐层分析故障 模式产生的影 响。
方法培训
3、可靠性分析方法--可靠性FMEA
描述结构图
目的:清晰功能模块之间的相互关系,主要输入/输出信号。
PPT文档演模板
方法培训
3、可靠性分析方法--可靠性FMEA
确定故障模式和故障原因(系统级)
可靠性FMEA、CA分析
PPT文档演模板
方法培训
1、概述--业界可靠性流程(MOTOROLA的AWP)
AWP:availability work process
可用 性工 作过 程数 据流
可用性计划 更新设计 FMEA分析 操作过程 操作最简化计划
可用性模型 故障插入计划
测试和现场 数据
故障原因和影响 操作界面
相关文档
最新文档