报警和事件管理综述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
TOP Computer Engineering
10 1
Philosophy / System Requirements
9
2
Identification
3
Rationalization / Design Requirements
Management of Change
4
Design
Assessment & Audit
实施报警管理的内容
Alarm Philosophy 报警指导原则文档,定义报警管理的方法和步骤,报警管理软件提 供报警philosophy书写模版 •System Requirements 报警系统的需求分析 •Identification 报警辨识:用风险分析等方法确定需要的报警,列出各个报警、风险 分析报告、P&ID修改 •Rationalization 报警理性化:按照报警指导原则philosophy的规定审核各个报警,写出 报警理性化文档和报警设计需求。报警管理软件提供理性化文档书写 文档 •Basic Alarm Design 基本报警设计 •HMI Design 人机界面设计 •Advanced Alarming Techniques 先进报警技术 •Implementation & Initial Training 报警管理实施和初始培训,要给出对各个活动报警的 响应办法,并培训操作员 •Operation 操作:使用报警系统 •Maintenance & Refresher Training 维护和培训:预防性维护,定期检测,修理有问题 的报警, 高级培训 •Monitoring & Assessment 监测和评价:检测报警数据并按照philosophy发现报警问题 •Reporting 报表 •Management of Change 变更管理:增加、修改、及删除报警 •Audit 审查
Identification
3
Rationalization
Review alarm against principles. Complete documentation and design requirements Complete the basic design, HMI design, and advanced alarming design
5
Implementation & Training
8 6
Operation Monitoring
7
Maintenance & Training
TOP Computer Engineering
1
Philosophy
Define processes for alarm management and system requirements Determine potential alarms
TOP Computer Engineering
报警和事件管理
2007年10月
TOP Computer Engineering
•
报警管理概论
– – – – 定义 当前报警系统的问题 问题产生的原因 问题产生的后果
•
•
报警管理实施生命周 期(阶段)及软件工 具 报警管理项目的实施
TOP Computer Engineering
维护 连续改进
安装软件工具和建立实施环境 动态报警分析(运用ProcessGuard) 确定报警系统性能的关键定量指标 • 操作员的工作负荷(报警数) • 报警优先级分布 • 有问题的报警比例 • 比较装置的报警系统运行性能 标定和差距分析是继续改进的基础 标定的依据是最好的工业实践标准(如EEMUA) 识别出不良报警 修理报警系统:去除Nuisance(Annoying)报 警 根据基线估算出项目可以获得的效益
报警管理的定义
报警管理是一个过程,通 过这一过程实现报警的监 测、管理和工程化,从而 保证安全、可靠的操作。
TOP Computer Engineering
不正常状态(工艺过程紊乱)造成的损失
每年200亿美金损失*
•生产损失(产品不合格、加工能力降低、 设备磨损增加)造成工厂产值损失3-8% •设备损坏 •造成损害人身健康和人身安全的严重后 果 •环境污染
4000 6000 5000
Recorded Max. Acceptable (300) Manageable (150)
2000 1500 1000 500 0 1960 1970 1980 1990 2000
Alarms Per Operator Position
3000 2000 1000 0 - 8 Weeks -
•4-6 屏幕、50-100个显示画面 •“显示内情的” 工艺过程画面 •过程紊乱事件识别 •通过多次键击才能访问控制器 •一个控制台有2,000到4,000个报警
TOP Computer Engineering
DCS带来的报警问题:数量急剧增加
Alarms Per Day
4000 3500 3000 2500
•
TOP Computer Engineering
标定和评估 Assessment,Benchmarking 建立报警指导原则 Philosophy 报警理性化 Rationalization
• 报警管理不仅是产品,更重要 的是一个过程 • 通常将报警管理过程分为6个主 要阶段或称生命周期
实施和执行 Implementation & Execution
TOP Computer Engineering
什么地方出了毛病?
模量控制盘 Analog Panel Board
•单个的、固定的、相互邻近的控制盘 •可以全览整个工艺过程 •工艺过程紊乱的早期模式识别 •直接、快速地用控制器进行控制 •一个控制盘有50到150个报警
CRT控制台 CRT-Based Console
4
Design
5
Implementation & Training Operation Maintenance
Activate alarm and train operators.
Alarm Response Procedures Alarm data Functioning alarms
6 7
Use alarms Preventive maintenance, periodic testing, and repair of problem alarms Monitor alarm data for problems identified per the philosophy Process for additions, modifications, and deletions of alarms. Periodic assessment of alarm management processes.
Philosophy templates, SP18 standard, training Potential alarms as identified by processes such as PHAs. Alarm philosophy, and potential alarms Alarm Design Guide and alarms with specified design requirements Completed alarm design and documentation Implemented alarms Alarm monitoring reports and alarm philosophy Alarm data and alarm philosophy Alarm philosophy, proposed changes and problem alarms Alarm philosophy and audit protocol
• 常驻报警(Stale alarms)
• 报警泛滥(Alarm Flood)
• 报警缺乏清晰度
TOP Computer Engineering
TOP Computer Engineering
加工行业中率先倡导解决这一问题的公司和组织
•PAS提出的“危急状态管理的最优方法” •Matrikon •不正常状态管理协会(ASM) •工程设备和材料用户协会 (EEMUA)
8
Monitoring Management of Change Assessment
Alarm reports and problem alarms Identified alarms for modification. Recommendations for improvement.
9
1 0
TOP Computer Engineering
Causes of Incidents*
工艺问题 22% 人为失误 42%
挑战
•造成不正常状态的原因十分复杂并且同 自动化密切相关 •操作员负荷问题 •设备运转时间延长问题
设备问题 36%
*异常情况管理协会(Abnormal Situation
Management Consortium)估计
TOP Computer Engineering
•实时报警阅览 ProcessGuard •报警和事件分析 •报警文档和理性化 •报警核查和强制执行 •实时报警管理 ProcessGuard MOCCA •先进报警策略 •基于操作状态的报警 •报警泛滥分析
TOP Computer Engineering
标定和评估
报警指导原则文档
报警理性化 实施和执行
Configured
操作员不可能评估成千上万个报警事件!
哪些报警是安全的、操作员可以不管?
TOP Computer Engineering
DCS带来的报警问题:界面复杂、不清晰
TOP Computer Engineering
TOP Baidu Nhomakorabeaomputer Engineering
DCS带来的报警问题:大量不必要报警
维护 Maintenance 继续改进 Continuous Improvement
TOP Computer Engineering
标定和评估 建立报警指导原则 报警理性化
(ProcessGuard)
ProcessGuard MOCCA
实施和执行
维护 继续改进
ProcessGuard MOCCA
TOP Computer Engineering
Definitions, principles, processes, system requirements Potential Alarm List, PHA report, P&ID Modifications Documented alarms, design requirements Completed alarm configurations
TOP Computer Engineering
报警管理的指导标准
• EEMUA(Engineered Equipment and Materials Users Association )1999年公布191号出版物-报警系统:设计、 管理和获得指南 • NAMUR( User Association of Process Control Technology in Chemical and Pharmaceutical Industries)2003年公布 NA102报警管理建议书 • 2003年开始制定ISA SP18.2 • 2006年4月 PAS出版了报警管理手册 – 综合指南 • 2007年3月 ISA(Instrument,Systems and Automation Society)公布了PAS的手册 – 报警管理:性能优化的7个有 效方法 • 2007年底至2008年初,ISA将公布ISA18.02
• 令人厌烦的报警(Nuisance alarms)
– 被触发的报警,但不需要操作员响应,一般一分钟超过3个 – 分散操作员的注意力 – 降低了对真正报警的响应能力 – 通常是由于维护问题造成的 – 消除这种报警是改进报警系统的主要目标 – 出现后持续保持很长时间的报警 – 不需要操作员响应动作 – 操作员采取动作后仍然清不掉 – 表明报警的配置设定可能有问题 – 在短时间内发生许多报警,而且通常是由单一事件触发的 – 是报警系统的危险问题 – 解决起来比较复杂,通常是在波动、扰动等不正常状态时发生 – 是由事件驱动的 – 使得操作员束手无策,需要帮助 – 操作员对报警根源以及应采取的行动不清楚