基于Apriori算法的设备故障诊断技术的研究
基于多值属性Apriori算法的飞机IDG故障分析

No.2Feb.2021第2期2021年2月组合机床与自动化加工技术ModularMachnneTool& AutomatncManufacturnng Technnque文章编号:1001 -2265(2021)02 -0069 -04DOI : 10.13462/j. cnki. mmtamt. 2021.02. 017基于多值属性Apriori 算法的飞机IDG 故障分析孔祥芬,张利寒,刘敬赞,王杰(中国民航大学航空工程学院,天津300300)摘要:为了更为高效地挖掘海量航空维修数据中隐含的信息,提升飞机故障分析能力及深度维修能 力,通过轮廓系数K-means 聚类和多值属性Ap/o/关联规则算法挖掘飞机IDG 部件各故障因素之 间的关联规则。
首先,采集B737飞机故障维修数据,进行预处理并筛选出与IDG 部件相关的故障 数据信息;其次,利用K-msns 聚类和多值属性Ap/o/关联规则算法对IDG 部件故障数据进行聚 类分析和关联规则挖掘,得到主要故障现象及各因素之间的强关联规则,和传统Ap/l 算法对比, 多值属性Ap/o/算法的运行时间更短、效率更高;最后,结合各组件工作机理对B737飞机IDG 部 件提出了相关预防性维修建议。
关键词:数据挖掘;多值属性Ap/o/算法;故障分析中图分类号:TH16;TG65 文献标识码:AFault Analysis of Aircraft IDG Based on Multi-valued Apriori AlgorittmKONG Xiang-fen ,ZHANG Li-han ,LIE Jing-Cun ,WANG Jic(CoXege of Aeronauhcol Engineering & Civil Aviation University of China & Tianjin 300300 & China)Abstracc : In order to mining hidden information of massive aviation maintenance data efficiently , improve aircrafhfaulhanalysisand deep mainhenancecapabilihy , Mining hhea s ociahion rulebehween faulhfachorsofaircraft IDG component by contour coefficient K-means clusteang and Apriori association rule algoathm based on multi-valued atWieuWs. Firstly & collecting fault maintenance data of B737 aircraft & then perform pre-processing and filter out fault data information asociated with IDG components ; secondly , performing clusteranalysisand a s ociation rulemining forfailuredataofIDG componentusing K-meansClustering and Multi-Valued a t ributeAprioriAlgorithm , obtain maeorfailurephenomenaand strong a s ociation rulebetween variousfactors , comparewith theApriorialgorithm , Multi-valued a t ributeApriorialgorithm has shorterruntimeand highere f iciency ; fina l y , combined with theworking mechanism ofcomponentstoprovidesuggestionsforpreventivemaintenanceofB 737 aircraftIDG components. Key wordt : datamining ; multi-valued a t ributeApriorialgorithm ; faultanalysis0引言近年来,随着航空公司机队规模的迅速增加[1],以 及民航“一二三三四”的总体发展思路和“民航高质量 发展”的战略需求,对航空维修提出了更高质量的精 细化深度维修要求⑵。
基于Apriori算法的电力系统二次设备缺陷数据挖掘与分析研究

基于Apriori算法的电力系统二次设备缺陷数据挖掘与分析研究皇甫汉聪;肖招娣【摘要】为了能够使电力系统二次设备运行维护及管理控制水平得到提高,基于电力系统二次设备缺陷数据提出了基于Apriori算法的电力系统二次设备缺陷数据挖掘及分析方法.首先,对关联规则和Apriori算法的思路进行了全面的分析,之后创建以关联规则为基础的电力系统二次设备缺陷模型,通过模型思考二次设备缺陷的主要属性,包括二次设备类型、生产厂家及缺陷原因、部位等.最后,将自动化设备缺陷数据作为例子,分析基于Apriori算法的电力系统二次设备缺陷数据挖掘及分析方法.通过分析结果表示,所提出的方法能够满足二次设备缺陷数据挖掘及分析需求,并且寻找导致数据缺陷的原因,还能够对设备家族性缺陷进行分析.【期刊名称】《电子设计工程》【年(卷),期】2019(027)005【总页数】5页(P6-9,15)【关键词】Apriori算法;电力系统二次设备;缺陷数据挖掘;关联规则【作者】皇甫汉聪;肖招娣【作者单位】广东电网有限责任公司佛山供电局广东佛山528000;广东电网有限责任公司佛山供电局广东佛山528000【正文语种】中文【中图分类】TN99二次设备的有效运行是电力系统稳定安全运行的重要保证,随着现代经济不断发展,电网规模也在不断扩大,电网二次设备的数量也有了进一步增加。
设备多和人员少的问题增加了运行维护管理人员的工作负担,还为电网的运行带来了一定风险。
二次设备运维工作人员在日常工作中会发现并处理缺陷,之后对数据进行记录归档,便于日后的统计、查找及分析。
此电力系统二次设备数据中具有大量的有用信息,实现缺陷数据的挖掘及分析,对电网二次设备的运行维护及管理控制水平的提高具有重要意义。
目前,数据挖掘已经被广泛应用到电力系统中,但是在二次系统分析中的使用并不多。
本文提出了基于Apriori算法的电力系统二次设备缺陷数据挖掘及分析技术,希望能够充分挖掘对二次设备有用的数据。
基于apriori算法的连锁故障机理研究

基于apriori算法的连锁故障机理研究本文探讨了基于Apriori算法的连锁故障机制研究。
首先,介绍了连锁故障机制的概念以及其重要性。
其次,介绍了Apriori算法的原理,以及利用Apriori算法进行连锁故障机制分析的相关方法,详细介绍了Apriori算法在连锁故障机制分析中的应用。
最后,通过把握连锁故障机制的认识和Apriori算法实施连锁故障机制分析,介绍了基于Apriori算法的连锁故障机制研究中的研究内容和研究成果。
Introduction连锁故障机制是指由多个外界事件或因素共同作用而导致系统发生故障的机制。
连锁故障机制是许多不同系统失效分析的重要组成部分,它可以用来分析系统在失效过程中可能发生的原因,以及对这些原因的处理方案。
因此,研究连锁故障机制对于系统安全和可靠性的保证至关重要。
Apriori AlgorithmApriori算法是一种数据挖掘算法,它可以有效地挖掘出频繁项集,从而挖掘出数据中隐藏的重要信息。
Apriori算法的主要思想是首先从数据集中挖掘出频繁项,然后建立“频繁项集”,最后根据关联规则进一步探索数据集。
Apriori算法可以有效地挖掘出数据集中隐藏的重要信息,从而提升数据分析的准确性和有效性。
Apriori Algorithm for Chain Fault Mechanism Analysis 基于Apriori算法进行连锁故障机制分析,可以从宏观的角度对故障事件进行分析,掌握连锁故障机制的认识,以及事件发生的前因后果。
首先,根据实际情况建立事件日志,并利用Apriori算法将日志中的事件序列挖掘出来,形成频繁项集;然后,将这些事件序列正确地划分为关联规则;最后,利用关联规则探索系统中可能存在的连锁故障机制,对系统故障进行归类研究,并分析出可能存在的故障状态机。
Research Content基于Apriori算法的连锁故障机制研究,主要包括以下研究内容:(1)连锁故障机制的定义和分类:建立连锁故障机制的概念,包括其构成、要素及类型;(2)基于Apriori算法的故障序列分析:利用Apriori算法对日志中事件序列进行分析,提取出频繁项,并构建频繁项集;(3)基于关联规则的连锁故障机制分析:利用关联规则来发现连锁故障机制,归类研究不同类型的连锁故障机制,构建故障状态机;(4)建立基于Apriori算法的连锁故障机制研究的框架:建立一种更好的连锁故障机制研究方法,充分利用信息熵来实施连锁故障机制的分析,分析不同系统的失效行为。
基于Apriori和C5.0算法的智能电表故障预测

基于Apriori和C5.0算法的智能电表故障预测
文耀宽;侯慧娟;王雍
【期刊名称】《自动化仪表》
【年(卷),期】2022(43)5
【摘要】针对智能电表故障状态的预测问题,提出了一种基于Apriori算法和C5.0算法建立智能电表故障识别模型,实现智能电表故障的预测。
首先,对智能电表历史故障数据库进行数据挖掘预处理,并采用Apriori算法进行强关联因素深度挖掘。
然后,将强关联因素组成的数据集合分为训练数据集和测试数据集两部分,采用C5.0算法对训练数据集进行数据挖掘,生成智能电表故障初步预测规则。
接着,根据测试集的数据对初步预测规则的正确性进行评估:如果准确度满足要求,确定预测规则;如果不满足,则返回训练集。
最后,根据获得的预测规则建立智能电表故障状态预测模型进行智能电表故障预测。
算例分析结果证明,智能电表故障状态预测模型具有较高的精度,可获得极为准确的故障状态预测结果。
【总页数】6页(P90-94)
【作者】文耀宽;侯慧娟;王雍
【作者单位】国网河南省电力公司营销服务中心
【正文语种】中文
【中图分类】TH89
【相关文献】
1.基于C5.0与Apriori算法的森林生物量等级评价与因子关联分析
2.基于改进Apriori算法的地面空调间歇故障预测
3.基于随机森林的智能电表故障及寿命预测模型
4.基于时空卷积神经网络的智能电表故障预测
5.基于多分类机器学习模型的智能电表故障预测
因版权原因,仅展示原文概要,查看原文内容请购买。
基于赋权Apriori算法的新型列车运行控制系统故障定位方法

基于赋权Apriori算法的新型列车运行控制系统故障定位方法在现代铁路交通的复杂网络中,列车运行控制系统(TCS)扮演着守护神的角色。
然而,当这个系统出现故障时,它就像一只被困在迷宫中的猛兽,急需找到出口。
传统的故障诊断方法往往如同盲人摸象,难以准确快速地定位问题所在。
而今天,我们要探讨的是一种基于赋权Apriori算法的新型故障定位方法,它如同一把锋利的钥匙,能够迅速解开迷宫之门。
首先,让我们来了解一下赋权Apriori算法。
这一算法源于数据挖掘领域,原本用于发现交易数据库中的频繁项集。
在这里,我们将它巧妙地运用于TCS故障数据的处理上。
通过分析历史故障记录,算法能够挖掘出潜在的故障模式和关联规则,就像是一位经验丰富的侦探,通过线索拼凑出案件的真相。
接下来,我们来看这种方法如何应用于新型列车运行控制系统的故障定位。
当系统发生故障时,大量的报警信息和状态数据会涌入控制中心。
这时,赋权Apriori算法就像一位精明的分析师,对这些繁杂的数据进行筛选、归类和关联分析。
它能够识别出哪些报警是关键性的,哪些是次要的,甚至是误报。
通过这种方式,算法能够迅速地缩小故障搜索范围,直至锁定真正的故障点。
举个例子来说,假设在某次故障中,系统报告了多个报警信息:信号灯故障、轨道电路异常、通信中断等。
传统方法可能会逐一排查这些报警,费时费力。
而赋权Apriori算法则能够根据历史数据分析出这些报警之间的关联性,比如“信号灯故障”和“轨道电路异常”经常同时出现,并且与“通信中断”没有直接联系。
因此,算法会优先检查信号灯和轨道电路,从而提高了故障定位的效率。
当然,这种方法并非没有挑战。
赋权Apriori算法需要大量的历史数据作为支撑,而这些数据的质量和完整性直接影响到算法的准确性。
此外,随着TCS系统的不断升级和变化,算法也需要不断地更新和优化以适应新的情况。
尽管如此,基于赋权Apriori算法的新型列车运行控制系统故障定位方法仍然显示出巨大的潜力和优势。
智能科学技术论文:浅谈基于Apriori算法的关联规则在疾病诊断中的应用

智能科学技术论文:浅谈基于Apriori算法的关联规则在疾病诊断中的应用随着计算机技术的发展,数据库及信息管理在医疗机构的应用越来越广泛,如何在浩瀚的数据中找出有价值的知识和规则,为疾病的诊断和治疗提供科学的依据,从而更好地为医院的医疗、科研和教学服务是当前急需解决的问题[1]。
本文通过关联规则挖掘疾病与症状的关联模式,期望对疾病的诊断提供有价值的参考。
1 数据挖掘在疾病诊断中的应用医学数据库是庞大的数据资源,每天都会有大量相同或相似的信息存储其中。
医学数据库中含有海量的原始信息,其中包括大量模糊的、不完整的、带有噪声的信息,在数据挖掘之前,必须对这些信息进行清理和过滤,确保数据一致性,将其变成适合挖掘的形式。
2 关联规则的基本概念关联规则挖掘是数据挖掘中最活跃的研究方法之一,最初用于购物篮分析,通过发现顾客放入购物篮中不同商品之间的联系,分析顾客的购物习惯。
要原因可能由感冒引起的。
当病人到医院向医生求助时,会主动描述自己的症状,医生会根据病人的描述,主动询问一些其他可能发生的症状,以进一步对病人的病情有所了解。
医生对病人的症状及疾病的诊断主要依据专业知识以及多年的临床经验,但有可能发生失误,影响病人的最佳治疗时机,从而引起医疗纠纷。
若能将所有关联规则置于信息系统中,则可减少上述错误发生的概率。
当医生将病人描述的症状输入到计算机时,系统便可根据关联规则,提醒医生该病人可能患有其他症状,而这些症状可能都是由某种疾病引发的。
此外,当病人身体不适去医院就诊时,往往不清楚该挂那个科。
当病人就诊时,被告知挂错号,不仅造成医疗资源的浪费,还可能会耽误病人的治疗。
若能在服务台的自助系统中加入关联规则搜索功能,病人可以根据自己的症状查询应该挂哪个科。
4 结语本文将基于Apriori算法的关联规则应用于疾病诊断,尝试挖掘症状和疾病之间的关联。
除此之外,关联规则的数据挖掘技术还可以为医疗提供更多潜在的、有价值的信息。
Apriori算法在雷达故障诊断系统中的应用研究

E ma :  ̄ @ c c e e - i x l cc. t l l n .l
htp/www. z .e .n t: / dn sn te Te: 86 51 69 63 56 09 4 1+ -5 —5 09 9 6
C mp  ̄ K o l g n e h o g o u r n we e d T c n l y电脑 知识 与技术 d a o
随着 电子 技术 的飞 速 发 展 , 达 装备 的系 统 越 来 越 复 杂 , 项 指 标 和 自动 化 程 度越 来 越 高 , 致 其 故 障呈 现层 次性 , 雷 各 导 传播 性 , 相
关性 和不 确 定 性… 特 点 , 断越 来 越 困难 。传统 的依 赖 人 工 经验 和 仪 表 的 方 法诊 断 效 率 低 , 能 化程 度 不 高 , 能 满 足 国军 标 规 定 等 诊 智 不
sac p r n, eNa a nyAc d my Huu a 2 0 1 Chn) e rh De a me t Th vl a e , ld o 1 5 0 , i a t
Absr c :Ai ng a he p o e fsr cur o p e a antn nc f c to et i a a ,t sa il n r du e io lo tm ta t mi tt r blm o u t e c m lx nd m i e a e di ul fac ran r d r h r ce ito c sApf f ag r h t i f i t i i t neas ito ea o fo h sorc antn nc e o d a s st socai n eai O de ie a sa l h a ful d a no i O mi soca n r lt n r m t e hit i a m i e a e r c r nd u e he as ito r lt i i l on t v s nd etbi a t ig ss s sse . y tm Thepa rm any i to c st n n a hi n o i tucur ft a tdig osss t m .Ap ia o ho st ss se a pe il n r du e he m i g m c nea d l g csr t eo i he ful a n i yse pl t n s w hi y tm c n ci
基于APRIORI算法及方差分析的电力故障原因相关度分析

摘要:电力是国民经济的支柱,是国家经济的命脉。
电力事故不仅影响电力系统的稳定,甚至影响到国家经济和社会安全。
故障树分析法是一种有效的事故分析方法,能够层层分析事故原因,但是不能直接分析出导致事故发生原因的相关程度。
为此,本文提出了一种基于apriori算法及方差分析的故障树原因相关度的分析方法,首先利用apriori算法在给定的数据库中进行多遍扫描,得出频繁项集,求出支持度;其次通过方差分析得出不同的原因对上级原因存在明显的差异,得出不同原因的影响程度。
有利于今后有针对性地对事故进行防范,降低事故发生的概率,减少事故的发生。
关键词:电力故障;apriori算法;支持度;方差分析中图分类号:tp391 文献标识码:a0.引言电力系统在空间上的广域分布,导致电力事故的发生是不可避免的,事故数据的收集、分析很难全面、系统地进行。
分析2003年~2015年中国南方电网电力生产事故,目前同类事故重复现象比较普遍。
采用故障树分析法无法确定导致事故发生的上下级原因之间的相关度,不能确定主要的事故防范措施;另一方面,故障树分析法缺乏对事故分析结果的系统应用,要想全面查找到各个根本原因间的逻辑关系,十分困难,不能建立多方面、多维度防范措施,无法真正达到事故预防目的。
利用基于apriori算法及方差分析的故障树上下级原因相关度分析方法,分析事故上下级原因的相关度可以有针对性地对事故进行防范,降低事故发生概率,减少事故的发生。
apriori算法是一种最有影响的挖掘布尔关联规则频繁项集合的算法。
apriori算法通过查找事务数据库中所有支持度大于最小支持度的频繁项集。
将apriori算法利用于事故树上下级原因分析,得出的频繁项集合的支持度便是事故树上下级原因之间的相关度,此时最小支持度应该设定为零;另外,apriori算法还可以在频繁项集合中产生所有大于等于最小可信度的关联规则,即可分析同级原因的关联规则。
对于电网发生的电力事故来说,在某一个确定的时间段上,电力安全生产管理水平是趋于一个稳定的程度,则对应的电力生产事故发生的可能性也是趋于一个确定的值。
基于 Apriori 算法的烟片生产设备参数分析

NO V . 2 0 1 3 Vo 1 . 4 2 N o . 1 1
第4 2卷 第 1 1 期
D O I : 1 0 . 3 9 6 9 / j . i s s n . 2 0 9 5— 5 0 9 X . 2 0 1 3 . 1 1 . 0 0 5
基于 A p r i o r i 算 法 的烟 片 生 产 设 备 参 数 分 析
征及 相关性 的过程 , 也 就是从 数据 中挖 掘信 息或 知
识 …。
出数据 集 中隐 藏 的强 规 则 。 此外 很 多 学 者 提 出了
重 要性 或兴 趣度 的概 念 , 重要性 的计算公 式 如下 :
I m p r o t a n c e( 4 B ) :L o g( 尸( B l A) / P( B I
度是 D中事务 包 含 A u B的百分 比 , 表示 这条 规则
在所有事务中有多大的代表性和适用性。 置信度是
D中包 含 A事务 的同时也 包含 事 务 的百分 比 , 是
是一种从 大规模 数据 中挖掘 关联 规则 的有 效方 法 4 J , 目前 已 获 得 广 泛 的应 用 。生 成 频 繁 项 集 的 A p i f o i算法 描述 如 下 【 f 5 j :
s u p p o t r — c o u n t ( A)
近年来 , 数 据挖 掘 引起 了工业 生产 领域 的极 大
关注 , 其 主要 原 因是 工业 生产 过程 中产 生 了大量 的
数据, 迫 切需 要将 这些 数据转 换 为有用 的知识 。但
人 工很难 理解 这些 数 据并分 析 他们 之间 的关 系 , 更 不 能及 时地 总结 和预 测 。数 据 挖 掘 一 般 是 指利 用 各 种分 析方 法 与技 术 , 将 过 去 所 积 累 的 大量 的 、 不 完全的、 有 噪声 的 、 模糊的、 随 机 的数 据 进 行 分析 、
基于关联规则的Apriori改进算法的研究综述

基于关联规则的Apriori改进算法的研究综述【摘要】本文主要对基于关联规则的Apriori改进算法进行了研究综述。
在介绍了研究背景、研究目的和研究意义。
正文部分首先对Apriori算法进行了简介,然后探讨了关联规则挖掘以及Apriori算法存在的问题。
接着重点分析了基于关联规则的Apriori改进算法,并总结了改进算法的研究现状。
在对整个研究进行了总结,同时展望了未来的研究方向。
本文对基于关联规则的Apriori改进算法进行了深入综述,有助于更深入地了解和应用这一领域的研究成果。
【关键词】关键词:Apriori算法、关联规则、挖掘、改进算法、研究现状、总结、未来展望1. 引言1.1 研究背景随着互联网和大数据技术的发展,数据量呈指数级增长,由此产生的数据挖掘技术也变得越来越重要。
关联规则挖掘作为数据挖掘领域的一个重要研究方向,得到了广泛关注与研究。
Apriori算法作为关联规则挖掘的经典算法,通过发现频繁项集进而生成关联规则,在实际应用中取得了一定效果。
传统的Apriori算法也存在一些问题,比如计算复杂度高、内存消耗大等。
研究学者们陆续提出了多种改进算法来应对这些问题,其中基于关联规则的Apriori改进算法成为了研究的热点之一。
通过对Apriori算法的优化和改进,提高了算法的效率和准确性,使其在大规模数据集上得以更好地应用和拓展。
本文将对基于关联规则的Apriori改进算法进行系统的研究和总结,希望能够更深入地了解这一领域的最新进展和未来发展趋势。
1.2 研究目的研究目的是为了探索基于关联规则的Apriori改进算法在数据挖掘领域的应用价值和潜力,进一步提高关联规则挖掘的效率和准确性。
通过对现有Apriori算法存在的问题进行深入分析,寻找改进算法的方向和方法,从而有效地解决传统算法在大规模数据集上的低效率和高计算复杂度等问题。
通过研究改进算法的具体实现和应用案例,探索在不同领域和场景下的实际应用效果,为相关研究提供实用和可靠的算法支持。
基于apriori算法的连锁故障机理研究

基于apriori算法的连锁故障机理研究今天,我们依然面临着全球性的技术发展挑战,其中最重要的就是连锁故障机理的研究和应用,有了这方面的研究,将有助于准确掌握故障机理,更好地管理系统,并实现高效运行。
本文通过介绍Apriori算法和项集,从理论和实践两方面综合研究连锁故障机理,以提高连锁故障检测和处理的效率。
Apriori算法是常用的关联规则挖掘算法,它的设计思想是,对于某一个频繁模式(K项集)而言,如果它的所有子集(K-1项集)也是频繁的,那么这个K项集也是频繁的。
Apriori算法的工作流程是,首先通过扫描数据库找出频繁1项集,然后从1项集开始,生成候选k项集,并再次扫描数据库,计算支持度,去除支持度低于最小支持度的频繁k项集,最后得到频繁k 项集,形成关联规则。
关联规则的核心是项集,项集的定义很简单,就是由一个或多个属性组成的集合,在连锁故障检测和处理中,项集包括某一类设备的配置信息,系统状态参数,以及操作记录等等。
首先,借助于Apriori算法可以求出项集之间的关联规则,并利用这些规则分析不同设备之间的关联关系,从而提供有助于连锁故障诊断的辅助信息;其次,Apriori算法可以帮助快速发现潜在的性能问题,并可以监控性能变化,这样可以提前发现可能的系统故障,从而降低连锁故障的风险,有效防范和解决连锁故障问题。
因此,基于Apriori算法的连锁故障机理研究非常重要。
针对不同类型系统,不同设备,可以根据数据库中的实时数据,采用Apriori 算法,结合实际应用需求,发现系统的连锁故障问题并实现对其的有效控制和管理。
同时,基于Apriori算法的连锁故障机理研究还可以提高故障检测及处理的效率,有效解决系统性能问题,有助于系统的高效运行。
总之,基于Apriori算法的连锁故障机理研究在系统性能检测和处理中起着重要的作用,建立更全面准确的故障机理模型,优化预测结果,降低系统故障风险,保证系统有效运行,促进技术进步与发展。
基于并行Apriori算法的电网日志故障自动诊断

基于并行Apriori算法的电网日志故障自动诊断摘要:本文根据电力系统访问日志记录,构建用于挖掘的数据集。
在Spark环境下,使用并行化的Apriori算法,对可能产生问题的相关设备组构建频繁项集,形成系统故障自动诊断报告。
本文以国网甘肃电力公司系统1400w条日志记录作为数据集,采用该方法进行了检验。
结果表明该方法能够有效发现相关问题设备组。
同时,该算法在80G内存,10个虚拟节点的集群上以10秒的速度完成了频繁项集挖掘,与专家判断对比,准确率达到99%,实现了预期效果。
关键词:电力日志;Spark;Apriori;关联规则挖掘引言电网日志的故障诊断是在电网调度指挥中心对电网进行的系统故障诊断[1]。
故障的检测通常采用机器学习的计算机抓取与专家判断两种方法[2]。
如何能够从众多的信息日志中准确找到与错误日志相关的信息日志,而不是依赖于专家判断成为了一个难题。
数据挖掘会根据客观的历史数据进行预测,减少人为主观判断的影响,因而成为解决该问题的首选方法[4]。
本文将以电网信息日志入手,在分布式环境中进行数据挖掘的尝试,并会在真实的数据集上进行验证。
关联规则挖掘需要从交易数据中发现买了X的用户,还会买Y的规则,多用于推荐系统[3]。
关联规则挖掘方法主要分为两步:生成频繁项集和生成关联规则。
由于Apriori算法扩展性较好,且易于实施,因此本文采用并行化的Apriori算法,以达到系统实时性的要求。
1数据集准备在本论文实验中,以国网甘肃省电力公司的2018年9月的日志为例,共获取约1400w条信息日志,279条错误日志。
信息日志主要由以下六部分组成:信息发生时间,设备编号及IP,请求页面,请求IP,请求设备环境,响应结果。
而错误日志主要由错误编号ID,错误时间,错误设备编号、设备连接状况和设备状态改变情况这五部分组成。
其中,错误设备编号与信息日志中的设备编号一致。
数据集的准备主要是将日志信息转化为关联规则挖掘中的输入,即事务与项集。
基于改进Apriori关联规则挖掘的冷水机组故障诊断

基于改进Apriori关联规则挖掘的冷水机组故障诊断
刘庆贵;丁进良
【期刊名称】《暖通空调》
【年(卷),期】2018(048)004
【摘要】针对正常运行的冷水机组故障难以预测的问题,提出了关联规则挖掘的故障诊断方法,通过读取冷水机组历史数据库,挖掘出各个变量与故障之间的关系.由于Apriori算法可能因人工设置的支持度不合理导致关联规则挖掘结果不能满足需求,故提出了采用改进Apriori算法实现冷水机组故障关联规则挖掘.实验结果表明,改进后的算法在准确率、扫描数据库次数以及运行时间上有明显改善.
【总页数】5页(P120-124)
【作者】刘庆贵;丁进良
【作者单位】武汉地铁集团有限公司;东北大学
【正文语种】中文
【相关文献】
1.基于关联规则挖掘Apriori算法的改进算法 [J], 周凯;顾洪博;李爱国
2.基于关联规则挖掘Apriori算法的改进算法 [J], 周凯; 顾洪博; 李爱国
3.基于矩阵的Apriori改进算法的关联规则挖掘 [J], 程昌品; 邬依林; 姜永生
4.基于矩阵的Apriori改进算法的关联规则挖掘 [J], 程昌品; 邬依林; 姜永生
5.基于改进Apriori算法的地铁故障关联规则挖掘 [J], 刘文雅;徐永能
因版权原因,仅展示原文概要,查看原文内容请购买。
基于关联规则的铁路信号设备故障诊断技术研究

基于关联规则的铁路信号设备故障诊断技术研究摘要:如何对大量的铁路信号设备信息数据进行分析,及时发现故障并对故障进行快速、准确的诊断、处理,是列车安全高效运行的重要前提。
提出将Apriori算法应用于铁路信号设备故障的诊断。
通过示例演示铁路信号设备信息数据库预处理,采用Apriori算法对数据进行挖掘,再剪枝,计算不同数据项集之间的支持度和置信度,得到关联规则,采用提升度对故障诊断的有效性进行评估。
关键词:信号设备;故障诊断;关联规则;Apriori算法;支持度;置信度;提升度引言铁路线路不断增多,运行速度不断提高,信号设备逐渐升级,使得铁路运输更加多样,运行环境更加复杂,造成铁路设备故障具有一定的随机性、多样性和不确定性。
因此,对现场采集的数据进行实时分析,及时发现故障并及时对故障进行诊断、处理是列车安全高效运行的重要前提。
1数据挖掘数据挖掘就是从大量、不完整、有噪声、模糊、随机的实际应用产生的数据中,找出包含在其中、事先不知道、具有可利用的信息和知识的过程。
通过对数据进行挖掘,运用算法及编程得到有用的信息。
为了确保得到的信息是可应用的,根据数据库的大小,数据特征等选择可靠的数据挖掘算法。
数据挖掘过程一般由数据清理、数据集成、数据转换、挖掘数据、模式评估和知识表示这几个阶段组成[1]。
完整的数据挖掘系统包括规则生成子系统和应用评估子系统,在具体的挖掘过程中,需要反复执行这几个阶段。
数据挖掘过程模型是目前最广泛应用的一种处理模型。
2关联规则2.1主要概念若2个或多个项的取值之间存在某种规律性,就称其为关联,那么其中1项的属性就可以依赖其他项的属性进行关联预测。
假定D为铁路信号设备信息数据库,即事务集;I为D中所有信息类别(包括信号设备故障和列车状态)的集合,即项集;T为所有信号设备故障的集合;A为某类信号故障集,B为某类列车状态集,且A⊆I,B⊆I并且A∩B=ϕ。
对于项集A,假定count(A⊆T)为D中包含A的数量,此时A的支持度为sup(A)=count(A⊆T)/|D|。
基于Apriori算法的连锁故障机理研究

基于Apriori算法的连锁故障机理研究肖遥;过羿;谢佳;石玮佳;王志鹍【期刊名称】《电力学报》【年(卷),期】2017(032)001【摘要】首先,分析了导致连锁故障扩大的主要因素,并根据影响因素定义了连锁故障事故链预测过程中线路的预测指标值;而且,每次预测时,用模糊均值聚类算法对所有线路预测指标值进行分类,选择指标值最大的一类线路为事故链预测时即将开断线路.其次,在得到连锁故障事故链集合的基础上,利用Apriori数据挖掘算法分析事故链集里面线路间的关联性,根据关联性分析的结果研究连锁故障的发生机理.最后,以IEEE14节点系统为例应用所提算法,进行了连锁故障事故链预测、线路关联性分析和连锁故障机理分析.【总页数】7页(P22-27,69)【作者】肖遥;过羿;谢佳;石玮佳;王志鹍【作者单位】国网安徽省电力公司经济技术研究院,合肥230071;国网安徽省电力公司检修公司,合肥230061;国网安徽省电力公司检修公司,合肥230061;国网安徽省电力公司检修公司,合肥230061;国网安徽省电力公司检修公司,合肥230061【正文语种】中文【中图分类】TM711【相关文献】1.中国农资连锁经营从数量扩张向质量提升转型——基于中国农资连锁经营现状、问题与对策的研究 [J], 于宏;王丽红;田志宏2.零售连锁药店承接社区卫生服务中心药房职能影响因素研究——基于零售连锁药店药师视角 [J], 何欢欢;林淑芳;刘佐仁3.经济型连锁酒店负面报道类型研究——基于十大经济型连锁酒店的内容分析 [J], 谢礼珊;高腾4.基于EMTP-RV的风电场集电系统典型雷击闪络故障机理研究 [J], 张石;张博;夏晖;孙通;翟津川;孔祥启;曹黎;5.基于ANSYS的掘进机回转故障机理研究 [J], 张欢欢因版权原因,仅展示原文概要,查看原文内容请购买。
基于Apriori算法的发电设备预警分析

基于Apriori算法的发电设备预警分析发布时间:2021-03-24T03:00:53.369Z 来源:《现代电信科技》2020年第16期作者:丁刚孙猛[导读] 从电力可靠性的角度看,电力安全和稳定与设备有着很大的关系。
一旦电力设备出现故障,无论大小,都会严重的影响供电的可靠性,进而给电力企业带来不可估量的损失。
(上海发电设备成套设计研究院有限责任公司上海市 200240)摘要:从电力可靠性的角度看,电力安全和稳定与设备有着很大的关系。
一旦电力设备出现故障,无论大小,都会严重的影响供电的可靠性,进而给电力企业带来不可估量的损失。
因此,需要通过各种信息化手段对电力设备故障进行诊断。
本文对关联算法在电力设备缺陷预警中的应用进行分析。
关键词:Apriori算法;电力设备;预警1Apriori算法的基本理论关联规则的原理是在同一个事件中,找到不同项之间存在的关联,也就是找出事件当中频繁发生的项或是其属性的所有的子集,并找出他们的相关性。
Apriori算法是关联规则算法中的一种,其主要思想是采用2阶挖掘思想,并采用多次扫描事务数据库的方式来实现对频繁项集的挖掘。
1)k阶频繁项集Lk。
Lk表示支持度大于最小支持度的元素的集合。
在Lk中,每个元素都由数据库中k个数据项构成。
如3阶频繁项集可以表示为L3={(l1,l2,l3),(l1,l3,l4),?},其中li代表数据库中第i个项。
2)k阶候选项集Ck。
Ck是将Lk-1与L1进行合并,通过合并则可以得到k阶候选项集。
在Ck中,支持度大于最小支持度的,也就是Lk。
对Apriori算法来讲,就是利用k阶候选项集对(k+1)阶候选项集进行寻找,进而得到(k+1)阶候选项集,直到不能找到下一阶的频繁项集为止,该算法就停止运行。
以下为具体步骤:1)数据的补齐、转换、约简及离散化等进行处理;2)合适的支持度、置信度设置;3)挖掘算法对数据进行挖掘,使其产生频繁项集,再继续转化为关联规则;4)结合实际经验和知识,解释评估已经生成的关联规则,判断得到的关联结果是否符合逻辑和常理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
G AN C h a o ,L U Yu a n ,L I J u a n . HU Y i n g
( 1 . S c h o o l o f Me c h a n i c a l &E l e c t i r c a l E n g i n e e r i n g , N a n c h a n g U n i v e r s i t y ,N a n c h a n g 3 3 0 0 3 1 ,C h i n a ; 2 . S c i - e n c e a n d T e c h n o l o g y o n V e h i c l e T r a n s mi s s i o n L a b o r a t o r y ,C h i n a N o r t h V e h i c l e R e s e a r c h I n s t i t u t e ,B e i j i n g
中图分 类 号 : T H 1 6 5 . + 3 ; T G 6 5 文献标 识码 : A
Eq u i pm e nt Fa u l t Di a g no s i s Te c hn o l o g y Ba s e d o n Apr i o r i Al g o r t h m
文章编号 : 1 0 0 1— 2 2 6 5 ( 2 0 1 4 ) 0 1 — 0 1 0 0— 0 4
D O I : 1 0 . 1 3 4 6 2 / j . c n k i . mm t a m t . 2 0 1 4 . 0 1 . 0 2 8
基于 A p r i o r i 算法 的设备故障诊断技术 的研究 水
甘
1 0 0 0 7 2 )
超 , 陆 远 , 李 娟 , 胡 莹
( 1 . 南 昌大学 机 电工程学院, 南昌 3 3 0 0 3 1 ; 2 . 中国北方车辆研 究所 车辆传 动重点实验 室, 北京
摘要: 设备故障诊断是设备安全运行的保 障, 合理分析 大量的故 障数据能为设备 管理提供 重要 的参 考价值。论文采用特征建模技术描述故障设备的特征信息, 根据故障数据的特点, 以及 A p r i o r i 算法 在 故 障诊 断 中应 用 的瓶 颈 , 采 用一种 改进 的 A p r i o r i 算法 , 将 故 障数 据 映射 为 0—1矩 阵 , 根 据 对矩 阵 的剪枝 和 处理计 算 出故障数 据 的频 繁 项 集 , 挖 掘 多故 障之 间 和故 障 与运 行 参数 之 间的 关联 关 系 , 为 设 备 管理提供 有 力 支持 。最后给 出 了该方 案 的可行性 实例 验证 。 关键词 : A p r i o r i 算法; 故障诊 断; 数据挖掘
第 1期 2 0 1 4年 1月
组 合 机 床 与 自 动 化 加 工 技 术
Mo d ul a r Ma c hi n e To o l& Au t o ma t i c Ma nu f a c t ur i n g Te c hn i q u e
No. 1
J a n .2 0 1 4
1 0 0 0 7 2 , C h i n a )
Ab s t r a c t :Eq u i p me n t f a u l t d i a g n o s i s i s t h e s a f e g ua r d o f t h e s a f e o p e r a t i o n o f e q u i p me n t .M i n i n g ma s s i v e f a u l t d a t a l e g i t i ma t e l y p r o v i d e s a n i mp o r t a n t r e f e r e n c e f o r e q u i p me n t ma n a g e me n t . Ba s e d o n t h e c h a r a c t e r i s - t i c s o f f a u l t d a t a a n d t h e d e f i c i e n c y o f Ap r i o r i a l g o it r h m u s i n g i n f a u l t d i a g n o s i s ,t he f e a t u r e i n f o r ma io t n o f f a u l t y e q u i p me n t i s d e s c ib r e d b y f e a t u r e mo d e l i n g t e c h n o l o g y, a nd a n i mp r o v e d Ap r i o r i a l g o it r h m i s p r o - p o s e d.The i n c i d e n c e r e l a t i o n i s e x hu me d a mo n g he t f a u l t o r be t we e n he t f a u l t a n d o p e r a t i n g p a r a me t e r s b y c o n v e r t i n g f a u l t da t a t o 0— ・1 ma t r i x a n d c a l c u l a i t n g t h e re f q u e nt i t e ms e t s o f f a u l t d a t a b y p r u n i n g a n d h a n ・ ・