PFPonCanTree:一种基于MapReduce的并行频繁模式增量挖掘算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

PFPonCanTree:一种基于MapReduce的并行频繁模式增
量挖掘算法
肖文;胡娟;周晓峰
【期刊名称】《计算机工程与科学》
【年(卷),期】2018(40)1
【摘要】频繁模式挖掘是最重要的数据挖掘任务之一,传统的频繁模式挖掘算法是以“批处理”方式执行的,即一次性对所有数据进行挖掘,无法满足不断增长的大数据挖掘的需要.MapReduce是一种流行的并行计算模式,在并行数据挖掘领域已得到了广泛的应用.将传统频繁模式增量挖掘算法CanTree向MapReduce计算模型进行了迁移,实现了并行的频繁模式增量挖掘.实验结果表明,提出的算法实现了较好的负载均衡,执行效率有明显提升.%Frequent pattern mining is one of the most important data mining tasks.Traditional frequent pattern mining algorithmsare executed in a "batch" mode,that is,all the data are mined in one time,so they cannotmeet the needs of the ever-growing bigdata mining.MapReduce is a popular parallel computing modeland has been widely used in the field of parallel data mining.In this paper,we migrate the traditional frequent pattern incremental mining algorithm CanTree to the MapReduce computing model,achieving a parallel frequent pattern incremental miningalgorithm.The experimental results show that the proposed algorithm achievesbetterload balancing and improvesthe execution efficiency significantly.
【总页数】9页(P15-23)
【作者】肖文;胡娟;周晓峰
【作者单位】河海大学文天学院,安徽马鞍山243000;河海大学文天学院,安徽马鞍山243000;河海大学文天学院,安徽马鞍山243000
【正文语种】中文
【中图分类】TP311
【相关文献】
1.一种基于FP-树的最大频繁模式增量更新挖掘算法 [J], 李忠哗;任春龙;何丕廉
2.MRClose:一种基于MapReduce的并行闭频繁项集挖掘算法 [J], 胡娟;肖文;
3.一种基于MapReduce的频繁模式挖掘算法 [J], 叶海琴;孟彩霞;王意锋;张爱玲
4.基于MapReduce的频繁模式挖掘算法的优化 [J], 王波;王怀彬;张超
5.一种基于Spark的高效增量频繁模式挖掘算法 [J], 荀亚玲;孙娇娇;毕慧敏
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档