频繁项集挖掘的Apriori改进算法研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1000-5862(2011)05-0498-05
频繁项集挖掘的Apriori改进算法研究
栗晓聪滕少华
广东工业大学计算机学院,广东广州510006
摘要:针对Apriori算法的不足,提出了一种新的优化算法—IApriori.该算法应用散列技术优化产生频繁-2项集,优化连接操作减少连接判断的次数,通过对候选项集编码来减少扫描数据库的次数,优化逻辑“与”运算减少不必要的“与”操作次数,缩短生成频繁项集的时间.IApriori算法仅需3次扫描数据库.研究结果表明,该算法具有快速、直观、节省内存等优点.
Apriori算法;频繁项集;候选项集;IApriori算法
TP311A
2011-07-12
广东省自然科学基金(06021484, 9151009001000007)和广州市越秀区科技计划(2007-GX-023)资助项目.
滕少华(1962-),男,江西南昌人,教授,博士,主要从事协同工作、网络安全和数据挖掘方面的研究.
第5期
2011年
第5期
@@[1]王琳,滕少华,伍乃骐,等.基于协议分析的散列模式入侵检 测方法[J].计算机工程与设计,2006,27(1): 53-55.@@[2]颜跃进,李舟军,陈火旺,等.基于FP-Tree有效挖掘最大频 繁项集[J].软件学报,2005,16(2): 215-222.
@@[3]郭宇红,童云海,唐世渭,等.基于FP-Tree的反向频繁项集 挖掘[J].软件学报,2008,19(2): 338-350.
@@[4] Han Jiawei, Pei Jian, Yin Yiwen, et al. Mining frequent matterns without candidate generation [J]. Data Minning and Knowledge Discover, 2004, 8(1): 53-87.
@@[5]Jiawei Han,Micheline Kamber.数据挖掘概念与技术[M].范 明,孟小峰,译.北京:机械工业出版社,2007:167-161.@@[6] Wu Xingdong, Vipin Kumar, Ross Quinlan J. Top 10 algorithms
in data mining [J]. Knowledge and Information Systems, 2008,14(1): 1-37.
@@[7]陈耿,朱玉全,杨鹤标,等.关联规则挖掘中若干关键技术的 研究[J].计算机研究与发展,2005,42(10): 1785-1789.@@[8]徐章艳,刘美玲,张师超,等.Apriori算法的三种优化方法[J]. 计算机工程与应用,2004,40(36): 190-193.
@@[9]傅慧,邹海.基于待与项集的频繁项集挖掘算法的研究[J]. 计算机工程与设计,2009,30(1): 129-131.
@@[10]徐健辉.生成频繁项集的逻辑“与”运算算法[J].计算机应用, 2004,24(11): 88-90.
@@[11]俞燕燕,李绍滋.基于散列的关联规则AprioriTid改进算法[J]. 计算机工程,2008,34(5): 60-62.
@@[12]柴华昕,王勇.Apriori挖掘频繁项集算法的改进[J].计算机 工程与应用,2007,43(24): 158-161.
The Research on Improvement of Apriori Algorithm Based on Mining Frequent Itemsets
LI Xiao-congTENG Shao-hua
频繁项集挖掘的Apriori改进算法研究
作者:栗晓聪, 滕少华, LI Xiao-cong, TENG Shao-hua
作者单位:广东工业大学计算机学院,广东广州,510006
刊名:
江西师范大学学报(自然科学版)
英文刊名:Journal of Jiangxi Normal University(Natural Sciences Edition)年,卷(期):2011,35(5)
本文链接:/Periodical_jxsfdxxb201105013.aspx