多级空间关联规则挖掘及性能评价方法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多级空间关联规则挖掘及性能评价方法
数据挖掘就是在现有的技术条件下,从大量的、不完全的、含有随机性的数据集中,挖掘其中隐含的并且具有重要价值的知识过程。
但是随着现代社会的知识的飞速产生及发展,数据挖掘技术变得越来越重要。
本文在Apriori算法的基础上,结合堆排序和链表的优点,设计了一种改进
的Apriori算法,并将其应用到多级空间关联规则的挖掘中,并对评价方法进行
了相应的研究。
关联规则是数据挖掘中最常使用的方法,只有发现关联规则才能够挖掘数据集中存在的数据关系。
本文设计了一种新的发现关联规则的方法。
该方法结合了Apriori算法和堆排序的特点。
通过对实验结果的分析,发现改进后的算法是有效的,并且得到的结果是频
率最高的前n项,即重要关联规则。
改进后的算法不仅优化了数据集的选择和生成候选集的运算,也优化了剪枝的过程。
另外本文的算法在一定程度上可以利用已有的挖掘结果,将现有的结果和未来新产生的数据集相结合,能较好的发现重要规则并利用其价值推断相应的规律。
最后将本文改进的算法应用到多级空间关联规则挖掘过程中,并对实验结果进行了分析。
关联规则的评价方法主要是为了对关联规则算法进行多方面的评价,能够较全面比较算法的性能,本文主要从主观和客观两方面来进行研究。
本文在主观上面主要考虑的是人们的预期结果与实际结果的对比,客观上面主要考虑的是准确度、空间效率、运行时间、对数据库的访问的比较。
本文还简单介绍了多级空间挖掘过程中的数据特性,并与其它空间算法的实
验结果进行了对比。
实验证明在多级空间挖掘中,本文算法能够更好的提取空间数据中最顶层的空间信息。