一种基于关联规则分析的挖掘算法[发明专利]
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专利名称:一种基于关联规则分析的挖掘算法专利类型:发明专利
发明人:岳东,朱昌敏,商永婕,黄崇鑫
申请号:CN201610953160.7
申请日:20161103
公开号:CN106570128A
公开日:
20170419
专利内容由知识产权出版社提供
摘要:一种基于关联规则分析的挖掘算法,属于互联网个性化推荐领域。
本发明首先将数据集进行频繁1‑项集的项总数扫描,在产生FP‑Tree之前,对不必要的冗余项先进行删除,减少挖掘量,然后对事务中每个项的提取得到各数据集子集,再使用FP‑Growth算法对各数据集子集进行频繁项挖掘,在挖掘过程中,只保留当前索要挖掘的有用的,必要的信息,省时又省空间。
最后按L‑1的次序对事务数据集的每一列排序,在存在共享前缀的条件下,遍历节点的第一个子女节点就发现相同前缀,根据共享前缀构建FP树。
提高生成FP‑Tree的速度,进而提高生成频繁项集的速度,提高挖掘数据集中关联规则的速度。
申请人:南京邮电大学
地址:210003 江苏省南京市鼓楼区新模范马路66号
国籍:CN
代理机构:南京经纬专利商标代理有限公司
代理人:许方
更多信息请下载全文后查看。