实践作业2_关联规则

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、练习:关联规则

数据如下:共有4个属性outlook,temperatur,humidity,windy 以及出游决定(play:yes or no)。count表示该条记录共出现的次数。

问题:

(1)为了简化关联规则的学习,将属性humidity重新定义为:humidity<=50 →low, 50

humidity>80 →high。

(2)在(1)基础上,利用Apriori模型找出所有关联规则,结果以支持度降序排列。要求设置最小支持度(support)阈值为

20%,最小置信度(confidence)阈值为90%。

(3)构建分析子流计算一下(2)结果中支持度与置信度均最高的一条关联规则的规则支持度与置信度。

(4)将产生的模型应用到数据流中,在模型后增加表节点,对数据集进行预测。

相关文档
最新文档