(3种算法)数据仓库与数据挖掘

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三.综合题

第一类:给定一个表的结构及数据,计算每个决策属性的信息增益(请同学们掌握该方法,不同的试题中给定的表结构及数据是不同的)

例一:假设有如下的“雇员基本信息”表的结构及数据,其中属性“工资”为类别标识属性,属性“部门”、“职位”、“年龄”作为决策属性集。

第一种出题形式:请计算每个决策属性“部门”、“职位”、“年龄”的信息增益。第二种出题形式:建立决策树,并产生IF-THEN规则。

第二类:利用Apriori算法寻找事务集中的频繁项集,并由找到的频繁项集产生强关联规则。(请同学们掌握该方法,不同的试题中给定的事务集是不同的)

例一:假设现有如下表所示的一个事务数据库,数据库中有10个事务,即|D|=10。假定最小支持度minsup=20%,最小置信度minsup=65%,利用Apriori算法寻找D中的频繁项集,并由找到的频繁项集产生强关联规则。(另外请同学们自己复

第三类:利用简单贝叶斯分类对数据进行分类(请同学们掌握该方法,不同的

试题中给定的表结构及数据是不同的)

例一:假设有如下的“雇员基本信息”表的结构及数据,其中属性“工资”为类别标识属性,类别标识有3个取值(C1、C2、C3),属性“部门”、“职位”、“年龄”作为决策属性集,请利用贝叶斯简单分类方法对未知数据:

X=(部门=‘系统部’,职位=‘高级’年龄=‘21…30’)进行分类。(另外请同

相关文档
最新文档