2013秋浙江大学数据挖掘作业必做在线要点

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.置信度(confidence)是衡量兴趣度度量()的指标。

A 简洁性

B 确定性

C 实用性

D 新颖性

正确答案:B

单选题

2.哪种OLAP操作可以让用户在更高的抽象层,更概化的审视数据?

A 上卷

B 下钻

C 切块

D 转轴

正确答案:A

单选题

3.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。

A 关联分析

B 分类和预测

C 聚类分析

D 演变分析

正确答案:A

单选题

4.下列哪个描述是正确的?

A 分类和聚类都是有指导的学习

B 分类和聚类都是无指导的学习

C 分类是有指导的学习,聚类是无指导的学习

D 分类是无指导的学习,聚类是有指导的学习

正确答案:C

5.计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?

A 算术平均值

B 截尾均值

C 中位数

D 众数

正确答案:B

单选题

6.规则:age(X,”19-25”) ∧buys(X, “popcorn”) => buys(X, “coke”)是一个()。

A 单维关联规则

B 多维关联规则

C 混合维关联规则

D 不是一个关联规则

正确答案:B

单选题

7.假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是()。

A 关联分析

B 分类和预测

C 孤立点分析

D 演变分析

E 概念描述

正确答案:E

单选题

8.下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?

A 数据清理

B 数据集成

C 数据变换

D 数据归约

正确答案:A

单选题

9.进行数据规范化的目的是()。

A 去掉数据中的噪声

B 对数据进行汇总和聚集

C 使用概念分层,用高层次概念替换低层次“原始”数据

D 将属性按比例缩放,使之落入一个小的特定区间

正确答案:D

单选题

10.平均值函数avg()属于哪种类型的度量?

A 分布的

B 代数的

C 整体的

D 混合的

正确答案:B

单选题

11.下面哪种分类方法是属于统计学的分类方法?

A 判定树归纳

B 贝叶斯分类

C 后向传播分类

D 基于案例的推理

正确答案:B

单选题

12.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。

A 关联分析

B 分类和预测

C 聚类分析

D 演变分析

正确答案:A

单选题

13.支持度(support)是衡量兴趣度度量()的指标。

A 实用性

B 确定性

C 简洁性

D 新颖性

正确答案:A

单选题

14.以下哪个范围是数据仓库的数据库规模的一个合理范围?

A 1-100M

B 100M-10G

C 10-1000G

D 100GB-数TB

正确答案:D

单选题

15.下面那种数据挖掘方法可以用来检测孤立点?

A 概念描述

B 分类和预测

C 聚类分析

D 演变分析

正确答案:C

单选题

16.字段Hair_color = {auburn, black, blond, brown, grey, red, white}属于那种属性类型?

A 标称属性

B 二元属性

C 序数属性

D 数值属性

正确答案:A

单选题

17.下面哪种分类方法是属于神经网络学习算法?

A 判定树归纳

B 贝叶斯分类

C 后向传播分类

D 基于案例的推理

正确答案:C

单选题

18.哪种数据变换的方法将数据沿概念分层向上汇总?

A 平滑

B 聚集

C 数据概化

D 规范化

正确答案:C

单选题

19.下面的数据挖掘的任务中,()将决定所使用的数据挖掘功能。

A 选择任务相关的数据

B 选择要挖掘的知识类型

C 模式的兴趣度度量

D 模式的可视化表示

正确答案:B

单选题

20.孤立点挖掘适用于下列哪种场合?

A 目标市场分析

B 购物篮分析

C 模式识别

D 信用卡欺诈检测

正确答案:D

单选题

21.下面的数据操作中,哪些操作不是多维数据模型上的OLAP操作?

A 上卷(roll-up)

B 选择(select)

C 切片(slice)

D 转轴(pivot)

正确答案:B

单选题

22.下列哪种可视化方法可用于发现多维数据中属性之间的两两相关性?

A 空间填充曲线

B 散点图矩阵

C 平行坐标

D 圆弓分割

正确答案:B

单选题

23.根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是()。

A 关联分析

B 分类和预测

C 演变分析

D 概念描述

正确答案:B

单选题

24.下列几种数据挖掘功能中,()被广泛的应用于股票价格走势分析。

A 关联分析

B 分类和预测

C 聚类分析

相关文档
最新文档