浙江大学数据挖掘在线作业

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

您的本次作业分数为:100分单选题

1.【第001章】孤立点挖掘适用于下列哪种场合?

A 目标市场分析

B 购物篮分析

C 模式识别

D 信用卡欺诈检测

正确答案:D

2.【第01章】根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是()。

A 关联分析

B 分类和预测

C 演变分析

D 概念描述

正确答案:B

3.【第01章】数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于()。

A 所涉及的算法的复杂性

B 所涉及的数据量

C 计算结果的表现形式

D 是否使用了人工智能技术

正确答案:B

4.【第01章】下列几种数据挖掘功能中,()被广泛的应用于股票价格走势分析。

A 关联分析

B 分类和预测

C 聚类分析

D 演变分析

正确答案:D

5.【第01章】下列几种数据挖掘功能中,()被广泛的用于购物篮分析。

A 关联分析

B 分类和预测

C 聚类分析

D 演变分析

正确答案:A

6.【第01章】帮助市场分析人员从客户的基本信息库中发现不同的客户群,通常所使用的数据挖掘功能是()。

A 关联分析

B 分类和预测

C 聚类分析

D 孤立点分析

E 演变分析

正确答案:C

7.【第01章】下面的数据挖掘的任务中,()将决定所使用的数据挖掘功能。

A 选择任务相关的数据

B 选择要挖掘的知识类型

C 模式的兴趣度度量

D 模式的可视化表示

正确答案:B

8.【第01章】假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是()。

A 关联分析

B 分类和预测

C 孤立点分析

D 演变分析

E 概念描述

正确答案:E

9.【第02章】下列哪种可视化方法可用于发现多维数据中属性之间的两两相关性?

A 空间填充曲线

B 散点图矩阵

C 平行坐标

D 圆弓分割

正确答案:B

10.【第02章】计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?

A 算术平均值

B 截尾均值

C 中位数

D 众数

正确答案:B

11.【第02章】字段Size = {small, medium, large}属于那种属性类型?

A 标称属性

B 二元属性

C 序数属性

D 数值属性

正确答案:C

12.【第02章】字段Hair_color = {auburn, black, blond, brown, grey, red, white}属于那种属性类型?

A 标称属性

B 二元属性

C 序数属性

D 数值属性

正确答案:A

13.【第03章】哪种数据变换的方法将数据沿概念分层向上汇总?

A 平滑

B 聚集

C 数据概化

D 规范化

正确答案:C

14.【第03章】下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?

A 数据清理

B 数据集成

C 数据变换

D 数据归约

正确答案:A

15.【第03章】()通过将属性域划分为区间,从而减少给定连续值的个数。

A 概念分层

B 离散化

C 分箱

D 直方图

正确答案:B

16.【第03章】数据的噪声是指()。

A 孤立点

B 空缺值

C 测量变量中的随即错误或偏差

D 数据变换引起的错误

正确答案:C

17.【第03章】进行数据规范化的目的是()。

A 去掉数据中的噪声

B 对数据进行汇总和聚集

C 使用概念分层,用高层次概念替换低层次“原始”数据

D 将属性按比例缩放,使之落入一个小的特定区间

正确答案:D

18.【第03章】数据归约的目的是()。

A 填补数据种的空缺值

B 集成多个数据源的数据

C 得到数据集的压缩表示

D 规范化数据

正确答案:C

19.【第03章】下列哪些是数据变换可能涉及的内容?

A 数据压缩

B 数据概化

C 维归约

D 规范化

正确答案:BD

20.【第03章】数据清理的目的是处理数据中的()。

A 空缺值

B 噪声数据

C 不一致数据

D 敏感数据

正确答案:ABC

21.【第03章】下面哪些问题是我们进行数据预处理的原因?

A 数据中的空缺值

B 噪声数据

C 数据中的不一致性

D 数据中的概念分层

正确答案:ABC

22.【第03章】以下哪些原因可能引起空缺值?

A 设备异常

B 命名规则的不一致

C 与其他已有数据不一致而被删除

D 在输入时,有些数据因为得不到重视而没有被输入

正确答案:ACD

23.【第04章】以下哪个范围是数据仓库的数据库规模的一个合理范围?

A 1-100M

B 100M-10G

C 10-1000G

D 100GB-数TB

正确答案:D

24.【第04章】下面的数据操作中,哪些操作不是多维数据模型上的OLAP操作?

A 上卷(roll-up)

B 选择(select)

C 切片(slice)

D 转轴(pivot)

正确答案:B

25.【第04章】平均值函数avg()属于哪种类型的度量?

A 分布的

B 代数的

相关文档
最新文档