2019年公需培训数据挖掘答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据挖掘1、(单选,4分)
以下哪项不属于知识发现的过程?( )
A、数据清理
B、数据挖掘
C、知识可视化表达
D、数据测试
答案:D
2、(单选,4分)
以下哪些不属于数据挖掘的内容?()
A、分类
B、聚类
C、离群点检测
D、递归分析
答案:D
3、(单选,4分)
以下哪个不是常见的属性类型?()
A、A.标称属性
B、数值属性
C、高维属性
D、序数属性
答案:C
4、(单选,4分)
以下哪个度量属于数据散度的描述?()
B、中位数
C、标准差
D、众数
答案:C
5、(单选,4分)
以下哪个度量不属于数据中心趋势度描述?( D )
A、A.均值
B、中位数
C、众数
D、四分位数
答案:D
6、(单选,4分)
对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?( )
A、频繁模式挖掘
B、分类和预测
C、数据预处理
D、噪声检测
答案:C
7、(单选,4分)
聚类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( )
A、K-Means
B、DBSCAN
C、SVM
答案:C
8、(单选,4分)
建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?( )
A、根据内容检索
B、建模描述
C、预测建模
D、寻找模式和规则
答案:C
9、(单选,4分)
当不知道数据所带标签时. 可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?( )
A、分类
B、聚类
C、关联分析
D、隐马尔可夫链
答案:B
10、(单选,4分)
在构造决策树时,以下哪种不是选择属性的度量的方法? ( )
A、信息增益
B、信息增益率
C、基尼指数
D、距离
答案:D
11、(单选,4分)
知识发现流程最核心的步骤是什么? ( )
A、数据挖掘
B、数据预处理
C、模式评估
D、知识表示
答案:A
12、(单选,4分)
将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( )
A、频繁模式挖掘
B、分类和预测
C、数据预处理
D、数据流挖掘
答案:C
13、(单选,4分)
以下哪个度量属于数据中心性的描述?()
A、均值
B、极差
C、众数
D、标准差
答案:A
14、(单选,4分)
类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( )
A、K-Means
B、DBSCAN
C、KNN
D、EM
答案:C
15、(单选,4分)
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题? ( )
A、关联规则发现
B、聚类
C、分类
D、自然语言处理
答案:A
16、(单选,4分)
以下哪些算法是分类算法?( )
A、DBSCAN
B、C4.5
C、K-Mean
D、EM
答案:B
17、(单选,4分)
K-means算法的缺点不包括?( )
A、K必须是事先给定的
B、选择初始聚类中心
C、对于“噪声”和孤立点数据是敏感的
D、可伸缩、高效
答案:D
18、(单选,4分)
机器学习中,下面哪些方法不可以避免分类中的过拟合问题?()
A、增加样本数量
B、增加模型复杂度
C、去除噪声
D、正则化
答案:B
19、(单选,4分)
下面那个不属于知识发现过程。()
A、数据清理与集成
B、数据统计
C、数据挖掘
D、模式评估和知识表示
答案:B
20、(单选,4分)
在构造决策树时,以下那个不属于选择属性的度量? ( )
A、信息增益
B、信息增益率
C、基尼指数
D、信息熵
答案:D
21、(单选,4分)
关于频繁模式,下面哪一个陈述是正确的? ( )
A、K项集频繁则K-1项则必定不频繁
B、K项集频繁则K-1项则必定频繁
C、K项集不频繁则K-1项则必定频繁
D、以上都不正确
答案:B
22、(单选,4分)
DBSCAN算法最大的挑战是? ( )
A、确定聚类个数
B、确定聚类形状
C、确定半径及MINPTS
D、确定评估指标
答案:C
23、(单选,4分)
以下那个不属于分类算法? ( )
A、KNN
B、朴素贝叶斯
C、K-MEANS
D、SVM
答案:C
24、(单选,4分)
以下哪些陈述是不正确的? ( )
A、聚类可以发现数据内部结构
B、聚类可以作为其他任务的预处理