数据挖掘考试题库
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、填空题
1.Web挖掘可分为、和3大类。
2.数据仓库需要统一数据源,包括统一、统一、统一和统一数据特征
4个方面。
3.数据分割通常按时间、、、以及组合方法进行。
4.噪声数据处理的方法主要有、和。
5.数值归约的常用方法有、、、和对数模型等。
6.评价关联规则的2个主要指标是和。
7.多维数据集通常采用或雪花型架构,以表为中心,连接多个表。
8.决策树是用作为结点,用作为分支的树结构。
9.关联可分为简单关联、和。
10.BP神经网络的作用函数通常为区间的。
11.数据挖掘的过程主要包括确定业务对象、、、及知识同化等几个步
骤。
12.数据挖掘技术主要涉及、和3个技术领域。
13.数据挖掘的主要功能包括、、、、趋势分析、孤立点分析和偏
差分析7个方面。
14.人工神经网络具有和等特点,其结构模型包括、和自组织网络
3种。
15.数据仓库数据的4个基本特征是、、非易失、随时间变化。
16.数据仓库的数据通常划分为、、和等几个级别。
17.数据预处理的主要内容(方法)包括、、和数据归约等。
18.平滑分箱数据的方法主要有、和。
19.数据挖掘发现知识的类型主要有广义知识、、、和偏差型知识五种。
20.O LAP的数据组织方式主要有和两种。
21.常见的OLAP多维数据分析包括、、和旋转等操作。
22.传统的决策支持系统是以和驱动,而新决策支持系统则是以、建
立在和技术之上。
23.O LAP的数据组织方式主要有和2种。
24.SQL Server2000的OLAP组件叫,OLAP操作窗口叫。
25.BP神经网络由、以及一或多个结点组成。
26.遗传算法包括、、3个基本算子。
27.聚类分析的数据通常可分为区间标度变量、、、、序数型以及混合
类型等。
28.聚类分析中最常用的距离计算公式有、、等。
29.基于划分的聚类算法有和。
30.C lementine的工作流通常由、和等节点连接而成。