2018年硕士研究生入学考试自命题科目考试大纲-817-数据挖掘综合(考试)大纲

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

西南财经大学招收硕士生考试说明及考试大纲

大数据管理

考试科目:数据挖掘

第一部分:考试内容及要求

一. 数据挖掘概述

考试内容

数据挖掘的概念知识发现过程数据挖掘与传统数据分析数据挖掘数据类型数据挖掘功能和模式数据挖掘可利用的技术数据挖掘应用数据挖掘的主要问题

考试要求

1.了解数据库系统技术的演变过程;理解数据挖掘的概念;掌握知识发现过程的7个步骤。

2.理解数据挖掘与传统数据分析的区别;掌握数据挖掘的数据类型;掌握数据挖掘功能和模式;了解数据挖掘可利用的技术;了解数据挖掘的应用领域;了解数据挖掘的主要问题。

二. 数据预处理

考试内容

数据预处理概述数据质量数据预处理的主要步骤数据基本描述统计数据清理数据集成数据变换数据规约数据离散化

考试要求

1.了解进行数据预处理的原因及其重要性;了解数据质量涉及的因素;掌握数据预处理的主要步骤。

2.理解数据的基本统计描述,掌握均值、中位数、众数、极差、四分位数、方差、标准差和四分位数极差的概念和计算方法;了解数据基本统计描述的图形显示。

3.了解数据清理的任务;了解处理数据缺失值的方法;了解处理噪音数据的方法。

4.理解数据集成的概念;掌握冗余和相关性分析的方法(

2

检验,Pearson积矩系数)。

5.了解数据变换的策略;掌握数据规范化的计算方法(最小-最大规范化、z分数规范化、按小数定标规范化)。

6.理解数据规约的概念;了解数据规约的策略;理解数据立方体聚集、属性子集选择、数据压缩、小波变换、主成分分析法等概念;了解线性回归、对数线性模型、直方图、聚类、抽样等数据规约方法。

7.理解数据离散化和概念分层的概念;了解数据离散化的方法(分箱、直方图分析、聚类分析、相关分析);了解数据概念分层的产生方法。

三.数据仓库和联机分析处理

考试内容

相关文档
最新文档