数据挖掘课程介绍
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课程介绍
数据挖掘是在大型数据库中,自动地发现有用信息的过程,将未加工的数据转换为有用的信息。数据挖掘技术用来探查大型数据库,发现先前未知的有用知识,此外,数据挖掘技术还可以用于预测未来观测结果。本课程将从预测任务和知识发现两个方面的内容对数据挖掘进行介绍,预测任务是根据其他属性的值,预测特定属性的值;知识发现是导出概括数据中潜在联系的模式。
课程安排
4学时:
数据挖掘的基本概念
数据挖掘中的分类技术(基本概念、线性分类器、SVM、交叉验证)
数据挖掘中的聚类分析(基本概念、K均值)
8学时:
数据挖掘的基本概念
数据挖掘中的回归分析(基本概念、线性回归、非线性回归)
数据挖掘中的分类技术(基本概念、线性分类器、SVM、交叉验证、boosting)
数据挖掘中的聚类分析(基本概念、K均值)
16学时:
数据挖掘的基本概念
数据挖掘中的回归分析(基本概念、线性回归、非线性回归)
最优化技术(最速下降法、随机梯度下降法)
实验:使用Scikit-learn进行线性回归
数据挖掘中的分类技术(基本概念、线性分类器、决策树、SVM、交叉验证、boosting)实验:使用Scikit-learn实现文本分类(线性分类器、SVM)
数据挖掘中的聚类分析(基本概念、K-means)
40学时:
数据挖掘的基本概念
线性代数、概率统计
数据与探索数据(数据类型、预处理、相似性和相异性度量、汇总统计、可视化)
回归分析(基本概念、线性回归、非线性回归)
最优化技术(无约束的优化、约束优化、最速下降法、随机梯度下降法)
实验:实现线性回归(使用最速下降法)
分类(基本概念、决策树、模型评估)
分类(基于规则的分类器、最近邻分类器、贝叶斯分类器、人工神经网络、支持向量机、组合方法、不平衡问题)
维归约(PCA、SVD)
实验:最近邻分类器的实现
实验:使用Scikit-learn实现分本分类(线性分类器、SVM、人工神经网络、决策树、随机森林)
聚类分析(基本概念、K-means、层次聚类、簇评估)