数据挖掘与知识获取
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课程名称:数据挖掘与知识获取
课程编码:C307
课程学分:2
适用学科:计算机应用技术
数据挖掘与知识获取
Data Mining and Knowledge Acquisition
教学大纲
一、课程性质
课程性质为专业选修课,32学时,2学分。
二、课程教学目的
数据挖掘是数据库研究、开发和应用最活跃的分支之一,将从数据库角度全面、系统地学习数据挖掘的基本概念、基本方法和基本技术以及数据挖掘的最新进展。
通过本课程的学习,使学生全面而深入地了解数据库技术的发展和数据挖掘应用的重要性,数据仓库和OLAP(联机分析处理)技术,学习并研究数据预处理技术(包括数据清理、数据集成和转换、数据归纳的方法)、数据挖掘技术(包括分类、预测、关联和聚类等基础概念和技术),先进的数据库系统中的数据挖掘方法、数据挖掘的应用和一些具有挑战性的研究问题。
三、教学基本内容及基本要求
第一章绪论﹙2学时﹚
1、数据挖掘的重要性
2、数据挖掘的定义
3、数据
4、数据挖掘功能
5、数据挖掘分类
第二章数据仓库和数据挖掘的OLAP技术﹙2学时﹚
1、什么是数据仓库
2、多维数据模型
3、数据仓库的系统结构
4、数据仓库的实现
5、从数据仓库到数据挖掘
第三章数据预处理﹙4学时﹚
1、为什么要预处理数据
2、数据清理
3、数据集成和变换
4、数据归约
5、离散化和概念分层生成
第四章数据挖掘原语、语言和系统结构﹙2学时﹚
1、数据挖掘原语
2、一种数据挖掘查询语言
3、数据挖掘系统的结构
第五章概念描述:特征化与比较﹙4学时﹚
1、概念描述
2、数据概化和基于汇总的特征化
3、解析特征化:属性相关分析
4、挖掘类比较:区分不同的类
5、在大型数据库中挖掘描述统计度量
6、讨论
第六章挖掘大型数据库中的关联规则﹙4学时﹚
1、关联规则挖掘
2、由事务数据库挖掘单维布尔关联规则
3、由事务数据库挖掘多层关联规则
4、由关系数据库和数据仓库挖掘多维关联规则
5、由关联挖掘到相关分析
6、基于约束的关联挖掘
第七章分类与预测﹙4学时﹚
1、分类与预测定义
2、用判定树归纳分类
3、贝叶斯分类
4、后向传播分类
5、基于源自关联规则挖掘概念的分类
6、其它分类方法
7、预测
8、分类法的准确性
第八章聚类分析﹙4学时﹚
1、聚类分析定义
2、聚类分析中的数据类型
3、主要聚类方法的分类
4、划分方法
5、层次方法
6、基于密度的方法
7、基于网格的方法
8、基于模型的聚类方法
9、孤立点分析
第九章复杂类型数据的挖掘﹙2学时﹚
1、复杂数据对象的多维分析和描述性挖掘
2、空间数据库挖掘
3、多媒体数据库挖掘
4、时序数据和序列数据的挖掘
5、文本数据库挖掘
6、Web挖掘
第十章应用及发展趋势﹙4学时﹚
1、数据挖掘的应用
2、数据挖掘的发展趋势
四、本课程与其他课程的联系与分工
先行课程:人工智能原理,数据仓库技术
后续课程:无
五、实践环节教学内容的安排与要求
《数据挖掘与知识获取》是一门理论性和实践性都很强的课程,实践性教学环节对该课程尤为重要。
1、选择感兴趣的专题,在课外收集资料,进行研究;
2、利用某一种编程语言,课外编写各种数据挖掘算法程序;
3、利用商品化数据挖掘软件,如Clementine,选择某一个领域,采集大量
的数据,如教务系统的选课记录,研究大量数据中隐藏的规律。
六、本课程课外练习的要求
课内外学时比:1:1
课外上机:16学时
七、本课程的教学方法及使用现代化教学手段方面的要求
以讲授为主,全部使用计算机投影进行教学。
八、本课程成绩的考查方法及评定标准
本课程教学考核采用研究论文的考核办法。要求学生以小组(2-3人为一组)为单位,就数据挖掘的某一专题进行研究、讨论,写出论文,并选择优秀的专题论文由学生在课堂进行讲授。
九、教材及参考书
教材:《数据挖掘—概念与技术》,Jiawei Han,Micheline Kamber,机械工业出版社;
参考书:《数据挖掘与知识发现》,李雄飞,高等教育出版社。
十、课程各章节学时分配
大纲撰写人:李晋宏大纲审阅人:刘文萍责任教授:李也白
系(教研室)主任:李也白
学院负责人:张常年
制(修)定日期:2004年9月1日