信息管理与信息系统专业培养方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《数据仓库与数据挖掘》教学大纲
一、课程名称:数据仓库与数据挖掘
Data Warehouse and Data Mining
二、课程编号:2440
三、学分学时:2学分/ 32学时
四、使用教材:
Han J等箸.范明,孟小明等译.数据挖掘:概念与技术(第二版) .机械工业出版社,2007.
五、课程属性:专业内选修课/ 选修课
六、教学对象:计算机科学与技术专业本科生
七、开课单位:计算机信息工程学院计算机系
八、先修课程:数据库原理
九、教学目标:
本课程是计算机科学与技术专业的专业内选修课程,主要讲授数据仓库和数据挖掘的基本概念、原理和方法。通过学习和实践,使学生了解数据仓库和数据挖掘系统的工作原理,掌握数据仓库的建模方法和数据挖掘中常用技术和方法,通过引导学生阅读参考书,扩大知识面,激发学生的学习兴趣。此外,利用思考题,培养学生的理论思维和解决实际问题的能力。
十、课程要求:
本课程为专业研讨课程。因此本课程采用课程讲授、课堂讨论、课程实验与案例分析等教学方式,实行互动式教学,并积极引导学生通过一些新的应用方向展开研讨。为了解决有限的授课时间与丰富内容之间的矛盾,教学内容应该进行合理剪裁,突出重点、难点知识的讲解,对于其它内容则可以让同学们在课外经过自学掌握。
十一、教学内容:
本课程主要由以下内容组成:
第一章绪论(4学时)
知识要点:
1)数据仓库和数据挖掘产生的背景
2)什么是数据挖掘
3)数据挖掘过程
4)数据挖掘的对象
5)数据挖掘的功能
6)模式的有趣性
7)数据挖掘系统的分类
⏹重点难点:数据挖掘的功能
⏹教学方法:
1)采用启发式教学方式。
2)开展课堂讨论,例如数据仓库与传统数据库系统的对比等。
第二章数据仓库原理(4学时)
⏹知识要点:
1)数据仓库概述
2)多维数据模型
3)数据仓库的系统结构
4)数据仓库的数据组织
⏹重点难点:多维数据模型
⏹教学方法:本章内容面广,采用讲授与自学相结合的办法,引出问题,鼓励学生阅读文献并主动参与课堂讨论。
第三章 OLAP的基本原理及SQL SERVER2000 ANALYSIS SERVICE的使用(4学时)
⏹知识要点:
1)OLAP的基本概念
2)ROLAP 与MOLAP
3)OLAP的设计准则
4)SQL SERVER2000 中OLAP服务器的使用
⏹重点难点:OLAP的基本概念与特点
⏹教学方法:
⏹讲授与自学相结合,主要采用启发式教学方式。
⏹开展课程讨论,例如针对OLTP与OLAP、ROLAP与MOLAP进行讨论。
⏹通过上机实践掌握SQL SERVER2000 ANALYSIS SERVICE的使用,并加深对多维模型的理解及OLAP操作的理解。
第四章数据预处理(2学时)
⏹知识要点:
1)数据预处理的目的
2)数据清洗
3)数据集成和变换
4)数据规约
5)离散化和概念分层的生成
⏹重点难点:常用的数据预处理的方法
⏹教学方法:
1)本章以自学为主,讲授为辅。
2)要求学生选阅读相关资料,然后对数据预处理的方法展开讨论。第五章关联分析(4学时)
⏹知识要点:
1)关联规则挖掘问题的提出背景及一般过程
2)Apriori算法及其改进算法
3)多层关联规则的挖掘
4)从关联规则到相关分析
5)基于约束的关联挖掘
⏹重点难点:Apriori算法
⏹教学方法:
1)讲授+自学
2)对于算法基础较好的学生,可要求编写Apriori算法。
3)案例分析
第六章分类与预测(4学时)
⏹知识要点:
1)分类与预测的基本问题和方法
2)决策树方法
3)其他分类方法
4)预测
⏹重点难点:决策树方法
⏹教学方法:讲授+自学
第七章聚类分析(6学时)
⏹知识要点:
1)什么是聚类分析
2)聚类分析中的数据类型
3)主要聚类方法
4)划分方法:K-均值和K-中心点法
5)层次方法
6)基于密度的方法
7)基于网格的方法
8)孤立点分析
⏹重点难点:常用的聚类方法
1)重点:概念设计及逻辑设计
2)难点:物理设计
⏹教学方法:讲授+自学+上机实践
第八章复杂类型数据的挖掘(4学时)
⏹知识要点:
1)复杂数据对象的多维分析和描述性挖掘
2)空间数据库挖掘
3)多媒体数据库挖掘
4)文本数据库挖掘
5)Web挖掘
⏹重点难点:Web挖掘
⏹教学方法:讲授+自学+讨论
十二、实践环节:
本课程安排的上机实践全部为课外实验。主要内容为学习和掌握要SQL Server Analysis Service的安装和使用、数据仓库建模、多维数据浏览等操作。
十三、教学参考:
1、参考教材
⏹Abraham Silberschatz等著. 杨冬青等译. 数据库系统概念(第4版). 机械工业出版
社,2003
⏹林宇等编著,数据仓库原理与实践,人民邮电出版社,2003
⏹彭木根. 数据仓库技术与实现[M]. 北京:电子工业出版社,2002.6
⏹陈京民.数据仓库原理、设计与应用[M].北京:中国水利水电出版社,2004.4
2、参考文献
⏹Surajit Chaudhuri ,Umeshwar Dayal. An Overview of Data Warehousing and OLAP Technology [M] Microsoft Research, Redmond 2001
⏹胡侃,夏绍玮.基于大型数据仓库的数据采掘.研究综述[J].软件学报,1998,(9).
⏹苏新宁,杨建林,江念年,等.数据仓库与数据挖掘[M].北京:清华大学出版社,2004.4.
⏹张志军,夏传良,宋玲. 基于数据仓库的企业管理决策支持系统[J]. 计算机应用与软件, 2005,(06)
⏹U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, R. Uthurusamy, Advances in Knowledge Discovery and Data Mining. The MIT Press, 1996.
⏹J. Han and M. Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2000.
⏹R. O. Duda, P. E. Hart, and D. G. Stork, Pattern Classification, 2ed., Wiley-Inter-science, 2001.
⏹U. Fayyad, G. Grinstein, and A. Wierse, Information Visualization in Data Mining and Knowledge Discovery, Morgan Kaufmann, 2001
⏹T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer-Verlag, 2001
⏹I. H. Witten and E. Frank, Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann, 2001
⏹V. Ganti, J. Gehrke, R. Ramakrishnan. Mining very large databases. COMPUTER, 32(8):38-45, 1999.
⏹S. Chaudhuri, U. Dayal, and V. Ganti, Database Technology for Decision Support Systems. Computer, 34(12):48-55, Dec. 2001.
3、网络资源
⏹数据挖掘讨论组:/
⏹UCI机器学习数据集:/ml/