信息管理与信息系统专业培养方案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《数据仓库与数据挖掘》教学大纲

一、课程名称:数据仓库与数据挖掘

Data Warehouse and Data Mining

二、课程编号:2440

三、学分学时:2学分/ 32学时

四、使用教材:

Han J等箸.范明,孟小明等译.数据挖掘:概念与技术(第二版) .机械工业出版社,2007.

五、课程属性:专业内选修课/ 选修课

六、教学对象:计算机科学与技术专业本科生

七、开课单位:计算机信息工程学院计算机系

八、先修课程:数据库原理

九、教学目标:

本课程是计算机科学与技术专业的专业内选修课程,主要讲授数据仓库和数据挖掘的基本概念、原理和方法。通过学习和实践,使学生了解数据仓库和数据挖掘系统的工作原理,掌握数据仓库的建模方法和数据挖掘中常用技术和方法,通过引导学生阅读参考书,扩大知识面,激发学生的学习兴趣。此外,利用思考题,培养学生的理论思维和解决实际问题的能力。

十、课程要求:

本课程为专业研讨课程。因此本课程采用课程讲授、课堂讨论、课程实验与案例分析等教学方式,实行互动式教学,并积极引导学生通过一些新的应用方向展开研讨。为了解决有限的授课时间与丰富内容之间的矛盾,教学内容应该进行合理剪裁,突出重点、难点知识的讲解,对于其它内容则可以让同学们在课外经过自学掌握。

十一、教学内容:

本课程主要由以下内容组成:

第一章绪论(4学时)

知识要点:

1)数据仓库和数据挖掘产生的背景

2)什么是数据挖掘

3)数据挖掘过程

4)数据挖掘的对象

5)数据挖掘的功能

6)模式的有趣性

7)数据挖掘系统的分类

⏹重点难点:数据挖掘的功能

⏹教学方法:

1)采用启发式教学方式。

2)开展课堂讨论,例如数据仓库与传统数据库系统的对比等。

第二章数据仓库原理(4学时)

⏹知识要点:

1)数据仓库概述

2)多维数据模型

3)数据仓库的系统结构

4)数据仓库的数据组织

⏹重点难点:多维数据模型

⏹教学方法:本章内容面广,采用讲授与自学相结合的办法,引出问题,鼓励学生阅读文献并主动参与课堂讨论。

第三章 OLAP的基本原理及SQL SERVER2000 ANALYSIS SERVICE的使用(4学时)

⏹知识要点:

1)OLAP的基本概念

2)ROLAP 与MOLAP

3)OLAP的设计准则

4)SQL SERVER2000 中OLAP服务器的使用

⏹重点难点:OLAP的基本概念与特点

⏹教学方法:

⏹讲授与自学相结合,主要采用启发式教学方式。

⏹开展课程讨论,例如针对OLTP与OLAP、ROLAP与MOLAP进行讨论。

⏹通过上机实践掌握SQL SERVER2000 ANALYSIS SERVICE的使用,并加深对多维模型的理解及OLAP操作的理解。

第四章数据预处理(2学时)

⏹知识要点:

1)数据预处理的目的

2)数据清洗

3)数据集成和变换

4)数据规约

5)离散化和概念分层的生成

⏹重点难点:常用的数据预处理的方法

⏹教学方法:

1)本章以自学为主,讲授为辅。

2)要求学生选阅读相关资料,然后对数据预处理的方法展开讨论。第五章关联分析(4学时)

⏹知识要点:

1)关联规则挖掘问题的提出背景及一般过程

2)Apriori算法及其改进算法

3)多层关联规则的挖掘

4)从关联规则到相关分析

5)基于约束的关联挖掘

⏹重点难点:Apriori算法

⏹教学方法:

1)讲授+自学

2)对于算法基础较好的学生,可要求编写Apriori算法。

3)案例分析

第六章分类与预测(4学时)

⏹知识要点:

1)分类与预测的基本问题和方法

2)决策树方法

3)其他分类方法

4)预测

⏹重点难点:决策树方法

⏹教学方法:讲授+自学

第七章聚类分析(6学时)

⏹知识要点:

1)什么是聚类分析

2)聚类分析中的数据类型

3)主要聚类方法

4)划分方法:K-均值和K-中心点法

5)层次方法

6)基于密度的方法

7)基于网格的方法

8)孤立点分析

⏹重点难点:常用的聚类方法

1)重点:概念设计及逻辑设计

2)难点:物理设计

⏹教学方法:讲授+自学+上机实践

第八章复杂类型数据的挖掘(4学时)

⏹知识要点:

1)复杂数据对象的多维分析和描述性挖掘

2)空间数据库挖掘

3)多媒体数据库挖掘

4)文本数据库挖掘

5)Web挖掘

⏹重点难点:Web挖掘

⏹教学方法:讲授+自学+讨论

十二、实践环节:

本课程安排的上机实践全部为课外实验。主要内容为学习和掌握要SQL Server Analysis Service的安装和使用、数据仓库建模、多维数据浏览等操作。

十三、教学参考:

1、参考教材

⏹Abraham Silberschatz等著. 杨冬青等译. 数据库系统概念(第4版). 机械工业出版

社,2003

⏹林宇等编著,数据仓库原理与实践,人民邮电出版社,2003

⏹彭木根. 数据仓库技术与实现[M]. 北京:电子工业出版社,2002.6

⏹陈京民.数据仓库原理、设计与应用[M].北京:中国水利水电出版社,2004.4

2、参考文献

⏹Surajit Chaudhuri ,Umeshwar Dayal. An Overview of Data Warehousing and OLAP Technology [M] Microsoft Research, Redmond 2001

⏹胡侃,夏绍玮.基于大型数据仓库的数据采掘.研究综述[J].软件学报,1998,(9).

⏹苏新宁,杨建林,江念年,等.数据仓库与数据挖掘[M].北京:清华大学出版社,2004.4.

⏹张志军,夏传良,宋玲. 基于数据仓库的企业管理决策支持系统[J]. 计算机应用与软件, 2005,(06)

⏹U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, R. Uthurusamy, Advances in Knowledge Discovery and Data Mining. The MIT Press, 1996.

⏹J. Han and M. Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2000.

⏹R. O. Duda, P. E. Hart, and D. G. Stork, Pattern Classification, 2ed., Wiley-Inter-science, 2001.

⏹U. Fayyad, G. Grinstein, and A. Wierse, Information Visualization in Data Mining and Knowledge Discovery, Morgan Kaufmann, 2001

⏹T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer-Verlag, 2001

⏹I. H. Witten and E. Frank, Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann, 2001

⏹V. Ganti, J. Gehrke, R. Ramakrishnan. Mining very large databases. COMPUTER, 32(8):38-45, 1999.

⏹S. Chaudhuri, U. Dayal, and V. Ganti, Database Technology for Decision Support Systems. Computer, 34(12):48-55, Dec. 2001.

3、网络资源

⏹数据挖掘讨论组:/

⏹UCI机器学习数据集:/ml/

相关文档
最新文档