136042-数据仓库与数据挖掘-专业课教学大纲
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
菏泽学院计算机学院
《数据仓库与数据挖掘》课程教学大纲
课程编号:136042
课程名称:数据仓库与数据挖掘/Data Warehouse and Data Mining Technology
课程类别:专业方向课
课程总学时/学分:80/4(实践80学时,任务驱动方式融入教学内容)
适用对象:计算机科学技术.NET方向
一、课程简介
数据仓库与数据挖掘技术出现于20世纪80年代,90年代有了突飞猛进的发展,并可望在新的千年继续繁荣。数据仓库与数据挖掘是一个多学科领域,从多个学科汲取营养。这些学科包括数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统、知识获取、信息检索、高信能计算和数据可视化。
二、教学目的和任务
根据学校“一体两翼,三经四纬,五个保障”的宏观人才培养模式,以及计算机类专业人才培养方案要求,通过本课程学习,使学生能对数据仓库和数据挖掘的基本方法和基本概念有整体的了解,掌握建立数据仓库的原理和方法,从理论上掌握数据仓库、OLAP联机分析的基本概念、原理、主要算法及应用系统解决方案,熟练掌握数据挖掘的关联规则,分类方法,聚类方法等算法,并能够在软件开发过程中熟练掌握这些方法加以应用。
三、教学基本要求
本课程的内容从知识、素质、能力、德、智、体、美七个维度形成教学内容方阵,每一次课一般安排3-5个知识点,从七个维度组织内容,分课内、课外开展教学。
素质养成主要包括以下内容:
1.思想政治素质
具有中国特色社会主义共同理想,秉承社会主义核心价值观;具有爱国主义精神;具有责任心和社会责任感。
2.文化科技素质
具有不断更新知识和自我完善的能力;具有持续学习和终身学习的能力;具有一定的创新意识、创新精神和创新能力;具有一定的人文和艺术素养;具有良好的人际沟通能力。
3.专业素质
掌握数据仓库与数据挖掘基本知识;具有一定数据挖掘与数据分析能力,利用数据挖掘基本知识、基本技能,解决实际问题的能力。
4.职业素质
具有良好的职业道德和职业操守;具有较强的组织观念和集体意识; 有耐心,精益求精,有着良好数据分析能力。
5.身心素质
具有人文素养、审美能力、团结协作精神,具有健康的体魄和良好的心理素质,社会适应能力。
能力训练:集中训练学生解决问题、分析问题能力、逻辑思维能力。
德育:贯彻课程思政精神,由于数据仓库与数据挖掘其本身就是数学与计算机的交叉应用,来源于实践最终落地于实践,与深度学习和机器学习等人工智能基础课程息息相关,是集我们的人生观、世界观、方法论于一体的,在学习中能结合知识点开展文化、思想、政治等教育。
智育:主要体现在知识点的难点重点的学习能力培养,创新能力的启迪与激发。
体育:主要培养学生的身心健康,阳光心态,问题分析过程,耐得住寂寞,经得了加班,要有体力还要有毅力。
美育:通过数学之美来培养学生欣赏美、创造美的素养,让学生爱上数据挖掘,体会数据的魅力!
四、教学内容与学时分配
第1章数据仓库概述(2学时)
1.1 数据仓库及其历史
1.2 数据仓库及其开发工具
1.3 数据仓库系统开发工具
1.4 数据仓库与操作型数据库的关系
1.5 商务智能与数据仓库关系
知识点:数据仓库概念、数据仓库及其开发工具、数据仓库系统开发工具、数据仓库与操作型数据库的关系、商务智能与数据仓库关系
重点:数据仓库与操作型数据库的关系、商务智能与数据仓库关系
难点:数据仓库与操作型数据库的关系、商务智能与数据仓库关系
第2章数据仓库设计(4学时)
2.1 数据仓库设计概述
2.2 数据仓库的规划和需求分析
2.3 数据仓库建模
2.4 数据仓库的物理模型设计
2.5 数据仓库的部署和维护
2.6 数据仓库设计示例
知识点:数据仓库构建模式、数据仓库规划与需求分析、多维数据模型及实现、数据存储结构、数据仓库部署、数据仓库维护。
重点:数据仓库规划与需求分析、多维数据模型及实现、数据存储结构、数据仓库部署
难点:数据仓库规划与需求分析、多维数据模型及实现、数据存储结构、数据仓库部署、数据仓库维护。
第3章OLAP技术(4学时)
3.1 OLAP概述
3.2 OLAP的多维数据模型
3.3 OLAP实现
知识点:OLAP概念、OLAP与OLTP区别与联系、多维数据模型定义、OLAP实现
重点:OLAP与OLTP区别与联系、多维数据模型定义、OLAP实现
难点:多维数据模型定义、OLAP实现第
4章数据挖掘概述(4学时)
4.1 什么是数据挖掘
4.2 数据挖掘系统
4.3 数据挖掘过程
知识点:数据挖掘定义,数据挖掘知识表示,数据挖掘对象,数据挖掘系统,数据清理,数据集成,数据变换,数据归约。
重点:数据挖掘知识表示,数据挖掘对象,数据清洗,数据集成,数据变换,数据归约
难点:数据清理,数据集成,数据变换,数据归约
第5章关联分析(8学时)
5.1 关联分析概念
5.2 Aprior算法
5.3 频繁项集的紧凑表示
5.4 多层关联规则挖掘
知识点:事务数据库,关联规则及其度量,频繁项集,挖掘关联规则的基本过程,Apriori 算法,频繁项集,多层关联规则的挖掘,多层关联规则的挖掘算法。
重点:关联规则及其度量,频繁项集,Apriori算法,频繁项集,多层关联规则的挖掘。难点:频繁项集,Apriori算法,频繁项集。
第6章序列模式挖掘(12学时)
6.1 序列模式挖掘概述
6.2 Apriori算法
6.3 模式增长框架的序列挖掘算法
知识点:序列数据库,序列模式挖掘算法,Apriori类算法,模式增长框架的序列挖掘算法。
重点:序列模式挖掘算法,Apriori类算法
难点:Apriori类算法,模式增长框架的序列挖掘算法
第7章分类方法(16学时)
7.1 分类过程
7.2 K-最近邻分类算法
7.3 决策树分类算法
7.4 贝叶斯分类算法
知识点:学习阶段、分类阶段、K-最近邻分类算法,决策树,建立决策树的ID3算法,贝叶斯分类。
重点:K-最近邻分类算法,决策树,贝叶斯分类。
难点:K-最近邻分类算法,决策树,贝叶斯分类。
第8章回归分析和时序挖掘(16学时)
8.1 回归分析和时序挖掘
8.2 逻辑回归分析
8.3 时序分析模型