《数据分析与挖掘实践》课程教学大纲
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《数据分析与挖掘实践》课程教学大纲
一、课程基本信息
课程编号:sk301
课程名称:数据分析与挖掘实践
英文名称:Data Analysis And Mining Practice
课程类型:实践教学
课程要求:必修
学时/学分:2周/2
先修课程:数据分析与挖掘算法、Python语言程序设计
后续课程:大数据项目综合实践、毕业设计
适用专业:数据科学与大数据技术
二、课程描述
本课程是“数据分析与挖掘算法”课程的集中实践和技能训练课程,旨在引领学生巩固、拓展数据分析与挖掘算法课程的基本学习算法,加深对数据分析和挖掘过程的理解。
选择适当的开发工具和环境,借助电商日志分析项目开发透彻理解和掌握数据挖掘分析、设计、开发的过程;利用Hadoop大数据技术体系,实现海量数据的分布存储、分析和计算,以及分析结果的可视化展现。
通过项目实现,使学生理解KPI文件分析的概念,能熟练应用MapReduce;深入理解大数据和数据挖掘的基本概念,并能利用分布式Hadoop进行大数据的存储和处理;能熟练地利用MapReduce和Hive,进行数据的分析和挖掘,并进行配置和管理;进一步培养独立分析问题、解决问题的能力,以及大数据应用项目的工程化开发能力。
三、教学目标
1. 能利用数据分析和挖掘算法的基本理论对具有大数据背景的实际案例进行分析,并根据分析结果总结其适用的数据分析和挖掘方法。
(支持毕业能力要求2)
2.能够大数据背景的实际工程需求,选择恰当的数据分析和挖掘方法及提出合理的解决方案。
(支持毕业能力要求3)
3. 能熟练配置和安装Hadoop、MapReduce和Hive环境,选择合适的程序语言解决大数据领域的工程问题。
(支持毕业能力要求5)
4. 能够对数据挖掘获得的结果进行分析,并进一步研究其不同结果的解决措施。
(支持毕业能力要求4)
四、教学内容、安排及与教学目标的对应关系
1. 一般性安排见表1。
2. 变更
掌握程度较好的项目组,可在完成表1指定项目之后,可根据项目实验结果的分析进行进一步的改进实验,但应在变更前向指导教师申明。
五、教学方法
数据分析与挖掘实践采用案例教学的方法、分组协作的形式进行教学。
(1) 采用电商日志分析项目,引导学生利用数据分析与挖掘方法进行项目的分析、设计。
(2) 采用分组协作方式,实现系统的分析、设计及Python语言编码、调试,在此过程中,教师会根据学生的项目执行情况进行辅导。
(3) 采用答辩和报告的形式分析、总结其实践项目的数据分析和挖掘结果。
六、考核与成绩评定
1. 成绩及其组成
总成绩采取百分制,由阶段考核、程序质量、答辩成绩和实验报告四部分构成。
其中,阶段考核成绩占比10%,程序质量30%,答辩成绩占40%、实验报告成绩占比20%。
2. 评价形式与方法
各部分基本考核形式及评价方法如下:
(1)阶段考核,通过提问,代码检查的方式考查设计过程中能否按时完成阶段设计任务。
主要依据各阶段完成任务情况评分。
(2)程序质量,主要考核系统功能、界面设计、运行情况,着重考核算法设计是否正确合理,程序结构是否清晰,编码是否规范等。
主要依据上述几项指标达成情况进行评分。
(3)答辩,主要考核能否正确地描述项目分析、设计、实现中所涉及的问题,以及相应的解决方案。
主要以回答问题思路清晰,叙述正确,语言流畅进行评分。
(4)实验报告,学生撰写自选应用程序实验报告。
依据实验报告的规范性,内容完整性进行评分。
3. 说明
(1)提倡充分讨论、交流,但成果须独立完成。
应用程序存在雷同回答时,所有雷同答案均不得分。
(2)存在旷课、迟到早退、玩游戏等情况时,每次扣2分,6次以上总成绩以50分计。
七、教学资源
1. 参考书
[1] (美)汤姆怀特.Hadoop权威指南:大数据的存储与分析.清华大学出版社,2017.。