大数据导论教学大纲
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据导论
教学大纲
20xx年xx月
前言
一、大纲编写依据
《大数据导论》是一门通识课程,也是数据科学与大数据专业的必要先修课程,面对大一学生开设。通过该课程学习,让学生了解大数据专业的内涵特点、大数据与社会经济发展的关系以及大数据的主要学科知识和课程体系。同时培养学生大数据处理问题的思维,引导学生认知大数据技术。要求学生了解学习大数据需要掌握的基础技术知识,熟悉海量数据处理的基本流程以及与之匹配使用的主要技术和工具。通过本课程的学习,加深学生对大数据的认识,并为后续专业课程打下良好基础。
二、课程目的
1、知识目标
通过课程学习让学生掌握大数据的概念和基本特征、理清大数据、云计算与人工智能的关系,了解大数据与社会各领域的应用关系。并就大数据硬件架构和处理流程及相关技术与工具介绍,让学生了解数据预处理,Hadoop、Spark、Strom、数据存储及数据分析等技术,为后续相关课程做铺垫,让不同专业学生可选择不同方向继续大数据的深入学习。
2、能力目标
(1) 实践能力
通过本课程的学习,培养自我学习和自我设计的意识和能力;培养数据搜集、加工处理和分析的能力;通过合作学习培养沟通交往、团队协作等能力。
(2) 创新能力
通过学习大数据产生促进新应用、新技术、新工具的产生,培养学生的创新精神,在什么情况下可以尽快抓住机会,促进学生将大数据与生活结合起来,培养使用大数据技术解决问题的思维。
三、教学方法
1、课堂教学
(1) 讲授
本课程的教学内容以讲授为主,讲授的主要内容有大数据的基本概念和基本特征、大数据行业必备基础知识、数据采集与预处理方法、大数据存储与管理、大数据计算框架、数据存储技术、数据分析技术,以及大数据与热门行业云计算和人工智能的结合。根据教学大纲的要求,突出重点和难点。
(2) 教师指导下的学生自学
指导学生自主学习大数据热门技术网络爬虫、Hadoop、Spark及Strom。教师通过给出一些相关的实例帮助学生理解和进行程序设计,并布置相应的习题让学生进行练习。
(3) 其它教学方法
尽可能运用动态演示手段进行多媒体辅助教学,解决好教学内容多、信息量大与学时少
的矛盾;充分利用学校的图书馆的资源优势,查阅与课程相关的资料;通过布置课后学习来提高学生对大数据相关技术的认识。
2、课外学习
作业1:完成本书后每章习题。
作业2;练习掌握Hadoop、Spark及Strom安装和简单使用。
四、适用对象
计算机科学、软件工程及信息安全专业等。
五、先修课程及后续课程(或相关课程)
(一)先修课程:无;
(二)后续课程:《Hadoop大数据技术》《数据导入与预处理》《NoSQL数据库原理与应用》《大数据应用开发语言》
六、课程性质
必修。
七、总课时及各章的分配
授课总课时数为32学时,各章的学时具体安排如下:
八、使用教材及主要参考书目
(一)选用教材
自编。
(二)主要参考书目
《大数据导论》
《云计算与大数据技术应用》
九、考核方式及成绩评定标准
1、考核内容与形式
(1) 知识类考核
本课程采用开卷考试形式。重点考试内容:大数据基础知识,大数据、云计算与人工智能的关系,大数据硬件架构,数据采集与预处理方法,Hadoop、Spark及Strom的特点、大
数据存储与管理、数据分析等。
(2) 能力类考核
利用学生平时作业、课堂提问与讨论考查学生的学习能力,理解和掌握相关知识的程度以及实际应用能力。
2、课程成绩构成
(1) 平时成绩占百分比
平时成绩(包括平时考勤、作业情况、课堂表现)占总分60%
(2) 考试成绩占百分比
期末考试成绩占总分40%
第一章大数据概述
第一节什么是大数据
从数据的产生和如何利用大数据的角度来认识大数据产生的原因,从而了解大数据概念。
第二节大数据的数据特征及对科学研究的影响了解大数据时代的4个数据特征,对科学研究的影响以及处理方法。
第三节大数据的数据类型
理解大数据的数据类型,即结构化数据、半结构化数据和非结构化数据。
第四节大数据的价值及相关技术
了解大数据在社会各领域的价值及所使用的技术。
第五节大数据的发展趋势
了解大数据在未来的发展趋势,主要有八种发展趋势。
第二章大数据与云计算
第一节云计算概述
了解云计算的概念和特点。
第二节云计算的主要部署模式
理解云计算主要的部署模式,主要可分为:公有云计算、私有云计算和混合云计算。
第三节云计算的主要服务模式
理解云计算三种服务模式(基础设施即服务IaaS、平台即服务PaaS和软件即服务SaaS)以及它们之间的关系。
第四节云计算与大数据体系架构关系
了解云计算的基础设施以及大数据的基础设施。
第五节物联网、大数据和云计算之间的关系
了解物联网、边缘计算、雾计算以及大数据和云计算之间的关系。
第三章从产业结构来探索大数据技术
第一节大数据产业结构示意图概述
了解大数据的产业结构,以及支持产业结构所需要的技术。
第二节大数据的解决方案
理解大数据的处理方式,以及相应的技术。
第三节大数据采集技术
了解Scrapy爬虫,重点掌握日志采集系统——Flume以及消息采集系统--Kafka。
第四节大数据预处理技术
理解数据预处理流程,重点掌握数据清洗、数据集成、数据规约。
第五节大数据可视化技术
了解数据可视化,以及可视化的分类和所使用的工具。
第四章大数据的硬件架构——集群
第一节集群的来源
了解集群的历史发展及其重要性。
第二节集群的产生促进了大数据技术发展
了解由集群的产生所促进的大数据技术。