研究生《大数据技术原理》教学大纲
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《大数据技术原理》教学大纲
Big Data Technology
第一部分大纲说明
1. 课程代码:
2. 课程性质:专业非学位课
3. 学时/学分:20/2
4. 课程目标:本课程以大数据处理技术为主题,旨在让学生理解掌握大数据相关的基础知识及核心技术。掌握大数据处理的概念、大数据处理架构、分布式文件系统、分布式数据库、NoSQL数据库和分布并行Map/Reduce编程模型及编程方法等。课程强调融合云计算技术、大数据处理技术和分布并行编程为一体,力图反映大数据处理领域的最新成就和发展趋势。学生除完成基本理论课程学习外,课程将通过在大数据系统平台上的实践,学习和掌握大数据的基础知识。
5. 教学方式:课堂讲授、实验、自学与讨论相结合
6. 考核方式:考试+平时+实验
7. 先修课程:JAVA程序设计
9. 教材及教学参考资料:
(一)教材:
《大数据技术原理与应用》人民邮电出版社主编林子雨
(二)教学参考资料:
[1] 深入理解大数据,黄宜华,机械工业出版社
第二部分教学内容和教学要求
第一章课程介绍及大数据概述
教学内容:
对于课程的基本介绍,包括课程特色、教材介绍、篇章安排、主讲教师和助教等,介绍大数据发展历程、基本概念、主要影响、应用领域、关键技术、计算模式和产业发展,并阐述了云计算、物联网的概念及其与大数据之间的紧密关系。
教学要求:
了解大数据课程要求,特色,教学安排以及答疑安排,了解大数据发展历程、基本概念、应用领域、关键技术等。
第二章大数据处理架构Hadoop
教学内容:
介绍Hadoop的发展历史、重要特性和应用现状,并详细介绍Hadoop项目结构及其各个组件,最后,演示如何在Linux操作系统下安装和配置Hadoop。
教学要求:了解hadoop特性和应用,掌握hadoop的项目结构及组件构成以及hadoop的安装配置等技术。
第三章分布式文件系统HDFS
教学内容:
介绍分布式文件系统的基本概念、结构和设计需求,然后介绍Hadoop分布式文件系统HDFS,详细阐述它的重要概念、体系结构、存储原理和读写过程,最后,介绍了一些HDFS 编程实践方面的知识。
教学要求:了解分布式文件系统的基本概念、结构和设计需求,掌握HDFS的概念,体系结构、存储原理和读写过程,熟练掌握HDFS编程实践技术。
第四章分布式数据库HBase
教学内容:
介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识。
教学要求:熟练掌握HBASE的原理和工作机制、掌握HBASE的编程实现技术。
第五章NoSQL数据库
教学内容:
介绍NoSQL兴起的原因,比较NoSQL数据库与传统的关系数据库的差异;然后,介绍NoSQL数据库的四大类型以及NoSQL数据库的三大基石;最后,简要介绍与NoSQL数据库同样受到关注的NewSQL数据库。
教学要求:熟悉NoSQL数据库的特点以及与传统数据库的差异,构建NoSQL数据库的技术基础,理解新兴的NewSQL数据库等。
第六章云数据库
教学内容:介绍云数据库的概念、特性及其与其他数据库的关系,然后,介绍云数据库的代表性产品和厂商,最后,以阿里云数据库RDS为实例演示如何使用云数据库。
教学要求:了解云数据库的概念,产品等,掌握如何使用云数据库。
第七章MapReduce编程
教学内容:介绍MapReduce模型,阐述其具体工作流程,并以单词统计为实例介绍MapReduce程序设计方法,同时,还介绍了MapReduce的具体应用,最后讲解MapReduce 编程实践
教学要求:理解MapReduce模型原理机制与工作流程,掌握MapReduce程序设计方法和编程实践。
编写人:张晓琳审核人:杜永兴