大数据处理与云计算教学大纲20170704

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《大数据处理与云计算》教学大纲

课程类别:专业教育课程课程名称:大数据处理与云计算

开课单位:信息与通信工程学院课程编号:B03050503

课程性质:必修

总学时:44(实验12学时) 学分:2.5

适用专业:信息工程

先修课程:C语言程序设计

大纲编写(修订)时间:2017年5月

一、课程在教学计划中的地位、作用

《大数据处理与云计算》是信息工程专业高年级学生开设的一门专业教育课,也是学生了解大数据和云计算基本原理,掌握高性能并行计算的入门课程。通过本课程的学习,使学生掌握大数据和云计算技术基本原理及其系统的基本架构,使学生从应用角度掌握基于MPI的高性能并行计算基本原理和Hadoop分布式文件存储、分布式数据处理技术。培养学生具有高性能计算集群的开发设计、搭建和应用的基本能力,同时为后续大数据与云计算相关课程的学习奠定扎实的基础。

二、课程目标

1. 理解大数据和云计算技术基础,掌握高性能并行计算的工作原理和技术基础,使学生具有将高性能并行计算技术用于工程的能力;(支撑毕业要求1)

2. 学会高性能计算相关的软件、硬件的配置方法,能够针对工程问题提出以MPI高性能并行计算为核心的解决方案,培养学生的系统设计与开发能力;(支撑毕业要求2、3、5)

3. 了解大数据及云计算的研究热点和发展趋势。(支撑毕业要求12)

三、课程内容及基本要求

第1章云计算与大数据基础

1. 了解云计算的意义,了解云服务的定义和分类;

2. 理解云存储、云桌面、云安全等云技术的技术架构和技术特点;

3. 了解了解大数据的定义和大数据处理的基本流程,了解主要的大数据处理系统;

4. 了解云计算与大数据的发展历程。

第2章云计算与大数据的相关技术

1. 了解云计算与大数据;

2. 了解云计算与物联网;

3. 掌握一致性哈希算法;

4. 了解关系型数据库和非关系型数据库;

5. 了解集群高速通信标准InfiniBand;

6. 理解云计算大数据集群的自组织特性。

第3章虚拟化技术

1. 了解虚拟化技术的发展、优势和劣势及其分类;

2. 掌握VirtualBox,了解VMware Workstation 和KVM等常见虚拟化软件;

3. 理解系统虚拟化,理解服务器虚拟化、桌面虚拟化和网络虚拟化。

第4章集群系统基础

1. 了解集群系统的基本概念和分类;

2. 理解单一系统映射和Beowulf集群;

3. 理解集群文件系统的概念;

4. 掌握分布式系统中计算和数据的协作机制(重点)。

第5章MPI——面向计算的高性能集群技术

1. 掌握Linux 操作系统基本操作;(重点)

2. 了解MPI的定义、架构和特点;

3. 掌握MPICH并行环境的建立方法;(重点、难点)

4. 熟练掌握MPI分布式程序设计;(重点、难点)

5. 掌握MPI消息组成和通信模式;(重点、难点)

6. 掌握并行计算中的规约Reduce操作。(重点、难点)

第6章Hadoop——分布式大数据系统

1 了解Hadoop发展历程;

2掌握HDFS文件的基本结构和存储过程;

3 掌握MapReduce编程框架和基本工作过程。

实验一linux基本操作(2学时)

实验内容:

1. 在PC机上安装linux虚拟机;

2. 在用户主目录下对文件进行操作和管理:复制一个文件、显示文件内容、查找指定内容、排序、文件比较、文件删除等。创建和删除子目录、改变和显示工作目录、列出和更改文件权限、链接文件等;

3. 对vi编辑器进行基本操作。

基本要求

1. 掌握虚拟机的安装;

2. 熟悉linux图形化界面和命令窗口界面;

3. 掌握linux中cd、date、pwd、cal、who、clear、passwd等常用命令;

4. 学习使用vi编辑器建立、编辑、显示及加工处理文本文件。

实验2:在虚拟机环境下搭建3个节点的MPI集群(2学时)

实验内容:

掌握MPI的运行原理,完成在传统计算机上,拥有3个节点的虚拟集群系统搭建,安装配置MPICH并测试程序安装的正确性。

基本要求:

1. 掌握linux下集群网络的配置;

2. 掌握NFS文件系统设置;

3. 掌握MPI的安装及运行的基本命令。

实验3:有消息传递功能的并行程序(2学时)

实验内容:

掌握MPI中点对点的通信原理,由其他进程通过MPI消息传递机制向0进程发送“Hello World”字符串数据,非0进程采用MPI_Send()函数发送数据,0进程通过循环语句分别通过MPI_Recv()函数接收来自其他进程的字符串数据。

基本要求:

1. 理解MPI并行函数执行的具体过程;

2. 掌握MPI编译和运行方法。

3. 理解MPI中进程和总进程数的含义;

4. 掌握消息传递函数及其各参数的意义;

实验4:基于蒙特卡洛方法求π(2学时)

实验内容:

根据蒙特卡罗方法的思想,以坐标原点为圆心作一个直径为2的单位圆,再作一个正方形与此圆相切。在这个正方形内随机产生n个点,根据概率理论,判断是否落在圆内,采用这一方法计算π的近似值。

基本要求:

1. 理解蒙特卡罗方法的思想内涵;

2. 掌握MPI中点对点通信

3. 掌握MPI中的规约操作Reduce函数;

实验5、Hadoop系统的安装配置和MapReduce功能的实现(4学时)

实验内容:

1. 在集群系统中安装并配置Hadoop;

2. 利用MapReduce程序对五个文件中的各个单词出现频率进行统计并输出统计结果。基本要求:

1. 了解Hadoop系统基本架构和工作原理;

2. 学会安装、配置和运行Hadoop系统;

3. 理解Map-Reduce的实现方法。

四、学时分配

表4.1学时分配表

五、课程目标达成的途径与措施

1、考核方式及评价依据

表5.1 各考核方式对不同课程目标评价的比例分配表

表5.2 各考核方式的评价依据

相关文档
最新文档