大数据实训方案
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据实训教学大纲
1 / 5
一、实训目标
基于Hadoop为核心,通过实训,达成以下目的:
➢➢➢➢➢
➢➢
➢
➢认识大数据,认识大数据技术在新时代对企业的重要性。
掌握 Linux的基础知识和应用
掌握hadoop集群环境的搭建。
熟悉HDFS分布式文件系统的原理,掌握HDFS的API的开发。
通过实际案例的开发,了解MapReduce原理,掌握MapReduce的开发技术。
了解Hive,学习Hive集群的搭建。
掌握Hive的DML和DDL相关技术。
认识ZooKeeper,学些ZooKeeper集群的搭建,了解ZooKeeper在Hadoop集群中的作用。
了解HBase原理和架构,掌握HBase API编程,掌握HBase数据的导入和导出。
通过综合案例实践,掌握Hadoop以及相关框架的开发和应用。
二、实训课程内容介绍
1、课程大纲
训
3 / 52、通过案例初步认识大数据
Linux入门1、Linux简介、安装
2、常用命令
3、文件权限及操作
4、用户及权限管理
5、Linux下搭建Java开发环境
Hadoop入门1、Hadoop介绍
2、Hadoop安装配置
3、hadoop初始化和测试
4、配置ssh免密码登陆配置和ssh原理
HDFS 1、HDFS原理
2、HDFS的shell操作
3、HDFS原理
4、HDFS的java接口
5、Hadoop RPC
6、HDFS读取数据过程
技术速成
Map-Reduce 技术培训
1、MR介绍
2、WordCount执行流程和代码编写
4 / 5
5 / 5。