大数据分析师培训课程大纲
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据分析师培训课程大纲
在计算机软件编程语言集聚发展的今天,大数据已经牵悄无声息的走进我们的生活,你对大数据了解多少,对大数据分析师培训你了解吗,现在让我们从最基础的开始,学习大数据分析师培训课程大纲。
第一阶段:大数据前沿知识及hadoop入门
1.大数据前沿知识介绍
2.课程介绍
3.Linux及unbuntu系统基础
4.hadoop的单机和伪分布模式的安装配置
第二阶段:Hadoop部署进阶
1.Hadoop集群模式搭建
2.Hadoop分布式文件系统HDFS深入剖析
3.使用hdfs提供的api进行hdfs文件操作
4.Mapreduce概念及思想
第三阶段:大数据导入与存储
1.mysql数据库基础知识
2.hive的基本语法
3.hive的架构及设计原理
4.hive安装部署与案例
5.sqoop安装及使用
6.sqoop组件导入到hive
第四阶段:Hbase理论及实战
1.hbase简介
2.安装及配置
3.hbase的数据存储
4.项目实战
第五阶段:Spark配置及使用场景
1.scala基本语法
2.spark介绍及发展历史
3..spark standalone模式部署
4.spark RDD 详解
第六阶段:spark大数据分析原理
1.Spark内核:基本定义、Spark任务调度
2.Spark Streaming 实时流计算
3.Spark MLlib 机器学习
4.Spark SQL 查询
第七阶段:hadoop+Spark大数据分析
1.实战案例深入解析
2.hadoop+Spark的大数据分析之分类
3.Logistic回归与主题推荐
今天的学习只能到这里了,我能帮助大家的也就这么多了,毕竟凡事还要靠自己,如果你想继续了解大数据分析师培训的相关内容,可以来这里:/