大数据平台方向教学计划
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据平台课程标准
一、课程定位
现在企业为了提升客人使用体验,提高业务效率,在大数据蓬勃发展的阶段里,需要对现有业务系统进行转型升级;作为大数据载体,大数据平台工程师应用成为有大量数据的企业必备人才。
随着大数据应用的大量普及,开源框架,比如hadoop,spark等,也得到长足发展。本课程着力于系统数据的收集和搭建技术,使得作为大数据的研发/分析带来基础设施,让学员掌握;并通过本课程,掌握大数据平台的理念,为将来在不同企业使用各种基础设施的搭建和维护指明方向。
二、课程性质与作用
课程性质大数据平台搭建核心课程。
课程作用
大数据平台搭建核心课程,是整个大数据中基础的一环。在实际工作中,掌握本技术是是大数据方向的重要的岗位,即大数据平台工程师。在后续的大数据研发及大数据分析中,必须要在大数据平台搭建完成后才能在真实生产环境运行。本课程会涉及到其余的计算机知识,比如Linux操作系统、数据库、集群等知识。学习完本科课程之后,为了巩固和提高对大数据平台搭建的理解,在后续课程中加入有实际生产环境的搭建过程并验证。
三、课程目标
课程教学以生产环境搭建为目标,以实际项目为中心,以合理知识结构分解为手段,在理解大数据平台架构的过程中,主要以实际操作让学员对相关知识点掌握,达到理论与实际结合,教学与企业融合的内容。学员学成后,能够利用流程的大数据平台框架大家生产环境,并且在企业相关架构选择有微调时,能够触类旁通,也能完成搭建任务。课程内容始终围绕全面提升学生的理论和操作的熟练程度、规范化程度以及职业素质三个方面展开。
(一)知识目标
1.理解大数据概念及应用场景,先导课程Linux的操作
2.掌握大数据HDFS、HBase、Hadoop集群搭建及数据批处理。
3.熟练掌握Spark搭建并能够验证运行。
4.熟练掌握Storm搭建并掌握流处理概念。
5.Hadoop生态其他组件的安装和应用,Yarn &zookeeper。
6.离线工具ETL和hive的安装及应用。
(二)能力目标
1.全局的眼光理解大数据,理解大数据的应用,并有总体的概念。
2.理解企业中实际生产环境的大数据搭建,收集,分析,应用的过程。
3.具备在实际应用中,针对技术框架的微调,能够应对并能够调试验证成功。
四、课程设计
主要指课程设计的总体思路:
课程设计围绕大数据基础设施的搭建,并考虑到实际企业生产环境中的应用场景,从先导知识,基础知识,生态知识及扩展知识。
课程案例选取:
以搭建支持10GB的数据为目标,在目标3机器上部署大数据仓库,并能实际运行。模拟手机1GB的数据,能够通过Hive进行查询,为将来数据清洗和数据分析提供基础。
五、考核标准
本课程属于实践性、应用性比较强的课程,所以要加强过程性检查,每个学员均需要单独在实际环境中配置系统,并能够验证系统所有功能。
考核课程中提供100G的大系统数据,然后倒入到环境,然后进行查询和分析。