Spark大数据商业实战三部曲:内核解密_商业案例_性能调优

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
nt实战解析 Spark
RDD内部机 制
上篇 内核解密
01
02
03
4.1 Spark Driver Program剖析
04
4.2 DAGScheduler 解析
4 . 3 Ta s k S c h e d u l e r 解析
05
06
4.4 SchedulerBackend
解析
4.5 打通Spark系统运 行内幕机制循环流程
6.4 从Application提 交的角度重新审视 Executor
6.5 Spark 1.6 RPC内幕 解密:运行机制、源码详
解、Netty与Akka等
6.6 本章总结
7.1 概述
7.3 Hash Based Shuffle 7.5 Tungsten Sorted Based
Shuffle
上篇 内核解密
01
1.1 通过RDD实战 电影点评系统入门
及源码阅读
2.1 Spark 2.2综述
2.4 Spark 2.2 Streaming
上篇 内核解密
2 Spark 2.2技术及原理
2.2 Spark 2.2 Core
2.5 Spark 2.2 MLlib
2.3 Spark 2.2 SQL
2.6 Spark 2.2 GraphX
16 电商广告点击大数据实时流处理系 统案例
13 Spark 2.2实战之Dataset开发实战 企业人员管理系统应用案例
15 Spark商业案例之NBA篮球运动员 大数据分析系统应用案例
17 Spark在通信运营商生产环境中的 应用案例
中篇 商业案例
18 使用Spark GraphX实现 婚恋社交网络多维度分析案例
4.6 本章总结
4 Spark Driver启动内幕剖析
上篇 内核解密
5.1 Master启动原理和 源码详解
06
5.6 本章总结
01
02
5.2 Worker启动原理和 源码详解
5.5 Executor执行结果 的处理方式
05
04
03
5.3 ExecutorBackend 启动原理和源码详解
5.4 Executor中任务的 执行
何被Driver管理的
8 Job工作原理和源码详解
8.1 Job到底在 什么时候产生
8.3 Task全生 命周期详解
9.1 Spark中Cache原理和 源码详解
9.2 Spark中checkpoint原 理和源码详解
上篇 内核解密
9 Spark中Cache和checkpoint原理和源码详解
01
中篇 商业案例
01
12.1 通过RDD实现分析电影的用户行为信息
02 1 2 .2 通过RDD实现电影流行度分析
03
12.3 通过RDD分析各种类型的最喜爱电影TopN及性能优化技 巧
04
12.4 通过RDD分析电影点评系统仿QQ和微信等用户群分析及广 播背后机制解密
Spark大数据商业实战三部曲:内 核解密|商业案例|性能调优
演讲人 2021-11-11
目录
01. 上篇 内核解密 02. 中篇 商业案例 03. 下篇 性能调优
01
上篇 内核解密
上篇 内核解密
1 电光石火间体验 Spark 2.2开发实战
1
6 Spark
Application提交给集
6
群的原理和源码详解
5 Spark集群启动原 理和源码详解
5
2
2 Spark 2.2技术及 原理
3
3 Spark的灵魂: RDD和DataSet
4
4 Spark Driver启 动内幕剖析
上篇 内核解密
7 Shuffle原理和源 码详解
1
11 Spark与大数据
其他经典组件整合原
5
理与实战
10 Spark中Broadcast
10.1 Spark中Broadcast原理和源 码详解
02
10.2 Spark中Accumulator原理 和源码详解
上篇 内核解密
10 Spark中Broadcast和Accumulator原理和源码详解
上篇 内核解密
11.1 Spark组 件综合应用
11.2 Spark与 Alluxio整合原理
5 Spark集群启动原理和源码 详解
上篇 内核解密
01
02
03
6.1 Spark Application到底是如
何提交给集群的
04
6.2 Spark Application是如何向
集群申请资源的
05
6wenku.baidu.com3 从Application提 交的角度重新审视 Driver
06
6 Spark Application提交给 集群的原理和源码详解
7 Shuffle原理和源码详解
7.2 Shuffle的框架
7.4 Sorted Based Shuffle
7.6 Shuffle与Storage模块 间的交互
上篇 内核解密
7 Shuffle原理和源码详解
7.7 本章总结
上篇 内核解密
8.2 Stage划分 内幕
8.4 ShuffleMapTask和 ResultTask处理结果是如
解析
上篇 内核 解密
3 Spark的灵魂: RDD和DataSet
https://m.94275.cn/
3.7 Spark RDD 中Runtime流程
解析
01
3.9 基于 D a t a S e t 的 03 代码到底是 如何一步步
转化成为 RDD的
3.8 通过 02 W o r d C o u
上篇 内核解密
01
02
03
3.1 为什么说RDD和 DataSet是Spark的灵

04
3.2 RDD弹性特性七 个方面解析
05
3.3 RDD依赖关系
06
3 Spark的灵魂:RDD和 DataSet
3.4 解析Spark中的 DAG逻辑视图
3.5 RDD内部的计算 机制
3.6 Spark RDD容错 原理及其四大核心要点
与实战
11.3 Spark与 Job Server整合
原理与实战
11.4 Spark与 Redis整合原理与
实战
11 Spark与大数据其他经典组 件整合原理与实战
02
中篇 商业案例
中篇 商业案例
12 Spark商业案例之大数据电影点评 系统应用案例
14 Spark商业案例之电商交互式分析 系统应用案例
和Accumulator原理和
4
源码详解
2
8 Job工作原理和源 码详解
9 Spark中Cache
3
和checkpoint原理
和源码详解
上篇 内核解密
03
1.3 Spark 2.2源
码阅读环境搭建及
源码阅读体验
02
1.2 通过DataFrame
和DataSet实战电影点
评系统
1 电光石火间体验Spark 2.2 开发实战
相关文档
最新文档