集团大数据平台总体设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

集团大数据平台总体设计

目录

1综述 ------------------------------------------------------------------------------------------------ 4

1.1项目背景 --------------------------------------------------------------------------------------------- 4

1.2建设目标 --------------------------------------------------------------------------------------------- 4

1.3需求分析 --------------------------------------------------------------------------------------------- 4

基础平台------------------------------------------------------------------------------------------ 5

企业画像应用 ----------------------------------------------------------------------------------- 6

2总体建设方案 ----------------------------------------------------------------------------------- 7

2.1平台框架设计理念 -------------------------------------------------------------------------------- 7

2.2功能架构 --------------------------------------------------------------------------------------------- 8

2.3技术架构 --------------------------------------------------------------------------------------------- 9

2.4产品覆盖综述------------------------------------------------------------------------------------- 10

2.5数据分布架构------------------------------------------------------------------------------------- 11

2.6关键技术说明------------------------------------------------------------------------------------- 11

云服务平台------------------------------------------------------------------------------------- 11

Hadoop平台------------------------------------------------------------------------------------ 23

元数据管理------------------------------------------------------------------------------------- 24

数据治理---------------------------------------------------------------------------------------- 31

爬虫引擎---------------------------------------------------------------------------------------- 36

数据探索---------------------------------------------------------------------------------------- 40

自助分析---------------------------------------------------------------------------------------- 41

企业画像---------------------------------------------------------------------------------------- 42

3技术方案特性 --------------------------------------------------------------------------------- 45

3.1平台开放性 ---------------------------------------------------------------------------------------- 45

3.2高性能----------------------------------------------------------------------------------------------- 46

应用高性能------------------------------------------------------------------------------------- 46

平台系统资源高性能 ----------------------------------------------------------------------- 46

实时数据抽取 --------------------------------------------------------------------------------- 47

压缩流处理------------------------------------------------------------------------------------- 48

库外处理与计算 ------------------------------------------------------------------------------ 48

分布式处理------------------------------------------------------------------------------------- 51

多网卡支持------------------------------------------------------------------------------------- 52

3.3高可用性 ------------------------------------------------------------------------------------------- 54

Hadoop平台高可用性----------------------------------------------------------------------- 54

ETL高可用性 ---------------------------------------------------------------------------------- 58

应用高可用性 --------------------------------------------------------------------------------- 59

3.4高可靠性 ------------------------------------------------------------------------------------------- 60

3.5开发易用性 ---------------------------------------------------------------------------------------- 61

3.6可维护性 ------------------------------------------------------------------------------------------- 66

3.7弹性扩展能力------------------------------------------------------------------------------------- 70

3.8资源管控能力------------------------------------------------------------------------------------- 71

多租户资源管控 ------------------------------------------------------------------------------ 71

相关文档
最新文档