数据中间层结构图

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据中间层功能简介

简介

曙光数据中间层分为分析平台、存储平台、监控平台,为所有应用的支撑中心,整个中间层可以实现集群资源调度,分配,以实现计算资源最大化,集群利用最大化。

中间层结构图

分析平台

结构图

分析平台

简介

分析平台内含大量分析任务功能,如常用ETL工具,智能分析工具,可以完成用户对数据常用的各种操作,底层实现方式多样化,可以实现spark内存是计算迭代和mapreduce编程处理。

运行流程

作业包

简介

作业包为各种分析作业的存放目录,包含各种分析功能jar,包括常见的关联作业,去重作业等,以一个个独立项目形式存在,每个项目可以完好的衔接。

结构图

包含作业包

任务解析组件

简介

任务解析组件主要是将用户相关操作映射成树状结构,并将对应的配置生成操作—xml 文件之间的映射。

功能列表

调度中心

简介

调度中心任务为分析平台的核心组件,包括解析组件,驱动组件,对外开放组件,可以分析不同的任务并转换为作业形式,完成各种分析功能。

存储查询平台

结构展示图

存储查询平台

简介

存储平台目的是为了将各种分析后的数据进行统一管理,提供表适配,数据入库,查询等一系列数据管理功能。

表适配

类型

表适配分为hbase表适配,hive表适配

功能图

流程图

查询组件功能图

查询类型

自动化入库

简介

自动化入库用处为:根据目录将新增的用户数据存入对应的hbase表中交互流程

开放接口

功能图

监控平台

结构展示图

监控平台

简介

监控平台主要用于监控作业状况、集群资源、数据资源等,并提供报警服务功能。作业监控

简介

作业监控为监督集群运行的任务,并提供借口给予外部服务调用展示

结构图

功能

数据监控

简介

数据监控包括对数据入数据中心及对数据一系列操作的记录,其中包括部分:

1.数据入库监控(包括入库条数,入库错误比对等)

2.数据入库操作监控(包括数据存储目录,数据权限,数据操作记录)

功能

报警系统

简介

报警系统,主要作为发送平台,包括邮件发送,短信提示等

功能结构图

功能

相关文档
最新文档