大数据整体架构

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

消息交换
基础设施(服务器、存储、网络、虚拟化、私有云、公有云)1
航班计划
调整工具



关键指标

计算工具
……
移动端应用
程序


事件监控


舆情定制
……
预测预警

态势监控

效率评估

路线规划

……
2、技术架构
数据源 数据交换平台

构 DBAgent 化
数 TextAgent 据
公网
消 息

消பைடு நூலகம்
接息息


实时决策 引擎


多结构数据存储与管理
多结构原始数据存储 (Raw Data)
融合数据存储 (Integrated Data)

分布式分 析与挖掘

引擎

基础数据区
传统数据存储与管理
整合数据区 通用语义区 数据集市



报表分

析与挖 掘引擎




数据交换
文件交换
数据库共享
Web services
推荐算法 recommendation Alg
orithm
评估算法 evaluation Algorithm
时序分析 Sequential Algorithm
深度学习 Deep Learing
回归算法 Regression Algorithm
数据计算 Data Process
流处理引擎 Stream
5 数据分析、挖掘
数据实时分析 (流式计算)
3 (b)推送到数据应用端
数据分析
数据挖掘
数据离线分析
6 数据利用
数据应用
3、数据平台(对应6章节数据平台)
数据分析算法 Algorithm Library
预测算法 prediction Algorithm
增强学习 Q-Learning
关联分析算法 association Algorithm
非关系型数据库 No Sql
列式数据库 ColuMN DB
数据采集 Data Acquisition
结构化数据 ETL工具
网络爬虫 Web crawler
非结构化文档工具 PDF ALALIB
实时事件侦听 Real-time monitor
语义识别工具 Semantic LIB
数据侦听 Data monitor
1、整体架构
数据源
航班
航空 器
机场
空域
气象
航空 情报 监控 视频 地空 通话
数据 采集 平台
实时事 件侦听 页面请求 侦听
网络爬虫
Map/ Reduce
Sqoop
API编程
CDC
ETL
数据管理
元数据
数据质量管理 数据传输任务与管理
数据安全
数据标准

快数据处理(实时事件)
快数据流处理(Event Processing)引擎
Data Security Management Platform Configuration Management Platform
ZooKeeper Yarn
监 控 及 配 置 管 理 平 台
数 据 安 全 管 理 平 台
入缓分
结 LogAgent
控存发

制模模
数 Web crawler
模块块


内网
非 结
Web crawler
构 化
BinAgent
数 据
ApiAgent
XBRL+DataX+K afka
实时流处理平台
流计算引擎 Storm /Spring Stream
统一调度和监控 Zookeeper+oozie+Ganglia
数据挖掘/机器学习 Data Mining
文本搜索
并行计算引擎 (MapReduce/Spark/Storm)

资 源 管 理
布 式 协 助 服

数据存储 Data Storage
分布式文件系统 HDFS
文档存储 Document Store
内存数据库 In-memory DB
全文检索 Full-text Search
基础设施(服务器、存储、网络、虚拟化、私有云、公有云)
应用服务平台
报表\OLAP服务 查询可视化
定制+ECharts 数据挖掘服务 开放平台API
移动服务
数据流
数据规划和 梳理数据源
1、获取外部数据
数据采集 平台
数据清洗
3 数据清洗 2(a)数据存储
4 清洗后的数据存 储
数据中心
2(b)对数据实时 处理
实时 查询
Hbase
批量 交互 查询 式
查询 Hive Impala
批量计算引擎 MapReduce
交互 式 内存
内存 数据 挖掘
内存 图计算
Spark SQL
MLLib Graphx
内存计算引擎 Spark
分布式存储引擎 HDFS/YARN
大数据数据处理平台
应用服务平台
MySQL+Redis
统一 元数据
相关文档
最新文档