大数据云平台基础架构介绍

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据云平台基础架构介绍
Agenda
► 云计算与大数据 ► 系统架构 ► 挑战
云计算与大数据
Big Data Requires Elastic, Flexible Infrastructure
► 大数据解决方案最大、最重要的决定是平台的选择
Hadoop、Spark、Hbase、Storm…
► 实际需求
GreenPlum
Monitoring Alarm Metering Security Governance (ZooKeeper)
Alluxio
HDFS / Hbase / Object Storage
IaaS
SQL on Cloud
► HashData 数据仓库是酷克数据在青云 QingCloud 上面提供的 SQL-on-Cloud 解决方案,一个高性能、 完全托管的 PB 级云端 数据仓库。 ► 源于 PostgreSQL 和 Greenplum Database, HashData 数据 仓库让你能够利用标准 SQL 客户端和 BI 工具轻松分析海量数据。
完整 稳定 安全
高性能
► 自动化运维
一键部署 | API 调用 | 定时器 | Auto Scaling
► 弹性、敏捷、灵活
纵向、横向伸缩 | 分钟级别
实时 按需 开放
► 稳定、高性能与安全
系统优化,平台配置优化


私有网络,防火墙
高度自动化是一个渐进的过程
易用
系统架构
Real Time Processing Storm Logs Metrics Social Data Sensor Data Messages Spark Streaming
实时处理 、离线处理、 结构化数据 、非结构化数据、 CRUD 、事务性、 数据量大小
► 平台的能力
能满足实际需求的平台才是好平台
► 业务的不确定性
Relative scale, not absolute scale The world is changing fast!
云计算与大数据
Don’t try to do it yourself. Let us handle it.
Kafka /Flume Custom Process Engine
Fra Baidu bibliotek
Reporting, Visualization
Cassandra, MongoDB, Redis, MySQL, ElasticSearch
Batch Processing
Big SQL
SparkSQL
Spark MapReduce Kylin Phoenix Hive
Hadoop on Cloud
► 默认3个副本因子 ► 云上真的需要3个吗?
► 怎么做最优?
挑战
► 稳定性 ► 性能
网络 IO – SDN 2.0 (点到点网状结构) 硬盘 IO – 容器,Unikernel,定制化 IaaS

迁移
Within cloud Between cloud and on-premise
相关文档
最新文档