Cloudera大数据解决方案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
以前
拷贝数据到计算节点
现在
拷贝计算程序到数据节点
Compute
Compute
Data Data
流程驱动:
• Structured data mainly • Internal data only • “Important” data only
Compute
Compute
数据信息驱动:
Multi-structured, internal & external data
Hadoop方式
Compute (CPU)
Memory
z z
Storage (Disk)
Commodity “Unreliable” Servers Hybrid Open Source Software
Expensive & Unattainable
$30,000+ per TB
Affordable & Attainable
7
© 2014 Cloudera, Inc. All rights reserved.
Cloudera中国
• 英特尔7.4亿美元投资到Cloudera • 英特尔与Cloudera通过开源驱动创新 • 英特尔使得Hadoop在IA架构上运行达到最
优性能
• Cloudera与英特尔协作建立广泛的合作伙 伴生态系统
of all types
Data Compute Data
Relative size & complexity
Compute
10
©2014 Cloudera, Inc. All rights
reserved.
传统数据分析: 将数据带至计算 平台
4
复杂的架构
•许多特殊用途的系统
•频繁的数据移动
•缺乏数据的整体认识
Cloudera大数据
从最先进的Hadoop平台到企业级数据中心
Cloudera 公司背景
创立 世界顶级技术支持
企业核心业务应用
成功案例 最大生态系统 培训 开源社区领导者
2008, 由几家世界顶级IT企业前雇员创立 24x7 全球技术支持 主动技术支持&预测性技术支持 数千家企业客户,超过500名付费订阅企业客户 超过60%为世界500强客户 全球范围内数百项成功实施案例
ERP 、 CRM 、数据库、机器 文件、图片、视频、日志、点击流
外部数据源
12
©2014 Cloudera, Inc. All rights
reserved.
Hadoop 改变游戏方式
传统方式
Compute (RDBMS, EDW)
Data Storage (SAN, NAS)
Network
Expensive, Special purpose, “Reliable” Servers Expensive Licensed Software
3 高数据分析的成本 •现有系统负荷量过大 •缺乏灵活性 •“商业智能积压”
2 数据存取速度慢 •需要前期建模 •数据转换速度慢 •转换程序常遗失数据
1
高数据遗失率
•许多资料数据未能被使用
•风险与合规
•高存储成本
企业级数据仓库
数据集市
服务器
文件资料库
存储源自文库统
搜索系统
存档系统
ERP、CRM、数据库、机器
•“Schema on read” 灵活性 •降低BI用户请求积压
2 保持Staging •所有的分析使用单一数据源 •保持变换后的数据的状态 •更快更便宜
1
主动合规存档
•全保真原始数据
•不定时间,任何来源
•成本最低的存储
3 2
服务器
数据集市
企业级数据仓库
1
4
文件资料库 存储系统 搜索系统 存档系统
• Cloudera在中国建立销售及技术服务团队 ,英特尔大数据团队2014年9月正式加入
8
©2014 Cloudera, Inc. All rights
reserved.
Intel与Cloudera大数据联盟
9
©2014 Cloudera, Inc. All rights
reserved.
数据量决定数据使用方式
审计
•Regulatory compliance (retention, privacy) •Usage analysis and mediation •e-Discovery
数据服务
•Data as-a-product •Data enriched with insights/inferences
渠道优化
•Campaign management •Selection process optimization
风险管理
•Fraud detection •Intrusion detection & digital forensics
市场资讯
•Competitive analysis •Economic factor analysis •Customer segmentation
文件、图片、视频、日志、点击流
外部数据源
11
©2014 Cloudera, Inc. All rights
reserved.
大数据分析: 将计算平台带至数 据
4
多样化的分析平台
•将应用程序带至数据
•结合多样化的工作于常见的数据
(即SQL+搜索)
•真正的敏捷性分析
3 自动服务BI探索 •简单的搜索 + BI工具
超过1300个合作伙伴 全球超过5万人通过培训得到了Cloudera认证 Cloudera是无可争议的Hadoop开源社区领导者和贡献者 Cloudera首席架构师为Hadoop之父:DongCutting
Cloudera应用成果
Cloudera Confidential - Internal
4
Use Only
Financial & Business Services
Telecom Technology
Healthcare Life Sciences
Media
Retail Consumer
Energy Public Sector
行业成功案例
应用行业
6
Cloudera大数据应用案例种类
客户360度分 析
•Enhanced customer experience & support •Personalization, targeted offerings, loyalty programs •Sentiment analysis
供应链优化
•Manufacturing process efficiency •Supplier/merchant management