16家顶尖大数据分析平台

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

16家顶尖大数据分析平台-系列文章之九

来源:缔元信发布时间:2014-03-07 17:58标签:数据结构化大数据DougHenschen,InformationWeek,1/30/2014

对今天的企业来说,数据分析已经成为生死攸关的选择。我们分析一些著名的供应商,从Hadoop创业者到传统的数据库市场参与者。

SAP将Hana置于分析的核心

分析数据库管理系统:SAPHana、SAPIQ

内存数据库管理系统:SAPHana

流分析选项:SAP事件流处理(EventStreamProcessing)

Hadoop分布式系统:代售并支持Hortonworks、Intel,由Cloudera和MapR认证的Hadoop集群

硬件/软件系统:多个硬件配置合作伙伴,包括Dell、Cisco、Fujitsu(富士通)、Hitachi(日立)、HP和IBM

无论数据来源是结构化的还是非结构化的,成批的还是流式的,规模大还是小,SAP总是推出

Hana内存平台来满足所有(不管是分析性的还是交互性的)需求。当数据确实规模很大或处于非结构化状态时,SAP支持各种Hadoop分布式系统,附带通过Hive实现的Hana数据处理功能。当数据需要为长期历史分析进行归集时,SAPIQ(之前名称SybaseIQ)提供一个压缩版的分列式数据库管理系统,作为一项基于SQL的Hadoop替代选择,来适配支持MapReduce处理。

Hana拥有一个嵌入式的预测分析资料库,支持R语言、空间处理、自然语言处理和文本分析资料库。如果需要,文本和非结构化数据分析可以用SAP数据服务推送到Hadoop里面进行。结果集可以返回到Hana,以完成快速的内存分析。

有很多时候SAP也会失灵,这时就要不停地推销"实时"概念,无论是否有对这个水平的性能的明确需求。投资SAP的好处是它在低延迟Hana分析,以及快速数据加载和流处理功能(后者通过对Sybase的收购获得)上走在了业界前列。当你发现一个突破低延迟性能的清晰机会时,SAP有各种工具来帮你实现。

Teradata实现了统一的大数据架构

分析数据库管理系统:Teradata、TeradataAster

内存数据库管理系统:虽然并不是一个内存数据库管理系统,但Teradata智能存储监视器仍实现了对最热数据的查询,并且自动将这些数据送至可用的最快速存储层,附带一些选项,包括RAM(随机存取存储器)、flash、SSD,以及不同速度的传统旋转磁盘。

流分析选项:无

Hadoop分布式系统:代售并支持Hortonworks数据平台

硬件/软件系统:Teradata和TeradataAster是集成的软硬件系统。Hadoop由两个Teradata 组件和标准的Dell配置来支持。

Teradata进入大数据时代,总是要吹嘘其最长的PB级企业数据仓库(EDW)供应商客户名单。公司花了两三年时间才接受SQL无法满足所有需求这个事实,2011年它获得了AsterData,2012年与Hortonworks结成合作伙伴,这样它就能建构一个称之为统一数据架构(UDA)的平台。

Teradata数据库管理系统处于统一数据架构(UDA)的核心位置,支持为满足生产商业智能和分析需求而设计的企业数据仓库(EDWs)和数据集市。选项则包括了SQL和不同的内部数据库分析选项,以及对SAS的广泛支持。公司把这个数据库管理系统置于混合行列压缩性能和一个智能存储功能的中心,以实现RAM、SSDs、flash和不同速度旋转磁盘的快速查询。

Aster是UDA的数据发现平台,一个专为每日搜寻结构化和多结构化(点击流量、社交或机器)数据而设计的小型、临时数据库。分析选项包括SQL、SQL-MapReduce和SQL图表分析。Hadoop是大规模、低成本存储的选择,来自这个库的数据子集可以被拷贝进TeradataAster,或者用SQL-H(公司的Hadoop上SQL查询功能选项)抽取到Teradata里。

像Cloudera这样的Hadoop支持者会认为成本和规模优势将引导客户做更多的分析,包括Hadoop上的SQL功能、图表分析,当然,还有MapReduce。Teradata一直很关注建立SQL 友好的方式-以及Hadoop工具的非相关特质和开发者们的语言,以保持Teradata的结构化数据分析和TeradataAster的变量数据分析。Hadoop越流行、越得力、越好用,独立的数据发现平台就将越少受人关注。无论如何,毫无疑问,对很多大型的、业绩驱动的公司来说,核心的Teradata数据库管理系统将持续成为数据管理的基石。

相关文档
最新文档