大数据平台技术厂商研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据平台技术厂商研究

1.Oracle

Oracle主要提供BDA(Big Data Appliance)大数据一体机、RTD(Real Time Decision)实施决策引擎作为整套企业大数据解决方案。大数据一体机满柜可支持648核CPU,2304G内存,864TB硬盘以及40GB/s的网络带宽,软件则与Cloudera 合作,统一安装Cloudera企业版及NoSQL数据库。

针对银行数据平台建设的特殊需求,Oracle为银行建议的解决方案为采用大数据一体机(三分之一柜)搭配传统结构化数据库以及RTD实时决策引擎,在解决异构数据整合、储存问题的同时,简化系统优化成本,并为业务部门提供实时营销能力支持,扩展营销业务场景。

2.Cloudera

Cloudera集合了包括Hadoop、Hive、Zookeeper在内的大量Hadoop技术组件的主要开发者,是目前对Hadoop技术发展贡献最大的企业之一,产品生态相对最完整。Cloudera属于最先进入中国市场的国外大数据技术服务企业,并在上海有独立技术支持团队和合作服务公司,但起步较晚。

Cloudera企业版产品在开源的社区版基础上,增加了企业管理功能,包括数据安全管理、用户权限设置、滚动更新、自动灾备等,同时提供电话及现场的技术支持。在对SQL支持度上,Cloudera开发的基于内存计算的Impala组件支持SQL99以及部分SQL2003版本,同时达到秒级的响应速率,性能超过SparkSQL 二到三倍。

3.IBM

IBM提供Hadoop技术解决方案BigInsights和实时分析产品Streams作为企业大数据技术解决方案。

BigInsights以纯开源Hadoop组件搭配IBM增值组件构成。底层系统由开源Hadoop技术经IBM轻度封装后免费开放,平台上层提供自主开发的增殖组件配套销售:包括SQL支持引擎BigSQL、数据可视化工具Bigsheet、R语言工具BigR、文本分析工具TextAnalytics、管理调度工具EnterpriseManagement等。其中BigSQL对SQL支持度达到SQL2011,可大幅减小平台迁移后重复开发成本,BigR集成了开源单机版R语言中已有挖掘模型包,可直接利用,避免了在平台

上重复建模。

Streams由IBM自主研发用于大数据实时处理,已有14年历史,原为美国军方分析使用,后开放转为民用。具有低延时、可扩展等优秀性能。

4.华为

华为自Hadoop技术发展至今一直在为开源Hadoop技术提供代码贡献,在2015年,华为在开源Hadoop的贡献度仅次于Cloudera和Hortonworks,排名全球第三。在大数据技术产品上,华为提供FusionInsight作为企业级大数据技术解决方案。FusionInsight利用自主研发技术支持从数据采集、储存到批量加工、交互查询、数据挖掘、实时流处理等各种应用场景,同时在安全管理上提供了统一权限管理、加密存储、网络隔离、集群容灾的特性,达到国家三级信息系统安全保护标准。

5.星环

星环科技合作开发了TDH大数据平台作为企业级Hadoop技术解决方案,在数据存储、资源管理、数据分析等业务场景上提供了一站式解决方案。其自主开发的分布式内存分析引擎Inceptor支持SQL92/SQL93,并已增加SQL2003扩展标准,可覆盖现有大部分传统场景的处理需要。在Spark基础上,还扩展了多种执行引擎的优化技术,有效将SQL任务执行的时间在开源Spark的技术上再降低了数倍,因而能够有效地应用于交互式和迭代式计算场景。由于全面支持事务一致性操作,避免大量的应用重写工作,因此能够有效满足大部分客户的应用需求。

6.南大通用

南大通用开发了事务型数据库管理系统GBase作为企业数据库解决方案,基于IBM的成熟商用数据库Informix为原型,自主构造并发行了GBase 8t产品。GBase除了支持原型的操作系统和平台外,具有支持高并发事务处理、提供图形化管理工具、高可用性等性能优势,具有了在高端市场替代传统国外数据库的能力,在数据处理层支撑国家自主可控战略。

相关文档
最新文档