实时数据分析平台、大数据分析、MPP数据仓库

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据分析平台

分析平台

实时加载 & 查询

高级库内分析

数据设计 & 管理工具

列式存储 & 执行

强劲的数据压缩

扩展的MPP架构

自动的高可用性

优化器, 执行引擎 & 负载管理

内在的 BI, ETL, & Hadoop/MapReduce 集成

Vertica的分析平台为特定目的建造的,以使公司从他们的数据中提取价值,他们需要在今天的经济环境中茁壮成长的速度和规模。不像大多数其它的数据仓库供应商正试图改造21世纪的技术,几十年的老基础设施,Vertica的设计和建造自成立以来,为当今最苛刻的分析工作负载。此外,每一个的Vertica的成分是由设计,能够充分利用其他。

Vertica分析平台关键特性

实时查询 & 加载 »通过不断加载的信息,获取数据的时间

价值,同时允许立即进行丰富的分析。

高级的库内分析 »不断增长的特点和功能库,展示和处理

更多和CPU内核紧密结合的数据,而无需解压。

数据设计 & 管理工具 »强大的设置,调整和控制以达到使

用最小的管理工作,就可以进行持续改进,而系统仍然保

持在线。

列式存储 & 执行 »执行查询快50 - 1000倍,消除了昂贵的

磁盘I / O,没有的索引和物化视图的麻烦和开销。

强劲的数据压缩 »我们的引擎,以较少的资本性支出完成

更多的压缩数据,同时提供卓越的性能。

可扩展的MPP架构 »Vertica的自动和无限线性扩展,只需

在网格中添加行业标准x86服务器

自动的高可用性 »不间断地运行与优化,提供卓越的查询

性能,良好的自动冗余,故障切换和恢复。

优化器执行引擎 & 负载管理 »获得最大的性能,而无需担

心它如何工作的细节。用户只思考有关的问题,我们快速

地提供答案。

内在的 BI, ETL, & Hadoop/MapReduce 集成 »一个强大和

不断增长的生态系统的分析解决方案的无缝集成。

今天,世界各地的信息是连续产生的。因此,隔夜批量加载

数据已经成为奢侈的过去。组织必须能够不停顿地加载到信

息到他们的分析平台,同时允许进行数据丰富的分析。

信息的时间价值是非常重要的,在数据产生后,用户越早处理就越有价值。对于零售商来说,这可能意味着即时的

促销和库存的摆放。对于金融公司,这会影响到及时的交易

决策。对于网络游戏公司,这提供了更加个性化和引人入胜

的游戏体验。这个最小延迟的量是不容易的壮举。因为从网

络源,用户鼠标点击,金融交易,传感器网络和越来越多的

其他来源的信息量是压倒性的挑战。

混合的主存中/磁盘上架构

当加载数据的时候,与传统的、管理者繁重的锁的关系数据库系统不同,Vertica设计了一个独特的时间旅行实务模型,以确保极高的并发查询,同时把新的数据加载到系统中。 Vertica通常是传统的行存储数据库加载速度的10多倍。此外,Vertica的为特定目的建造的混合主存内/磁盘上架构,以确保近实时的信息可用性。在分析操作中,我们会自动地查询在内存中和磁盘中的位置,并返回请求的单一结果。

Vertica’s FlexStore™

Vertica的FlexStore技术使用户能够控制每列数据不同的存储介质。这允许Vertica的管理员可以很容易地把最频繁的列放在一个更快的存储层,

例如固态硬盘驱动器或Fusion-io驱动器。开始加载时,数据在数据库中最佳的层和位置是自动分配的。

实时数据分析平台、大数据分析、MPP数

据仓库 - vertica (三)高级库内分析

Vertica的提供了一个强大和不断增长的先进的数据库内分析功能,客户可以进行数据紧密的分析计算,并可以从一个地方立即得到答案,而不需要把信息抽取到一个单独的环境。把数据保持在数据库中是特别关键的,因为数据集的大小从TB到PB级及以后的变化。

更重要的是,Vertica的原生解析函数和UDF还专门设计可以充分利用我们独特的MPP并行机制,列存储和执行,比其他任何平台上执行得更快。

Vertica的提供完整的ANSI标准SQL的支持,SQL分析功能,规则的文本表达式,原生SQL的扩展和用户定义函数(UDF)框架。UDF正在迅速扩大,超出今天我们提供的SQL宏的UDF。所有这些提供给业务分析师,开发人员和管理员的灵活性和简单性,使他们能够利用大量的信息,在并行处理上而无需博士学位。他们

可以简单地使用他们喜欢的工具提问。

Vertica高级分析特性包括:

原生空白填补

插补

事件窗口功能

图形遍历

序列化

Vertica的简洁SQL语法扩展,使用这些SQL语句的扩展是非常简单的,因此不存在需要学习和使用另一种语言。

谈NoSQL的有很多,但真正的问题是不是SQL语法。传统的RDBMS性能表现不佳。就拿社会网络端点分析中图的遍历来说,传统的RDBMS会使用连接和痛苦多路自联接得到一个答案,这通常会使系统过载,且无法返回最终结果。另外,可以使用自定义的数据结构和程序语言,但不幸的是,这些往

往不是企业级的,缺乏简单,可扩展性和高效率的并行化。另一方面,使用我们的MPP操作和有效的列链接,执行排序与标准的SQL语法,Vertica能够提供这些强劲的功能和简单性。最重要的是,Vertica 的优化和执行引擎喂你处理所有的规划和并行。

基于事件的窗口

您还可以使用Vertica基于事件的窗口,把时间序列数据放入运行的窗口中。特别是财务相关的数据分析可能会集中在特定事件触发其他活动。 sessionization,一个特殊的情况下,基于事件的窗口,是一种经常用来分析点击流的功能,如标识在一个特定的时间内从记录的Web 点击web浏览的会话。暴力的过程方法,可以实现这一点,但Vertica简单,高效,大规模并行,Web会话以一个即席查询的方式与不同的运行窗口中确定的参数完成。举例来说,30秒可能就不会是一个平均的web 访问会话。 Vertica可以自动地分析同一IP地址会话的时间间隔,以确定平均会话时间,然后根据这个参数或会话数据自动地进行标记。

Vertica投入巨资研发更强大的数据库内分析,使我们的客户能够以执行额外的统计,地理空间,决策树和几个其他先进的分析。 让他们的数据以更多的方式,更快地使用SQL或他们喜欢的程序编程或脚本语言。

进一步阅读

更多Vertica库内分析, 在我们的博客上检查这些链接:

Sessionize with Style – Part 1

Sessionize with Style – Part 2

More Time Series Analytics: Event-Based Window

Functions

Gap Filling and Interpolation (GFI)

Reading between the Lines with Vertica 4.0

相关文档
最新文档