实时数据分析平台、大数据分析、MPP数据仓库
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据分析平台
分析平台
实时加载 & 查询
高级库内分析
数据设计 & 管理工具
列式存储 & 执行
强劲的数据压缩
扩展的MPP架构
自动的高可用性
优化器, 执行引擎 & 负载管理
内在的 BI, ETL, & Hadoop/MapReduce 集成
Vertica的分析平台为特定目的建造的,以使公司从他们的数据中提取价值,他们需要在今天的经济环境中茁壮成长的速度和规模。不像大多数其它的数据仓库供应商正试图改造21世纪的技术,几十年的老基础设施,Vertica的设计和建造自成立以来,为当今最苛刻的分析工作负载。此外,每一个的Vertica的成分是由设计,能够充分利用其他。
Vertica分析平台关键特性
实时查询 & 加载 »通过不断加载的信息,获取数据的时间
价值,同时允许立即进行丰富的分析。
高级的库内分析 »不断增长的特点和功能库,展示和处理
更多和CPU内核紧密结合的数据,而无需解压。
数据设计 & 管理工具 »强大的设置,调整和控制以达到使
用最小的管理工作,就可以进行持续改进,而系统仍然保
持在线。
列式存储 & 执行 »执行查询快50 - 1000倍,消除了昂贵的
磁盘I / O,没有的索引和物化视图的麻烦和开销。
强劲的数据压缩 »我们的引擎,以较少的资本性支出完成
更多的压缩数据,同时提供卓越的性能。
可扩展的MPP架构 »Vertica的自动和无限线性扩展,只需
在网格中添加行业标准x86服务器
自动的高可用性 »不间断地运行与优化,提供卓越的查询
性能,良好的自动冗余,故障切换和恢复。
优化器执行引擎 & 负载管理 »获得最大的性能,而无需担
心它如何工作的细节。用户只思考有关的问题,我们快速
地提供答案。
内在的 BI, ETL, & Hadoop/MapReduce 集成 »一个强大和
不断增长的生态系统的分析解决方案的无缝集成。
今天,世界各地的信息是连续产生的。因此,隔夜批量加载
数据已经成为奢侈的过去。组织必须能够不停顿地加载到信
息到他们的分析平台,同时允许进行数据丰富的分析。
信息的时间价值是非常重要的,在数据产生后,用户越早处理就越有价值。对于零售商来说,这可能意味着即时的
促销和库存的摆放。对于金融公司,这会影响到及时的交易
决策。对于网络游戏公司,这提供了更加个性化和引人入胜
的游戏体验。这个最小延迟的量是不容易的壮举。因为从网
络源,用户鼠标点击,金融交易,传感器网络和越来越多的
其他来源的信息量是压倒性的挑战。
混合的主存中/磁盘上架构
当加载数据的时候,与传统的、管理者繁重的锁的关系数据库系统不同,Vertica设计了一个独特的时间旅行实务模型,以确保极高的并发查询,同时把新的数据加载到系统中。 Vertica通常是传统的行存储数据库加载速度的10多倍。此外,Vertica的为特定目的建造的混合主存内/磁盘上架构,以确保近实时的信息可用性。在分析操作中,我们会自动地查询在内存中和磁盘中的位置,并返回请求的单一结果。
Vertica’s FlexStore™
Vertica的FlexStore技术使用户能够控制每列数据不同的存储介质。这允许Vertica的管理员可以很容易地把最频繁的列放在一个更快的存储层,
例如固态硬盘驱动器或Fusion-io驱动器。开始加载时,数据在数据库中最佳的层和位置是自动分配的。
实时数据分析平台、大数据分析、MPP数
据仓库 - vertica (三)高级库内分析
Vertica的提供了一个强大和不断增长的先进的数据库内分析功能,客户可以进行数据紧密的分析计算,并可以从一个地方立即得到答案,而不需要把信息抽取到一个单独的环境。把数据保持在数据库中是特别关键的,因为数据集的大小从TB到PB级及以后的变化。
更重要的是,Vertica的原生解析函数和UDF还专门设计可以充分利用我们独特的MPP并行机制,列存储和执行,比其他任何平台上执行得更快。
Vertica的提供完整的ANSI标准SQL的支持,SQL分析功能,规则的文本表达式,原生SQL的扩展和用户定义函数(UDF)框架。UDF正在迅速扩大,超出今天我们提供的SQL宏的UDF。所有这些提供给业务分析师,开发人员和管理员的灵活性和简单性,使他们能够利用大量的信息,在并行处理上而无需博士学位。他们
可以简单地使用他们喜欢的工具提问。
Vertica高级分析特性包括:
原生空白填补
插补
事件窗口功能
图形遍历
序列化
Vertica的简洁SQL语法扩展,使用这些SQL语句的扩展是非常简单的,因此不存在需要学习和使用另一种语言。
谈NoSQL的有很多,但真正的问题是不是SQL语法。传统的RDBMS性能表现不佳。就拿社会网络端点分析中图的遍历来说,传统的RDBMS会使用连接和痛苦多路自联接得到一个答案,这通常会使系统过载,且无法返回最终结果。另外,可以使用自定义的数据结构和程序语言,但不幸的是,这些往
往不是企业级的,缺乏简单,可扩展性和高效率的并行化。另一方面,使用我们的MPP操作和有效的列链接,执行排序与标准的SQL语法,Vertica能够提供这些强劲的功能和简单性。最重要的是,Vertica 的优化和执行引擎喂你处理所有的规划和并行。
基于事件的窗口
您还可以使用Vertica基于事件的窗口,把时间序列数据放入运行的窗口中。特别是财务相关的数据分析可能会集中在特定事件触发其他活动。 sessionization,一个特殊的情况下,基于事件的窗口,是一种经常用来分析点击流的功能,如标识在一个特定的时间内从记录的Web 点击web浏览的会话。暴力的过程方法,可以实现这一点,但Vertica简单,高效,大规模并行,Web会话以一个即席查询的方式与不同的运行窗口中确定的参数完成。举例来说,30秒可能就不会是一个平均的web 访问会话。 Vertica可以自动地分析同一IP地址会话的时间间隔,以确定平均会话时间,然后根据这个参数或会话数据自动地进行标记。
Vertica投入巨资研发更强大的数据库内分析,使我们的客户能够以执行额外的统计,地理空间,决策树和几个其他先进的分析。 让他们的数据以更多的方式,更快地使用SQL或他们喜欢的程序编程或脚本语言。
进一步阅读
更多Vertica库内分析, 在我们的博客上检查这些链接:
Sessionize with Style – Part 1
Sessionize with Style – Part 2
More Time Series Analytics: Event-Based Window
Functions
Gap Filling and Interpolation (GFI)
Reading between the Lines with Vertica 4.0