2019年整理Teradata数据仓库简介资料

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基本概念 常用工具介绍 管理的一些约定
关于TERADATA
• Teradata最初产生于1976年,由加州理工学院和花旗银行的高科 技项目-创建一个能够分析10的12次方 bytes 数据的系统。
1 Kilobyte 1 Megabyte 1 Gigabyte 1 Terabyte 1 Petabyte 1 Exabyte 1 Zetabyte 1 Yottabyte
的 Loading 数 据
AMP2源自文库数据 AMP1的数据
Backup & Recovery
并行处理性能
其他关系数据库
“有条件的并行”
初始查询 查询优化 查询并行
扫描 链接 聚合 排序
收敛 最终结果集
Teradata
“无条件的并行”
时间
Shared Nothing Software
• 线性扩展能力
10
8
Teradata WorldMark (CPU = 1.00,
88% 1-4 CPU SMP scaling, 98% per
Teradata
Oracle IBM
Sybase HP
Microsoft-DATAllegro Netezza
Greenplum
Vertica
Kognitio Sand Technology Sun Microsystems-MySQL Ingres Illuminate Solutions
1010data
niche players pleteness f vision
visionaries
completeness of vision
as of September 2007
niche players
visionaries as of December 2008
5
Teradata数据库原理
Teradata数据库架构 Teradata数据库工作原理 Teradata特性
关于TERADATA
•Teradata 是全球最大的专注于数据 仓库、咨询服务及企业分析方案的提 供商,凭借业界领先的数据库、数据 仓库解决方案、性能卓越的可扩展平 台以及全球2000多个大型数据仓库项 目的客户成功经验,成就了公司在数 据仓库领域的创新领导地位。
Gartner 评选Teradata为数据仓库领导厂商
challengers
2007
leaders
challengers
2008
leaders
ability to execute ability to execute
Teradata
Oracle IBM
MySQL
Microsoft Sybase
Netezza Greenplum
DATAllegro
Kognitio Sand Technology
CPU CPU CPU CPU Memory
CPU CPU CPU CPU Memory
MPP系统与Teradata
•多结点同时工作 •数据库由各结点共同拥有
•MPP (Massive Parallel Processing)
海量并行处理服务器:由多个SMP服务器通过一定 的结点互联网络进行连接,协同工作,完成相同的 任务。从用户的角度来看是一个系统!
> 最大化的利用每个节点的资源 > 可灵活配置
VPROCs VPROCs VPROCs VPROCs Amps Amps Amps Amps
VPROCs VPROCs VPROCs VPROCs Amps Amps Amps Amps
VPROCs VPROCs VPROCs VPROCs Amps Amps Amps Amps
= 103 = 1000 bytes = 106 = 1,000,000 bytes = 109 = 1,000,000,000 bytes = 1012 = 1,000,000,000,000 bytes = 1015 = 1,000,000,000,000,000 bytes = 1018 = 1,000,000,000,000,000,000 bytes = 1021 = 1,000,000,000,000,000,000,000 bytes = 1024 = 1,000,000,000,000,000,000,000,000 bytes
Teradata并行处理架构
V-PE
V-PE
BY-Net
• PARSING ENGINE (PE) •SQL Parser & Optimizer •Query Step Dispatcher
• Network Distribution
V-AMP V-AMP V-AMP V-AMP
• Access Module Processors (AMP)
VPROCs VPROCs VPROCs VPROCs Amps Amps Amps Amps
MPP小结
• Teradata MPP 架构
> 使用当前最快的CPU > 最好的扩展性 > 使用 shared-nothing MPP架构以达到线性扩展
Effective CPU Performance
Effective CPU Scaling Performance
Teradata数据库架构
TCP/IP
封闭主机 系统
分析引擎 PE
BYNET信息 存 取 模 块 通 信 界 面 传递网络 单 元 AMP
网关 通道
PE1 PE2
AMP1


AMP2


AMP3
层 AMP4
PDE (并 行 数 据 库 扩 展 环 境)
UNIX
单 结 点 SMP
磁盘阵列
TERADATA的MPP架构
• Disk Partitions
Teradata并行的机制



AMP


AMP

AMP

AMP1


Reading Writing
Sorting

AAMgPgr4eg的at数ing据

Building Indexes
Row LockinAgMP3的数据TJroaunrsnaaclitziionng
Teradata数据库简介
Teradata数据仓库事业部 华南区
Teradata Confidential
Agenda
关于TERADATA Teradata数据库原理
Teradata数据库架构 Teradata数据库工作原理 Teradata特性
Teradata数据仓库构建
相关文档
最新文档