TeraData数据库学习笔记
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
处理节点(node)、用于节点间通信的内部高速互联(InterConnection)和数据存储介质(一般是磁盘阵列)。每个节点都是SMP结构的单机,节点的物理和逻辑结构如图1所示单个节点就是一个就是一个smp 处理单元,一台多CPU或多核的计算机。硬件包括CPU、内存、用于安装操作系统和应用软件的本地磁盘,与外界交互的网卡及bynet端口;节点网卡一种是与IBM MainFrame链接的Channel Adapter,另一种是局域网网卡,通常一个节点只有一种网卡,但有很多块网卡,分别用于不同的连接(比如:备份等)和冗余。
多个节点一起构成MPP系统,多个节点之间的内部高速互联时通过BYNET的硬件实现
Shared Nothing Architecture The Teradata Database virtual processors, or vprocs (which are the PEs and AMPs), share the components of the nodes (memory and cpu). The main component of the "shared-nothing" architecture is that each AMP manages its own dedicated portion of the system's disk space (called the vdisk) and this space is not shared with other AMPs. Each AMP uses system resources independently of the other AMPs so they can all work in parallel for high system performance overall.
Modul-2
一个关系数据库是存储在关系数据库管理系统里的相关联的表的集合。“管理系统”这个词,指的是一个关系数据库需要软件来提供象事物处理完整性、安全性和日志的功能。Teradata是一个关系数据库管理系统。
关系数据库不用访问路径去查找数据,数据通过数据值来连接。数据连接由一个列与另外一个表中的
相关列的匹配值来实现。在相关联的术语中,连接就是指JOIN。
Module-3:Teradata的系统主要组成结构
分析引擎Parsing Engine
分析引擎(PE)是一个解释SQL 请求,接受输入记录,过虑数据的虚拟处理器。完成后的信息通过BYNET 传递给AMP。
包括:session control(会话控制),parser(解析,包括优化器optimizer),dispatcher(调度) 分析引擎主要负责:
管理单独的会话层(可以到120个)
分析和优化SQL 请求
将优化的计划发送给AMP
ASCII/EBCDIC 之间的转化(如果需要的话)
发送响应的结果给请求客户
BYNET
BYNET可以看作是精密复杂的通讯总线。它依靠使用的平台,既可以是软件也可以是硬件。它决定哪个存取模块处理器(AMP)将接收信息。
BYNET是负责:
AMP与PE之间的信息传送
广播,点对点和多点通讯
合并结果集返回给PE
让Teradata 的并行处理成为可能
BYNET被应用在多节点和单节点系统。
存取模块处理器Access Module Processor (AMP)
AMP 是一个专门设计用来管理整个数据库的一部分的虚拟处理器。它执行数据库所有的管理功能,例如排序,合计和格式化数据等。AMP从PE接收数据,格式化输出行,然后将数据分配到它所控制的存储磁盘单元。AMP也通过分析引擎接收行请求。一个AMP 最多可以控制64个物理磁盘
AMP 通过BYNET 的传送响应分析器和优化器的执行步骤,从它关联的磁盘中选择数据或存储数据。对于一些请求,AMP 还需要重新分配一个数据的副本到其他的AMP。
数据库管理的子系统依赖每一个AMP。数据库的管理:* 接收从发报机送来的执行步骤,处理这些执行步骤。它可以做:
—锁数据库和表
—建立,修改和删除表的定义
—插入,删除和修改表中的行
—从表和数据定义中获取信息
—收集统计数据,记录会话的访问过程,用户可以被准确地列出表来。
—响应返回给发报机
数据库管理为磁盘上数据的逻辑组织和物理组织提供了一座桥梁作用。数据库管理执行了空间管理的功能,控制了空间的分配和使用。AMP 也能进行数据转化,检查会话层和把Teradata 内部使用的8 位ASCII 转成请求的数据格式。(这与PE 将输入数据转成内部的ASCII 是一个相反的处理过程。)
磁盘
与AMP 相关联的磁盘和磁盘驱动器用来存储数据行。在当前的系统中,它们一般使用磁盘阵列。
磁盘阵列(Disk Array)
磁盘矩阵是一个利用专门的控制器来管理和分配数据和奇偶校验的磁盘驱动器结构,以此提供快速存取和数据完整性。每一个AMP 虚拟处理器都必须访问矩阵控制器,这个控制器依次访问物理磁盘。AMP 虚拟处理器和一个或多个rank 的数据相关联。一个AMP 虚拟处理器和相关联的总的磁盘空间被称为VDisk(虚拟存储器)。一个VDisk 最多可以有三个rank。
所有磁盘RAID 技术进行管理,其中有如下的几个方式:
_RAID LEVEL 5――多个磁盘的数据和奇偶保护
_RAID LEVEL 1――每个磁盘有一个数据复制的物理镜像
_RAID LEVEL S――类似RAID5 用于EMC 磁盘矩阵的数据和奇偶保护
磁盘矩阵控制器是一个双重可用的矩阵控制器,也就是说除了在相互备份时,两个控制器都可用。
每个AMP 能支持的最大磁盘空间
V2R2――46GB
V2R3/V2R4――119GB
_每个AMP虚拟处理器额可以指派给一个虚拟存储器
_每个虚拟存储器可以拥有119的磁盘空间
Teradata 存储过程
_分析引擎解释SQL 命令,将从主机那里得到的数据记录转化成一个AMP 信息。
_BYNET 把这一行分配给相应的AMP。
_AMP 格式化行并它们写到相关联的磁盘中去。
_磁盘保存行的并发访问路径。
主机或客户端系统提供数据记录。这些数据记录是未被加工的原始数据,数据库将从这些原始数据中构造。由于Teradata没有预先分配表空间的概念,所以表中的行不仅被随机分配到所有的AMP 中去,而且它们被随机存储在AMP 相关联的磁盘空间中。