RAID系统基础知识

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

RAID系统基础知识

1.1 SCSI基础知识

在配置磁盘阵列系统之前,你必须了解一些SCSI的基础知识。

●SCSI ID

SCSI ID是安排给一个SCSI设备的唯一的编号,这使这些设备在通过SCSI总线连接到主机后,能够很好的与主机之间交换信息。每个SCSI设备和SCSI卡必须有一个SCSI ID号(Fast SCSI-2 = 0 ~7,Ultra Wide/Ultra2 SCSI = 0 ~ 15)。一个ID号将唯一的定义在同一SCSI总线.上的一个设备,不能有多个设备使用同一ID号。如果一台主机有两条SCSI总线,则不同SCSI总线上的设备可以有相同SCSI ID号。

●Terminator(终结器)

基于SCSI的定义,SCSI总线必须在两端终结。这就是说,连接在SCSI总线最末端的设备必须使其终结器有效。连接在SCSI总线中间的设备必须使其终结器失效。其实,终结是为了使数据信号能不失真的在SCSI总线上传输。一些SCSI设备要手工加上或去掉终结器,而另一些设备内建有终结器,通过开关或软件命令使终结器有效或失效。

1.2 Why disk array

●我们需要磁盘阵列

在过去的七年间,PC机速度提高了50多倍,这种进步导致现在已能制造出功能非常强大的PC机,它们能执行那些以前被认为只有在大得多并且贵得多的机器上才能完成的任务.

但是,存储数据的设备(指硬磁盘)的处理速度未能跟上来。图1说明了两者的巨大差异。虽然磁盘驱动器的性能就其价格容量比来说大大改善了,它的实际速度却只提高了3-4倍。因此,九十年代末最强大的计算将是那些磁盘系统性能优化的机器,如果磁盘系统的性能得到像计算机处理系统性能那样的改善,我们就有了真正的超级微型计算机.

的速度对比

目前已经研制了

新的技术来缩小

日益增大的计算

机主机和磁盘驱

动之间的性能差

距,这就是现在正

在被人们逐渐认

识的磁盘阵列技

术。磁盘阵列技术

可以详细地划分

为若干个级别0 - 5 RAID技术。RAID是廉价冗余磁盘阵列(Redundant Array of Inexpensive Disk)的简称。某些级别的RAID技术可以把速度提高到单个磁盘驱动器的400% 。磁盘阵列把多个磁盘驱动器连接在一起协同工作,大大提高了速度,同时把磁盘系统的可靠性提高到接近无错的境界。这些“容错”系统速度极快,同时可靠性极高。

这本小册子将讨论这些新技术,以及不同级别RAID的优缺点。我们并不想涉及那些关键性的技术细节问题,而是将磁盘阵列和RAID技术介绍给对它们尚不熟悉的人们。相信这将帮助你选用合适的RAID技术。

RAID级别的定义

下表提供了RAID的简单定义,本书其后部分将对各级RAID进行更详尽的描述。

备注1:N代表驱动器总数目;C代表capacity,单个驱动器容量。

2

RAID 0:又称Striping阵列,做RAID 0需要两上或两个以上的、容量相同的硬盘,N个硬盘做成RAID0后的硬盘容量为单个硬盘的N倍。在做数据存储时将数据分割存储到多块硬盘上,磁盘读写时负载平均分配到多块硬盘,由于多块硬盘均可同时读写,所以速度显著提升。也正是由于数据被分割存储到多块硬盘,所以数据的完整性依赖于多块硬盘数据均完好无损,一旦其中一块硬盘的数据损坏或磁盘故障,那么所有的数据都将丢失。所以RAID0数据存取性能好、速度快,但可靠性差,RAID 0通常用于对磁盘性能要求高但对数据安全性要求不高的场合。

RAID 1:又称Mirror阵列,做RAID 1需要两个容量相同的硬盘,两个硬盘做成RAID1后的硬盘容量为单个硬盘容量。在做数据存储时将同样的数据写入两块硬盘,两块硬盘互为镜像盘,当一块硬盘中的数据受损或磁盘故障时,另一块硬盘可继续工作,并可在需要时重建RAID1阵列。但RAID 1不能提升磁盘性能,RAID 1适合对数据可靠性要求严格的场合。

RAID 2:带海明码校验磁盘阵列,RAID2是为大型机和超级计算机开发的。磁盘驱动器组中的第一个、第二个、第四个......第2的n次幂个磁盘驱动器是专门的校验盘,用于校验和纠错,例如七个磁盘驱动器的RAID2,第一、二、四个磁盘驱动器是纠错盘,其余的用于存放数据。使用的磁盘驱动器越多,校验盘在其中占的百分比越少。RAID2对大数据量的输入输出有很高的性能,但少量数据的输入输出时性能不好。由于海明码的特点,它可以在数据发生错误的情况下将错误校正,以保证输出的正确。它的数据传送速率相当高,如果希望达到比较理想的速度,那最好提高保存校验码的硬盘性能,对于控制器的设计来说,它又比RAID3、4、5要简单。但是利用海明码校验必须要付出数据冗余的代价。

RAID 3:做RAID 3至少需要三块硬盘,N个硬盘做成RAID 3后的硬盘容量为单个硬盘的N-1倍。RAID 3是将数据先做XOR 运算,产生Parity Data后,再将数据和Parity Data以并行存取模式写入成员磁盘驱动器中,进一步来说,RAID3每一笔数据传输,都更新整个Stripe﹝即每一个成员磁盘驱动器相对位置的数据都一起更新﹞,因此不会发生需要把部分磁盘驱动器现有的数据读出来,与新数据作XOR运算,再写入的情况发生。因此,在所有RAID级别中,RAID3的写入性能是最好的。RAID 3的Parity Data一般都是存放在一个专属的Parity Disk,但是由于每笔数据都更新整个Stripe,因此,RAID3的Parity Disk并不会如RAID 4的Parity Disk,会造成存取的瓶颈。RAID 3需要RAID控制器特别功能的支持,RAID3以其优越的写入性能,特别适合用在大型、连续性档案写入为主的应用。

RAID 4:带奇偶校验码的独立磁盘结构,做RAID 4至少需要三块硬盘,RAID 4和RAID 3很相似,不同的是RAID4对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘。RAID 3是一次一横条,而RAID 4一次一竖条。所以RAID3常须访问阵列中所有的硬盘驱动器,而RAID4只须访问有用的硬盘驱动器。这样读数据的速度大大提高了,但在写数据方面,需将从数据硬盘驱动器和校验硬盘驱动器中恢复出的旧数据与新数据通过异或运算,然后再将更新后的数据和检验位写入硬盘驱动器,所以处理时间较RAID3长。

RAID 5:类似于RAID 0,做RAID 5至少需要三块硬盘,N个硬盘(N>2)做成RAID5后的硬盘容量为单个硬盘的N-1倍,在做数据存储时将数据的每个字节按bit 拆分到硬盘,在数据出错时可以按奇偶校验码重建数据,容错能力强于RAID0,但它需要一块硬盘来容纳额外的奇偶校验信息。RAID 5的Parity Data分散写入到各个成员磁盘驱动器,脱离如RAID 4单一专属Parity Disk的写入瓶颈。但是,RAID 5在做数据写入时,仍然稍微受到"读、改、写过程"的拖累。当RAID5的成员磁盘驱动器数目越多,其性能也就越高,但是反过来说,成员磁盘驱动器越多,RAID5中可能有磁盘驱动器故障的机率就越高,整个阵列的可靠度就会降低。基本上来说,多人多任务的环境,存取频繁,数据量不是很大的应用,都适合选用RAID 5架构。

3

相关文档
最新文档