RAID
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
报告册(RAID)
共七页
姓名:曾亚坤班级:本科一班
RAID概述
RAID是“Redundant Array of Independent Disk”的缩写,中文意思是独立冗余磁盘阵列。
冗余磁盘阵列技术诞生于1987年,由美国加州大学伯克利分校提出。
简单地解释,就是将N台硬盘通过RAID Controller(分Hardware,Software)结合成虚拟单台大容量的硬盘使用。
RAID的采用为存储系统(或者服务器的内置存储)带来巨大利益,其中提高传输速率和提供容错功能是最大的优点。
RAID的功能
1、扩大了存储能力可由多个硬盘组成容量巨大的存储空间。
2、降低了单位容量的成本市场上最大容量的硬盘每兆容量的价格要大大高于普及型硬盘,因此采用多个普及型硬盘组成的阵列其单位价格要低得多。
3、提高了存储速度单个硬盘速度的提高均受到各个时期的技术条件限制,要更进一步往往是很困难的,而使用RAID,则可以让多个硬盘同时分摊数据的读或写操作,因此整体速度有成倍地提高。
4、可靠性RAID系统可以使用两组硬盘同步完成镜像存储,这种安全措施对于网络服务器来说是最重要不过的了。
5、容错性RAID控制器的一个关键功能就是容错处理。
容错阵列中如有单块硬盘出错,不会影响到整体的继续使用,高级RAID控制器还具有拯救功能。
6、对于IDE RAID来说,目前还有一个功能就是支持ATA/66/100。
RAID也分为SCSI RAID和IDE RAID两类,当然IDE RAID要廉价得多。
如果主机主板不支持ATA/66/100硬盘,通过RAID卡,则能够使用上新硬盘的ATA/66/100功能。
RAID 的优点
RAID的采用为存储系统(或者服务器的内置存储)带来巨大利益,其中提高传输速率和提供容错功能是最大的优点。
RAID通过同时使用多个磁盘,提高了传输速率。
RAID通过在多个磁盘上同时存储和读取数据来大幅提高存储系统的数据吞吐量(Throughput)。
在RAID中,可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个磁盘驱动器几倍、几十倍甚至上百倍的速率。
这也是R AID最初想要解决的问题。
因为当时CPU的速度增长很快,而磁盘驱动器的数据传输速率无法大幅提高,所以需要有一种方案解决二者之间的矛盾。
RAID最后成功了。
通过数据校验,RAID可以提供容错功能。
这是使用RAID的第二个原因,因为普通磁盘驱动器无法提供容错功能,如果不包括写在磁盘上的CRC(循环冗余校验)码的话。
RAID容错是建立在每个磁盘驱动器的硬件容错功能之上的,所以它提供更高的安全性。
在很多RAID模式中都有较为完备的相互校验/恢复的措施,甚至是直接相互的镜像备份,从而大大提高了RAID系统的容错度,提高了系统的稳定冗余性RAID的技术规范
(1)RAID技术规范简介
冗余磁盘阵列技术最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用,同时也希望采用冗余信息的方式,使得磁盘失效时不会使对数据的访问受损失,从而开发出一定水平的数据保护技术,并且能适当的提升数据传输速度。
(2)RAID的工作原理
RAID如何实现数据存储的高稳定性呢?我们不妨来看一下它的工作原理。
RAI
D按照实现原理的不同分为不同的级别,不同的级别之间工作模式是有区别的。
整个的RAID结构是一些磁盘结构,通过对磁盘进行组合达到提高效率,减少错误的目的,不要因为这么多名词而被吓坏了,它们的原理实际上十分简单。
为了便于说明,下面示意图中的每个方块代表一个磁盘,竖的叫块或磁盘阵列,横称之为带区。
(3)RAID规范
RAID 0:无差错控制的带区组
要实现RAID0必须要有两个以上硬盘驱动器,RAID0实现了带区组,数据并不是保存在一个硬盘上,而是分成数据块保存在不同驱动器上。
因为将数据分布在不同驱动器上,所以数据吞吐率大大提高,驱动器的负载也比较平衡。
如果刚好所需要的数据在不同的驱动器上效率最好。
它不需要计算校验码,实现容易。
它的缺点是它没有数据差错控制,如果一个驱动器中的数据发生错误,即使其它盘上的数据正确也无济于事了。
不应该将它用于对数据稳定性要求高的场合。
如果用户进行图象(包括动画)编辑和其它要求传输比较大的场合使用RAID0比较合适。
同时,RAID可以提高数据传输速率,比如所需读取的文件分布在两个硬盘上,这两个硬盘可以同时读取。
那么原来读取同样文件的时间被缩短为1/2。
在所有的级别中,RAID 0的速度是最快的。
但是RAID 0没有冗余功能的,如果一个磁盘(物理)损坏,则所有的数据都无法使用。
RAID 1:镜象结构
对于使用这种RAID1结构的设备来说,RAID控制器必须能够同时对两个盘进行读操作和对两个镜象盘进行写操作。
通过下面的结构图您也可以看到必须有两个驱动器。
因为是镜象结构在一组盘出现问题时,可以使用镜象,提高系统的容错能力。
它比较容易设计和实现。
每读一次盘只能读出一块数据,也就是说数据块传送速率与单独的盘的读取速率相同。
因为RAID1的校验十分完备,因此对系统的处理能力有很大的影响,通常的RAID功能由软件实现,而这样的实现方法在服务器负载比较重的时候会大大影响服务器效率。
当您的系统需要极高的可靠性时,如进行数据统计,那么使用RAID1比较合适。
而且RAID1技术支持“热替换”,即不断电的情况下对故障磁盘进行更换,更换完毕只要从镜像盘上恢复数据即可。
当主硬盘损坏时,镜像硬盘就可以代替主硬盘工作。
镜像硬盘相当于一个备份盘,可想而知,这种硬盘模式的安全性是非常高的,RAID 1的数据安全性在所有的RAID级
别上来说是最好的。
但是其磁盘的利用率却只有50%,是所有RAID级别中最低的。
RAID2:带海明码校验
从概念上讲,RAID 2同RAID 3类似,两者都是将数据条块化分布于不同的硬盘上,条块单位为位或字节。
然而RAID 2 使用一定的编码技术来提供错误检查及恢复。
这种编码技术需要多个磁盘存放检查及恢复信息,使得RAID 2技术实施更复杂。
因此,在商业环境中很少使用。
下图左边的各个磁盘上是数据的各个位,由一个数据不同的位运算得到的海明校验码可以保存另一组磁盘上,具体情况请见下图。
由于海明码的特点,它可以在数据发生错误的情况下将错误校正,以保证输出的正确。
它的数据传送速率相当高,如果希望达到比较理想的速度,那最好提高保存校验码E CC码的硬盘,对于控制器的设计来说,它又比RAID3,4或5要简单。
没有免费的午餐,这里也一样,要利用海明码,必须要付出数据冗余的代价。
输出数据的速率与驱动器组中速度最慢的相等。
RAID3:带奇偶校验码的并行传送
这种校验码与RAID2不同,只能查错不能纠错。
它访问数据时一
次处理一个带区,这样可以提高读取和写入速度,它像RAID 0一
样以并行的方式来存放数据,但速度没有RAID 0快。
校验码在
写入数据时产生并保存在另一个磁盘上。
需要实现时用户必须要有三个以上的驱动器,写入速率与读出速率都很高,因为校验位比较少,因此计算时间相对而言比较少。
用软件实现RAID控制将是十分困难的,控制器的实现也不是很容易。
它主要用于图形(包括动画)等要求吞吐率比较高的场合。
不同于RAID 2,RAID 3使用单块磁盘存放奇偶校验信息。
如果一块磁盘失效,奇偶盘及其他数据盘可以重新产生数据。
如果奇偶盘失效,则不影响数据使用。
RAID 3对于大量的连续数据可提供很好的传输率,但对于随机数据,奇偶盘会成为写操作的瓶颈。
利用单独的校验盘来保护数据虽然没有镜像的安全性高,但是硬盘利用率得到了很大的提高,为n-1。
RAID4:带奇偶校验码的独立磁盘结构
RAID4和RAID3很象,不同的是,它对数据的访问是按数据块
进行的,也就是按磁盘进行的,每次是一个盘。
在图上可以这么
看,RAID3是一次一横条,而RAID4一次一竖条。
它的特点的R
AID3也挺象,不过在失败恢复时,它的难度可要比RAID3大得多了,控制器的设计难度也要大许多,而且访问数据的效率不怎么好。
RAID5:分布式奇偶校验的独立磁盘结构
从它的示意图上可以看到,它的奇偶校验码存在于所有磁盘上,
其中的p0代表第0带区的奇偶校验值,其它的意思也相同。
RA
ID5的读出效率很高,写入效率一般,块式的集体访问效率不错。
因为奇偶校验码在不同的磁盘上,所以提高了可靠性,允许单个磁盘出错。
RAID 5也是以数据的校验位来保证数据的安全,但它不是以单独硬盘来存放数据的校验位,而是将数据段的校验位交互存放于各个硬盘上。
这样,任何一个硬盘损坏,都可以根据其它硬盘上的校验位来重建损坏的数据。
硬盘的利用率为n-1。
但是它对数据传输的并行性解决不好,而且控制器的设计也相当困难。
RAID 3 与RAID 5相比,重要的区别在于RAID 3每进行一次数据传输,需涉及到所有的阵列盘。
而对于RAID 5来说,大部分数据传输只对一块磁盘操作,可进行并行操作。
在RAID 5中有“写损失”,即每一次写操作,将产生四个实际的读/写操作,其中两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。
RAID-5的话,优点是提供了冗余性(支持一块盘掉线后仍然正常运行),磁盘空间利用率较高(N-1/N),读写速度较快(N-1倍)。
但当掉盘之后,运行效率大幅下降。
RAID5性能和校验信息算法
从RAID5示意图上可以看到,它的奇偶校验码存在于所有磁盘上,其中的p0代表第0带区的奇偶校验值,其它的意思也相同。
RAID5的读出效率很高,写入效率一般,块式的集体访问效率不错。
因为奇偶校验码在不同的磁盘上,所以提高了可靠性。
但是它对数据传输的并行性解决不好,而且控制器的设计也相当困难。
RAID 3 与R AID 5相比,重要的区别在于RAID 3每进行一次数据传输,需涉及到所有的阵列盘。
而对于RAID 5来说,大部分数据传输只对一块磁盘操作,可进行并行操作。
在RAI D 5中有“写损失”,即每一次写操作,将产生四个实际的读/写操作,其中两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。
RAID5最大的好处是在一块盘掉线的情况下,RAID照常工作,相对于RAID0必须每一块盘都正常才可以正常工作的状况容错性能好多了。
因此RAID5是RAID级别中最常见的一个类型。
RAID5校验位即P 位是通过其它条带数据做异或(xor)求得的。
计算公式为P=D0xorD1xorD2…xorDn,其中p代表校验块,Dn代表相应的数据块,xor是数学运算符号异或。
RAID6:带有两种分布存储的奇偶校验码的独立磁盘结构
名字很长,但是如果看到图,大家立刻会明白是为什么,请注意
p0代表第0带区的奇偶校验值,而pA代表数据块A的奇偶校验
值。
它是对RAID5的扩展,主要是用于要求数据绝对不能出错的场合。
当然了,由于引入了第二种奇偶校验值,所以需要N+2个磁盘,同时对控制器的设计变得十分复杂,写入速度也不好,用于计算奇偶校验值和验证数据正确性所花费的时间比较多,造成了不必须的负载。
我想除了军队没有人用得起这种东西。
RAID7:优化的高速数据传送磁盘结构
RAID7所有的I/O传送均是同步进行的,可以分别控制,这样提高了系统的并行性,提高系统访问数据的速度;每个磁盘都带有高速缓冲存储器,实时操作系统可以使用任何实时操作芯片,达到不同实时系统的需要。
允许使用SNMP协议进行管理和监视,可以对校验区指定独立的传送信道以提高效率。
可以连接多台主机,因为加入高速缓冲存储器,当多用户访问系统时,访问时间几乎接近于0。
由于采用并行结构,因此数据访问效率大大提高。
需要注意的是它引入了一个高速缓冲存储器,这有利有弊,因为一旦系统断电,在高速缓冲存储器内的数据就会全部丢失,因此需要和UPS一起工作。
当然了,这么快的东西,价格也非常昂贵。
RAID10:高可靠性与高效磁盘结构
这种结构无非是一个带区结构加一个镜象结构,因为两种结构各有优缺点,因此可以相互补充,达到既高效又高速还可以的目的。
大家可以结合两种结构的优点和缺点来理解这种新结构。
这种新结构的价格高,可扩充性不好。
主要用于容量不大,但要求速度和差错控制的数据库中。
RAID 50:被称为分布奇偶位阵列条带。
同RAID 30相仿的,它具有RAID 5和RAID 0的共同特性。
它由两组RAID 5磁盘组成(每组最少3个),每一组都使用了分布式奇偶位,而两组硬盘再组建成RAID 0,实验跨磁盘抽取数据。
RAID 50提供可靠的数据存储和优秀的整体性能,并支持更大的卷尺寸。
即使两个物理磁盘发生故障(每个阵列中一个),数据也可以顺利恢复过来。
RAID 50最少需要6个驱动器,它最适合需要高可靠性存储、高读取速度、高数据传输性能的应用。
这些应用包括事务处理和有许多用户存取小文件的办公应用程序。
RAID 53:称为高效数据传送磁盘结构。
结构的实施同Level 0数据条阵列,其中,每一段都是一个RAID 3阵列。
它的冗余与容错能力同RAID 3。
这对需要具有高数据传输率的RAID 3配置的系统有益,但是它价格昂贵、效率偏低。
RAID 1.5:是一个新生的磁盘阵列方式,它具有RAID 0+1的特性,而不同的是,它的实现只需要2个硬盘。
从表面上来看,组建RAID 1.5后的磁盘,两个都具有相同的数据。
当然,RAI D 1.5也是一种不能完全利用磁盘空间的磁盘阵列模式,因此,两个80GB的硬盘在组建RAID 1.5后,和RAID 1是一样的,即只有80GB的实际使用空间,另外80G B是它的备份数据。
如果把两个硬盘分开,分别把他们运行在原系统,也是畅通无阻的。
但通过实际应用,我们发现如果两个硬盘在分开运行后,其数据的轻微改变都会引起再次重组后的磁盘阵列,没法实现完全的数据恢复,而是以数据较少的磁盘为准。
RAID常见故障:
安装需知
先找一个空闲的PCI插槽将该卡插进去并将硬盘用硬盘线和该卡安装连接好,安装完适配卡后,在启动计算机的过程中,你会看到该适配卡已成功安装并被系统识别。
而在系统开机时,其控制器的BIOS会显示硬盘状态的信息,按CTRL+H即可进入结构非常清楚的设置菜单,在这里你可以设定磁盘阵列:两个硬盘可以选择条带模式(RAID 0)和镜像模式(RAID 1),有三块硬盘的话只能选跨越扩充或条带模式,而四块就可以选跨越模式、条带模式或条带结合镜像模式(RAID 0+1),而选用RAID 1
的话硬盘必须进行同步化。
常见安装故障排除
当Rocket100 RAID卡被识别后,板上BIOS开始检测连接设备。
请注意屏幕上出现的设备,如果所连接设备全部被正确扫描出,则说明设备已正确连接并被系统识别,再安装好驱动之后你即可使用RAID功能了。
而如果其中有的设备没有被识别出,你可打开机箱,将所连接设备的电源线是否插牢,必要时换一个电源插头试一试;所连接设备的数据线是否正确连接并已插牢,必要时换一根数据线试一试;如果一根数据线上接有两个设备,请确认这两个设备的主从跳线是否设置冲突(一根数据线上的两个设备必须为一主一从)。
硬盘容量的选择
考虑到系统的操作性能及磁盘的利用率,我们建议你最好使同样容量的硬盘。
但你如果一定要用不同容量的磁盘,需要注意的是整个阵列的容量要由该阵列中最小容量的硬盘决定,例如在由3个磁盘组成的RAID 0阵列中,总容量等于最小磁盘的容量的3倍。
在RAID 1阵列中,目标盘的容量不能小于源盘的容量。
该阵列的总容量就等于最小磁盘的容量。
但是JBOD是个例外,两个或更多的不同容量的硬盘可以组合起来,形成一个逻辑单盘。
BIOS设置须知
IDE RAID卡是即插即用设备,所以,你不必改变系统CMOS。
系统会自动指出中断及端口的地址。
而在CMOS设置中将所有设备处于none或unstalled状态时,即可将IDE RAID卡设为启动卡;或将SCSI设备调为启动序列的第1位,也可将RA ID卡设为启动卡。
RAID损坏了怎么办?
如果一个RAID级别被破坏了,可以按以下操作进行检查:先关闭计算机的电源,检查硬盘电源的连接,以及数据线是否与硬盘和RAID控制卡连接正常再重新开机;如果以上操作仍不能解决问题,可能是硬盘的问题,对于RAID 1和RAID 0+1,可以用一个新的硬盘将已经被破坏的硬盘上的数据进行备份,所有的数据都不会丢失的。
对于RAID 0和JBOD,必须先删除原有的RAID级别,再进行RAID创建,但要注意,此动作会使硬盘的所有数据丢失,所以,对RAID 0和JBOD,请务必经常对数据进行备份。
RAID种类及应用
基于不同的架构,RAID 的种类又可以分为: 软件RAID (软件RAID) ,硬件RA ID (硬件RAID) ,外置RAID (External RAID)
软件RAID很多情况下已经包含在系统之中,并成为其中一个功能,如Windows、Netware及Linux。
软件RAID中的所有操作皆由中央处理器负责,所以系统资源的利
用率会很高,从而使系统性能降低。
软件RAID是不需要另外添加任何硬件设备,因为它是靠你的系统—主要是中央处理器的功能—提供所有现成的资源。
硬件RAID通常是一张PCI卡,你会看到在这卡上会有处理器及内存。
因为这卡上的处理器已经可以提供一切RAID所需要的资源,所以不会占用系统资源,从而令系统的表现可以大大提升。
硬件RAID的应用之一是可以连接内置硬盘、热插拔背板或外置存储设备。
无论连接何种硬盘,控制权都是在RAID卡上,亦即是由系统所操控。
在系统里,硬件RAID PCI卡通常都需要安驱动程序,否则系统会拒绝支持。
磁盘阵列可以在安装系统之前或之后产生,系统会视之为一个(大型)硬盘,而它具有容错及冗余的功能。
磁盘阵列不单只可以加入一个现成的系统,它更可以支持容量扩展,方法也很简单,只需要加入一个新的硬盘并执行一些简单的指令,系统便可以实时利用这新加的容量。
外置式RAID也是属于硬件RAID的一种,区别在于RAID卡不会安装在系统里,而是安装在外置的存储设备内。
而这个外置的储存设备则会连接到系统的SCSI卡上。
系统没有任何的RAID功能, 因为它只有一张SCSI卡;所有的RAID功能将会移到这个外置存储里。
好处是外置的存储往往可以连接更多的硬盘,不会受系统机箱的大小所影响。
而一些高级的技术,如双机容错,是需要多个服务器外连到一个外置储存上,以提供容错能力.外置式RAID 的应用之一是可以安装任何的操作系统,因此是与操作系统无关的。
为什么呢?因为在系统里只存在一张SCSI卡,并不是RAID卡。
而对于这个系统及这张SCSI卡来说,这个外置式的R AID只是一个大型硬盘,并不是什么特别的设备,所以这个外置式的RAID可以安装任何的操作系统。
唯一的要求就是你用的这张SCSI卡在这个操作系统要安装驱动程序。