NetApp RAID技术介绍
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
NetApp RAID技术介绍
NetApp可以提供WAFL Optimized intelligent RAID 4(增强型RAID 4) 、双校验盘RAID DP 、SyncMirror和组合型RAID等多种技术手段,不仅满足传统RAID的四种需求目标—安全、经济、效率、扩充,另外对资料安全还提供更多层不影响资料服务的线上防护机制:
Ÿ硬盘区块验证系统 (Block-level checksum),当有一颗硬盘故障时,RAID系统可保护资料不会流失,但是硬盘无故障时,如果某个硬盘的区块 (Block) 资料有错误时,RAID将无法侦测与更正,此时读取的的资料将会错误。WAFL内建硬盘区块验证系统 (Block-level checksum) 功能,在RAID所写入资料的Block 都会加写checksum在每颗硬盘上,每次读取资料时都会同时检查checksum值。若检查不符时,就会利用RAID的Parity将该Block进行修复与更正,如此所读出的资料就可得到正确性的保障了。(专利申请中)
Ÿ硬盘扇区检查系统 (Disk scrubbing),每周WAFL会自动自我扫描检查每颗有资料的硬盘所有区块,检查的周期与时间长度亦可自行调整,于所定的时间内未完成时,也会在下次检查时继续未完成的部分。如此可以提早剔除将会故障的扇区,提供更安全、稳定的硬盘环境,更进一步降低风险。
Ÿ文件系统线上检查系统 (Online File System Check),一般的文件系统检查都必须在离线状态下才能进行(例如 fsck 和 scandisk),不仅需要漫长的等待时间,更造成服务的中断,文件系统容量越大时,服务停顿的时间就越长。为避免任何可能造成文件系统错误的因素,同时避免因着检查而让服务中断,WAFL 具有独步全球的线上进行文件系统检查的能力,进行检查时仍可正常提供资料服务,达到同时兼顾安全、不带来服务停顿的效果。
1.1.1 增强型RAID4+
RAID技术原来分为RAID 1到RAID 5 等几级。最常使用的是RAID 1,3和5。
RAID 0,过去一些人使用其来指磁盘条带化,它基本上是没有校验盘的RAID 4机制。由于磁盘条带之间没有数据冗余,使用RAID这个名词容易引起误解。
RAID 1是简单的磁盘镜像。所有数据在两个单独的盘上重复存在。RAID 1十分安全,但加倍了磁盘存储的成本。
RAID 3是与RAID 4类似,在每组盘中使用单一的校验盘,但是RAID 3中条带划分较小,使得每一个操作都要跨越阵列中所有的磁盘。例如,一个块数据中的
第一个字节可能在第一个盘上,第二个字节在第二个盘上,诸如此类。RAID 3经常处于磁头同步状态以减少等待时间,RAID 3适于单一大文件以高数据率进行读写的应用,诸如超级计算机和图形图像处理。对于多用户并行发起众多互不相关磁盘操作的应用则不适宜。作为对比,RAID4盘组中的每一个数据盘都可以同时满足一个单独用户的请求。
RAID 5与RAID 4类似,但与RAID 4拥有独立校验盘不同,RAID 5在阵列中所有磁盘上存储校验信息。RAID 5的主要的优势在于它可以防止校验盘本身成为读写瓶颈。主要的缺点是不能方便的将一块新磁盘添加到现有的RAID组中。如果要向已有的磁盘组中加入新盘,必须加入一个新的磁盘组。如果一个RAID 5盘组采用8个盘构成,那么新加磁盘必须以8个为一组,一次性添加。
NetApp Filer使用WAFL Optimized intelligent RAID 4(增强型RAID 4) 提供硬盘保护机制。传统的RAID4、RAID5中对文件系统的结构与应用考虑的并不是很多。NetApp采用的增强型RAID4与以上介绍的WAFL文件系统结合非常紧密,并经过了专门的优化。通过同时优化文件系统与RAID机制,NetAppRAID在提供RAID保护机制的同时,没有带来类似RAID 5的性能损耗。同时,RAID结构可以迅速、简便的加以动态扩充。
通过增强型RAID 4,如果一块磁盘上的一个数据块损坏,盘组中的校验盘将重新计算该数据块上的数据。并且该数据块将被映射到磁盘中新的位置上。如果某个磁盘整体损坏,校验盘能防止任何数据丢失。当替换损坏的磁盘时,校验盘被将自动重新计算其内容。
增强型RAID4阵列在同一个盘组中使用一个磁盘作为校验盘,其它作为数据盘。每个磁盘均划分为4KB大小的数据块。一道磁盘条带包括每个数据磁盘的一个数据块和校验盘的数据块。条带中任意一个数据块的数据丢失,均能通过校验计算重新得出。
图 5:增强型RAID 4 磁盘布局
以上图片数字展示了Filer中的增强型RAID4阵列中的条带是如何划分的。我们可以通过简单的数学运算模拟RAID机制。如:
校验数据数据1 数据2 数据3
12 3 7 2
如果数据盘之一失败,例如“数据2”,数据然能通过简单的算术计算重建:
数据2 = 校验数据-数据1-数据3
= 12 - 3 - 2
= 7
实际上,RAID系统中不是采用加减运算,而是采用异或运算来实现RAID功能。但是如果一个条带中出现两处错误,则无法用这种方法重新计算出所有数据。需要依靠下文介绍的NetApp专利技术—RAID DP。
1.1.2 消除校验盘瓶颈
面向UNIX和Windows等操作系统的RAID外围设备厂商较少采用RAID 4,因为在通用文件系统下,RAID4校验盘容易成为瓶颈。但是WAFL文件系统利用其灵活的“任意位置写入文件布局”特性,继承了RAID 4固有的优势,并且避免了其校验盘瓶颈,最大限度的发挥了RAID 4的效率。
WAFL不同于通用文件系统的一个例子是,伯克利快速文件系统(FFS)设计中专门为一次写入一个文件做了优化。结果是可以为不同的文件把数据块散布到磁盘的不同位置上。下图左半部显示了FFS如何为不相关的三个文件分配RAID阵列空间。当例子中每块数据盘仅仅写入2次时,校验盘要做6次写入。更重要的是,校验数据写入分布过于分散,导致磁盘寻道时间消耗。
图 6:伯克利快速文件系统(FFS)和 WAFL文件系统写入空间分配特点