RAID磁盘阵列数据恢复指南
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
RAID磁盘阵列数据恢复指南
RAID磁盘阵列设备,在使用过程中,经常会遇到一些常见故障,这也使得RAID在给我们带来海量存储空间的应用之外,也带来了很多难以估计的数据风险。本文将重点介绍RAID常见故障及相关处理方式。
RAID故障注意事项
1、数据丢失后,用户千万不要对硬盘进行任何操作,将硬盘按顺序卸下来,用镜像软件将每块硬盘做成镜像文件,也可以交给专业数据恢复中心进行。
2、不要对Raid卡进行Rebuild操作,否则会加大恢复数据的难度。
3、标记好硬盘在Raid卡上面的顺序。
4、一旦出现问题,可以拨打专业数据恢复中心的咨询电话找专业工程师进行咨询,切忌自己试图进行修复,除非你确信自己有足够的技术和经验来处理数据风险。
常见Raid 故障及可恢复性分析
1、软件故障:
a.突然断电造成RAID磁盘阵列卡信息的丢失的数据恢复。
b.重新配置RAID阵列信息,导致的数据丢失恢复。
c.如果磁盘顺序出错,将会导致系统不能识别数据。
d.误删除、误格式化、误分区、误克隆、文件解密、命毒损坏等数据恢复工作。
2、硬件损坏:
a.raid一般都会有几块硬盘,其中某一块硬盘出现损坏,数据将无法读取。
b.raid出现坏道,导致数据丢失,这种恢复成功率比较大。
c.如果硬盘同时出现两块以上的损坏,恢复工作非常复杂,成功率比较低。
案例一
2004-9-17,西城区某公司的赵先生拨打了专业数据恢复中心的咨询电话,该公司的一台服务器,不知为何突然无法启动,数据无法读取。该服务器是采用RAID 5的工作方式。数据恢复中心的工程师根据用户的陈述初步判断是硬盘的排列顺序问题。这是一个五块75G的阵列服务器,要做这块硬盘数据,至少要有400G空间。
恢复步骤如下:
* 分别对每块硬盘进行镜像,不要在原盘进行操作,以免造成二次破坏。
* 通过计算首先来判断,硬盘的排列顺序,只有顺序对数据才会出来,否则数据恢复跟本是不可能会出来的。
* 判断完毕这后,对这五个镜像文件来进行恢复。三天后,数据成功找回。
RAID基本知识
RAID 磁盘阵列(Redundant Array of Independent Disks)简单的解释,就是将N台硬盘透过RAID Controller(分Hardware,Software )结合成虚拟单台大容量的硬盘使用,其特色是N台硬盘同时读取速度加快及提供容错性Fault Tolerant,所以RAID是当成平时主要访问Data的Storage不是Backup Solution。
在RAID有一基本概念称为EDAP ( Extended Data Availability and Protection ) ,其强调扩充性及容错机制,也是各家厂商如: Mylex,IBM,HP,Compaq,Adaptec,Infortrend等诉求的重点,包括在不须停机情况下可处理以下动作:
RAID 磁盘阵列支援自动检测故障硬盘。
RAID 磁盘阵列支援重建硬盘坏轨的资料。
RAID 磁盘阵列支援支持不须停机的硬盘备援Hot Spare。
RAID 磁盘阵列支援支持不须停机的硬盘替换Hot Swap。
RAID 磁盘阵列支援扩充硬盘容量等。
一旦RAID阵列出现故障,硬件服务商只能给客户重新初始化或者REBUILD,这样客户数据就会无法挽回。出现故障以后只要不对阵列作初始化操作,就有机会恢复出故障RAID磁盘阵列的数据。
磁盘阵列volume group的划分和segment大小划分的学问
我回来了,还好还活着。消失的这段时间是我来辽宁电视台以来最黑暗的一段时间。盘阵无数次的坏掉。加上上新的系统X-SAN把我们的意志力折磨的已经临近崩溃的边缘,可以说在这1周里,我除了在吃饭睡觉以外剩下都在工作。
我在上班以后头一次感觉到有压力。还好学到了很多知识。让我感觉还有一些欣慰吧,现在唯一的想法就是回家睡觉~~~
这一周把STK几乎所有的工程师都折腾来了,B280那个磁盘总是不争气的,一口气坏掉了6快盘,今天D280还坏掉了一个光纤盘。最后B280的解决办法是把原来的数据倒到了磁带库上面,然后把整个磁盘重新做了Volume Group,这样才解决了这个问题,从中也学到了不少存储的知识。
总结如下:
1,磁盘在更新和安装的时候,尤其是冬天,要把磁盘放置一会,保证磁盘已经到了室内温度,要不会凝结水珠,烧坏设备。
2,在重新做磁盘的时候要选择好为什么样的MDC来进行初始化,比如说这次我们是用2003 cluster做的MDC,就需要用win 2000 or 2003 cluster的格式来进行初始化,不然会出现上次D280做cluster时候的情况(从单机迁移到cluster的时候,cluster总是莫名奇妙的切换)3,segment大小如果设置越大的话磁盘的速度会越快,但是会占用更多的CPU资源和存储空间,从64mb修改到128mb快了将近1倍。
4,FC盘单盘的I/O大概是40mb/s,但是SATA盘只能够达到6.13mb左右。
5,单个卷的I/O速度和这个卷所在盘的volume group的cache总大小成正比,cache越大I/O 越快,比如说EMC的磁盘好,其实只是cache大的原因,盘体基本上都是一样的,无非是那几种。我们的磁盘是STK的B280,SATA盘是MT的,是OEM的LSI的东西。MT的这个盘cache只有8mb,所以是远远不够的。
我们最开始把一个LUN建VG,但是对单个LUN的I/O只有53MB多一些,这样的速度SAN 就没有意义了,当搞到一头雾水的时候我们忽然想到,测试下单个盘的I/O,发现只有6MB 多,我们是9块250G的盘做的RAID5,一个做校验,8块盘的大小大概是1886G左右,这