RAID5同时坏两块硬盘的处理办法
NASRAID5群组磁盘损坏时的不关机更换方法(热抽换)
威连通NAS的RAID群组磁盘损坏时的不关机更换方法(热抽换)QNAP NAS组建RAID 5很多玩QNAP NAS的朋友都会去组RAID,这样可以更好地保护数据,以RAID 5为例,RAID5磁盘镜像就提供了非常严谨的数据安全保护机制。
您可以使用三颗容量相同的硬盘来建立一个RAID 5磁盘阵列。
如果三颗硬盘的容量大小不相同,则RAID 5内所可以使用的硬盘总容量会跟硬盘群中容量最小的那一颗相同。
在写入数据时,RAID 5会将同一份数据写入这三颗硬盘中以确保数据不会因磁盘损毁就造成遗失。
因此,RAID 5特别适合用来储存极重要的数据。
QNAP NAS RAID正常执行时的RAID群组状态当RAID正常地执行时,[储存池]>[储存池RAID群组]内硬盘的状态会显示为正常。
不过,我们都知道,硬盘是有可能损坏的,当硬盘出现故障时,我们又该进行怎么处理呢?首先请按照下面的步骤,来检查磁盘状况∙当硬盘失效时,QNAP NAS会在1.5秒内发出哔声两次。
∙NAS系统状态灯会持续闪烁。
∙检查储存池内的RAID群组页面,其状态会显示为[降级模式]。
RAID群组硬盘出现故障时状态此时,你可以在系统纪录内,查阅硬盘失效或是硬盘组态降级模式(disk volume in degraded mode)的相关错误或警告讯息。
如果你之前设置有报警提示,系统在硬盘出现故障时,也会自动寄送警告email。
不关机,安装新的硬盘以重建RAID 5接下来,请依照以下步骤以热抽换方式更换QNAP NAS中失效的硬盘:•准备一颗新的硬盘以重建RAID 5。
这颗新硬盘的容量必须等于或是大于失效硬盘的容量。
•将新的硬盘装上硬盘拖盘,并将其插入失效硬盘所在的硬盘槽。
Turbo NAS会在1.5秒内发出两次哔声,系统状态灯号会以红色与绿色灯号交错闪烁。
•检查目前储存池RAID群组设定内的硬盘组态状态,该字段会显示出[重建],且显示进度。
∙当硬盘组态重建完成后,系统状态灯号将恢复为绿色灯号,且硬盘群组状态会显示为正常。
Linux RAID5 数据库恢复全过程
Linux RAID5 数据库恢复方案【故障描述】Red Hat RAID5,两块硬盘出现故障,导致RAID5崩溃,进入不了系统,上层数据库不能正常使用。
【解决方案】1、商务流程1、与北亚数据恢复中心签订数据安全救援服务协议、保密协议。
2、实施数据安全救援工作(见技术流程)。
3、进行数据验收A、验收成功:客户签字确认;在约定周期内,完成付款及开具发票流程。
提供后续数据保管、服务跟踪及技术咨询服务。
B、验收不成功,销毁中转数据及已恢复数据,移交设备。
2、技术流程1、前期备份流程A、在备份服务器中准备足够的空间,并将拔出的硬盘以只读方式接入到备份服务器中。
B、使用dd,Winhex等专业备份工具将完好的物理硬盘做全部镜像。
C、使用专业硬件工具对离线的两块硬盘进行只读镜像,两块离线硬盘可能是坏道较多或者是固件损坏,需要先跳过坏道或者修复固件在进行备份;如果这两块硬盘彻底损坏,请跳转到步骤5查看解决方案D、做完全部镜像后,之后的数据恢复操作均不对原始硬盘做任何操作2、重组RAIDA、分析损坏的RAID镜像文件,并依据数据在所有硬盘中的分布规律,找出RAID 条带大小及RAID走向。
B、根据分析得到的RAID信息,结合北亚自主开发的虚拟RAID程序将原始RAID 重组出来。
C、RAID重组完成后,分析数据逻辑卷情况利用开发的程序导出数据逻辑卷。
3、解析文件系统,导出数据库A、对导出的逻辑卷进行分析,并利用自主开发的文件系统解析程序对其进行文件系统解析。
B、校验文件系统是否完整,并对不完整的文件系统进行修复。
C、修复完成后,利用自主开发的程序将所有数据库文件全部导出。
D、把数据库文件移交数据库工程师检测和验证。
4、数据验证A、由用户主导对数据本身进行详细验证。
B、如发现新问题,重新检验上述所有恢复过程。
5、其他情况如果两块硬盘彻底损坏,无法进行只读镜像备份,就是只能从两块正常的硬盘中提取数据库的表结构、记录,以文件的方式存放在恢复服务器上,在重新建立oracle数据库环境,在把提取出来表结构、记录重新导入新的数据库中,这种情况提取出来的记录可能会有缺失,因为两块硬盘故障,会导致条带缺失。
磁盘阵列故障修复方法探析
磁盘阵列故障修复方法探析[摘要] 磁盘阵列是由多个稳定性较高的磁盘,组合成一个大型的磁盘组,磁盘阵列具有扩充性及容错机制两大功能,不同的RAID级别数据容错及读写速度不一样,误操作和硬件故障同样会引起的阵列数据丢失,本文探讨了在磁盘阵列各种故障情况下修复方法。
[关键词] 磁盘阵列容错机制故障修复方法1.引言RAID是将N台硬盘通过RAID 卡(或是软件)组合成虚拟的单台大容量的硬盘使用,其功能是让N台硬盘同时读取,加快数据存取速度及提供容错性,RAID是最重要用途是数据存储和备份。
磁盘阵列是由多个稳定性较高的磁盘,组合成一个大型的磁盘组,在储存数据时,将数据切割成许多区段,分别存放在各个硬盘上,磁盘阵列还能利用同位检查,在阵列中任一个硬盘故障时,可重构数据,在数据重构时,将故障硬盘内的数据,经计算后重新置入新硬盘中,磁盘阵列在停机情况下可处理以下动作:◇自动检测故障硬盘。
◇重建硬盘坏道的资料。
◇支持不须停机的硬盘热备空间(Hot Spare)。
◇支持不须停机的硬盘热备盘自动替换(Hot Swap)。
◇在线扩充硬盘容量。
2.磁盘阵列的工作原理利用RAID技术不仅可以增大存储容量,提高数据传输速率,同时采取冗余信息的方式提供了容错机制,提高了数据存储的可靠性。
实现RAID可用两种方法,一种是硬件RAID,用专门的控制器RAID卡来完成;另一种是软RAID,用软件的方法来实现。
磁盘阵列主要用到以下几种技术:(1)条带化存储RAID通过条带化存储和奇偶校验两个措施来实现其冗余和容错的目标。
条带化存储可以以一次写入一个数据块的方式将文件写入多个磁盘。
条带化存储技术将数据分开写入多个驱动器,从而提高数据传输速率并缩短磁盘处理总时间。
(2)奇偶校验奇偶校验通过对所有数据进行冗余校验实现确保数据的有效性。
利用奇偶校验,当RAID系统的一个磁盘发生故障时,其它磁盘能够重建该故障磁盘。
(3)磁盘镜像镜像是将数据同时写入两个驱动器的技术,如果一个磁盘发生故障,镜像磁盘将接替它进行运行。
RAID5同时坏两块硬盘的处理办法
RAID5同时坏两块硬盘的处理办法两块盘坏掉一般来说处理的方法都是先尝试强行o nline那块后坏的,然后re build恢复rai d后,再利用这个机会换掉那块先坏的,再r ebuil d。
这样所有盘都On line了,不过最好还是换了那块后坏的,再重新re build一次。
不过不是每次都那么幸运,能够强行O nline成功。
如果把先出问题的那块强行ONLIN E,并对后出问题的盘rebui ld的话,数据就完全被毁掉了。
通常来说R AID5中两块,或两块以上硬盘同时出现问题的几率是非常低,但并不代表这种情况不会发生。
最常见的情况是一块硬盘先出问题,在没有发现,或是未及时更换之前,又一块硬盘出现问题,造成服务器瘫痪。
这时候一定要分析哪块盘是后出问题的,因为这块盘上的数据才是最“新鲜”的,与RAID中其他硬盘的数据组合后才是完整,并且可以正常使用的。
当R AID5中两块硬盘出现故障时数据恢复一例廉价冗余磁盘阵列RAID(Redun dantArray of I nexpe nsive Disk)是一种容量大、速度快、可靠性高的外部存储器,现已在各种高性能的服务器、工作站及大中型计算机中得到广泛应用。
其中的RAID5级为无独立校验磁盘的奇偶校验磁盘阵列,采用数据分块和独立存取技术,能在同一磁盘上并行处理多个访问请求,较适用于访问请求频繁的场合,如医院信息系统(HI S)。
由于此技术特点:在一个硬盘出现错误时,当插入新硬盘,能利用其他硬盘上信息对受损数据进行恢复,但当两块硬盘出现错误时,要恢复数据就会有一定的困难了,我们医院在不久前就出现过类似现象。
RAID5磁盘阵列数据恢复
RAID5磁盘阵列数据恢复作者:李清来源:《中国新通信》2013年第10期【摘要】当只有一块磁盘损坏时,RAID5磁盘阵列能通过其它正常运行的磁盘进行异或运算换算出故障磁盘的数据信息,从而保证磁盘阵列存贮信息的完整。
通过研究RAID5结构和数据重组的规律,发现两个以上磁盘同时出现故障或RAID卡失效,也可以恢复故障磁盘阵列的数据。
本文尝试了将RAID5故障磁盘阵列中的磁盘分别制作为磁盘镜像文件,对有故障的磁盘镜像文件进行数据恢复后,按照数据重组原理将这些磁盘镜像文件重组为RAID5镜像盘,成功恢复了图书馆文献管理服务器RAID5故障磁盘阵列中的数据。
【关键词】RAID5数据重组磁盘镜像数据恢复RAID5是一种存储性能、数据安全和存储成本兼顾的存储解决方案,被广泛应用于较重要数据存贮。
RAID5校验位算法原理为:假设RAID5由以块磁盘组成,那么校验位P=D1 XOR D2 XOR D3…XOR Dn(D1,D2,D3…Dn为数据块,P为校验块,XOR为异或运算),如果i号磁盘失效,也就是Di数据块的数据丢失,则通过D1,D2,D3…P,Dn它们之间的异或运算重新计算出来,即Di=D1 XOR D2 XOR D3…XOR P XOR Dn一1[1]。
该原理论证了一个驱动器失效状态下,RAID5磁盘阵列的数据是可以恢复的。
为了挽救数据,对RAID5的结构和数据重组原理进行了深入研究,发现以扇区为单位来描述磁盘数据时,同一扇区的错误小于或等于1,该扇区的完整信息可以通过数据重组和异或运算得以恢复。
据此原理,采用磁盘镜像技术将RAID5故障阵列的磁盘分别制作为磁盘镜像文件,利用磁盘恢复软件对有故障的磁盘镜像文件进行扇区故障修复,最后根据数据重组原理将磁盘镜像文件重组为RAID5镜像盘,可以恢复两个以上驱动器同时出现故障或RAID卡失效的原阵列数据。
一、RAID5结构和数据重组1.1RAID5结构RAID5阵列中的数据是分布到每块硬盘上,RAID5中每个条带组中总有一个条带是校验块[2]。
双盘失效解决方案
本节只介绍双盘失效问题处理案例。
三盘及以上盘失效请联系研发处理。
•本操作方法只适应于RAID失效且该RAID中所有的LUN全部失效的情况。
1.查看RAID类型,确认RAID状态、LUN状态以及失效硬盘的槽位号和时间点。
登录OSM管理界面,找到告警ID为900 的告警:硬盘失效,记录硬盘失效的时间点及先后顺序,如下图:可知(0,8)槽位硬盘先失效,(0,4)槽位硬盘后失效(此项一定要记正确,顺序记反,会导致数据丢失)。
图2图3通过后台登录至Cli模式,输入showrg 获取RAID的ID、类型和状态,输入showlun 获取LUN的ID和状态以及LUN归属的RAID,如下图:其中RAID1的类型为RAID5,状态为fault(失效),其所属的LUN状态全部为失效。
图42.确认硬盘的物理状态和逻辑状态。
通过后台登录至CLI模式,输入showdisk –l和showdisk –p分别获取硬盘的逻辑状态和物理状态,如下图:(0,4)(0,8)逻辑状态为fault,物理状态为nomal.5图63。
修复RAID为降级状态。
a.修复最后失效的硬盘为normal状态。
进入mml命令模式下面,通过(revive disk 框号槽位号)命令操作恢复后失效的硬盘,如下图后失效的为(0,4)槽位硬盘。
注意:如果(0,4)槽位的硬盘物理状态为fault,需要先拔插一下该槽位的硬盘使其物理状态恢复为normal(查看方法同showdisk –p )。
b.修复所有的LUN为normal状态,RAID为降级状态。
c。
修复完硬盘之后,通过(r evive raidlun RAID—ID)命令继续修复所有的LUN为normal,然后退出到cli模式查看RAID的状态会变为降级状态(Degrade).图78d.确认修复完成。
执行完步骤3。
c之后,exit到cli模式,重新查看最先失效的硬盘的状态是否为重构状态(Reconstruction is in process),如果为重构状态则修复完成,如下图(0,8)槽位硬盘的状态为重构状态。
RAID5数据恢复实例
RAID磁盘阵列数据恢复Write by kernel()RAID技术是目前服务器使用较多的一种数据存储技术,它在存储容量、存储安全和存储速度上都有一定的优势。
但是RAID磁盘阵列一旦出现故障,给用户带来的损失也往往最为惨重。
对于服务器来说最常见的就是磁盘物理故障和RAID卡故障。
一旦发现RAID阵列出现故障,不要轻易尝试Rebuild、同步等操作,更不要初始化硬盘。
通过正确的操作是可以帮助你把损失降到最低的。
运气好还可以让服务器“起死回生”。
尽管各个厂家RAID卡的操作界面不一样,但是恢复原理基本是一样的。
下面是我对HP LH3服务器RAID损坏后的一次数据恢复经历,希望能对大家有所帮助。
这是一台HP LH3的PC服务器,磁盘阵列为RAID-5。
超期服役5年多了,相信有不少网管也和我一样每天都在为这些“老爷车”提心吊胆,因为时间长了,不定哪天就死翘翘了,这样的“好事”还就让我碰到了。
上周四这台跑SQLSERVER应用的HP LH3服务器突然宕机了。
鼠标、键盘均无响应,没有任何错误提示,以为是正常的死机了,Reset重新启动,服务器自检的时候提示“Logic disk failed”,硬盘都没有发现,看来是RAID出问题了。
于是就决定查看RAID配置是否正常,重新启动当系统自检到RAID卡时,按照提示按CTRL+M进入HP NETRAID Express Tool界面,不同品牌的服务器RAID卡不一样,进入的方式也不一样,,需要自己注意。
下图是进入HP NETRAID Express Tool界面的提示:“Objects”---->“Physical Drive”如下图:的是可以去买彩票了。
RAID5两块硬盘同时损坏的情况是不常见的,因为RAID卡通常都有自保护动作的。
比如RAID-5阵列,当阵列卡发现有一块硬盘出现问题的时候,会自动 Degrade(降低RAID级别),系统自检的时候也会出现Degrade提示,这样可以降低风险。
raid5数据恢复
raid5数据恢复Raid 5是最常见的raid方式之一,它本身也具有一定的数据保护机制,如果其中的一块盘坏了,插上新磁盘后,将会自动通过其他磁盘上的校验码实现数据恢复。
但是,这样的机制对于数据保护机制是不够的,万一出现下面这些情况怎么办呢?依次或同时出现多个磁盘的失败引电压的不稳定造成了系统的故障由于过大温差引起的硬件故障RAID数据被删除或格式化在服务器和NAS的固件上发送故障RAID控制器发生故障新初始化RAID 5需要恢复数据德国的一家专门进行raid 5数据恢复的公司总结了一些常见的raid5恢复问题三个硬盘中有两个坏了,是从RAID 5中恢复数据的可能吗?在大多数情况下,在两个有缺陷的磁盘上可以恢复数据。
但是,至少需要清洁室中的两个故障硬盘驱动器中的一个被恢复。
之后,可以从碎片和奇偶校验数据中挽回剩余的RAID 5数据。
我们尽可能使用手动和专有的半自动程序保存数据。
这使得恢复的数据质量非常高。
RAID 5数据恢复有多昂贵?RAID 5数据恢复的成本取决于RAID 5配置(标准或特定)有缺陷的硬盘(或SSD)已经执行数据恢复尝试(通常会导致更多的努力)是数据覆盖,例如重建失败?经过RAID 5分析后,我们可以确定需要多少努力来恢复数据。
同时,您将收到RAID 5数据恢复的固定价格。
哪些文件系统允许RAID 5数据恢复?在RAID 5阵列发生故障的情况下,使用操作系统(Windows,Linux,MacOS等)和RAID卷上使用的文件系统在数据恢复中起初不起决定性作用。
所以这是可能的所有文件系统。
当涉及到删除数据,格式化的RAID驱动器和其他逻辑损坏(快照删除等)时,所使用的文件系统与数据恢复工作以及成功的可能性相关得多。
这些文件系统通常是RAID 5数据恢复NTFS(Windows)FAT32(Windows)Ext3,Ext4BtrFS(各种NAS制造商,Windows,Linux)HFS / HFS +(苹果/ Mac)APFS(也是Mac)vmFS(vmWare文件系统)RAID 5消失了,我可以交换磁盘进行测试吗?在很多情况下,任意更换RAID 5中的磁盘顺序都会导致RAID数据的大量恶化。
RAID5中两块硬盘出现损坏的恢复技巧
2、弄乱磁盘阵列中的磁盘顺 序。在RAID5的中数据块和数据奇 偶校验块是按系统设定的顺序存储 的,且前后位置是固定不变的,一 旦磁盘顺序搞错,系统还会按原来 的顺序读取磁盘上的数据,这样会 导致数据丢失。
文章来源:天盾数据恢复中心官网
RAID5故障原因和恢复方法
3、磁盘的意外掉电脱机 磁盘的意外脱机和掉电都会导致 数据丢失,所以为了保持系统不停 机、不中断,在更换故障盘时一般 都要采用热插拔。在对第一块故障 盘进行更换前,最好对RAID5阵列 上的数据进行一次完全备份。
RAID5中两块硬盘出现损坏的 恢复方法
文章来源:天盾数中心官网
一、前言 二、RAID5故障原因和恢复方法
三、结语
文章来源:天盾数据恢复中心官网
一、前言
RAID5技术的磁盘阵列,采 用了奇偶校验技术提供数据冗余信 息,大幅提高了系统和数据的安全 性,固然RAID5的安全级别较高, 但在实际运用中还是会发生的损坏 和丢失的情况。下面介绍RAID5的 常见故障和数据恢复方法。
文章来源:天盾数据恢复中心官网
RAID5故障原因和恢复方法
4、咨询专业的数据恢复中心 磁盘阵列遇到故障导致数据丢失时 ,第一时间咨询国内较专业的天盾 数据恢复中心为你恢复数据,十余 年的数据恢复经验和强大的技术支 持,能最大程度上为您挽回损失。
谢谢观看!
文章来源:天盾数据恢复中心官网
文章来源:天盾数据恢复中心官网
二、RAID5故障原因和恢复方法
1、组成RAID5的磁盘有具有 相近的使用寿命 有些组成RAID5的可能是使用期 限、性能相同的磁盘,如果其中一 块出现故障,其他也可能接近使用 寿命,如没及时处理好第一块磁盘 带来的故障,raid5无法读取数据
RAID5双盘损坏,如何快速恢复数据
数据安全保障,但保障程度要比Mirror低而磁盘空间利用率要比Mirror高。RAID 5
具有和RAID 0相近似的数据读取速度,只是多了一个奇偶校验信息,写入数据的 速度比对单个磁盘进行写入操作稍慢。同时由于多个数据对应一个奇偶校验信息, RAID 5的磁盘空间利用率要比RAID 1高,存储成本相对较低。 4
RAID5磁盘阵列优缺点
RAID 5不对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储 到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同 的磁盘上。当RAID5的一个磁盘数据发生损坏后,利用剩下的数据和相应的奇偶 校验信息去恢复被损坏的数据。
RAID 5可以理解为是RAID 0和RAID 1的折衷方案。RAID 5可以为系统提供
RAID5磁盘阵列优缺点
RAID5模式并不是完全没有缺点,如果阵列当中某块硬盘上的信息发生了改 变的话,那么就需要重新计算文件分割碎片,并且,校验信息也需要重新计算, 这时,三个硬盘都需要重新调用那么整个系统性能将会降下来。如果要做RAID5 阵列的话,最好使用相同容量相同速度的硬盘。
RAID5磁盘阵列如何实现
RAID5双盘损坏,如何快速恢复 数据?
天盾数据恢复中心
目录
前言
RAID5磁盘阵列优缺点
RAID5磁盘阵列如何实现 RAID5磁盘阵列数据丢失原因 RAID5双盘损坏后数据恢复 结语
前言
RAID5硬盘损坏, 怎么恢 复数据?RAID5双盘失效怎么 办? 本文就将带大家一起来了 解RAID磁盘阵列的优缺点, 硬盘结构以及RAID5硬盘损坏 后如何快速恢复数据。
另外,这三块硬盘的任务也是随机的,也就是说在这次存储当中可能是1号硬
盘和2好硬盘用来存储分割后的文件碎片,那么在下次存储的时候可能就是2号硬 盘和3号硬盘来完成这个任务了。
浅谈存储raid5及其运行过程中遇两块硬盘出错问题的解决方法
建议方案 :
R A I D组和热备盘经常查看状态 ,并定期做好 重 要数据的备份工作 二、操作系统层面增强备份机制 , w i n d o w s 下面的动
一
、
态 硬 盘 的镜 像卷 功能 三、 维护存放存储环境 , 避免静 电及灰尘的干扰 参 考 文献 : [ 1 ] 张子 强 . 浅谈 R AI D 技 术 与硬 盘 存储 技 术 的 发 展 Ⅲ. 中国有线 电视. 2 0 0 3 , 5 : 2 5 — 2 6 . 【 2 】 汪 中夏、 张京生、 刘伟. A I R D数据 恢复技 术揭秘 . 清 华 大 学 出版 社 . 2 0 1 0 — 1 2
RAID5数据恢复的两种办法
32(编号0~31)。2
1.img)的首个块。3号块不论在哪个硬
号块最后扇区(31号扇区)和3号块首个扇区(32号扇
在内容肯定是是紧密相连的。关键是看3号块在哪个盘。
号块最后扇区内容是DBR(EB5290)即1.img的31号扇区。
RAID中,则1.img的32号扇区就应该是
RAID5故障后就任务硬盘没有用了,
块走向”,先假定“P块走向”是1、
、3,因为1.dsk的首个P块第二个块,所以1.dsk就是第
P块走向图,1.dsk的0扇区应该是阵列的起
EBR,但实际上却是空扇区。所以我们
1,2,的P块顺序了。
P块走向为3,2,1,再结合已知的“各个硬盘上首个P
第一块是2.img,第二块是1.img,
3.img。
RAID5有五个关键参数:阵列起始扇区、每块扇区数、盘
P代表)块走向、数据块走向!如果这五个参
raid5恢复数据。
512个字节全是00的扇区!
一个RAID5由若干块硬盘组成,不同硬盘上的同
P扇区!
1:确定所有磁盘的首个校验块
的3145857号扇区是P扇区。 3145793MOD96=65,
数据恢复的两种办法
RAID5发生故障的原因可能有很多种,或者是RAID控
RAID信息出错,也有可
RAID5的一块硬盘出错,没及时更换,等到第二块硬盘出
RAID5失效。第一种情况,RAID5发生硬件故
RAID5是由RAID卡/芯片生成的(硬RAID5)
NTFS。在讲述具体案例前,我们先介绍一
号扇区隶属于2.img上的首个P块,所以2.img上的首个
块是第三个块;
,1号扇区隶属于3.img上的首个P块,
关于为什么RAID5往往掉一个盘后第二个盘也立刻挂掉的原因分析
为什么RAID5掉一个盘后第二个盘也立刻挂掉的原因分析(原作者为CCF论坛的Sharin大)很多人遇到过服务器RAID5挂掉,往往掉一个盘后,第二个盘也立刻挂掉。
大家都知道RAID5 一次允许一个盘缺失,如果挂掉两个盘,数据就玩完了。
理论上两个硬盘同时失效的概率是很低的,但为什么会这样呢?今天刚好在测试一个ZFS阵列,能清晰地进行数据校验并看到结果,于是正好分析了一下原因。
这里首先要引入一个一般人不常接触到的概念:BER 硬盘误码率,英文是BER(Bit Error Rate),是描述硬盘性能的一个非常重要的参数,是衡量硬盘出错可能性的一个参数。
这个参数代表你写入硬盘的数据,在读取时遇到不可修复的读错误的概率。
(不能恢复的ECC读取错误)从统计角度来说也比较少见,一般来说是指读取多少位后会出现一次读取错误。
随着硬盘容量增加,驱动器读取数据的误读率就会增加,而硬盘容量暴涨,误码率的比例一直保持相对增加。
一个1TB的驱动器是需要更多读取整个驱动器,这是在RAID重建期间发生错误的概率会比300G 驱动器遇到错误的几率大。
那这个错误的几率到底有多大呢?或者说,我们写入多少GB数据,才会遇到1byte的读取错误呢?看这篇文章:/docs/scsi-sata-reliability/对于不同类型的硬盘(以前企业级、服务器、数据中心级硬盘用SCSI/光纤,商用、民用级别是IDE;现在对应的则是SAS/SATA);他们的MRBF(平均无故障时间)是接近的,但是BER便宜的SATA硬盘要比昂贵的SCSI硬盘的误码率(BER)要高得多。
也就是说,出现某个sector无法读取的情况,SATA要比SCSI严重得多。
这两种硬盘(企业级的SCSI/ FC/ SAS 磁盘)/(商用/民用级的IDE/SATA)BER 的差距大概是1-2个数量级。
按照文中的计算,一个1TB的硬盘,通常你无法读取所有sector的概率达到了56%,因此你用便宜的大容量SATA盘,在出现硬盘故障的情况下重建RAID的希望是:无法实现。
应用:RAID5磁盘阵列的故障以及修复要点
RAID5磁盘阵列的故障以及修复要点磁盘阵列也会发生故障,在发生故障时我们应该怎么做呢?本文将为大家简单介绍RAID5磁盘阵列的故障以及修复要点。
1.若单个硬盘失效,尝试热插拔,即拔下来再插上去;如果不能解决,则进入RAID配置界面,将该硬盘进行ForceOnLine操作;如果不能解决,尝试更换其它硬盘插槽(一定不要改变磁盘顺序);如果不能解决,尝试将该硬盘格式化后插入,然后使用ReBuild操作;如果不能格式化,基本是硬盘物理错误严重,尝试更换硬盘后重建数据。
RAID5磁盘阵列允许硬盘的热插拔。
更换损坏的硬盘时,首先拔下硬盘托架(硬盘固定在托架上),从托架上卸下损坏的硬盘,再把完好的硬盘安装在托架上,插入阵列里。
如果一切正常,这时RAID5磁盘阵列会马上自动进入数据重建状态。
这个过程会进行数个到20几个小时。
这里要注意几点:(1) 更换损坏硬盘前,必须查看阵列的当前状态,保证除损坏的硬盘外,其他硬盘处于正常的ONL在线状态。
(2) 更换坏盘必须及时。
(3) 更换的新硬盘必须是完好的。
(4) 在阵列数据重建完成之前,不能插拔任何硬盘。
2.如果多块硬盘失效,先将部分(不要全部同时上线)硬盘强制上线,然后进入操作系统尝试读取数据,如果能够读取,再将其它硬盘上线,然后重建数据。
3.如果SCSI卡损坏导致配置信息丢失,更换卡后,尝试从硬盘读取配置信息(需要阵列支持此功能)。
4.如果所有磁盘上线后,操作系统无法访问RAID(资源管理器中无相应盘符),尝试进入“计算机管理”-->“磁盘管理”查看阵列状态;如果处于“未初始化”状态,可以尝试使用数据恢复软件逐磁道扫描以恢复数据,此时万万不可进行RAID初始化操作。
5.不要过于依赖RAID,如有条件或特别重要的资料,仍需要刻录光盘或使用磁带机以备万一。
6.如有条件,最好给阵列加配UPS。
7.出现问题以后,不要急于开始RAID数据修复及RAID配置,先给厂家打免费电话寻求帮助,以及到各大数据恢复公司的网站查询,自己不能确定的操作不要去尝试,以免造成更大的损失,导致不可挽回的错误,给自己留下遗憾8,热备盘的更换热备盘总是和RAID5磁盘阵列对应起来,如果不是RAID5级别的阵列,就没有必要创建热备盘。
raid10和raid5笔记以及raid5为什么遇到连续坏2块磁盘
raid10和raid5笔记以及raid5为什么遇到连续坏2块磁盘raid10和raid5⽐较raid0+1 也就是raid10raid10最少4个盘,raid5⾄少3个盘结论:频繁的数据库读写的话,⾮常推荐使⽤raid10,也就是说⽇常数据库的话,使⽤raid10ssd的随机读写能⼒秒杀各种sas和sata盘做数据库的话,raid10的读写速度⾼于raid5,还要看raid卡的性能你简单的对⽐⼀下就知道了,⽐如 500G的硬盘,你要⽤raid10组成1T的空间,要4块硬盘,raid 5只需要3块,但是前者的读取速度是4X,后者是2X,前者的写⼊速度是2X,后者取决于控制器的能⼒;因此很明显的 raid 的读写速度均超过后者;你可以在任务控制器⾥⾯观察⼀下你的数据库进程,看看读与写的操作哪种⽐较多;如果读取的操作多,那么raid 5可以考虑⼀下,他⽐raid10慢⼀些,但是省了些银⼦;如果写操作很多,那么还是考虑raid 10吧,因为raid 5的写速度慢太多了。
raid5为什么有时候会坏2块盘RAID5往往⼀次挂两个的原因——不是⽤户RP问题,从BER ⾓度来说,是硬盘其实早坏鸟,我们没发现⽽已。
当某个硬盘因为MTBF原因整个挂掉,有问题的BER 扇区开始跳出来作梗,于是RAID5就完蛋鸟。
我们也能总结遇到RAID5⼀次挂掉俩盘的概率:1. 使⽤越⼤容量的硬盘做RAID5,遇到BER 扇区的概率越⼤;⽐如⽤100G硬盘做RAID5就⽐⽤1TB的安全;2. 使⽤越多盘数的硬盘做RAID5,遇到BER 扇区的概率越⼤;⽐如⽤3个盘做的RAID5,⽐6个盘做的RAID5安全;3. 使⽤越便宜的硬盘做RAID5,遇到BER 扇区的概率越⼤;⽐如⽤SCSI/FC/SAS盘⽐⽤IDE/SATA的RAID5安全;4. RAID5⾥⾯存放的数据越多,塞得越满,遇到BER 扇区的概率越⼤;⽐如存了100G数据的⽐存了1TB数据的RAID5安全;。
RAID5同时坏两块硬盘的处理办法
RAID5同时坏两块硬盘的处理办法RAID5同时坏两块硬盘的处理办法两块盘坏掉一般来说处理的方法都是先尝试强行online那块后坏的,然后rebuild恢复raid后,再利用这个机会换掉那块先坏的,再rebuild。
这样所有盘都Online了,不过最好还是换了那块后坏的,再重新rebuild一次。
不过不是每次都那么幸运,能够强行Online成功。
如果把先出问题的那块强行ONLINE,并对后出问题的盘rebuild 的话,数据就完全被毁掉了。
通常来说RAID5中两块,或两块以上硬盘同时出现问题的几率是非常低,但并不代表这种情况不会发生。
最常见的情况是一块硬盘先出问题,在没有发现,或是未及时更换之前,又一块硬盘出现问题,造成服务器瘫痪。
这时候一定要分析哪块盘是后出问题的,因为这块盘上的数据才是最“新鲜”的,与RAID中其他硬盘的数据组合后才是完整,并且可以正常使用的。
当RAID5中两块硬盘出现故障时数据恢复一例廉价冗余磁盘阵列RAID(Redundant Array of Inexpensive Disk)是一种容量大、速度快、可靠性高的外部存储器,现已在各种高性能的服务器、工作站及大中型计算机中得到广泛应用。
其中的RAID5级为无独立校验磁盘的奇偶校验磁盘阵列,采用数据分块和独立存取技术,能在同一磁盘上并行处理多个访问请求,较适用于访问请求频繁的场合,如医院信息系统(HIS)。
由于此技术特点:在一个硬盘出现错误时,当插入新硬盘,能利用其他硬盘上信息对受损数据进行恢复,但当两块硬盘出现错误时,要恢复数据就会有一定的困难了,我们医院在不久前就出现过类似现象。
一、故障重现我们医院硬件配置为:HP LH6000 PIII700 Xeon 512M内存,18G硬盘一块Ⅹ2台,作两机容错,*作系统为Windows NT SP4,数据库平台为Oracle 7.3,光纤为主干的星形拓扑网络,HP磁盘阵列柜一台,四块18G IBM');" href="javascript:;" target="_self">IBM硬盘做RAID5用以存放HIS系统数据,分别标为硬盘ID0、ID1、ID2和ID3。
利用空闲空间抗两个磁盘失效的RAID5阵列算法
冗余磁盘阵列是一个 比较 良好的选择, 冗余磁盘阵列使用冗余磁
盘为数据恢复提供了可能。 [ 2 ] R A I D 5 是 一 种 容 灾 性 较 好 的 冗 余 磁 盘 阵 列 。R a i d 5阵 列 具 有 N - 1的特 性 , 即 n个 磁 盘 组 成 的 阵 列 中, 当 任 意 一块 磁 盘 失 效 的 时候 , 其 余 的 磁 盘 能 够 通 过 技 术 手 段恢复失效磁盘的数据 [ 3儿 4 儿 5 ] 。
f a i l u r e o f R A I D 5 a r r a y i n c r e a s e b y 5 0 % , n u m b e r o f t o l e r a t e d s t o r e d d a t a b l o c k s l o s s i n c r e a s e d b y 2 5 % ,d i s k s p a c e u ti 1 i z a t i o n b y 2 5 % . Ke y wor d s: R A I D 5: a r r a y: a l g o r i t h m : t w o — d i s k s — f a i l u r e
.
w e d e s i g n a n e w R A I D 5 a r r a y a l g o r i t h m , i n c l u d i n g s t o r a g e a l g o r i t h m a n d r e b u i l d a l g o r i t h m . i n t h e c a s e
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
RAID5同时坏两块硬盘的处理办法
两块盘坏掉一般来说处理的方法都是先尝试强行online那块后坏的,然后rebuild恢复raid后,再利用这个机会换掉那块先坏的,再rebuild。这样所有盘都Online了,不过最好还是换了那块后坏的,再重新rebuild一次。不过不是每次都那么幸运,能够强行Online成功。如果把先出问题的那块强行ONLINE,并对后出问题的盘rebuild的话,数据就完全被毁掉了。通常来说RAID5中两块,或两块以上硬盘同时出现问题的几率是非常低,但并不代表这种情况不会发生。最常见的情况是一块硬盘先出问题,在没有发现,或是未及时更换之前,又一块硬盘出现问题,造成服务器瘫痪。这时候一定要分析哪块盘是后出问题的,因为这块盘上的数据才是最“新鲜”的,与RAID中其他硬盘的数据组合后才是完整,并且可以正常使用的。
3、在处理故障时应将服务器与网络的连接切断,因为在恢复网络,受损硬盘修复的过程中,会有用户登录至服务器,进行数据操作,从而产生新的数据,这样就有可能产生新的逻辑错误,对于故障的排除非常不利。
4、经过此次故障,我们认为任何先进的技术手段都不可能是万无一失的,如果要确保数据安全,就一定要做好备份工作,最好每天作一次数据库的异地备份;并至少备好一块新硬盘,以便在第一块硬盘出现错误时就能及时换上,进行数据恢复,防止以上类似事件的再次发生.
四、个案总结
在经过了长达6小时的紧张的数据抢救后,我们终于成功的恢复了数据,经过此次惊心动魄的数据拯救后,我们痛定思痛,总结了以下几条经验:
1、在出现问题后不能紧张,应冷静分析故障原因,全面了解硬件知识,作出正确合理的判断,以最小的代价解决问题。在我们此次故障处理过程中,我们对故障的进行了合理的分析,运用了服务器硬盘可热插拔的性能特点,在保证另两块硬盘数据完整的基础上,进行了正确的数据拯救,从而确保了故障的圆满解决。
三、数据拯救
1、打开磁盘阵列柜,启动主域服务器,自检至阵列柜时按Ctrl+M进入NetRaid管理程序,查看阵列信息,发现硬盘ID0与硬盘ID2状态为Failed,运用修改配置将硬盘ID0强制OnLine,重新启动服务器,在进入NT前的硬件自检时,出现硬盘ID2,ID0依次闪红灯,访问D盘失败。
3、关闭磁盘阵列柜,将磁盘阵列柜上的所有四块硬盘全部拔除,启动主域服务器,正常进入NT,打开磁盘阵列柜,用NT下的HP NetRaid管理软件,将硬盘ID0进行热插拔,软件能检测到此硬盘,并无任何错误提示,依次将硬盘ID1,ID2,ID3进行热插拔,但在进行至硬盘ID2时软件检测不到此硬盘,立刻将其拔除,换上一块新硬盘,此时四块硬盘状态为Ready,全部选中后新建RAID5信息,成功后将硬盘ID2状态置为Failed,然后进行Rebuild,运用RAID5技术恢复这块真正失效的硬盘上的数据。但当进度到达50%左右时,出现错误提示,重新启动服务器,进入NT后,系统自动进行CHKDSK,出现修复硬盘信息,无任何错误提示,在磁盘正常自检后访问D盘成功。此时时间18:00分左右。
1、硬盘ID2在早上7:30时出现闪红灯现象,其余硬盘正常,无出错提示。
2、硬盘ID0在下午14:5时,服务器屏幕上出现出错提示框:D盘(即阵列盘)不能访问。依次关掉备份服务器、主域服务器、磁盘阵列柜后保护现场,开始分析故障原因,处理故障。
2、在处理问题时应遵循由简单到复杂,由安全到危险的原则,应确保不破坏数据的原则下进行故障处理。硬盘内的数据信息对我们医院来说,是非常重要的,处理故障的过程也就是我们拯救数据的过程,因此我们在故障处理过程中没有
进行一味的蛮干,在清除磁盘阵列信息的同时,并没有对硬盘内数据进行任何操作,从而确保了数据的安全性。
当RAID5中两块硬盘出现故障时数据恢复一例
廉价冗余磁盘阵列RAID(Redundant Array of Inexpensive Disk)是一种容量大、速度快、可靠性高的外部存储器,现已在各种高性能的服务器、工作站及大中型计算机中得到广泛应
用。其中的RAID5级为无独立校验磁盘的奇偶校验磁盘阵列,采用数据分块和独立存取技术,能在同一磁盘上并行处理多个访问请求,较适用于访问请求频繁的场合,如医院信息系统(HIS)。由于此技术特点:在一个硬盘出现错误时,当插入新硬盘,能利用其他硬盘上信息对受损数据进行恢复,但当两块硬盘出现错误时,要恢复数据就会有一定的困难了,我们医院在不久前就出现过类似现象。
二、故障分析
RAID5技术原理是:采用磁盘冗余技术和磁盘校验技术,将数据分布在磁盘阵列中的各个磁盘上,这样做可以提高数据的可靠性和读取数据时的速度。如果阵列中的某一个硬盘失效时,能运用上述技术,利用阵列中其他硬盘的信息,恢复失效硬盘中的数
据,但如果有一个以上的硬盘同时失效时,在技术上来说数据是不可恢复的。结合我院出现的实际情况,我们分析:有可能是由于硬盘ID2出现错误后,数据的读取量增大,导致另三个硬盘在进行冗余校验时可能出现逻辑错误,而并不是出现了真正的物理损坏或失效。基于以上分析,我们在保证数据完整性的原则下,开始拯救数据。
2、打开磁盘阵列柜,启动主域服务器,自检至阵列柜时按Ctrl+M进入NetRaid管理程序,选择磁盘阵列,将阵列配置信息清空,然后新建磁盘阵列信息(不作初始化),并将硬盘ID2与ID0强制OnLine后,重新启动服务器,在进入NT前的硬件自检时,出现硬盘ID2,ID0依次闪红灯,访问D盘失败。
一、故障重现
我们医院硬件配置为:HP LH6000 PIII700 Xeon 512M内存,18G硬盘一块Ⅹ2台,作两机容错,*作系统为Windows NT SP4,数据库平台为Oracle 7.3,光纤为主干的星形拓扑网络,HP磁盘阵列柜一台,四块18G IBM');" href="javascript:;" target="_self">IBM硬盘做RAID5用以存放HIS系统数据,分别标为硬盘ID0、ID1、ID2和ID3。下面是当时故障的重现: