收费服务器磁盘阵列(RAID)中硬盘故障的处理分析
服务器磁盘阵列常见问题及解决方法
一般问题检查 SCSI 电缆。
阵列中的一个硬盘驱动器发生故障。
请替换该如果 SCSI 电缆没有问题,驱动器。
重新建立阵列。
特定 SCSI ID 上的一个驱动器重复替换 SCSI 电缆。
发生故障。
检查每个通道上的驱动器 ID,确保并尝试进行新配置于启动时按下每个设备有不同的 ID。
时,系统停止响应。
检查以确保内部连接和外部连接未占用相同的通道。
确定该通道已经过正确的终结处理。
通道尾端的设备必须经过终结处理或电缆上必须已经连接一个终结器。
检查以确保 RAID 控制器已经正确安置在插槽中。
替换驱动器电缆。
按并不显示菜单。
必须有彩色显示器才能显示 BIOS 公用程序菜单。
已经安装 RAID 控制器的系统 POSTRAID 控制器高速缓存可能已经损坏或遗(开机自测)时,BIOS 标题显示为失。
乱码或完全不显示。
无法快闪刷新或更新固件。
联系 Dell 支持人员以寻求协助。
小心:检查一致性或进行后台初始化过程时,请不要执行固件快闪更新,否则可能会失败。
确保已正确地为每个外围设备提供Firmware Initializing.....电源。
)出现并停(正在初始化固件.....确保已经使用为外围设备建议的终留在屏幕上。
结器,正确终结处理每个 SCSI 通道的尾端。
如果只有一根电缆连接到通道,则 RAID控制器会自动对通道进行终结处理。
BIOS 启动错误消息制器监控程序停止运行)(致命错误:控制器核心自测失败)Fatal Error: ControllerKernel PANIC!!(致命错误:控制器核心发生严重错误!!)Fatal Error: SDRAMinitial pattern testfailed(致命错误:SDRAM 初始模式测试失败)若要解决问题,如果内部适配器诊断失败,Controller POST command 请快闪在 Controller 可能导致此问题。
Configuration(控制器配置)菜单中,按以将设置还原为默认值。
磁盘阵列的故障诊断与恢复技术研究
磁盘阵列的故障诊断与恢复技术研究随着数据存储的重要性日益增长,数据安全和恢复成为了越来越重要的问题。
磁盘阵列(RAID)是一种将多个磁盘组成数组来提高数据存储和可靠性的技术。
然而,RAID系统也可能会遭遇故障,例如磁盘故障、控制器故障等。
这时候,故障诊断和恢复技术就显得非常关键了。
一、磁盘阵列的结构和工作原理了解RAID的结构和工作原理是理解故障诊断和恢复技术的基础。
RAID有多种不同的级别,例如RAID 0、RAID 1、RAID 5等。
其中,RAID 0只将数据通过条带化(striping)的方式分配到多个磁盘上,因此可以提高存储速度,但没有冗余,一旦其中一个磁盘损坏,所有数据都可能丢失。
相比之下,RAID 1通过镜像技术将数据同时存储在两个磁盘上,并且在一个磁盘损坏时可以从另一个磁盘上读取数据。
RAID 5则将数据分成多个块,并附加校验信息存储在不同的磁盘上,这样可以提高存储容量和冗余性。
当一个磁盘损坏时,RAID 5可以使用校验信息来重建丢失的数据。
二、磁盘故障的诊断和处理磁盘故障是RAID中最常见的问题之一。
如果一个磁盘损坏,RAID系统将自动从其他磁盘上重建数据。
但是,如果多个磁盘同时出现故障,或者重建失败,RAID系统将无法正常工作。
在这种情况下,必须对磁盘进行诊断和处理。
诊断磁盘故障需要使用专门的工具和技术。
例如,可以使用磁盘健康检查工具来扫描磁盘并检测任何错误和损坏。
如果硬件出现故障,则需要更换受损部件。
如果RAID控制器本身出现故障,则可能需要更新控制器固件或更换整个控制器。
三、数据恢复技术当RAID系统无法自动重建数据时,必须使用数据恢复技术。
在进行数据恢复之前,需要先制定恢复计划和恢复方案。
这包括确定丢失的数据和确定如何将数据从受损的磁盘中恢复出来。
常用的数据恢复技术包括数据恢复软件、数据恢复服务和数据恢复专家。
数据恢复软件可以扫描受损的磁盘并尝试恢复数据。
数据恢复服务则需要将受损的磁盘寄送给数据恢复公司,由公司的专业人员使用高端工具和技术恢复数据。
磁盘阵列(RAID)常见故障排除技巧
常见安装故障排除
当Rocket100 RAID卡被识别后,板上BIOS开始检测连接设备。请注意屏幕上出现的设备,如果所连接设备全部被正确扫描出,则说明设备已正确连接并被系统识别,再安装好驱动之后你即可使用RAID功能了。而如果其中有的设备没有被识别出,你可打开机箱,将所连接设备的电源线是否插牢,必要时换一个电源插头试一试;所连接设备的数据线是否正确连接并已插牢,必要时换一根数据线试一试;如果一根数据线上接有两个设备,请确认这两个设备的主从跳线是否设置冲突(一根数据线上的两个设备必须为一主一从)。
硬盘容们建议你最好使同样容量的硬盘。但你如果一定要用不同容量的磁盘,需要注意的是整个阵列的容量要由该阵列中最小容量的硬盘决定,例如在由3个磁盘组成的RAID 0阵列中,总容量等于最小磁盘的容量的3倍。在RAID 1阵列中,目标盘的容量不能小于源盘的容量。该阵列的总容量就等于最小磁盘的容量。但是JBOD是个例外,两个或更多的不同容量的硬盘可以组合起来,形成一个逻辑单盘。
RAID损坏了怎么办
如果一个RAID级别被破坏了,可以按以下操作进行检查:先关闭计算机的电源,检查硬盘电源的连接,以及数据线是否与硬盘和RAID控制卡连接正常再重新开机;如果以上操作仍不能解决问题,可能是硬盘的问题,对于RAID 1和RAID 0+1,可以用一个新的硬盘将已经被破坏的硬盘上的数据进行备份,所有的数据都不会丢失的。对于RAID 0和JBOD,必须先删除原有的RAID级别,再进行RAID创建,但要注意,此动作会使硬盘的所有数据丢失,所以,对RAID 0和JBOD,请务必经常对数据进行备份。
磁盘阵列(RAID)常见故障排除技巧
现在选择IDE磁盘阵列卡(IDE RAID卡)来确保数据安全的人越来越多,如何正确使用IDE RAID卡也是个学问。下面我们就以采用HPT370A/372控制芯片的Rocket100 RAID卡为例讲解见故障与技巧。
磁盘阵列故障分析处理报告
@@@@@@磁盘阵列故障分析处理报告报告提交人:@@@现场工程师:@@@@@@提交日期:2009年03月31日——————————————————————————一、故障描述2009年3月22日@@@@平安城市项目使用的两台NAS存储服务器,其中有一台设备出现物理磁盘丢失现象,我方与海康威视技术人员及相关人员到现场进行调试了解,具体情况如下:@@@@平安城市项目所使用的存储服务器的型号是:DS-A1016R;采用RAID 5 冗余磁盘阵列;磁盘存储阵列和存储管理服务器通过ISCSI 协议做IP SAN网络数据存储;其中有一台NAS存储服务器设备出现磁盘丢失阵列报错现象。
二、处理过程3月22日晚上10点,出现磁盘阵列无法读写数据的情况。
现场通过查找NAS 存储服务器事件日志记录发现第二块阵列控制卡的第3块和第8块物理磁盘有扇区坏道报错记录,导致NAS存储服务器出现磁盘丢失阵列报错现象;出现两块物理磁盘有坏道扇区情况下必须将有坏道的磁盘扇区克隆到无坏道的磁盘扇区下,才能重新重构阵列恢复丢失的数据;第 1 页共 5 页3月23日将第3块硬盘克隆到新硬盘,整个克隆过程大概需要6个小时。
克隆完毕后,将克隆好的新硬盘装回磁盘阵列柜,重启磁盘阵列柜,磁盘阵列自动启动阵列重构。
阵列重构是根据RAID5的冗余校验信息,自动修正磁盘的错误数据。
因为磁盘阵列空间比较大,重构需要大概2天半时间。
但3月24日凌晨1点半,重构进度达9%的时候,访问第2张控制卡的第7块硬盘报错,重构中止。
查看硬盘状态,并没有显示第7快硬盘有坏道。
但查看日志时,发现访问第7块硬盘时,多次出错。
因此初步判定第7块硬盘校验数据出错,硬盘有损坏的征兆,但不明显。
3月24日将第7块硬盘克隆到新硬盘。
克隆完毕后,将克隆好的新硬盘装回磁盘阵列柜,重启磁盘阵列,磁盘阵列自动启动重构。
但3月25日凌晨2点半,重构进度达17%的时候,访问第2张控制卡的第8块硬盘报错,重构中止。
RAID磁盘阵列常见故障以及修复方法
RAID磁盘阵列常见故障以及修复方法RAID磁盘阵列常见故障以及修复方法服务器资料安全有着至关重要的意义,目前大多数服务器都采用了RAID磁盘阵列技术。
受服务器自身硬件局限和技术人员的操作因素,服务器无阵列无法做到100%的无故障发生。
那么RAID磁盘阵列故障有哪些?RAID磁盘阵列如何进行资料恢复?导致磁盘阵列RAID资料丢失的故障原因分为RAID逻辑层故障,RAID物理层故障以及RAID坏道层故障。
对于逻辑层故障,例如误删除,误格式化,误分区,RAID阵列信息丢失, RAID阵列信息混乱, 重新配置RAID阵列信息导致资料丢失, RAID阵列内磁盘顺序出错等,可以使用专业的RAID磁盘阵列资料恢复工具,全面支RAID 0,RAID 5,Raid 5E, Raid 5EE及Raid 6,只要没有对磁盘阵列做初始化和非常规的Rebuild操作,就可以保证100%恢复出磁盘阵列的资料。
对于服务器物理层故障,主要是指服务器阵列SAS、SCSI硬盘由于硬盘内部磁头或者电机原因引起的故障。
主要表现是硬盘通电敲盘,硬盘通电不转,硬盘通电不识别。
这种情况,一般公司技术人员没办法恢复,需要专业资料恢复人员进行恢复,可能还涉及到硬盘开盘恢复,建议不要自行操作,可以联系资料恢复中心,由工程师诊断故障原因在制定恢复方案。
对于RAID坏道层故障,主要是指磁盘阵列中SCSI、SAS硬盘由于一块或者多块有坏道引起操作系统产生如无法启动,启动操作系统蓝屏,启动操作系统死机等故障。
坏道里的资料无法读取,有坏道的硬盘需要做全盘镜像,只有镜像完成之后,才能着手去重组硬盘阵列,然后导出资料。
为了获得较高的资料恢复成功率,有三点需要注意。
一是,当服务器发生故障后,大家切忌再对服务器进行任何操作,也切忌随意取出硬盘,以免弄乱顺序增加后期资料恢复的难度。
二是如果已经取出硬盘,一定要标记好硬盘的顺序。
三是服务器资料恢复公司的专业服务器资料恢复工程师,有技术设备保障,资料恢复更安全。
硬盘常见故障与维修方法
硬盘常见故障与维修方法硬盘作为一种重要的存储设备,常常面临各种故障。
以下是几种常见的硬盘故障以及其对应的维修方法。
1.硬盘不被识别:这是最常见的硬盘故障之一、当硬盘插入电脑时,电脑不能检测到硬盘的存在。
这可能是由于硬盘接线不良或接口松动所致。
解决方法包括逐一检查硬盘电源和SATA或IDE线路连接,确保它们齐全并牢固连接。
2.硬盘系统文件损坏:当硬盘的系统文件损坏时,电脑可能无法启动或显示错误消息。
此时,使用操作系统的引导修复功能或使用命令提示符执行修复命令来解决该问题。
如果这些方法不起作用,可能需要重新安装操作系统。
3.硬盘物理损坏:当硬盘受到撞击、摔倒或其他外部力量时,可能会发生物理损坏,如磁头碰撞、马达故障等。
这种情况下,最好将硬盘交给专业的数据恢复公司进行修复,因为自行修复可能会导致更大的数据丢失。
4.硬盘逻辑故障:硬盘逻辑故障通常由于软件错误、病毒感染或操作系统损坏引起。
在这种情况下,可以使用数据恢复软件来尝试恢复丢失的数据。
如果软件无法解决问题,可能需要重新格式化硬盘并重新安装操作系统。
5.硬盘不稳定或频繁崩溃:这可能是由于硬盘的老化、过热或电源供应问题引起的。
解决方法包括使用硬盘健康检测工具检查硬盘的状态,并及时更换可能存在问题的硬件组件。
除了上述故障和维修方法之外,还有一些其他常见的硬盘故障,如读写速度变慢、噪音异常等。
对于这些问题,可以尝试清理硬盘的数据碎片、更新硬盘驱动程序、降低硬盘使用温度等来解决问题。
总之,硬盘故障对于数据安全和计算机正常运行都会产生不良影响。
因此,及时诊断和维修硬盘故障是保护数据和计算机的重要任务。
如果用户无法解决问题,最好寻求专业的技术支持或数据恢复服务。
服务器阵列问题处理办法
服务器阵列问题处理办法
当已经做了raid5的服务器,如果其中一块硬盘出现黄灯常亮的现象,表明这块硬盘已经损坏,在这种情况下建议对当前运行的系统中重要的数据进行备份,以防止再换一块盘之后的服务器宕机,数据丢失现象。
然后在有备用的相同型号硬盘的前提下,可以对坏掉的硬盘进行在线热插拔更换,更换之后新硬盘会自动同步数据,在此期间,新硬盘黄灯会闪烁,属正常现象。
同步完成,黄灯即可熄灭,此过程需要1到几个小时不等,根据系统数据容量而定。
此过程操作有风险,尽量在服务器闲暇时,例如晚上。
如果机器在保修期间内遇到硬盘故障问题,给IBM售后800-810-1818打电话报修,让IBM专业售后工程师来解决。
raid出现故障该如何修复
raid出现故障该如何修复
RAID是英文Redundant Array of Inexpensive Disks的缩写,中文简称为独立磁盘冗余阵列,RAID就是一种由多块硬盘构成的冗余阵列。
虽然RAID包含多块硬盘,但是在操作系统下是作为一个独立的大型存储设备出现。
目前RAID应用非常广泛,而raid故障问题也成为大家关注的焦点。
当raid发生故障时,大家该如何修复呢?
常见Raid 故障:
1)突然断电造成RAID磁盘阵列信息的丢失或损坏的RAID数据修复。
2)重新配置RAID阵列信息,导致的数据丢失的恢复。
3)磁盘顺序混乱导致的系统不能识别数据。
4)误删除、误格式化、误分区、误克隆、文件解密等。
5)RAID其中的某一块或某几块硬盘损坏导致RAID信息丢失,数据崩溃。
6)硬盘有坏道,导致数据读取出错。
7)RAID控制器故障导致数据丢失。
对于大多数用户来说,raid故障修复是比较复杂的问题,如果没有相关专业的知识和设备,用户最好不要自行操作。
当raid出现故障后,用户应该立刻采取有效措施,对数据进行保护。
一旦RAID出现故障,硬件服务商大部分只能给客户重新初始化或者重建RAID,这样客户数据就会无法挽回。
因此,出现故障以后用户应该选择专业的数据恢复机构,这样才能保证数据安全。
磁盘阵列的常见故障
磁盘阵列的常见故障
磁盘阵列的常见故障
1、磁盘阵列控制器故障
LCD会交替显示“ModeError”和“RAIDReady”,有蜂鸣声,但不影响应用系统正常运行。
解决方法:在线更换故障磁盘阵列控制器,更换过程不影响应用系统正常运行。
磁盘阵列和服务器开关顺序:启动:先启动磁盘阵列,过两分钟再启动服务器。
关闭:先关闭服务器再关闭磁盘阵列。
2、电源故障
本磁盘阵列有三个电源,其中之一是后备电源,所以要磁盘阵列工作至少要接两个电源。
如果只接两个电源时,LCD会交替显示“FailPower”和“RAIDReady”,有蜂鸣声,但不影响应用系统正常运行。
Raid常见的几种故障分析
2.Rebuild
例如:RAID5阵列,4块盘,Rebuild操作的实际意义是,用其中3块盘做异或运算,将结果写到另一块盘中。这里要求,用来做异或运算的3块盘的数据一定要是正确的,如果其中有一块或多块不正确哪么异或出来的结果也就是不正确的。
3.更换RAID卡或主机
目前大部分RAID卡都是支持这种操作的,在阵列正常的情况下这个操作是不会破坏数据的。但是,在阵列已经瘫痪或是无法正常工作的时候,这个操作将有可能导致RAID对硬盘做不正常的Rebuild和校验,所以当阵列出现问题的时候,要准确判断是阵列卡有问题,还是硬盘有问题,不要轻易去尝试更换RAID卡或主机。
5.操作系统的check disk
Windows,Linux,Unix等操作系统都有自己的一个硬盘检测程序,当你硬盘中的分区或文件出现问题无法正常读取的时候,操作系统就会在重启的时候去自动运行Check disk去试图修复,这时,如果是阵列的检验出现问题而导致分区或文件出错的话,运行Check disk将有可能破坏阵列中数据。
例如:RAID5阵列,4块盘,0号和2号掉线。假设0号盘先掉线,1个月后2号盘又掉线,这个时候如果将2块盘强制在线的话,因为0号盘1个月前就掉线了,这一个月当中对数据做的很多的改变,这块盘的数据已经不能通过RAID的检验了,阵列是无法分析数据的新旧的,所以阵列有可能用0号盘+1、3号盘去Rebuild 2号盘,这样一来,2号盘的数据也就成了不正确的了,将无法恢复,最多也只能恢复到1个月前的部分数据。
8.磁盘有坏道
阵列中的磁盘如果有坏道的话,会导致磁盘掉线或阵列不稳定,这时应尽早将有坏道的硬盘换掉,如果出现多坏硬盘有坏道的话,阵列将可能瘫痪。
9.断电或意外关机
阵列是由RAID卡控制硬盘,通过某种算法将多块硬盘整合成一块硬盘提供给用户使用。在阵列运行过程中,会有大量的输入输出信息放在RAID卡的缓冲或主机的缓冲中的,如果发生突然断电和意外关机的情况,将导致碏的信息无法写回到硬盘或RAID卡的ROM中,这样极易导致阵败或扩容过程中意外中断
处理硬盘故障的方法
处理硬盘故障的方法
处理硬盘故障的方法主要包括以下几个方面:
1. 软故障:软故障基本不会对硬盘中存储的资料造成损害,而且是可以修复的。
例如,因为用户的错误操作而造成的硬盘主引导分区故障,这时则可以利用系统盘或U盘启动电脑,进入PE系统,再用DiskGenius分区工具进
行“重建主引导记录”。
2. 物理故障:
硬盘有叫声,指示灯不停的闪烁,在开机自检时会出现“Hard Disk Error”字样的错误提示。
这通常是因为控制电路部分出现故障,主轴电机失速造成的。
开机自检时,产生“哒哒哒”的长时间碰撞声,这是因为磁头步进钢带松动或断裂,使得盘体被严重撞击或震动产生。
电脑不能开机,显示"HDD Controller Error",一般是由于硬盘驱动器损坏或硬盘的连接线损坏或解除不良造成的。
3. 检查硬盘线:检查硬盘线是否松动,如果松动可以换一根好的硬盘线试试。
4. 硬件更换:把硬盘换到其他机器上试试,换一块主板,确认IDE口没问题。
也可以换一个质量好一些的电源。
5. 检查PCB板:认真检查硬盘的PCB,如果PCB板有烧坏的痕迹,请尽快送修。
6. BIOS设置和安装问题:如果BIOS里硬盘参数设置不对,自检不会通过,硬盘就无法正常使用的。
首先检查BIOS里硬盘参数的设置,一般来说,486以后的计算机都会有自动检测硬盘型号的功能,进入BIOS里,找到IDE HDD AUTO DETECTION一项后,会自动检测到硬盘型号。
7. 硬盘容错提示:现在硬盘都采取了多项容错技术,其中应用最普遍的是技术。
以上就是处理硬盘故障的一些方法,如果遇到问题建议寻求专业技术人员的帮助。
磁盘阵列的故障诊断和维护
磁盘阵列的故障诊断和维护磁盘阵列是一种由多个磁盘组成的存储系统,通过将数据分散存储在多个磁盘上,提供了更高的容量、更高的性能和更好的数据冗余能力。
然而,由于硬件故障、软件问题或操作错误,磁盘阵列可能会出现故障,导致数据丢失或性能下降。
因此,及时的故障诊断和维护对于保证磁盘阵列的正常运行至关重要。
故障诊断是磁盘阵列维护过程中的关键步骤之一。
在发生故障时,首先需要确定故障的类型和原因。
常见的磁盘阵列故障包括磁盘损坏、磁盘控制器故障、电源故障、数据线松动等。
可以通过以下几种方式来进行故障诊断:1. 硬件检查:检查磁盘阵列的物理连接和电源是否正常。
确保所有磁盘和磁盘控制器都连接正确,并且电源供应稳定。
2. 日志分析:磁盘阵列通常会记录各种事件和错误信息的日志。
通过分析这些日志,可以确定故障的类型和出现的时间点。
可以使用专门的日志分析工具来加快诊断过程。
3. 软件工具:一些磁盘阵列厂商提供了专门的诊断工具,可以帮助用户检测和诊断故障。
这些工具通常会提供故障报告、错误代码解释和故障处理建议。
一旦确定了故障的类型和原因,就可以采取相应的维护措施来修复问题,以恢复磁盘阵列的正常工作状态。
以下是一些常见的磁盘阵列故障的维护方法:1. 磁盘更换:如果发现某个磁盘损坏,需要立即将其更换。
在更换磁盘之前,需要确保其他磁盘和磁盘控制器的正常工作。
在更换磁盘时,一定要按照相关的操作手册和指导进行操作,以确保数据的安全和完整性。
2. 控制器更换:如果发现磁盘控制器故障,需要将其更换。
更换控制器时,需要备份重要数据,并在更换后重新配置控制器。
3. 数据恢复:在某些情况下,磁盘阵列的数据可能会损坏或丢失。
在这种情况下,需要使用数据恢复工具或专业的数据恢复服务来尝试恢复丢失的数据。
注意,数据恢复过程可能是复杂且耗时的,因此务必确保在操作前备份重要数据。
4. 定期备份:为了防止数据丢失的风险,定期备份磁盘阵列中的数据是非常重要的。
备份可以包括完整备份、增量备份或差异备份等不同的备份方法。
服务器磁盘阵列常见问题及解决方法
服务器磁盘阵列常见问题及解决方法一般问题下表说明您可能遇到的一般问题,以及建议的解决方案。
问题建议的解决方案系统不从 RAID 控制器启动。
请检查系统的基本输入/输出系统 (BIOS) 配置,查看是否已指定 PCI 中断。
确保已经为 RAID 控制器指定唯一性中断。
在安装操作系统之前,先初始化逻辑驱动器。
阵列中的一个硬盘驱动器发生故障。
•检查 SCSI 电缆。
•如果 SCSI 电缆没有问题,请替换该驱动器。
•重新建立阵列。
特定 SCSI ID 上的一个驱动器重复发生故障。
替换 SCSI 电缆。
于启动时按下并尝试进行新配置时,系统停止响应。
•检查每个通道上的驱动器 ID,确保每个设备有不同的 ID。
•检查以确保内部连接和外部连接未占用相同的通道。
•确定该通道已经过正确的终结处理。
通道尾端的设备必须经过终结处理或电缆上必须已经连接一个终结器。
•检查以确保 RAID 控制器已经正确安置在插槽中。
•替换驱动器电缆。
按并不显示菜单。
必须有彩色显示器才能显示 BIOS 公用程序菜单。
已经安装 RAID 控制器的系统 POST(开机自测)时,BIOS标题显示为乱码或完全不显示。
RAID 控制器高速缓存可能已经损坏或遗失。
无法快闪刷新或更新固件。
联系 Dell 支持人员以寻求协助。
小心:检查一致性或进行后台初始化过程时,请不要执行固件快闪更新,否则可能会失败。
Controller POST command failed (控制器 POST 命令失败)如果内部适配器诊断失败,将显示此消息。
•若要解决问题,请快闪刷新适配器的固件。
• 如果问题仍然存在,请与 Dell 支持人员联系。
<><> 如果适配器的 SEEPROM 读取或写入失败,将显示此消息。
如果是读取失败,将使用一组防止失败的安全默认值。
SEEPROM 损毁或失败可能导致此问题。
• 若要解决问题,请于系统 POST 时按 ,以进入适配器“BIOS Configuration utility”。
硬盘故障的分析与排除方法总结
硬盘故障的分析与排除⽅法总结关于硬盘故障的分析与排除⽅法总结 硬盘故障分析与排除 在实际⼯作中,硬盘并不是经常出现问题的配件,正常使⽤中的硬盘⼀般能够保持五年的⼯作时间。
⽽⼤部分的硬盘故障都是由于出现坏道所引起的,解决的⽅法是利⽤特殊的软件查找出硬盘的坏道并将期隐藏屏蔽。
很多情况下检查出的机器硬盘故障,往往是由于设置不正确或其它的因素所造成的,这⾥笔者为⼤家介绍两例⽐较常见的硬盘故障及排除⽅法。
⼀、都是数据线惹的祸接触不良导致⽆法识别硬盘故障排除实例 故障现象:学校⽹络教室的⼀台学⽣⽤机,近期经常出现不能开机或开机后提⽰找不到硬盘的情况,通过仔细检查,在开机后能够听到硬盘盘⽚的转动声⾳,系统检测启动设备时提⽰⽆法找到硬盘。
机器的型号是:英特尔810主板,英特尔赛扬1.1GHz处理器,256MDDR266内存,硬盘为希捷酷鱼7200.740GB。
重新启动机器时或者进⼊CMOS重新设置⼀下就⼀切正常,但在使⽤过程中还是经常会重新启动,重新启动后则⼜⽆法找到硬盘。
刚开始故障并不算严重,还能够将就使⽤,但随着使⽤次数的增多,故障越来越频繁,于是决定彻底解决。
故障分析与解决:按照正常的检修顺序,先对硬盘进⾏彻底杀毒,⽤最新版的江民和瑞星查杀后却⼀⽆所获,基本上排除了病毒破坏引导区和分区表的可能。
于是⼜开始怀疑是CMOS电池⽼化导致硬盘有时⽆法识别,更换了⼀个新电池以后故障还是依旧。
根据故障现象来看,如果软件没有问题,那么看到故障出⾃硬盘本⾝,是不是硬盘的质量出了问题,由于是在机房⾥,每⼀台机器的配置基本上都是相同的,这就给替换法带来了⽅便,把硬盘和另⼀台电脑互换以后,结果两台电脑竟然都没有出现问题!这就奇怪了,难道硬盘和主板之间还有兼容性的问题不成?绝对不可能呀,这两台机器的主板可都是⼀个型号的,均为英特尔的原装810芯⽚组的主板呀。
排除了硬盘⾃⾝的故障以后,因为⽹络教室⾥每⼀台计算机都有⾃⼰的名字,⽽且IP地址也不同,为了便于管理,把硬盘⼜换了回来,结果故障⼜来找了。
服务器硬盘故障处理的方法和预防措施
服务器硬盘故障处理的方法和预防措施随着信息技术的不断发展,服务器在企业和个人生活中扮演着越来越重要的角色。
而服务器硬盘作为服务器的核心组件之一,一旦出现故障将会给工作和生活带来不便甚至损失。
因此,了解服务器硬盘故障处理的方法和预防措施显得尤为重要。
本文将就此展开讨论。
### 一、服务器硬盘故障处理的方法#### 1. 及时备份数据在处理服务器硬盘故障时,首要任务是保护数据安全。
因此,及时备份数据是至关重要的。
定期将重要数据备份到外部存储设备或云端,确保数据不会因硬盘故障而丢失。
#### 2. 确认故障原因当服务器硬盘出现故障时,需要及时确认故障原因。
可以通过查看系统日志、硬盘状态指示灯等方式来初步判断故障原因,以便采取相应的处理措施。
#### 3. 使用专业工具进行诊断针对硬盘故障,可以借助专业的诊断工具来进行检测和诊断。
这些工具可以帮助准确定位硬盘故障的具体原因,为后续的处理提供参考依据。
#### 4. 数据恢复与修复针对不同类型的硬盘故障,可以采取相应的数据恢复与修复方法。
比如,对于逻辑故障可以尝试使用数据恢复软件进行修复,而对于物理故障可能需要更换硬盘或进行专业维修。
#### 5. 寻求专业帮助如果自行无法解决服务器硬盘故障,建议及时寻求专业的硬件维修服务。
专业的技术人员可以更快速、更有效地帮助解决硬盘故障问题,避免造成更大的损失。
### 二、服务器硬盘故障预防措施#### 1. 定期维护保养定期对服务器硬盘进行维护保养是预防硬盘故障的有效途径。
可以清洁服务器内部灰尘,确保散热良好;定期检查硬盘状态,及时发现问题并进行处理。
#### 2. 注意使用环境服务器硬盘对使用环境要求较高,应避免在潮湿、灰尘大、温度过高或过低的环境中使用。
保持良好的通风条件,确保硬盘正常工作。
#### 3. 避免频繁开关机频繁开关机会对服务器硬盘造成一定的损耗,增加硬盘故障的风险。
因此,在不必要的情况下尽量避免频繁开关机,保持硬盘稳定运行。
服务器硬盘故障处理方法
服务器硬盘故障处理方法服务器硬盘是服务器中最重要的组件之一,存储着服务器的操作系统、应用程序和数据文件。
一旦服务器硬盘出现故障,可能会导致数据丢失、系统崩溃等严重后果。
因此,及时有效地处理服务器硬盘故障至关重要。
本文将介绍几种常见的服务器硬盘故障处理方法,帮助管理员快速有效地应对硬盘故障。
一、识别硬盘故障在处理服务器硬盘故障之前,首先需要准确地识别硬盘是否出现故障。
常见的硬盘故障表现包括:1. 硬盘读写速度变慢:文件读写速度明显下降,系统响应变得缓慢。
2. 硬盘发出异常声音:硬盘发出嘎嘎声、咔咔声等异常声音。
3. 硬盘无法被识别:服务器启动时无法检测到硬盘,或者硬盘在系统中消失。
4. 硬盘报错:系统提示硬盘出现错误或损坏。
如果服务器硬盘出现以上情况,很可能是硬盘出现了故障,需要及时处理。
二、备份数据在处理服务器硬盘故障之前,务必先备份重要数据。
因为硬盘故障可能导致数据丢失,及时备份可以保证数据的安全。
管理员可以通过外接硬盘、网络存储等方式对数据进行备份,确保数据不会因硬盘故障而丢失。
三、更换硬盘如果确认服务器硬盘出现故障,需要及时更换硬盘。
更换硬盘的具体步骤如下:1. 关闭服务器:在更换硬盘之前,务必先关闭服务器,避免硬盘在运行时被拔出导致数据损坏。
2. 打开服务器:打开服务器外壳,找到故障硬盘所在位置。
3. 拆卸故障硬盘:拆下故障硬盘,注意不要对其他硬件造成损坏。
4. 安装新硬盘:将新硬盘安装到硬盘插槽中,确保连接牢固。
5. 关闭服务器外壳:安装完新硬盘后,关闭服务器外壳,重新启动服务器。
四、重建RAID如果服务器硬盘是RAID阵列,且出现了故障,需要进行RAID重建。
RAID重建的步骤如下:1. 查看RAID状态:登录RAID控制器管理界面,查看RAID阵列的状态,确认哪一块硬盘出现了故障。
2. 更换故障硬盘:按照上文所述的方法更换故障硬盘。
3. RAID重建:在RAID控制器管理界面中选择重建RAID选项,系统会自动将数据从其他硬盘恢复到新硬盘上。
RAID磁盘常见状态及解决方法
RAID磁盘常见状态及解决方法使用RAID-1卷和RAID-5卷的目的就是利用磁盘空间的冗余实现数据容错,当磁盘出现故障的时候能够确保数据的安全。
不过这一切都是在所有的磁盘或卷没有任何问题的前提下实现的,也就是说必须保证冗余磁盘或卷的正常运转。
当RAID-1卷或RAID-5卷中的单个磁盘出现故障后,尽管数据可能暂时不会受到威胁,但是磁盘冗余已经不复存在了。
只有及时修复故障,才能保证磁盘冗余的存在。
那么如何知道RAID-1卷或RAID-5卷已经出现故障?这在“磁盘管理”窗口中很容易看到。
发生故障的RAID-1卷或RAID-5卷的状态将显示为“失败的重复”,而发生故障的磁盘状态为“丢失”或“脱机”,下面列出RAID-1卷或RAID-5卷中磁盘的常见状态,供用户参考。
(1)联机该磁盘为可用磁盘且没有检测到已知的错误。
(2)联机(错误)该磁盘为可用磁盘但检测到I/O错误。
用户可以选择该磁盘的快捷命令“重新激活磁盘”或许能将它恢复到“联机”状态。
这种状态只出现在动态磁盘中。
(3)脱机该磁盘不可用。
这通常是由物理磁盘或传输介质的故障而引起的。
用户可以尝试选择“重新激活磁盘”操作进行修复,如果失败则只能移走该磁盘并选择“删除磁盘”快捷命令。
这种状态只出现在动态磁盘中。
(4)外部该磁盘是从另一台计算机移过来的。
在该磁盘的快捷菜单中选择“导入外部磁盘”命令导入该磁盘。
(5)丢失该磁盘已经损坏或断开连接。
尝试选择“重新激活磁盘”命令,如果不能恢复成联机状态,则只能选择“删除磁盘”操作。
这种状态只出现在动态磁盘中。
(6)未初始化磁盘有效信息从MBR(主启动记录)中丢失,或者一个有效的GUID(Globally Unique Identifier,全局唯一标识符)从GPT(全局分区表)中丢失。
通常在服务器安装新硬盘时会出现这种情况,初始化磁盘会解决这个问题。
(7)正在初始化这种状态会在将一个基本磁盘转换为动态磁盘时出现。
关于服务器硬盘损坏故障分析及处理方式
关于服务器硬盘损坏故障分析及处理方式6月26日整个ERP系统无法登陆,经检查为硬盘损坏,及时联系新未来科技有限公司工程师(服务器硬件设备为新未来有限公司提供),工程师十点到达公司并进行检测,直到下午三点已确认为硬盘损坏,但没有技术力量来维修,新未来公司工程师联系济南天和数据恢复中心尹经理。
6月27日中午天和数据中心收到硬盘并进行检测,直到下午六点左右反馈消息确认两块硬盘已损坏并无法修复,还有两块硬盘坏道严重,但暂时能使用,具体故障原因经天和数据中心工程师分析有几下几种:1.服务器突然断电造成,这种原因应该不存在,因为机房内装有UPS电源,即时突然停电,但UPS可支持服务器运行最少八个小时。
2.硬盘过小,而读取用户过多,这种原因也不会存在,因为故障出现时为夜晚,用户不会再使用,并且单位服务器的硬盘数为六块,总容量为1800G。
3.非正常关机造成,故障出现在夜晚,机房内已无人,这种原因也不会存在。
4.经常出现震动造成,这种原因也不成立,因为服务器安装在标准机柜内,不会发生震动而损坏硬盘。
5.最终原因分析为质量问题,服务器总共为六块硬盘,但服务器标配为两块,剩余四块为后来添加,天和公司检测后四块都有问题。
经与新未来公司及济南天和数据公司沟通协商,最终解决的方法为:新未来公司答应置换有问题的硬盘,但不负责盘内的数据;(所有ERP数据每天都保存在硬盘中)天和数据公司负责找回数据,需做两块坏盘的开盘处理,所谓开盘即是天和数据公司购买两个同型号的盘,进行镜像对接及磁头更换拷贝出原坏硬盘的数据,成本比较高,一个硬盘价格在2000-3000之间,如果不成功,天和数据中心不收任何费用。
所以最终天和数据中心报价为两个盘内数据恢复费用为7000元。
请领导给予意见!综合管理部2014-07-28。
服务器硬盘故障处理方法
服务器硬盘故障处理⽅法服务器硬盘故障处理⽅法 服务器在使⽤过程中多多少少会出现⼀些问题,遭受攻击是⼀⽅⾯,硬件⽅⾯出现问题也是⼀个⽅⾯,当企业服务器硬盘出现故障之后有什么处理⽅法?⼀起来看看! 服务器硬盘数据恢复 硬盘数据恢复是在硬盘发⽣故障⽽不能读取数据,或是⼈为操作失误及病毒侵袭造成硬盘分区或是数据丢失,使⽤专门的设备或是硬盘数据恢复软件和技术⼿段将数据从硬盘上恢复出来的服务。
⾸先我们要知道,造成服务器硬盘数据丢失的原因有很多,其中有病毒和⿊客⼊侵、误操作、软件”打架“等多种原因,针对不同的原因,我们要做出相应的解决⽅案才能对数据进⾏快速有效的恢复。
如果是RAID阵列发⽣了故障,譬如RAID1、RAID2、乃⾄RAID10都发⽣了错误的同步操作,这样的数据恢复我们需要借助专业⼈⼠例如专业维修⼯⼈等的.帮助,因此其中涉及到各种代码的重置与重组,⼀般⼈是完成不了的。
如果是硬件受到了损坏,我们就要根据服务器的品牌进⾏专业的恢复,遗憾的是,我们还是不能单⼈进⾏操作,需要寄回相应的⼚家在⽆尘等条件下进⾏操作,如果能有专业的操作场所,可以请专业⼈⼠前来进⾏现场操作,但是还是要根据硬件的要求来进⾏,不可草草了事。
服务器硬盘恢复注意事项 ⾸先,服务器发⽣数据故障与普通硬盘数据故障不同,不能交给技术不成熟的⼈进⾏恢复⼯作,由于服务器数据更加复杂和庞⼤,因此每⼀步都要谨慎操作。
其次,我们不要⾃⼰在⽹上各⼤论坛中搜索服务器数据恢复的⽅法,因为不同的服务器故障有着⼤不⼀样的处理⽅法,如果不是具备了专业的技术,⼀般来说是根本没有办法判断出故障原因的,更别说恢复数据了。
这种⼆次操作的失误,最后将直接导致数据再也没办法完全恢复! 由于服务器有着它的特殊性,当服务器出现问题的时候需要专业的⼈员进⾏快速处理,如果选择的是服务器托管服务,那么数据中⼼的⼯作⼈员会做好这⽅⾯的防护,如果是⾃建数据数据中⼼,就需要请专⼈进⾏维护,确保企业信息的安全。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
冗余类型 数 据传输 能力 磁盘 数量 要求 容 量可用 比 安 全性
完全复 制 一般 2 块 n 12 , 最好
奇偶 校验 高 至少 3 块 n 1n ., 好
奇偶 校验 ,保 留未条 带化 空间 至少4 块 略低 于n 1n 一/ 较好
表 2)。 并 且 在 表 中 列 出 了 在 满 足 系 统
图2
圈3
故 障现象 分析
中的 磁 盘 管理 ( 图 2 如 )
而 D盘 空 间 I d p n e tDik ) & 独 立 磁 盘 冗 余 n e e d n s s 口
20 年 1 1 0 2日 , 运 行 六 年 之 仍 为 原 来 的 9 . GB ,但 不 是 所 需 的 2月 17
容 量 要 求 的 情 况 下 不 同容 量 硬 盘 构 成 磁 盘 阵 列 的 价 格 。结 果 发 现 使 用 大 容 量 硬 盘 构 建 磁 盘 阵 列 性 价 比较 高 , 同 时也 节
R D5、RAI E三 种 RAl 式 ,如 表 AI D5 D模
1 示 。 所
硬盘作为其它服务器的备份盘。
68 2MB可 用 .不 能 满 足 收 费 系 统 对 服
了 图4中有 下 划 线 的 四个 文 件 .数 据 量
超 过 5 正 常 情 况 下 应 在 D盘 中 。 GB
可 以提 供 良好 的容 错 能 力 。在 任 何 一 块
硬 盘 出 现 问 题 的 情 况 下 都 可 以 继 续 工 作 不 会 受 到 损 坏 硬 盘 的 影 响 。 根 据
省成 本 。 随 之 ,我 们 又 进 行 了 三 种 阵 列 的
RA I 是 两 块 硬 盘 数 据 镜 像 复 D1
制 , 内容 完全 一样 ,数 据 恢 复 容 易 ,安
方 案 分 析
服 务器 磁盘 阵列 要 求所 采 用 的硬 盘
可 靠 性 分 析 :首 先 假 设 硬 盘 的 可 靠 性
损 坏 . 不 能 继 续 使 用 。 进 入 我 的 电 Se  ̄eA MSSQL Daa 件 夹 目 录 中 多 出 \ t文
可 以 充分 发 挥 出 多块 硬 盘 的优 势 .不仅
能提 供 超 出单 硬 盘 的速 度 和 吞 吐 量 ,还
脑 后 ( 图 1 .C盘 1 GB空 间 仅 留 如 ) O
表 1 R D模 式 AI 容 错性 RAf 1 D R D Af 5 RAt E D5
还 要 选 择 性 能 更 好 的 R D1 式 。 通 过 AI 模
镜像
有
条 带分散 校验
有
条带 分散校 验
有
对 3 .GB、73 64 GB、 1 6GB三 种 容 量 的 4 希 捷 硬 盘 的 网上 报 价 作 了 一个 对 比 ( 见
智 能 交 通
N E LG N R S OR T L I E TT AN P T
收费服 务器磁盘阵列 ( AI R D)中硬 盘 故障的处理分析 文保 ,臣 李
高速 公 路收 费系 统服 务器 作为 系统 稳定 .可靠 高 效运 行 的核 心设 备 。主 要用 于存 储 车道 实时交 易数据 、 车 辆通 过 的抓拍 图像 、收费状 态 信息 、各 种报 警 信息 、查 询信 息和 数 据 的处理 。为 了满足 服 务器 本身 性能 和数
务 器 的 存 储 要 求 而 D盘 空 间 无 显 示
且 处 于 不 可 用 状 态 .其 中 所 有 程 序 及 数 据 不 能 查 找 。 不 过 打 开 计 算 机 管 理
拟 采 用 R D 术 AI 技
收费交易数据的数据量小, 读写和传
RAI ( D RedundantA aY r Of 输 随 机 性 大 的特 点 下 面 列 出 RAI 、 r D1
Байду номын сангаас提高 。
应 当 是 同 一 厂 家 、 同一 型 号 、 同 样 容 量 的S CSl 口硬 盘 从 而 最 有 利 于 发 挥 接
R D技 术 的作 用 ,提 高 多 块硬 盘 的 整 体 AI
于 是 ,我 们 进 行 了 现 场 处 理 . 发 现 磁
随之 我 们 对 C盘 的 可 用 空 间 变 小 原 辑 硬 盘 ) .从而 提 供 比单 硬 盘 更 高 的 存
因 进 行 调 查 , 由 图 3与 图4的 对 比 可 发
储性能 和提供 数据冗余 的技术 。R D AI
盘 阵 列 中 位 于 1 插 槽 的 硬 盘 O 道 现 . 在 C: o r m lsM ir s f SQL 号 磁 \ g a Fi \ c o ot Pr e
阵 列 是 一 种 把 多块 独 立硬 盘 ( 理 硬 物 盘 )按 不 同 方 式 组 合 成一 个 硬 盘 组 ( 逻
TS 久 的 内 丘 站 收 费 系 统 服 务 器 突 然 出 现 N F 格 式 ,而 是 未 格 式 化 状 态 。
硬盘 故 障 ,造成 交易信 息 不能 查询 。
为 0 9 其 次 分 析 各 种 阵 列 的 结 构 特 . 点 , R D1 用 硬 盘 复 制 .具 有 并 行 AI 采 性 , 一 块 硬 盘 故 障 不 影 响 另 一 块 硬 盘
的数 据 读 写 与存 储 ;RAI D5、RAI D5E
全 性 高 。 但读 写 能 力 与 单 硬 盘 相 比没 有
据 存储 高质 量可靠 性要 求 ,高速 公路 收费 系统服 务器 广泛 采用 r相 当成 熟的 磁盘 阵列 ( D)数据存 储技 术 。 RAI
石 安 高 速 公 路 收 费 站 服 务 器 采 用 I M e ir 5 服 务 器 , 用 4 3 .GB ( t 3 0 S 1 的 I M硬 盘 建 立 了 B Xs r s 2 5 e 块 64 Ula 2 CS ) r B R D E 盘 阵列 ,满足 了联网 收费运 行的需 要 。 AI 5 磁