IBM 7133硬盘更换总结、步骤
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
办法是,1)lsdev -Cc pdisk列出所有的pdisk
2)smitty ssaraid->...->List Disks in an SSA RAID Array 列出所有在RAID中的盘
3)smitty ssaraid->...->List Hot Spares 列出所有Hot Spares盘
二. 确定盘的位置,有多种方法可以确定盘的位置
1. lsdev -Cc pdisk 会显示各个pdisk的location
2. diag->task->ssa service aids->Enclosure Configuration或者Physical Link Configuration,会显示location
5. 更换时将盘设置成service mode的同时标志该盘,则该盘灯会闪暗黄色
几种方法结合就可以确定位置而不至于换错盘了。
三. 最后换盘。
注意:如果换的是RAID中的盘,则新盘设置成Array Candidate,并添加到相应RAID;如果换的盘是HOT SPARE,则新盘设置成HOT SPARE;如果RAID中的坏盘已经被REJECT,则新换的盘也设置成HOT SPARE。
3. smitty ssaraid
->List All Defined SSA RAID Arrays
列出所有RAID,如显示GOOD,则RAID中的盘都是好的,如有RAID显示degraded,则该RAID中有盘故障。可以结合ERRPT报错确定故障的盘
smitty ssaraid
->List/Identify SSA Physical Disks
->List Rejected Array Disks 列出被REJECT的盘,REJECTED盘都是有故障被从RAID剔除的,需要更换。
因为HOT SPARE盘坏了以后一般只有一次ERRPT报错,而且对RAID状态没有影响,如果时间久远或者ERRPT日志被客户清了就很容易被忽略,所以我们需要查清所有盘的使用所属情况,来确认是否有隐藏的坏盘。
3、DIAG->task selectionàssa service aidàLink verification
你可以看到所有的pdisk 的具体状态和S/N 号码。你可以清楚地看到在ERROR LOG 里面报错的PDISK的状态是REJECT 或者是FAIL。记下那个出错PDISK的S/N 号码,然后到7133那里用眼睛去对硬盘上的标签是不是和系统里面显示的一样。(参考步骤2的SCSI ID,看是否相符),也可以用“DIAG->task selectionàssa service aidà Set Service Mode”把要换的硬盘的灯变成黄灯,亮黄灯的那个就是要换的硬盘。
4)smitty ssaraid->...->List Rejected Array Disks 列出所有Rejected盘
那些没有归属的而且物理上存在的盘就是隐藏的故障盘了。
4. 如果RAID状态显示是GOOD,但是ERRPT中有该RAID中的盘连续报错,则该盘还可用,但是不安全,建议与客户沟通后更换掉。
一. 确定哪些盘是故障的,需要更换。方法如下:
1. 查看ERRPT报错。
在向硬盘读写数据失败时会产生一个报错。hot spare盘或者是阵列中因为故障而已经被reject的盘一般只有一次报错,而在阵列中的故障盘,或者读写时有偶发性错误的盘则会连续报错。
2. diag->Task->ssa service aids->Link Verification 查看LINK状态,显示failed表示盘连接有问题,有故障。(显示GOOD表示连接是好的,但是不能保证硬盘是好的)
四.换盘
1、#errpt –dH |more
一般都会出现PDISK* 的OPERATION 的错误,将PDISK号记下来。
2、#lsdev –Cc pdisk
会显示出系统当前所有PDISK的状态,其状态有可能都是AVAILABLE。但是ERROR LOG出现那个出错的PDISK* 才是我们需要注意的。写下PDISK 的 SCSI ID。(SCSI ID 为 location code 中逗号左边那个号码)SCSI ID 又为 这个PDISK 在7133的实际SLOT 位置,这个非常重要,如果出错那个PDISK SCSI ID 残缺,看不到完整的SCSI ID,那么可以根据上下的PDISK 号码估计出实际位置,例如有16的硬盘,那么排除其他有明确SCSI ID的硬盘,可以估计出出错PDISK的实际位置。(这个适合于其中一个SCSI ID残缺的情况,如果有两个SCSI ID残缺,则转步骤3)。
DISK TO ADD 选新认出的那个PDISK号(要把新的硬盘变回7133用的硬盘,因为cfgmgr出来的是Systerm Disk)回车等待OK。
7、确认换盘是否成功, list all component in a hot spare pool , 你可以看到所有ARRAY 和HOTSPARE 盘的状态(如果有HOTSPARE的话)
location对照机器槽位上的编号就可以确定位置
3. diag->task->ssa service aids->Link Verification
显示pdisk的UID,可以到物理盘上对照,但是有时候不准确,可做参考查看
4. smitty ssaraid->List/Identify SSA Physical Disks,选Identify项可以标志指定的盘,盘上灯闪暗黄色
刚换上盘的时ቤተ መጻሕፍቲ ባይዱARRAY 的状态是rebuilding ,如果是RAID 5要很长时间才能变回 good状态,4-5小时。不过这个是不会影响数据的读写,RAID10的话时间会短很多。
注:只要把新的硬盘变成HOT SPARE这样ok了,它会自动的变回RAID里面的硬盘。
4、rmdev –dl pdisk* (*是出错的pdisk 号码)
将硬盘拔出,换上新的硬盘。
cfgmgr –vl ssar
你会发现一个新的PDISK*会出现,*号码和你刚才删掉是一样。不过是你刚换上的那个硬盘,可以用“DIAG-àtask selection-àssa service aid-àLink verification”确认S/N 号码
在硬盘类型里面将硬盘选成CANDIDATE。回车等待OK
按F3退回上一级MENU,选change member disks of in an ssa raid .你会看见
选swap members of an ssa raid array .
DISK TO REMOVE 选 BrankZLXXXX(这个是坏掉的硬盘在ARRAY中的旧信息)
smitty ssaraid出现
选 list all defined ssa raid
看当前RAID的状态。如果状态是good 的,那么就是说HOTSPARE已经顶替上坏掉的硬盘。只要将新换上去的硬盘变成HOT SPARE 就得了。如果硬盘的容量不对,会导致新换的硬盘不能变成HOT SPARE,这样要Format新的硬盘,然后把新的硬盘变成HOT SPARE,就得了。(DIAG----àtask selection----ssa service aid----àFormat Disk然后选要Format的硬盘),然后按照步骤5
如果当前的RAID 处于DEGRADE状态,按照步骤6
5、选change and show use of an ssa physical disk .
在硬盘类型那里将硬盘选成HOTSPARE。回车等待OK,转步骤7
6、选change and show use of an ssa physical disk
2)smitty ssaraid->...->List Disks in an SSA RAID Array 列出所有在RAID中的盘
3)smitty ssaraid->...->List Hot Spares 列出所有Hot Spares盘
二. 确定盘的位置,有多种方法可以确定盘的位置
1. lsdev -Cc pdisk 会显示各个pdisk的location
2. diag->task->ssa service aids->Enclosure Configuration或者Physical Link Configuration,会显示location
5. 更换时将盘设置成service mode的同时标志该盘,则该盘灯会闪暗黄色
几种方法结合就可以确定位置而不至于换错盘了。
三. 最后换盘。
注意:如果换的是RAID中的盘,则新盘设置成Array Candidate,并添加到相应RAID;如果换的盘是HOT SPARE,则新盘设置成HOT SPARE;如果RAID中的坏盘已经被REJECT,则新换的盘也设置成HOT SPARE。
3. smitty ssaraid
->List All Defined SSA RAID Arrays
列出所有RAID,如显示GOOD,则RAID中的盘都是好的,如有RAID显示degraded,则该RAID中有盘故障。可以结合ERRPT报错确定故障的盘
smitty ssaraid
->List/Identify SSA Physical Disks
->List Rejected Array Disks 列出被REJECT的盘,REJECTED盘都是有故障被从RAID剔除的,需要更换。
因为HOT SPARE盘坏了以后一般只有一次ERRPT报错,而且对RAID状态没有影响,如果时间久远或者ERRPT日志被客户清了就很容易被忽略,所以我们需要查清所有盘的使用所属情况,来确认是否有隐藏的坏盘。
3、DIAG->task selectionàssa service aidàLink verification
你可以看到所有的pdisk 的具体状态和S/N 号码。你可以清楚地看到在ERROR LOG 里面报错的PDISK的状态是REJECT 或者是FAIL。记下那个出错PDISK的S/N 号码,然后到7133那里用眼睛去对硬盘上的标签是不是和系统里面显示的一样。(参考步骤2的SCSI ID,看是否相符),也可以用“DIAG->task selectionàssa service aidà Set Service Mode”把要换的硬盘的灯变成黄灯,亮黄灯的那个就是要换的硬盘。
4)smitty ssaraid->...->List Rejected Array Disks 列出所有Rejected盘
那些没有归属的而且物理上存在的盘就是隐藏的故障盘了。
4. 如果RAID状态显示是GOOD,但是ERRPT中有该RAID中的盘连续报错,则该盘还可用,但是不安全,建议与客户沟通后更换掉。
一. 确定哪些盘是故障的,需要更换。方法如下:
1. 查看ERRPT报错。
在向硬盘读写数据失败时会产生一个报错。hot spare盘或者是阵列中因为故障而已经被reject的盘一般只有一次报错,而在阵列中的故障盘,或者读写时有偶发性错误的盘则会连续报错。
2. diag->Task->ssa service aids->Link Verification 查看LINK状态,显示failed表示盘连接有问题,有故障。(显示GOOD表示连接是好的,但是不能保证硬盘是好的)
四.换盘
1、#errpt –dH |more
一般都会出现PDISK* 的OPERATION 的错误,将PDISK号记下来。
2、#lsdev –Cc pdisk
会显示出系统当前所有PDISK的状态,其状态有可能都是AVAILABLE。但是ERROR LOG出现那个出错的PDISK* 才是我们需要注意的。写下PDISK 的 SCSI ID。(SCSI ID 为 location code 中逗号左边那个号码)SCSI ID 又为 这个PDISK 在7133的实际SLOT 位置,这个非常重要,如果出错那个PDISK SCSI ID 残缺,看不到完整的SCSI ID,那么可以根据上下的PDISK 号码估计出实际位置,例如有16的硬盘,那么排除其他有明确SCSI ID的硬盘,可以估计出出错PDISK的实际位置。(这个适合于其中一个SCSI ID残缺的情况,如果有两个SCSI ID残缺,则转步骤3)。
DISK TO ADD 选新认出的那个PDISK号(要把新的硬盘变回7133用的硬盘,因为cfgmgr出来的是Systerm Disk)回车等待OK。
7、确认换盘是否成功, list all component in a hot spare pool , 你可以看到所有ARRAY 和HOTSPARE 盘的状态(如果有HOTSPARE的话)
location对照机器槽位上的编号就可以确定位置
3. diag->task->ssa service aids->Link Verification
显示pdisk的UID,可以到物理盘上对照,但是有时候不准确,可做参考查看
4. smitty ssaraid->List/Identify SSA Physical Disks,选Identify项可以标志指定的盘,盘上灯闪暗黄色
刚换上盘的时ቤተ መጻሕፍቲ ባይዱARRAY 的状态是rebuilding ,如果是RAID 5要很长时间才能变回 good状态,4-5小时。不过这个是不会影响数据的读写,RAID10的话时间会短很多。
注:只要把新的硬盘变成HOT SPARE这样ok了,它会自动的变回RAID里面的硬盘。
4、rmdev –dl pdisk* (*是出错的pdisk 号码)
将硬盘拔出,换上新的硬盘。
cfgmgr –vl ssar
你会发现一个新的PDISK*会出现,*号码和你刚才删掉是一样。不过是你刚换上的那个硬盘,可以用“DIAG-àtask selection-àssa service aid-àLink verification”确认S/N 号码
在硬盘类型里面将硬盘选成CANDIDATE。回车等待OK
按F3退回上一级MENU,选change member disks of in an ssa raid .你会看见
选swap members of an ssa raid array .
DISK TO REMOVE 选 BrankZLXXXX(这个是坏掉的硬盘在ARRAY中的旧信息)
smitty ssaraid出现
选 list all defined ssa raid
看当前RAID的状态。如果状态是good 的,那么就是说HOTSPARE已经顶替上坏掉的硬盘。只要将新换上去的硬盘变成HOT SPARE 就得了。如果硬盘的容量不对,会导致新换的硬盘不能变成HOT SPARE,这样要Format新的硬盘,然后把新的硬盘变成HOT SPARE,就得了。(DIAG----àtask selection----ssa service aid----àFormat Disk然后选要Format的硬盘),然后按照步骤5
如果当前的RAID 处于DEGRADE状态,按照步骤6
5、选change and show use of an ssa physical disk .
在硬盘类型那里将硬盘选成HOTSPARE。回车等待OK,转步骤7
6、选change and show use of an ssa physical disk