硬盘SMART检测参数详解
如何看硬盘SMART参数实现自我检测
如何看硬盘SMART参数实现⾃我检测S.M.A.R.T.,全称为“Self-Monitoring Analysis and Reporting Technology”,即“⾃我监测、分析及报告技术”。
是⼀种⾃动的状态检测与预警系统和规范。
通过在硬盘硬件内的检测指令对硬盘的硬件如、盘⽚、、电路的运⾏情况进⾏监控、记录并与⼚商所设定的预设安全值进⾏⽐较,若监控情况将或已超出预设安全值的安全范围,就可以通过主机的监控硬件或软件⾃动向⽤户做出警告并进⾏轻微的⾃动修复,以提前保障数据的安全。
除⼀些出⼚时间极早的硬盘外,现在⼤部分硬盘均配备该项技术。
⼀、SMART概述 硬盘的故障⼀般分为两种:可预测的(predictable)和不可预测的(unpredictable)。
后者偶⽽会发⽣,也没有办法去预防它,例如芯⽚突然失效,机械撞击等。
但像电机轴承磨损、盘⽚磁介质性能下降等都属于可预测的情况,可以在在⼏天甚⾄⼏星期前就发现这种不正常的现象。
如果发⽣这种问题,SMART功能会在开机时响起警报,⾄少让使⽤者有⾜够的时间把重要资料转移到其它储存设备上。
最早期的硬盘监控技术起源于1992年,IBM在AS/400计算机的IBM 0662 SCSI 2代硬盘驱动器中使⽤了后来被命名为Predictive Failure Analysis(故障预警分析技术)的监控技术,它是通过在固件中测量⼏个重要的硬盘安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全”或“不久后会发⽣故障”。
不久,当时的微机制造商康柏和硬盘制造商希捷、昆腾以及康纳共同提出了名为IntelliSafe的类似技术。
通过该技术,硬盘可以测量⾃⾝的的健康指标并将参量值传送给操作系统和⽤户的监控软件中,每个硬盘⽣产商有权决定哪些指标需要被监控以及设定它们的安全阈值。
1995年,康柏公司将该技术⽅案提交到Small Form Factor(SFF)委员会进⾏标准化,该⽅案得到IBM、希捷、昆腾、康纳和西部数据的⽀持,1996年6⽉进⾏了1.3版的修正,正式更名为S.M.A.R.T.(Self-Monitoring Analysis And Reporting Technology),全称就是“⾃我检测分析与报告技术”,成为⼀种⾃动监控硬盘驱动器完好状况和报告潜在问题的技术标准。
硬盘SMART检测全参数详解
硬盘SMART检测参数详解用户最不愿意看到的事情,莫过于在毫无警告的情况下发现硬盘崩溃了。
诸如RAID的备份和存储技术可以在任何时候帮用户恢复数据,但为预防硬件崩溃造成数据丢失所花费的代价却是相当可观的,特别是在用户从来没有提前考虑过在这些情况下的应对措施时。
硬盘的故障一般分为两种:可预测的〔predictable〕和不可预测的〔unpredictable〕。
后者偶而会发生,也没有方法去预防它,例如芯片突然失效,机械撞击等。
但像电机轴承磨损、盘片磁介质性能下降等都属于可预测的情况,可以在在几天甚至几星期前就发现这种不正常的现象。
对于可预测的情况,如果能通过磁盘监控技术,通过测量硬盘的几个重要的安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全〞或“不久后会发生故障〞。
那么在发生故障前,至少有足够的时间让使用者把重要资料转移到其它储存设备上。
最早期的硬盘监控技术起源于1992年,IBM在AS/400计算机的IBM 0662 SCSI 2代硬盘驱动器中使用了后来被命名为Predictive Failure Analysis〔故障预警分析技术〕的监控技术,它是通过在固件中测量几个重要的硬盘安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全〞或“不久后会发生故障〞。
不久,当时的微机制造商康柏和硬盘制造商希捷、昆腾以与康纳共同提出了名为IntelliSafe的类似技术。
通过该技术,硬盘可以测量自身的的健康指标并将参量值传送给操作系统和用户的监控软件中,每个硬盘生产商有权决定哪些指标需要被监控以与设定它们的安全阈值。
1995年,康柏公司将该技术方案提交到Small Form Factor(SFF)委员会进展标准化,该方案得到IBM、希捷、昆腾、康纳和西部数据的支持,1996年6月进展了1.3版的修正,正式更名为S.M.A.R.T.〔Self-Monitoring Analysis And Reporting Technology〕,全称就是“自我检测分析与报告技术〞,成为一种自动监控硬盘驱动器完好状况和报告潜在问题的技术标准。
SMART技术检测磁盘故障参数
SMART技术检测磁盘故障参数SMART检测参数说明一般情况下,用户只要观察当前值、最差值和临界值的关系,并注意状态提示信息即可大致了解硬盘的健康状况。
下面简单介绍各参数的含义,以红色标出的项目是寿命关键项,蓝色为固态硬盘(SSD)特有的项目。
在基于闪存的固态硬盘中,存储单元分为两类:SLC(Single Layer Cell,单层单元)和MLC(Multi-Level Cell,多层单元)。
SLC成本高、容量小、但读写速度快,可靠性高,擦写次数可高达100000次,比MLC高10倍。
而MLC虽容量大、成本低,但其性能大幅落后于SLC。
为了保证MLC的寿命,控制芯片还要有智能磨损平衡技术算法,使每个存储单元的写入次数可以平均分摊,以达到100万小时的平均无故障时间。
因此固态硬盘有许多SMART参数是机械硬盘所没有的,如存储单元的擦写次数、备用块统计等等,这些新增项大都由厂家自定义,有些尚无详细的解释,有些解释也未必准确,此处也只是仅供参考。
下面凡未注明厂商的固态硬盘特有的项均为SandForce主控芯片特有的,其它厂商各自单独注明。
01(001)底层数据读取错误率 Raw Read Error Rate数据为0或任意值,当前值应远大于与临界值。
底层数据读取错误率是磁头从磁盘表面读取数据时出现的错误,对某些硬盘来说,大于0的数据表明磁盘表面或者读写磁头发生问题,如介质损伤、磁头污染、磁头共振等等。
不过对希捷硬盘来说,许多硬盘的这一项会有很大的数据量,这不代表有任何问题,主要是看当前值下降的程度。
在固态硬盘中,此项的数据值包含了可校正的错误与不可校正的RAISE错误(UECC+URAISE)。
注:RAISE(Redundant Array of Independent Silicon Elements)意为独立硅元素冗余阵列,是固态硬盘特有的一种冗余恢复技术,保证内部有类似RAID 阵列的数据安全性。
SMART参数解析
SMART参数解析S.M.A.R.T 参数解析S.M.A.R.T(Self Monitoring Analysis and Reporting Technology /自我监测、分析与报告技术)是为了提高硬盘数据的安全性而开发的。
它可以使硬盘实时检查自身的状态,通过一定机理及时分析出潜在的问题,报告给系统,有时甚至能给出预计的硬盘故障日期,实际就是一种预警技术。
这个功能可以比较客观的反映硬盘目前的健康状况。
提示:该硬盘没有任何损坏。
因为SATA数据线曾经被多次拔插过,造成SATA数据线接口处,金属弹簧触片磨损氧化、弹性下降引起的接触不良。
使(C7)值上升。
故障表现:电脑卡死、蓝屏、无法开机。
甚至硬盘丢失(BIOS里也没有硬盘信息)运行一些程序时会弹出警告:(C7)值也不再增加。
后来网上查看资料,SATA数据线有弊端:就是SATA数据线拔插次数有限,质量差的,拔插几次就没用了。
Value/Current(当前值) 当前硬盘该属性的值。
Worst(最坏值) 该属性出现过的峰值。
Threshold/Warn(阈值/临界/极限值) 硬盘厂商所规定的该属性峰值。
如果某个属性超过Threshold规定的极限值时,就表示你的硬盘可能出现了问题。
Raw Values/Data (Raw值/数据) 。
和该属性有关联的数据总值。
怎么看这类属性?主要是看Raw和Worst的值是否还在临界值之内(>或<临界值)一般使用软件如HDTune、CrystalDiskInfo等,一般属性中有黄色或者红色你就要注意了,硬盘可能快坏了,要是还在保修期内,就赶紧备份数据,送去检修。
下面我们来介绍各个属性(按2010年2月11日维基百科上的解释)指从磁盘表面读取数据时发生的硬件读取错误的比率,Raw值对于不同的厂商有着不同的体系,单纯看做1个十进制数字是没有任何意义的。
*以上为Wiki上的英文翻译版本,此属性貌似存在分歧,有的说值高了好,有的说低了好,此处我们还是按照Wiki上的吧,反正只要Worst不小于 Threshold 就行了。
磁盘检测之读懂SMART
磁盘检测之读懂S.M.A.R.TS.M.A.R.T.(自监测、分析、报告技术):这是现在硬盘普遍采用的数据安全技术,在硬盘工作的时候监测系统对电机、电路、磁盘、磁头的状态进行分析,当有异常发生的时候就会发出警告,有的还会自动降速并备份数据。
早在上个世纪九十年代,人们就意识到数据的宝贵性胜于硬盘自身价值,渴望有种技术能对硬盘故障进行预测并实现相对安全的数据保护,因此S.M.A.R.T技术应运而生。
对于不少用户,特别是商业用户而言,一次普通的硬盘故障便足以造成灾难性后果,所以时至今日,S.M.A.R.T技术仍为我们所用。
S.M.A.R.T信息保留在硬盘的系统保留区(service area)也叫固件区内,这个区域一般位于硬盘0物理柱面的最前面几十个物理磁道,由厂商写入相关内部管理程序。
系统保留区除了S.M.A.R.T信息表外还包括低级格式化程序、加密解密程序、自监控程序、自动修复程序等。
监测软件通过一个名为“SMART RETURN STATUS”的命令(命令代码为:B0h)对S.M.A.R.T信息进行读取,且不允许最终用户对信息进行修改。
在硬盘以及操作系统都支持S.M.A.R.T.技术并且该技术默认开启的的情况下,在不良状态出现时S.M.A.R.T.技术能够在屏幕上显示英文警告信息:“WARNING:IMMEDIATLY BACKUP YOUR DATA AND REPLACE YOUR HARD DISK DRIVE,A FAILURE MAY BE IMMINENT.” (警告:立刻备份你的数据同时更换硬盘驱动器,可能有错误出现。
)SMART数据分析:例如用任意软件查看硬盘的SMART结果如下:S.M.A.R.T检测参数分为7列,分别是ID检测代码、属性描述、属性值、最大错误值、阈值、实际值和属性状态。
ID检测代码(ID)ID检测代码不是唯一的,厂商可以根据需要,使用不同的ID代码或根据检测参数的多少增减ID代码的数量。
磁盘smart检查
1 磁盘smart信息介绍S.M.A.R.T的全称为“Self-Monitoring,Analysis and Reporting Technology”,即“自我监测、分析及报告技术”。
支持S.M.A.R.T技术的硬盘可以通过硬盘上的监测指令和主机上的监测软件对磁头、盘片、马达、电路的运行情况、历史记录及预设的安全值进行分析、比较。
当出现安全值范围以外的情况时,就会自动向用户发出警告。
磁盘Smart信息中包含各种值的介绍:1、属性当前值(value)属性值是指硬盘出厂时预设的最大正常值,一般范围为1~253。
通常,最大的属性值等于100(适用于IBM、富士通)或253(适用于三星)。
当然,也有例外的时候,比如由西部数据公司生产的部分型号硬盘,就用了两个不同的属性值,最初生产时属性值设为200,但后来生产的有些硬盘属性值又改为100。
2、最大出错值(Worst)最大出错值是硬盘运行中曾出现过的最大的非正常值。
它是对硬盘累计运行的计算值,根据运行周期,该数值会不断地刷新,并且会非常接近阈值。
S.M.A.R.T分析和判定硬盘的状态是否正常,就是根据这个数值和阈值的比较结果而定。
新硬盘开始时有最大的属性值,但随着日常使用或出现错误,该值会不断减小。
因此,较大的属性值意味着硬盘质量较好而且可靠性较高,而较小的属性值则意味着故障发生的可能性增大。
3、实际值(Date)是硬盘各检测项目运行中的实际数值,很多项目是累计值。
例如:Start/Stop Count(启停次数),累计的实际值是436,即该硬盘从开始到现在累计加电启停436次。
4、属性状态(Status)这是S.M.A.R.T针对前面的各项属性值进行比较分析后,提供的硬盘各属性目前的状态,也是我们直观判断硬盘“健康”状态的重要信息。
根据S.M.A.R.T的规定,这种状态一般有正常、警告和报告故障或错误等3种状态。
5、阈值(Threshold)又称门限值。
SMART参数详解
SMART参数详解2017年5月18日1:21一、SMART概述硬盘的故障一般分为两种:可预测的(predictable)和不可预测的(unpredictable)。
后者偶而会发生,也没有办法去预防它,例如芯片突然失效,机械撞击等。
但像电机轴承磨损、盘片磁介质性能下降等都属于可预测的情况,可以在在几天甚至几星期前就发现这种不正常的现象。
如果发生这种问题,SMART功能会在开机时响起警报,至少让使用者有足够的时间把重要资料转移到其它储存设备上。
最早期的硬盘监控技术起源于1992年,IBM在AS/400计算机的IBM 0662 SCSI 2代硬盘驱动器中使用了后来被命名为Predictive Failure Analysis(故障预警分析技术)的监控技术,它是通过在固件中测量几个重要的硬盘安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全”或“不久后会发生故障”。
不久,当时的微机制造商康柏和硬盘制造商希捷、昆腾以及康纳共同提出了名为IntelliSafe的类似技术。
通过该技术,硬盘可以测量自身的的健康指标并将参量值传送给操作系统和用户的监控软件中,每个硬盘生产商有权决定哪些指标需要被监控以及设定它们的安全阈值。
1995年,康柏公司将该技术方案提交到Small Form Factor(SFF)委员会进行标准化,该方案得到IBM、希捷、昆腾、康纳和西部数据的支持,1996年6月进行了1.3版的修正,正式更名为S.M.A.R.T.(Self-Monitoring Analysis And Reporting Technology),全称就是“自我检测分析与报告技术”,成为一种自动监控硬盘驱动器完好状况和报告潜在问题的技术标准。
作为行业规范,SMART规定了硬盘制造厂商应遵循的标准,满足SMART 标准的条件主要包括:1)在设备制造期间完成SMART需要的各项参数、属性的设定;2)在特定系统平台下,能够正常使用SMART;通过BIOS检测,能够识别设备是否支持SMART并可显示相关信息,而且能辨别有效和失效的SMART信息;3)允许用户自由开启和关闭SMART功能;4)在用户使用过程中,能提供SMART的各项有效信息,确定设备的工作状态,并能发出相应的修正指令或警告。
硬盘SMART参数解释
硬盘SMART参数解释Raw Read Error Rate 底层读取错误率,⾼值暗⽰盘体/磁头有问题Throughput Performance 读写通量性能 (越⾼越好) * ⼀般在进⾏了⼈⼯ Offline S.M.A.R.T. 测试以后才会有值。
Spin Up Time 电机起转时间,单位为秒或者毫秒Start/Stop Count 电机起停次计数,⾼值暗⽰故障概率增加Reallocated Sector Count 重定位扇区计数,表⽰硬件已经发现了多少坏扇区* 理想情况下这个值应该为0,如果不为0也不要太惊慌,⽽是应该⽐较密切的关注这个值的变化情况:如果连续⼏周没有变化,那你应该可以放⼼的继续使⽤⽐较长的⼀段时间;如果这个值持续攀升,那么请尽快备份所有数据,并考虑购买新硬盘。
Seek Error Rate 寻道错误率,这个视硬盘⼚家⽽定,有的⼚新硬盘都会有* ⼀般不为零也不要紧,但是如果持续升⾼,暗⽰盘体/磁头机械有问题。
Seek Time Performance 寻道性能 (越⾼越好),如果持续减低,暗⽰盘体/磁头机械有问题Power-On Hours 磁盘加电时间。
* 参考磁盘⼚家给的该款硬盘的 MTBF(平均故障间隔时间) 可以估计故障概率。
但是也有可能超过MTBF⽽不会出现故障,因为统计数据对于个体来说是不精确的v-Spin Retry Count 电机起转重试,理想情况应该为0,⾮0表⽰电机或者控制芯⽚可能存在问题* 当然,在某些情况下可能认为造成这个值的⾮故障升⾼,⽐如电压供给不⾜。
Recalibration Retries 磁头校准重试,⾼值暗⽰磁头机械有问题Device Power Cycle Count 设备开关计数,⾼值暗⽰故障概率增加mSoft Read Error Rate 软件读取错误率,⾼值暗⽰有扇区不稳定G-Sense Error Rate 加速度错误率* ⼀般存在于笔记本硬盘和企业级硬盘中,表⽰硬盘受到的可能导致故障的冲击次数。
SMART介绍
SMART详解1、查看SMART状态Worst=最坏值;这个名称容易产生歧意,其实就是某个属性出现过的峰值;Value=目前的值;Threshold=阈值/极限值;如果磁盘的某个属性超过阈值时,就表示该盘出现了问题;Status=状态;OK表示正常;FAIL表示磁盘已经出现问题了;如果当一个参数的数值(Value)往阈值(Threshold)变化,就表示该项参数在恶化,也许是常态的老化现象,也许是出现了问题;相反的,如果往门槛值的反方向变化时,则表示该问题在改善,或是状况已经暂时解除。
但不管怎样,只要数值(Value)曾低于阈值(包括Worst),就代表这颗磁盘快挂了,应该尽快备份数据。
SMART数据会因硬盘厂商和产品型号的不同而有差异,不过不必担心,因为关键属性是任何一款硬盘都不会遗漏的。
那什么叫关键属性?其实SMART的属性分为Critical Attributes和Informative Attributes两类,关键属性和信息属性。
其中关键属性包括了有关硬盘健康的最重要的数据,而信息属性所提供的数据一般只是辅助性的,相对来说比较次要的。
区分它们的方法是看threshold(阈值/极限值),值为非零代表关键属性,为零代表信息属性。
2、S.M.A.R.T.AttributesID Hex Attribute name Description0101Read Error Rate读取出错率Indicates the rate of hardware read errors that occurred when readingdata from a disk surface.The raw value has different structure fordifferent vendors and is often not meaningful as a decimal number.0202ThroughputPerformance输出性能Overall(general)throughput performance of a hard disk drive.If thevalue of this attribute is decreasing there is a high probability thatthere is a problem with the disk.0303Spin-Up Time旋上时间Average time of spindle spin up(from zero RPM to fully operational[millisecs]).硬盘马达达到规定转速所花费的时间0404Start/Stop Count启停次数A tally of spindle start/stop cycles.The spindle turns on,and hencethe count is increased,both when the hard disk is turned on afterhaving before been turned entirely off(disconnected from powersource)and when the hard disk returns from having previously beenput to sleep mode.[13]硬盘马达启动/停止的次数。
SMART参数解析
参数解析S.M.A.R.T(Self Monitoring Analysis and Reporting Technology /自我监测、解析与报告技术 ) 是为了提高硬盘数据的安全性而开发的。
它能够使硬盘实时检查自己的状态,经过必然机理实时解析出潜藏的问题,报告给系统,有时甚至能给出预计的硬盘故障日期,实质就是一种预警技术。
这个功能能够比较客观的反响硬盘当前的健康情况。
提示:该硬盘没有任何损坏。
由于 SATA数据线曾经被多次拔插过,造成 SATA数据线接口处,金属弹簧触片磨损氧化、弹性下降引起的接触不良。
使 (C7) 值上升。
故障表现:电脑卡死、蓝屏、无法开机。
甚至硬盘扔掉 (BIOS 里也没有硬盘信息)运转一些程序时会弹出警告:( X: 是运转程序所在分区)无法接见。
由于 I/O 设备错误,无法运转此项要求。
先判断是硬盘出现坏道了,但当把硬盘接到另一台电脑后,硬盘所有正常使用,说明硬盘没有问题。
今后换条SATA数据线,故障解决。
(C7) 值也不再增加。
今后网上查察资料,SATA数据线出弊端:就是 SATA数据线拔插次数有限,质量差的,拔插几次就没用了。
Value/Current(当前值)当前硬盘该属性的值。
Worst( 最坏值 )该属性出现过的峰值。
Threshold/Warn( 阈值 / 临界 / 极限值 ) 硬盘厂商所规定的该属性峰值。
若是某个属性高出Threshold 规定的极限值时,就表示你的硬盘可能出现了问题。
Raw Values/Data (Raw 值/ 数据 ) 。
和该属性有关系的数据总值。
怎么看这类属性?主若是看 Raw和 Worst 的值可否还在临界值之内(> 或<临界值 )一般使用软件如 HDTune、CrystalDiskInfo 等,一般属性中有黄色也许红色你就要注意了,硬盘可能快坏了,若是还在保修期内,就连忙备份数据,送去检修。
下面我们来介绍各个属性( 按 2010 年 2 月 11 日维基百科上的讲解)ID Hex = 英文属性名 /中文属性名属性描述01 01 =Read Error Rate / (基层)数据读取错误率指从磁盘表面读取数据时发生的硬件读取错误的比率, Raw值对于不相同的厂商有着不相同的系统,单纯看做 1 个十进制数字是没有任何意义的。
硬盘SMART参数解释
Raw Read Error Rate 底层读取错误率,高值暗示盘体/磁头有问题Throughput Performance 读写通量性能(越高越好)* 一般在进行了人工Offline S.M.A.R.T. 测试以后才会有值。
Spin Up Time 电机起转时间,单位为秒或者毫秒Start/Stop Count 电机起停次计数,高值暗示故障概率增加Reallocated Sector Count 重定位扇区计数,表示硬件已经发现了多少坏扇区* 理想情况下这个值应该为0,如果不为0也不要太惊慌,而是应该比较密切的关注这个值的变化情况:如果连续几周没有变化,那你应该可以放心的继续使用比较长的一段时间;如果这个值持续攀升,那么请尽快备份所有数据,并考虑购买新硬盘。
Seek Error Rate 寻道错误率,这个视硬盘厂家而定,有的厂新硬盘都会有* 一般不为零也不要紧,但是如果持续升高,暗示盘体/磁头机械有问题。
Seek Time Performance 寻道性能(越高越好),如果持续减低,暗示盘体/磁头机械有问题Power-On Hours 磁盘加电时间。
* 参考磁盘厂家给的该款硬盘的MTBF(平均故障间隔时间) 可以估计故障概率。
但是也有可能超过MTBF而不会出现故障,因为统计数据对于个体来说是不精确的v-Spin Retry Count 电机起转重试,理想情况应该为0,非0表示电机或者控制芯片可能存在问题* 当然,在某些情况下可能认为造成这个值的非故障升高,比如电压供给不足。
Recalibration Retries 磁头校准重试,高值暗示磁头机械有问题Device Power Cycle Count 设备开关计数,高值暗示故障概率增加mSoft Read Error Rate 软件读取错误率,高值暗示有扇区不稳定G-Sense Error Rate 加速度错误率* 一般存在于笔记本硬盘和企业级硬盘中,表示硬盘受到的可能导致故障的冲击次数。
硬盘SMART检测参数详解
硬盘SMART检测参数详解SMART(Self-Monitoring, Analysis and Reporting Technology)是一种嵌入在硬盘中的自我监测、分析和报告技术,用于检测硬盘的健康状况和预测可能的故障。
SMART报告显示了硬盘的各种检测参数,可以帮助用户及时采取措施以保护硬盘中的数据。
本文将详细介绍一些常见的SMART检测参数及其含义。
1. Raw Read Error Rate(原始读取错误率):表示在从硬盘中读取数据时发生的错误次数。
数值越小越好,如果该值超过了硬盘的阈值,说明硬盘的读取性能可能有问题。
2. Spin-Up Time(启动时间):指硬盘从静止状态启动到正常运转所需的时间。
数值越小越好,如果启动时间过长,可能是硬盘的电机出现了问题。
3. Start/Stop Count(启动/停止计数):指硬盘启动和停止的次数。
当硬盘的启动/停止次数超过阈值时,可能表示硬盘可能发生故障。
4. Reallocated Sectors Count(重分配扇区计数):表示硬盘因为发现一些扇区出现故障而将其重新分配给备用扇区的次数。
数值越大表示硬盘上的坏扇区越多,可能意味着硬盘的寿命已经接近尽头。
5. Seek Error Rate(寻道错误率):表示在寻找指定数据时发生的错误次数。
数值越小越好,如果这个值过高,可能是硬盘磁头或电机出现故障。
6. Power-On Hours(通电时间):指硬盘从上次通电以来的总工作时间。
数值越大表示硬盘使用时间越长,寿命可能越接近尽头。
7. Temperature(温度):硬盘的温度。
高温会对硬盘的寿命造成不利影响,用户应确保硬盘处于适宜的工作温度范围内。
8. Hardware ECC Recovered(硬件ECC恢复):表示硬盘自动纠错功能(ECC)成功恢复错误的次数。
数值越大表示纠错功能越有效。
9. Current Pending Sector Count(当前待定扇区计数):表示硬盘当前有多少个扇区出现了错误但尚未被硬盘重新分配。
电脑硬盘SMART监测与故障
电脑硬盘SMART监测与故障智能硬盘监测技术(Self-Monitoring, Analysis and Reporting Technology,简称SMART)是一种为电脑硬盘提供自动检测和监测的机制。
通过SMART技术,我们可以及时发现硬盘的潜在问题以及预测故障的可能性,从而采取相应的措施来保护重要的数据。
一、SMART技术原理及作用SMART技术通过硬盘内置的传感器和自我诊断工具来收集与硬盘运行情况相关的各种数据,包括温度、读写错误率、旋转速度、起停次数等。
通过这些数据的收集和分析,SMART技术可以对硬盘的健康状况进行评估。
当硬盘出现问题或存在潜在故障时,SMART技术会提供警告信息,使用户能够及早采取防护措施,防止数据丢失和系统崩溃的风险。
二、SMART监测的方法和工具为了实施SMART监测,我们可以使用多种方式和工具。
以下是一些常见的SMART监测工具:1. 硬盘厂商提供的监测工具:大多数硬盘厂商都提供了自家设计的SMART监测工具,用户可以从厂商官方网站下载和安装。
这些工具通常具有用户友好的界面,并可以提供详细的硬盘状态报告。
2. 第三方监测工具:除了硬盘厂商提供的工具,还有许多第三方软件也提供了SMART监测功能。
例如CrystalDiskInfo、HD Tune等。
这些工具通常具有丰富的功能和可视化界面,可以更直观地展示硬盘的运行状态。
三、SMART监测结果的解读在进行SMART监测后,我们需要对监测结果进行分析和解读。
以下是一些常见的SMART监测参数及其含义:1. 温度:硬盘的工作温度。
过高的温度可能导致硬盘寿命的缩短和数据丢失的风险。
2. 读写错误率:硬盘在读写数据时出现错误的频率。
高错误率可能意味着硬盘驱动器有坏道或其他故障。
3. 旋转速度:硬盘的旋转速度。
过低或过高的旋转速度可能导致读取和写入速度的下降,影响系统性能。
4. 起停次数:硬盘的启动和停止次数。
频繁的起停操作可能加速硬盘的磨损,增加故障风险。
硬盘SMART检测参数详解
硬盘S M A R T检测参数详解Document number:NOCG-YUNOO-BUYTT-UU986-1986UT硬盘SMART检测参数详解用户最不愿意看到的事情,莫过于在毫无警告的情况下发现硬盘崩溃了。
诸如RAID的备份和存储技术可以在任何时候帮用户恢复数据,但为预防硬件崩溃造成数据丢失所花费的代价却是相当可观的,特别是在用户从来没有提前考虑过在这些情况下的应对措施时。
硬盘的故障一般分为两种:可预测的(predictable)和不可预测的(unpredictable)。
后者偶而会发生,也没有办法去预防它,例如芯片突然失效,机械撞击等。
但像电机轴承磨损、盘片磁介质性能下降等都属于可预测的情况,可以在在几天甚至几星期前就发现这种不正常的现象。
对于可预测的情况,如果能通过磁盘监控技术,通过测量硬盘的几个重要的安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全”或“不久后会发生故障”。
那么在发生故障前,至少有足够的时间让使用者把重要资料转移到其它储存设备上。
最早期的硬盘监控技术起源于1992年,IBM在AS/400计算机的IBM0662SCSI2代硬盘驱动器中使用了后来被命名为PredictiveFailureAnalysis(故障预警分析技术)的监控技术,它是通过在固件中测量几个重要的硬盘安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全”或“不久后会发生故障”。
不久,当时的微机制造商康柏和硬盘制造商希捷、昆腾以及康纳共同提出了名为IntelliSafe的类似技术。
通过该技术,硬盘可以测量自身的的健康指标并将参量值传送给操作系统和用户的监控软件中,每个硬盘生产商有权决定哪些指标需要被监控以及设定它们的安全阈值。
1995年,康柏公司将该技术方案提交到SmallFormAnalysisAndReportingTechnology),全称就是“自我检测分析与报告技术”,成为一种自动监控硬盘驱动器完好状况和报告潜在问题的技术标准。
如何看硬盘SMART参数实现自我检测
如何看硬盘SMART参数实现⾃我检测S.M.A.R.T.,全称为“Self-Monitoring Analysis and Reporting Technology”,即“⾃我监测、分析及报告技术”。
是⼀种⾃动的状态检测与预警系统和规范。
通过在硬盘硬件内的检测指令对硬盘的硬件如、盘⽚、、电路的运⾏情况进⾏监控、记录并与⼚商所设定的预设安全值进⾏⽐较,若监控情况将或已超出预设安全值的安全范围,就可以通过主机的监控硬件或软件⾃动向⽤户做出警告并进⾏轻微的⾃动修复,以提前保障数据的安全。
除⼀些出⼚时间极早的硬盘外,现在⼤部分硬盘均配备该项技术。
⼀、SMART概述 硬盘的故障⼀般分为两种:可预测的(predictable)和不可预测的(unpredictable)。
后者偶⽽会发⽣,也没有办法去预防它,例如芯⽚突然失效,机械撞击等。
但像电机轴承磨损、盘⽚磁介质性能下降等都属于可预测的情况,可以在在⼏天甚⾄⼏星期前就发现这种不正常的现象。
如果发⽣这种问题,SMART功能会在开机时响起警报,⾄少让使⽤者有⾜够的时间把重要资料转移到其它储存设备上。
最早期的硬盘监控技术起源于1992年,IBM在AS/400计算机的IBM 0662 SCSI 2代硬盘驱动器中使⽤了后来被命名为Predictive Failure Analysis(故障预警分析技术)的监控技术,它是通过在固件中测量⼏个重要的硬盘安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全”或“不久后会发⽣故障”。
不久,当时的微机制造商康柏和硬盘制造商希捷、昆腾以及康纳共同提出了名为IntelliSafe的类似技术。
通过该技术,硬盘可以测量⾃⾝的的健康指标并将参量值传送给操作系统和⽤户的监控软件中,每个硬盘⽣产商有权决定哪些指标需要被监控以及设定它们的安全阈值。
1995年,康柏公司将该技术⽅案提交到Small Form Factor(SFF)委员会进⾏标准化,该⽅案得到IBM、希捷、昆腾、康纳和西部数据的⽀持,1996年6⽉进⾏了1.3版的修正,正式更名为S.M.A.R.T.(Self-Monitoring Analysis And Reporting Technology),全称就是“⾃我检测分析与报告技术”,成为⼀种⾃动监控硬盘驱动器完好状况和报告潜在问题的技术标准。
SMART参数解析
S.M.A.R.T 参数解析S.M.A.R.T(Self Monitoring Analysis and Reporting Technology /自我监测、分析与报告技术)是为了提高硬盘数据的安全性而开发的。
它可以使硬盘实时检查自身的状态,通过一定机理及时分析出潜在的问题,报告给系统,有时甚至能给出预计的硬盘故障日期,实际就是一种预警技术。
这个功能可以比较客观的反映硬盘目前的健康状况。
提示:该硬盘没有任何损坏。
因为SATA数据线曾经被多次拔插过,造成SATA数据线接口处,金属弹簧触片磨损氧化、弹性下降引起的接触不良。
使(C7)值上升。
故障表现:电脑卡死、蓝屏、无法开机。
甚至硬盘丢失(BIOS里也没有硬盘信息)运行一些程序时会弹出警告:(C7)值也不再增加。
后来网上查看资料,SATA数据线有弊端:就是SATA数据线拔插次数有限,质量差的,拔插几次就没用了。
Value/Current(当前值) 当前硬盘该属性的值。
Worst(最坏值) 该属性出现过的峰值。
Threshold/Warn(阈值/临界/极限值) 硬盘厂商所规定的该属性峰值。
如果某个属性超过Threshold规定的极限值时,就表示你的硬盘可能出现了问题。
Raw Values/Data (Raw值/数据) 。
和该属性有关联的数据总值。
怎么看这类属性?主要是看Raw和Worst的值是否还在临界值之内(>或<临界值)一般使用软件如HDTune、CrystalDiskInfo等,一般属性中有黄色或者红色你就要注意了,硬盘可能快坏了,要是还在保修期内,就赶紧备份数据,送去检修。
下面我们来介绍各个属性(按2010年2月11日维基百科上的解释)指从磁盘表面读取数据时发生的硬件读取错误的比率,Raw值对于不同的厂商有着不同的体系,单纯看做1个十进制数字是没有任何意义的。
*以上为Wiki上的英文翻译版本,此属性貌似存在分歧,有的说值高了好,有的说低了好,此处我们还是按照Wiki上的吧,反正只要 Worst不小于 Threshold 就行了。
smart参数解析
S.M.A.R.T 参数解析S.M.A.R.T(Self Monitoring Analysis and Reporting Technology /自我监测、分析与报告技术)是为了提高硬盘数据的安全性而开发的。
它可以使硬盘实时检查自身的状态,通过一定机理及时分析出潜在的问题,报告给系统,有时甚至能给出预计的硬盘故障日期,实际就是一种预警技术。
这个功能可以比较客观的反映硬盘目前的健康状况。
提示:该硬盘没有任何损坏。
因为SATA数据线曾经被多次拔插过,造成SATA数据线接口处,金属弹簧触片磨损氧化、弹性下降引起的接触不良。
使(C7)值上升。
故障表现:电脑卡死、蓝屏、无法开机。
甚至硬盘丢失(BIOS里也没有硬盘信息)运行一些程序时会弹出警告:(X:是运行程序所在分区)无法访问X:\。
由于I/O设备错误,无法运行此项要求。
先判断是硬盘出现坏道了,但当把硬盘接到另一台电脑后,硬盘一切正常使用,说明硬盘没有问题。
后来换条SATA数据线,故障解决。
(C7)值也不再增加。
后来网上查看资料,SATA数据线有弊端:就是SATA数据线拔插次数有限,质量差的,拔插几次就没用了。
Value/Current(当前值) 当前硬盘该属性的值。
Worst(最坏值) 该属性出现过的峰值。
Threshold/Warn(阈值/临界/极限值) 硬盘厂商所规定的该属性峰值。
如果某个属性超过Threshold规定的极限值时,就表示你的硬盘可能出现了问题。
Raw Values/Data (Raw值/数据) 。
和该属性有关联的数据总值。
怎么看这类属性?主要是看Raw和Worst的值是否还在临界值之内(>或<临界值)一般使用软件如HDTune、CrystalDiskInfo等,一般属性中有黄色或者红色你就要注意了,硬盘可能快坏了,要是还在保修期内,就赶紧备份数据,送去检修。
下面我们来介绍各个属性(按2010年2月11日维基百科上的解释)指从磁盘表面读取数据时发生的硬件读取错误的比率,Raw值对于不同的厂商有着不同的体系,单纯看做1个十进制数字是没有任何意义的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
硬盘SMART检测参数详解用户最不愿意看到的事情,莫过于在毫无警告的情况下发现硬盘崩溃了。
诸如RAID的备份和存储技术可以在任何时候帮用户恢复数据,但为预防硬件崩溃造成数据丢失所花费的代价却是相当可观的,特别是在用户从来没有提前考虑过在这些情况下的应对措施时。
硬盘的故障一般分为两种:可预测的(predictable)和不可预测的(unpredictable)。
后者偶而会发生,也没有办法去预防它,例如芯片突然失效,机械撞击等。
但像电机轴承磨损、盘片磁介质性能下降等都属于可预测的情况,可以在在几天甚至几星期前就发现这种不正常的现象。
对于可预测的情况,如果能通过磁盘监控技术,通过测量硬盘的几个重要的安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全”或“不久后会发生故障”。
那么在发生故障前,至少有足够的时间让使用者把重要资料转移到其它储存设备上。
最早期的硬盘监控技术起源于1992年,IBM在AS/400计算机的IBM 0662 SCSI 2代硬盘驱动器中使用了后来被命名为Predictive Failure Analysis(故障预警分析技术)的监控技术,它是通过在固件中测量几个重要的硬盘安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全”或“不久后会发生故障”。
不久,当时的微机制造商康柏和硬盘制造商希捷、昆腾以及康纳共同提出了名为IntelliSafe的类似技术。
通过该技术,硬盘可以测量自身的的健康指标并将参量值传送给操作系统和用户的监控软件中,每个硬盘生产商有权决定哪些指标需要被监控以及设定它们的安全阈值。
1995年,康柏公司将该技术方案提交到Small Form Factor(SFF)委员会进行标准化,该方案得到IBM、希捷、昆腾、康纳和西部数据的支持,1996年6月进行了1.3版的修正,正式更名为S.M.A.R.T.(Self-Monitoring Analysis And Reporting Technology),全称就是“自我检测分析与报告技术”,成为一种自动监控硬盘驱动器完好状况和报告潜在问题的技术标准。
SMART的目的是监控硬盘的可靠性、预测磁盘故障和执行各种类型的磁盘自检。
如今大部分的ATA/SATA、SCSI/SAS和固态硬盘都搭载内置的SMART系统。
作为行业规范,SMART规定了硬盘制造厂商应遵循的标准,满足SMART标准的条件主要包括:1)在设备制造期间完成SMART需要的各项参数、属性的设定;2)在特定系统平台下,能够正常使用SMART;通过BIOS检测,能够识别设备是否支持SMART并可显示相关信息,而且能辨别有效和失效的SMART信息;3)允许用户自由开启和关闭SMART功能;4)在用户使用过程中,能提供SMART的各项有效信息,确定设备的工作状态,并能发出相应的修正指令或警告。
在硬盘及操作系统都支持SMART技术并且开启的情况下,若硬盘状态不良,SMART功能会在开机时响起警报,SMART技术能够在屏幕上显示英文警告信息:“WARNING IMMEDIATLY BACKUP YOUR DATA AND REPLACE YOUR HARD DISK DRIVE,A FAILURE MAY BE IMMINENT.”(警告:立刻备份你的数据并更换硬盘,硬盘可能失效。
)SMART功能不断从硬盘上的各个传感器收集信息,并把信息保存在硬盘的系统保留区(service area)内,这个区域一般位于硬盘0物理面的最前面几十个物理磁道,由厂商写入相关的内部管理程序。
这里除了SMART信息表外还包括低级格式化程序、加密解密程序、自监控程序、自动修复程序等。
用户使用的监测软件通过名为“SMART Return Status”的命令(命令代码为:B0h)对SMART信息进行读取,且不允许最终用户对信息进行修改。
smartmontools是smart的的软件包程序,由smartctl和smartd两部分工具程序组成,它们一起为Linux平台提供对磁盘退化和故障的高级警告。
二、smart信息解读ID属性ID,通常是一个1到255之间的十进制或十六进制的数字。
硬盘SMART 检测的ID代码以两位十六进制数表示(括号里对应的是十进制数)硬盘的各项检测参数。
目前,各硬盘制造商的绝大部分SMART ID代码所代表的参数含义是一致的,但厂商也可以根据需要使用不同的ID代码,或者根据检测项目的多少增减ID代码。
一般来说,以下这些检测项是必需的:01(001) Raw_Read_Error_Rate 底层数据读取错误率04(004) Start_Stop_Count 启动/停止计数05(005) Reallocated_Sector_Ct 重映射扇区数09(009) Power_On_Hours 通电时间累计,出厂后通电的总时间,一般磁盘寿命三万小时0A(010) Spin_Retry_Count 主轴起旋重试次数(即硬盘主轴电机启动重试次数)0B(011) Calibration_Retry_Count 磁盘校准重试次数0C(012) Power_Cycle_Count 磁盘通电次数C2(194) Temperature_Celsius 温度C7(199) UDMA_CRC_Error_Count 奇偶校验错误率C8(200) Write_Error_Rate: 写错误率F1(241) Total_LBAs_Written:表示磁盘自出厂总共写入的的数据,单位是LBAS=512Byte F2(242) Total_LBAs_Read:表示磁盘自出厂总共读取的数据,单位是LBAS=512ByteATTRIBUTE_NAME硬盘制造商定义的属性名。
,即某一检测项目的名称,是ID代码的文字解释。
FLAG属性操作标志(可以忽略)当前值(value)当前值是各ID项在硬盘运行时根据实测原始数据(Raw value)通过公式计算的结果,1到253之间。
253意味着最好情况,1意味着最坏情况。
计算公式由硬盘厂家自定。
硬盘出厂时各ID项目都有一个预设的最大正常值,也即出厂值,这个预设的依据及计算方法为硬盘厂家保密,不同型号的硬盘都不同,最大正常值通常为100或200或253,新硬盘刚开始使用时显示的当前值可以认为是预设的最大正常值(有些ID项如温度等除外)。
随着使用损耗或出现错误,当前值会根据实测数据而不断刷新并逐渐减小。
因此,当前值接近临界值就意味着硬盘寿命的减少,发生故障的可能性增大,所以当前值也是判定硬盘健康状态或推测寿命的依据之一。
最差值(Worst)最差值是硬盘运行时各ID项曾出现过的最小的value。
最差值是对硬盘运行中某项数据变劣的峰值统计,该数值也会不断刷新。
通常,最差值与当前值是相等的,如果最差值出现较大的波动(小于当前值),表明硬盘曾出现错误或曾经历过恶劣的工作环境(如温度)。
临界值(Threshold)在报告硬盘FAILED状态前,WORST可以允许的最小值。
临界值是硬盘厂商指定的表示某一项目可靠性的门限值,也称阈值,它通过特定公式计算而得。
如果某个参数的当前值接近了临界值,就意味着硬盘将变得不可靠,可能导致数据丢失或者硬盘故障。
由于临界值是硬盘厂商根据自己产品特性而确定的,因此用厂商提供的专用检测软件往往会跟Windows下检测软件的检测结果有较大出入。
硬盘的每项SMART信息中都有一个临界值(阈值),不同硬盘的临界值是不同的,SMART针对各项的当前值、最差值和临界值的比较结果以及数据值进行分析后,提供硬盘当前的评估状态,也是我们直观判断硬盘健康状态的重要信息。
根据SMART的规定,状态一般有正常、警告、故障或错误三种状态。
SMART判定这三个状态与SMART的Pre-failure/advisory BIT(预测错误/发现位)参数的赋值密切相关,当Pre-failure/advisory BIT=0,并且当前值、最差值远大于临界值的情况下,为正常标志。
当Pre-failure/advisory BIT=0,并且当前值、最差值大于但接近临界值时,为警告标志;当Pre-failure/advisory BIT=1,并且当前值、最差值小于临界值时,为故障或错误标志原始值(RAW_VALUE)制造商定义的原始值,从VALUE派生。
数据值是硬盘运行时各项参数的实测值,大部分SMART工具以十进制显示数据。
数据值代表的意义随参数而定,大致可以分为三类:1)数据值并不直接反映硬盘状态,必须经过硬盘内置的计算公式换算成当前值才能得出结果;2)数据值是直接累计的,如Start/Stop Count(启动/停止计数)的数据是50,即表示该硬盘从出厂到现在累计启停了50次;3)有些参数的数据是即时数,如Temperature(温度)的数据值是44,表示硬盘的当前温度是44℃。
因此,有些参数直接查看数据也能大致了解硬盘目前的工作状态。
TYPE属性的类型(Pre-fail或Oldage)。
Pre-fail类型的属性可被看成一个关键属性,表示参与磁盘的整体SMART健康评估(PASSED/FAILED)。
如果任何Pre-fail类型的属性故障,那么可视为磁盘将要发生故障。
另一方面,Oldage类型的属性可被看成一个非关键的属性(如正常的磁盘磨损),表示不会使磁盘本身发生故障。
UPDATED表示属性的更新频率。
Offline代表磁盘上执行离线测试的时间。
WHEN_FAILED如果VALUE小于等于THRESH,会被设置成“FAILING_NOW”;如果WORST 小于等于THRESH会被设置成“In_the_past”;如果都不是,会被设置成“-”。
在“FAILING_NOW”情况下,需要尽快备份重要文件,特别是属性是Pre-fail类型时。
“In_the_past”代表属性已经故障了,但在运行测试的时候没问题。
“-”代表这个属性从没故障过。
一般情况下,用户只要观察当前值、最差值和临界值的关系,并注意状态提示信息即可大致了解硬盘的健康状况。
下面简单介绍各参数的含义,以红色标出的项目是寿命关键项,蓝色为固态硬盘(SSD)特有的项目。
在基于闪存的固态硬盘中,存储单元分为两类:SLC(Single Layer Cell,单层单元)和MLC(Multi-Level Cell,多层单元)。
SLC成本高、容量小、但读写速度快,可靠性高,擦写次数可高达100000次,比MLC高10倍。
而MLC虽容量大、成本低,但其性能大幅落后于SLC。
为了保证MLC的寿命,控制芯片还要有智能磨损平衡技术算法,使每个存储单元的写入次数可以平均分摊,以达到100万小时的平均无故障时间。