高亮颜色说明:突出重点
个人觉得,:待核准个人观点是否有误
高亮颜色超链接
文章目录
- S.M.A.R.T.监控技术
- 磁盘健康状态监测,硬盘检测
- 硬盘检测工具 HD Tune
- 硬盘检测工具 CrystalDiskInfo
- 当前值最差值阈值原始值的含义
- 二级标题
- 待补充
- 待补充
开头提醒, 想不丢数据最重要的事情是备份。其次是保持良好的使用习惯,包括安全删除、将硬盘连接到供电稳定充足的USB接口(如台式机后置接口,不要插分线器)、存放硬盘时把数据线从硬盘接口上拔出来(防止接口受损接触不良)、使用硬盘时不要碰硬盘防止接触不良断电、机械盘轻拿轻放且不用时及时拔出等。
S.M.A.R.T.监控技术
- 9636:S.M.A.R.T. Monitoring 20100528
S.M.A.R.T.(Self-Monitoring, Analysis, and Reporting Technology)是一种大多数现代硬盘都支持的监控技术。利用该技术,可以对磁盘的各种内部和外部问题(如大量坏块、错误或启动/停止循环次数增加、气流温度上升等)进行监测,并及时向用户报告。S.M.A.R.T.可以报告一些可能会导致即将发生的硬盘故障和数据丢失的机电问题。其他参数指示磁盘将来可能出现的问题,不需要立即采取行动。
统计上,S.M.A.R.T.可以预测一半以上的硬盘故障,这使得这项技术成为关于当前硬盘状态的可靠信息来源。但无论如何,这种监视并不能取代为数据保持最新备份的必要性。备份存档将保护您免受多种情况下的关键数据丢失,例如硬盘逻辑损坏、物理损坏、破坏甚至硬件丢失等,这些是任何一种监控都无法预测的。
S.M.A.R.T.参数描述硬盘状态的具体方面——表面损坏、读/写错误、机电部件问题等。当某个关键参数的值变小时,硬盘故障的概率会增加30倍。这意味着在不久的将来可能会发生崩溃,您需要紧急更换硬件以避免重要数据丢失。
每个硬件制造商都支持自己的一组S.M.A.R.T.参数,这些参数也可能因磁盘型号而异。所有S.M.A.R.T.参数都有多个值,其中最重要的是:
- 原始值具有供应商指定的格式。硬盘监测工具使用一些参数的原始值来计算磁盘健康状况。
- 归一化值由制造商转换,取值范围为1 ~ 253。该值在磁盘的生命周期内逐渐减小。当归一化值低于阈值(如果指定)时,通常被认为是潜在的危险情况(警告);
- 阈值是由制造商设置的S.M.A.R.T.参数的最低可接受值。对于某些参数,可能不需要设置此值。当该参数低于“阈值”时,说明该硬盘处于危险状态,需要更换,需要紧急关注需要保护的数据。这是超出阈值条件的情况,因此这样的磁盘可以在保修期内退回给制造商。
在本页面(9636:S.M.A.R.T. Monitoring 20100528 )搜索框搜索"S.M.A.R.T."可以获知更多 S.M.A.R.T. Attributes 的含义。
磁盘健康状态监测,硬盘检测
- How to Check Your Hard Drive or SSD’s Health With S.M.A.R.T. 20230224
- 【科普】看懂HDTune和CrystalDiskInfo参数 - DIY硬件 - 萝卜头IT论坛 - Powered by Discuz! 20240131
硬盘检测工具 HD Tune
- HD Tune怎么用:如何分析磁盘健康状态参数? 20170928
- HD_Tune使用教程 - 百度文库 20120427
- 新盘,通电时间记数两千万,磁头飞行时间八千万?什么鬼_图拉丁吧_百度贴吧 20190125
硬盘检测工具 CrystalDiskInfo
- CrystalDiskInfo中文版-硬盘健康状况检测工具(CrystalDiskInfo)下载v8.15.0 多语中文便携版-西西软件下载 20220205
- 这几款硬盘检测工具,为您的数据保驾护航 - 望北川的文章 - 知乎 20210726
- 二手硬盘查看通电时间与使用次数的方法,是否可以清零? 20190415
当前值最差值阈值原始值的含义
20240529记:
HDTune 和 CrystalDiskInfo 硬盘检测硬盘监测工具;S.M.A.R.T.参数的Current(当前值)、Worst(最差值)、Threshold(阈值/临界值)、原始值(Raw Values)是什么意思?
20240529必应国际版检索"Hard Disk, S.M.A.R.T., parameter, Current, Worst",
- SMART Parameters and Early Signs of a Failing Hard Disk - iFixit
每个SMART属性都有如下几列:
- ID:属性的ID号,用于与其他列表进行比较,因为属性名称有时不同。
- Name: SMART属性的名称。
- Value:该属性的当前的规格化值。数值越高越好(某些制造商的硬盘温度除外)。范围通常为0-100,对于某些属性为0-255(故100或255最好,0最差)。制造商如何将其原始值转换为规格化值并没有标准:可以采用线性、指数、对数或任何其他方式,因此加倍的规格化值并不一定意味着硬盘健康状况也是两倍的好。
- Worst:该属性在启用SMART的任何时间点上的最差(规格化)值。一些SMART属性的数值会随着时间的推移而波动,因此保留最差的一个是有意义的。
- Threshold:低于该阈值将被视为"exceeding specifications"。如果属性类型为"Pre-fail",则表示SMART认为硬盘处于故障前。这将"触发"SMART:将其从"SMART测试通过(SMART test passed)"设置为"SMART即将故障(SMART impending failure)"或类似状态。
- Type:属性的类型。对于指示即将发生故障的属性,可以使用"Pre-fail";对于仅指示损耗的属性,可以使用"Old_age"。请注意,同一个属性可以被一个制造商或一个型号归类为"Pre-fail",而被另一个制造商或另一个型号归类为"Old_age"。例如属性Seek_Error_Rate (ID 7)就是这种情况,这是许多磁盘上普遍存在的现象,一些制造商并不认为这很重要,但希捷将其作为"Pre-fail"。
- Raw value:转换为上述规格化值的当前原始值。smartctl显示所有的十进制值,但一些制造商的一些属性值可能会以别的进制显示。
- 有关各个属性的更详细含义,请参见 Wikipedia: S.M.A.R.T.: Known ATA S.M.A.R.T. attributes。此外,根据制造商、系列和型号的不同,SMART属性解释有许多特殊性,因此,如果您遇到奇怪的情况,请搜索其他人在论坛上发布的相同或类似磁盘的SMART属性值。人们甚至说,这需要大量的"直觉"来解释…
用CrystalDiskInfo查看硬盘健康状态----2023.7.14 - 无名计算机二级的文章 - 知乎 20230714
20240529 木鱼木夕:
感谢楼主给出的许多配图[微笑],对比着看,再去查阅资料后算是弄明白了某些属性参数的含义[耶]
“临界值/阈值是由硬盘制造商设置的S.M.A.R.T.参数的最低可接受值”,因此这个数值只是一个参考基准。某些硬盘检测工具对于不同硬盘有可能给出的是同一个临界值/阈值有可能都是一样的,这么做其实是不合理的;此外,大多数具有零阈值的属性都不是关键的。“Current(当前值)和Worst(最差值)的数字越小则越不好,Current(当前值)的数字小到接近于临界值则意味着硬盘即将报废”。
因此,文中"从上面图看出“02、吞吐性能”已经减半。“A9坏块数”已经有10%了,坏块数到后面是飞快增长的。"这里的解说是有误的,就图中数字而言,02吞吐性能和A9坏块数没问题的(除非卖硬盘的篡改重置了参数值)。"这张图明显不可信"这里的解说可能也有误,个人感觉这张图应该是个新硬盘,通电时间可能非常短以至于取整显示的为0。"通电小时数"和"擦除计数"的原始值特别大,"擦除计数"的当前值和最差值特别小,则意味着硬盘已经使用特别久了。
- hard drive - What do the current, worst, and threshold SMART values mean? - Super User 20160922
Sep 22, 2016 at 11:34 Celarix:
对于某个2TB希捷硬盘(ST2000DM001-1CH164),希捷(Seagate)的SeaTools实用程序报告说S.M.A.R.T.z状况正常,且没有报告任何问题。而CrystalDiskInfo 7.0.3 x64工具对该硬盘的监测结果如下:
现象:
不可纠正的扇区计数(Uncorrectable Sector Count)属性的当前值为100,最差值也为100,而阈值则为0,该属性被标记了"警告(Caution)“。而有些其它属性的当前值和最差值也都为100,但却没有被标记为"警告(Caution)”。
疑问:
我不确定the Current(当前值), Worst(最差值), and Threshold(阈值/临界值)字段是什么含义。我知道它们的实际数值因制造商而异,而且我还看到说,如果当前值低于阈值,则意味着硬盘的该属性有故障。
为什么不可纠正的扇区计数(Uncorrectable Sector Count)被标记为"警告(Caution)",而具有相同当前值和阈值的其他属性却没有?当阈值为零时,低于阈值的值怎么可能出现呢?这是硬盘即将故障的信号,还是仅仅是硬盘监测工具的监测统计错误?
【回答一】
Sep 22, 2016 at 13:04 qasdfdsaq:
根据谷歌的大量统计数据,不可纠正的扇区计数(Uncorrectable Sector Count)属性的原始值(Raw Values)>0的任何驱动器更有可能在短期内出故障,但这并不能保证它很快就会出故障或永远故障。无论如何,您都应该确保有硬盘文件的最新备份。
【回答二】
Sep 22, 2016 at 11:53 DavidPostill:
在本例中,您需要关注不可纠正的扇区计数(Uncorrectable Sector Count)属性的原始值(Raw Values),数值为000000000008意味着一共发生过8次事件。在这种特殊情况下,我会密切关注该数值,如果它继续增加,则需要更换硬盘。不可纠正的扇区计数(Uncorrectable Sector Count)属性的是一个关键参数,其原始值表示读/写扇区时不可纠正错误的总数。此参数的退化可能表明即将发生驱动器故障,建议紧急备份数据和更换硬件。
9134:S.M.A.R.T. Attribute: Uncorrectable Sector Count 20100331
【回答三】
Oct 27, 2020 at 21:33 Foogod:
先阐明一下(因为这是谷歌上关于这个问题的最热门的回答之一,但实际上并没有很好地回答这个问题,恕我直言):S.M.A.R.T.报告的Current(当前值)、Worst(最差值)、Threshold(阈值/临界值)是规格化的定性值,即它们不表示某个指标属性的实际数字等。相反,它们的目的是表明指标属性的值在一个尺度上"有多好"或"有多坏"。
对于Current(当前值)和Worst(最差值),数字越高总是越好,它们通常被规格化到一些常见的尺度(比如0-100)。不幸的是,S.M.A.R.T.的一个问题是,许多这些细节都没有在标准中规定,所以特定制造商使用什么尺度来表示这些值完全取决于该制造商。通常,大多数制造商似乎使用100作为尺度上界(此时数字相当于是"百分比"),但在某些情况下,也有看到取200甚至253等数字作为尺度上界的。
因此,当制造商选择的规格化尺度是0-100时,如果一个指标报告的当前值为100(100%健康),这意味着驱动器告诉您"非常好,这里没有什么可担心的"。如果它报告的数字比这个小,那么它告诉你可能有一些值得关注的原因。你需要注意的是这些数字与阈值的距离有多近。如果当前值低于阈值,那么这就是制造商认为驱动器在某种程度上是"有故障的"(并且可以退回保修退货等)。
但所报告的数字没有降到阈值以下,并不一定意味着一切都很好。驱动器尚未发生故障,但在不久的将来仍可能会有故障。通常情况下,低于100的数值(特别是某些指示未来可能有故障的属性指标,如不可纠正的扇区计数(Uncorrectable Sector Count))能够指示你可能需要关注某些内容。
然而,这些数字的另一个问题是,没有办法确切地说驱动器固件在特定情况下的健康状况是怎样的。在给出的不可纠正的扇区计数(Uncorrectable Sector Count)的例子中,驱动器实际上报告了100的当前值和最坏值(“一切都很好!”),但如果我们查看原始值,它表明实际上遇到了8个不可纠正的扇区。8个扇区是个问题吗?驱动器似乎不这么认为,但它没有告诉我们原因。你认为8个扇区是个问题吗?嗯,我个人认为任何超过零的指标都是令人担忧的,所以……
这就是为什么大多数人会说"只需看原始值(Raw Values)字段",但这也有两个问题:首先,对于驱动器应该为某个指标值返回什么,绝对没有标准,因此您只能猜测它在那里报告什么。通常,对于大多数涉及事物计数的指标,原始值将是实际的原始计数(请记住,原始值通常以十六进制显示),所以这里很可能报告了在这种情况下遇到的总计8个不可纠正的扇区(这就是为什么CrystalDiskInfo将其标记为"警告(Caution)")。原始值的另一个问题是,驱动器通常有更多关于它可以拿去考虑的状况信息,而不仅仅是一个值(例如,确切地说,每个不可纠正的扇区是什么时候遇到的,最近是否有增加的数量,等等),只是没有报告给我们。这可能是硬盘似乎不关心8个坏扇区的部分原因(也许它们都是很久以前发生的,从那以后就没见过了?)但是谁知道呢……
但总的来说,对于很多这样的东西,你只能做出有根据的猜测。原始值字段中的8很可能意味着遇到了8个未纠正的扇区(在驱动器的生命周期中)。当前值和最差值显示的是100,表示驱动器固件实际上不关心这个问题,也不认为这是一个问题(“100% fine”)。这只是一个暗示,可能你自己的评价会有所不同。
【回答四】
Sep 22, 2016 at 11:49 Martin Sugioarto:
关于您的第一个问题,这三个字段一起告诉您属性的状态。
字段"Current"表示当前值。通常情况下,当一切正常时,它是100。较高的值通常意味着该属性数值很少被更新过。
字段"Worst"告诉您S.M.A.R.T.曾经为该属性分配过的最差值。如果驱动器碰到了"比以往任何时候都糟糕"的时刻(对应的会有一个数值),那么这时该数字就会被更新为那个数值。最差值有时会大于当前值,这意味驱动器碰到过糟糕但不是比以往更糟糕的时刻,那时当前值会被更新而最差值不作更新。
字段"Threshold"表示阈值/临界值。当属性指标的当前值低于阈值时,S.M.A.R.T.认为硬盘存在故障。大多数具有零阈值的属性都不是关键的,当它们减少时,这只意味着你的驱动器老化了。而阈值大于零的其他属性通常是关键的。
关于你的第二个问题,不可纠正的扇区计数(Uncorrectable Sector Count)是一个重要的属性,它通常指示是否即将发生全面故障。仔细观察这个属性,如果增量过快,最好寻找替换驱动器。从我所看到的来看,S.M.A.R.T.并不总是被诚实地执行。有8个不正确的扇区却仍报告100%健康就是这种情况。如果您想保存/检查驱动器,请尝试进行表面扫描,但在高I/O负载下进行此类操作之前,请进行备份。
Sep 22, 2016 at 11:55 Martin Sugioarto:
字段"Raw Values"是用于计算运行状况的未解释值,其数值通常是特定于供应商的。例如,一些供应商以摄氏度存储温度,而另一些则不是。他们还计算扇区/错误/次数,如果不看当前值,你无法真正判断硬盘状况有多糟糕。
Jun 9, 2020 at 11:59 Chameleon reply to Martin Sugioarto:
我不明白。因为到目前为止发生了8起事件,所以RAW值是当前值,这么理解正确吗?阈值是一个界限,当RAW值<阈值时,产生警告?所以,问题仍然存在:如果RAW是当前值,那么当前值是多少,最坏值是多少?当RAW值为8时,当前值怎么可能是100?Current和RAW不一样吗?请多写点。
Jun 9, 2020 at 12:13 Martin Sugioarto reply to Chameleon:
在本例中,8是受影响的扇区数量。不可纠正的意思是,它们不能被驱动器的逻辑所纠正。但是有些属性是可以修复的,它们会归零。原始值和当前值是相同的。当前值由硬盘监测工具UI所解释,原始值是属性真正包含的内容。有时属性数值会被转换显示(通常温度显示为状况好坏或实际温度)。供应商如何存储原始值并没有真正的统一标准。
二级标题
待补充
待补充