Технология S. жестких дисков и анализ ее показателей. Что такое S.M.A.R.T. жестких дисков

Доброго времени суток!

Сколько бы всего можно было исправить, если бы знать заранее, что нас поджидает...

И если в жизни предугадать некоторые события практически нереально, то вот в случае с жестким диском - часть проблем всё же, предугадать и предвидеть можно!

Для этого существуют специальные утилиты, которые могут узнать и проанализировать показания SMART* диска (показать их вам, если необходимо), и на основе этих данных оценить состояние здоровья вашего диска, попутно рассчитав сколько лет он еще сможет прослужить.

Информация крайне полезная, к тому же подобные утилиты могут вести мониторинг вашего диска в режиме онлайн, и как только появятся первые признаки нестабильной работы - тут же вас оповестить. Соответственно, вы вовремя успеете сделать бэкап и принять меры (хотя бэкап нужно делать всегда, даже когда все хорошо ☺).

И так, рассмотрю в статье несколько способов (и несколько утилит) анализа состояния HDD и SSD.

* Примечание:
S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology) - специальная технология оценки состояния жёсткого диска системой интегрированной аппаратной самодиагностики/самонаблюдения. Основная задача - определить вероятность выхода устройства из строя, предотвратив потерю данных.

Пожалуй, это один из самых популярных вопросов, которые задают все пользователи, впервые столкнувшиеся с проблемами с жестким диском (либо задумавшиеся о безопасности хранения своих данных). Всех интересует время, которое проработает диск до полной "остановки". Попробуем предсказать...

Поэтому, в первой части статьи я решил показать пару утилит, которые могут получить все показания с диска и проанализировать их самостоятельно, а вам дать лишь готовый результат (во второй части статьи, приведу утилиты для просмотра показаний SMART для самостоятельного анализа).

Способ №1 - с помощью Hard Disk Sentinel

Одна из лучших утилит для мониторинга состояния дисков компьютера (как жестких дисков (HDD), так и "новомодных" SSD). Что больше всего подкупает в программе - она все данные, полученные о состоянии диска самостоятельно проанализирует и покажет Вам уже готовый результат (очень удобно для начинающих пользователей).

Чтобы не быть голословным, покажу сразу же главное окно программы, которое появляется после первого запуска (анализ диска будет сделан сразу автоматически). Здоровье и производительность диска оцениваются как 100% (в идеале, так и должно быть), время, которое диск еще проработает в нормальном режиме оценивается программой примерно в 1000 дней (~3 лет).

Что с диском по версии Hard Disk Sentinel

Кроме этого, программа позволяет следить за температурой: как за текущей, так и за средней и максимальной в течении дня, недели, месяца. В случае выхода температуры за пределы "нормальности" - программа предупредит Вас об этом (что тоже очень удобно).

Также Hard Disk Sentinel позволяет просмотреть показания SMART (правда, чтобы оценить их, нужно неплохо разбираться в дисках), получить полную информацию о жестком диске (модель, серийной номер, производитель и пр.), посмотреть, чем жесткий диск загружен (т.е. получить сведения о производительности).

В общем и целом, на мой скромный взгляд, Hard Disk Sentinel - это одна из лучших утилит за контролем состояния дисков в системе. Стоит добавить, что есть несколько версий программ: профессиональная и стандартная (для профессиональной версии с расширенным функционалом - есть портативная версия программы, не нуждающаяся в установке (например, ее можно даже запускать с флешке)).

Hard Disk Sentinel работает во всех популярных Windows (7, 8, 10 - 32|64 bits), поддерживает русский язык в полном объеме.

Способ №2 - с помощью HDDlife

Эта программа аналогична первой, также наглядно показывает текущее состояние диска: его здоровье и производительность (в процентном выражении), его температуру, количество отработанного времени (в месяцах). В верхней части окна, на основе всех этих данных, HDDlife показывает итоговое резюме по вашему диску, например, в моем случае "ALL RIGHT" (что значит, что с диском все в порядке).

Кстати, программа может работать в режиме онлайн, следя за состоянием вашего диска, и в случае, если что-то пойдет не так (при появлении первых признаков проблем) - сразу же известить вас об этом.

В качестве примера ниже на скриншоте показан SSD-диск получил предупреждение: его состояние еще в допустимых пределах, но надежность и производительность ниже среднего значения. В этом случае доверять диску какие-либо важные данные не стоит, и по возможности, нужно готовиться к его замене.

Кстати, в главном окне программы, рядом с количеством отработанного времени диска, есть ссылка "Настойка диска" (позволяет изменить некоторые нужные параметры). Открыв ее, можно управлять балансом между шумом/производительностью) очень полезно с дисками, которые сильно шумят), и настроить параметры энергопотребления (актуально для ноутбуков, у которых быстро садится батарея).

Дополнение : HDDlife работает как на ПК, так и на ноутбуках. Поддерживает HDD и SSD диски. Есть в наличие портативные версии программы, не нуждающиеся в установке. Можно настроить так, чтобы программа запускалась вместе с вашей Windows. HDDlife работает в Windows: XP, 7, 8, 10 (32|64 bits).

Как посмотреть показания SMART

Если предыдущие утилиты самостоятельно оценивали состояние диска, на основе данных SMART, то нижеприведенные утилиты предоставят вам больше свободы и данных для самостоятельного анализа. В отчетах можно будет найти достаточно большой набор параметров, на основе которых - можно будет примерно оценить состояние диска и сделать прогноз по его дальнейшей работе.

Способ №1 - с помощью СrystalDiskInfo

СrystalDiskInfo

Отличная бесплатная утилита для просмотра состояния и показаний SMART жесткого диска (поддерживаются в том числе и SSD-диски). Чем подкупает утилита - она предоставляет вам полную информацию о температуре, техническому состоянию диска, его характеристиках и пр., причем, часть данных идут с пометками (т.е. утилита актуальна, как для опытных пользователей, которые сами знают "что-есть-что", так и для начинающих, которым нужна подсказка).

Например, если с температурой что-то не так - то вы увидите на ней красный индикатор, т.е. СrystalDiskInfo сам вам об этом сообщит.

Главное окно программы условно можно разбить на 4 зоны (см. скриншот выше):

  1. "1" - здесь указаны все ваши физические диски, установленные в компьютере (ноутбуке). Рядом с каждым показана его температура, техсостояние, и кол-во разделов на нем (например, "C: D: E: F:");
  2. "2" - здесь показана текущая температура диска и его техсостояние (программа делает анализ на основе всех полученных данных с диска);
  3. "3" - данные о диске: серийный номер, производитель, интерфейс, скорость вращения и пр.;
  4. "4" - показания SMART. Кстати, чем подкупает программа - вам необязательно знать, что означает тот или иной параметр - если что-то не так с каким-либо пунктом, программа его пометит желтым или красным цветом и известит вас об этом.

В качестве примера к вышесказанному, приведу скриншот, на котором отображены два диска: слева - с которым все нормально, справа - у которого есть проблемы с переназначенными секторами (техсостояние - тревога!).

В качестве справки (о переназначенных секторах):

когда жесткий диск обнаруживает, например, ошибку записи, он переносит данные в специально отведённую резервную область (а сектор этот будет считаться «переназначенным»). Поэтому на современных жёстких дисках нельзя увидеть bad-блоки - они спрятаны в переназначенных секторах. Этот процесс называют remapping , а переназначенный сектор - remap .

Чем больше значение переназначенных секторов - тем хуже состояние поверхности дисков. Поле "raw value" содержит общее количество переназначенных секторов.

Кстати, для многих производителей дисков, даже один переназначенный сектор - это уже гарантийный случай!

Чтобы утилита CrystalDiskInfo следила в режиме онлайн за состоянием вашего жесткого диска - в меню "Сервис" поставьте две галочки: " Запуск агента" и "Автозапуск" (см. скрин ниже).

Затем вы увидите значок программы с температурой рядом с часами в трее. В общем-то, за состояние диска теперь можно быть более спокойным ☺...

Способ №2 - с помощью Victoria

Victoria - одна из самых знаменитых программ для работы с жесткими дисками. Основное предназначение программы оценить техническое состояние накопителя, и заменить поврежденные сектора на резервные рабочие.

Утилита бесплатна и позволяет работать как из-под Windows, так и из-под DOS (что во многих случаях показывает гораздо более точные данные о состоянии диска).

Из минусов: работать с Викторией достаточно сложно, по крайней мере, наугад нажимать в ней кнопки я крайне не рекомендую (можно легко уничтожить все данные на диске). У меня на блоге есть одна достаточно большая статья, где подробно разобрано, как проверить диск с помощью Виктории (в том числе, узнать показания SMART - пример на скриншоте ниже (на котором Виктория указала на возможную проблему с температурой)).

Инструкция по работе с Викторией:

Вкладка SMART || утилита Виктория

На сим закругляюсь, всем удачи!

Дополнения по теме приветствуются ☺

Или просто хочется узнать, в каком он состоянии - это можно сделать с помощью различных программ для проверки HDD и SSD.

В этой статье - описание самых популярных бесплатных программ для проверки жесткого диска, кратко об их возможностях и дополнительная информация, которая будет полезной, если вы решили проверить жесткий диск. Если вы не хотите устанавливать подобные программы, то для начала можете использовать инструкцию - возможно, уже этот способ поможет решить некоторые проблемы с ошибками HDD и поврежденными секторами.

Несмотря на то, что когда речь заходит про проверку HDD, чаще всего вспоминают бесплатную программу Victoria HDD, начну я все-таки не с нее (про Victoria - в конце инструкции, сначала о более подходящих для начинающих пользователей вариантах).

Проверка жесткого диска или SSD в бесплатной программе HDDScan

HDDScan - отличная и полностью бесплатная программа для проверки жестких дисков. С помощью нее можно проверить сектора HDD, получить информацию S.M.A.R.T., и выполнить различные тесты жесткого диска.

HDDScan не исправляет ошибки и бэд-блоки, а лишь позволяет узнать о том, что с диском есть проблемы. Это может быть минусом, но, иногда, в случае когда речь идет о начинающем пользователе - положительный момент (сложно что-то испортить).

Программой поддерживаются не только IDE, SATA и SCSI диски, но и USB флешки, внешние жесткие диска, RAID, SSD.


Подробно о программе, ее использовании и о том, где скачать: .

Seagate SeaTools

Бесплатная программа Seagate SeaTools (единственная из представленных на русском языке) позволяет проверить на ошибки жесткие диски различных марок (не только Seagate) и, при необходимости, исправить неисправные сектора (работает и с внешними жесткими дисками). Скачать программу можно с официального сайта разработчика https://www.seagate.com/ru/ru/support/downloads/seatools/ , где она доступна в нескольких вариантах.


  • SeaTools for Windows - утилита для проверки жесткого диска в интерфейсе Windows.
  • Seagate for DOS - iso образ, из которого можно сделать загрузочную флешку или диск и, загрузившись с него, выполнить проверку жесткого диска и исправить ошибки.

Использование DOS версии позволяет избежать различных проблем, которые могут возникнуть при проверке в Windows (так как сама операционная система также постоянно обращается к жесткому диску, а это может влиять на проверку).

После запуска SeaTools вы увидите список жестких дисков, установленных в системе и сможете выполнить необходимые тесты, получить информацию SMART, а также выполнить автоматическое восстановление поврежденных секторов. Все это вы найдете в пункте меню «Базовые тесты». Кроме этого, программа включает подробное руководство на русском языке, которое вы можете найти в разделе «Справка».

Программа для проверки жесткого диска Western Digital Data Lifeguard Diagnostic

Эта бесплатная утилита, в отличие от предыдущей, предназначена только для жестких дисков Western Digital. А у многих российских пользователей именно такие жесткие диски.

Также, как и предыдущая программа, Western Digital Data Lifeguard Diagnostic доступна в версии для Windows и как загрузочный ISO образ.


С помощью программы можно посмотреть информацию SMART, проверить сектора жесткого диска, перезаписать диск нулями (стереть все окончательно), посмотреть результаты проверки.

Скачать программу можно на сайте поддержки Western Digital: https://support.wdc.com/downloads.aspx?lang=ru

Как проверить жесткий диск встроенными средствами Windows

В Windows 10, 8, 7 и XP вы можете выполнить проверку жесткого диска, включая проверку поверхности и исправить ошибки не прибегая к использованию дополнительных программ, в самой системе предусмотрено несколько возможностей проверки диска на ошибки.

Проверка жесткого диска в Windows

Самый простой метод: откройте проводник или «Мой компьютер», кликните правой кнопкой мыши по жесткому диску, который требуется проверить, выберите «Свойства». Зайдите на вкладку «Сервис» и нажмите «Проверить». После этого останется лишь дождаться окончания проверки. Данный метод не слишком эффективный, но неплохо бы знать о его наличии. Дополнительные способы - .

Как проверить работоспособность жесткого диска в Victoria

Victoria - пожалуй, одна из самых популярных программ для целей диагностики жесткого диска. С помощью нее вы можете просмотреть информацию S.M.A.R.T. (в том числе для SSD) проверить HDD на ошибки и сбойные сектора, а также пометить бэд блоки как не работающие или попытаться восстановить их.

Программу можно скачать в двух вариантах - Victoria 4.66 beta для Windows (и другие версии для ОС Windows, но 4.66b - самая последняя, обновление этого года) и Victoria для DOS, в том числе ISO для создания загрузочного накопителя. Официальная страница для загрузки - http://hdd.by/victoria.html .


Инструкция по использованию Victoria займет не одну страницу, а потому не берусь ее писать сейчас. Скажу лишь, что главный элемент программы в версии для Windows - это вкладка Tests. Запустив тестирование, предварительно выбрав жесткий диск на первой вкладке, вы сможете получить наглядное представление о том, в каком состоянии находятся сектора жесткого диска. Отмечу, что зеленые и оранжевые прямоугольники с временем доступа 200-600 мс - это уже плохо и означает, что сектора выходят из строя (проверить таким образом можно только HDD, для SSD такого рода проверка не подходит).


Здесь же, на странице тестирования, вы можете поставить отметку «Remap», для того, чтобы во время теста сбойные сектора были помечены как неработающие.

И, наконец, что делать, если на жестком диске обнаружены поврежденные сектора или бэд блоки? Я считаю, что оптимальное решение - позаботиться о сохранности данных и в кратчайшие сроки заменить такой жесткий диск на работоспособный. Как правило, любое «исправление бэд-блоков» носит временный характер и деградация накопителя прогрессирует.

Дополнительная информация:

  • среди рекомендованных программ для проверки жесткого диска нередко можно встретить Drive Fitness Test for Windows (DFT). У нее есть некоторые ограничения (например, не работает с чипсетами Intel), но отзывы о работоспособности исключительно положительные. Возможно, пригодится.
  • Информация SMART не всегда корректно считывается для некоторых марок накопителей сторонними программами. Если вы увидели «красные» пункты в отчете, это не всегда говорит о проблема. Попробуйте использовать фирменную программу от производителя.

Маленький рассказ об S.M.A.R.T. атрибутах, их важности и понимании. В статье пойдет речь об расшифровке всех smart атрибутов ATA дисков. В предыдущих статьях речь шла об и . Теперь хочу немного описать атрибуты обычных АТА дисков на примере Seagate Barracuda ES.2 (ST31000340NS). Так же определим самые важные атрибуты, на которые нужно обращать внимание при мониторинге дисков используя smartctl. Для начала, можно убедиться, что наш диск поддерживает смарт

Root@ s01:~# smartctl -i /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF INFORMATION SECTION === Model Family: Seagate Barracuda ES.2 Device Model: ST31000340NS Serial Number: 9QJ2ADVC … ATA Version is: 8 ATA Standard is: ATA-8-ACS revision 4 Local Time is: Fri Feb 21 16:18:35 2014 CET … SMART support is: Available - device has SMART capability. SMART support is: Enabled

Две последние строки свидетельствуют о том, что диск поддерживает smart и можно посмотреть значение всех его атрибутов и их интерпретация будет корректной(интерпретация RAW_VALUE) . В данном случаи тип интерфейса (устройства) не указывался явно (не было указанно атрибут «-d»), по этому smartctl автоматически определил тип устройства и сказал, что «SMART support is: Enabled». Но если используются, к примеру массивы дисков (RAID контроллер), то smartctl может сказать, что смарт не поддерживается:

Root@s06:~# smartctl -i /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net Vendor: SMC Product: SMC2108 Revision: 2.90 User Capacity: 2,996,997,980,160 bytes Logical block size: 512 bytes Logical Unit id: 0xSerial number: Device type: disk Local Time is: Fri Feb 21 17:32:27 2014 IST Device does not support SMART

Но на самом деле, нужно просто знать (или подбирать) какие дисковые массивы используются, и тогда можно получить желаемый результат явно указав тип устройства:

Root@s06:~# smartctl -d megaraid,14 -i /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net Vendor: SEAGATE Product: ST1000NM0001 Revision: 0002 User Capacity: 1,000,204,886,016 bytes Logical block size: 512 bytes Logical Unit id: 0x5000c50041080343 Serial number: Z1N0TV980000C2157TYR Device type: disk Transport protocol: SAS Local Time is: Fri Feb 21 17:34:45 2014 IST Device supports SMART and is Enabled Temperature Warning Enabled

Также может быть проблема в версии smartctl ибо не все жесткие диски добавляются в базу SMART сразу после выхода в мир нового HDD или RAID контроллера. Или же в BIOS отключено поддержку (нужно включить). Так же может быть проблема в прошивке (firmware) самого жесткого диска. Можете также стоит для начала попытаться включить SMART командой:

Root@s01:~# smartctl -s on /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF ENABLE/DISABLE COMMANDS SECTION === SMART Enabled.

Следующая, интересующая нас часть вывода покажет суммарный результат проверки статуса здоровья диска (Если не Passed – нужно проводить замену диска). Так же выводится дополнительные характеристики диска и предполагаемое время выполнения коротких и длинных тестов.

Root@s01:~# smartctl -Hc /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x82) Offline data collection activity was completed without error. Auto Offline Data Collection: Enabled. Self-test execution status: (41) The self-test routine was interrupted by the host with a hard or soft reset. Total time to complete Offline data collection: (634) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: (1) minutes. Extended self-test routine recommended polling time: (226) minutes. Conveyance self-test routine recommended polling time: (2) minutes. SCT capabilities: (0x003d) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported. SCT Data Table supported.

В нашем случаи тип устройства определился автоматически и теперь можно вывести самое интересное — список атрибутов.

Root@s01:~# smartctl -A /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 068 059 044 Pre-fail Always - 130449727 3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 23 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 4 7 Seek_Error_Rate 0x000f 063 039 030 Pre-fail Always - 549998464474 9 Power_On_Hours 0x0032 052 052 000 Old_age Always - 42335 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 037 020 Old_age Always - 63 184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 188 Command_Timeout 0x0032 100 093 000 Old_age Always - 4295032870 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 076 049 045 Old_age Always - 24 (Min/Max 18/26) 194 Temperature_Celsius 0x0022 024 051 000 Old_age Always - 24 (0 17 0 0) 195 Hardware_ECC_Recovered 0x001a 041 021 000 Old_age Always - 130449727 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0

Используя SMART можно предугадать с довольно большой вероятностью проблемы связанные с:

  • Магнитными головками диска
  • Физическими повреждениями диска
  • Логическими ошибками
  • Механическими проблемами (проблемы привода, системы позиционирования)
  • Подачей питания (платы)
  • Температурой

Расшифруем полученный вывод.


Каждый атрибут имеет группу значений:

  • ID# — идентификационный номер атрибуты (детали ). Каждый атрибуты имеет свой уникальный ID, который должен быть одинаковым для всех фирм производителей дисков.
  • ATTRIBUTE_NAME – название атрибута. Так как разные фирмы производители дисков могут называть атрибуты по своему (сокращать, синонимы), лучше всего ориентироваться по ID атрибута.
  • FLAG (Status flag) – каждый атрибут имеет определенный флаг, назначенный фирмой разработчиком диска. В ОС с графическим интерфейсом значения этого флага предоставляется в виде набора буквенных обозначений – w,p,r,c,o,s (расшифровка ниже). И эти наборы предоставляются в виде шестнадцатеричного числа которые вы видели выше.
  1. W arranty: Указывает на жизненно важный атрибут диска и покрывается гарантией. Если этот флаг установлен и значение атрибута с этим флагом достигнет порогового (threshold) значения, в то время, когда диск еще на гарантии, то фирма должна будет заменить диск бесплатно.
  2. P erformance: Указывает на атрибут, который представляет показатель производительности диска – не критический.
  3. Error R ate: Атрибут с частотой ошибок.
  4. C ount of occurrences: Атрибут-счетчик происшествий.
  5. O nline test: Атрибут, который обновляет значения только через on-line тесты. Если не указан, то обновляется через off-line тесты.
  6. S elf preserving: Указывает на атрибут который может собирать и сохранять данные о диска, даже если S.M.A.R.T. отключен.
  • Value – Текущее значение атрибута(оценка атрибута диска на основе Raw_value). Низкое значение говорит о быстрой деградации диска или о возможном скором сбое. т.е. чем выше значение Value атрибута, тем лучше. Это значение атрибута нужно сравнивать с пороговым (threshold) значением. Если это критический атрибут и значение ниже порогового — нужно проводить замену диска.
  • Worst – Самое низкое значение атрибута за жизненный цикл диска. Значение может изменяться на протяжении жизни диска, и не должно быть ниже или равным пороговому значению (threshold).
  • Thresh (Threshold) – Пороговое значения атрибута назначенное создателем диска. Значение не меняется за жизненный цикл диска. Если значение Value атрибута станет равным или меньше порогового – появиться уведомление в колонке WHEN_FAILED. И диск нужно заменить.
  • Type – тип атрибута. Может быть критическим (pre-fail), который указывает на предстоящий отказ диска из-за ошибок или не критический, указывающий на достижение конца жизненного цикла диска.
  • Raw_value – Объективное значения атрибута, которое показывается в десятичном формате (вычисляется firmware диска) и известных только производителю единицах (имеет связь с Value, Threshold и Worst значениями).
  • WHEN_FAILED – Указывает на проблемы с атрибутом.

Атрибут диска примет значение failed, в случаи:

Value = f(Raw_value ) <= Threshold

  • f(Raw_value) – функция вычисления деградации (уменьшения) значения параметра Value в зависимости от значения Raw_value.

Недостатки такого подхода к вычислению деградации диска:

  • Для каждого производителя дисков и даже модели диска функция f(Raw_value) вычисляется по-разному.
  • Оценка каждого атрибута подсчитывается независимо друг от друга – т.е. игнорируются связи между атрибутами.

Теперь хочу представить таблицу с перечисленными всех атрибутов. Те атрибуты, которые выделены розовым — относятся к атрибутам критическим. К тому же, указано тип параметра в зависимости от величины значения. Т.е. чем больше значение параметра, тем лучше состояние здоровья диска или наоборот.

Теперь приступим к атрибутам:

#ID HEX Имя атрибута Лучше если… Описание
01 01 Raw Read Error Rate Частота ошибок при чтении данных с жёсткого диска. Происхождение их обусловлено аппаратной частью винчестера.
02 02 Throughput Performance Общая производительность накопителя. Если значение атрибута уменьшается перманентно, то велика вероятность проблем с винчестером.
03 03 Spin-Up Time Время раскрутки шпинделя из состояния покоя (0 rpm) до рабочей скорости. В поле Raw_value содержится время в миллисекундах/секундах в зависимости от производителя
04 04 Start/Stop Count * Полное число запусков, остановок шпинделя. Иногда в том числе количество включений режима энергосбережения. В поле raw value хранится общее количество запусков/остановок жёсткого диска.
05 05 Reallocated Sectors Count Число операций переназначения секторов. При обнаружении повреждённого сектора на винчестере, информация из него помечается и переносится в специально отведённую зону, происходит утилизация bad блоков, с последующим консервированием этих мест на диске. Этот процесс называют remapping. Чем больше значение Reallocated Sectors Count, тем хуже состояние поверхности дисков - физический износ поверхности. Поле raw value содержит общее количество переназначенных секторов.
07 07 Seek Error Rate Частота ошибок при позиционировании блока магнитных головок. Чем больше значение, тем хуже состояние механики, или поверхности жёсткого диска.
08 08 Seek Time Performance Средняя производительность операции позиционирования. Если значение атрибута уменьшается, то велика вероятность проблем с механической частью.
09 09 Power-On Hours (POH) Время, проведённое устройством, во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ.
10 0A Spin-Up Retry Count Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной.
11 0B Recalibration Retries Количество повторов рекалибровки в случае, если первая попытка была неудачной.
12 0C Device Power Cycle Count Число циклов включения-выключения винчестера.
13 0D Soft Read Error Rate Число ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению.
187 BB Reported UNC Errors Неустранимые аппаратные ошибки.
190 BE Airflow Temperature Температура воздуха внутри корпуса жёсткого диска. Целое значение, либо значение по формуле 100 - Airflow Temperature
191 BF G-sense error rate Количество ошибок, возникающих в результате ударов.
192 C0 Power-off retract count Число циклов аварийных выключений.
193 C1 Load/Unload Cycle Количество циклов перемещения блока головок в парковочную зону.
194 C2 HDA temperature Показания встроенного термодатчика накопителя.
195 C3 Hardware ECC Recovered Число коррекции ошибок аппаратной частью диска (ошибок чтения, ошибок позиционирования, ошибок передачи по внешнему интерфейсу).
196 C4 Reallocation Event Count Число операций переназначения в резервную область, успешные и неудавшиеся попытки.
197 C5 Current Pending Sector Count Число секторов- кандидатов на перенос в резервную зону. Помечены как не надёжные. При последующих корректных операциях атрибут может быть снят.
198 C6 Uncorrectable Sector Count Число некорректируемых ошибок при обращении к сектору.
199 C7 UltraDMA CRC Error Count Число ошибок при передаче данных по внешнему интерфейсу.
200 C8 Write Error Rate / Multi-Zone Error Rate Общее количество ошибок при заполнения сектора информацией. Показатель качества накопителя.
201 C9 Soft read error rate Частота появления «программных» ошибок при чтении данных с диска, а не аппаратной части HDD.
202 Ca Data Address Mark errors Число ошибок адресно помеченной информации (Data Address Mark (DAM)).Если автоматически не корректируется - заменить устройство.
203 CB Run out cancel Количество ошибок ECC данных, присоединяемые к передаваемому сигналу, позволяющие принимающей стороне определить факт сбоя или исправить несущественную ошибку.
204 CC Soft ECC correction Количество ошибок ECC, скорректированных программным способом.
205 CD Thermal asperity rate (TAR) Число ошибок в следствии температурных колебаний.
206 CE Flying height * Высота между головкой и поверхностью диска компьютера.
209 D1 Offline seek performance * Drive’s seek performance during offline operations.
220 DC Disk Shift Дистанция смещения блока дисков относительно шпинделя. В основном возникает из-за удара или падения.
221 DD G-Sense Error Rate Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного crash датчика.
222 DE Loaded Hours * Время, проведённое блоком магнитных головок между выгрузкой из парковочной области в рабочую область диска и загрузкой блока обратно в парковочную область.
223 DF Load/Unload Retry Count * Количество новых попыток выгрузок/загрузок блока магнитных головок винчестера в/из парковочной области после неудачной попытки.
224 E0 Load Friction Величина силы трения блока магнитных головок при его выгрузке из парковочной области.
225 E1 Load Cycle Count Число циклов вход-выход в парковочную зону.
226 E2 Load ‘In’-time * Время, за которое привод выгружает магнитные головки из парковочной области на рабочую поверхность диска.
227 E3 Torque Amplification Count Количество попыток скомпенсировать вращающий момент.
228 E4 Power-Off Retract Cycle Количество повторов автоматической парковки блока магнитных головок в результате выключения питания.
230 E6 GMR Head Amplitude * Амплитуда «дрожания» (расстояние повторяющегося перемещения блока магнитных головок).
231 E7 Temperature Температура жёсткого диска.
240 F0 Head flying hours * Время позиционирования головки.
250 FA Read error retry rate Число ошибок во время чтения жёсткого диска.

Атрибуты дисков нужно смотреть в целом и самостоятельно прогнозировать замену, не только опираясь на smart атрибуты. Нужно дополнительно проводить тесты на бедблоки и запускать fscheck и smart тесты, о которых пойдет речь в следующих статьях.

Жесткий диск - сложное электронно-механическое устройство, имеющее свою технологию самодиагностики, которая может предсказать о скором выходе из строя вашего жесткого диска. Что обычно является очень грустным событием...

Технология S.M.A.R.T. (англ. S elf M onitoring A nalysing and R eporting T echnology ) - технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.

Мы не будем рассматривать данную технологию во всех подробностях, т.к. это слишком широкий вопрос и у каждого из производителей накопителей своё видение и количество отслеживаемых параметров. Рассмотрим наиболее важные с практической точки зрения.

Для этого нам потребуется программа для просмотра отслеживаемых параметров.

В ней на вкладке "Хранение данных->SMART" выбираем жёсткий диск и в окне показываются отслеживаемые параметры:

01 Raw Read Error Rate - количество ошибок при чтении. У современных дисков очень большая плотность хранения данных, поэтому с ошибками они считывают данные постоянно, а информация восстанавливается за счёт кода коррекции ошибок ECC. Именно эти ошибки и считает этот параметр. В жёстких дисках фирмы Seagate эти некритичные ошибки показываются, остальные производители предпочитают об этом скромно умалчивать. Для дисков Seagate можно считать очень хорошим состояние когда параметры Raw Read Error Rate и Hardware ECC Recovered равны. Это значит что сколько было ошибок столько и было исправлено с помощью кода коррекции. Если же эти значения не равны то всё же не стоит бояться. Это не критичный параметр и диск может прожить ещё годы без каких либо проблем.

03 Spinup Time - время раскрутки диска до рабочего состояния. Беспокоиться стоит только если значение меньше половины от начального. Но тут ещё есть несколько нюансов, таких как сколько пластин в жестком диске. Максимум в настоящее время это 5 пластин (Hitachi), разумеется для раскрутки такого пакета дисков понадобится времени больше чем для 1-ой пластины. Силу инерции никто не отменял.

04 Start/Stop Count - общее количество стартов/остановок шпинделя. Для Seagate количество остановок шпинделя при переходе в режим энергосбережения.

05 Reallocated Sector Count - число переназначенных секторов. То есть когда диск обнаруживает ошибку чтения/записи, он помечает сектор «переназначенным», и переносит данные в специально отведённую резервную область. Вообще это страшный параметр, если значение его равно более 10 то это как минимум значит что пора вроверять всю поверхность диска чтобы понять будет ли этот процесс продолжаться. Судя по практике переназначенными секторами страдают ноутбучные диски гдето через год использования. Потому как они работают в очень жестких условиях. Я не говорю об ударах - большинство от этого более-менее защищены. Причина - температура. Корпус ноутбука обычно плохо продувается и диск перегревается, затем мы выключаем ноутбук и идём куда? Ну правильно, на улицу! А там -10 по цельсию. Вот как раз скорость нагрева-остывания и разрушает нежный магнитный слой на пластинах диска. По спецификациям всех производителей дисков так называемый "временной градиент температур", то есть скорость изменения температуры должна быть не более 20 град/час - в рабочем состоянии и не более 30 град/час в выключенном. Это правило нарушается всегда, но для ноутбуков особенно часто и жестоко.

09 Power-on Time Count (Power-on Hours) - количество времени проведённого во включённом состоянии. Обычно у современных дисков измеряется в часах (у Fujitsu в секундах). У старых дисков Maxtor, не у тех которые сейчас выпускаются Seagate под этой маркой, а у оригинальных Maxtor время изменяется в минутах. Это весьма полезный параметр если вы покупаете старый диск, то хочется же знать сколько он в своей жизни отработал. А кроме того обычно это время совпадает с временем работы компьютера и можно определить сколько человек проводит за компьютером в среднем. Как показывает практика и мой опрос на одном из крупных форумов посвящённых компьютерному железу диски с временем наработки более 20000 часов (примерно 2.5 года постоянной работы) уже имеют какие то дефекты, например те же "переназначенные" секторы и не так уж далеки от старческой смерти. Из тех же спецификаций производителей можно узнать что диски предназначенные для настольных компьютеров не предназначены для круглосуточной работы, а рассчитаны на работу в режиме 8/5, то есть 8 часов 5 дней в неделю. Это получается около 2400 часов в год. И получается что гарантия рассчитана для 3-х лет - 7200 часов, для 5 лет - 12000 часов. Не так то уж и много, учитывая что в году 8760 часов.

0A Spinup Retry Count - Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. Если значение атрибута увеличивается, то вероятнее всего повреждение механической части/подшипников. Встречается очень редко, современные диски делают с гидродинамическими подшипниками и в случае неисправности такого подшипника он заклинивает сразу и намертво или работает долго и счастливо. Не так давно этим сильно страдали диски Toshiba и в меньшей степени Western Digital. Заклинивание происходит от перегрева.

0С Power Cycle Count - число циклов включения/выключения диска.

С2 Temperature - температура диска. К сожалению датчики температуры стоят у дисков разных производителей в разных местах, поэтому бывают и завышения и занижения реальной температуры. Но в среднем как показало недавнее исследование Google оптимальная рабочая температура находится в пределах от 35 до 45 градусов. Выше 50 градусов эксплуатация крайне не рекомендуется, но такую температуру и даже выше часто можно увидеть в ноутбуках.

Число секторов, являющихся кандидатами на замену. Они не были ещё определены как плохие, но считывание с них отличается от чтения стабильного сектора, это так называемые подозрительные или нестабильные сектора. В случае успешного последующего прочтения сектора он исключается из числа кандидатов. В случае повторных ошибочных чтений накопитель пытается восстановить его и выполняет операцию переназначения. Значение не равное нулю встречается обычно если на диске уже есть переназначенные сектора. Если это так, то с высокой вероятностью можно сказать что диск активно "сыпется", то есть разрушается магнитный слой пластин жесткого диска.

Кол-во нескорректированных ошибок, то есть серьёзное повреждение поверхности диска. Появляются такие ошибки когда заканчивается место в резервной зоне диска для переназначения секторов. Так же могут появляться при резком отключении питания в момент когда диск записывает данные - это так называемые "программные бэд блоки". Если их количество один два, а остальные параметры касающиеся поверхности диска в норме то беспокоиться не стоит. Если же велико, то данные надо спасать и готовить "тело на вынос". :)

С7 Ultra ATA CRC Error Rate - количество ошибок при передаче во внешнем интерфейсе. Обычно в этом виноват кабель или плохой контакт кабеля с разъёмами, особенно проявляется на SATA дисках. Встречается весьма часто.

С8 Write Error Rate - ошибки при записи на диск. Встречается редко. Обычно на очень старых дисках. Если есть ошибки то это означает физический износ привода головок жесткого диска. Или же при серьёзных повреждения поверхности диска. (когда количество переназначенных секторов и нескоректированных ошибок превышают все разумные значения).

Вот мы и кратенько рассмотрели основные параметры системы самодиагностики жестких дисков. Если есть желание узнать об этом подробнее то можно обратиться к материалам википедии:

К сожалению SMART не всегда может предсказать смерть диска. Как показало исследование всё того же Google около 50% дисков умирают резко и без видимых причин. Но в одном эта технология точно полезна. По ней можно быстро узнать состояние поверхности диска, то есть параметры:

05 Reallocated Sector Count

C5 Current Pending Sector Count

С6 Offline Uncorrectable Sector Count

И очень полезно знать время которое за свою жизнь проработал диск, чтобы примерно угадать что от него можно ждать.

А теперь немного о будущем. В продаже уже появилось достаточное количество предложений действительно "жестких дисков" . Они выполнены на микросхемах твердотельной памяти типа flash и гораздо более надёжны и по механическим воздействиям и по температуре. Однако производители ещё не договорились о стандарте системы самодиагностики для этого вида накопителей. Но она будет гораздо проще чем для старых добрых электромеханических дисков. И главное с гораздо более высокой вероятностью будет предсказывать возможность выхода из строя! Флэш память более предсказуема в этом смысле. Чтож, будем ждать этого светлого будущего!




Top