Smart status

Проблемы с жестким диском

Несколько слов о технологии S.M.A.R.T.
Оценка технического состояния жесткого диска
Пример использования терминального режима для ремонта HDD.
О некоторых мифах относительно жестких дисков.


Несколько слов о технологии S.M.A.R.T



  




Современные дисковые накопители - довольно сложные устройства, выполняющие
не только присущие им по их прямому назначению операции с пользовательскими
данными, но и встроенные функции самоконтроля (Self-test), автономного
сканирования поверхности диска с замещением ненадежных секторов из резервной
области (Spare area), сбора данных о своем состоянии (Off-line data collection).
Даже если накопитель в какое-то время не используется операционной системой,
он может выполнять какую-либо подпрограмму самотестирования, занимаясь
внутренней диагностикой, сбором информации о состоянии оборудования и
поверхности дисков. Если во время выполнения самотестирования накопитель
получает команду по интерфейсу, то процесс самотестирования прерывается и
накопитель приступает к обработке поступившей команды.
Кроме того, в состав команд для накопителя сейчас добавлены команды для
принудительного запуска внутренних тестов (SMART EXECUTE OFF-LINE IMMEDIATE).
В процессе выполнения обычных команд накопитель также выполняет
сбор и обработку данных о своем состоянии.
Все вышеперечисленные факторы и есть основа технологии S.M.A.R.T.
(Self-Monitoring Analysis and Reporting Technology).

Принцип работы S.M.A.R.T. основан на том, что в процессе функционирования,
винчестер отслеживает определенные параметры своего состояния и отражает
их в специальных характеристиках - атрибутах (Attribute), сохраняющихся в
энергонезависимой памяти накопителя (обычно в качестве такой памяти
используется часть дисковой поверхности, доступная только внутренней
микропрограмме накопителя - "служебная зона"). Данные атрибутов могут быть считаны
специальным программным обеспечением.
Атрибуты состоят из нескольких полей. Каждое поле имеет определенный смысл.
Обычно, программы считывания S.M.A.R.T. выдают их расшифровку в виде:


Несколько слов о технологии S.M.A.R.T


Оценка технического состояния жесткого диска




  
Для анализа состояния накопителя, пожалуй самым важным значением атрибута
является Value - условное число (обычно от 0 до 100 или до 253), заданное
производителем, которое изначально установлено на максимум при производстве
накопителя и уменьшается в случае ухудшения его параметров.
Для каждого атрибута существует предельное значение, при котором производитель
гарантирует его работоспособность - поле Threshold. Если значение Value
приближается или становится меньше значения Threshold, - накопитель пора менять.
Перечень атрибутов и их значения жестко не стандартизированы и определяются
изготовителем накопителя, но наиболее важные из них интерпретируются одинаково.
Например, атрибут с идентификатором 194 будет характеризовать температуру
диска, и для устройств Seagate и для WD, Samsung, Maxtor.
В настройках большинства современных BIOS материнских плат имеется пункт
позволяющий запретить или разрешить считывание и анализ атрибутов S.M.A.R.T. в
процессе начальной загрузки. Иногда его ошибочно трактуют, как запрет или
разрешение самой технологии SMART для дискового накопителя. Это неверно,
SMART - это часть микропрограммного кода, прошитого в накопителе, часть его
рабочего алгоритма, изменить который настройками BIOS невозможно.
При включении этой опции, в процессе тестирования оборудования компьютера
после включения питания, дополнительно выполняется еще и считывание
SMART-атрибутов из накопителя, их анализ на достижение предельного значения
для предупреждения пользователя о возможном скором отказе.


Оценка технического состояния жесткого диска

Одной из самых удобных программ для тестирования жестких дисков является
Victoria Сергея Казанского. Сайт Victoria SoftWare
На сайте найдете последнюю версию программы, а также массу
полезной информации, в том числе и подробное описание работы с Victoria.

Самый же простой вариант проверки жесткого диска - HDDScan For Windows.

Скачать - 416Кб.
Это очень простая, не требующая установки или каких-либо драйверов программа.
Скачиваете ее, распаковываете в какой-нибудь каталог и запускаете hddscan.exe.
Основное окно программы состоит из 3-х частей:

1. Source Disk - Здесь выбирается текущий диск для тестирования и, по
нажатию кнопки "S.M.A.R.T.", выполняется считывание S.M.A.R.T.-атрибутов.
Также в этом окне отображается модель накопителя (Model), версия его прошивки
(Firmware), серийный номер (serial) и объем в блоках LBA (LBA)
2. Process - кнопки для запуска и остановки теста (Start Stop),
область тестирования, время тестирования, режим теста, номер текущего блока и
текущая скорость передачи данных.
3. Информационное окно - ход процесса тестирования и его результаты. Также
несколько вкладок для интерпретации результатов и запуска автономных
тестов S.M.A.R.T.

Что такое S.M.A.R.T?

Атрибут диска примет значение failed, в случаи:

Value = f(Raw_value) <= Threshold

Здесь:

  • f(Raw_value) – функция вычисления деградации (уменьшения) значения параметра Value в зависимости от значения Raw_value.

Недостатки такого подхода к вычислению деградации диска:

  • Для каждого производителя дисков и даже модели диска функция f(Raw_value) вычисляется по-разному.
  • Оценка каждого атрибута подсчитывается независимо друг от друга – т.е. игнорируются связи между атрибутами.

If the computer can boot after pressing the F1 key immediately backup all information on the computer and contact the hard drive manufacturer for replacement or additional help. In some very rare cases, the S.M.A.R.T. implementation on your computer may have issues of its own and may need to be patched before replacing the hard drive.

RAW (Data) — самый интересный, важный и нужный для оценки показатель. В большинстве случаев он содержит в себе не уе, а реальные значения, выражаемые в различных единицах измерения, напрямую говорящие о текущем состоянии диска. Основываясь именно на этом показателе, формируется значение Value (а вот по какому алгоритму оно формируется — это уже тайна производителя, покрытая мраком). Именно умение читать и анализировать поле RAW даёт возможность объективно оценить состояние винчестера.

Теперь перейдем непосредственно к самим атрибутам.

01 (01)Raw Read Error Rate - Частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска. Для всех дисков Seagate, Samsung (семейства F1 и более новые) и Fujitsu 2,5″ это — число внутренних коррекций данных, проведенных до выдачи в интерфейс, следовательно, на пугающе огромные цифры можно реагировать спокойно.

02 (02)Throughput Performance - Общая производительность диска. Если значение атрибута уменьшается, то велика вероятность, что с диском есть проблемы.

С2 Temperature - температура диска. К сожалению датчики температуры стоят у дисков разных производителей в разных местах, поэтому бывают и завышения и занижения реальной температуры. Но в среднем как показало недавнее исследование Google оптимальная рабочая температура находится в пределах от 35 до 45 градусов. Выше 50 градусов эксплуатация крайне не рекомендуется, но такую температуру и даже выше часто можно увидеть в ноутбуках.

C5 Current Pending Sector Count - число секторов, являющихся кандидатами на замену. Они не были ещё определены как плохие, но считывание с них отличается от чтения стабильного сектора, это так называемые подозрительные или нестабильные сектора. В случае успешного последующего прочтения сектора он исключается из числа кандидатов. В случае повторных ошибочных чтений накопитель пытается восстановить его и выполняет операцию переназначения. Значение не равное нулю встречается обычно если на диске уже есть переназначенные сектора. Если это так, то с высокой вероятностью можно сказать что диск активно "сыпется", то есть разрушается магнитный слой пластин жесткого диска.

С6 Offline Uncorrectable Sector Count - кол-во нескорректированных ошибок, то есть серьёзное повреждение поверхности диска. Появляются такие ошибки когда заканчивается место в резервной зоне диска для переназначения секторов. Так же могут появляться при резком отключении питания в момент когда диск записывает данные - это так называемые "программные бэд блоки". Если их количество один два, а остальные параметры касающиеся поверхности диска в норме то беспокоиться не стоит. Если же велико, то данные надо спасать и готовить "тело на вынос". :)

If everything is working properly, you should see the status OK displayed.  Other statuses can indicate problems or errors retrieving S.M.A.R.T. information.

Help, My Hard Drive Is Dying!

   В атрибуте № 5 - значение Value равно 1 при пороговом в 36 (при этом в поле Raw видно действительное количество переназначеных секторов - аж 2153 - больше чем достаточно).

   В атрибуте № 187 - также значение Value равно 1 при пороговом в 0. Вроде как 1 больше нуля, но вообще-то само по себе значение Value равное 1 уже очень не хорошо. А значение Raw, в этом случае - 7361, тем более. То есть за все время работы винчестера (весьма кстати небольшое - всего лишь 884 часа, суммарно месяц с небольшим - атрибут № 9) количество секторов, которые были признаны кандидатами на переназначение - целых 7361, что весьма много. Скорее всего у винчестера какие-то проблемы с поверхностью дисков (поверхность "посыпалась").

Типнеизвестно
Описаниесодержание атрибута — загадка, но проанализировав различные диски, могу констатировать, что ненулевое значение — это плохо

Атрибут: 203 (CB) Run Out Cancel

Типтекущий
Описаниесодержит количество ошибок ECC

Влияние на здоровье неизвестно.

Атрибут: 220 (DC) Disk Shift

Типтекущий
Описаниесодержит измеренный в неизвестных единицах сдвиг пластин диска относительно оси шпинделя

Влияние на здоровье неизвестно.

Атрибут: 240 (F0) Head Flying Hours

Типнакапливающий
Описаниесодержит время, затраченное на позиционирование БМГ. Счётчик может содержать несколько значений в одном поле

Влияние на здоровье неизвестно.

Атрибут: 254 (FE) Free Fall Event Count

Типнакапливающий
Описаниесодержит зафиксированное электроникой количество ускорений свободного падения диска, которым он подвергался, т. е., проще говоря, показывает, сколько раз диск падал

Влияние на здоровье неизвестно.

Подытожим описание атрибутов. Ненулевые значения:

  • атрибутов 01, 07, 195 — вызывают подозрения в «болезни» у некоторых моделей дисков;
  • атрибутов 10, 11, 188, 196, 199, 202 — вызывают подозрения у всех дисков;
  • и, наконец, атрибутов 05, 184, 187, 197, 198, 200 — прямо говорят о неполадках.

При анализе атрибутов учитывайте, что в некоторых параметрах S.M.A.R.T. могут храниться несколько значений этого параметра: например, для предпоследнего запуска диска и для последнего. Такие параметры длиной в несколько байт логически состоят из нескольких значений длиной в меньшее количество байт — например, параметр, хранящий два значения для двух последних запусков, под каждый из которых отводится 2 байта, будет иметь длину 4 байта. Программы, интерпретирующие S.M.A.R.T., часто не знают об этом, и показывают этот параметр как одно число, а не два, что иногда приводит к путанице и волнению владельца диска. Например, «Raw Read Error Rate», хранящий предпоследнее значение «1» и последнее значение «0», будет выглядеть как 65536.

Похожие

Наверх