HDD дохнет? 5 ошибок SMART

IDE, SATA, SCSI, внешние USB-HDD, SSD, USB-Flash накопители

Модератор: Модераторы разделов

lexikon
Сообщения: 128

HDD дохнет? 5 ошибок SMART

Сообщение lexikon »

:unsure: вебмин вечно кричит что 5 ошибок в SMART
вот вывод smartctl --all /dev/sda1

Код: Выделить всё

smartctl version 5.38 [i386-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.8 family
Device Model:     ST3250823A
Serial Number:    3ND24PH4
Firmware Version: 3.03
User Capacity:    250 059 350 016 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Sun Dec 13 18:53:36 2009 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)    Offline data collection activity
                    was completed without error.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:          ( 430) seconds.
Offline data collection
capabilities:              (0x5b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   1) minutes.
Extended self-test routine
recommended polling time:      (  84) minutes.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   052   044   006    Pre-fail  Always       -       201912783
  3 Spin_Up_Time            0x0003   098   098   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   099   099   020    Old_age   Always       -       1174
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   082   060   030    Pre-fail  Always       -       199773789
  9 Power_On_Hours          0x0032   094   094   000    Old_age   Always       -       5629
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   099   099   020    Old_age   Always       -       1621
194 Temperature_Celsius     0x0022   043   049   000    Old_age   Always       -       43 (0 16 0 0)
195 Hardware_ECC_Recovered  0x001a   052   043   000    Old_age   Always       -       201912783
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 5
    CR = Command Register [HEX]
    FR = Features Register [HEX]
    SC = Sector Count Register [HEX]
    SN = Sector Number Register [HEX]
    CL = Cylinder Low Register [HEX]
    CH = Cylinder High Register [HEX]
    DH = Device/Head Register [HEX]
    DC = Device Command Register [HEX]
    ER = Error register [HEX]
    ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 5 occurred at disk power-on lifetime: 4529 hours (188 days + 17 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 4e 59 0d e0  Error: ICRC, ABRT 1 sectors at LBA = 0x000d594e = 874830

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 08 47 59 0d e0 00      02:14:15.475  READ DMA EXT
  35 00 80 2f 80 0b e0 00      02:14:15.110  WRITE DMA EXT
  35 00 80 af 7f 0b e0 00      02:14:15.109  WRITE DMA EXT
  35 00 80 2f 7f 0b e0 00      02:14:15.109  WRITE DMA EXT
  35 00 80 af 7e 0b e0 00      02:14:15.109  WRITE DMA EXT

Error 4 occurred at disk power-on lifetime: 4529 hours (188 days + 17 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 4e 59 0d e0  Error: ICRC, ABRT 1 sectors at LBA = 0x000d594e = 874830

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 08 47 59 0d e0 00      02:09:41.449  READ DMA EXT
  35 00 08 9f 29 61 e0 00      02:09:41.386  WRITE DMA EXT
  35 00 08 f7 20 61 e0 00      02:09:41.386  WRITE DMA EXT
  35 00 08 e7 20 61 e0 00      02:09:41.354  WRITE DMA EXT
  35 00 08 c7 20 61 e0 00      02:09:41.354  WRITE DMA EXT

Error 3 occurred at disk power-on lifetime: 834 hours (34 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 df 52 60 e0  Error: UNC at LBA = 0x006052df = 6312671

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 b0 07 51 60 e0 00      00:07:01.877  READ DMA EXT
  c8 00 01 00 00 00 e0 00      00:07:01.877  READ DMA
  c8 00 01 00 00 00 e0 00      00:07:01.877  READ DMA
  ca 00 08 37 00 5e e0 00      00:07:01.859  WRITE DMA
  c8 00 01 00 00 00 e0 00      00:07:01.858  READ DMA

Error 2 occurred at disk power-on lifetime: 834 hours (34 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 df 52 60 e0  Error: UNC at LBA = 0x006052df = 6312671

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 b0 07 51 60 e0 00      00:07:01.877  READ DMA EXT
  c8 00 01 00 00 00 e0 00      00:07:01.877  READ DMA
  c8 00 01 00 00 00 e0 00      00:07:01.877  READ DMA
  ca 00 08 2f 00 5e e0 00      00:07:01.859  WRITE DMA
  c8 00 01 00 00 00 e0 00      00:07:01.858  READ DMA

Error 1 occurred at disk power-on lifetime: 834 hours (34 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 df 52 60 e0  Error: UNC at LBA = 0x006052df = 6312671

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 d8 b0 07 51 60 e0 00      00:06:54.168  READ DMA EXT
  c8 d8 80 cf 4f 60 e0 00      00:06:54.168  READ DMA
  25 d8 88 47 4d 60 e0 00      00:06:54.163  READ DMA EXT
  c8 d8 40 47 49 60 e0 00      00:06:54.163  READ DMA
  c8 d8 08 3f 49 60 e0 00      00:06:54.154  READ DMA

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      5587         -
# 2  Short offline       Aborted by host               60%      5587         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

винт разделен на два раздела при выводе smartctl --all /dev/sda2 так же эти же ошибки :(
еще бы разбираться во всем этом! Подскажите что делать и что такое 49 дней :( жить осталось что ли?
Спасибо сказали:
Аватара пользователя
destr
Сообщения: 128
ОС: Debian

Re: HDD дохнет? 5 ошибок SMART

Сообщение destr »

Вообще цифры пугают. Raw_Read_Error_Rate Seek_Error_Rate бэкапте данные.
Ошибки при чтении, ошибки позиционирования под 200 миллионов, это плохо.
Статья в тему
http://www.opennet.ru/base/sys/smart_hdd_mon.txt.html
Спасибо сказали:
lexikon
Сообщения: 128

Re: HDD дохнет? 5 ошибок SMART

Сообщение lexikon »

спасибо огромное за ссылку...буду искать винчестер для бэкапа!
Спасибо сказали:
Аватара пользователя
rm_
Сообщения: 3340
Статус: It's the GNU Age
ОС: Debian

Re: HDD дохнет? 5 ошибок SMART

Сообщение rm_ »

destr писал(а):
13.12.2009 22:51
Вообще цифры пугают. Raw_Read_Error_Rate Seek_Error_Rate бэкапте данные.
Ошибки при чтении, ошибки позиционирования под 200 миллионов, это плохо.

Это абсолютно нормальные цифры для Seagate, особенность их SMART'а.

Что действительно не радует, так это:
40 51 00 df 52 60 e0 Error: UNC at LBA = 0x006052df = 6312671

Рекомендую:

Код: Выделить всё

smartctl -t long /dev/сабж

После часа-двух работы теста, посмотреть результаты (smartctl -a). Если там Test complete: read error, залить весь диск нулями и запустить тест ещё раз.
Спасибо сказали:
lexikon
Сообщения: 128

Re: HDD дохнет? 5 ошибок SMART

Сообщение lexikon »

для начала как "залить весь диск нулями"?
Спасибо сказали:
dhampire
Сообщения: 409
ОС: arch x86_64

Re: HDD дохнет? 5 ошибок SMART

Сообщение dhampire »

lexikon писал(а):
14.12.2009 00:08
для начала как "залить весь диск нулями"?

dd if=/dev/zero of=/dev/сабж
Спасибо сказали:
Flaming
Сообщения: 2579

Re: HDD дохнет? 5 ошибок SMART

Сообщение Flaming »

Можно ещё при помощи mhdd проверить из-под доса. IMHO, точнее и надёжнее. :)
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 21327
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: HDD дохнет? 5 ошибок SMART

Сообщение Bizdelnick »

rm_ писал(а):
14.12.2009 00:02
destr писал(а):
13.12.2009 22:51
Вообще цифры пугают. Raw_Read_Error_Rate Seek_Error_Rate бэкапте данные.
Ошибки при чтении, ошибки позиционирования под 200 миллионов, это плохо.

Это абсолютно нормальные цифры для Seagate, особенность их SMART'а.

Подтверждаю. У меня такая же картина.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
lexikon
Сообщения: 128

Re: HDD дохнет? 5 ошибок SMART

Сообщение lexikon »

а что делать с ошибками? как их вообще убрать тогда чтобы не маячили!
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 21327
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: HDD дохнет? 5 ошибок SMART

Сообщение Bizdelnick »

lexikon писал(а):
14.12.2009 01:35
а что делать с ошибками? как их вообще убрать тогда чтобы не маячили!

Я только про цифры, не про ошибки.
А так - неплохо бы и правда проверить, лучше родной сигейтовской утилой. Есть линуксовая версия, но она вроде только для SCSI, так что из-под доса.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
lexikon
Сообщения: 128

Re: HDD дохнет? 5 ошибок SMART

Сообщение lexikon »

запустил тест, ввел smartctl -a /dev/sda
нужно это?

Код: Выделить всё

Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.

но все равно эти ошибки он показывает :(

Код: Выделить всё

Error 5 occurred at disk power-on lifetime: 4529 hours (188 days + 17 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 4e 59 0d e0  Error: ICRC, ABRT 1 sectors at LBA = 0x000d594e = 874830

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 08 47 59 0d e0 00      02:14:15.475  READ DMA EXT
  35 00 80 2f 80 0b e0 00      02:14:15.110  WRITE DMA EXT
  35 00 80 af 7f 0b e0 00      02:14:15.109  WRITE DMA EXT
  35 00 80 2f 7f 0b e0 00      02:14:15.109  WRITE DMA EXT
  35 00 80 af 7e 0b e0 00      02:14:15.109  WRITE DMA EXT

Error 4 occurred at disk power-on lifetime: 4529 hours (188 days + 17 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 4e 59 0d e0  Error: ICRC, ABRT 1 sectors at LBA = 0x000d594e = 874830

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 08 47 59 0d e0 00      02:09:41.449  READ DMA EXT
  35 00 08 9f 29 61 e0 00      02:09:41.386  WRITE DMA EXT
  35 00 08 f7 20 61 e0 00      02:09:41.386  WRITE DMA EXT
  35 00 08 e7 20 61 e0 00      02:09:41.354  WRITE DMA EXT
  35 00 08 c7 20 61 e0 00      02:09:41.354  WRITE DMA EXT

Error 3 occurred at disk power-on lifetime: 834 hours (34 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 df 52 60 e0  Error: UNC at LBA = 0x006052df = 6312671

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 b0 07 51 60 e0 00      00:07:01.877  READ DMA EXT
  c8 00 01 00 00 00 e0 00      00:07:01.877  READ DMA
  c8 00 01 00 00 00 e0 00      00:07:01.877  READ DMA
  ca 00 08 37 00 5e e0 00      00:07:01.859  WRITE DMA
  c8 00 01 00 00 00 e0 00      00:07:01.858  READ DMA

Error 2 occurred at disk power-on lifetime: 834 hours (34 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 df 52 60 e0  Error: UNC at LBA = 0x006052df = 6312671

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 b0 07 51 60 e0 00      00:07:01.877  READ DMA EXT
  c8 00 01 00 00 00 e0 00      00:07:01.877  READ DMA
  c8 00 01 00 00 00 e0 00      00:07:01.877  READ DMA
  ca 00 08 2f 00 5e e0 00      00:07:01.859  WRITE DMA
  c8 00 01 00 00 00 e0 00      00:07:01.858  READ DMA

Error 1 occurred at disk power-on lifetime: 834 hours (34 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 df 52 60 e0  Error: UNC at LBA = 0x006052df = 6312671

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 d8 b0 07 51 60 e0 00      00:06:54.168  READ DMA EXT
  c8 d8 80 cf 4f 60 e0 00      00:06:54.168  READ DMA
  25 d8 88 47 4d 60 e0 00      00:06:54.163  READ DMA EXT
  c8 d8 40 47 49 60 e0 00      00:06:54.163  READ DMA
  c8 d8 08 3f 49 60 e0 00      00:06:54.154  READ DMA

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      5638         -
# 2  Short offline       Completed without error       00%      5635         -
# 3  Short offline       Aborted by host               80%      5635         -
# 4  Extended offline    Aborted by host               90%      5635         -
# 5  Extended offline    Aborted by host               90%      5635         -
# 6  Short offline       Completed without error       00%      5587         -
# 7  Short offline       Aborted by host               60%      5587         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Спасибо сказали: