Дохнет винт? (Постоянные ругательства в messages)

IDE, SATA, SCSI, внешние USB-HDD, SSD, USB-Flash накопители

Модератор: Модераторы разделов

Аватара пользователя
trancefer
Сообщения: 485
Статус: $>
ОС: Arch, Slackware, OpenBSD

Дохнет винт?

Сообщение trancefer »

Здравствуйте уважаемые!

Имеется не очень новый ноут Asus L4500R с установленной несколько дней назад на него Mandriva 2009.0 и хардом Hitachi Travelstar 80GN IC25N040ATMR04-0. В процессе загрузки, а так же в /var/log/messages постоянно сыплется такая вещь:

Код: Выделить всё

Feb  6 20:59:48 localhost kernel: sd 0:0:0:0: [sda] 78140160 512-byte hardware sectors (40008 MB)
Feb  6 20:59:48 localhost kernel: sd 0:0:0:0: [sda] Write Protect is off
Feb  6 20:59:48 localhost kernel: sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Feb  6 20:59:49 localhost kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Feb  6 20:59:49 localhost kernel: ata1.00: BMDMA stat 0x26
Feb  6 20:59:49 localhost kernel: ata1.00: cmd c8/00:08:43:b0:53/00:00:00:00:00/e0 tag 0 dma 4096 in
Feb  6 20:59:49 localhost kernel:          res 50/00:00:4a:b0:53/00:00:00:00:00/e0 Emask 0x20 (host bus error)
Feb  6 20:59:49 localhost kernel: ata1.00: status: { DRDY }
Feb  6 20:59:49 localhost kernel: ata1.00: configured for UDMA/100
Feb  6 20:59:49 localhost kernel: ata1: EH complete


Причем такая ситуация наблюдается с разными ядрами, проверку на плохие блоки делал - было выявлено порядка сотни на весь диск (правда не знаю много это или мало). Машина при этом пашет вроде нормально - никаких посторонних скрипов/стуков из винта не раздается, зависаний нет. Что можете посоветовать?
Спасибо сказали:
Аватара пользователя
sirocco
Сообщения: 782
Статус: Задвинутый соучастник

Re: Дохнет винт?

Сообщение sirocco »

mhdd или victoria.
Внимательно ознакомившись с мануалом.
Спасибо сказали:
Аватара пользователя
rm_
Сообщения: 3340
Статус: It's the GNU Age
ОС: Debian

Re: Дохнет винт?

Сообщение rm_ »

проверку на плохие блоки делал - было выявлено порядка сотни на весь диск (правда не знаю много это или мало).

Один плохой блок на диск - это уже очень много.

Что можете посоветовать?

Данные срочно сбэкапить, винчестер на помойку либо в гарантийку.

Чем ещё можно подиагностировать:

Код: Выделить всё

smartctl -t long /dev/девайс # подождать пару часов, или сколько напишет
smartctl -a  /dev/девайс # в разделе селф-тестов будут результаты
Спасибо сказали:
Аватара пользователя
trancefer
Сообщения: 485
Статус: $>
ОС: Arch, Slackware, OpenBSD

Re: Дохнет винт?

Сообщение trancefer »

Интересная ситуация складывается: после похода в компьютерный магазин диск был заменен на новый WD, далее волею судеб на этот ноут была водружена Gentoo 2008.0 с самосборным ядром сконфигурированным под местное железо, вышеобозначенная вещь из messages пропала, но зато появилась другая: ( :crazy: )

Код: Выделить всё

hda: dma_intr: status=0x50 { DriveReady SeekComplete }
hda: dma_intr: bad DMA status (dma_stat=36)


В процессе гугления было обнаружено, что данная проблема проявлялась на аналогичном железе - в частности на ATI IXP чипсетах:

раз;
два;

Отсюда вопрос к знатокам: вероятно ли что это: неправильная (неполная) настройка ядра под это железо / баг ядра ?

PS ядро - 2.6.27-gentoo-r8
Спасибо сказали:
Flaming
Сообщения: 2579

Re: Дохнет винт?

Сообщение Flaming »

trancefer, проверь mhdd - если обнаружатся плохие блоки, забудь про ядро и про глюки - лучше перестраховаться и купить новый винчестер.
Либо регулярно делать резервные копии и ждать, пока окончательно не посыпется. :)
Хотя копии в любом случае не мешает делать даже на здоровом винте.
Спасибо сказали:
lexikon
Сообщения: 128

Re: Дохнет винт?

Сообщение lexikon »

Для начала

Код: Выделить всё

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.7 and 7200.7 Plus family
Device Model:     ST3120026AS
Serial Number:    3JT4QVKF
Firmware Version: 3.20
User Capacity:    120 034 123 776 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   6
ATA Standard is:  ATA/ATAPI-6 T13 1410D revision 2
Local Time is:    Thu Mar  5 12:08:22 2009 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

выручайте умники)) чтоб новую тему не создавать сюда же напишу! седня утром проснулся от того что бипер на серваке пищал, тот что при загрузке биоса выдает его диагностику! (один бип - все хорошо и т.д.) надеюсь поняли о чем :rolleyes: пищал он очень странно! непрерывно и бипы рвались как бы...грубо говоря постоянные оборванные бипы! выяснил что что-то с винтом не то! головка раскручивалась и во время бипа останавливалась, потом снова раскручивалась! Сервак еле запустил!
Нашел статью _http://www.opennet.ru/base/sys/smart_hdd_mon.txt.html
Сделал как там написано - вот что мне выдало!

Код: Выделить всё

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   064   051   006    Pre-fail  Always       -       202899081
  3 Spin_Up_Time            0x0003   099   096   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       493
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   088   060   030    Pre-fail  Always       -       693802103
  9 Power_On_Hours          0x0032   085   085   000    Old_age   Always       -       13543
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   020    Old_age   Always       -       3643
194 Temperature_Celsius     0x0022   040   059   000    Old_age   Always       -       40
195 Hardware_ECC_Recovered  0x001a   064   051   000    Old_age   Always       -       202899081
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   180   000    Old_age   Always       -       48
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age   Always       -       0

Ваши идеи? что делать?? Очень интересует пункт 10 Spin_Retry_Count ((
если в поле THRESH станет 100 - винт подохнет (судя по статье), но опять же в той статье тоже тестировался Seageat и значения такие же 100 100 097 - может это конструктивная особенность?
Спасибо сказали:
Аватара пользователя
rm_
Сообщения: 3340
Статус: It's the GNU Age
ОС: Debian

Re: Дохнет винт?

Сообщение rm_ »

Ваши идеи? что делать??

Винчестер в целом выглядит исправным, для Seagate такие показатели - норма.
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0

Ноль единиц, значит не было ни одного Spin Retry.

Могу предположить, что пищал Ваш сервер не из-за винчестера. При таких симптомах, я бы прежде всего обратил внимание на БП.
Спасибо сказали:
lexikon
Сообщения: 128

Re: Дохнет винт?

Сообщение lexikon »

дело то в том что бип пищал как раз на момент запуска - раскрутка винта! то есть
рваный бип - винт раскручивается - останавливается, рваный бип - винт раскручивается ...
с железом как бы дружу - не совсем чайник!
с БП проблемы исключаю, т.к. держал и по сильнее конфиг в легкую!
при перезагрузке все норм включалось - вот примерный лог моими словами
Старт - лого биоса - бип о удачной загрузке - задумался - рваный бип и тд :rolleyes:
если зайти в биос - тоже намервто виснет и начинаюся рваные бипы!
Спасибо сказали:
Flaming
Сообщения: 2579

Re: Дохнет винт?

Сообщение Flaming »

Mage-Warrior писал(а):
05.03.2009 17:22
А на мой взгляд, вполне дружественно. Наверное, индивидуальное восприятие.

lexikon, а если этот же винчестер к другой материнке (к другому компу) подсоединить попробовать?
Спасибо сказали:
lexikon
Сообщения: 128

Re: Дохнет винт?

Сообщение lexikon »

токо тут написал - сервак опять упал((( опять начались рваный бипы ! раз уж тут тема зашла про то что это может быть не винт - удостоверился!
отсоединил питание винта и запустил машину - все работает!!
под виндой быстрее найти проблему((( можно было бы определить просаживание на ветках БП - посмотреть напруги!
если кто знает такие проги - подскажите плиз!
Пойду покопаю суслоги! если что интересное найду - отпишусь!
Спасибо сказали:
lexikon
Сообщения: 128

Re: Дохнет винт?

Сообщение lexikon »

в логах все чисто! буду ждать следующий сбой - полезу снова туда! за сутки пока ничего не случилось - может быть помогло просто переткнуть питание винта на другую ветку!
Спасибо сказали:
Аватара пользователя
Aviator
Сообщения: 65
ОС: Debian GNU/Linux amd64

Re: Дохнет винт?

Сообщение Aviator »

Код: Выделить всё

  1 Raw_Read_Error_Rate     0x000f   064   051   006    Pre-fail  Always       -       202899081
  7 Seek_Error_Rate         0x000f   088   060   030    Pre-fail  Always       -       693802103
195 Hardware_ECC_Recovered  0x001a   064   051   000    Old_age   Always       -       202899081

Это у всех сигейтов такие дикие значения. Непонятно, как они это считают... Принимать в расчет это не следует.

Код: Выделить всё

194 Temperature_Celsius     0x0022   040   059   000    Old_age   Always       -       40

Надо бы задуматься над охлаждением. Достаточно горячий.

Код: Выделить всё

199 UDMA_CRC_Error_Count    0x003e   200   180   000    Old_age   Always       -       48

Пищит при тесте из-за этого.
Я бы проверил сначала шлейф, разъемы, блок питания.
Далее, если проблема осталась, проверил бы на другой материнской плате, с заведомо исправным ATA/SATA контроллером.
Таким образом локализуем проблему - либо виноват контроллер в HDD либо в системной плате.
В случае проблем в контроллере на самом диске самым лучшим вариантом будет купить новый, а в случае материнской платы как правило это либо шунтирующие конденсаторы поплыли, либо порт поврежден статическим электричеством. Во втором случае можно просто диск попробовать воткнуть в другой порт, а вот в первом - под паяльник однозначно.
С уважением, Сергей.
Спасибо сказали:
lexikon
Сообщения: 128

Re: Дохнет винт?

Сообщение lexikon »

ух) вот это ответ! огромное благодарность! будем действовать! пока тьфу тьфу все хорошо!
Спасибо сказали:
Аватара пользователя
trancefer
Сообщения: 485
Статус: $>
ОС: Arch, Slackware, OpenBSD

Re: Дохнет винт?

Сообщение trancefer »

Flaming, я сильно сомневаюсь в неисправности самого винта тк он абсолютно новый (из магазина с гарантией етц) и только один раз форматировался собственно при установке самой Дженты. Плюс мое сомнение подтверждается тем, что точно такие же проблемы были и у других людей на ноутах с таким же или практически таким же внутренним содержимым как и у меня. Как вариант думаю следует покурить бамбук маны по hdparm - может чего и прояснится.

У меня пока остался один вопрос: если гипотетически предположить что это баг в ядре то насколько серьезно это может отразиться на самом оборудовании?
Спасибо сказали: