Нужен совет, падает система, как посадить чтоб не разбиться ... (По тиху сдает железо, в итоге частые зависания процессов.)

Cent OS, Scientific Linux

Модератор: Модераторы разделов

Аватара пользователя
kontur
Сообщения: 23
ОС: CentOS, Debian

Нужен совет, падает система, как посадить чтоб не разбиться ...

Сообщение kontur »

Доброго здоровья ...

Ситуация такая:

Раньше это была система полностью на базе FC10, но так случилось, что железо на котором это все работало
и не парило мозги, успешно сказало долго жить :/ ... Не могу сазать, что сервак боевой, но и экспериментальным
тоже трудно его уже назвать, короче приятного мало ...
Переставлять все, что там было не хотелось, потому долго не думая, взял два веника и перетащил на свой рабочий
комп, где ранее sabayon4 у меня был, и все отлично работало. Дык вот, первый запуск, и fc10 начала ругаться на sda
девайсы, оказалось, что используемое ядро ничего не знает о scsi устройствах, либо перекоппилировать его, либо
искать готовое. :D я пошел путем наименьшего сопротивления ! Взял ядро от sabayon4 и втюхал его системе и о чудо !
Все сразу заработало ! На том, вроде, и закончить бы историю, но ... по какой-то причине вдруг машина перестала
нормально включаться, система на отрез отказывалась распознавать веники пока шлейфы не передернешь ...
Но и это еще не все, когда ударили "холода", в системе начали появляться процессы (smbd) которые через top
видно челую кучу, с загрузкой проца под 98sy, при нормальном кол-ве процессов с 1-2 вдруг подскакивает до 700,
короче система почти перестает на что-либо реагировать. Ради интереса взялся за южный мост, чуть пальзы себе не
обжег ! На других компах температупа около 40-50 градусов, на вскидку, я сам не системщик, короче не по железу, но
пологаю что такой нагрев есть не нормальность ?

Дык вот и возникла делема :crazy:, это следствие моих действий с ядром системы ? Или это банальный перегрев компа ?
Если второе, то как можно ее посадить, так что fs не повреждалась( при том kill -9 на те процессы ничего не давали ), и
тому же реакция системы на shutdown -h now --> не удавалось остановить процесы 1... 2... итд ...
Еще интересный факт, ничего лучшего не придумав, просто рубанул его, и второй раз неудачно :crazy: ...
Сразу после перезагрузки пошли востановления по журналам, и типа ничего автоматом зделать не смог ...
Но, о чудо ! После того, как ему дали 10 мин передышки :crazy:, операция востановления прошла
с лету ?!

Сам-то вроде понимаю, что мало вероятно, что бы ПО было виновато, но хотелось
бы услышать что скажут более опытные люди ...

Заранее благодарен

PS: просьба сильно не пинать :) !
Спасибо сказали:
Аватара пользователя
kontur
Сообщения: 23
ОС: CentOS, Debian

Re: Нужен совет, падает система, как посадить чтоб не разбиться ...

Сообщение kontur »

В этой теме удалось кое-что найти: Не могу завершить процесс
Правда далеко не все понял про режимы отладки !? И еще ! Ребут не спасает, так как система не может
остановить те процессы, а следовательно освободить fs по тем же причинам, что и kill -9 ...
И уж то, что это не замби - это уж точно !!! Ресурсы проца в момент уходят в нуль ...
Поправка, вчера обнаружил, что этот процесс(движение) носит постепенный характер, те
нагрузка возврастает по мере "подвисания" процессов. Я систему не отлаживал (не дорос), но
очень похоже на то, как эсли бы код ядра, обрабатывающий запрос процесса, входил
в бесконечный цикл ...

Единственным выходом из ситуации, который я вижу - ручное
размонтирование fs, а после отправить систему в reboot или shutdown ...

PS: просьба сильно не пинать :) !

Поправка :D, Пинать можно, только не очень сильно, пожалуйста ...

Поправьте пожалуйста, если ошибаюсь.

Заранее благодарен ...
Спасибо сказали:
Аватара пользователя
kontur
Сообщения: 23
ОС: CentOS, Debian

Re: Нужен совет, падает система, как посадить чтоб не разбиться ...

Сообщение kontur »

Спасибо всем, кто может, что-то пытался найти ...

Может, кому-то будет интересно.

Попробую частично ответить на свои вопросы.

Оказалось, что вопрос, несколько не в тему, те скорее по hardware.
Путем отсева всех возможных вариантов, удолось выяснить, что
причиной отказов был не перегрев компонентов MB, а неправильно
установленная память, во 2-й канал попала не та планка, короче :(,
так сказать, внимательнее читайте мат. часть. Во всяком случае, после
удаления 2-й планки из 2-го канала сбои прекратились.

Однако, дожен заметить, как мне объяснили спецы, что моя мамка, а
именно MB GA-7N400, доживает свои последние дни, так что ее заменна
все таки потребуется !

К сожалению, но по 2-му вопросу: как снять подвисший процесс (см. выше),
накопать, что-то вразуметильное, мне так и не удалось, может кто-то знает
что-то еще ...
Спасибо сказали: