Температура CPU

Проблемы со старым железом.

Модератор: Модераторы разделов

Аватара пользователя
lone_wolf
Сообщения: 204

Температура CPU

Сообщение lone_wolf »

Всем привет!
Есть старенький сервер Intel S5000VSA c 2-я CPU Xeon 5130. Смотрю температуру 3 программами CPUID HWMonitor, AIDA64 и Linux утилитой lm_sendors.
Все три показывают разную температуру. И какой из них верить? :scratch_one-s_head:

Изображение Изображение Изображение

На ark.intel.com смотрю максимальная температура Tcase равна 65 градусам. Но при этом в HWMonitor видел температуру 67 градусов, и при этом светодиод на корпусе сигнализирующий о проблемах не загорался оранжевым и в логах ошибок в bios тоже не каких ошибок не увидел. :huh:
Спасибо сказали:

Аватара пользователя
Hephaestus
Сообщения: 3077
Статус: Многоуважаемый джинн...
ОС: Slackware64-14.1/14.2

Re: Температура CPU

Сообщение Hephaestus »

Насчет CPUID HWMonitor и AIDA64 ничего не скажу,
а lm_sensors имеет в конфиге кучу корректировочных формул и коэффициентов.
Чтобы иметь более-менее достоверные показания, имеет смысл идентифицировать чип, который используется в данной системе и смотреть на сайте lm_sensors рекомендации/формулы/коэффициенты (а может и готовые конфиги), относящиеся к этому чипу (если они есть конечно).

Кроме того, для десктопа (как для сервера не знаю) есть вариант смотреть показатели в BIOS и сравнивать их с теми, какие выдает lm_sensors. На их сайте мне даже попадались методики выведения формул, на основе этих сравнений.

За свою систему могу сказать, что у меня в настройках BIOS выставлен уровень температуры, выше которого оно будет орать и сигналить (70 градусов), и именно эта цифра отображается в выводе lm_sensors

Shell

temp1: +30.0°C (low = +127.0°C, high = +127.0°C) sensor = thermistor
temp2: -8.0°C (low = +127.0°C, high = +127.0°C) sensor = thermistor
temp3: +13.0°C (low = +0.0°C, high = +70.0°C) sensor = Intel PECI
с одной стороны, это косвенно позволяет определить, какой из показателей относится к процессору, с другой - свидетельствует о том, что между показателями в BIOS и показателями lm_sensors всё же есть некая связь.

Но в целом, lm_sensors без должного конфига, да ещё без загрузки нужных модулей ядра, либо не показывает вообще почти ничего, либо показывает всякую ерунду.
Не исключено, что другие инструменты (в Вашем случае это CPUID HWMonitor и AIDA64) ведут себя схожим образом, то есть тоже могут показывать ерунду. Только вот корректировать их сложнее, в силу закрытости, если вообще возможно. В этом смысле показания в BIOS самые достоверные, так как производители знают особенности чипа и все необходимые поправочные коэффициенты к "сырым данным" там уже применены.
Пускай скрипят мои конечности.
Я - повелитель бесконечности...
Мой блог
Спасибо сказали:

Аватара пользователя
lone_wolf
Сообщения: 204

Re: Температура CPU

Сообщение lone_wolf »

Да вот что странно в BIOS нету пункта с температурой. Хотя это же настоящая породистая интеловая мать, это вообще полностью интеловый сервер.
Hephaestus Спасибо за информацию посмотрю и вправду на офсайте данные по чипу, может повезет.
Спасибо сказали:

Аватара пользователя
yoricI
Сообщения: 1111
ОС: gentoo fluxbox

Re: Температура CPU

Сообщение yoricI »

Поищите про "IPMI".
Спасибо сказали:

Аватара пользователя
Hephaestus
Сообщения: 3077
Статус: Многоуважаемый джинн...
ОС: Slackware64-14.1/14.2

Re: Температура CPU

Сообщение Hephaestus »

lone_wolf
Кстати, Вы обратили внимание на цифры, которые я привел в предыдущем посте?
Строка, отображающая температуру процессора, показывает 13 градусов по цельсию.
Это вот как раз пример того, как могут выглядеть показатели в отсутствие должных настроек.
При этом температура в BIOS (это значит практически без нагрузки) составляет 38-39-40 градусов.
И тогда уж при загруженной системе (то есть уже с некоторой нагрузкой) температура никак не может быть ниже отображаемой в BIOS. Тем более, 13 градусов. Понятно же, что это ерунда.
Да, действительно, lm_sensors я не настраивал.
С переездом на другое железо, старые настройки потеряли актуальность, а новых я как-то не создал.
В готовом виде их не нашлось, а самому ковырять лень. Да у меня и модуль ядра соответствующий не загружен.
Я иногда даю процессору какую-нибудь ощутимую задачу (типа кодирования видео), вот тогда имеет смысл следить за температурой. Тогда я вручную подгружаю нужный модуль, смотрю показатели.
Кстати, я заметил, что чем выше температура процессора, тем ближе к правде показания ненастроенного lm_sensors. Оно может показать 13 градусов в спокойном состоянии, но под нагрузкой показывает 50-56-60-65-67 градусов, что уже похоже на правду. А если доходит до 70 градусов (было такое со старым кулером), начинает пищать. Пищит-то оно на уровне BIOS (в соответствии с настройками BIOS), а цифирки показывает на уровне lm_sensors. То есть, в этот момент у них полное согласие.
Пускай скрипят мои конечности.
Я - повелитель бесконечности...
Мой блог
Спасибо сказали:

Аватара пользователя
lone_wolf
Сообщения: 204

Re: Температура CPU

Сообщение lone_wolf »

yoricI писал:
01.09.2018 06:32
Поищите про "IPMI".
Я же сказал что сервак старенький, и там нету IPMI.
Спасибо сказали:

Аватара пользователя
lone_wolf
Сообщения: 204

Re: Температура CPU

Сообщение lone_wolf »

Но кстати да надо почитать про IPMI
Как доберусь до работы и серверной попробую сконфигурировать lm_sensors :scratch_one-s_head:
Спасибо сказали:

Аватара пользователя
lone_wolf
Сообщения: 204

Re: Температура CPU

Сообщение lone_wolf »

Кстати офсайт www.lm-sensors.org с примерами конфигов у меня не пашет :(
Надо будет sensors-detect выполнить есче, ибо я сейчас данные брал с LiveCD.
Кстати извиняюсь за тупой вопрос но с какого датчика lm_sensors берет данные о температуре CPU? Я правильно понимаю что внутри CPU под крышкой есть сенсор и вот его мне и надо определить и прописать для него смешения +/- в конфиге. :blush:
Спасибо сказали:

Аватара пользователя
yoricI
Сообщения: 1111
ОС: gentoo fluxbox

Re: Температура CPU

Сообщение yoricI »

lone_wolf писал:
01.09.2018 09:58
Я же сказал что сервак старенький, и там нету IPMI.
Я видел IPMI на двухпроцессорной плате с третьими пнями, лет так 10 назад. А выпуска она была лет 20 назад.
Спасибо сказали:

Аватара пользователя
Hephaestus
Сообщения: 3077
Статус: Многоуважаемый джинн...
ОС: Slackware64-14.1/14.2

Re: Температура CPU

Сообщение Hephaestus »

lone_wolf писал:
01.09.2018 10:29
Кстати извиняюсь за тупой вопрос но с какого датчика lm_sensors берет данные о температуре CPU?
Здесь нужно различать две вещи: собственно датчики (как железо) и данные, отображаемые программой.
Программа не берет данные непосредственно с датчиков.

Что касается самих датчиков - возможны варианты.
Опять-таки посмотрите на цифирки, которые я приводил выше.
В двух строках указано sensors=termistor, в одной sensor= Intel PECI (при том, что процессор у меня AMD :))

А что касается того, откуда lm_sensors черпает информацию, то черпает она информацию из /proc, если не ошибаюсь. В свою очередь в /proc данные попадают посредством ядра и его модулей.
А модули взаимодействуют вот с этим самым чипом, о котором я говорил выше.
Поэтому напрямую с датчиками прикладные программы не взаимодействуют.
Если я где-то ошибся, думаю, собратья по форуму меня поправят.

В моем случае это чип iTE Super I/O и, соответственно, модуль it87. Так уж получилось, что на всех моих железках именно эти чипы (в конфигах lm_sensors с этими чипами дело обстоит не очень хорошо). Когда я этим интересовался, упоминались ещё чипы Winbond, кажется, но таких мне вживую не попадалось.

Чип, кстати, довольно недвусмысленно обозначен в мануале на материнскую плату: на функциональной схеме материнской платы, а также в спецификации.
А в моем случае ещё и в BIOS можно видеть упоминание об этом чипе (предъявляется как Super I/O Chip: IT8620).

sensors-detect в принципе должен его опознать и предложить загрузку соответствующего модуля.
В крайнем случае (если уж не определяется), можно заглянуть в корпус и лично познакомиться с этим чипом, (если конечно, он не закрыт каким-нибудь радиатором), а потом озаботиться наличием и загрузкой соотвествующего модуля, но скорее всего до этого не дойдет.
Пускай скрипят мои конечности.
Я - повелитель бесконечности...
Мой блог
Спасибо сказали:

Аватара пользователя
Hephaestus
Сообщения: 3077
Статус: Многоуважаемый джинн...
ОС: Slackware64-14.1/14.2

Re: Температура CPU

Сообщение Hephaestus »

lone_wolf писал:
01.09.2018 10:29
Кстати офсайт www.lm-sensors.org с примерами конфигов у меня не пашет
Да помер он. Проект переехал на https://github.com/groeck/lm-sensors
А примеры конфигов ищите теперь за тридевять земель, в тридесятом царстве, у Кащея Бессмерт...
ой, о чем это я?
На http://web.archive.org/web/20150901092438/http://www.lm-sensors.org:80/wiki/Configurations
короче говоря.
Пускай скрипят мои конечности.
Я - повелитель бесконечности...
Мой блог
Спасибо сказали:

Аватара пользователя
lone_wolf
Сообщения: 204

Re: Температура CPU

Сообщение lone_wolf »

yoricI писал:
01.09.2018 12:18
Я видел IPMI на двухпроцессорной плате с третьими пнями, лет так 10 назад. А выпуска она была лет 20 назад.
Я понимаю, но у меня его нету :( Либо я окончательно ослеп.
Спасибо сказали:

Аватара пользователя
lone_wolf
Сообщения: 204

Re: Температура CPU

Сообщение lone_wolf »

Hephaestus Спасибо, в принципе понял.
Спасибо сказали: