Температура CPU
Модератор: Модераторы разделов
Температура CPU
Всем привет!
Есть старенький сервер Intel S5000VSA c 2-я CPU Xeon 5130. Смотрю температуру 3 программами CPUID HWMonitor, AIDA64 и Linux утилитой lm_sendors.
Все три показывают разную температуру. И какой из них верить?
На ark.intel.com смотрю максимальная температура Tcase равна 65 градусам. Но при этом в HWMonitor видел температуру 67 градусов, и при этом светодиод на корпусе сигнализирующий о проблемах не загорался оранжевым и в логах ошибок в bios тоже не каких ошибок не увидел.
Есть старенький сервер Intel S5000VSA c 2-я CPU Xeon 5130. Смотрю температуру 3 программами CPUID HWMonitor, AIDA64 и Linux утилитой lm_sendors.
Все три показывают разную температуру. И какой из них верить?
На ark.intel.com смотрю максимальная температура Tcase равна 65 градусам. Но при этом в HWMonitor видел температуру 67 градусов, и при этом светодиод на корпусе сигнализирующий о проблемах не загорался оранжевым и в логах ошибок в bios тоже не каких ошибок не увидел.
- Hephaestus
- Сообщения: 3729
- Статус: Многоуважаемый джинн...
- ОС: Slackware64-14.1/14.2
- Контактная информация:
Re: Температура CPU
Насчет CPUID HWMonitor и AIDA64 ничего не скажу,
а lm_sensors имеет в конфиге кучу корректировочных формул и коэффициентов.
Чтобы иметь более-менее достоверные показания, имеет смысл идентифицировать чип, который используется в данной системе и смотреть на сайте lm_sensors рекомендации/формулы/коэффициенты (а может и готовые конфиги), относящиеся к этому чипу (если они есть конечно).
Кроме того, для десктопа (как для сервера не знаю) есть вариант смотреть показатели в BIOS и сравнивать их с теми, какие выдает lm_sensors. На их сайте мне даже попадались методики выведения формул, на основе этих сравнений.
За свою систему могу сказать, что у меня в настройках BIOS выставлен уровень температуры, выше которого оно будет орать и сигналить (70 градусов), и именно эта цифра отображается в выводе lm_sensorsс одной стороны, это косвенно позволяет определить, какой из показателей относится к процессору, с другой - свидетельствует о том, что между показателями в BIOS и показателями lm_sensors всё же есть некая связь.
Но в целом, lm_sensors без должного конфига, да ещё без загрузки нужных модулей ядра, либо не показывает вообще почти ничего, либо показывает всякую ерунду.
Не исключено, что другие инструменты (в Вашем случае это CPUID HWMonitor и AIDA64) ведут себя схожим образом, то есть тоже могут показывать ерунду. Только вот корректировать их сложнее, в силу закрытости, если вообще возможно. В этом смысле показания в BIOS самые достоверные, так как производители знают особенности чипа и все необходимые поправочные коэффициенты к "сырым данным" там уже применены.
а lm_sensors имеет в конфиге кучу корректировочных формул и коэффициентов.
Чтобы иметь более-менее достоверные показания, имеет смысл идентифицировать чип, который используется в данной системе и смотреть на сайте lm_sensors рекомендации/формулы/коэффициенты (а может и готовые конфиги), относящиеся к этому чипу (если они есть конечно).
Кроме того, для десктопа (как для сервера не знаю) есть вариант смотреть показатели в BIOS и сравнивать их с теми, какие выдает lm_sensors. На их сайте мне даже попадались методики выведения формул, на основе этих сравнений.
За свою систему могу сказать, что у меня в настройках BIOS выставлен уровень температуры, выше которого оно будет орать и сигналить (70 градусов), и именно эта цифра отображается в выводе lm_sensors
Shell
temp1: +30.0°C (low = +127.0°C, high = +127.0°C) sensor = thermistor
temp2: -8.0°C (low = +127.0°C, high = +127.0°C) sensor = thermistor
temp3: +13.0°C (low = +0.0°C, high = +70.0°C) sensor = Intel PECI
Но в целом, lm_sensors без должного конфига, да ещё без загрузки нужных модулей ядра, либо не показывает вообще почти ничего, либо показывает всякую ерунду.
Не исключено, что другие инструменты (в Вашем случае это CPUID HWMonitor и AIDA64) ведут себя схожим образом, то есть тоже могут показывать ерунду. Только вот корректировать их сложнее, в силу закрытости, если вообще возможно. В этом смысле показания в BIOS самые достоверные, так как производители знают особенности чипа и все необходимые поправочные коэффициенты к "сырым данным" там уже применены.
Re: Температура CPU
Да вот что странно в BIOS нету пункта с температурой. Хотя это же настоящая породистая интеловая мать, это вообще полностью интеловый сервер.
Hephaestus Спасибо за информацию посмотрю и вправду на офсайте данные по чипу, может повезет.
Hephaestus Спасибо за информацию посмотрю и вправду на офсайте данные по чипу, может повезет.
Re: Температура CPU
Поищите про "IPMI".
- Hephaestus
- Сообщения: 3729
- Статус: Многоуважаемый джинн...
- ОС: Slackware64-14.1/14.2
- Контактная информация:
Re: Температура CPU
lone_wolf
Кстати, Вы обратили внимание на цифры, которые я привел в предыдущем посте?
Строка, отображающая температуру процессора, показывает 13 градусов по цельсию.
Это вот как раз пример того, как могут выглядеть показатели в отсутствие должных настроек.
При этом температура в BIOS (это значит практически без нагрузки) составляет 38-39-40 градусов.
И тогда уж при загруженной системе (то есть уже с некоторой нагрузкой) температура никак не может быть ниже отображаемой в BIOS. Тем более, 13 градусов. Понятно же, что это ерунда.
Да, действительно, lm_sensors я не настраивал.
С переездом на другое железо, старые настройки потеряли актуальность, а новых я как-то не создал.
В готовом виде их не нашлось, а самому ковырять лень. Да у меня и модуль ядра соответствующий не загружен.
Я иногда даю процессору какую-нибудь ощутимую задачу (типа кодирования видео), вот тогда имеет смысл следить за температурой. Тогда я вручную подгружаю нужный модуль, смотрю показатели.
Кстати, я заметил, что чем выше температура процессора, тем ближе к правде показания ненастроенного lm_sensors. Оно может показать 13 градусов в спокойном состоянии, но под нагрузкой показывает 50-56-60-65-67 градусов, что уже похоже на правду. А если доходит до 70 градусов (было такое со старым кулером), начинает пищать. Пищит-то оно на уровне BIOS (в соответствии с настройками BIOS), а цифирки показывает на уровне lm_sensors. То есть, в этот момент у них полное согласие.
Кстати, Вы обратили внимание на цифры, которые я привел в предыдущем посте?
Строка, отображающая температуру процессора, показывает 13 градусов по цельсию.
Это вот как раз пример того, как могут выглядеть показатели в отсутствие должных настроек.
При этом температура в BIOS (это значит практически без нагрузки) составляет 38-39-40 градусов.
И тогда уж при загруженной системе (то есть уже с некоторой нагрузкой) температура никак не может быть ниже отображаемой в BIOS. Тем более, 13 градусов. Понятно же, что это ерунда.
Да, действительно, lm_sensors я не настраивал.
С переездом на другое железо, старые настройки потеряли актуальность, а новых я как-то не создал.
В готовом виде их не нашлось, а самому ковырять лень. Да у меня и модуль ядра соответствующий не загружен.
Я иногда даю процессору какую-нибудь ощутимую задачу (типа кодирования видео), вот тогда имеет смысл следить за температурой. Тогда я вручную подгружаю нужный модуль, смотрю показатели.
Кстати, я заметил, что чем выше температура процессора, тем ближе к правде показания ненастроенного lm_sensors. Оно может показать 13 градусов в спокойном состоянии, но под нагрузкой показывает 50-56-60-65-67 градусов, что уже похоже на правду. А если доходит до 70 градусов (было такое со старым кулером), начинает пищать. Пищит-то оно на уровне BIOS (в соответствии с настройками BIOS), а цифирки показывает на уровне lm_sensors. То есть, в этот момент у них полное согласие.
Спасибо сказали:
Re: Температура CPU
Но кстати да надо почитать про IPMI
Как доберусь до работы и серверной попробую сконфигурировать lm_sensors
Как доберусь до работы и серверной попробую сконфигурировать lm_sensors
Re: Температура CPU
Кстати офсайт www.lm-sensors.org с примерами конфигов у меня не пашет
Надо будет sensors-detect выполнить есче, ибо я сейчас данные брал с LiveCD.
Кстати извиняюсь за тупой вопрос но с какого датчика lm_sensors берет данные о температуре CPU? Я правильно понимаю что внутри CPU под крышкой есть сенсор и вот его мне и надо определить и прописать для него смешения +/- в конфиге.
Надо будет sensors-detect выполнить есче, ибо я сейчас данные брал с LiveCD.
Кстати извиняюсь за тупой вопрос но с какого датчика lm_sensors берет данные о температуре CPU? Я правильно понимаю что внутри CPU под крышкой есть сенсор и вот его мне и надо определить и прописать для него смешения +/- в конфиге.
- Hephaestus
- Сообщения: 3729
- Статус: Многоуважаемый джинн...
- ОС: Slackware64-14.1/14.2
- Контактная информация:
Re: Температура CPU
Здесь нужно различать две вещи: собственно датчики (как железо) и данные, отображаемые программой.
Программа не берет данные непосредственно с датчиков.
Что касается самих датчиков - возможны варианты.
Опять-таки посмотрите на цифирки, которые я приводил выше.
В двух строках указано sensors=termistor, в одной sensor= Intel PECI (при том, что процессор у меня AMD )
А что касается того, откуда lm_sensors черпает информацию, то черпает она информацию из /proc, если не ошибаюсь. В свою очередь в /proc данные попадают посредством ядра и его модулей.
А модули взаимодействуют вот с этим самым чипом, о котором я говорил выше.
Поэтому напрямую с датчиками прикладные программы не взаимодействуют.
Если я где-то ошибся, думаю, собратья по форуму меня поправят.
В моем случае это чип iTE Super I/O и, соответственно, модуль it87. Так уж получилось, что на всех моих железках именно эти чипы (в конфигах lm_sensors с этими чипами дело обстоит не очень хорошо). Когда я этим интересовался, упоминались ещё чипы Winbond, кажется, но таких мне вживую не попадалось.
Чип, кстати, довольно недвусмысленно обозначен в мануале на материнскую плату: на функциональной схеме материнской платы, а также в спецификации.
А в моем случае ещё и в BIOS можно видеть упоминание об этом чипе (предъявляется как Super I/O Chip: IT8620).
sensors-detect в принципе должен его опознать и предложить загрузку соответствующего модуля.
В крайнем случае (если уж не определяется), можно заглянуть в корпус и лично познакомиться с этим чипом, (если конечно, он не закрыт каким-нибудь радиатором), а потом озаботиться наличием и загрузкой соотвествующего модуля, но скорее всего до этого не дойдет.
Спасибо сказали:
- Hephaestus
- Сообщения: 3729
- Статус: Многоуважаемый джинн...
- ОС: Slackware64-14.1/14.2
- Контактная информация:
Re: Температура CPU
Да помер он. Проект переехал на https://github.com/groeck/lm-sensorslone_wolf писал: ↑01.09.2018 10:29Кстати офсайт www.lm-sensors.org с примерами конфигов у меня не пашет
А примеры конфигов ищите теперь за тридевять земель, в тридесятом царстве, у Кащея Бессмерт...
ой, о чем это я?
На http://web.archive.org/web/20150901092438/http://www.lm-sensors.org:80/wiki/Configurations
короче говоря.
Спасибо сказали:
Re: Температура CPU
Hephaestus Спасибо, в принципе понял.