Неизвестная проблема с сетью (alx_interrupt: TX/RX over flow)

Обсуждение настройки и работы сервисов, резервирования, сетевых настроек и вопросов безопасности ОС.

Модераторы: SLEDopit, Модераторы разделов

TonnyBennet
Сообщения: 230
ОС: Ubuntu Server 9.10

Неизвестная проблема с сетью

Сообщение TonnyBennet »

Здравствуйте.

Есть сервер телефонии на базе Asterisk c OC Centos. Внезапно отвалился от сети. Пришёл в серверную, на экране сыпятся ошибки сетевого интерфейса.

Код:

Feb 7 15:53:27 pbx kernel: alx: eth0: alx_interrupt: TX/RX over flow (status = 0x10). Feb 7 15:53:27 pbx last message repeated 135 times Feb 7 15:53:29 pbx kernel: alx: eth0: alx_interrupt: TX/RX over flow (status = 0x8). Feb 7 15:54:00 pbx last message repeated 781 times Feb 7 15:55:01 pbx last message repeated 1996 times Feb 7 15:56:02 pbx last message repeated 1925 times Feb 7 15:57:03 pbx last message repeated 1789 times Feb 7 15:58:04 pbx last message repeated 1815 times Feb 7 15:58:47 pbx last message repeated 1285 times Feb 7 15:58:47 pbx kernel: alx_hw: alf_setup_phy_link: speed = 0x2f, autoneg = 1 ... Feb 7 16:00:42 pbx kernel: alx: eth0: alx_interrupt: TX/RX over flow (status = 0x8). Feb 7 16:00:56 pbx last message repeated 480 times Feb 7 16:00:56 pbx kernel: alx_hw: alf_setup_phy_link: speed = 0x2f, autoneg = 1 Feb 7 16:01:17 pbx shutdown[2436]: shutting down for system reboot


После перезагрузки ошибки пропали. Можете помочь выяснить в чём была/есть/таится проблема?
Спасибо сказали:
Аватара пользователя
drBatty
Сообщения: 8735
Статус: GPG ID: 4DFBD1D6 дом горит, козёл не видит...
ОС: Slackware-current

Re: Неизвестная проблема с сетью

Сообщение drBatty »

переполнение счётчика. Вот нагуглил: https://bugzilla.redhat.com/show_bug.cgi?id=928220
http://emulek.blogspot.ru/ Windows Must Die
Учебник по sed зеркало в github

Скоро придёт
Осень
Спасибо сказали:
ИзБывших
Сообщения: 4
ОС: win / SL / Ubuntu

Re: Неизвестная проблема с сетью

Сообщение ИзБывших »

У меня похожая проблема началась с выходом ядра 2.6.32-431.
Ошибок в логах не вижу. Пока сижу на предыдущемя ядре.
Спасибо сказали:
TonnyBennet
Сообщения: 230
ОС: Ubuntu Server 9.10

Re: Неизвестная проблема с сетью

Сообщение TonnyBennet »

ИзБывших писал(а):
08.02.2014 21:55
У меня похожая проблема началась с выходом ядра 2.6.32-431.
Ошибок в логах не вижу. Пока сижу на предыдущемя ядре.


У меня такое:

Код:

~# uname -a Linux pbx.mydomain.ru 2.6.18-348.1.1.el5 #1 SMP Tue Jan 22 16:24:03 EST 2013 i686 i686 i386 GNU/Linux


Я так понимаю это и есть предыдущее ядро.

drBatty писал(а):
08.02.2014 11:47
переполнение счётчика. Вот нагуглил: https://bugzilla.redhat.com/show_bug.cgi?id=928220


Перечитал всё описание, в 83-м комментарии. Предлагаю поставить более старый драйвер. Попробую - отпишусь.
Спасибо сказали:
TonnyBennet
Сообщения: 230
ОС: Ubuntu Server 9.10

Re: Неизвестная проблема с сетью

Сообщение TonnyBennet »

Увы, версия ядра не та...

Код:

# wget https://www.kernel.org/pub/linux/kernel/pro...-12-19-u.tar.gz --2014-02-10 09:28:17-- https://www.kernel.org/pub/linux/kernel/pro...-12-19-u.tar.gz Распознаётся www.kernel.org... 198.145.20.140, 199.204.44.194, 149.20.4.69 Устанавливается соединение с www.kernel.org|198.145.20.140|:443... соединение установлено. Запрос HTTP послан, ожидается ответ... 200 OK Длина: 8459872 (8,1M) [application/x-gzip] Сохраняется в каталог: `compat-drivers-2012-12-19-u.tar.gz'. 100%[=============================================================================== ===========================>] 8 459 872 522K/s в 17s 2014-02-10 09:28:36 (494 KB/s) - `compat-drivers-2012-12-19-u.tar.gz' сохранён [8459872/8459872] # ./scripts/driver-select atl1c Processing new driver-select request... Backing up makefile: Makefile.bk Backup exists: Makefile.bk Backing up makefile: drivers/net/ethernet/broadcom/Makefile.bk Backing up makefile: drivers/net/ethernet/atheros/Makefile.bk Backup exists: Makefile.bk Backup exists: Makefile.bk Backup exists: drivers/net/ethernet/broadcom/Makefile.bk # make make -C /lib/modules/2.6.18-348.1.1.el5/build M=/root/compat-drivers-2012-12-19-u modules make[1]: Entering directory `/usr/src/kernels/2.6.18-348.1.1.el5-i686' /root/compat-drivers-2012-12-19-u/config.mk:21: *** "ERROR: compat-drivers by default supports kernels >= 2.6.24, try enabling only one driver though". Останов. make[1]: *** [_module_/root/compat-drivers-2012-12-19-u] Ошибка 2 make[1]: Leaving directory `/usr/src/kernels/2.6.18-348.1.1.el5-i686' make: *** [modules] Ошибка 2


Как найти старый драйвер для моего ядра?
Спасибо сказали:
Аватара пользователя
drBatty
Сообщения: 8735
Статус: GPG ID: 4DFBD1D6 дом горит, козёл не видит...
ОС: Slackware-current

Re: Неизвестная проблема с сетью

Сообщение drBatty »

TonnyBennet
ИМХО рискну предложить костыль: попробовать сбросить счётчики. Не пробовали копать в этом направлении?



TonnyBennet писал(а):
10.02.2014 09:32
Как найти старый драйвер для моего ядра?

это на сервере RH искать надо. Драйвера из обычных ядер скорее всего не подойдут даже нужной версии. Возможно драйвера и не существует, да.
http://emulek.blogspot.ru/ Windows Must Die
Учебник по sed зеркало в github

Скоро придёт
Осень
Спасибо сказали:
TonnyBennet
Сообщения: 230
ОС: Ubuntu Server 9.10

Re: Неизвестная проблема с сетью

Сообщение TonnyBennet »

drBatty писал(а):
10.02.2014 09:40
TonnyBennet
ИМХО рискну предложить костыль: попробовать сбросить счётчики. Не пробовали копать в этом направлении?


Стыдно, но я даже не представляю о каких счётчиках идёт речь :blush: . Можете пояснить?


drBatty писал(а):
10.02.2014 09:40
это на сервере RH искать надо. Драйвера из обычных ядер скорее всего не подойдут даже нужной версии. Возможно драйвера и не существует, да.


Сразу напрашивается несколько вопросов:
- почему система отработала нормально несколько недель?
- как она работает сейчас если нет драйвера?
- имеет ли смысл воткнуть другую сетевую карту на которую точно есть работоспособные драйверы (какую модель взять?)?
Спасибо сказали:
TonnyBennet
Сообщения: 230
ОС: Ubuntu Server 9.10

Re: Неизвестная проблема с сетью

Сообщение TonnyBennet »

Вспомнилось мне, что на подобных материнках у меня в принципе не поднимались сетевые интерфейсы.

Нашёл у себя в загашниках ссылку на форум где всё обсуждалось.

https://www.centos.org/forums/viewtopic.php?t=7495

Поставил этот драйвер. Мониторю работоспособность системы.
Спасибо сказали:
Аватара пользователя
drBatty
Сообщения: 8735
Статус: GPG ID: 4DFBD1D6 дом горит, козёл не видит...
ОС: Slackware-current

Re: Неизвестная проблема с сетью

Сообщение drBatty »

TonnyBennet писал(а):
10.02.2014 09:51
не представляю о каких счётчиках идёт речь

ну там(в драйвере AFAIK, или может в самой железке) есть счётчики, один считает то что вышло, второй то, что вошло. По большому счёту они не нужны(ну я не слышал, что-бы их кто-то использовал. Может я и не прав конечно). Можно нагуглить документацию к драйверу, и посмотреть: можно-ли сбрасывать. Если "да, можно", и если они действительно не нужны, то нужно просто сбрасывать скажем 1 раз в сутки.
TonnyBennet писал(а):
10.02.2014 09:51
- почему система отработала нормально несколько недель?

счётчик == некая ячейка памяти в N бит. Например в 32 бита. Потому там всего 4294967296 значений. Как только к 4294967295 прибавляется 1, получается 0. Это == ошибка (т.к. некая программа может отслеживать это значение, и она(программа) от этого поломается).
TonnyBennet писал(а):
10.02.2014 09:51
- как она работает сейчас если нет драйвера?

есть драйвер. Только не тот, что нужен, а с багом/фичей.
TonnyBennet писал(а):
10.02.2014 09:51
- имеет ли смысл воткнуть другую сетевую карту на которую точно есть работоспособные драйверы (какую модель взять?)?

имеет. Потому что AFAIK данная "ошибка" обычно игнорируется, счётчик просто скидывается в 0, и самое страшное -- лишняя строчка в логе, о том, что случилось переполнение.
http://emulek.blogspot.ru/ Windows Must Die
Учебник по sed зеркало в github

Скоро придёт
Осень
Спасибо сказали:
TonnyBennet
Сообщения: 230
ОС: Ubuntu Server 9.10

Re: Неизвестная проблема с сетью

Сообщение TonnyBennet »

drBatty писал(а):
10.02.2014 10:33
TonnyBennet писал(а):
10.02.2014 09:51
- имеет ли смысл воткнуть другую сетевую карту на которую точно есть работоспособные драйверы (какую модель взять?)?

имеет. Потому что AFAIK данная "ошибка" обычно игнорируется, счётчик просто скидывается в 0, и самое страшное -- лишняя строчка в логе, о том, что случилось переполнение.


Как оказалось, самое страшное это неработоспособный сетевой интерфейс.

Вчера в, 10:00 примерно, закончил работу по переустановке драйвера. К 20:00 начались сыпаться ошибки... Сегодня в 9:00 снова перезапустил систему. Думаю прикупить другую сетевую и не ломать голову.

Код:

Feb 10 09:59:50 pbx kernel: dahdi: Version: 2.6.1 Feb 10 09:59:50 pbx kernel: rxt1: no version for "dahdi_hdlc_putbuf" found: kernel tainted. Feb 10 09:59:55 pbx ntpd[2698]: ntpd 4.2.2p1@1.1570-o Fri Nov 18 13:21:16 UTC 2011 (1) Feb 10 09:59:55 pbx ntpd[2699]: precision = 1.000 usec Feb 10 09:59:55 pbx ntpd[2699]: Listening on interface wildcard, 0.0.0.0#123 Disabled Feb 10 09:59:55 pbx ntpd[2699]: Listening on interface lo, 127.0.0.1#123 Enabled Feb 10 09:59:55 pbx ntpd[2699]: Listening on interface eth0, 192.168.0.4#123 Enabled Feb 10 09:59:55 pbx ntpd[2699]: kernel time sync status 0040 Feb 10 09:59:55 pbx ntpd[2699]: getaddrinfo: "::1" invalid host address, ignored Feb 10 09:59:56 pbx ntpd[2699]: frequency initialized 57.258 PPM from /var/lib/ntp/drift Feb 10 09:59:56 pbx xinetd[2683]: xinetd Version 2.3.14 started with libwrap loadavg labeled-networking options compiled in. Feb 10 09:59:56 pbx xinetd[2683]: Started working: 1 available service Feb 10 10:00:06 pbx saslauthd[3230]: detach_tty : master pid is: 3230 Feb 10 10:00:06 pbx saslauthd[3230]: ipc_init : listening on socket: /var/run/saslauthd/mux Feb 10 10:03:15 pbx ntpd[2699]: synchronized to LOCAL(0), stratum 10 Feb 10 10:03:15 pbx ntpd[2699]: kernel time sync enabled 0001 Feb 10 10:04:18 pbx ntpd[2699]: synchronized to 188.128.19.66, stratum 2 Feb 10 10:25:43 pbx ntpd[2699]: time reset -0.265948 s Feb 10 10:25:43 pbx kernel: dahdi: Detected time shift. Feb 10 10:29:04 pbx ntpd[2699]: synchronized to LOCAL(0), stratum 10 Feb 10 10:31:11 pbx ntpd[2699]: synchronized to 188.128.19.66, stratum 2 Feb 10 19:55:06 pbx kernel: alx: eth0: alx_interrupt: TX/RX over flow (status = 0x10). Feb 10 19:55:06 pbx last message repeated 7345 times Feb 10 19:55:15 pbx kernel: alx: eth0: alx_interrupt: TX/RX over flow (status = 0x8). Feb 10 19:55:46 pbx last message repeated 811 times Feb 10 19:56:47 pbx last message repeated 1467 times Feb 10 19:57:48 pbx last message repeated 1440 times Feb 10 19:58:49 pbx last message repeated 1348 times

Спасибо сказали:
Аватара пользователя
drBatty
Сообщения: 8735
Статус: GPG ID: 4DFBD1D6 дом горит, козёл не видит...
ОС: Slackware-current

Re: Неизвестная проблема с сетью

Сообщение drBatty »

TonnyBennet писал(а):
11.02.2014 11:58
Как оказалось, самое страшное это неработоспособный сетевой интерфейс.

да.
TonnyBennet писал(а):
11.02.2014 11:58
Думаю прикупить другую сетевую и не ломать голову.

ага. А перед покупкой погуглите sucess story для вашшего ядра/дистра (в CentOS AFAIK ядро пропатченое)
http://emulek.blogspot.ru/ Windows Must Die
Учебник по sed зеркало в github

Скоро придёт
Осень
Спасибо сказали:
TonnyBennet
Сообщения: 230
ОС: Ubuntu Server 9.10

Re: Неизвестная проблема с сетью

Сообщение TonnyBennet »

Вот уже несколько недель ничего не отключалось. Непонятно.
Спасибо сказали: