Если бы...
От использования nx-овых шар в конторе месяц назад пришлось отказаться. Причина - такая шара в филиале с успехом валит центральный офис заодно со всеми остальными филиалами.
Причем отслеживание деталей падения проблематично (уволить-то не уволят, но репутационный ущерб обеспечен).
Сначала подключается филиал, в логах проскакивает
Код: Выделить всё
Mar 9 12:01:43 decsrv kernel: CIFS VFS: Error connecting to IPv4 socket. Aborting operation
Mar 9 12:01:43 decsrv kernel: CIFS VFS: cifs_mount failed w/return code = -111
Здесь подключается но без шары, естественно. Затем он еще пару раз отключается-подключается (suspend/restore) с нормальными логами freenx, но неизвестно, использует ли шару.
Далее филиал отключается, в логах freenx шару отключает с 14 (!) раза:
Код: Выделить всё
09.03 12:43:05: node_umount_smb (14041): Umounting "/home/nahim/Documents/Remote". Remain 30 attempts
09.03 12:43:12: node_umount_smb (14041): Umounting "/home/nahim/Documents/Remote" with '-f
...
09.03 12:43:47: node_umount_smb (14041): Umounting "/home/nahim/Documents/Remote". Remain 16 attempts
09.03 12:43:47: node_umount_smb (14041): Umounting "/home/nahim/Documents/Remote" with '-f'
09.03 12:43:48: node_umount_smb (14041): Mountpoint "/home/nahim/Documents/Remote" umounted
Пара suspend+restore, еще туда-сюда-обратно и:
Код: Выделить всё
09.03 18:18:36: node_umount_smb (19562): Umounting "/home/nahim/Documents/Remote". Remain 1 attempts
Шару отмонтировать не вышло, армагедец уже близко.
Следующим днем в локальной сетке с самбой начинают твориться чудеса.
Код: Выделить всё
Mar 10 15:27:34 decsrv smbd[24978]: [2011/03/10 15:27:34, 0] smbd/notify_inotify.c:inotify_handler(240)
Mar 10 15:27:34 decsrv smbd[24978]: No data on inotify fd?!
Mar 10 15:27:35 decsrv smbd[24978]: [2011/03/10 15:27:34, 0] smbd/notify_inotify.c:inotify_handler(240)
Mar 10 15:27:35 decsrv smbd[24978]: No data on inotify fd?!
Mar 10 15:27:35 decsrv smbd[24978]: [2011/03/10 15:27:34, 0] smbd/notify_inotify.c:inotify_handler(240)
Не читается и не пишется. Пингуется с секундными таймингами, кое-как по цепляется ssh, в top имеется отжирающий 100% вчерашний nxagent, но т.к. камней там четыре штуки, можно сделать вывод, что виноват охреневший IO.
В оконцовке вовремя не сделанный reboot -nf вынуждает к отправке менеджера по кнопку питания сервера.
На тестовом сервере воспроизвести не удалось - нужно где-то взять десяток smb-пользователей. Дальнейшие эксперименты на рабочем признаны вредными, т.к. роняется не только оный сервер, а еще и авторитет. Ему больно.
Осторожная попытка общения мылом с разработчиком этеркифса к результатам не привела (нэ ответил).
Багу заводить не стал - мутновато по логам. Даже если там все в едином порыве бросятся воспроизводить, вряд ли это выйдет.
Ех, и гиде ж ты, верный невъядренный smbmount?
Опять пичаль.