Напишу свои действия, если я была не права и шла не в том направлении - скажите об этом,пжл.
В журнале сообщений messages я нашла проблемное место, самая первая строчка
Jun 20 06:11:56 linux-gjkq kernel: [78226.129248] Xorg invoked oom-killer: gfp_mask=0x200d4, order=0, oom_adj=0
Практически в это время и начинается падение виртуальных серверов
[2012-06-20 06:11:56 3455] WARNING (image:562) domain podpiska: device model failure: pid 3593: malfunctioning (closed sentinel), killed; see /var/log/xen/qemu-dm-podpiska.log
[2012-06-20 06:11:56 3455] WARNING (XendDomainInfo:2108) Domain has crashed: name=podpiska id=1.
[2012-06-20 06:11:56 3455] DEBUG (XendDomainInfo:3121) XendDomainInfo.destroy: domid=1
[2012-06-20 06:11:56 3455] WARNING (image:562) domain Server_Lotus: device model failure: pid 3815: malfunctioning (closed sentinel), killed; see /var/log/xen/qemu-dm-Server_Lotus.log
[2012-06-20 06:11:56 3455] DEBUG (XendDomainInfo:1840) Storing domain details: {'console/port': '3', 'description': 'None', 'console/limit': '1048576', 'store/port': '2', 'vm': '/vm/5754800c-4ad4-01ad-2be3-6c4c2dea0e1a', 'domid': '1', 'image/suspend-cancel': '1', 'cpu/0/availability': 'online', 'memory/target': '1048576', 'control/platform-feature-multiprocessor-suspend': '1', 'store/ring-ref': '1044476', 'console/type': 'ioemu', 'name': 'podpiska'}
[2012-06-20 06:11:57 3455] DEBUG (XendDomainInfo:2452) Destroying device model
[2012-06-20 06:11:57 3455] WARNING (XendDomainInfo:2108) Domain has crashed: name=Server_Lotus id=2.
[2012-06-20 06:11:57 3455] DEBUG (XendDomainInfo:3121) XendDomainInfo.destroy: domid=2
[2012-06-20 06:11:57 3455] DEBUG (XendDomainInfo:2459) Releasing devices
[2012-06-20 06:11:57 3455] DEBUG (XendDomainInfo:2465) Removing vif/0
[2012-06-20 06:11:57 3455] DEBUG (XendDomainInfo:1294) XendDomainInfo.destroyDevice: deviceClass = vif, device = vif/0
[2012-06-20 06:11:57 3455] WARNING (XendDomainInfo:2108) Domain has crashed: name=Server_Lotus id=2.
[2012-06-20 06:11:57 3455] DEBUG (XendDomainInfo:2465) Removing console/0
[2012-06-20 06:11:57 3455] DEBUG (XendDomainInfo:1294) XendDomainInfo.destroyDevice: deviceClass = console, device = console/0
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:2465) Removing vbd/768
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:1294) XendDomainInfo.destroyDevice: deviceClass = vbd, device = vbd/768
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:2452) Destroying device model
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:2465) Removing vbd/832
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:1294) XendDomainInfo.destroyDevice: deviceClass = vbd, device = vbd/832
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:2465) Removing vfb/0
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:1294) XendDomainInfo.destroyDevice: deviceClass = vfb, device = vfb/0
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:2459) Releasing devices
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:2465) Removing vif/0
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:1294) XendDomainInfo.destroyDevice: deviceClass = vif, device = vif/0
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:2465) Removing vkbd/0
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:1294) XendDomainInfo.destroyDevice: deviceClass = vkbd, device = vkbd/0
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:2465) Removing console/0
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:1294) XendDomainInfo.destroyDevice: deviceClass = console, device = console/0
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:2465) Removing vbd/768
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:1294) XendDomainInfo.destroyDevice: deviceClass = vbd, device = vbd/768
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:2465) Removing vbd/832
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:1294) XendDomainInfo.destroyDevice: deviceClass = vbd, device = vbd/832
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:2465) Removing vfb/0
[2012-06-20 06:11:58 3455] DEBUG (XendDomainInfo:1294) XendDomainInfo.destroyDevice: deviceClass = vfb, device = vfb/0
[2012-06-20 06:17:17 3455] WARNING (image:562) domain Informix_dir: device model failure: pid 3995: died due to signal 9; see /var/log/xen/qemu-dm-Informix_dir.log
[2012-06-20 06:17:17 3455] WARNING (XendDomainInfo:2108) Domain has crashed: name=Informix_dir id=3.
[2012-06-20 06:17:17 3455] DEBUG (XendDomainInfo:3121) XendDomainInfo.destroy: domid=3
[2012-06-20 06:17:17 3450] CRITICAL (SrvDaemon:232) Xend died due to signal 9! Restarting it.
[2012-06-20 06:17:17 17934] INFO (SrvDaemon:332) Xend Daemon started
[2012-06-20 06:17:17 3450] CRITICAL (SrvDaemon:232) Xend died due to signal 9! Restarting it.
[2012-06-20 06:17:17 3450] CRITICAL (SrvDaemon:232) Xend died due to signal 9! Restarting it.
Перед этим я запустила скрит с "фотографией" top
Значения top на время 6.11 в файле top_log.txt
Да,я вижу, что процессы 3593,3815 кушают много памяти, и oom-killer их судя по всему и прибивает.
Что мне нужно делать, чтобы никто никого не прибивал (в том числе и меня мои пользователи)? Каждое утро начинается с перезагрузки...
