Дедупликация данных (Linux)
Модератор: Модераторы разделов
-
BratSinot
- Сообщения: 812
- ОС: Slackware64
Дедупликация данных
Доброго времени суток!
Вообщем вопрос насчет файловых систем с дедупликацией данных в Linux (ZFS и прочие костыли не предлагать) или чего-то, что применимо к существующим файловым системам.
И да, желательно чтобы эту ФС можно было использовать в корне.
Вообщем вопрос насчет файловых систем с дедупликацией данных в Linux (ZFS и прочие костыли не предлагать) или чего-то, что применимо к существующим файловым системам.
И да, желательно чтобы эту ФС можно было использовать в корне.
-
SinClaus
- Сообщения: 1952
- Статус: Мучитель Мандривы
- ОС: Arch,BSD
Re: Дедупликация данных
Что бы этот вопрос не задать Гуглю? Или даже Вики. А оттуда ссылка вот сюда.
-
BratSinot
- Сообщения: 812
- ОС: Slackware64
-
Ленивая Бестолочь
- Бывший модератор
- Сообщения: 2760
- ОС: Debian; gentoo
Re: Дедупликация данных
я может быть ошибаюсь, и ситуация изменилась, но, когда я последний раз озабачивался этим вопросом, я пришел к выводу, что единственное, что можно использовать в корне, и что вообще работает не через fuse под линукс с дедупликацией - это zfs :-)
Солнце садилось в море, а люди с неоконченным высшим образованием выбегали оттуда, думая, что море закипит.
-
alv
- Бывший модератор
- Сообщения: 7275
- Статус: Пенсионер в законе
- ОС: Cintu
Re: Дедупликация данных
Ленивая Бестолоч... писал(а): ↑04.12.2012 02:55что вообще работает не через fuse под линукс с дедупликацией - это zfs :-)
ТС обозвал это костылём
Правда, если с ним согласиться, то всё остальное будет инвалидной коляской
что, конечно, куда прогрессивней костыля
-
Bluetooth
- Сообщения: 4395
- Статус: Блюзовый
- ОС: Debian Squeeze amd64
Re: Дедупликация данных
Интересно, а много там в корне надедублицируется данных? :)
ЛБ, напомни, что ты через fuse использовал для дедупликации данных?
ЛБ, напомни, что ты через fuse использовал для дедупликации данных?
-
BratSinot
- Сообщения: 812
- ОС: Slackware64
Re: Дедупликация данных
alv писал(а): ↑04.12.2012 03:26Ленивая Бестолоч... писал(а): ↑04.12.2012 02:55что вообще работает не через fuse под линукс с дедупликацией - это zfs :-)
ТС обозвал это костылём
Я обозвал ZFS On Linux костылем (а как иначе SPL назвать?).
Да и потом, ZFS это такое месиво. Делаем раздел, ставим тип Solaris/Solaris2, на разделе создаем пул, в пуле создаем виртуально устройство, с этим устройством еще что-то делаем, и монтируется оно хитро. Мне больше по душе классический подход.
-
pelmen
- Сообщения: 1268
- ОС: debian
-
Ленивая Бестолочь
- Бывший модератор
- Сообщения: 2760
- ОС: Debian; gentoo
Re: Дедупликация данных
lessfs например :-)
да в целом это равносильно подходу LVM + любая "нормальная" ФС. но SLP конечно да.
монтировать можно и через fstab, если хочется.
вот это точно.
Солнце садилось в море, а люди с неоконченным высшим образованием выбегали оттуда, думая, что море закипит.
-
alv
- Бывший модератор
- Сообщения: 7275
- Статус: Пенсионер в законе
- ОС: Cintu
Re: Дедупликация данных
Не в обиду Вам будет сказано, но месиво - Ваши представления о ZFS on Linux (или о ZFS вообще?).
совсем не обязательно, более того, рекомендуется деать пул на raw-устройствах
Это Вы от одного умника-убунтовца услышали?
во-первых, если пул на устройствах, а не на разделах - никакого типа у них нет
во-вторых, у Брайна ни слова не сказано о типе раздела
в-третьих, я делал пулы и на разделах с ID 83 - вреда ни малейшего
а создание, скажем, softRAID Level# на разделах не смущает?
это устройство называется файловой системой ZFS
или при создании softRAID или LVM можно обойтись без создания файловой системы?
страшно сказать, но с этим устройством работаем
типа данные на него пишем, например, парнуху всякую
потому что
да, монтируется оно настолько хитро, что не монтируется вообще
то есть монтируется, конечно, но так незаметненько...
если очень хочется - можно, конечно, как заметил Ленивая Бестолоч... и через fstab монтировать, но это - исключительно тем, кому
А вообще, лучше один раз проделать, что сто раз пересказывать. И тогда Вы увидите, что на деле всё это действительно не сложнее создания каталогов в обычной файловой системе. Как и было обещано создателями.
Во всяком случае, куда проще, чем создание и особенно управление LVM.
-
alv
- Бывший модератор
- Сообщения: 7275
- Статус: Пенсионер в законе
- ОС: Cintu
Re: Дедупликация данных
Ленивая Бестолоч... писал(а): ↑04.12.2012 17:27да в целом это равносильно подходу LVM + любая "нормальная" ФС
кроме того, что это гораздо проще
-
alv
- Бывший модератор
- Сообщения: 7275
- Статус: Пенсионер в законе
- ОС: Cintu
Re: Дедупликация данных
Видимо, речь идёт о решении
для предприятий с виртуальной средой
которым не жалко приобрести
Data Domain за $ 2 миллиарда
но хочется чуток сэкономить.
Цитаты из статьи по ссылке SinClaus, за которую ему, кстати, вери гран мерси.
-
BratSinot
- Сообщения: 812
- ОС: Slackware64
Re: Дедупликация данных
В целом. Может то, что они там наделали (я про все тот-же пул и все что с ним связано) кому то и надо, но лично для меня это нагромождение.
Круто, а с другими разделами мне как быть? Выкинуть?
Сам видел, когда через "format->fdisk" разделы ковырял.
"format->fdisk->Type" с вами не согласится.
Можно много чего делать.
Во первых, я ставил OpenIndiana и поднимал ZFS (правда в VBox, но я в нем делал, чтобы научится с их fdisk'ом работать и на винчестере разделы не похерить).
Во вторых, мне LVM, RAID и другие подобные вещи не нужны (в середине 0-х стояла RAID железка, но потом убрал). У меня нет машин с десятком винчестеров, чтобы их объединять.
Вообщем понятно, ничего нет путного. Только если плагин к Reiser4 навалять
Короче, тема исчерпана.
-
alv
- Бывший модератор
- Сообщения: 7275
- Статус: Пенсионер в законе
- ОС: Cintu
Re: Дедупликация данных
После этого поста - пожалуй...
-
Ленивая Бестолочь
- Бывший модератор
- Сообщения: 2760
- ОС: Debian; gentoo
Re: Дедупликация данных
ну в общем факт такой: надёжных и красивых, и при этом не zfs систем для linux с дедуплекацией - нет.
есть минимум две, которые работают через fuse.
мне лично SLP кажется меньшим злом, чем fuse.
есть минимум две, которые работают через fuse.
мне лично SLP кажется меньшим злом, чем fuse.
Солнце садилось в море, а люди с неоконченным высшим образованием выбегали оттуда, думая, что море закипит.
-
rm_
- Сообщения: 3340
- Статус: It's the GNU Age
- ОС: Debian
Re: Дедупликация данных
Вообщем понятно, ничего нет путного.
А чем OpenDedup не "путное"? Вроде бы это и есть "та самая" дедуплицирующая ФС, самая лучшая из свободных и на GNU/Linux.
Ссылку на её обзор дали в первом же ответе, собсс-но какие ещё вопросы могут быть?
Я тестировал, работает. Из минусов - потребление ОЗУ, кажется до гигабайта на терабайт данных на диске, но похоже иначе просто никак.
И подозреваю возможны вопросы с "использовать в корне" - но нахрена козе боян? Если у вас сотни виртуалок или NFS-загружающихся систем, то какая разница, что в корне у сервера (занимающем какие-нибудь 5-10 ГБ), где это всё хранится. Под хранение - отдельный раздел, и OpenDedup на нём.
-
BratSinot
- Сообщения: 812
- ОС: Slackware64
Re: Дедупликация данных
Да не держу я сервер! На своей рабочей машине хочу (и не спрашивайте зачем).
FUSE и Java.
-
rm_
- Сообщения: 3340
- Статус: It's the GNU Age
- ОС: Debian
Re: Дедупликация данных
На своей рабочей машине хочу
На одной машине профит будет изчезающе мал, гораздо больше вы получите от BTRFS со сжатием и при умелом использовании снапшотов.
-
Ленивая Бестолочь
- Бывший модератор
- Сообщения: 2760
- ОС: Debian; gentoo
Re: Дедупликация данных
(я шучу)
Солнце садилось в море, а люди с неоконченным высшим образованием выбегали оттуда, думая, что море закипит.
-
rm_
- Сообщения: 3340
- Статус: It's the GNU Age
- ОС: Debian
Re: Дедупликация данных
Я понимаю, но костылить ZFS (вкорячивая мутные третьесторонние патчи, с неясной надёжностью и будущим) вообще не вариант,
вот будет под GPL и в майнлайне, тогда и поговорим.
А btrfs есть и работает уже сейчас, к тому же она гораздо проще (что судя по сообщениям выше, немаловажно для автора).
-
alv
- Бывший модератор
- Сообщения: 7275
- Статус: Пенсионер в законе
- ОС: Cintu
Re: Дедупликация данных
Вообще-то, вопрос так и просится.
Потому как когда just for fun - то не выспрашивают по форумам, а копают, разбираются, а потом с восторгом рассказывают: я, блин, это сделал.
не будет, но
за этими костылями, кроме Брайана, стоит американский Средмаш. За btrfs не стоит уже никто - даже лично товарищ Крис.
так что говорить надо здесь и сейчас
-
rm_
- Сообщения: 3340
- Статус: It's the GNU Age
- ОС: Debian
Re: Дедупликация данных
Так или иначе обе принадлежат Ораклу, при желании которого вполне могла бы и "быть". Но такого желания нету, и в качестве решения для GNU/Linux предлагается BTRFS.
Крис собсс-но тоже продолжает её пилить, перейдя вместе с ещё одним разработчиком в FusionIO (которая, соответствуя своему названию, тоже вовсё не портянковязанием занимается). А ещё в майл-листе постоянный поток патчей от миллионов китайцев из (внезапно) Fujitsu.
-
Bluetooth
- Сообщения: 4395
- Статус: Блюзовый
- ОС: Debian Squeeze amd64
-
BratSinot
- Сообщения: 812
- ОС: Slackware64
Re: Дедупликация данных
Я в ФС не разбираюсь, но я придерживаюсь мнения Шишкина о btrfs. И только не надо про всяких Red Hat и им подобных говорить, они btrfs продвигают только потому, что на Linux альтернативы нет.
У меня слишком мало опыта, чтобы JFF без форумов делать
На самом деле, дело было вечером, делать было нечего. У меня мания такая, что-нибудь да менять (Slackware позволяет делать это безболезненно). Вечно то список установленных пакетов почищу, то из ядра очередную ненужную фичу/драйвер выкину (на самом деле я это специально постепенно делаю, а то уже было пару раз, повыкидывал, а потом сидел и думал что же такого важного я выкинул), то init-скрипты на csh перепишу
-
drBatty
- Сообщения: 8735
- Статус: GPG ID: 4DFBD1D6 дом горит, козёл не видит...
- ОС: Slackware-current
Re: Дедупликация данных
tar чем не подходит?
-
rm_
- Сообщения: 3340
- Статус: It's the GNU Age
- ОС: Debian
Re: Дедупликация данных
tar - это файловая система с дедупликацией данных?
-
pelmen
- Сообщения: 1268
- ОС: debian
-
Bluetooth
- Сообщения: 4395
- Статус: Блюзовый
- ОС: Debian Squeeze amd64
Re: Дедупликация данных
то init-скрипты на csh перепишу biggrin.gif.
:D
Ну раз никакой реальной задачи не стоит, то зачем тогда упираться в желании поставить это на корень? Поставьте не на корень, посмотрите fuse поделки на это, оцените их, zfs в конце концов посмотрите, btrfs.На самом деле, дело было вечером, делать было нечего.
-
Ленивая Бестолочь
- Бывший модератор
- Сообщения: 2760
- ОС: Debian; gentoo
Re: Дедупликация данных
Солнце садилось в море, а люди с неоконченным высшим образованием выбегали оттуда, думая, что море закипит.
-
Bluetooth
- Сообщения: 4395
- Статус: Блюзовый
- ОС: Debian Squeeze amd64