необходимо удалить из файла-1 строки, в которых есть хотя бы одна подстрока из файла-2
т.е. на каждую строку из 1 файла нужно прогонять регулярку всех строк из 2 файла
скриптом могу сделать но хотелось бы одной конвейерной командой
типа cat file-1 | sed... etc > out
возможно?
Сортировка файлов
Модератор: Модераторы разделов
-
Лис
- Сообщения: 1639
- ОС: Zenwalk
Re: Сортировка файлов
А если не sed, а grep --invert-match?
-
Vitaly79
- Сообщения: 5
Re: Сортировка файлов
Лис
ей Богу пусть grep лиш бы работало
соль в том как прогнать для каждой строки все другие строки из другого файла
вот например в sed есть команда 'r file' прочитать файл
а у меня тяму не хватает как сделать
perl скрипт могу забацать но думаю конвейер большой файл быстрее обработает
ей Богу пусть grep лиш бы работало
соль в том как прогнать для каждой строки все другие строки из другого файла
вот например в sed есть команда 'r file' прочитать файл
а у меня тяму не хватает как сделать
perl скрипт могу забацать но думаю конвейер большой файл быстрее обработает
-
elide
- Бывший модератор
- Сообщения: 2421
- Статус: Übermensch
- ОС: лялих
Re: Сортировка файлов
ты спросил в 9 утра. уже 12. как бы медленно не работал скрипт на перл, за три часа он уже всяко обработал бы твои файлы. тратить несколько часов на решение, которое экономит несколько секунд на выполнении...... это крайне странное занятие, да.
слава роботам!
-
Vitaly79
- Сообщения: 5
Re: Сортировка файлов
elide
ошибаешься
1) никуда не тороплюсь
2) задачка довольна интересна
ошибаешься
1) никуда не тороплюсь
2) задачка довольна интересна
-
snake
- Бывший модератор
- Сообщения: 677
Re: Сортировка файлов
В таком разе можно бы и C выучить и сконстролить для такой задачи бинарник. Кстати, тоже самый выход будет полезен, если вам эту процедуру нужно делать регулярно и/или в цикле по сто тыщ мульёнов раз.
Не охота си учить, возьмите хотя б freepascal (уж паскалю в свое время почти всех учили) Всяко быстрее перла будет.
В реальности все не так, как на самом деле...
JabberID: zmeyk@jabber.ru
JabberID: zmeyk@jabber.ru
-
plumbum
- Сообщения: 169
- ОС: Debivan
Re: Сортировка файлов
Код: Выделить всё
grep -ivE "`xargs -a dellist.txt | tr " " "|"`" source.txtНедостаток: нельзя что бы в подстроках (файл dellist.txt) были пробелы и "|". Но они экранируются в соответствии с правилами регэкспов (к примеру пробел \\s).
Вроде работает. На всё это дело, вместе с чтением манов у меня ушло 10 минут.
ivan-a-r_1.0-19791224.3_ru_i786.deb (testing)
-
xorader
- Сообщения: 1030
- Статус: собирающий миры
- ОС: Debian
Re: Сортировка файлов
"тематический флейм" <_<
Это пример, когда важен процесс, а не результат ?
Это пример, когда важен процесс, а не результат ?
Molchanov Alexander (aka Xor)
*offtopic* - ololo!
*offtopic* - ololo!
-
Vitaly79
- Сообщения: 5
Re: Сортировка файлов
snake
СИ я как раз таки знаю и довольно неплохо
но под никсы тока на перле в основном программирую
в принципе идея хорошая по быстроте не уступит
но хотелось бы воспользоваться гибкими инструментами Unix
зачем велик ихобретать
и научиться ими работать, по sed что-то не нашел нужных примеров в интернете
plumbum
спасибо вам
буду пробовать
СИ я как раз таки знаю и довольно неплохо
но под никсы тока на перле в основном программирую
в принципе идея хорошая по быстроте не уступит
но хотелось бы воспользоваться гибкими инструментами Unix
зачем велик ихобретать
и научиться ими работать, по sed что-то не нашел нужных примеров в интернете
plumbum
спасибо вам
буду пробовать
-
sash-kan
- Администратор
- Сообщения: 13939
- Статус: oel ngati kameie
- ОС: GNU
Re: Сортировка файлов
действительно, пусть другие их обретут (:(Vitaly79 @ Nov 8 2006, в 15:33) писал(а):зачем велик ихобретать
вот требуемый велик:
grep -vxf dellist.txt source.txt
Писать безграмотно - значит посягать на время людей, к которым мы адресуемся, а потому совершенно недопустимо в правильно организованном обществе. © Щерба Л. В., 1957
при сбоях форума см.блог
при сбоях форума см.блог
-
plumbum
- Сообщения: 169
- ОС: Debivan
Re: Сортировка файлов
sash-kan, ндя.. Таки буду маны внимательнее читать
=)
=)
ivan-a-r_1.0-19791224.3_ru_i786.deb (testing)
-
Vitaly79
- Сообщения: 5
Re: Сортировка файлов
не все так просто оказывается
sash-kan ваша команда с лог-файлами 500(исходный) и 1(деллист) Мб зависает очень надолго
не выводя в stdout ни одной строки, через 30 минут памяти под grep довольно много выделилось
пробовал grep с опцией --line-buffered, не помогает
plumbum ваша команда выдала
извиняюсь если не туда запостил
не нашел соответствующего раздела
sash-kan ваша команда с лог-файлами 500(исходный) и 1(деллист) Мб зависает очень надолго
не выводя в stdout ни одной строки, через 30 минут памяти под grep довольно много выделилось
пробовал grep с опцией --line-buffered, не помогает
plumbum ваша команда выдала
bash: /bin/grep: Argument list too long
извиняюсь если не туда запостил
не нашел соответствующего раздела
-
sash-kan
- Администратор
- Сообщения: 13939
- Статус: oel ngati kameie
- ОС: GNU
Re: Сортировка файлов
прочитал и чуть не поперхнулся.(Vitaly79 @ Nov 9 2006, в 18:35) писал(а):500(исходный) и 1(деллист) Мб
конечно, тут надо потяжелее артиллерию подтягивать.
хотя бы perl.
Писать безграмотно - значит посягать на время людей, к которым мы адресуемся, а потому совершенно недопустимо в правильно организованном обществе. © Щерба Л. В., 1957
при сбоях форума см.блог
при сбоях форума см.блог