Вытащить описание из книги в fb2

radial · Сообщение **radial** » 07.03.2011 03:42

Аж не спится спокойно

Так конечно работает:

что-то-там-такое | grep -o '<genre>.*</genre>' | sed -e 's/<\/*genre>//g'

только выглядит страшно. Поэтому вопрос- а как будет правильно?

Про структуру документа FB2 я думаю не нужно рассказывать, все итак видели?
(В данном случае "выдергиваем" жанр, все это еще нужно проделать для названия и автора. Дальше все уже примитивно будет)

Сообщение **/dev/random** » 07.03.2011 04:21

Боюсь, что правильного способа обработки XML в ком. строке не существует. Любой способ - костыль, либо неудобный (например, скрипт на перле), либо имеющий множество случаев, в которых он будет работать неправильно (например, ваш способ).

liaonau · Сообщение **liaonau** » 07.03.2011 04:55

radial писал(а): ↑
07.03.2011 03:42
Так конечно работает:
Код: Выделить всё
что-то-там-такое | grep -o '<genre>.*</genre>' | sed -e 's/<\/*genre>//g'
только выглядит страшно. Поэтому вопрос- а как будет правильно?

А что именно вас напугало?

Недавно обсуждалось что-то похожее в теме grep нуть блок
t.t предложил sgrep.
Что-то вроде такого

Код: Выделить всё

|sgrep -o "%r\n" '"<genre>"__"</genre>"'

WTakET · Сообщение **WTakET** » 07.03.2011 10:16

Скрипт для извлечения описания из FB2 и переименования файлов (умеет работать с zip файлами, показывать обложку и оглавление). http://pybookreader.narod.ru/fb2desc.tgz

radial · Сообщение **radial** » 07.03.2011 13:52

WTakET, это круто!
сам собирался с нуля писать скрипт-каталогизатор, а тут- такой подарок!

Как ни странно, софта никакого для этого нет (про калябру молчу- жуткая вещь, в FBReader поиска по "базе" нет- сплошные недоделки).

unixforum.org

Вытащить описание из книги в fb2

Вытащить описание из книги в fb2

Re: Вытащить описание из книги в fb2

Re: Вытащить описание из книги в fb2

Re: Вытащить описание из книги в fb2

Re: Вытащить описание из книги в fb2