Вытащить описание из книги в fb2

На самом деле это единственный раздел про unix на этом форуме

Модераторы: /dev/random, Модераторы разделов

Аватара пользователя
radial
Сообщения: 577
ОС: OpenSUSE

Вытащить описание из книги в fb2

Сообщение radial »

Аж не спится спокойно ;)

Так конечно работает:

Код: Выделить всё

что-то-там-такое | grep -o '<genre>.*</genre>' | sed -e 's/<\/*genre>//g'

только выглядит страшно. Поэтому вопрос- а как будет правильно?

Про структуру документа FB2 я думаю не нужно рассказывать, все итак видели?
(В данном случае "выдергиваем" жанр, все это еще нужно проделать для названия и автора. Дальше все уже примитивно будет)
Спасибо сказали:
Аватара пользователя
/dev/random
Администратор
Сообщения: 5456
ОС: Gentoo

Re: Вытащить описание из книги в fb2

Сообщение /dev/random »

Боюсь, что правильного способа обработки XML в ком. строке не существует. Любой способ - костыль, либо неудобный (например, скрипт на перле), либо имеющий множество случаев, в которых он будет работать неправильно (например, ваш способ).
Спасибо сказали:
liaonau
Сообщения: 390
ОС: gentoo

Re: Вытащить описание из книги в fb2

Сообщение liaonau »

radial писал(а):
07.03.2011 03:42
Так конечно работает:

Код: Выделить всё

что-то-там-такое | grep -o '<genre>.*</genre>' | sed -e 's/<\/*genre>//g'

только выглядит страшно. Поэтому вопрос- а как будет правильно?

А что именно вас напугало?

Недавно обсуждалось что-то похожее в теме grep нуть блок
t.t предложил sgrep.
Что-то вроде такого

Код: Выделить всё

|sgrep -o "%r\n" '"<genre>"__"</genre>"'
Спасибо сказали:
WTakET
Сообщения: 73
ОС: Debian GNU/Linux squeeze/sid

Re: Вытащить описание из книги в fb2

Сообщение WTakET »

Скрипт для извлечения описания из FB2 и переименования файлов (умеет работать с zip файлами, показывать обложку и оглавление). http://pybookreader.narod.ru/fb2desc.tgz
Спасибо сказали:
Аватара пользователя
radial
Сообщения: 577
ОС: OpenSUSE

Re: Вытащить описание из книги в fb2

Сообщение radial »

WTakET, это круто!
сам собирался с нуля писать скрипт-каталогизатор, а тут- такой подарок!

Как ни странно, софта никакого для этого нет (про калябру молчу- жуткая вещь, в FBReader поиска по "базе" нет- сплошные недоделки).
Спасибо сказали: