Андрей, всех-то не надо.
Или это намёк?
А если серьёзно - нет настроения сделать сборку для openSUSE? Там было бы востребовано. Правда, в ней ни cuneiform, ни tesseract штатно нету...
Вообще-то странно, что это где-то понадобилось делать явным образом, поскольку
By default, GCC links to the libraries of glibc, which includes libdl.so.
So, you don't have to explicitly link to libdl.so, gcc and g++ link to it automatically.
И во всех дистрах, с которыми я работал, так и происходит, но строчку в CMakeLists.txt добавить можно. Думаю, это никому не повредит.
Далеко не все. Я вот, к примеру, практически не пью (тем более не на дни рождения). А уж при двухмесячном малыше не до алкоголя точно.
Я сам сборок не делаю, все равно у разных дистров разные правила. Я лучше над кодом поработаю.
И это правильно. Как мейнтейнер пакета в ALT Linux всячески желаю побыстрее разработку перевести на Git. А то получается, что мне нужно через watch скачать тарболл, сделать в Git (где и происходит сборка) коммит с обновлённого тарбола и только тогда запустить. Гораздо проще было бы отслеживать теги, тогда пакет сам бы собирался.
В Мандриве почему-то не происходит, по крайней мере в 2011.
Кстати, насчет автоматического связывания libdl я, похоже, был неправ. Но в Убунте/Дебиане и OpenSuse все работает. Факт. В общем, добавляю эту строку в cmake-овый файл.
Кстати, scantailor видели? Возможно, имеет смысл оттуда что-то позаимствовать.
Видел, и даже общался с разработчиками на предмет объединения усилий (инициатива исходила от них). Но не сошлись. Возможно, у меня слишком авторитарный подход к проектированию ПО
Долго ли, коротко ли, но вышел YAGF 0.9.1.
Основная новая фишка – автоматическое разбиение отсканированного текста на блоки.
Исходники, как всегда, на странице YAGF
Долго ли, коротко ли, но вышел YAGF 0.9.1.
Основная новая фишка – автоматическое разбиение отсканированного текста на блоки.
Исходники, как всегда, на странице YAGF
У меня версия 0.9.1 падает при импорте файлов PDF. На предыдущих не пробовал.
Прикладываю лог отладчика.
Если изменить разрешение на 300х300, то работает нормально. Также меняю формат на PNG.
Конвертация происходит, но в списке YAGF картинки не появляются. Так и должно быть?
openSUSE 11.4 x86_64. Qt 4.7.1.
У вас нет необходимых прав для просмотра вложений в этом сообщении.
Загруженные обычным способом файлы отображаются. Не появляются в боковой панели картинки, конвертированные из PDF.
То есть, я предполагаю, что после импорта PDF программа должна автоматически загрузить полученные изображения.
Долго ли, коротко ли, но вышел YAGF 0.9.1.
Основная новая фишка – автоматическое разбиение отсканированного текста на блоки.
Исходники, как всегда, на странице YAGF
Отлично, спасибо! В ALT Linux собрал. Надеюсь, будет достойная замена падучего Ocrfeeder, который монопольно держал эту фичу.
P.S. Радость была преждевременна. А вот не всё так просто: блоки распознаются не сверху вниз, а наоборот, снизу вверх. То есть сначала в выводе показывается самый нижний блок, потом средний, потом заголовок. Порядок можно поправить?
Радость была преждевременна. А вот не всё так просто: блоки распознаются не сверху вниз, а наоборот, снизу вверх. То есть сначала в выводе показывается самый нижний блок, потом средний, потом заголовок. Порядок можно поправить?
Это странно. Я с такой проблемой столкнулся в ходе разработки и специально принял меры, чтобы блоки при распознавании перечислялись сверху вниз и слева направо. Так у меня везде и происходит. Можете выслать пример страницы, где это происходит не так? Мой гуглоадрес - andrei.borovsky@gmail.com
То есть, я предполагаю, что после импорта PDF программа должна автоматически загрузить полученные изображения.
Правильно предполагаете. Так оно и происходит, причем даже не после импорта, а прямо в процессе, по мере импорта страниц. И я так и не понял, при чем тут PNG и разрешение. Вы изменили параметры конвертера?
Да, я изменил параметры конвертера для проверки. Как я писал выше, с текущими параметрами программа падает. Формат, JPEG или PNG не важен, это я для себя сделал. Мне показалось, что программа не может обработать получающиеся файлы большого размера.