Мне показалось, что программа не может обработать получающиеся файлы большого размера.
Я прикрепил лог в сообщении Новая графическая оболочка для cuneiform
Вы смотрели?
Лог смотрел. Там проблема BadAlloc, то есть, как я понимаю, системе не хватает памяти при создании пиксмапа.
Проблемы с большими изображениями действительно могут возникнуть при недостатке памяти. Тут трудно что-либо сделать, так как на определенном этапе X Window создает пиксмапы страниц, и если они не умещаются в памяти, программа просто падает. Но в системах с 1 гигабайтом и выше у меня такого не было. Попробую тоже увеличить разрешение при импорте из PDF.
P.S. PNG, кстати, не очень подходящий вариант, т.к. с ним Qt работает медленнее, чем с jpg.
P.S. PNG, кстати, не очень подходящий вариант, т.к. с ним Qt работает медленнее, чем с jpg.
Мне подумалось, что PNG даст меньше артефактов в картинке, что положительно скажется на распознавании.
Протестировал работу импорта из PDF в openSUSE Factory.
Преобразование в отдельные изображения происходит, файлы складываются в заданный каталог, но в YAGF не появляются.
Мне подумалось, что PNG даст меньше артефактов в картинке, что положительно скажется на распознавании.
Если Вы хотели повысить распознаваемость PDF, изначально отсканированного как картинка в низком разрешении, то это не поможет. Там нужны более хитрые алгоритмы. Я их реализую, со временем.
Попробовал ещё раз, без изменения разрешения и формата. Импортировал пять страниц. Все конвертировались, но в YAGF появились только четыре картинки. При этом он отъел 2200 Мб памяти.
Сейчас и так 600.
Попробовал ещё раз, без изменения разрешения и формата. Импортировал пять страниц. Все конвертировались, но в YAGF появились только четыре картинки. При этом он отъел 2200 Мб памяти.
Кстати, программа многостраничные TIFF не разбирает на страницы. Автору пример отправил.
Я провел распознавание присланного документа после автоматического разбиения на блоки. Результаты отослал тебе на почту. Блоки распознаются в порядке сверху вниз, как и должно быть. Проверь еще раз или уточни условия возникновения ошибки.
Кстати, программа многостраничные TIFF не разбирает на страницы. Автору пример отправил.
Я провел распознавание присланного документа после автоматического разбиения на блоки. Результаты отослал тебе на почту. Блоки распознаются в порядке сверху вниз, как и должно быть. Проверь еще раз или уточни условия возникновения ошибки.
Нажми ещё раз на кнопку распознавания и удивись. Воспроизводится в каждом чётном (!) случае разспознавания.