PDF => text (Конвертирование форматов)

Софт под Linux, разные программы, но только связанные с Linux

Модератор: /dev/random

Аватара пользователя
azn
Сообщения: 3

PDF => text

Сообщение azn »

Возникла необходимость преобразовать документ PDF в какой-нибудь редактирумый текстовый формат. Возможно ли это (не очень разбираюсь в тонкостях различных форматов, но, если я не ошибаюсь, pdf - графический ?)? :huh:
Спасибо сказали:
Аватара пользователя
Vladislav
Сообщения: 383
ОС: Debian Sid

Re: PDF => text

Сообщение Vladislav »

xpdf-utils должны исправить ситуацию, а еще точнее одна утилита входящая туда - pdftotext
Спасибо сказали:
Аватара пользователя
t.t
Бывший модератор
Сообщения: 7390
Статус: думающий о вечном
ОС: Debian, LMDE

Re: PDF => text

Сообщение t.t »

(Vladislav @ Четверг, 04 Ноября 2004, 12:53) писал(а):xpdf-utils должны исправить ситуацию, а еще точнее одна утилита входящая туда - pdftotext
За исключением того варианта, когда pdf содержит просто сканы страниц, т.е. действительно графику.
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
Спасибо сказали:
Аватара пользователя
Vladislav
Сообщения: 383
ОС: Debian Sid

Re: PDF => text

Сообщение Vladislav »

в этом случае можно попробовать kword он может импортировать pdf, но результат еще далек от совершенства.
Спасибо сказали:
Аватара пользователя
t.t
Бывший модератор
Сообщения: 7390
Статус: думающий о вечном
ОС: Debian, LMDE

Re: PDF => text

Сообщение t.t »

(Vladislav @ Четверг, 04 Ноября 2004, 13:08) писал(а):в этом случае можно попробовать kword он может импортировать pdf, но результат еще далек от совершенства.
Разве kword распознаёт текст?
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
Спасибо сказали:
OrlovPa
Сообщения: 93

Re: PDF => text

Сообщение OrlovPa »

t.t. прав! :thumbsup:
Если в PDF - текст как графика, то редактировать только после распознания.
И не важно как там текст графикой стал - или сканом, или нет.
Спасибо сказали: