OCR для русского языка.

Разные проблемы звука, видео, обсуждение разных устройств и т.д.

Модератор: Модераторы разделов

NoMad
Сообщения: 92
ОС: Debian 4.0

OCR для русского языка.

Сообщение NoMad »

Знаю, что больная тема, но все же - никто не в курсе? Может появилось что-нибудь, даже и проприетарное (хотя свободный вариант предпочтительнее)? А то вроде и движок от ABBYY открывали в свое время (чуть ли не год назад).
Спасибо сказали:
Аватара пользователя
t.t
Бывший модератор
Сообщения: 7390
Статус: думающий о вечном
ОС: Debian, LMDE

Re: OCR для русского языка.

Сообщение t.t »

(NoMad @ Jun 3 2006, в 13:43) писал(а):движок от ABBYY открывали в свое время
Что вы имеете ввиду под словом "открывали"? Есть версия ABBYY FineReader Engine под Linux, но это закрытый коммерческий продукт стоимостью, если я правильно помню, 16.5 килобаксов.
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
Спасибо сказали:
snake
Бывший модератор
Сообщения: 677

Re: OCR для русского языка.

Сообщение snake »

NoMad писал(а):
03.06.2006 14:43
Знаю, что больная тема, но все же - никто не в курсе? Может появилось что-нибудь, даже и проприетарное (хотя свободный вариант предпочтительнее)? А то вроде и движок от ABBYY открывали в свое время (чуть ли не год назад).
Программ OCR для русского под линукс нет в природе. Движек от ABBYY это инструмент для разработчиков, а не прикладная программа, к тому же никто его не открывал и открывать, по ходу, не собирается. Продукт этот коммерческий и как уже было замечено стоит 16,5 килобаксов.

Возможно Вас немного утешит тот факт, что и под английский текст свободных юниксовых (по-моему и несвободных тоже) OCR пригодных длия мирного использования нет. То что есть (goosr и что-то еще) в реальных условиях невыдерживает никакой критики.
В реальности все не так, как на самом деле...
JabberID: zmeyk@jabber.ru
Спасибо сказали:
Аватара пользователя
prokoudine
Сообщения: 688

Re: OCR для русского языка.

Сообщение prokoudine »

Всё на свете перепутали :)

1. Код движка Finereader, как сказано выше, никто не открывал.
2. Программ OCR для русского под линукс в природе есть, но их русскому нужно научить. Речь о ClaraOCR (см. архивы community@altlinux.ru) и Kognition(.sf.net). Ещё есть http://www.linux.org.ru/view-message.jsp?msgid=1238248
3. Что такое "мирное использование", я не знаю, но конкретно ClaraOCR создавалась и успешно использовалась для массового сканирования и распознавания. По удобству им всем до FR как пешком до Китая. Но с латиницей работают сразу.
Спасибо сказали: