[NIXP] В OCR-системе Tesseract 3.00 появилась поддержка русского языка

Dmitry Shurupov · Сообщение **Dmitry Shurupov** » 05.10.2010 14:21

1 октября была анонсирована новая стабильная версия Open Source-системы распознавания текста (OCR) — Tesseract 3.00. В ней появилась поддержка множества языков, среди которых и русский. Начало разработки OCR-системы Tesseract было положено еще в 1985—1994 годах в лабораториях HP. Сейчас приложение работает в Linux, Mac OS X и Windows, распространяется под свободной лицензией Apache License 2.0. Среди изменений в релизе Tesseract 3.00 отмечаются:

проведена подготовка для обеспечения безопасности работы потоков;
новый модуль анализа разметки страницы;
новый вывод HOCR;
использование Leptonica в качестве основного средства ввода/вывода изображений и работы с ними;
отказ от поддержки VC++ 6;
появление поддержки множества новых языков, таких как русский и украинский.

Файлы с релизом Tesseract 3.0 доступны на code.google.com.

оригинал на www.nixp.ru

Atolstoy · Сообщение **Atolstoy** » 05.10.2010 15:52

А ГУИ-морда к нему есть?

AlexYeCu · Сообщение **AlexYeCu** » 05.10.2010 17:06

Atolstoy писал(а): ↑
05.10.2010 15:52
А ГУИ-морда к нему есть?

Есть. Только название не скажу — это нечто универсальное для gocr, tesseract и ещё пары движков. Но уровень морды — не FineReader явно — предпросмотр да кнопки, вызывающие программу с нужными агрументами.

AlexYeCu · Сообщение **AlexYeCu** » 05.10.2010 18:20

Мда, ну тут и бардак в *.spec`е… Пути другие, файлы другие…

unixforum.org

[NIXP] В OCR-системе Tesseract 3.00 появилась поддержка русского языка

[NIXP] В OCR-системе Tesseract 3.00 появилась поддержка русского языка

Re: [NIXP] В OCR-системе Tesseract 3.00 появилась поддержка русского языка

Re: [NIXP] В OCR-системе Tesseract 3.00 появилась поддержка русского языка

Re: [NIXP] В OCR-системе Tesseract 3.00 появилась поддержка русского языка