1 октября была анонсирована новая стабильная версия Open Source-системы распознавания текста (OCR) — Tesseract 3.00. В ней появилась поддержка множества языков, среди которых и русский.
Начало разработки OCR-системы Tesseract было положено еще в 1985—1994 годах в лабораториях HP. Сейчас приложение работает в Linux, Mac OS X и Windows, распространяется под свободной лицензией Apache License 2.0.
Среди изменений в релизе Tesseract 3.00 отмечаются:
проведена подготовка для обеспечения безопасности работы потоков;
новый модуль анализа разметки страницы;
новый вывод HOCR;
использование Leptonica в качестве основного средства ввода/вывода изображений и работы с ними;
отказ от поддержки VC++ 6;
появление поддержки множества новых языков, таких как русский и украинский.
Всего лишь 26 литров пива достаточно человеку для удовлетворения ежедневной потребности в кальции. Здоровое питание - это так просто! http://atolstoy.wordpress.com
Есть. Только название не скажу — это нечто универсальное для gocr, tesseract и ещё пары движков. Но уровень морды — не FineReader явно — предпросмотр да кнопки, вызывающие программу с нужными агрументами.