[NIXP] В OCR-системе Tesseract 3.00 появилась поддержка русского языка

Обсуждение новостей, соответствующих тематике форума

Модератор: Модераторы разделов

Аватара пользователя
Dmitry Shurupov
Сообщения: 336
Статус: Open Source geek
ОС: Ubuntu Linux

[NIXP] В OCR-системе Tesseract 3.00 появилась поддержка русского языка

Сообщение Dmitry Shurupov »

1 октября была анонсирована новая стабильная версия Open Source-системы распознавания текста (OCR) — Tesseract 3.00. В ней появилась поддержка множества языков, среди которых и русский. Начало разработки OCR-системы Tesseract было положено еще в 1985—1994 годах в лабораториях HP. Сейчас приложение работает в Linux, Mac OS X и Windows, распространяется под свободной лицензией Apache License 2.0. Среди изменений в релизе Tesseract 3.00 отмечаются:

  • проведена подготовка для обеспечения безопасности работы потоков;
  • новый модуль анализа разметки страницы;
  • новый вывод HOCR;
  • использование Leptonica в качестве основного средства ввода/вывода изображений и работы с ними;
  • отказ от поддержки VC++ 6;
  • появление поддержки множества новых языков, таких как русский и украинский.
Файлы с релизом Tesseract 3.0 доступны на code.google.com.

оригинал на www.nixp.ru
По-моему, это еще один повод перейти на Убунту.
Спасибо сказали:
Аватара пользователя
Atolstoy
Сообщения: 1655
Статус: Tux in the rain
ОС: Linux x86_64

Re: [NIXP] В OCR-системе Tesseract 3.00 появилась поддержка русского языка

Сообщение Atolstoy »

А ГУИ-морда к нему есть?
Всего лишь 26 литров пива достаточно человеку для удовлетворения ежедневной потребности в кальции. Здоровое питание - это так просто!
http://atolstoy.wordpress.com
Спасибо сказали:
Аватара пользователя
AlexYeCu
Сообщения: 1137
ОС: fedora

Re: [NIXP] В OCR-системе Tesseract 3.00 появилась поддержка русского языка

Сообщение AlexYeCu »

Atolstoy писал(а):
05.10.2010 15:52
А ГУИ-морда к нему есть?


Есть. Только название не скажу — это нечто универсальное для gocr, tesseract и ещё пары движков. Но уровень морды — не FineReader явно — предпросмотр да кнопки, вызывающие программу с нужными агрументами.
Спасибо сказали:
Аватара пользователя
AlexYeCu
Сообщения: 1137
ОС: fedora

Re: [NIXP] В OCR-системе Tesseract 3.00 появилась поддержка русского языка

Сообщение AlexYeCu »

Мда, ну тут и бардак в *.spec`е… Пути другие, файлы другие…
Спасибо сказали: