OCR для русского текста

Софт под Linux, разные программы, но только связанные с Linux

Модератор: /dev/random

Аватара пользователя
clx
Сообщения: 3121
Статус: Think Different !
ОС: Mac OS X

Re: OCR для русского текста

Сообщение clx »

Заканчиваем оффтопить, отвечаем по теме.
iMac 20" Core Duo.
Спасибо сказали:
Аватара пользователя
ddc
Бывший модератор
Сообщения: 3535
Статус: OpenBSD-compatible
ОС: OpenBSD -current

Re: OCR для русского текста

Сообщение ddc »

Для clx:
Тема исчесрпалась, так что либо флудим, либо закрываемся.
Спасибо сказали:
Аватара пользователя
Warderer
Модератор
Сообщения: 1056
Статус: киберпИнгвин на гусеничном ходу
ОС: Debian unstable

Re: OCR для русского текста

Сообщение Warderer »

Для czarker:
Еще один закрыватель... А вдруг кто-то придет сообщить о создавшейся OCR, и воспользуется поиском, а тема закрыта? Нафига ее закрывать? Сама уйдет.
Читаю вслух с выражением маны - $50/ч + стоимость звонка. Настраиваю сервисы за Вас - $100/ч + стоимость выезда и проживания.
И восемь строк матом...(бесплатно)
Спасибо сказали:
Аватара пользователя
ddc
Бывший модератор
Сообщения: 3535
Статус: OpenBSD-compatible
ОС: OpenBSD -current

Re: OCR для русского текста

Сообщение ddc »

Для Strangerrr:
Я тоже предпочитаю первый вариант... :D
Спасибо сказали:
Аватара пользователя
clx
Сообщения: 3121
Статус: Think Different !
ОС: Mac OS X

Re: OCR для русского текста

Сообщение clx »

(czarker @ Среда, 04 Мая 2005, 15:02) писал(а):Для Strangerrr:
Я тоже предпочитаю первый вариант... :D


Хотите флеймить? Для этого есть специальный раздел, вот там создавайте и флеймите сколько душе угодно. Но не в этом разделе :angry:
iMac 20" Core Duo.
Спасибо сказали:
Аватара пользователя
Jinn
Сообщения: 698
Статус: Интересующийся бывалый прохожий

Re: OCR для русского текста

Сообщение Jinn »

Ну если по существу, то насколько мне известно под Wine можно установить тоько sprint-версию файнридера... А родной ocr в nix-ах нетути... И всё потому, что всем капусты хочется!
Don't trouble troubles until troubles trouble you!
Спасибо сказали:
snake
Бывший модератор
Сообщения: 677

Re: OCR для русского текста

Сообщение snake »

(Jinn @ Четверг, 05 Мая 2005, 1:55) писал(а):Ну если по существу, то насколько мне известно под Wine  можно установить тоько sprint-версию файнридера... А родной ocr в nix-ах нетути... И всё потому, что всем капусты хочется!

Всем хочеться не капусты, а куска хлеба, желательно с маслом. А написать толковый OCR это вам, извините, не хрен собачий, это как никак система с элементами искуственного интелекта. Для этого нужна очень нехилая научная база и очень-очень много человеко-часов причем не столько кодинга, сколько именно иследовательской работы. Одиночкам это не подсилу, на голом энтузиазме тут не выедешь! Следавательно нужна организация коллективной работы, планы, сметы, отчеты и тд. и тп. Так что создание OCR подсилу либо научным организациям либо комерческим. С первыми, ситуация ясна (можете поинтересоваться у alv'а, как обстоят дела в в этой сфере) а вторые, извините, не богодельни им нужна прибыль со всеми вытекающими.
В реальности все не так, как на самом деле...
JabberID: zmeyk@jabber.ru
Спасибо сказали:
Аватара пользователя
Bolverk
Бывший модератор
Сообщения: 1571
ОС: Cygwin

Re: OCR для русского текста

Сообщение Bolverk »

Ну вообще-то проскакивала новость о том, что какой-то питерский институт/университет работает над свободной системой распознавания текста, но больше ничего не было слышно.
Спасибо сказали:
Аватара пользователя
t.t
Бывший модератор
Сообщения: 7390
Статус: думающий о вечном
ОС: Debian, LMDE

Re: OCR для русского текста

Сообщение t.t »

(Jinn @ Среда, 04 Мая 2005, 1:33) писал(а):Так-так-так... А позвольте полюбопытствовать.. Компиляторы для своего движка они за сколько килограмм капусты покупали?.. А интегрированные среды разработки, которыми пользовались?!.. Дебугеры, профилеры??.. Ну и как тогда это назвать?.. Ох и горазды вы, ребята, ярлыки-то вешать!
Что-то я не пойму, о чём вы. Больше всего похоже, как верно заметил Странник, на обвинение компании ABBYY в использовании ворованного софта, но эту версию вы уже отмели. Так что же вы имели ввиду?

t.t добавил в 05.05.2005 18:16

(Bolverk @ Четверг, 05 Мая 2005, 11:02) писал(а):Ну вообще-то проскакивала новость о том, что какой-то питерский институт/университет работает над свободной системой распознавания текста, но больше ничего не было слышно.
А где проскакивала, если не секрет? Буду благодарен за ссылку, сам не нашёл.
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
Спасибо сказали:
Аватара пользователя
Bolverk
Бывший модератор
Сообщения: 1571
ОС: Cygwin

Re: OCR для русского текста

Сообщение Bolverk »

Да вот и я искал, искал - не нашел. Где-то в рассылках о новостях юникс, с полгода-год.
Спасибо сказали:
Аватара пользователя
eugrus
Сообщения: 179

Re: OCR для русского текста

Сообщение eugrus »

Спасибо сказали:
Аватара пользователя
Jinn
Сообщения: 698
Статус: Интересующийся бывалый прохожий

Re: OCR для русского текста

Сообщение Jinn »

(Jinn @ Среда, 04 Мая 2005, 1:33)
Так-так-так... А позвольте полюбопытствовать.. Компиляторы для своего движка они за сколько килограмм капусты покупали?.. А интегрированные среды разработки, которыми пользовались?!.. Дебугеры, профилеры??.. Ну и как тогда это назвать?.. Ох и горазды вы, ребята, ярлыки-то вешать!

Что-то я не пойму, о чём вы. Больше всего похоже, как верно заметил Странник, на обвинение компании ABBYY в использовании ворованного софта, но эту версию вы уже отмели. Так что же вы имели ввиду?

czarker  post Среда, 04 Мая 2005, 16:36
И что? Т.е. если я что-то делаю под Linux, то не имею права брать за это деньги? Чушь!

Значиться так... Согласно лицензии GNU, если код программы использует другой код GNU, то эта программа - тоже не может быть коммерческой! А нечего и говорить, о том, что компиляторы и ихние либы - именно GNU!
..И вообще, ребята! Вы что ж думаете? Для того и пишуться свободные системы, что бы самые умные могли капусты побольше состричь? Тогда милости просим! Купите себе форточки, весь софт под них и - вперёд! Или лучше рубить сук на котором сидишь?
Don't trouble troubles until troubles trouble you!
Спасибо сказали:
Аватара пользователя
ddc
Бывший модератор
Сообщения: 3535
Статус: OpenBSD-compatible
ОС: OpenBSD -current

Re: OCR для русского текста

Сообщение ddc »

(Jinn @ Пятница, 06 Мая 2005, 3:32) писал(а):Согласно лицензии GNU, если код программы использует другой код GNU, то эта программа - тоже не может быть коммерческой! А нечего и говорить, о том, что компиляторы и ихние либы - именно GNU!
Использовать код, предоставляемый по лицензии GPL можно только при использовании этой лицензии, а вот пользоваться утилитами, распространяемыми по GPL, можно свободно и в любых целях (включая создание несвободного ПО и вызыв из него). А библиотеки GNU вообще распространяются по LGPL, позволяющей линковать их с несвободным софтом даже статически.
Спасибо сказали:
Аватара пользователя
Jinn
Сообщения: 698
Статус: Интересующийся бывалый прохожий

Re: OCR для русского текста

Сообщение Jinn »

2czarker. Можно было бы и дальше поспорить, только не здеся... А по второй части не нашёлся что сказать? Жаль! Обвинять-то мы все горазды!
Don't trouble troubles until troubles trouble you!
Спасибо сказали:
Аватара пользователя
ddc
Бывший модератор
Сообщения: 3535
Статус: OpenBSD-compatible
ОС: OpenBSD -current

Re: OCR для русского текста

Сообщение ddc »

Для Jinn:
Хочешь по второй? Пожалуйста! Есть простой выбор: либо ты пользуешься софтом за деньги, либо ты им вообще не пользуешься. Выбор этот основывается на том, что выпускать такое объёмное, ресурсоёмкое и высокотехнологичное ПО как OCR способны только компании, в которые группы разработчиков по нескольку лет занимаются этой проблемой с 9:00 до 18:00 с часовым перерывом на обед. Если им не платить за их работу, они не смогут этим заниматься, и софта не будет. Поэтому экономически целесообразно платить за такой софт.
Отдельный вопрос - это OpenSource, но тебя, как я вижу, он не особо волнует.
Спасибо сказали:
Аватара пользователя
t.t
Бывший модератор
Сообщения: 7390
Статус: думающий о вечном
ОС: Debian, LMDE

Re: OCR для русского текста

Сообщение t.t »

(Jinn @ Пятница, 06 Мая 2005, 3:32) писал(а):Значиться так... Согласно лицензии GNU, если код программы использует другой код GNU, то эта программа - тоже не может быть коммерческой! А нечего и говорить, о том, что компиляторы и ихние либы - именно GNU!
..И вообще, ребята! Вы что ж думаете? Для того и пишуться свободные системы, что бы самые умные могли капусты побольше состричь? Тогда милости просим! Купите себе форточки, весь софт под них и - вперёд! Или лучше рубить сук на котором сидишь?
Использовать _код_ и использовать _софт_ -- это, согласитесь, разные вещи. Помимо этого, кроме GPL есть и другие свободные лицензии, такие как упомянутая LGPL или (неупомянутая) BSD. Советую ознакомиться, прежде чем делать такие обобщающие заявления.
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
Спасибо сказали:
Аватара пользователя
Jinn
Сообщения: 698
Статус: Интересующийся бывалый прохожий

Re: OCR для русского текста

Сообщение Jinn »

2agbr Ты еще здесь? А то все такие мрачные... что и флеймить не хочется лишний раз. Если пиплы хотят ещё одну винду, всё равно ничего не докажешь... Посмотри в сторону виндовой программульки papier converter от scansoft, прежде чем что-то платить. Есть поддержка и русского и дюжины других языков. С пол-года тому, запускал из под wine, но там есть тонкости в виде смешанного регистра имён файлов. Версия была у меня очень старая, не помню какая точно. Коммерческая, но ключей вроде не требовала. Мне не понравилось, что сохраняет только в html, потому это дело и бросил. Думаю, если руки дойдут, то продолжу.
Don't trouble troubles until troubles trouble you!
Спасибо сказали:
Аватара пользователя
t.t
Бывший модератор
Сообщения: 7390
Статус: думающий о вечном
ОС: Debian, LMDE

Re: OCR для русского текста

Сообщение t.t »

(Jinn @ Воскресенье, 08 Мая 2005, 3:02) писал(а):Если пиплы хотят ещё одну винду, всё равно ничего не докажешь...
Да никто не хочет винду, ни одну, ни ещё одну. Речь была о том, что качество распознавания у свободных программ, как и наличие (точнее, отсутствие) распознавания кирилицы не сравнится (к сожалению) с коммерческими, по очевидным, на наш взгляд, причинам.
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
Спасибо сказали:
Аватара пользователя
agbr
Сообщения: 486
ОС: openSUSE 10.2

Re: OCR для русского текста

Сообщение agbr »

Вообщем, в сухом остатке - кириллических OCR'ов под linux нет и делать никто не собирается. Есть только некий проект "открытый код" ( http://ocr.apmath.spbu.ru/ ), который по-моему уже давно умер.
jabber: agbr@jabber.ru

против проприетарного ПО в GNU/Linux
Спасибо сказали: