OCR для русского текста
Модератор: /dev/random
-
- Сообщения: 3121
- Статус: Think Different !
- ОС: Mac OS X
-
- Бывший модератор
- Сообщения: 3535
- Статус: OpenBSD-compatible
- ОС: OpenBSD -current
Re: OCR для русского текста
Для clx:
Тема исчесрпалась, так что либо флудим, либо закрываемся.
Тема исчесрпалась, так что либо флудим, либо закрываемся.
-
- Модератор
- Сообщения: 1056
- Статус: киберпИнгвин на гусеничном ходу
- ОС: Debian unstable
Re: OCR для русского текста
Для czarker:
Еще один закрыватель... А вдруг кто-то придет сообщить о создавшейся OCR, и воспользуется поиском, а тема закрыта? Нафига ее закрывать? Сама уйдет.
Еще один закрыватель... А вдруг кто-то придет сообщить о создавшейся OCR, и воспользуется поиском, а тема закрыта? Нафига ее закрывать? Сама уйдет.
Читаю вслух с выражением маны - $50/ч + стоимость звонка. Настраиваю сервисы за Вас - $100/ч + стоимость выезда и проживания.
И восемь строк матом...(бесплатно)
И восемь строк матом...(бесплатно)
-
- Бывший модератор
- Сообщения: 3535
- Статус: OpenBSD-compatible
- ОС: OpenBSD -current
Re: OCR для русского текста
Для Strangerrr:
Я тоже предпочитаю первый вариант...
Я тоже предпочитаю первый вариант...

-
- Сообщения: 3121
- Статус: Think Different !
- ОС: Mac OS X
Re: OCR для русского текста
(czarker @ Среда, 04 Мая 2005, 15:02) писал(а):Для Strangerrr:
Я тоже предпочитаю первый вариант...
Хотите флеймить? Для этого есть специальный раздел, вот там создавайте и флеймите сколько душе угодно. Но не в этом разделе

iMac 20" Core Duo.
-
- Сообщения: 698
- Статус: Интересующийся бывалый прохожий
Re: OCR для русского текста
Ну если по существу, то насколько мне известно под Wine можно установить тоько sprint-версию файнридера... А родной ocr в nix-ах нетути... И всё потому, что всем капусты хочется!
Don't trouble troubles until troubles trouble you!
-
- Бывший модератор
- Сообщения: 677
Re: OCR для русского текста
(Jinn @ Четверг, 05 Мая 2005, 1:55) писал(а):Ну если по существу, то насколько мне известно под Wine можно установить тоько sprint-версию файнридера... А родной ocr в nix-ах нетути... И всё потому, что всем капусты хочется!
Всем хочеться не капусты, а куска хлеба, желательно с маслом. А написать толковый OCR это вам, извините, не хрен собачий, это как никак система с элементами искуственного интелекта. Для этого нужна очень нехилая научная база и очень-очень много человеко-часов причем не столько кодинга, сколько именно иследовательской работы. Одиночкам это не подсилу, на голом энтузиазме тут не выедешь! Следавательно нужна организация коллективной работы, планы, сметы, отчеты и тд. и тп. Так что создание OCR подсилу либо научным организациям либо комерческим. С первыми, ситуация ясна (можете поинтересоваться у alv'а, как обстоят дела в в этой сфере) а вторые, извините, не богодельни им нужна прибыль со всеми вытекающими.
В реальности все не так, как на самом деле...
JabberID: zmeyk@jabber.ru
JabberID: zmeyk@jabber.ru
-
- Бывший модератор
- Сообщения: 1571
- ОС: Cygwin
Re: OCR для русского текста
Ну вообще-то проскакивала новость о том, что какой-то питерский институт/университет работает над свободной системой распознавания текста, но больше ничего не было слышно.
-
- Бывший модератор
- Сообщения: 7390
- Статус: думающий о вечном
- ОС: Debian, LMDE
Re: OCR для русского текста
Что-то я не пойму, о чём вы. Больше всего похоже, как верно заметил Странник, на обвинение компании ABBYY в использовании ворованного софта, но эту версию вы уже отмели. Так что же вы имели ввиду?(Jinn @ Среда, 04 Мая 2005, 1:33) писал(а):Так-так-так... А позвольте полюбопытствовать.. Компиляторы для своего движка они за сколько килограмм капусты покупали?.. А интегрированные среды разработки, которыми пользовались?!.. Дебугеры, профилеры??.. Ну и как тогда это назвать?.. Ох и горазды вы, ребята, ярлыки-то вешать!
t.t добавил в 05.05.2005 18:16
А где проскакивала, если не секрет? Буду благодарен за ссылку, сам не нашёл.(Bolverk @ Четверг, 05 Мая 2005, 11:02) писал(а):Ну вообще-то проскакивала новость о том, что какой-то питерский институт/университет работает над свободной системой распознавания текста, но больше ничего не было слышно.
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
-
- Бывший модератор
- Сообщения: 1571
- ОС: Cygwin
Re: OCR для русского текста
Да вот и я искал, искал - не нашел. Где-то в рассылках о новостях юникс, с полгода-год.
-
- Сообщения: 179
-
- Сообщения: 698
- Статус: Интересующийся бывалый прохожий
Re: OCR для русского текста
(Jinn @ Среда, 04 Мая 2005, 1:33)
Так-так-так... А позвольте полюбопытствовать.. Компиляторы для своего движка они за сколько килограмм капусты покупали?.. А интегрированные среды разработки, которыми пользовались?!.. Дебугеры, профилеры??.. Ну и как тогда это назвать?.. Ох и горазды вы, ребята, ярлыки-то вешать!
Что-то я не пойму, о чём вы. Больше всего похоже, как верно заметил Странник, на обвинение компании ABBYY в использовании ворованного софта, но эту версию вы уже отмели. Так что же вы имели ввиду?
czarker post Среда, 04 Мая 2005, 16:36
И что? Т.е. если я что-то делаю под Linux, то не имею права брать за это деньги? Чушь!
Значиться так... Согласно лицензии GNU, если код программы использует другой код GNU, то эта программа - тоже не может быть коммерческой! А нечего и говорить, о том, что компиляторы и ихние либы - именно GNU!
..И вообще, ребята! Вы что ж думаете? Для того и пишуться свободные системы, что бы самые умные могли капусты побольше состричь? Тогда милости просим! Купите себе форточки, весь софт под них и - вперёд! Или лучше рубить сук на котором сидишь?
Don't trouble troubles until troubles trouble you!
-
- Бывший модератор
- Сообщения: 3535
- Статус: OpenBSD-compatible
- ОС: OpenBSD -current
Re: OCR для русского текста
Использовать код, предоставляемый по лицензии GPL можно только при использовании этой лицензии, а вот пользоваться утилитами, распространяемыми по GPL, можно свободно и в любых целях (включая создание несвободного ПО и вызыв из него). А библиотеки GNU вообще распространяются по LGPL, позволяющей линковать их с несвободным софтом даже статически.(Jinn @ Пятница, 06 Мая 2005, 3:32) писал(а):Согласно лицензии GNU, если код программы использует другой код GNU, то эта программа - тоже не может быть коммерческой! А нечего и говорить, о том, что компиляторы и ихние либы - именно GNU!
-
- Сообщения: 698
- Статус: Интересующийся бывалый прохожий
Re: OCR для русского текста
2czarker. Можно было бы и дальше поспорить, только не здеся... А по второй части не нашёлся что сказать? Жаль! Обвинять-то мы все горазды!
Don't trouble troubles until troubles trouble you!
-
- Бывший модератор
- Сообщения: 3535
- Статус: OpenBSD-compatible
- ОС: OpenBSD -current
Re: OCR для русского текста
Для Jinn:
Хочешь по второй? Пожалуйста! Есть простой выбор: либо ты пользуешься софтом за деньги, либо ты им вообще не пользуешься. Выбор этот основывается на том, что выпускать такое объёмное, ресурсоёмкое и высокотехнологичное ПО как OCR способны только компании, в которые группы разработчиков по нескольку лет занимаются этой проблемой с 9:00 до 18:00 с часовым перерывом на обед. Если им не платить за их работу, они не смогут этим заниматься, и софта не будет. Поэтому экономически целесообразно платить за такой софт.
Отдельный вопрос - это OpenSource, но тебя, как я вижу, он не особо волнует.
Хочешь по второй? Пожалуйста! Есть простой выбор: либо ты пользуешься софтом за деньги, либо ты им вообще не пользуешься. Выбор этот основывается на том, что выпускать такое объёмное, ресурсоёмкое и высокотехнологичное ПО как OCR способны только компании, в которые группы разработчиков по нескольку лет занимаются этой проблемой с 9:00 до 18:00 с часовым перерывом на обед. Если им не платить за их работу, они не смогут этим заниматься, и софта не будет. Поэтому экономически целесообразно платить за такой софт.
Отдельный вопрос - это OpenSource, но тебя, как я вижу, он не особо волнует.
-
- Бывший модератор
- Сообщения: 7390
- Статус: думающий о вечном
- ОС: Debian, LMDE
Re: OCR для русского текста
Использовать _код_ и использовать _софт_ -- это, согласитесь, разные вещи. Помимо этого, кроме GPL есть и другие свободные лицензии, такие как упомянутая LGPL или (неупомянутая) BSD. Советую ознакомиться, прежде чем делать такие обобщающие заявления.(Jinn @ Пятница, 06 Мая 2005, 3:32) писал(а):Значиться так... Согласно лицензии GNU, если код программы использует другой код GNU, то эта программа - тоже не может быть коммерческой! А нечего и говорить, о том, что компиляторы и ихние либы - именно GNU!
..И вообще, ребята! Вы что ж думаете? Для того и пишуться свободные системы, что бы самые умные могли капусты побольше состричь? Тогда милости просим! Купите себе форточки, весь софт под них и - вперёд! Или лучше рубить сук на котором сидишь?
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
-
- Сообщения: 698
- Статус: Интересующийся бывалый прохожий
Re: OCR для русского текста
2agbr Ты еще здесь? А то все такие мрачные... что и флеймить не хочется лишний раз. Если пиплы хотят ещё одну винду, всё равно ничего не докажешь... Посмотри в сторону виндовой программульки papier converter от scansoft, прежде чем что-то платить. Есть поддержка и русского и дюжины других языков. С пол-года тому, запускал из под wine, но там есть тонкости в виде смешанного регистра имён файлов. Версия была у меня очень старая, не помню какая точно. Коммерческая, но ключей вроде не требовала. Мне не понравилось, что сохраняет только в html, потому это дело и бросил. Думаю, если руки дойдут, то продолжу.
Don't trouble troubles until troubles trouble you!
-
- Бывший модератор
- Сообщения: 7390
- Статус: думающий о вечном
- ОС: Debian, LMDE
Re: OCR для русского текста
Да никто не хочет винду, ни одну, ни ещё одну. Речь была о том, что качество распознавания у свободных программ, как и наличие (точнее, отсутствие) распознавания кирилицы не сравнится (к сожалению) с коммерческими, по очевидным, на наш взгляд, причинам.(Jinn @ Воскресенье, 08 Мая 2005, 3:02) писал(а):Если пиплы хотят ещё одну винду, всё равно ничего не докажешь...
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
-
- Сообщения: 486
- ОС: openSUSE 10.2
Re: OCR для русского текста
Вообщем, в сухом остатке - кириллических OCR'ов под linux нет и делать никто не собирается. Есть только некий проект "открытый код" ( http://ocr.apmath.spbu.ru/ ), который по-моему уже давно умер.
jabber: agbr@jabber.ru
против проприетарного ПО в GNU/Linux
против проприетарного ПО в GNU/Linux