Проверка орфографии автоматически, как?

Для новичков как вообще в Linux, так и в конкретной теме, к которой относится вопрос.

Модератор: Bizdelnick

Ответить
azsx
Сообщения: 3684
ОС: calculate linux, debian, ubuntu

Проверка орфографии автоматически, как?

Сообщение azsx »

Есть тексты на русском языке, которые писали люди. Вопросы и ответы, 1.5 гб в базе. Людям свойственно ошбаться и ошибок в текстах очень много. Я хочу проверить тексты и автоматически исправить все ошибки. Из более менее работающих вариантов нашел только https://www.languagetool.org/ Очень хотелось приспособить libreoffice, но его не понимание буквы ё сразу не понравилось. Хотя в линукс обычно все юзают aspell, однако, ничего в нём не понятно. Скажите пожалуйста.
А как бы вы проверили такие тексты?
Вы юзаете aspell? Как с ним работать?
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 20752
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: Проверка орфографии автоматически, как?

Сообщение Bizdelnick »

Автоматическое исправление такого нагородит, что только хуже станет.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
azsx
Сообщения: 3684
ОС: calculate linux, debian, ubuntu

Re: Проверка орфографии автоматически, как?

Сообщение azsx »

Хуже не становится. Маловато исправляет, согласен.
Спасибо сказали:
Аватара пользователя
chitatel
Сообщения: 2063

Re: Проверка орфографии автоматически, как?

Сообщение chitatel »

azsx писал(а):
02.01.2017 14:18
тексты на русском языке /.../ 1.5 гб в базе.
А как бы вы проверили такие тексты?

Никак. Убил бы нафиг такую базу.
Спасибо сказали:
azsx
Сообщения: 3684
ОС: calculate linux, debian, ubuntu

Re: Проверка орфографии автоматически, как?

Сообщение azsx »

Убил бы нафиг такую базу.

Надо сделать api чат бота, вы ему вопрос - он вам релевантный ответ. Где базу возьмёте, если создать 100500 заданий на фрилансе мне дорого?
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 20752
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: Проверка орфографии автоматически, как?

Сообщение Bizdelnick »

azsx писал(а):
03.01.2017 02:08
Надо сделать api чат бота, вы ему вопрос - он вам релевантный ответ.

Купите у IBM Watson, а то они его для какой-то фигни уже используют, типа предсказания погоды. Тоже мне, авгура нашли.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
azsx
Сообщения: 3684
ОС: calculate linux, debian, ubuntu

Re: Проверка орфографии автоматически, как?

Сообщение azsx »

Не знаю к кому именно обращаться в IBM и у меня немного не хватает денег.
Буду считать, что у меня самый лучший вариант.
Спасибо сказали:
vzor74
Сообщения: 3

Re: Проверка орфографии автоматически, как?

Сообщение vzor74 »

azsx писал(а):
02.01.2017 14:18
Очень хотелось приспособить libreoffice, но его не понимание буквы ё сразу не понравилось.

Если установить вот этот пакет: hunspell-ru-lebedev-io - Словарь русского языка для myspell/hunspell с обязательным употреблением буквы "ё", то Libreoffice "ё" понимает
Спасибо сказали:
azsx
Сообщения: 3684
ОС: calculate linux, debian, ubuntu

Re: Проверка орфографии автоматически, как?

Сообщение azsx »

Если установить вот этот пакет: hunspell-ru-lebedev-io

Этот пакет только в альт линуксе, а мне бездельник строго настрого рекомендовал не брать ничего из других пакетов.
https://packages.altlinux.org/ru/Platform6/...-ru-lebedev/get
ну и какбы я не умею :(
зы
у меня убунту 14.04
Спасибо сказали:
Ответить