как сличать на php похожесть текста?

Модератор: Модераторы разделов

tull
Сообщения: 484

как сличать на php похожесть текста?

Сообщение tull »

есть форум, движок на php, данные - в mysql

есть проблема, что иногда берут, и копируют существующий пост (почему - это отдельная тема, но поверьте, бывает такое).
но далеко не всегда целиком, т.е. какая-то часть поста может и отличаться.

что посоветуете, чтобы проверять похожесть текста?
Спасибо сказали:
Аватара пользователя
sash-kan
Администратор
Сообщения: 13939
Статус: oel ngati kameie
ОС: GNU

Re: как сличать на php похожесть текста?

Сообщение sash-kan »

diff ?

p.s. а зачем проверять?
Писать безграмотно - значит посягать на время людей, к которым мы адресуемся, а потому совершенно недопустимо в правильно организованном обществе. © Щерба Л. В., 1957
при сбоях форума см.блог
Спасибо сказали:
tull
Сообщения: 484

Re: как сличать на php похожесть текста?

Сообщение tull »

sash-kan писал(а):
21.05.2009 02:27
diff ?

p.s. а зачем проверять?
не в обиду, но вы похоже не читали вопрос :(

зачем написано - потому что есть такая проблема, что юзеры пишут посты-дубли. это мешает в силу специфики форума.

что такое diff я не знаю, такой ф-ии в php нет
кроме того, то, с чем сравнивать, лежит в mysql (там под миллион строк в таблице с постами, объем базы 1.5 гига)
Спасибо сказали: