есть форум, движок на php, данные - в mysql
есть проблема, что иногда берут, и копируют существующий пост (почему - это отдельная тема, но поверьте, бывает такое).
но далеко не всегда целиком, т.е. какая-то часть поста может и отличаться.
что посоветуете, чтобы проверять похожесть текста?
как сличать на php похожесть текста?
Модератор: Модераторы разделов
-
sash-kan
- Администратор
- Сообщения: 13939
- Статус: oel ngati kameie
- ОС: GNU
Re: как сличать на php похожесть текста?
diff ?
p.s. а зачем проверять?
p.s. а зачем проверять?
Писать безграмотно - значит посягать на время людей, к которым мы адресуемся, а потому совершенно недопустимо в правильно организованном обществе. © Щерба Л. В., 1957
при сбоях форума см.блог
при сбоях форума см.блог
-
tull
- Сообщения: 484
Re: как сличать на php похожесть текста?
не в обиду, но вы похоже не читали вопрос
зачем написано - потому что есть такая проблема, что юзеры пишут посты-дубли. это мешает в силу специфики форума.
что такое diff я не знаю, такой ф-ии в php нет
кроме того, то, с чем сравнивать, лежит в mysql (там под миллион строк в таблице с постами, объем базы 1.5 гига)