Какое-то время назад видел в интернете проект (о фильтрации текста страниц.)
Модератор: Модераторы разделов
Какое-то время назад видел в интернете проект
Видел проект по созданию некоторого фильтра для страниц в интернете. Типа "не хочу видеть новости про политику", ввожу слово "политика" и получаю на том же Яндексе почти пустую страницу.
Теперь найти не могу. Необязательно именно тот проект - важен сам принцип подобного.
Может кто знает, как это можно сделать ?
P.S. Совершенно не помню, был ли это плагин к браузеру или еще что. А может и просто приснилось.
Теперь найти не могу. Необязательно именно тот проект - важен сам принцип подобного.
Может кто знает, как это можно сделать ?
P.S. Совершенно не помню, был ли это плагин к браузеру или еще что. А может и просто приснилось.
Re: Какое-то время назад видел в интернете проект
Не, я не про это. Просто, захожу на любой сайт (в оригинале вроде было за поисковики) и не вижу блоков текста с вариантами текста "политика". Я не хочу что-то не то, что бы искать, я не хочу это видеть вообще. Никогда.
Хотя, может мне такое и приснилось...
Хотя, может мне такое и приснилось...
Re: Какое-то время назад видел в интернете проект
дополнение foxreplace может делать замену по регулярной маске. Логично, что можно настроить его на замену текста целыми предложениями на пустое поле.
Жуть... Надеюсь, вы это не для себя делаете.
Жуть... Надеюсь, вы это не для себя делаете.
Re: Какое-то время назад видел в интернете проект
Для себя.
Допустим, я плохо реагирую на многие вещи, типа политики, убийств и некоторых других. Сильно портится настроение.
Поэтому, хотелось бы этого просто не видеть. Причем, желательно, как то сделать так, чтобы страница не "поехала" от изменений.
Дополнение я посмотрю, конечно. Спасибо.
Но, хотелось бы понять принцип, как именно можно такое сделать.
P.S. У каждого свои тараканы в голове.
Допустим, я плохо реагирую на многие вещи, типа политики, убийств и некоторых других. Сильно портится настроение.
Поэтому, хотелось бы этого просто не видеть. Причем, желательно, как то сделать так, чтобы страница не "поехала" от изменений.
Дополнение я посмотрю, конечно. Спасибо.
Но, хотелось бы понять принцип, как именно можно такое сделать.
P.S. У каждого свои тараканы в голове.
Re: Какое-то время назад видел в интернете проект
devilr
Идеально, как обычно, невозможно. Если блоки внешние, вроде рекламы, то можно что-то вроде AdBlock только реагировать не на URL, а не содержимое. Ну, а если идёт текст, а там внезапно абзац про политику и убийства... гарантировать, что ничего не поедет сложно. Но всё равно можно. Берём DOM, ищем стоп-слова, удаляем блоки (например, div и p), которые содержат эти слова. Готово, страницу раскорячило :)
Идеально, как обычно, невозможно. Если блоки внешние, вроде рекламы, то можно что-то вроде AdBlock только реагировать не на URL, а не содержимое. Ну, а если идёт текст, а там внезапно абзац про политику и убийства... гарантировать, что ничего не поедет сложно. Но всё равно можно. Берём DOM, ищем стоп-слова, удаляем блоки (например, div и p), которые содержат эти слова. Готово, страницу раскорячило :)
Re: Какое-то время назад видел в интернете проект
А может, просто последовать рекомендации знаменитого некогда рукопашника Нила Ознобишина? И не шляться ночами по улицам, пользующимся дурной репутацией? То есть - не заходить на такие сайты?
Я вот - не захожу, и прекрасно себя чувствую... Заодно и всякой разной другой дряни не вижу, не только политики.
Спасибо сказали:
Re: Какое-то время назад видел в интернете проект
NickLion писал(а): ↑15.10.2017 14:40devilr
Идеально, как обычно, невозможно. Если блоки внешние, вроде рекламы, то можно что-то вроде AdBlock только реагировать не на URL, а не содержимое. Ну, а если идёт текст, а там внезапно абзац про политику и убийства... гарантировать, что ничего не поедет сложно. Но всё равно можно. Берём DOM, ищем стоп-слова, удаляем блоки (например, div и p), которые содержат эти слова. Готово, страницу раскорячило
Именно на содержимое. Кстати, чтобы страницу "не раскорячило" можно в нужных блоках выставить одинаковые цвета. Или, как-то, заменять все символы в блоке на какие-то другие с таким же размером. Но, это явно сложнее...
Re: Какое-то время назад видел в интернете проект
А чем мой вариант с плагином не подошёл? Вроде то, что надо ведь.
Re: Какое-то время назад видел в интернете проект
Я не говорил, что не подойдет. Его просто доработать надо. Пока думаю, как...
Re: Какое-то время назад видел в интернете проект
Осталось его там найти. Обсуждение это...
Re: Какое-то время назад видел в интернете проект
В первом приближении можно вообще что-то такое использовать:
for(el of document.getElementsByTagName("*")) { if (Array.from(el.childNodes).some((n) => n.nodeType === Node.TEXT_NODE && n.data.includes('политик'))) { el.style.setProperty('color', 'transparent'); } }
Но оно убирает наименьший елемент, который включает текст, т.е. может скрыть пол абзаца, если есть выделение, например, курсивом. Лучше будет проверять по p и div, и проверять рекурсивно по другим елементам вроде span, b/strong и т.д.
И может быть лучше не color: transparent (скрывает текст, оставляет картинки и фон), а visibility: hidden (полностью блок) ставить.
for(el of document.getElementsByTagName("*")) { if (Array.from(el.childNodes).some((n) => n.nodeType === Node.TEXT_NODE && n.data.includes('политик'))) { el.style.setProperty('color', 'transparent'); } }
Но оно убирает наименьший елемент, который включает текст, т.е. может скрыть пол абзаца, если есть выделение, например, курсивом. Лучше будет проверять по p и div, и проверять рекурсивно по другим елементам вроде span, b/strong и т.д.
И может быть лучше не color: transparent (скрывает текст, оставляет картинки и фон), а visibility: hidden (полностью блок) ставить.
Re: Какое-то время назад видел в интернете проект
C хабра, однако, неформальное общение с автором зачистили:( Вот с другого сайта https://vc.ru/5981-good-media
И еще по теме
https://habrahabr.ru/company/riddut/blog/296418/
https://habrahabr.ru/post/66221/
https://habrahabr.ru/search/?q=[информационный шум]&type=posts
Спасибо сказали: