Состязательный поиск информации

редактировать
Стратегии извлечения информации в наборах данных

Состязательный поиск информации (Состязательный IR ) - это тема в поиске информации, связанная со стратегиями работы с источником данных, часть которого была подвергнута злонамеренным манипуляциям. Задачи могут включать в себя сбор, индексацию, фильтрацию, извлечение и ранжирование информации из такого источника данных. Adversarial IR включает изучение методов обнаружения, выделения и пресечения таких манипуляций.

В Интернете преобладающей формой таких манипуляций является рассылка спама поисковыми системами (также известная как спамдексинг), которая включает использование различных методов для нарушения деятельности поисковых систем, обычно ради финансовой выгоды. Примеры спамодекса: бомбардировка ссылок, комментарий или реферер-спам, спам-блоги (сплоги), вредоносные теги. Обратный инжиниринг из алгоритмов ранжирования, блокировка рекламы, мошенничество с кликами и фильтрация веб-контента. формы враждебного манипулирования данными.

Содержание
  • 1 Темы
  • 2 История
  • 3 См. также
  • 4 Ссылки
  • 5 Внешние ссылки
Темы

Темы связанный с веб-спамом (спамодексинг):

Другие темы:

История

Термин «состязательный поиск информации» впервые был введен в 2000 году Андреем Бродером (в то время главным научным сотрудником Alta Vista ) во время веб-пленарное заседание на конференции TREC -9.

См. также
Ссылки
Внешние ссылки
  • AIRWeb : серия семинаров по состязательному поиску информации в Интернете
  • Web Spam Challenge : конкурс для исследователей по обнаружению веб-спама
  • Наборы данных веб-спама : наборы данных для исследований по обнаружению веб-спама
Последняя правка сделана 2021-06-10 02:20:08
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте