Состязательный поиск информации (Состязательный IR ) - это тема в поиске информации, связанная со стратегиями работы с источником данных, часть которого была подвергнута злонамеренным манипуляциям. Задачи могут включать в себя сбор, индексацию, фильтрацию, извлечение и ранжирование информации из такого источника данных. Adversarial IR включает изучение методов обнаружения, выделения и пресечения таких манипуляций.
В Интернете преобладающей формой таких манипуляций является рассылка спама поисковыми системами (также известная как спамдексинг), которая включает использование различных методов для нарушения деятельности поисковых систем, обычно ради финансовой выгоды. Примеры спамодекса: бомбардировка ссылок, комментарий или реферер-спам, спам-блоги (сплоги), вредоносные теги. Обратный инжиниринг из алгоритмов ранжирования, блокировка рекламы, мошенничество с кликами и фильтрация веб-контента. формы враждебного манипулирования данными.
Темы связанный с веб-спамом (спамодексинг):
Другие темы:
Термин «состязательный поиск информации» впервые был введен в 2000 году Андреем Бродером (в то время главным научным сотрудником Alta Vista ) во время веб-пленарное заседание на конференции TREC -9.