Запрос веб-поиска

редактировать
запрос, который пользователь вводит в систему веб-поиска

A запрос веб-поиска - это запрос, основанный на конкретный поисковый запрос, который пользователь вводит в поисковую систему, чтобы удовлетворить свои информационные потребности. Запросы веб-поиска отличаются тем, что они часто представляют собой обычный текст или гипертекст с необязательными директивами поиска (такими как "и" / "или" с "-" для исключения). Они сильно отличаются от стандартных языков запросов, которые регулируются строгими синтаксическими правилами, как языки команд с ключевыми словами или позиционными параметрами .

Содержание

  • 1 Типы
  • 2 Структурированные запросы
  • 3 См. Также
  • 4 Ссылки

Типы

Существует три широких категории, которые охватывают большинство поисковых запросов в Интернете: информационные, навигационные и транзакционные. Их также называют «делай, знай, иди». Хотя эта модель поиска не была получена теоретически, классификация была подтверждена эмпирически с помощью реальных запросов поисковых систем.

  • Информационные запросы - запросы, охватывающие широкую тему (например, Колорадо или грузовики), для которых могут быть тысячи релевантных результатов.
  • Навигационные запросы - Запросы, которые ищут отдельный веб-сайт или веб-страницу одного объекта (например, YouTube или дельта-авиалинии).
  • Транзакционные запросы - Запросы, отражающие намерение пользователя для выполнения определенного действия, например покупки автомобиля или загрузки экранной заставки.

Поисковые системы часто поддерживают четвертый тип запроса, который используется гораздо реже:

  • запросы подключения - запросы, которые сообщают о связности проиндексированного веб-графа (например, какие ссылки указывают на этот URL ? и сколько страниц проиндексировано с этого доменного имени ?).

== Характеристики

Список поисковых предложений для поискового запроса

Самая коммерческая поисковая система в Интернете. Они не раскрывают свои журналы поиска, поэтому трудно получить информацию о том, что пользователи ищут в Интернете. Тем не менее, в 1998 г. появились исследования. Позже исследование 2001 г., проанализировав запросы поисковой системы Excite, показало некоторые интересные характеристики веб-поиска:

  • Средняя длина поискового запроса составляла 2,4 термина.
  • Около половины пользователей вводили один запрос, в то время как чуть менее трети пользователей вводили три или более уникальных запроса.
  • Почти половина пользователей исследовали только первые один или два страницы результатов (10 результатов на странице).
  • Менее 5% пользователей использовали расширенные функции поиска (например, логические операторы, такие как AND, OR и NOT).
  • Четыре наиболее часто используемых термина: (пустой поиск) и, of и sex.

Исследование тех же журналов запросов Excite показало, что 19% запросов содержали географические термины (например, названия мест, почтовые индексы, географические особенности и т. д.). Исследования также показывают, что помимо коротких запросов (то есть запросов с небольшим количеством терминов) существуют также предсказуемые закономерности того, как пользователи меняют свои запросы.

Исследование журналов запросов Yahoo в 2005 году выявило 33% запросов. от одного и того же пользователя были повторные запросы, и в 87% случаев пользователь нажимал на тот же результат. Это говорит о том, что многие пользователи используют повторяющиеся запросы для повторного посещения или повторного поиска информации. Этот анализ подтверждается сообщением в блоге поисковой системы Bing, в котором говорится, что около 30% запросов являются навигационными запросами

Кроме того, многие исследования показали, что частотное распределение терминов запросов соответствует степенному закону или кривые распределения длинного хвоста. То есть небольшая часть терминов, наблюдаемых в большом журнале запросов (например,>100 миллионов запросов), используется чаще всего, в то время как остальные термины используются реже по отдельности. Этот пример принципа Парето (или правила 80–20) позволяет поисковым системам использовать такие функции, как индексирование или разбиение базы данных, кэширование и предварительная выборка. Кроме того, были проведены исследования по обнаружению лингвистически ориентированных атрибутов, которые могут распознать, является ли веб-запрос навигационным, информационным или транзакционным.

Но в недавнем исследовании 2011 года было обнаружено, что средняя длина запросов со временем неуклонно росла, а средняя длина запросов на языках, отличных от английского, увеличилась больше, чем на английском языке. Google внедрил обновление hummingbird в августе 2013 года, чтобы обрабатывать более длинные поисковые запросы, поскольку все больше запросов носят разговорный характер (например, «где ближайшая кофейня?»). Для более длинных запросов помогает Обработка естественного языка, поскольку деревья синтаксического анализа запросов могут быть сопоставлены с деревьями синтаксического анализа ответов и их фрагментов. Для запросов с несколькими предложениями, где статистика ключевых слов и Tf – idf не очень полезны, используется метод Parse чаще для структурного представления сложных вопросов и ответов.

Структурированный запросы

С поисковыми системами, поддерживающими логические операторы и круглые скобки, можно применить метод, традиционно используемый библиотекарями. Пользователь, который ищет документы, охватывающие несколько тем или аспектов, может захотеть описать каждый из них с помощью дизъюнкции характерных слов, таких как автомобили ИЛИ автомобили ИЛИ автомобили. Фасетный запрос - это соединение таких фасетов; например такой запрос, как (электронное ИЛИ компьютеризированное ИЛИ DRE) И (голосование ИЛИ выборы ИЛИ выборы ИЛИ голосование ИЛИ выборы), скорее всего, найдет документы об электронном голосовании, даже если они опускают одно из слов «электронное» и голосование "или даже то и другое.

См. также

Ссылки

Последняя правка сделана 2021-06-20 10:30:15
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте