Поиск Яндекса

редактировать
Поиск Яндекса
Яндекс Logo.svg Логотип английской версии
Тип сайтаПоисковая система в Интернете
Доступно вМногоязычный
ВладелецЯндекс
СоздалАркадий Волож. Аркадий Борковский. Илья Сегалович
URLЯндекс.com
КоммерческийДа
РегистрацияНеобязательно
Текущий статусАктивный

Яндекс Поиск - это поисковая система в Интернете, которая принадлежит российской корпорации Яндекс. Это основной продукт Яндекс. По данным [ru ; uk ].

Contents

  • 1 О
  • 2 Функциональность
    • 2.1 Основная информация
    • 2.2 Индексирование
    • 2.3 Журналы сервера, в январе 2015 года сгенерировано 51,2% всего поискового трафика в России.
    • 2.4 Язык запроса
    • 2.5 Результаты поиска
    • 2.6 Защита от спама и вирусов
    • 2.7 Рейтинг поиска
    • 2.8 Подсказки поиска
  • 3 История
    • 3.1 1990-е годы
    • 3.2 2000
    • 3,3 2001
    • 3,4 2002
    • 3,5 2003
    • 3,6 2004
    • 3,7 2005
    • 3,8 2006
    • 3,9 2007
    • 3,10 2008
  • 4 Достижения Яндекса
  • 5 Логотип
  • 6 Ссылки
  • 7 Внешние ссылки

О

Технология поиска обеспечивает местный поиск в более чем 1400 городах. Яндекс.Поиск также предлагает «параллельный» поиск, который представляет результаты как из основного веб-индекса, так и из специализированных информационных ресурсов, включая новости, покупки, блоги, изображения и видео на одной странице.

Яндекс.Поиск реагирует на запросы в режиме реального времени, распознавая, когда запрос требует самой последней информации, такой как последние новости или последняя запись в Twitter по определенной теме. Он также содержит некоторые дополнительные функции: ответ мастера, который предоставляет дополнительную информацию (например, спортивные результаты), проверка орфографии, автозаполнение, которое предлагает запросы по мере ввода, антивирус, который обнаруживает вредоносное ПО на веб-страницах и т. Д.

В мае 2010 года Яндекс запустил Yandex.com, платформу для бета-тестирования и улучшения поиска на нерусских языках.

Доступ к поисковому продукту можно получить с персональных компьютеров, мобильных телефонов, планшетов и других цифровых устройств. Помимо веб-поиска, Яндекс предоставляет широкий спектр специализированных поисковых сервисов.

В 2009 году Яндекс запустил MatrixNet - новый метод машинного обучения, который значительно повышает релевантность результатов поиска. Это позволяет поисковой системе Яндекса учитывать очень большое количество факторов при принятии решения о релевантности результатов поиска.

Еще одна технология, Spectrum, была запущена в 2010 году. Она позволяет выводить неявные запросы и возвращение совпадающих результатов поиска. Система автоматически анализирует поисковые запросы пользователей и идентифицирует такие объекты, как личные имена, фильмы или автомобили. Пропорции результатов поиска, отвечающие различным намерениям пользователей, основаны на потребности пользователей в этих результатах.

С первым выпуском 21 июля 2017 года в веб-браузере Brave Яндекс стал одним из поисковые системы по умолчанию.

Функциональные возможности

Основная информация

Поисковая машина состоит из трех основных компонентов:

  1. Агент - это поисковый робот. Он обходит сеть, скачивает и анализирует документы. Если при анализе сайта обнаруживается новая ссылка, она попадает в список веб-адресов робота. Поисковые роботы бывают следующих типов: пауки - скачивают сайты как браузеры пользователя; Crawler - обнаруживайте новые, пока неизвестные ссылки на основе анализа уже известных документов; индексаторы - анализируют обнаруженные веб-страницы и добавляют данные в индекс. Многие дефлированные документы делятся на непересекающиеся части и очищаются от разметки.
  2. Индекс - это база данных, составленная роботами индексирования поисковой системы. Документы ищутся в индексе.
  3. Поисковая машина. Поисковый запрос от пользователя отправляется на наименее загруженный сервер после анализа нагрузки поисковой системы. Для такой возможности серверы Яндекса объединены в кластеры. Затем запрос пользователя обрабатывается программой «Метапоиск». Метапоиск анализирует запрос в реальном времени: определяет географическое положение пользователя, проводит лингвистический анализ и т. Д. Программа также определяет, относится ли запрос к категории самых популярных или недавно определенных. Выдача таких запросов на некоторое время хранится в памяти (кеше) метапоиска, и в случае совпадения отображаются ранее сохраненные результаты. Если запрос является редким и в кэше нет совпадений, система перенаправляет его в программу базового поиска. Он анализирует системный индекс, который также разбивается на разные дублирующие серверы (это ускоряет процедуру). Затем полученная информация снова попадает в мета-поиск, данные ранжируются и показываются пользователю в окончательном виде.

Индексирование

В целом Яндекс индексирует следующие типы файлов: html, pdf, rtf, doc, xls, ppt, docx, odt, odp, ods, odg, xlsx, pptx.

Поисковая система также может индексировать текст внутри объектов Shockwave Flash (если текст не помещается на самом изображении), если эти элементы переданы как отдельная страница, имеющая MIME-тип application / x-shockwave-flash, а файлы с расширением.swf

у Яндекса 2 сканирующих робота - «основной» и «быстрый». Первый отвечает за весь Интернет, второй индексирует сайты с часто меняющейся и обновляемой информацией (новостные сайты и информационные агентства). В 2010 году «быстрый» робот получил новую технологию под названием «Orange», разработанную совместно калифорнийским и московским подразделениями Яндекса.

С 2009 года Яндекс поддерживает технологию Sitemaps.

Журналы сервера

В журналах сервера роботы Яндекса представлены следующим образом:

  • Mozilla / 5.0 (совместимый; ЯндексБот / 3.0)- основной робот-индексатор.
  • Mozilla / 5.0 (совместимый; ЯндексБот / 3.0; MirrorDetector)- робот, обнаруживающий зеркала сайтов. При наличии нескольких сайтов с одинаковым содержанием в результатах поиска будет отображаться только один.
  • Mozilla / 5.0 (совместимый; YandexImages / 3.0)- индексатор Яндекс. Изображения.
  • Mozilla / 5.0 (совместимо; ЯндексВидео / 3.0)- индексатор Яндекс. Видео.
  • Mozilla / 5.0 (совместимый; ЯндексМедиа / 3.0)- индексатор мультимедийных данных.
  • Mozilla / 5.0 (совместимый; ЯндексБлоги / 0.99; робот)- поисковый робот, который индексирует комментарии к сообщениям.
  • Mozilla / 5.0 (совместимый; YandexAddurl / 2.0)- поисковый робот, который индексирует страницы через форму «Добавить URL ».
  • Mozilla / 5.0 (совместимый; ЯндексДирект / 2.0 ; Дятел)- проверка Яндекс. Директ.
  • Mozilla / 5.0 (совместимый; ЯндексМетрика / 2.0)- индексатор Яндекс. Метрики.
  • Mozilla / 5.0 (совместимый; ЯндексКаталог / 3.0; Дятел)- проверка Яндекс. Каталог.
  • Mozilla / 5.0 (совместимо; ЯндексНовости / 3.0)- индексатор Яндекс. Новости.
  • Mozilla / 5.0 (совместимый; ЯндексАнтивирус / 2.0)- Антивирусный робот Яндекса.

Язык запросов

Для настройки используются следующие операторы:

  • ""- точная цитата
  • |- вводить между словами, если нужно найти одно из них
  • *- вводить между словами, если какое-то слово отсутствует
  • site:- поиск на конкретном сайте
  • дата:- искать документы по дате, например, date: 2007
  • +- введите перед словом, которое должно быть в документе

Результаты поиска

Яндекс, автоматически вместе с исходным «точным форма »запроса, ищет его различные варианты и формулировки.

Поиск Яндекс учитывает морфологию русского языка, поэтому независимо от формы слова в поисковом запросе поиск будет выполняться для всех словоформ. Если морфологический анализ нежелателен, можно поставить восклицательный знак (!) Перед словом - поиск в этом случае покажет только конкретную форму слова. Кроме того, поисковый запрос практически не учитывает так называемые стоп-слова, то есть предлоги, знаки препинания, местоимения и т. Д., в связи с их широким распространением

Как правило, сокращения раскрываются автоматически, орфография корректируется. Он также ищет синонимы (мобильный - сотовый). Расширение исходного запроса пользователя зависит от контекста. Расширение не происходит, когда набор узкоспециализированных терминов, названий собственных имен компаний (например, ОАО «Бегемот» - ОАО «Бегемот»), добавляя слово «цена», в точных кавычках (это запросы, выделенные пишущей машинкой цитаты).

Результаты поиска для каждого пользователя формируются индивидуально на основе их местонахождения, языка запроса, интересов и предпочтений на основе результатов предыдущих и текущих сеансов поиска. Однако ключевым фактором ранжирования результатов поиска является их соответствие поисковому запросу. Релевантность определяется на основе формулы ранжирования, которая постоянно обновляется на основе алгоритмов машинного обучения.

Поиск ведется на русском, английском, французском, немецком, украинском, Белорусский, Татарский, Казахский.

Результаты поиска можно сортировать по релевантности и по дате (кнопки под результатами поиска).

Страница с результатами поиска состоит из 10 ссылок с короткими аннотациями - «сниппетами». Сниппеты включают текстовый комментарий, ссылку, адрес, популярные разделы сайта, страницы в социальных сетях и т. Д. В качестве альтернативы сниппетам Яндекс представил в 2014 году новый интерфейс под названием «Острова».

Яндекс реализует механизм «параллельного поиска», когда вместе с поиском в сети выполняется поиск по сервисам Яндекса, таким как Каталог, Новости, Маркет, Энциклопедии, Изображения и т. д. В результате в ответ на запрос пользователя система показывает не только текстовая информация, но и ссылки на видеофайлы, изображения, словарные статьи и т. д.

Отличительной особенностью поисковой машины также является технология «намеренного поиска», что означает поиск решения проблемы. К элементам намеренного поиска относятся - диалоговые подсказки при неоднозначном запросе, автоматический перевод текста, информация о характеристиках запрашиваемого автомобиля и др. Например, при запросе «Борис Гребенщиков - Золотой город» система покажет форму для онлайн прослушивания музыки из сервиса Yandex Music, по запросу «ул. Королева 12» будет показан фрагмент карты с отмеченным объектом на Это.

Защита от спама и вирусов

В 2013 году некоторые считали Яндекс самой безопасной поисковой системой в то время и третьей по безопасности среди всех веб-ресурсов. К 2016 году Яндекс поскользнулся до третьего места, где Google был первым.

Проверка веб-страниц и предупреждение пользователей появились на Яндексе в 2009 году: с тех пор на странице результатов поиска рядом с опасным сайтом появляется пометка «Этот сайт может угрожать безопасность вашего компьютера ». Для обнаружения угроз используются сразу две технологии. Первый был приобретен у американского антивируса Sophos и основан на сигнатурном подходе: это означает, что при доступе к веб-странице система антивирус также обращается к базе данных уже известных вирусов и вредоносных программ. Этот подход быстр, но практически бессилен против новых вирусов, которые еще не вошли в базу данных. Поэтому Яндекс наряду с сигнатурой также использует собственный антивирусный комплекс, основанный на анализе поведенческого фактора. Программа Яндекс при обращении к сайту проверяет, запрашивал ли последний у браузера дополнительные файлы, перенаправлял ли его на сторонний ресурс и т. Д. Таким образом, если получена информация о том, что сайт начинает выполнять определенные действия (каскадные таблицы стилей, JavaScript модули запускаются и завершают программы) без разрешения пользователя, помещается в «черный список» и в базу сигнатур вирусов. Информация о заражении сайта появляется в результатах поиска, а через сервис Яндекс.Вебмастер владелец сайта получает уведомление. После первой проверки Яндекс выполняет вторую, и при повторном подтверждении информации о заражении проверки будут проводиться чаще, пока угроза не будет устранена. Общее количество зараженных сайтов в базе данных Яндекса не превышает 1%.

Ежедневно в 2013 году Яндекс проверяет 23 миллиона веб-страниц (при обнаружении 4 300 опасных сайтов) и показывает пользователям 8 миллионов предупреждений. Ежемесячно проверяется около миллиарда сайтов.

Поисковый рейтинг

Долгое время ключевым фактором ранжирования для Яндекса было количество сторонних ссылок на конкретный сайт. Каждой странице в Интернете был присвоен уникальный индекс цитирования, аналогичный индексу авторов научных статей: чем больше ссылок, тем лучше. Аналогичный механизм был реализован в Яндексе и Google PageRank. Для предотвращения накрутки Яндекс использует многовариантный анализ, в котором только 70 из 800 факторов зависят от количества сторонних ссылок. Сегодня гораздо большую роль играет контент сайта и наличие или отсутствие там ключевых слов, удобство чтения текста, название домена, его история и наличие мультимедийного контента.

5 декабря 2013 года Яндекс объявил о полном отказе от учета ссылочного фактора в будущем.

Подсказки при поиске

По мере того, как пользователь вводит запрос в строке поиска, поисковая система предлагает подсказки в виде раскрывающегося списка. Подсказки появляются еще до появления результатов поиска и позволяют уточнить запрос, исправить макет или опечатку или перейти непосредственно на сайт, который вы ищете. Для каждого пользователя генерируются подсказки, в том числе по истории его поисковых запросов (сервис My Finds). В 2012 году появились так называемые «подсказки интеллектуального поиска», которые мгновенно выдают информацию об основных константах (длина экватора, скорость света и т. Д.), Пробках и имеют встроенный калькулятор. Кроме того, переводчик был интегрирован в «Подсказки» (запрос «любовь по-французски» мгновенно выдает любовь, привязанность), расписание и результаты футбольных матчей, курсы валют, прогнозы погоды и многое другое. Вы можете узнать точное время, спросив «который час». В 2011 году подсказки в поиске Яндекса стали полностью локальными в 83 регионах России.

Помимо собственно поиска, подсказки встроены в поисковые системы Яндекса. Словари »,« Яндекс. Маркет »,« Яндекс. Карты »и другие сервисы Яндекса.

Функция подсказки является следствием развития технологии поиска по намерениям и впервые появилась на Яндекс.Баре в августе 2007 года, а в октябре 2008 года была представлена ​​на главная страница поисковой системы. Доступен как в настольной, так и в мобильной версии сайта, Яндекс показывает своим пользователям более миллиарда поисковых подсказок в день

История

Изменения в поисковой системе долгое время не были широко представлены и оставались безымянными, и только с начала 2008 года, когда было объявлено о запуске алгоритма 8 SP1, Яндекс объявил, что отныне новые алгоритмы ранжирования будут носить названия городов.

1990-е годы

Название системы - Яндекс - придумали вместе Аркадий Волож и Илья Сегалович.

Слово расшифровывается как y et и другое в dex er (или как «Я ("ya" на русском языке) и индекс ) ». Согласно интерпретации Артемия Лебедева, название поисковой системы созвучно с Яндекс, где ян означает мужское начало,

Поисковая система yandex.ru была анонсирована CompTek в сентябре 23 декабря 1997 г. на выставке Softool, хотя некоторые разработки в области поиска (Библия индексация, поиск документов на CD-ROM, поиск по сайту) были осуществлены компанией даже ранее.

Первый индекс содержал информацию о 5 тысячах серверов и занимал 4,5 ГБ.

В том же 1997 году поиск Яндекса стал использоваться в русской версии Internet Explorer 4,0. Появилась возможность делать запросы на естественном языке.

В 1998 году для каждого результата поиска появилась функция «найти похожие документы».

«Яндекс. Поиск »по состоянию на 1998 год работал на трех машинах, работающих на FreeBSD под Apache : одна машина просматривала Интернет и индексировала документы, одна поисковая машина и одна машина дублировала поисковую машину.

В 1999 году поиск появился по категориям - поиск, сочетание поисковой системы и каталога. Обновлена ​​версия поисковой машины.

2000

6 июня 2000 года была представлена ​​вторая версия поисковой машины. Был введен механизм параллельного поиска, и наряду с выдачей информация предлагалась из крупных источников. Пользователи смогли ограничить результаты поиска выбранной темой. Появился заголовок «Популярные находки» - слова, уточняющие поиск.

В декабре 2000 г. объем проиндексированной информации достиг 355,22 ГБ.

2001

В 2001 г. Яндекс обогнал другую российскую поисковую систему Рамблер по посещаемости и стал ведущей поисковой системой Рунета. Яндекс начал понимать запросы на естественном языке, которые задавались в вопросительной форме. Система научилась распознавать опечатки и предлагать их исправить. Изменился дизайн.

2002

Количество ежедневных запросов к поисковой системе Яндекс превысило 2 миллиона

2003

Индексирование. rtf Запущены документы и. pdf. Результаты поиска стали выдавать в том числе в формате XML.

2004

Изменился алгоритм ранжирования.

Яндекс начал индексацию документов в. swf (Flash ). xls и. ppt форматы.

В конце года исследование «Некоторые аспекты полнотекстового поиска и ранжирования в Яндексе »(авторы Илья Сегалович, Михаил Маслов), которая раскрыла некоторые детали ранжирования в поисковой системе.

2005

Летом был запущен так называемый «быстрый» поисковый робот, работающий параллельно с реальными страницами, предназначенными для индексации. База «быстрого робота» обновляется каждые 1,5–2 часа.

Доработан алгоритм ранжирования для повышения точности поиска.

Возможности поиска расширены с помощью Яндекс. Словари »и« Яндекс. Lingvo ». Поисковая система научилась понимать запросы типа« Что такое [что-то] по-испански »и автоматически переводить их.

Появилась возможность ограничивать результаты поиска по регионам.

2006

С мая 2006 года значки сайтов отображались в результатах поиска.

В начале декабря рядом с каждой ссылкой в ​​результатах поиска появлялся пункт «Сохраненная копия», нажав на который, пользователь переходит к полной копии страницы в специальном архиве БД («Яндекс-кеш»).

2007

Снова изменен алгоритм ранжирования.

2008

В 2008 году Яндекс впервые начал открыто анонсировать изменения в алгоритме поиска и стал называть изменения названиями городов России. город »каждого последующего алгоритма начинается с буквы, которой заканчивалось название предыдущего.

Достижения Яндекса

Практически уникален прецедент, когда локальные поисковые компании не уступают американским брендам. В мире, если не брать во внимание опыт Китая, где Google был заблокирован в 2010 году, почтовые ящики правозащитников взламывают, а местные провайдеры часто перенаправляют адрес www.google.cn - Baidu. Также следует отметить, что Россия - единственная страна в мире, за исключением США, которая без протекционистских мер создала не одну успешную поисковую технологию. со значительной долей рынка (см. Также Рамблер ).

По мнению медиа-эксперта Михаила Гуревича, Яндекс - «национальное достояние», «стратегический продукт».

Этот факт также был признан в Государственной Думе Российской Федерации, где в мае 2012 года появился закон, в котором Яндекс и ВКонтакте признаны стратегическими предприятиями национальными переводчиками информации. 2009 г. Президент России Дмитрий Медведев инициировал покупку золотой акции «Яндекса» Сбербанком во избежание попадания в иностранные руки важной общенациональной компании..

В 2012 году Яндекс обогнал Первый канал по дневной аудитории, что сделало Яндекс лидером отечественного медиарынка. подтвердил этот статус, обогнав по доходам «Первую».

В 2008 году Яндекс был девятой поисковой системой в мире, в 2009 - седьмой, а в 2013 - четвертой.

Одна из самых популярных поисковых систем в мире. Составляющими этой ситуации является наличие в России достаточного количества математически подкованных специалистов с научным чутьем.

К 2002 году слово «Яндекс» стало настолько распространенным, что когда компания Аркадия Воложа потребовал вернуть домен yandex.com, купленный третьими лицами, ответчик заявил, что слово «Яндекс» уже стало синонимом поиска и стало нарицательным в России.

С конца 2012 года Яндекс поисковая система превзошла количество пользователей Google в браузере Google Chrome в России.

Логотип

Русская версия логотипа

Логотип Яндекса появляется во многих настройках для идентификации поисковой компании. Яндекс использовал несколько логотипов с момента своего переименования. Первый логотип был создан Аркадием Воложом и дебютировал в 1997 году в продуктах Яндекс.Site и Яндекс.CD, еще до анонса поисковой системы Яндекс. Логотип был разработан аналогом логотипа CompTek.

С 1997 года логотипы разрабатываются по ст. Студия Лебедева, - разработала четыре версии. Действующий логотип с использованием кириллицы.

Ссылки

Внешние ссылки

Последняя правка сделана 2021-06-22 10:14:28
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте