Apache Solr

редактировать
Solr
Solr logo
Разработчик Apache Software Foundation
Стабильный выпуск 8.6.3 / 7 октября 2020 г.; 6 дней назад (07.10.2020)
Репозиторий Solr Repository
Написано наJava
Операционная система Кросс-платформенная
Тип Поиск и index API
Лицензия Лицензия Apache 2.0
Веб-сайтlucene.apache.org / solr / Измените это в Wikidata

Solr (произносится как «солнечный») - это открытый источник платформа корпоративного поиска, написанная на Java, из Apache Lucene проект. Его основные функции включают полнотекстовый поиск, выделение совпадений, фасетный поиск, индексирование в реальном времени, динамическую кластеризацию, интеграцию с базами данных, NoSQL функции и расширенный документ ( например, Word, PDF). Обеспечивая распределенный поиск и репликацию индексов, Solr разработан для обеспечения масштабируемости и отказоустойчивости. Solr широко используется для примеров использования корпоративного поиска и аналитики, имеет активное сообщество разработчиков и регулярные выпуски.

Solr работает как автономный сервер полнотекстового поиска. В его основе лежит поисковая библиотека Java Lucene для полнотекстового индексирования и поиска, а также REST -подобие HTTP / XML и JSON API, которые позволяют использовать его из большинства популярных языков программирования. Внешняя конфигурация Solr позволяет адаптировать его ко многим типам приложений без программирования на Java, и он имеет архитектуру плагинов для поддержки более продвинутой настройки.

Apache Lucene и Apache Solr созданы одной и той же командой разработчиков Apache Software Foundation.

Содержание
  • 1 История
  • 2 Операции
  • 3 Сообщество
  • 4 Интеграция Solr
  • 5 См. Также
  • 6 Ссылки
  • 7 Библиография
  • 8 Внешние ссылки
История

В 2004 году Йоник Сили создал Solr в CNET Networks как собственный проект по добавлению возможностей поиска на веб-сайт компании.

В январе 2006 года CNET Networks решила открыто опубликовать исходный код, пожертвовав его Apache Software Foundation. Как и любой новый проект Apache, он вступил в инкубационный период, который помог решить организационные, правовые и финансовые вопросы.

В январе 2007 года Solr перешел из инкубационного статуса в автономный проект верхнего уровня (TLP) и неуклонно рос за счет накопленных функций, тем самым привлекая пользователей, участников и коммиттеров. Несмотря на то, что он был довольно новым в качестве общедоступного проекта, он поддерживал несколько веб-сайтов с высоким трафиком.

В сентябре 2008 года был выпущен Solr 1.3, включающий, среди прочего, возможности распределенного поиска и улучшения производительности.

В январе 2009 Йоник Сили вместе с Грантом Ингерсоллом и Эриком Хэтчером присоединились к Lucidworks (ранее Lucid Imagination), первой компании, предоставляющей коммерческую поддержку и обучение технологиям поиска Apache Solr. С тех пор предложения поддержки вокруг Solr были многочисленны.

В ноябре 2009 г. был выпущен Solr 1.4. В этой версии представлены усовершенствования в индексировании, поиске и фасетировании, а также множество других улучшений, таких как расширенная обработка документов (PDF, Word, HTML ), кластеризация результатов поиска на основе на Carrot2, а также улучшена интеграция с базой данных. В выпуске также есть множество дополнительных надстроек.

В марте 2010 года проекты Lucene и Solr объединились. Solr стал подпроектом Lucene. Раздельная загрузка продолжалась, но теперь продукты разрабатывались совместно одним набором коммиттеров.

В 2011 году схема номеров версий Solr была изменена, чтобы соответствовать схеме номеров Lucene. После Solr 1.4 следующий выпуск Solr был помечен как 3.1, чтобы сохранить Solr и Lucene с одним и тем же номером версии.

В октябре 2012 года была выпущена версия 4.0 Solr, включая новую функцию SolrCloud. В 2013 и 2014 годах было выпущено несколько выпусков Solr в линейке 4.x, постоянно расширяющих набор функций и повышающих надежность.

В феврале 2015 года был выпущен Solr 5.0, первый выпуск, в котором Solr упакован как отдельное приложение, прекращая официальную поддержку развертывания Solr в качестве войны. Solr 5.3 имел встроенную подключаемую среду аутентификации и авторизации.

В апреле 2016 года была выпущена Solr 6.0. Добавлена ​​поддержка выполнения параллельных SQL-запросов в коллекциях SolrCloud. Включает поддержку StreamExpression и новый драйвер JDBC для интерфейса SQL.

В сентябре 2017 года была выпущена Solr 7.0. В этом выпуске, помимо прочего, добавлена ​​поддержка нескольких типов реплик, автомасштабирования и математического механизма.

В марте 2019 года была выпущена Solr 8.0, включающая множество исправлений ошибок и обновлений компонентов. Узлы Solr теперь могут прослушивать и обслуживать запросы HTTP / 2. Имейте в виду, что по умолчанию внутренние запросы также отправляются с использованием HTTP / 2. Кроме того, был добавлен вход в пользовательский интерфейс администратора с поддержкой BasicAuth и Kerberos. И теперь возможно построение математических выражений в Apache Zeppelin.

Операции

Для поиска в документе Apache Solr последовательно выполняет следующие операции:

  1. Индексирование: прежде всего он преобразует документы в машиночитаемый формат, который называется Индексирование.
  2. Запросы: понимание условий запроса, заданного пользователем. Эти термины могут быть, например, изображениями или ключевыми словами.
  3. Сопоставление: Solr сопоставляет пользовательский запрос с документами, хранящимися в базе данных, чтобы найти соответствующий результат.
  4. Ранжирование результата: как только механизм выполняет поиск проиндексированных документов, ранжирует результаты по их релевантности.
Сообщество

В Solr есть как отдельные лица, так и компании, которые вносят новые функции и исправляют ошибки.

Интеграция Solr

Solr входит в состав встроенного поиска во многих приложениях, таких как системы управления контентом и системы управления корпоративным контентом. Все дистрибутивы Hadoop от Cloudera, Hortonworks и MapR включают Solr в качестве поисковой системы для своих продуктов, предназначенных для больших данных. DataStax DSE интегрирует Solr в качестве поисковой системы с Cassandra. Solr поддерживается в качестве конечной точки в различных средах обработки данных и инфраструктурах корпоративной интеграции.

Solr предоставляет отраслевой стандарт HTTP REST-подобный API с поддержкой как XML, так и JSON, и будут интегрированы с любой системой или языком программирования, поддерживающими эти стандарты. Для простоты использования доступны также клиентские библиотеки для Java, C#, PHP, Python, Ruby и большинства других популярных языков программирования.

См. Также
  • Портал бесплатного программного обеспечения с открытым исходным кодом
Ссылки
Библиография
Внешние ссылки
Последняя правка сделана 2021-06-11 20:11:07
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте