Apache Lucene

редактировать
Lucene
Lucene logo green.svg
Разработчик (и) Apache Software Foundation
Первоначальный выпуск1999; 21 год назад (1999 г.)
Стабильный выпуск 8.6.3 / 7 октября 2020 г.; 17 дней назад (07.10.2020)
Репозиторий Измените это в Викиданных
Написано наJava
Операционная система Межплатформенность
Тип Поиск и индекс
Лицензия Лицензия Apache 2.0
Веб-сайтlucene.apache.org

Apache Lucene - это бесплатная поисковая машина с открытым исходным кодом программная библиотека, изначально написанная полностью на Java пользователем Дуг Каттинг. Он поддерживается Apache Software Foundation и выпущен под Лицензией на программное обеспечение Apache.

Lucene был перенесен на другие языки программирования, включая Object Pascal, Perl, C#, C ++, Python, Ruby и PHP.

Содержание
  • 1 История
  • 2 Возможности и общее использование
  • 3 Lucene проекты на основе
  • 4 См. также
  • 5 Ссылки
  • 6 Библиография
  • 7 Внешние ссылки
История

Дуг Каттинг первоначально написал Lucene в 1999 году. Lucene была его пятой поисковой машиной, ранее написав два в Xerox PARC, один в Apple и четвертый в Excite. Первоначально он был доступен для загрузки на домашней странице SourceForge. Он присоединился к семейству Java-продуктов с открытым исходным кодом Jakarta Apache Software Foundation в сентябре 2001 года и стал собственным проектом Apache верхнего уровня в феврале 2005 года. Имя Lucene - это второе имя жены Дуга Каттинга и первое имя ее бабушки по материнской линии. name.

Lucene ранее включала ряд подпроектов, таких как Lucene.NET, Mahout, Tika и Nutch. Эти три теперь являются независимыми проектами верхнего уровня.

В марте 2010 года поисковый сервер Apache Solr присоединился в качестве подпроекта Lucene, объединив сообщества разработчиков.

Версия 4.0 была выпущена 12 октября 2012 года.

Функции и общее использование

Подходит для любого приложения, требующего полнотекстового индексации и поиска возможности, Lucene известна своей полезностью в реализации поисковых систем в Интернете и локального поиска на одном сайте.

Lucene включает функцию для выполнения нечеткого поиска на основе редактирования расстояние.

Lucene также использовался для реализации рекомендательных систем. Например, класс MoreLikeThis в Lucene может генерировать рекомендации для аналогичных документов. При сравнении подхода «MoreLikeThis», основанного на векторном подобии, с мерами сходства документов на основе цитирования, такими как совместное цитирование и анализ близости совместного цитирования, подход Lucene преуспел в рекомендации документов с очень похожими структурные характеристики и более узкое родство. Напротив, меры схожести документов на основе цитирования, как правило, более подходят для рекомендации более общих документов, а это означает, что подходы на основе цитирования могут быть более подходящими для создания случайных рекомендаций, если рекомендуемые документы содержатся в -текстовые цитаты.

Проекты на основе Lucene

Сама Lucene представляет собой просто библиотеку для индексации и поиска и не содержит функций сканирования и анализа HTML . Однако несколько проектов расширяют возможности Lucene:

См. Также
  • Портал бесплатного программного обеспечения с открытым исходным кодом
Ссылки
Библиография
  • Gospodnetic, Отис; Эрик Хэтчер; Майкл МакКэндлесс (28 июня 2009 г.). Lucene в действии (2-е изд.). Manning Publications. ISBN 1-9339-8817-7.
  • Gospodnetic, Otis; Эрик Хэтчер (1 декабря 2004 г.). Lucene в действии (1-е изд.). Manning Publications. ISBN 978-1-9323-9428-3.
Внешние ссылки
Последняя правка сделана 2021-06-11 20:10:46
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте