Разработчик (и) | Apache Software Foundation |
---|---|
Первоначальный выпуск | 1999; 21 год назад (1999 г.) |
Стабильный выпуск | 8.6.3 / 7 октября 2020 г.; 17 дней назад (07.10.2020) |
Репозиторий | |
Написано на | Java |
Операционная система | Межплатформенность |
Тип | Поиск и индекс |
Лицензия | Лицензия Apache 2.0 |
Веб-сайт | lucene.apache.org |
Apache Lucene - это бесплатная поисковая машина с открытым исходным кодом программная библиотека, изначально написанная полностью на Java пользователем Дуг Каттинг. Он поддерживается Apache Software Foundation и выпущен под Лицензией на программное обеспечение Apache.
Lucene был перенесен на другие языки программирования, включая Object Pascal, Perl, C#, C ++, Python, Ruby и PHP.
Дуг Каттинг первоначально написал Lucene в 1999 году. Lucene была его пятой поисковой машиной, ранее написав два в Xerox PARC, один в Apple и четвертый в Excite. Первоначально он был доступен для загрузки на домашней странице SourceForge. Он присоединился к семейству Java-продуктов с открытым исходным кодом Jakarta Apache Software Foundation в сентябре 2001 года и стал собственным проектом Apache верхнего уровня в феврале 2005 года. Имя Lucene - это второе имя жены Дуга Каттинга и первое имя ее бабушки по материнской линии. name.
Lucene ранее включала ряд подпроектов, таких как Lucene.NET, Mahout, Tika и Nutch. Эти три теперь являются независимыми проектами верхнего уровня.
В марте 2010 года поисковый сервер Apache Solr присоединился в качестве подпроекта Lucene, объединив сообщества разработчиков.
Версия 4.0 была выпущена 12 октября 2012 года.
Подходит для любого приложения, требующего полнотекстового индексации и поиска возможности, Lucene известна своей полезностью в реализации поисковых систем в Интернете и локального поиска на одном сайте.
Lucene включает функцию для выполнения нечеткого поиска на основе редактирования расстояние.
Lucene также использовался для реализации рекомендательных систем. Например, класс MoreLikeThis в Lucene может генерировать рекомендации для аналогичных документов. При сравнении подхода «MoreLikeThis», основанного на векторном подобии, с мерами сходства документов на основе цитирования, такими как совместное цитирование и анализ близости совместного цитирования, подход Lucene преуспел в рекомендации документов с очень похожими структурные характеристики и более узкое родство. Напротив, меры схожести документов на основе цитирования, как правило, более подходят для рекомендации более общих документов, а это означает, что подходы на основе цитирования могут быть более подходящими для создания случайных рекомендаций, если рекомендуемые документы содержатся в -текстовые цитаты.
Сама Lucene представляет собой просто библиотеку для индексации и поиска и не содержит функций сканирования и анализа HTML . Однако несколько проектов расширяют возможности Lucene: