Isearch

редактировать

Isearch - это открытый источник поиск текста программное обеспечение, впервые разработанное в 1994 году Нассибом Нассаром как часть информационной структуры Isite Z39.50. Проект стартовал в Центре обмена информацией по обнаружению и извлечению сетевой информации (CNIDR) суперкомпьютерного центра Северной Каролины MCNC и финансировался Национальным научным фондом, чтобы следовать по пути WAIS и разработка прототипов систем для распределенных информационных сетей, включающих Интернет-приложения, библиотечные каталоги и другие информационные ресурсы.

Основные возможности Isearch включают полнотекстовый поиск и поиск по полю, ранжирование по релевантности, логические запросы и поддержку многих типов документов, таких как HTML, почтовые папки, дайджесты списков, MEDLINE, BibTeX, SGML / XML, метаданные FGDC., Метаданные NASA DIF, ANZLIC, метаданные ISO 19115 и многие другие типы ресурсов и форматы документов.

Это была первая поисковая машина, которая была разработана с нуля для поддержки поиска и извлечения SGML и Z39.50. Он включал в себя множество нововведений, включая модель «типа документа», которая представляет собой простой (объектно-ориентированный) метод связывания каждого документа с классом функций, обеспечивающих стандартный интерфейс для доступа к документу. Это был один из первых движков (если не первый), когда-либо поддерживающий XML.

Алгоритмы поиска / индексирования текста Isearch были основаны на плодотворной работе Гастона Гоннета над массивами и деревьями PAT для поиска текста --- идеями, которые были разработаны для проекта New Oxford English Dictionary Project в Univ. of Waterloo, и предоставил семена для механизма PAT SGML Тима Брея, который лег в основу Open Text. Однако одним из ограничивающих факторов дизайна Isearch было то, что он не очень хорошо подходил для обработки чрезвычайно больших наборов данных, которые стали популярными в середине-конце 1990-х годов. Во многих случаях Isearch был адаптирован или модифицирован для использования различных алгоритмов, но обычно сохранял модель типа документа и архитектурную взаимосвязь с Isite.

Isearch получил широкое распространение и использовался на сотнях общедоступных поисковых сайтов, в том числе во многих крупных проектах, таких как США. Патентный поиск Управления по патентам и товарным знакам (USPTO), Федеральный центр обмена географическими данными (FGDC), Главный каталог NASA по глобальным изменениям, Система NASA EOS Guide System, Проект взаимодействия каталогов NASA, Astronomical pre - служба печати на базе Научного института космического телескопа, The PCT Electronic Gazette Всемирной организации интеллектуальной собственности (WIPO), Linsearch (поисковая система для программного обеспечения с открытым исходным кодом, разработанная Майлзом Эфроном), проект SAGE Департамента специальных коллекций в Эмори Университет, Eco Companion Australasia (каталог экологических геопространственных ресурсов), Австралийская национальная служба геномной информации (ANGIS), Open Directory Project и многочисленные правительственные порталы в контексте Службы поиска правительственной информации (GILS) Полномочия GPO (закончились в 2005 г.?).

С 1994 по 1998 гг. Большая часть разработки была сосредоточена на Центре обмена информацией по обнаружению и извлечению сетевой информации (CNIDR) в Северной Каролине (ядро ядра) и BSn в Германии (Doctypes). К 1998 году большинство разработчиков ядра Isearch с открытым исходным кодом переориентировали разработку на несколько дополнительных. В 1998 году он стал частью эталонной программной платформы Advanced Search Facility, финансируемой Министерством торговли США.

A / WWW Enterprises теперь поддерживает версию с открытым исходным кодом для публичного использования, поддерживаемую платными государственными клиентами, такими как Бюро по патентам и товарным знакам США, НАСА и FGDC, которые предоставили поддержку для повышения функциональности и надежности программного обеспечения. Программный пакет считается эталонной реализацией программного обеспечения службы каталогов.

По состоянию на 2010 год версия Isearch с открытым исходным кодом все еще используется на более чем 250 узлах FGDC, а также ANZLIC в Австралии и избранными участниками Geospatial OneStop для облегчения сбора данных GOS, включая NOAA, Бюро переписи населения и Теннесси. • Полевой офис Службы охраны рыболовства и дикой природы США, среди прочего.

Ссылки

Последняя правка сделана 2021-05-24 07:31:48
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте