Astrophysics Data System

редактировать
Портал цифровой библиотеки, управляемый Смитсоновским институтом
Astrophysics Data System
ADS logo.png Логотип ADS
ProducerГарвард-Смитсоновский центр астрофизики для Национального управления по аэронавтике и исследованию космического пространства (США)
История1992 г. по настоящее время
Доступ
СтоимостьБесплатно
Охват
ДисциплиныАстрономия и Физика
Глубина записиИндекс и аннотация и полнотекстовый
Геопространственный охватПо всему миру
Ссылки
Веб-сайтhttp://www.adsabs.harvard.edu/

Система астрофизических данных (ADS ) это онлайн-база данных, содержащая более восьми миллионов статей по астрономии и физике как из рецензируемых, так и из нерецензируемых источников. Тезисы доступны бесплатно в Интернете почти для всех статей, а полные отсканированные статьи доступны в формате обмена графикой (GIF) и Portable Document Format (PDF) для более старых версий. статьи. Он был разработан Национальным управлением по аэронавтике и исследованию космического пространства (НАСА) и управляется Гарвард-Смитсоновский центр астрофизики.

. ADS - мощный исследовательский инструмент, оказавший значительное влияние на эффективность астрономических исследований с момента их начала в 1992 году. Поиск литературы, который раньше занимал дни или недели, теперь может быть выполнен за секунды с помощью поисковой системы ADS, которая специально создана для астрономических нужд. Исследования показали, что выгода для астрономии от ADS эквивалентна нескольким сотням миллионов долларов США в год, и, по оценкам, эта система утроила читательскую аудиторию астрономических журналов.

Использование ADS почти универсален среди астрономов во всем мире, поэтому статистику использования ADS можно использовать для анализа глобальных тенденций в астрономических исследованиях. Эти исследования показали, что объем исследований, проводимых астрономом, связан с валовым внутренним продуктом (ВВП) на душу населения в стране, в которой он / она базируется, и что количество астрономов в Страна пропорциональна ВВП этой страны, поэтому общий объем исследований, проведенных в стране, пропорционален квадрату ее ВВП, деленного на ее население.

Содержание
  • 1 История
  • 2 Данные в системе
  • 3 Программное и аппаратное обеспечение
  • 4 Индексирование
  • 5 Охват
  • 6 Поисковая машина
    • 6.1 Запросы по имени автора
    • 6.2 Поиск по имени объекта
    • 6.3 Поиск по заголовку и аннотации
    • 6.4 Синоним замена
    • 6.5 Логика выбора
    • 6.6 Фильтрация результатов
  • 7 Результаты поиска
  • 8 Влияние на астрономию
  • 9 Социологические исследования с использованием ADS
  • 10 См. также
  • 11 Ссылки
  • 12 Внешние ссылки
История

В течение многих лет растущей проблемой в астрономических исследованиях (как и в других академических дисциплинах) было то, что количество статей, опубликованных в количество крупных астрономических журналов неуклонно росло, а это означало, что астрономы могли читать все меньше и меньше последних исследований. В 1980-х годах астрономы увидели, что зарождающиеся технологии, которые легли в основу Интернета, в конечном итоге могут быть использованы для создания электронной системы индексации научных работ по астрономии, которая позволит астрономам быть в курсе гораздо большего диапазона

Первое предложение о создании базы данных рефератов из журнальных статей было сделано на конференции по астрономии из больших баз данных, состоявшейся в Гархинг-бай-Мюнхен в 1987 году. Первоначальная разработка электронной системы доступ к астрофизическим рефератам происходил в течение следующих двух лет; в 1991 г. велись дискуссии о том, как интегрировать ADS с базой данных SIMBAD, содержащей все доступные обозначения в каталоге для объектов за пределами солнечной системы, чтобы создать систему, в которой астрономы могли бы искать все документы, написанные о данном объекте.

Первоначальная версия ADS с базой данных, состоящая из 40 статей, была создана в качестве доказательства концепции в 1988 году, и база данных ADS была успешно подключена с базой данных SIMBAD летом 1993 года. Создатели полагали, что это было первое использование Интернета для одновременного запроса трансатлантических научных баз данных. До 1994 года услуга была доступна через проприетарное сетевое программное обеспечение, но в начале того же года она была перенесена в зарождающуюся World Wide Web. Число пользователей службы увеличилось в четыре раза за пять недель после внедрения веб-службы ADS.

Сначала журнальные статьи, доступные через ADS, были отсканированы растровые изображения создан на основе бумажных журналов, но с 1995 года Astrophysical Journal начал публиковать онлайн-издание, вскоре за ним последовали другие основные журналы, такие как Astronomy and Astrophysics и Ежемесячные уведомления Королевского астрономического общества. ADS предоставила ссылки на эти электронные издания с момента их первого появления. Примерно с 1995 года количество пользователей ADS удваивается примерно каждые два года. В настоящее время ADS имеет соглашения почти со всеми астрономическими журналами, которые предоставляют рефераты. Отсканированные статьи начала XIX века доступны через службу, которая сейчас содержит более восьми миллионов документов. Сервис распространяется по всему миру, с двенадцатью зеркальными сайтами в двенадцати странах на пяти континентах, с синхронизацией базы данных посредством еженедельных обновлений с помощью rsync, утилиты зеркалирования, которая позволяет обновлять только части базы данных, которые изменились. Все обновления запускаются централизованно, но они запускают сценарии на зеркальных сайтах, которые «извлекают» обновленные данные с основных серверов ADS.

Данные в системе
1284 статьи о M101 доступны через ADS, начиная с 1850 года.

Статьи индексируются в базе данных по их библиографической записи, содержащей сведения о журнале, в котором они были опубликованы, и различные связанные метаданные, такие как списки авторов, ссылки и цитаты. Первоначально эти данные хранились в формате ASCII, но в конечном итоге ограничения этого метода побудили специалистов по обслуживанию базы данных в 2000 году перенести все записи в формат XML (Extensible Markup Language). Библиографические записи теперь хранится как элемент XML с подэлементами для различных метаданных.

С появлением онлайн-изданий журналов рефераты загружаются в ADS не позднее даты публикации статей, с полным журналом текст доступен подписчикам. Предыдущие статьи были отсканированы, а реферат создан с помощью программного обеспечения оптического распознавания символов. Отсканированные статьи примерно до 1995 г. обычно доступны бесплатно по соглашению с издателями журнала.

Отсканированные статьи хранятся в формате TIFF как со средним, так и с высоким разрешением. Файлы TIFF по запросу преобразуются в файлы GIF для просмотра на экране и файлы PDF или PostScript для печати. Сгенерированные файлы затем кэшируются, чтобы исключить излишне частое повторение популярных статей. По состоянию на 2000 год ADS содержал 250 ГБ сканированных изображений, которые состояли из 1 128 955 страниц статей, содержащих 138 789 статей. К 2005 году он вырос до 650 ГБ и, как ожидается, вырастет до 900 ГБ к 2007 году. Никакой дополнительной информации опубликовано не было.

Изначально база данных содержала только астрономические ссылки, но теперь она выросла и включает три базы данных, охватывающие астрономию (включая планетарные науки и физику Солнца), физику (включая приборы и науки о Земле) ссылки, а также препринты научных работ из arXiv. База данных по астрономии, безусловно, является самой продвинутой, и на ее использование приходится около 85% от общего использования ADS. Статьи назначаются в разные базы данных в соответствии с темой, а не журналом, в котором они публикуются, так что статьи из любого одного журнала могут появляться во всех трех тематических базах данных. Разделение баз данных позволяет настраивать поиск в каждой дисциплине, так что словам могут автоматически присваиваться разные весовые функции при разных поисках в базе данных, в зависимости от того, насколько часто они встречаются в соответствующем поле.

Данные в архиве препринтов обновляются ежедневно из arXiv, главного хранилища препринтов по физике и астрономии. Появление серверов препринтов, как и ADS, оказало значительное влияние на скорость астрономических исследований, поскольку статьи часто становятся доступными с серверов препринтов за несколько недель или месяцев до публикации в журналах. Включение препринтов из arXiv в ADS означает, что поисковая система может возвращать самые последние доступные исследования, с оговоркой, что препринты могут не пройти рецензирование или корректировать в соответствии с требуемым стандартом для публикации в основном журналы. База данных ADS связывает препринты с впоследствии опубликованными статьями везде, где это возможно, так что поиск по цитированию и справочникам будет возвращать ссылки на статью журнала, где был процитирован препринт.

Программное и аппаратное обеспечение

Программное обеспечение работает на система, которая была написана специально для нее, позволяя обширную настройку для астрономических нужд, что было бы невозможно с помощью универсального программного обеспечения базы данных. Скрипты разработаны так, чтобы быть независимыми от платформы, насколько это возможно, учитывая необходимость облегчения зеркалирования в различных системах по всему миру, хотя все более широкое использование Linux в качестве операционной системы выбор в рамках астрономии привел к все большей оптимизации сценариев для установки на этой платформе.

Главный сервер ADS расположен в Гарвард-Смитсоновском Центре астрофизики в Кембридж, Массачусетс, и представляет собой двойной 64-разрядный сервер X86 Intel с двумя четырехъядерными процессорами 3,0 ГГц и 32 ГБ RAM, под управлением CentOS 5.4 Linux. Зеркала расположены в Бразилии, Китае, Чили, Франции, Германии, Индии, Индонезии, Японии, России, Южной Корее, Великобритании и Украине.

Индексирование

ADS в настоящее время получает рефераты или оглавления почти из двухсот журнальных источников. Сервис может получать данные, относящиеся к одной и той же статье из нескольких источников, и создает одну библиографическую ссылку на основе наиболее точных данных из каждого источника. Обычное использование TeX и LaTeX почти всеми научными журналами значительно облегчает включение библиографических данных в систему в стандартизованном формате и импорт HTML -кодирования Интернет-статьи также просты. ADS использует сценарии Perl для импорта, обработки и стандартизации библиографических данных.

Очевидно банальная задача преобразования имен авторов в стандартную фамилию. Исходный формат на самом деле является одним из труднее автоматизировать из-за большого разнообразия соглашений об именах во всем мире и возможности того, что данное имя, такое как Дэвис, может быть именем, вторым именем или фамилией. Точное преобразование имен требует детального знания имен авторов, работающих в астрономии, и ADS поддерживает обширную базу данных имен авторов, которая также используется при поиске в базе данных (см. Ниже).

Для электронных статей легко извлечь список ссылок, приведенный в конце статьи. Для отсканированных статей извлечение ссылок зависит от OCR. Справочную базу данных затем можно «инвертировать», чтобы перечислить цитаты для каждой статьи в базе данных. Списки цитирования использовались в прошлом для выявления популярных статей, отсутствующих в базе данных; в основном они были созданы до 1975 года и теперь добавлены в систему.

Охват

Сейчас база данных содержит более восьми миллионов статей. В случае крупных журналов по астрономии (Astrophysical Journal, Astronomical Journal, Astronomy and Astrophysics, Publications of the Astronomical Society of the Pacific и Ежемесячные извещения Королевского астрономического общества ), охват является полным, все выпуски проиндексированы с номера 1 до настоящего времени. На эти журналы приходится около двух третей статей в базе данных, а остальные состоят из статей, опубликованных в более чем 100 других журналах со всего мира, а также в материалах конференций.

Хотя база данных содержит статьи полное содержание всех крупных журналов, а также многих второстепенных, охват ссылок и цитирований гораздо менее полный. Ссылки и цитаты статей в основных журналах достаточно полны, но такие ссылки, как «частное общение», «в прессе» или «в процессе подготовки» не могут быть сопоставлены, и ошибки автора в списках литературы также представляют потенциальные ошибки. Астрономические статьи могут цитироваться и цитироваться статьями в журналах, выходящих за рамки ADS, таких как химические, математические или биологические журналы.

Поисковая машина
Пример сложного поиска, объединяющего объектные, заголовочные и абстрактные запросы с фильтром по дате

С момента своего создания ADS разработала очень сложную поисковую машину для запросов к абстрактным и объектным базам данных. Поисковая машина специально создана для поиска астрономических рефератов, и эта машина и ее пользовательский интерфейс предполагают, что пользователь хорошо разбирается в астрономии и может интерпретировать результаты поиска, которые предназначены для того, чтобы возвращать больше, чем просто наиболее актуальные документы. В базу данных можно запросить имена авторов, имена астрономических объектов, слова заголовков и слова в абстрактном тексте, а результаты можно отфильтровать по ряду критериев. Он работает, сначала собирая синонимы и упрощая условия поиска, как описано выше, а затем генерируя «инвертированный файл», который представляет собой список всех документов, соответствующих каждому термину поиска. Затем выбранная пользователем логика и фильтры применяются к этому перевернутому списку для генерации окончательных результатов поиска.

Запросы имени автора

Система индексирует имена авторов по фамилии и инициалам и учитывает возможные варианты написания имен с использованием списка вариантов. Это часто встречается в именах, содержащих диакритические знаки, такие как умляуты, и транслитерации от арабского или кириллицы. Пример записи в списке синонимов авторов:

АФАНАСЬЕВ, В
АФАНАСЬЕВ, В
АФАНАСЬЕВ, В
АФАНАСЕВ, В
АФАНАСЬЕВ, В
АФАНСЬЕВ, В
АФАНСЬЕВ, В

Поиск по именам объектов

Возможность поиска статей по конкретным астрономическим объектам является одним из самых мощных инструментов ADS. Система использует данные из SIMBAD, внегалактической базы данных NASA / IPAC, циркуляров Международного астрономического союза и Лунного и планетарного института для идентификации документов, относящихся к данному объекту, а также может выполнять поиск по положению объекта, перечисляя документы, которые касаются объектов в радиусе 10 угловых минут от заданного прямого восхождения и склонения. Эти базы данных объединяют множество каталогов, которые может иметь объект, так что поиск Плеяд также найдет статьи, в которых перечислено знаменитое рассеянное скопление в Телец в разделе любое другое обозначение в каталоге или популярные названия, такие как M45, Семь сестер или Melotte 22.

Поиск по заголовку и аннотации

Поисковая машина сначала фильтрует условия поиска несколькими способами. После M, за которым следует пробел, или дефис удален пробел или дефис, так что поиск объектов каталога Мессье упрощается и пользователь вводит M45, M 45 или M-45 все приведет к выполнению того же запроса; Точно так же обозначения NGC и общие поисковые запросы, такие как Shoemaker Levy и T Tauri, лишены пробелов. Неважные слова, такие как AT, OR и TO, удаляются, хотя в некоторых случаях чувствительность к регистру сохраняется, так что, хотя a nd игнорируется, A nd преобразуется в «Andromedae », а H er преобразуется в «Herculis », но h er игнорируется.

Замена синонима

После предварительной обработки условий поиска в базу данных запрашивается измененный термин поиска, а также синонимы для него. Наряду с простой заменой синонима, такой как поиск форм множественного числа и единственного числа, ADS также выполняет поиск большого количества специфически астрономических синонимов. Например, спектрограф и спектроскоп имеют в основном одно и то же значение, и в астрономическом контексте металличность и обилие также являются синонимами. Список синонимов ADS был создан вручную путем группирования списка слов в базе данных по схожим значениям.

Помимо синонимов английского языка, ADS также выполняет поиск переводов на английский язык иностранных поисковых терминов. и наоборот, так что поиск по слову французский soleil дает ссылки на Sun, а статьи на языках, отличных от английского, могут быть возвращены по английским условиям поиска.

Замена синонима при необходимости может быть отключена, чтобы редкий термин, который является синонимом гораздо более распространенного термина (например, «строка даты », а не «дата <45»).>') можно искать конкретно.

Логика выбора

Поисковая машина позволяет выбирать логику как внутри полей, так и между полями. Условия поиска в каждом поле можно комбинировать с помощью ИЛИ, И, простой логики или логической логики, и пользователь может указать, какие поля должны совпадать в результатах поиска. Это позволяет строить сложные поисковые запросы; например, пользователь может искать статьи, касающиеся NGC 6543 ИЛИ NGC 7009, с заголовками статей, содержащими (радиус ИЛИ скорость) И НЕ (количество ИЛИ температура).

Фильтрация результатов

Результаты поиска могут быть отфильтрованы по ряду критериев, включая указание диапазона лет, например «1945–1975», «2000 г. по настоящее время» или «до». 1900 », и в каком типе журнала появляется статья - статьи, не прошедшие рецензирование, такие как конференции, могут быть исключены или специально найдены, или определенные журналы могут быть включены или исключены из поиска.

Результаты поиска
Страница результатов поиска из ADS - A, F, G, C, R и т. Д. Являются ссылками на связанные данные для каждого реферата, такие как полнотекстовая статья, цитаты, также прочитанные статьи и и т. д.

Хотя он был задуман как средство доступа к рефератам и статьям, ADS предоставляет значительный объем вспомогательной информации наряду с результатами поиска. Для каждого возвращенного реферата предоставляются ссылки на другие статьи в базе данных, на которые есть ссылки и которые цитируют статью, а также предоставляется ссылка на препринт, если он существует. Система также создает ссылку на статьи, которые также можно прочитать, то есть те, к которым чаще всего обращаются те, кто читает статью. Таким образом, пользователь ADS может определить, какие статьи представляют наибольший интерес для астрономов, интересующихся предметом данной статьи.

Также возвращаются ссылки на базы данных имен объектов SIMBAD и / или NASA Extragalactic Database., с помощью которого пользователь может быстро узнать основные данные наблюдений за объектами, анализируемыми в статье, и найти дополнительные статьи по этим объектам.

Влияние на астрономию

ADS почти повсеместно используется в качестве исследовательского инструмента среди астрономов, и есть несколько исследований, которые количественно оценили, насколько более эффективными стали ADS в астрономии; один подсчитал, что ADS повысил эффективность астрономических исследований на 333 года исследований с полной занятостью в год, а другой обнаружил, что в 2002 году его эффект был эквивалентен 736 штатным исследователям или всем астрономическим исследованиям, проведенным во Франции. ADS позволила выполнить поиск литературы, на выполнение которого раньше уходили бы дни или недели, за секунды, и, по оценкам, ADS увеличила читательскую аудиторию и использование астрономической литературы примерно в три раза с момента ее создания.

В денежном выражении это повышение эффективности представляет собой значительную сумму. Во всем мире насчитывается около 12000 активных астрономических исследователей, поэтому ADS составляет около 5% работающего населения астрономов. Бюджет глобальных астрономических исследований оценивается в размере от 4 000 до 5 000 миллионов долларов США, поэтому ценность ADS для астрономии будет составлять около 200–250 миллионов долларов США в год. Его операционный бюджет составляет небольшую часть этой суммы.

Большое значение ADS для астрономов было признано Организацией Объединенных Наций, Генеральная ассамблея которой высоко оценил работу и успех ADS, особенно отметив его важность для астрономов в развивающихся странах, в отчетах Комитета ООН по использованию космического пространства в мирных целях. Между тем в отчете гостевой комиссии Центра астрофизики за 2002 год говорится, что эта служба «произвела революцию в использовании астрономической литературы» и была «вероятно, самым ценным отдельным вкладом в астрономические исследования, который CfA сделал за время своего существования. ".

Социологические исследования с использованием ADS

Поскольку ADS почти повсеместно используется астрономами, ADS может многое рассказать о том, как астрономические исследования распространяются по всему миру. Большинство пользователей получают доступ к системе из высших учебных заведений, чей IP-адрес можно легко использовать для определения географического местоположения пользователя. Исследования показывают, что самыми высокими пользователями ADS на душу населения являются астрономы из Франции и Нидерландов, и в то время как более развитые страны (измеряемые по ВВП на душу ) используют систему более, чем менее развитые страны; связь между ВВП на душу населения и использованием ADS не является линейной. Диапазон использования ADS на душу населения намного превышает диапазон ВВП на душу населения, и фундаментальные исследования, проведенные в стране, измеренные с помощью ADS, оказались пропорциональны квадрату ВВП страны, деленному на ее население.

Статистика использования ADS также предполагает, что астрономы в более развитых странах, как правило, более продуктивны, чем астрономы в менее развитых странах. Объем проведенных фундаментальных исследований пропорционален количеству астрономов в стране, умноженному на ВВП на душу населения. Статистика также подразумевает, что астрономы в европейских культурах проводят примерно в три раза больше исследований, чем в азиатских культурах, что, возможно, свидетельствует о культурных различиях в важности астрономических исследований.

ADS также использовалась, чтобы показать, что доля статей по астрономии, написанных одним автором, существенно уменьшилась с 1975 года и что с 1990 года стали более распространены астрономические статьи с более чем 50 авторами.

См. Также
Ссылки
Внешние ссылки

Последняя правка сделана 2021-06-13 02:15:31
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте