Данные открытой науки

редактировать

Данные открытой науки - это тип открытых данных, ориентированных на публикацию наблюдений и результатов научных исследований. деятельности, доступной для анализа и повторного использования кем угодно. Основная цель стремления к открытым данным состоит в том, чтобы позволить проверку научных заявлений, позволяя другим взглянуть на воспроизводимость результатов и позволяя интегрировать данные из многих источников для получения новых знаний. Хотя идея открытых научных данных активно продвигалась с 1950-х годов, распространение Интернета значительно снизило стоимость и время, необходимое для публикации или получения данных.

Содержание
  • 1 История
  • 2 Отношение к открытому доступу
  • 3 Отношение к экспертной оценке
  • 4 Вычисление открытого исследования
  • 5 См. Также
  • 6 Ссылки
  • 7 Внешние ссылки
История

Концепция открытого доступа к научным данным была институционально закреплена с образованием системы Мирового центра данных (ныне Мировой системы данных ) в подготовка к Международному геофизическому году 1957–1958 гг. Международный совет научных союзов (ныне Международный совет по науке ) учредил несколько мировых центров данных, чтобы свести к минимуму риск потери данных и максимально повысить доступность данных, и в 1955 году рекомендовал, чтобы данные были доступны в машинах. читаемая форма.

Первой инициативой по созданию базы данных электронной библиографии данных открытого доступа был Информационный центр образовательных ресурсов (ERIC) в 1966 году. В том же году MEDLINE - онлайн-база данных с бесплатным доступом, управляемая Национальной медицинской библиотекой и Национальным институтом здравоохранения (США) с библиографическими цитатами из журналов в биомедицинской области, которые позже будет называться PubMed, в настоящее время с более чем 14 миллионами полных статей.

В 1995 году GCDIS (США) четко изложил свою позицию в «Полном и открытом обмене научными данными» (публикация Комитет по геофизическим и экологическим данным - Национальный исследовательский совет):

«Атмосфера, океаны и биосфера Земли образуют интегрированную систему, выходящую за пределы национальных границ. Чтобы понять элементы системы, то, как они взаимодействуют и как они менялись со временем, необходимо собирать и анализировать данные об окружающей среде со всех частей мира. Исследования глобальной окружающей среды требуют международного сотрудничества по многим причинам:

  • для решения глобальных проблем важно иметь глобальные наборы данных и продукты, полученные из этих наборов данных;
  • это более эффективно и рентабельно чтобы каждая нация делилась своими данными и информацией, а не собирала все необходимое самостоятельно; и
  • реализация эффективных политик, направленных на решение проблем глобальной окружающей среды, требует участия с самого начала почти всех стран мира.

Международные программы исследования глобальных изменений и мониторинга окружающей среды в решающей степени зависят от принципа полный и открытый обмен данными (т. е. данные и информация предоставляются без ограничений, на недискриминационной основе не более, чем за расходы на воспроизведение и распространение) ».

Последняя фраза подчеркивает традиционные затраты на распространение информации в печати и по почте. Устранение этих затрат через Интернет значительно упростило техническую передачу данных. Соответственно, дешевле создавать, продавать и контролировать многие ресурсы данных, и это привело к нынешней озабоченности по поводу закрытых данные.

Более поздние применения этого термина включают:

  • SAFARI 2000 (Южная Африка, 2001) использовала лицензию, проинформированную ICSU и политикой НАСА
  • Геном человека (Kent, 2002)
  • Консорциум открытых данных по геопространственным данным (2003)
  • Манифест по открытой химии (Мюррей-Раст и Рзепа, 2004) (2004)
  • Презентации для JISC и OAI под названием «открытые данные» (Murray-Rust, 2005)
  • запуск Science Commons (2004)
  • Первые форумы Open Knowledge (Лондон, Великобритания), организованные Open Knowledge Фонд (Лондон, Великобритания) по открытым данным в связи с гражданской информацией и геоданными (февраль и апрель 2005 г.)
  • Группа Голубой обелиск по химии (мантра: открытые данные, открытый исходный код, Открытые стандарты) (2005) doi : 10.1021 / ci050400b
  • Ходатайство об открытых данных в кристаллографии подано Консультативным советом Crystallography Open Database (2005).
  • XML Conference Exposition 2005 (Connolly 2005)
  • Список рассылки SPARC Open Data (2005)
  • Первый проект определения открытых знаний прямо ссылается на «открытые данные» (2005)
  • XTech (Dumbill, 2005), (Bray and O'Reilly 2006)

В 2004 году министры науки всех Страны, входящие в ОЭСР (Организация экономического сотрудничества и развития), в которую входят наиболее развитые страны мира, подписали декларацию, в которой, по сути, говорится, что все архивные данные, финансируемые государством, должны быть общедоступными. После запроса и интенсивного обсуждения с организациями, производящими данные в государствах-членах, ОЭСР опубликовала в 2007 году Принципы и рекомендации ОЭСР по доступу к данным исследований за счет государственного финансирования в качестве рекомендации мягкого права.

В 2005 году Эдд Дамбилл представил тему «Открытые данные» в XTech, в том числе:

В 2006 году Science Commons провела двухдневную конференцию в Вашингтоне, на которой основная тема могла быть описана как открытые данные. Сообщалось, что объем микрозащиты данных (например, по лицензии) в таких областях, как биотехнология, создает трагедию антикоммонов. В связи с этим затраты на получение лицензий от большого числа владельцев сделали нерентабельным проведение исследований в этой области.

В 2007 году SPARC и Science Commons объявили о консолидации и расширении своих авторских дополнений.

В 2007 году OECD (Организация экономического сотрудничества и развития) опубликовала Принципы и рекомендации по доступу к данным исследований за счет государственного финансирования. В Принципах говорится, что:

Доступ к данным исследований увеличивает отдачу от государственных инвестиций в этой области; усиливает открытый научный поиск; поощряет разнообразие исследований и мнений; продвигает новые области работы и позволяет исследовать темы, не предусмотренные первоначальными исследователями.

В 2010 году были запущены Принципы Пантона, пропагандирующие открытые данные в науке и устанавливающие принципы, которым должны следовать поставщики открыть свои данные.

В 2011 году LinkedScience.org был запущен для реализации подхода Linked Open Science к открытому обмену научными активами, такими как наборы данных, методы, инструменты и словари, и их взаимосвязь.

В 2012 году Королевское общество опубликовало крупный отчет «Наука как открытое предприятие», в котором отстаивались открытые научные данные и рассматривались их преимущества и требования.

В 2013 году министры науки «Большой восьмерки» опубликовали Заявление, подтверждающее набор принципов открытых данных научных исследований

В 2015 году Мировая система данных Международного совета for Science принял новый набор принципов обмена данными, чтобы воплотить дух «открытой науки». Эти Принципы соответствуют политике данных национальных и международных инициатив и выражают основные этические обязательства, воплощенные в Сертификации WDS для надежных хранилищ данных и услуг.

Отношение к открытому доступу

Многие данные доступны через научные публикации, которые сейчас вызывают интенсивные дискуссии в рамках «открытого доступа » и семантически открытых форматов - хотел бы предлагать научные статьи в формате JATS. Будапештская инициатива открытого доступа (2001) ввела этот термин:

Под «открытым доступом» к этой литературе мы подразумеваем ее бесплатную доступность в общедоступном Интернете, позволяющую любым пользователям читать, скачивать, копировать, распространять, печатать, искать или ссылаться на полные тексты этих статей, сканировать их для индексации, передавать в качестве данных в программное обеспечение или использовать их для любых других законных целей без финансовых, юридических или технических барьеров, кроме тех, которые неотделимы от получение доступа к самому Интернету. Единственное ограничение на воспроизведение и распространение, а также единственная роль авторского права в этой области, должно заключаться в том, чтобы дать авторам контроль над целостностью их работы и право на надлежащее признание и цитирование.

Логика объявления допускает повторное использование данных, хотя термин «литература» имеет коннотации к читабельному тексту и может подразумевать процесс научной публикации. В дискурсе открытого доступа часто используется термин «полнотекстовый», который не подчеркивает данные, содержащиеся в публикации или сопровождающие ее.

Некоторые издатели открытого доступа не требуют, чтобы авторы передавали авторские права, и данные, связанные с этими публикациями, обычно могут рассматриваться как открытые данные. У некоторых издателей есть стратегии открытого доступа, когда издатель требует передачи авторских прав и где неясно, действительно ли данные в публикациях могут рассматриваться как открытые данные.

Издатели ALPSP и STM выступили с заявлением о желательности предоставления данных в свободный доступ:

Издатели признают, что во многих дисциплинах сами данные в различных формах в настоящее время являются ключевым результатом исследований. Инструменты поиска и интеллектуального анализа данных позволяют использовать необработанные данные все более изощренно. Конечно, журнальные статьи дают одно «видение» значения и интерпретации этих данных - а презентации на конференциях и неформальный обмен мнениями могут предоставлять другие «взгляды», - но сами данные становятся все более важным ресурсом сообщества. Наука развивается лучше всего, если позволяет как можно большему числу ученых иметь доступ к как можно большему количеству предшествующих данных; это позволяет избежать дорогостоящего повторения работы и позволяет творчески интегрировать новые и переработать существующие данные.

и

Мы считаем, что в качестве общего принципа наборы данных, исходные исходные данные исследований, а также наборы или подмножества этих данных, которые отправляются вместе со статьей в журнал, должны быть по возможности свободно доступен для других ученых. Мы считаем, что передовой практикой для издателей научных журналов является отделение подтверждающих данных от самой статьи и не требовать какой-либо передачи или владения такими данными или наборами данных в качестве условия публикации рассматриваемой статьи.

Хотя это заявление никак не повлияло на открытую доступность первичных данных, связанных с публикациями в журналах членов ALPSP и STM. Таблицы данных, предоставленные авторами в качестве приложения к статье, пока доступны только подписчикам.

Отношение к экспертной оценке

В попытке решить проблемы с воспроизводимостью результатов исследования некоторые ученые просят авторов согласиться поделиться своими необработанными данными в рамках экспертной оценки просмотрите процесс. Например, еще в 1962 году ряд психологов пытались получить необработанные наборы данных от других исследователей, с неоднозначными результатами, чтобы повторно проанализировать их. Недавняя попытка привела к получению только семи наборов данных из пятидесяти запросов. Понятие получения, не говоря уже требует, открытых данных в качестве условия экспертной оценки остается спорным.

Открыть исследование вычисления

Для того, чтобы смысл научных данных, они должны быть проанализированы. Во всех случаях, кроме простейших, это делается программно. Широкое использование программного обеспечения создает проблемы для воспроизводимости исследований. Для обеспечения воспроизводимости исследования необходимо публиковать не только все данные, но и исходный код всего используемого программного обеспечения, а также всю параметризацию, используемую при запуске этого программного обеспечения. В настоящее время эти просьбы редко выполняются. Способы приблизиться к воспроизводимым научным вычислениям обсуждаются под лозунгом «открытые исследовательские вычисления ».

См. Также
Ссылки
Внешние ссылки

.

Последняя правка сделана 2021-06-01 12:49:55
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте