Информатика биоразнообразия

редактировать

Информатика биоразнообразия - это применение методов информатики к информации о биоразнообразии, например таксономия, биогеография или экология. Современные компьютерные методы могут дать новые способы просмотра и анализа существующей информации, а также прогнозирования будущих ситуаций (см. моделирование ниши ). Информатика биоразнообразия - это термин, который появился только в 1992 году, но с быстро растущими наборами данных он стал полезен во многих исследованиях и приложениях, таких как создание таксономических баз данных или географических информационных систем. Информатика биоразнообразия контрастирует с «биоинформатикой », которое часто используется как синоним компьютеризированной обработки данных в специализированной области молекулярной биологии.

Содержание

  • 1 Обзор
  • 2 История дисциплина
  • 3 История термина
  • 4 Цифровая таксономия (систематика)
    • 4.1 Глобальный список всех видов
    • 4.2 Научные названия родов и видов как уникальные идентификаторы
    • 4.3 Консенсусная классификация организмов
  • 5 Мобилизация первичной информации о биоразнообразии
  • 6 Стандарты и протоколы
  • 7 Текущая деятельность
  • 8 Примеры проектов в области информатики биоразнообразия
  • 9 См. Также
  • 10 Ссылки
  • 11 Дополнительная литература
  • 12 Внешние ссылки ссылки

Обзор

Информатика биоразнообразия (разная, но связанная с биоинформатикой) - это применение методов информационных технологий к проблемам организации, доступа, визуализации и анализа первичных данных о биоразнообразии. Первичные данные о биоразнообразии состоят из названий, наблюдений и записей образцов, а также генетических и морфологических данных, связанных с образцом. Информатике биоразнообразия также, возможно, придется справляться с управлением информацией от неназванных таксонов, например, полученной путем отбора проб окружающей среды и определения последовательности смешанных проб. Термин «информатика биоразнообразия» также используется для обозначения вычислительных проблем, специфичных для названий биологических объектов, таких как разработка алгоритмов для работы с вариантными представлениями идентификаторов, таких как названия видов и авторитетные источники, и множественная классификация схемы, в которых эти объекты могут находиться в соответствии с предпочтениями различных специалистов в этой области, а также синтаксис и семантика, с помощью которых контент в таксономических базах данных может быть сделан машинным запросом и совместимым для целей информатики биоразнообразия...

История дисциплины

Информатика биоразнообразия, как можно считать, началась с создания первых компьютеризированных таксономических баз данных в начале 1970-х годов и продвинулась через последующую разработку инструментов распределенного поиска в направлении конец 1990-х, включая специалиста по анализу видов из Канзасского университета, Североамериканской информационной сети по биоразнообразию NABIN, CONABIO в Мексике ico и другие, создание Глобального информационного фонда по биоразнообразию в 2001 г. и параллельная разработка различных моделей нишевого моделирования и других инструментов для работы с цифровыми данными о биоразнообразии из -1980-е годы (например, увидеть). В сентябре 2000 года американский журнал Science посвятил специальный выпуск «Биоинформатике для биоразнообразия», журнал «Biodiversity Informatics» начал публиковаться в 2004 году, а несколько международных конференций 2000-х собрали вместе практиков в области информатики биоразнообразия. включая лондонскую конференцию e-Biosphere в июне 2009 года. Приложение к журналу BMC Bioinformatics (Volume 10 Suppl 14), опубликованное в ноябре 2009 года, также посвящено информатике биоразнообразия.

История термина

Согласно переписке, воспроизведенной Уолтером Берендсоном, термин «информатика биоразнообразия» был введен Джоном Уайтингом в 1992 году для охвата деятельности организации, известной как Canadian Biodiversity Informatics Консорциум, группа, занимающаяся объединением базовой информации о биоразнообразии с экономикой окружающей среды и геопространственной информацией в форме GPS и GIS. Впоследствии он, похоже, потерял всякую обязательную связь с миром GPS / ГИС и был связан с компьютеризированным управлением любыми аспектами информации о биоразнообразии (например, см.)

Цифровая таксономия (систематика)

Глобальный список всех видов

Одной из основных проблем в области информатики биоразнообразия в глобальном масштабе является отсутствие в настоящее время полного основного списка признанных в настоящее время видов мира, хотя это и является целью проект Каталог жизни, насчитывающий ок. 1,65 миллиона видов из примерно 1,9 миллиона описанных видов в его Ежегодном контрольном списке 2016. Аналогичная попытка для таксонов окаменелостей, база данных палеобиологии документирует около 100 000+ названий ископаемых видов из неизвестного общего числа.

Научные названия родов и видов как уникальные идентификаторы

Применение системы биномиальной номенклатуры Линнея для видов и одночленов для родов и выше, дало много преимуществ, но также и проблемы с омонимами (одно и то же имя используется для нескольких таксонов, случайно или законно в нескольких царствах), синонимов ( несколько названий для одного и того же таксона), а также вариантные представления одного и того же названия из-за орфографических различий, незначительных орфографических ошибок, вариаций в способе цитирования имен авторов и дат и т. д. Кроме того, названия могут меняться с течением времени из-за изменения таксономических мнений (например, правильного родового положения вида или повышения подвида до ранга вида или наоборот), а также ограниченность таксона может меняться в зависимости от к таксономическим концепциям разных авторов. Одним из предлагаемых решений этой проблемы является использование идентификаторов наук о жизни (LSID ) для целей машинно-машинной связи, хотя есть как сторонники, так и противники этого подхода.

Консенсусная классификация организмов

Организмы можно классифицировать множеством способов (см. Главную страницу Биологическая классификация ), что может создать проблемы при проектировании систем информатики биоразнообразия. для включения единой или множественной классификации для удовлетворения потребностей пользователей или для направления их к единой «предпочтительной» системе. Вопрос о том, удастся ли когда-либо достичь единой консенсусной системы классификации, вероятно, остается открытым, однако «Каталог жизни» инициировал деятельность в этой области, на смену которой пришла опубликованная система, предложенная в 2015 году М. Руджеро и его коллегами.

Мобилизация первичной информации о биоразнообразии

«Первичная» информация о биоразнообразии может считаться базовыми данными о встречаемости и разнообразии видов (или, действительно, любых распознаваемых таксонов), обычно в сочетании с информацией об их распространении в пространство, время или и то, и другое. Такая информация может быть в форме сохраненных образцов и связанной с ней информации, например, собранной в коллекциях естествознания музеев и гербариев, или в виде записей наблюдений, например, из официальных фаунистические или флористические исследования, проводимые профессиональными биологами и студентами, или в качестве любительских и других запланированных или внеплановых наблюдений, включая те, которые все чаще попадают в сферу гражданской науки. Обеспечение согласованного цифрового доступа в режиме онлайн к этой обширной коллекции разрозненных первичных данных является основной функцией информатики биоразнообразия, которая лежит в основе региональных и глобальных сетей данных о биоразнообразии, примеры последних включают OBIS и GBIF.

В качестве вторичного источника данных о биоразнообразии соответствующая научная литература может анализироваться либо людьми, либо (потенциально) специальными алгоритмами поиска информации для извлечения соответствующей первичной информации о биоразнообразии, которая сообщается в ней, иногда в совокупности / краткая форма, но часто как первичные наблюдения в повествовательной или табличной форме Элементы такой деятельности (такие как извлечение ключевых таксономических идентификаторов, ключевые слова / индексные термины и т. Д.) Уже много лет практикуются на более высоком уровне избранными академическими базами данных и поисковыми системами. Однако для максимальной ценности информатики биоразнообразия в идеале следует извлечь фактические данные о первичных встречах, а затем сделать их доступными в стандартизированной форме или формах; например, проекты Plazi и INOTAXA преобразуют таксономическую литературу в форматы XML, которые затем могут быть прочитаны клиентскими приложениями, первые используют TaxonX- XML, а последний - в формате taXMLit. Библиотека биоразнообразия также добилась значительных успехов в своей цели по оцифровке значительной части таксономической литературы, не защищенной авторским правом, которая затем подвергается OCR (оптическое распознавание символов), поэтому как подлежащие дальнейшей обработке с использованием инструментов информатики биоразнообразия.

Стандарты и протоколы

Как и другие дисциплины, связанные с данными, информатика биоразнообразия выигрывает от принятия соответствующих стандартов и протоколов для того, чтобы поддерживать машинно-машинную передачу и взаимодействие информации в пределах своей конкретной области. Примеры соответствующих стандартов включают Darwin Core XML схему для данных о биоразнообразии на основе образцов и наблюдений, разработанную с 1998 г. и далее, а также ее расширения, Схема передачи таксономических концепций, а также стандарты для структурированных описательных данных и доступа к данным биологической коллекции (ABCD); в то время как протоколы поиска и передачи данных включают DiGIR (в настоящее время в основном заменено) и TAPIR (протокол доступа TDWG для поиска информации). Многие из этих стандартов и протоколов в настоящее время поддерживаются, а их разработка контролируется Рабочей группой по таксономическим базам данных (TDWG).

Текущая деятельность

На конференции по электронной биосфере в Великобритании в 2009 году были приняты следующие темы, которые указывают на широкий спектр текущих мероприятий в области информатики биоразнообразия и на то, как они могут быть классифицированы:

  • Применение: Сохранение / Сельское хозяйство / Рыболовство / Промышленность / Лесное хозяйство
  • Применение: Инвазивные чужеродные виды
  • Применение: Систематическая и эволюционная биология
  • Применение: Системы таксономии и идентификации
  • Новые инструменты, услуги и стандарты для управления данными и доступа
    • Новые инструменты моделирования
    • Новые инструменты для интеграции данных
    • Новые подходы к инфраструктуре биоразнообразия
    • Новые подходы к идентификации видов
    • Новые подходы к картированию биоразнообразия
  • Национальные и региональные базы данных и сети по биоразнообразию

Послеконференционный семинар ключевых лиц с текущими важными ролями в области информатики биоразнообразия также привел к Резолюция семинара, в которой, среди прочих r аспекты, необходимость создания надежных глобальных реестров ресурсов, которые являются основными для информатики биоразнообразия (например, репозиториев, коллекций); завершить создание прочной таксономической инфраструктуры; и создавать онтологии для данных о биоразнообразии.

Примеры проектов в области информатики биоразнообразия

Глобальные:

Региональные / национальные проекты:

  • LifeWatch предлагается в качестве общеевропейской исследовательской (электронной) инфраструктуры для поддержки исследований и разработки политики в области биоразнообразия.

Список из более 600 текущих информационных материалов по биоразнообразию мероприятия можно найти в базе данных TDWG «Всемирные информационные проекты по биоразнообразию».

См. также

Литература

Дополнительная литература

Внешние ссылки

Последняя правка сделана 2021-05-12 06:44:01
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте