Биологическая база данных

редактировать
Домашняя страница биологической базы данных под названием STRING, которая характеризует функциональные связи между белками.

Биологические базы данных - это библиотеки информации о биологических науках, собранной из научные эксперименты, опубликованная литература, технология высокопроизводительных экспериментов и вычислительный анализ. Они содержат информацию из областей исследований, включая геномику, протеомику, метаболомику, экспрессию генов на микрочипах и филогенетику. Информация, содержащаяся в биологических базах данных, включает функцию генов, структуру, локализацию (как клеточную, так и хромосомную), клинические эффекты мутаций, а также сходство биологических последовательностей и структур.

Биологические базы данных можно в целом разделить на базы данных последовательностей, структур и функциональных возможностей. Последовательности нуклеиновых кислот и белков хранятся в базах данных последовательностей, а в базах данных структур хранятся решенные структуры РНК и белков. Функциональные базы данных предоставляют информацию о физиологической роли генных продуктов, например об активности ферментов, мутантных фенотипах или биологических путях. Базы данных модельных организмов - это функциональные базы данных, которые предоставляют данные по конкретным видам. Базы данных являются важными инструментами, помогающими ученым анализировать и объяснять множество биологических явлений от структуры биомолекул и их взаимодействия до всего метаболизма организмов и понимания эволюция из видов. Эти знания помогают облегчить борьбу с болезнями, помогают в разработке лекарств, предсказании определенных генетических заболеваний и обнаружении основных взаимосвязей между видами в истории жизни.

Биологические знания распространяются среди многих различные общие и специализированные базы данных. Иногда это затрудняет обеспечение последовательности информации. Интегративная биоинформатика - одна из областей, пытающихся решить эту проблему путем предоставления единого доступа. Одним из решений является то, как биологические базы данных перекрестно ссылаются на другие базы данных с номерами доступа, чтобы связать свои связанные знания вместе.

Реляционная база данных концепции информатики и информационный поиск концепции цифровых библиотек важны для понимания биологических баз данных. Проектирование, разработка и долгосрочное управление биологической базой данных - это основная область дисциплины биоинформатики. Содержимое данных включает последовательности генов, текстовые описания, атрибуты и онтологические классификации, цитаты и табличные данные. Они часто описываются как полу- структурированные данные и могут быть представлены в виде таблиц, записей с разделителями ключей и XML-структур.

Содержание

  • 1 Выпуск базы данных исследований нуклеиновых кислот
  • 2 Доступ
  • 3 Базы данных по конкретным видам
  • 4 См. Также
  • 5 Ссылки
  • 6 Внешние ссылки

База данных исследований нуклеиновых кислот Выпуск

Важным ресурсом для поиска биологических баз данных является специальный ежегодный выпуск журнала Nucleic Acids Research (NAR). Выпуск базы данных NAR находится в свободном доступе и классифицирует многие общедоступные онлайн-базы данных, относящиеся к биологии и биоинформатике. В сопутствующей базе данных под названием Online Molecular Biology Database Collection содержится 1380 онлайн-баз данных. Существуют и другие коллекции баз данных, такие как MetaBase и Коллекция ссылок на биоинформатику.

Доступ

Большинство биологических баз данных доступно через веб-сайты, которые организуют данные таким образом, чтобы пользователи могли просматривать данные в Интернете. Кроме того, базовые данные обычно доступны для загрузки в различных форматах. Биологические данные бывают разных форматов. Эти форматы включают текст, данные о последовательностях, структуру белка и ссылки. Каждый из них можно найти в определенных источниках, например:

  • Текстовые форматы предоставляются PubMed и OMIM.
  • Данные последовательности предоставляются GenBank в с точки зрения ДНК и UniProt с точки зрения белка.
  • Белковые структуры предоставлены PDB, SCOP и CATH.

Базы данных по конкретным видам

Базы данных по конкретным видам доступны для некоторых видов, в основном тех, которые часто используются в исследованиях (). Например, EcoCyc - это база данных E. coli. Другие популярные базы данных модельных организмов включают Mouse Genome Informatics для лабораторных мышей, Mus musculus, Rat Genome Database для Rattus, ZFIN для Данио Рерио (рыбок данио), PomBase для делящихся дрожжей Schizosaccharomyces pombe, FlyBase для Drosophila, WormBase для нематод Caenorhabditis elegans и Caenorhabditis briggsae и Xenbase для лягушек Xenopus tropicalis и Xenopus laevis.

См. Также

Ссылки

Внешние ссылки

Последняя правка сделана 2021-05-12 06:49:06
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте