Список биологических баз данных
редактировать
Биологические базы данных - хранилища биологической информации. Журнал Nucleic Acids Research регулярно публикует специальные выпуски по биологическим базам данных и имеет список таких баз данных. В выпуске 2018 года содержится список из около 180 таких баз данных и обновлений к ранее описанным базам данных.
Содержание
- 1 Мета-базы данных
- 2 Базы данных модельных организмов
- 3 Базы данных нуклеиновых кислот
- 3.1 Базы данных ДНК
- 3.2 Базы данных экспрессии генов (в основном данные микрочипов)
- 3.3 Базы данных фенотипов
- 3.4 Базы данных РНК
- 4 Базы данных аминокислот / белков
- 4.1 Базы данных последовательностей протеинов
- 4.2 Базы данных структур протеинов
- 4.3 Белки Базы данных моделей
- 4.4 Белковые взаимодействия и другие молекулярные взаимодействия
- 4.5 Базы данных экспрессии белков
- 5 Базы данных путей передачи сигналов
- 6 Базы данных метаболических путей и функций белков
- 7 Дополнительные базы данных
- 7.1 Экзосомные базы данных
- 7.2 Базы данных математических моделей
- 7.3 Таксономические базы данных
- 7.4 Радиологические базы данных
- 7.5 Базы данных по устойчивости к противомикробным препаратам
- 8 Базы данных в стиле Wiki
- 9 Специализированные базы данных
- 10 Ссылки
- 11 Внешние ссылки
Мета-базы данных
Мета-базы данных - это базы данных баз данных, которые собирают данные о данных для генерации новых данных. Они способны объединять информацию из разных источников и делать ее доступной в новой и более удобной форме или с акцентом на конкретное заболевание или организм.
- ConsensusPathDB : база данных молекулярного функционального взаимодействия, объединяющая информацию из 12 других
- Entrez (Национальный центр биотехнологической информации )
- Neuroscience Information Framework (University of Калифорния, Сан-Диего ): int объединяет сотни ресурсов, имеющих отношение к нейробиологии; многие из них перечислены ниже
Базы данных модельных организмов
Базы данных модельных организмов предоставляют подробные биологические данные для интенсивного изучения.
- PomBase : база знаний о делящихся дрожжах Schizosaccharomyces pombe
Базы данных нуклеиновых кислот
Базы данных ДНК
Первичные базы данных. Международная нуклеотидная последовательность База данных (INSD) состоит из следующих баз данных.
DDBJ (Япония), GenBank (США) и European Nucleotide Archive (Европа) являются хранилищами данных нуклеотидной последовательности от всех организмов. Все три принимают представления нуклеотидных последовательностей, а затем обмениваются новые и обновляемые данные на ежедневной основе для достижения оптимальной синхронизации между ними. Эти три базы данных являются первичными базами данных, так как они содержат исходные данные о последовательностях. Они взаимодействуют с Sequence Read Archive (SRA), который архивирует необработанные чтения из инструменты для высокопроизводительного секвенирования.
Вторичные базы данных
- База данных 23andMe
- HapMap
- OMIM (онлайн-менделевское наследование у человека): наследственные заболевания
- RefSeq
- Проект 1000 геномов : запущен в январе 2008 г. Геномы более тысячи анонимных участников из различных различные этнические группы были проанализированы и опубликованы.
- База данных EggNOG: иерархический, функционально и филогенетически аннотированный ортологический ресурс, основанный на 5090 организмах и 2502 вирусах. Он обеспечивает множественное выравнивание последовательностей и деревья максимального правдоподобия, а также широкую функциональную аннотацию.
Базы данных экспрессии генов (в основном данные микрочипов)
Геномные базы данных
Эти базы данных собирают геном последовательностей, аннотируйте и анализируйте их и предоставляйте общий доступ. Некоторые добавляют курата ion экспериментальной литературы для улучшения расчетных аннотаций. Эти базы данных могут содержать геномы многих видов или один геном модельного организма.
- ArrayExpress: архив данных функциональной геномики; хранит данные высокопроизводительных экспериментов по функциональной геномике из EMBL
- Bioinformatic Harvester
- Ensembl : обеспечивает автоматические базы данных аннотаций для людей, мышей, других позвоночных и эукариот геномы
- Ensembl Genomes : предоставляет данные в масштабе генома для бактерий, простейших, грибов, растений и беспозвоночных многоклеточных животных через унифицированный набор интерактивных и программных интерфейсов (с использованием программной платформы Ensembl)
- FlyBase : геном модельного организма Drosophila melanogaster
- База данных по генным заболеваниям
- Омнибус экспрессии генов (GEO): общедоступный репозиторий функциональных геномных данных из Национального института рака США (NCI), который поддерживает данные на основе массивов и последовательностей. Предоставляются инструменты для запроса и загрузки профилей экспрессии генов.
- Атлас белков человека (HPA): общедоступная база данных с профилями экспрессии генов, кодирующих человеческие белки, как на уровне мРНК, так и на уровне белка в тканях, клетках, субклеточных компартментах и раковые опухоли.
- Информационная система по бобовым (LIS): геномная база данных для семейства бобовых
- Персональный геномный проект : человеческие геномы 100000 добровольцев со всего мира
- RGD (База данных генома крыс ): данные генома и фенотипа для Rattus norvegicus
- База данных генома Saccharomyces : геном дрожжей модельного организма
- SNPedia
- База данных SoyBase (SoyBase): генетическая база данных сои и геномная база данных Министерства сельского хозяйства США (Soybean )
- UCSC Malaria Genome Browser : геном видов, вызывающих малярию (Plasmodium falciparum и другие)
- Wormbase : геном модельного организма Caenorhabditis elegans и WormBase ParaSite для видов-паразитов
- Xenbase : геном модельного организма Xenopus tropicalis и Xenopus laevis
- Информационная сеть по рыбкам данио : геном этой рыбы модельного организма
Базы данных фенотипов
- PHI-base : база данных взаимодействия патоген-хозяин. Он связывает информацию о генах с фенотипической информацией от микробных патогенов на их хозяевах. Информация подбирается вручную из рецензируемой литературы.
- RGD База данных генома крысы : данные генома и фенотипа для Rattus norvegicus
- База данных PomBase : вручную подобранные фенотипические данные для дрожжей Schizosaccharomyces pombe
РНК базы данных
- miRBase : база данных микроРНК
- Rfam : база данных семейств РНК
базы данных аминокислот / белков
- DisProt : база данных экспериментальных доказательств нарушения в белках (Школа медицины Университета Индианы, Университет Темпл, Университет Падуи )
- InterPro : классифицирует белки по семействам и прогнозирует наличие доменов и сайтов
- MobiDB : база данных аннотаций внутренних нарушений белков (Университет Падуи )
- neXtProt : a человеческий ресурс, ориентированный на белок
- Pfam : база данных сопоставлений и HMM семейств белков (Институт Сангера )
- ПРИНТЫ : сборник протеинов n отпечатков пальцев из (Манчестерского университета )
- ПРОФИЛЬ : база данных семейств белков и доменов
- Информационный ресурс по белкам (Джорджтаунский университет Medical Center [GUMC])
- SUPERFAMILY : библиотека HMM, представляющая суперсемейства, и база данных аннотаций (суперсемейства и семейства) для всех полностью секвенированных организмов
- Swiss-Prot : база знаний о белках (Swiss Институт биоинформатики )
- NCBI : последовательность белков и база знаний (Национальный центр биотехнологической информации)
- Банк данных по белкам (PDB), содержащий:
- Банк данных о белках в Европе (PDBe)
- Prot Банк данных einDatabank в Японии (PDBj)
- Научно-исследовательское сотрудничество в области структурной биоинформатики (RCSB)
- Структурная классификация белков (SCOP)
Дополнительные базы данных структуры белков см. также База данных структуры белков.
- ModBase : база данных сравнительных моделей структуры белков (Sali Lab, UCSF )
- Матрица сходства белков (SIMAP ): база данных сходства белков, рассчитанная с использованием FASTA
- Swiss-model : сервер и репозиторий для моделей структуры белков
- AAindex : база данных аминокислотных индексов, матриц аминокислотных мутаций, потенциалы парных контактов
белок-белок и другие молекулярные взаимодействия
- Атлас белков человека : направлен на отображение всех белков человека в клетках, тканях и органах
базы данных путей передачи сигналов
Базы данных метаболических путей и функций белков
- Коллекция баз данных BioCyc : включает EcoCyc и MetaCyc
- BRENDA : комплексную информационную систему по ферментам, включая FRENDA, AMENDA, DRENDA и KENDA
- HMDB : содержит подробную информацию о низкомолекулярные метаболиты, обнаруженные в организме человека
- База данных KEGG PATHWAY (Univ. Киото )
- MANET database (University of Illinois )
- Reactome : navigable map of human biological pathways, ranging from metabolic processes to hormonal signalling (Ontario Institute for Cancer Research, European Bioinformatics Institute, NYU Langone Medical Center, Cold Spring Harbor Laboratory )
- SABIO-RK : database for biochemical reactions and their kinetic properties
- WikiPathways
Additional databases
Exosomal databases
- ExoCarta
- Extracellular RNA Atlas: a repository of small RNA-seq and qPCR-derived exRNA profiles from human and mouse biofluids
Mathematical model databases
- Biomodels Database : published mathematical models describing biological processes
Taxonomic databases
- BacDive : bacterial metadatabase that provides strain-linked information about bacterial and archaeal biodiversity, including taxonomy information
- EzTaxon-e : database for the identification of prokaryotes based on 16S ribosomal RNA gene sequences
Radiologic databases
Wiki-style databases
Specialized databases
- Barcode of Life Data Systems : database of DNA barcodes
- The Cancer Genome Atlas (TCGA): provides data from hundreds of cancer samples obtained using high-throughput techniques such as gene expression profiling, copy number variationпрофилирование, генотипирование SNP, профилирование метилирования ДНК по всему геному, профилирование микроРНК и секвенирование экзонов не менее 1200 генов
- Cellosaurus : ресурс знаний по клеточным линиям
- CTD (Сравнительная токсикогеномика База данных ): описывает взаимодействия химикатов, генов и болезней.
- DiProDB : база данных для сбора и анализа термодинамических, структурных и других свойств динуклеотидов
- Dryad : хранилище данных, лежащих в основе научных публикаций в базовые и прикладные биологические науки
- Эдинбургский Атлас мышей
- База данных эукариотических промоторов EPD
- FINDbase (база данных частоты унаследованных заболеваний)
- GigaDB : хранилище крупномасштабных наборов данных, лежащих в основе научных публикаций в биологические и биомедицинские исследования
- HGNC (Комитет по номенклатуре генов HUGO): ресурс для утвержденной номенклатуры генов человека
- Международный консорциум эпигенома человека : объединяет эпигеномные справочные данные из хорошо известных национальных проектов, таких как Канадский CEEHRC, European Blueprint, European Genome-phenome Archive (EGA), US ENCODE и NIH Roadmap, German DEEP, Japanese CREST, Korean KNIH, Singapore's GIS and China EpiHK
- MethBase : база данных данных метилирования ДНК, визуализированных в UCSC Genome Browser
- Minimotif Miner : база данных коротких непрерывных функциональных пептидных мотивов
- Онкогеномных баз данных : сборник баз данных, служащих для исследований рака
- PubMed : ссылки и рефераты по наукам о жизни и биомедицине
- интегрированная база данных RIKEN по млекопитающим
- TDR Targets : база данных хемогеномики, ориентированная на открытие лекарств при тропических болезнях
- TRANSFAC : база данных о факторах транскрипции эукариот, их сайтах связывания генома и профилях связывания ДНК
- JASPAR : база данных вручную подобранных, неизбыточных профилей связывания факторов транскрипции.
- MetOSite : база данных о сайтах сульфоксидации метионина и их функциях. roles in proteins
- Healthcare Cost and Utilization Project (HCUP) is the largest collection of hospital care data in the United States. It includes hundreds of millions of inpatient, outpatient, and emergency records.
References
External links