Архив чтения последовательности

редактировать
Последовательность Прочитать Архив
Database.png
Содержимое
ОписаниеПоследовательности FASTQ. Данные BAM
Организмы все
Связаться
Исследовательский центр Национальный центр биотехнологической информации. Европейский институт биоинформатики. Банк данных ДНК Японии
Доступ
Веб-сайтwww.ncbi.nlm.nih.gov / sra /. www.ebi.ac.uk / ena /. trace.ddbj.nig.ac.jp /dra/index_e.html

Архив чтения последовательности (SRA, ранее известный как Архив короткого чтения ) - это биоинформатика база данных, которая представляет собой общедоступный репозиторий для данных секвенирования ДНК, особенно "коротких чтений", генерируемых высокопроизводительным секвенированием, которые обычно имеют длину менее 1000 пар оснований. Архив является частью International Nucleotide Sequence Database Collaboration (INSDC) и работает в сотрудничестве между NCBI, Европейским институтом биоинформатики (EBI) и DNA. Банк данных Японии (DDBJ).

Архив был создан Национальным центром биотехнологической информации (NCBI) в 2007 году для того, чтобы обеспечить репозиторий для данных, созданных RNA-Seq и ChIP-Seq исследования, а также крупномасштабные исследования, в том числе Human Microbiome Project и 1000 Genomes Project. Первоначально называвшийся архивом коротких считываний, название было изменено в ожидании того, что будущие технологии секвенирования смогут производить более длинные считывания последовательностей.

SRA быстро выросла с 2008 года. По состоянию на 2011 год, большая часть данных последовательности SRA была произведена Анализатор генома компании Illumina.

Объем данных, хранящихся в архиве чтения последовательностей, быстро растет. По состоянию на сентябрь 2010 г. 65% SRA составляла последовательность генома человека, а еще 16% относились к считыванию последовательности метагенома человека. Большая часть этих данных была депонирована в рамках проекта «1000 геномов». В июне 2011 года данные, содержащиеся в SRA, прошли 100 терабаз ДНК в объеме.

Предпочтительным форматом данных для файлов, представленных в SRA, является формат BAM, который может хранить как выровненные, так и невыровненные чтения. Внутренне SRA полагается на NCBI SRA Toolkit, используемый во всех трех базах данных-членах INSDC, для обеспечения гибкого сжатия данных, API доступа и преобразования в другие форматы, такие как FASTQ.

NCBI объявили о своем плане закрыть NCBI SRA в феврале 2011 года в связи с сокращением финансирования. Однако EBI и DDBJ объявили, что они будут продолжать поддерживать SRA. В октябре 2011 года NCBI объявил о продолжении финансирования SRA.

Размещение данных в SRA требуется большинством финансирующих агентств и журналов с открытым доступом. Журналы Nature Publishing Group требуют, чтобы данные секвенирования ДНК и РНК предоставлялись через SRA.

См. Также

Ссылки

Внешние ссылки

Последняя правка сделана 2021-06-07 10:45:27
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте