Программный проект для анализа геномных данных
Bioconductor - это бесплатный, проект с открытым исходным кодом и с открытым исходным кодом для анализа и понимать Использование геномных данных, полученных в ходе влажных лабораторий экспериментов в молекулярной биологии.
Bioconductor, основано в первую очередь на статистическом языке программирования R, но содержит вклады на других языках программирования. Он выпускает два выпуска каждый год, которые следуют за полугодовыми выпусками R. В любой момент существует выпускная версия , которая соответствует выпущенной версии R, и разрабатываемая версия, которая соответствует разрабатываемой версии R. Большинство пользователей сочтут выпускаемую версию подходящей для своих нужд. Кроме того, доступно множество пакетов аннотации генома, которые в основном, но не исключительно, ориентированы на различные типы микрочипов.
. В то время как вычислительные методы продолжают развиваться для интерпретации биологических данных, проект Bioconductor - это репозиторий программного обеспечения с открытым исходным кодом, в котором размещен широкий спектр статистических инструментов, разработанных в среде программирования R. Используя богатый набор статистических и графических функций в R, многие пакеты Bioconductor были разработаны для удовлетворения различных потребностей в анализе данных. Использование этих пакетов обеспечивает базовое понимание языка программирования / команд R. В результате, пакеты R и Bioconductor, имеющие большой опыт в области вычислений, используются большинством биологов, которые получат значительную выгоду от своей способности анализировать наборы данных. Все эти результаты предоставляют биологам легкий доступ к анализу геномных данных без необходимости программирования опыта.
Проект был начат осенью 2001 года и находится под контролем основной группы Bioconductor, в основном из Фреда. Центр исследования рака Хатчинсона с другими членами из международных организаций.
Содержание
- 1 Пакеты
- 2 Цели
- 3 Основные характеристики
- 4 Вехи
- 5 Ресурсы
- 6 См. Также
- 7 Ссылки
- 8 Внешние ссылки
Пакеты
Большинство компонентов Bioconductor распространяются как пакеты R, которые являются дополнительными модулями для R. Первоначально большинство пакетов программного обеспечения Bioconductor были ориентированы на анализ одноканального Affymetrix и двух или более микроматриц кДНК / Oligo. По мере развития проекта функциональные возможности программных пакетов расширились и стали включать анализ всех типов геномных данных, таких как данные SAGE, последовательность или SNP.
Цели
Основные цели проектов:
- Обеспечение широкого доступа к широкому спектру мощных статистических и графических методов. для анализа геномных данных.
- Содействовать включению биологических метаданных в анализ геномных данных, например литературные данные из PubMed, аннотационные данные из LocusLink / Entrez.
- Обеспечивают общую программную платформу, которая обеспечивает быструю разработку и развертывание сменного, масштабируемого и интероперабельного программного обеспечения.
- Дальнейшее научное понимание путем создания высококачественного документация и воспроизводимые исследования.
- Обучить исследователей вычислительным и статистическим методам анализа геномных данных.
Основные возможности
- Документирование и воспроизводимые исследования. Каждый пакет Bioconductor содержит как минимум одну виньетку, которая - это документ, содержащий текстовое, ориентированное на задачи описание функциональности пакета. Эти виньетки бывают нескольких форм. Многие из них представляют собой простые инструкции «How-to », предназначенные для демонстрации того, как конкретная задача может быть выполнена с помощью программного обеспечения этого пакета. Другие предоставляют более подробный обзор пакета или могут даже обсуждать общие вопросы, связанные с пакетом. В будущем проект Bioconductor стремится предоставить виньетки, которые не привязаны конкретно к пакету, а скорее демонстрируют более сложные концепции. Как и во всех аспектах проекта Bioconductor, пользователям предлагается принять участие в этой работе.
- Статистические и графические методы. Проект Bioconductor направлен на обеспечение доступа к широкому спектру мощных статистических и графических методов для анализ геномных данных. Доступны пакеты анализа для: предварительной обработки данных массивов Affymetrix и Illumina, кДНК ; идентификация дифференциально экспрессируемых генов ; теоретический анализ графов; построение геномных данных. Кроме того, сама система пакетов R обеспечивает реализации широкого диапазона современных статистических и графических методов, включая linear и нелинейное моделирование, кластерный анализ, прогноз, повторная выборка, анализ выживаемости и временные ряды анализа.
- Аннотации генома. Проект Bioconductor предоставляет программное обеспечение для связывания микрочипов и других геномных данных в реальном времени с биологическими метаданными из веб-баз данных, таких как GenBank, LocusLink и PubMed (пакет с аннотациями). Также предусмотрены функции для включения результатов статистического анализа в отчеты HTML со ссылками на аннотационные ресурсы WWW. Доступны программные инструменты для сборки и обработки данных геномных аннотаций из таких баз данных, как GenBank, Gene Ontology Consortium, LocusLink, UniGene, UCSC Human Genome Project и другие с пакетом AnnotationDbi. Пакеты данных распространяются для обеспечения сопоставлений между различными идентификаторами зондов (например, Affy ID, LocusLink, PubMed ). Также могут быть собраны настраиваемые библиотеки аннотаций.
- Открытый исходный код. Проект Bioconductor привержен принципу полного открытого исходного кода с распространением через платформу, подобную SourceForge.net. Ожидается, что все дополнения будут существовать под лицензией с открытым исходным кодом, например Artistic 2.0, GPL2 или BSD. Есть много разных причин, по которым программное обеспечение с открытым исходным кодом полезно для анализа данных микрочипов и для вычислительной биологии в целом. Причины включают:
- Обеспечить полный доступ к алгоритмам и их реализации
- Для облегчения улучшения программного обеспечения посредством исправления ошибок и plug- ins
- Поощрять научные вычисления и статистическую практику, предоставляя соответствующие инструменты и инструкции
- Предоставлять инструментальные средства, позволяющие исследователям исследовать и расширять методы, используемые для анализа биологических данных
- Чтобы международное научное сообщество стало владельцем программных инструментов, необходимых для проведения исследований
- возглавлять и поощрять коммерческую поддержку и разработку тех инструментов, которые являются успешными
- Содействовать воспроизводимому исследованию, предоставляя открытые и доступные инструменты для проведения этого исследования (воспроизводимое исследование отличается от независимой проверки)
- Открытая разработка.Пользователи могут стать разработчиками, внося свой вклад в соблюдение требований Bioconductor. NT пакеты или документацию. Кроме того, Bioconductor предоставляет механизм для объединения различных групп с общими целями для развития сотрудничества в области программного обеспечения, возможно, на уровне совместной разработки.
Основные этапы
Каждая Выпуск Bioconductor разработан для наилучшей работы с выбранной версией R. В дополнение к исправлениям ошибок и обновлениям в новый выпуск обычно добавляются пакеты. В таблице ниже сопоставляется выпуск Bioconductor с версией R и показано количество доступных пакетов программного обеспечения Bioconductor для этого выпуска.
Версия | Дата выпуска | Количество пакетов | Зависимость от R |
---|
3.11 | 28 апреля 2020 г. | 1903 | R 4,0 |
3,10 | 30 октября 2019 г. | 1823 | R 3,6 |
3,8 | 31 октября 2018 г. | 1649 | 3,5 |
3,6 | 31 октября 2017 г. | 1473 | 3,4 |
3,4 | 18 октября 2016 г. | 1296 | 3,3 |
3,2 | 14 октября 2015 г. | 1104 | 3,2 |
3,0 | 14 октября 2014 г. | 934 | R 3,1 |
2,13 | 15 октября 2013 г. | 749 | R 3,0 |
2,11 | 3 октября 2012 г. | 610 | R 2,15 |
2,9 | 1 ноября 2011 г. | 517 | R 2,14 |
2,8 | 14 апреля 2011 г. | 466 | R 2,13 |
2,7 | 18 ноября 2010 г. | 418 | R 2,12 |
2,6 | 23 апреля 2010 г. | 389 | R 2,11 |
2,5 | 28 октября 2009 г. | 352 | R 2,10 |
2,4 | 21 апреля 2009 г. | 320 | 2,9 |
2,3 | 22 октября 2008 г. | 294 | 2,8 |
2,2 | 1 мая 2008 г. | 260 | 2,7 |
2,1 | 8 октября 2007 г. | 233 | 2,6 |
2,0 | 26 апреля 2007 г. | 214 | R 2,5 |
1,9 | 4 октября 2006 г. | 188 | R 2,4 |
1,8 | 27 апреля 2006 г. | 172 | R 2.3 |
1.7 | 14 октября 2005 г. | 141 | R 2.2 |
1,6 | 18 мая 2005 г. | 123 | R 2.1 |
1.5 | 25 октября 2004 г. | 100 | R 2.0 |
1.4 | 17 мая 2004 г. | 81 | R 1,9 |
1,3 | 30 октября 2003 г. | 49 | R 1,8 |
1,2 | 29 мая 2003 г. | 30 | R 1,7 |
1,1 | 19 октября 2002 г. | 20 | R 1,6 |
1,0 | 1 мая 2002 г. | 15 | R 1,5 |
Ресурсы
- Gentleman, R.; Кэри, В.; Huber, W.; Irizarry, R.; Дудуа, С. (2005). Решения в области биоинформатики и вычислительной биологии с использованием R и Bioconductor. Springer. ISBN 978-0-387-25146-2.
- Джентльмен Р. (2008). Программирование на R для биоинформатики. Чепмен и Холл / CRC. ISBN 1-4200-6367-7.
- Hahne, F.; Huber, W.; Джентльмен, Р.; Сокол, С. (2008). Примеры использования биопроводников. Springer. ISBN 978-0-387-77239-4.
- Джентльмен, Роберт К. ; Кэри, Винсент Дж.; Бейтс, Дуглас М.; Болстад, Бен; Деттлинг, Марсель; Дудуа, Сандрин ; Эллис, Байрон; Готье, Лоран; Ге, Юнчао; Джентри, Джефф; Хорник, Курт; Хорн, Торстен; Хубер, Вольфганг; Иак, Стефано; Иризарри, Рафаэль; Лейш, Фридрих; Ли, Ченг; Maechler, Мартин; Россини, Энтони Дж.; Савицки, Гюнтер; Смит, Колин; Смит, Гордон; Тирни, Люк; Ян, Жан Ю. Х. ; Чжан, Цзяньхуа (2004). «Биокондуктор: открытая разработка программного обеспечения для вычислительной биологии и биоинформатики». Геномная биология. 5(10): R80. DOI : 10.1186 / GB-2004-5-10-R80. PMC 545600. PMID 15461798.
См. Также
- Портал бесплатного программного обеспечения с открытым исходным кодом
- Портал биологии
Ссылки
.
Внешние ссылки
- Официальный веб-сайт
- Проект R GNU R - это язык программирования для статистических вычислений.
- Выпуски Bioconductor
- Сообщество дистрибутива Debian GNU / Linux стремится к автоматизированная сборка пакетов BioConductor для их распространения. BioKnoppix и Quantian - это проекты, расширяющие Knoppix, которые предоставили загрузочные компакт-диски Debian GNU / Linux с установками BioConductor.