BioPerl

редактировать
Коллекция модулей Perl для биоинформатики
BioPerl
BioPerlLogo.png
Первоначальный выпуск11 июня 2002 г. (2002-06-11)
Стабильный выпуск 1.7.2 / 29 ноября 2018 г.; 22 месяца назад (29.11.2018)
Репозиторий Измените это на Wikidata
Написано наPerl
Тип Биоинформатика
Лицензия Художественная лицензия и GPL
Веб-сайтbioperl.org

BioPerl представляет собой собрание Perl модули, облегчающие разработку сценариев Perl для приложений биоинформатики. Он сыграл важную роль в проекте "Геном человека".

Содержание

  • 1 Предыстория
    • 1.1 Влияние на проект "Геном человека"
  • 2 Особенности и примеры
  • 3 Использование
  • 4 Преимущества
  • 5 Недостатки
  • 6 Связанные библиотеки на других языках программирования
  • 7 Ссылки

Предпосылки

BioPerl - это активный программный проект с открытым исходным кодом, поддерживаемый Открытый фонд биоинформатики. Первый набор Perl-кодов BioPerl был создан Тимом Хаббардом и Джонгом Бхаком в MRC Center Cambridge, где первое секвенирование генома было выполнено Фредом Сэнгером. Центр MRC был одним из центров и мест рождения современной биоинформатики, поскольку он имел большое количество последовательностей ДНК и трехмерных белковых структур. Хаббард использовал библиотеку Perl th_lib.pl, которая содержала множество полезных подпрограмм Perl для биоинформатики. Бхак, первый аспирант Хаббарда, создал сайт jong_lib.pl. Бхак объединил две библиотеки подпрограмм Perl в Bio.pl. Название BioPerl было придумано совместно Бхаком и Стивеном Бреннером в Центре белковой инженерии (CPE). В 1995 году Бреннер организовал сессию BioPerl на конференции Интеллектуальные системы для молекулярной биологии, проходившей в Кембридже. В ближайшие месяцы у BioPerl появилось несколько пользователей, в том числе Георг Топиллен, который организовал учебный курс в Германии. Коллеги и студенты Fuellen значительно расширили BioPerl; это было дополнительно расширено другими, включая Стива Червица, который активно разрабатывал коды Perl для своей базы данных генома дрожжей. Основное расширение произошло, когда к команде разработчиков присоединился студент Кембриджа Эван Бирни.

Первый стабильный выпуск был выпущен 11 июня 2002 года; самый последний стабильный (с точки зрения API) выпуск - 1.7.2 от 7 сентября 2017 года. Также периодически выпускаются выпуски для разработчиков. Версия серии 1.7.x считается самой стабильной (с точки зрения ошибок) версией BioPerl и рекомендуется для повседневного использования.

Чтобы воспользоваться преимуществами BioPerl, пользователю необходимо базовое понимание языка программирования Perl, включая понимание того, как использовать ссылки, модули, объекты и методы Perl.

Влияние на проект "Геном человека"

За время своего существования проект "Геном человека" столкнулся с несколькими проблемами. Некоторые из этих проблем были решены, когда многие лаборатории геномики начали использовать Perl. Одной из таких проблем был процесс анализа всех последовательностей ДНК. В некоторых лабораториях были созданы большие монолитные системы со сложными реляционными базами данных, отладка и внедрение которых заняли много времени, и их превзошли новые технологии. Другие лаборатории научились строить модульные слабосвязанные системы, части которых можно было менять местами при появлении новых технологий. Многие из первоначальных результатов всех лабораторий были неоднозначными. В конце концов было обнаружено, что многие из шагов могут быть реализованы в виде слабо связанных программ, запускаемых с помощью сценария оболочки Perl. Еще одна проблема, которая была исправлена, - это обмен данными. В каждой лаборатории обычно были разные программы, которые они запускали со своими скриптами, что приводило к нескольким преобразованиям при сравнении результатов. Чтобы исправить это, лаборатории коллективно начали использовать супернабор данных. Один скрипт использовался для преобразования из супернабора в каждый лабораторный набор, а другой - для обратного преобразования. Это минимизировало количество необходимых сценариев, и обмен данными стал упрощен с Perl.

Возможности и примеры

BioPerl предоставляет программные модули для многих типичных задач программирования биоинформатики. К ним относятся:

Пример доступа к GenBank для получения последовательности:

использовать Bio: : DB :: GenBank; $ db_obj = Bio :: DB :: GenBank->новый; $ seq_obj = $ db_obj->get_Seq_by_acc (# Вставить регистрационный номер);
  • Преобразование форматов записей базы данных / файлов

Пример кода для преобразования форматов

использовать Bio :: SeqIO; my $ usage = "all2y.pl informat outfile outfileformat"; мое использование $ informat = shift or die $; мое использование $ outfile = shift or die $; мое использование $ outformat = shift or die $; мой $ seqin = Bio :: SeqIO->new (-fh =>* STDIN, -format =>$ informat,); мой $ seqout = Bio :: SeqIO->new (-file =>">$ outfile", -format =>$ outformat,); в то время как (мой $ Inseq = $ seqin->next_seq) {$ seqout->write_seq ($ Inseq); }
  • Управление отдельными последовательностями

Пример сбора статистики для данной последовательности

use Bio :: Tools :: SeqStats; $ seq_stats = Bio :: Tools :: SeqStats->новый ($ seqobj); $ вес = $ seq_stats->get_mol_wt (); $ monomer_ref = $ seq_stats->count_monomers (); # для последовательности нуклеиновой кислоты $ codon_ref = $ seq_stats->count_codons ();

Использование

Помимо непосредственного использования конечными пользователями, BioPerl также предоставил основу для широкого спектра биоинформатических инструментов, включая среди других :

  • SynBrowse
  • GeneComber
  • TFBS
  • MIMOX
  • BioParser
  • Вырожденный дизайн праймера
  • Опрос общественности базы данных
  • Текущая сравнительная таблица

Новые инструменты и алгоритмы от внешних разработчиков часто интегрируются непосредственно в сам BioPerl:

  • Работа с филогенетическими деревьями и вложенными таксонами
  • Веб-инструменты FPC

Преимущества

BioPerl был одним из первых репозиториев биологических модулей, который повысил удобство использования. Он имеет очень простые в установке модули, а также гибкий глобальный репозиторий. BioPerl использует хорошие тестовые модули для большого разнообразия процессов.

Недостатки

Есть много способов использования BioPerl, от простого написания сценариев до программирования очень сложных объектов. Это делает язык непонятным, а иногда и трудным для понимания. Из того количества модулей, которые есть в BioPerl, некоторые не всегда работают так, как предполагалось.

Связанные библиотеки на других языках программирования

В рамках Open Bioinformatics Foundation существует несколько связанных библиотек биоинформатики, реализованных на других языках программирования, в том числе:

Ссылки

Последняя правка сделана 2021-05-12 06:39:18
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте