Galaxy (вычислительная биология)

редактировать
Galaxy
Galaxy Project (вычислительная биология) logo.png
Импортированная история Импортированная история
Разработчик (и) Сообщество Galaxy
Первоначальный выпуск16 сентября 2005 г.; 15 лет назад (16 сентября 2005 г.)
Стабильный выпуск 19.01 / 28 февраля 2019 г. (28 февраля 2019 г.)
Репозиторий github.com / galaxyproject / galaxy
Написано наPython, JavaScript
Операционная система Unix-подобная
Платформа Linux, OSX
Доступно вАнглийский
Тип Научный рабочий процесс, интеграция данных, анализ и публикация данных
Лицензия Academic Free License
Веб-сайтgalaxyproject.org

Galaxy - это научный рабочий процесс, интеграция данных и платформа сохранения и публикации данных и анализа, цель которой - сделать вычислительная биология доступна ученым-исследователям, не имеющим опыта компьютерного программирования или системного администрирования. Хотя изначально он был разработан для исследований в области геномики, он в значительной степени не зависит от предметной области и теперь используется в качестве общей системы управления рабочим процессом биоинформатики.

Содержание

  • 1 Функциональность
  • 2 Цели проекта
    • 2.1 Доступность
    • 2.2 Воспроизводимость
    • 2.3 Прозрачность
  • 3 Объекты Galaxy: истории, рабочие процессы, наборы данных и страницы
  • 4 Доступность
  • 5 Реализация
  • 6 Сообщество
  • 7 См. Также
  • 8 Ссылки
  • 9 Внешние ссылки

Функциональность

Galaxy - это система научных рабочих процессов. Эти системы предоставляют средства для построения многоэтапных вычислительных анализов, подобных рецепту. Обычно они предоставляют графический пользовательский интерфейс для указания того, с какими данными работать, какие шаги нужно предпринять и в каком порядке их делать.

Galaxy также интеграция данных платформа для биологических данных. Он поддерживает загрузку данных с компьютера пользователя, по URL-адресу и непосредственно из многих онлайн-ресурсов (таких как UCSC Genome Browser, BioMart и InterMine ). Galaxy поддерживает ряд широко используемых форматов биологических данных и перевод между этими форматами. Galaxy предоставляет веб-интерфейс для многих утилит для работы с текстом, позволяя исследователям выполнять свои собственные переформатирование и манипуляции без необходимости выполнять какое-либо программирование. Galaxy включает утилиты манипулирования интервалами для выполнения теоретико-множественных операций (например, пересечение, объединение,...) с интервалами. Многие форматы биологических файлов включают данные геномных интервалов (система отсчета, например, хромосома или имя контига, а также начальная и конечная позиции), что позволяет интегрировать эти данные.

Galaxy изначально был написан для анализа биологических данных, в частности геномики. Набор доступных инструментов был значительно расширен за прошедшие годы, и теперь Galaxy также используется для экспрессии генов, сборки генома, протеомики, эпигеномики, транскриптомика и множество других дисциплин в области наук о жизни. Сама платформа фактически не зависит от предметной области и теоретически может применяться в любой научной области, такой как хеминформатика. Например, серверы Galaxy существуют для анализа изображений, вычислительной химии и разработки лекарств, космологии, моделирования климата, социальных наук и лингвистики.

Наконец, Galaxy также поддерживает сохранение и публикацию данных и анализа. См. Разделы Воспроизводимость и Прозрачность ниже.

Цели проекта

Galaxy - «открытая веб-платформа для выполнения доступной, воспроизводимой и прозрачной геномной науки».

Доступность

Вычислительная биология - это специализированная область, которая часто требует знания компьютерного программирования. Galaxy стремится предоставить исследователям-биомедикам доступ к вычислительной биологии, не требуя от них понимания компьютерного программирования. Galaxy делает это, делая упор на простой пользовательский интерфейс, а не на возможность создавать сложные рабочие процессы. Такой выбор конструкции позволяет относительно легко строить типовые анализы, но труднее строить сложные рабочие процессы, которые включают, например, циклические конструкции. (См. Apache Taverna для примера системы рабочего процесса, управляемого данными, который поддерживает цикл.)

Воспроизводимость

Воспроизводимость - ключевая цель науки: когда научные результаты Опубликованные публикации должны включать достаточно информации, чтобы другие могли повторить эксперимент и получить те же результаты. В последнее время было предпринято много попыток расширить эту цель от стендовых («мокрая лаборатория ») до вычислительных экспериментов («сухая лаборатория »). Это оказалось более сложной задачей, чем предполагалось изначально.

Galaxy поддерживает воспроизводимость, собирая достаточную информацию о каждом шаге вычислительного анализа, так что анализ может быть повторен точно в любой момент в будущем. Это включает отслеживание всех входных, промежуточных и окончательных наборов данных, а также предоставленных параметров и порядка каждого шага анализа.

Прозрачность

Galaxy поддерживает прозрачность в научных исследованиях, позволяя исследователям делиться любыми из своих объектов Galaxy публично или с конкретными лицами. Общие элементы можно детально исследовать, повторно запускать по желанию, копировать и изменять для проверки гипотез.

Объекты Galaxy: истории, рабочие процессы, наборы данных и страницы

Объекты Galaxy - это все, что можно сохранять, сохранять и совместно использовать в Galaxy:

Истории
Истории - это вычислительный анализ ( recipes) запускаются с указанными наборами входных данных, вычислительными шагами и параметрами. Истории также включают все промежуточные и выходные наборы данных.
Рабочие процессы
Рабочие процессы - это вычислительные анализы, которые определяют все этапы (и параметры) анализа, но не данные. Рабочие процессы используются для выполнения одного и того же анализа для нескольких наборов входных данных.
Наборы данных
Наборы данных включают любой набор входных, промежуточных или выходных данных, используемых или созданных в анализе.
Страницы
Истории, рабочие процессы а наборы данных могут включать аннотации, предоставленные пользователем. Galaxy Pages позволяет создать виртуальный документ, в котором описывается, как и почему проводится весь эксперимент. Этой цели способствует тесная интеграция страниц с историями, рабочими процессами и наборами данных.

Доступность

Galaxy доступен:

  1. как бесплатный общедоступный веб-сервер, поддерживаемый проектом Galaxy. Этот сервер включает в себя множество инструментов биоинформатики, которые широко используются во многих областях геномных исследований. Пользователи могут создавать логины и сохранять истории, рабочие процессы и наборы данных на сервере. Этими сохраненными элементами также можно поделиться с другими.
  2. Как программное обеспечение с открытым исходным кодом, которое можно загрузить, установить и настроить для удовлетворения конкретных потребностей. Galaxy можно установить локально или с помощью вычислительного облака.
  3. общедоступных веб-серверов, размещенных другими организациями. Несколько организаций, у которых есть собственная установка Galaxy, также решили сделать эти серверы доступными для других.
  4. В рамках инициативы GenomeSpace.

Реализация

Galaxy is программное обеспечение с открытым исходным кодом, реализованное с использованием языка программирования Python. Он разработан командой Galaxy из Penn State, Университета Джонса Хопкинса, Орегонского университета здравоохранения и науки и Galaxy Community.

Galaxy. является расширяемым, поскольку новые инструменты командной строки могут быть интегрированы и совместно использованы в Galaxy ToolShed.

Примером расширения Galaxy является Galaxy-P от Института суперкомпьютеров Университета Миннесоты, который настроен как платформа анализа данных для масс-спектрометрии протеомики.

Сообщество

Galaxy - это проект с открытым исходным кодом, и в сообщество входят пользователи, организации, которые установить собственный экземпляр, разработчики Galaxy и разработчики инструментов биоинформатики. У проекта Galaxy есть списки рассылки, центр сообщества и ежегодные встречи.

См. Также

Ссылки

Внешние ссылки

Последняя правка сделана 2021-05-21 10:33:02
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте