Импортированная история | |
Разработчик (и) | Сообщество Galaxy |
---|---|
Первоначальный выпуск | 16 сентября 2005 г.; 15 лет назад (16 сентября 2005 г.) |
Стабильный выпуск | 19.01 / 28 февраля 2019 г. (28 февраля 2019 г.) |
Репозиторий | github.com / galaxyproject / galaxy |
Написано на | Python, JavaScript |
Операционная система | Unix-подобная |
Платформа | Linux, OSX |
Доступно в | Английский |
Тип | Научный рабочий процесс, интеграция данных, анализ и публикация данных |
Лицензия | Academic Free License |
Веб-сайт | galaxyproject.org |
Galaxy - это научный рабочий процесс, интеграция данных и платформа сохранения и публикации данных и анализа, цель которой - сделать вычислительная биология доступна ученым-исследователям, не имеющим опыта компьютерного программирования или системного администрирования. Хотя изначально он был разработан для исследований в области геномики, он в значительной степени не зависит от предметной области и теперь используется в качестве общей системы управления рабочим процессом биоинформатики.
Galaxy - это система научных рабочих процессов. Эти системы предоставляют средства для построения многоэтапных вычислительных анализов, подобных рецепту. Обычно они предоставляют графический пользовательский интерфейс для указания того, с какими данными работать, какие шаги нужно предпринять и в каком порядке их делать.
Galaxy также интеграция данных платформа для биологических данных. Он поддерживает загрузку данных с компьютера пользователя, по URL-адресу и непосредственно из многих онлайн-ресурсов (таких как UCSC Genome Browser, BioMart и InterMine ). Galaxy поддерживает ряд широко используемых форматов биологических данных и перевод между этими форматами. Galaxy предоставляет веб-интерфейс для многих утилит для работы с текстом, позволяя исследователям выполнять свои собственные переформатирование и манипуляции без необходимости выполнять какое-либо программирование. Galaxy включает утилиты манипулирования интервалами для выполнения теоретико-множественных операций (например, пересечение, объединение,...) с интервалами. Многие форматы биологических файлов включают данные геномных интервалов (система отсчета, например, хромосома или имя контига, а также начальная и конечная позиции), что позволяет интегрировать эти данные.
Galaxy изначально был написан для анализа биологических данных, в частности геномики. Набор доступных инструментов был значительно расширен за прошедшие годы, и теперь Galaxy также используется для экспрессии генов, сборки генома, протеомики, эпигеномики, транскриптомика и множество других дисциплин в области наук о жизни. Сама платформа фактически не зависит от предметной области и теоретически может применяться в любой научной области, такой как хеминформатика. Например, серверы Galaxy существуют для анализа изображений, вычислительной химии и разработки лекарств, космологии, моделирования климата, социальных наук и лингвистики.
Наконец, Galaxy также поддерживает сохранение и публикацию данных и анализа. См. Разделы Воспроизводимость и Прозрачность ниже.
Galaxy - «открытая веб-платформа для выполнения доступной, воспроизводимой и прозрачной геномной науки».
Вычислительная биология - это специализированная область, которая часто требует знания компьютерного программирования. Galaxy стремится предоставить исследователям-биомедикам доступ к вычислительной биологии, не требуя от них понимания компьютерного программирования. Galaxy делает это, делая упор на простой пользовательский интерфейс, а не на возможность создавать сложные рабочие процессы. Такой выбор конструкции позволяет относительно легко строить типовые анализы, но труднее строить сложные рабочие процессы, которые включают, например, циклические конструкции. (См. Apache Taverna для примера системы рабочего процесса, управляемого данными, который поддерживает цикл.)
Воспроизводимость - ключевая цель науки: когда научные результаты Опубликованные публикации должны включать достаточно информации, чтобы другие могли повторить эксперимент и получить те же результаты. В последнее время было предпринято много попыток расширить эту цель от стендовых («мокрая лаборатория ») до вычислительных экспериментов («сухая лаборатория »). Это оказалось более сложной задачей, чем предполагалось изначально.
Galaxy поддерживает воспроизводимость, собирая достаточную информацию о каждом шаге вычислительного анализа, так что анализ может быть повторен точно в любой момент в будущем. Это включает отслеживание всех входных, промежуточных и окончательных наборов данных, а также предоставленных параметров и порядка каждого шага анализа.
Galaxy поддерживает прозрачность в научных исследованиях, позволяя исследователям делиться любыми из своих объектов Galaxy публично или с конкретными лицами. Общие элементы можно детально исследовать, повторно запускать по желанию, копировать и изменять для проверки гипотез.
Объекты Galaxy - это все, что можно сохранять, сохранять и совместно использовать в Galaxy:
Galaxy доступен:
Galaxy is программное обеспечение с открытым исходным кодом, реализованное с использованием языка программирования Python. Он разработан командой Galaxy из Penn State, Университета Джонса Хопкинса, Орегонского университета здравоохранения и науки и Galaxy Community.
Galaxy. является расширяемым, поскольку новые инструменты командной строки могут быть интегрированы и совместно использованы в Galaxy ToolShed.
Примером расширения Galaxy является Galaxy-P от Института суперкомпьютеров Университета Миннесоты, который настроен как платформа анализа данных для масс-спектрометрии протеомики.
Galaxy - это проект с открытым исходным кодом, и в сообщество входят пользователи, организации, которые установить собственный экземпляр, разработчики Galaxy и разработчики инструментов биоинформатики. У проекта Galaxy есть списки рассылки, центр сообщества и ежегодные встречи.