GeneNetwork

редактировать
GeneNetwork
Разработчик (и) Группа разработчиков GeneNetwork, Университет Теннесси
Стабильная версия 2.0 / 15 января 1994; 26 лет назад (1994-01-15)
Репозиторий github.com / genenetwork / genenetwork2
Написано наJavaScript, HTML, Python, CSS, CoffeeScript, PHP
Лицензия Стандартная общественная лицензия Affero
Веб-сайтwww.genenetwork.org

GeneNetwork - это комбинированная база данных и открытый источник программный ресурс для анализа данных биоинформатики. Этот ресурс используется для изучения сетей регуляции генов, которые связывают различия в последовательностях ДНК с соответствующими различиями в экспрессии генов и белков и с вариациями в таких характеристиках, как здоровье и риск заболеваний. Наборы данных в GeneNetwork обычно состоят из больших коллекций генотипов (например, SNP ) и фенотипов групп лиц, включая людей, линии мышей и крыс, а также такие разнообразные организмы, как Drosophila melanogaster, Arabidopsis thaliana и ячмень. Включение генотипов делает практичным выполнение картирования генов на основе Интернета для обнаружения тех областей геномов, которые способствуют различиям между людьми в уровнях мРНК, белка и метаболитов, а также различиях в функциях клеток, анатомия, физиология и поведение.

Содержание
  • 1 История
  • 2 Организация и использование
  • 3 Источники данных
  • 4 Инструменты и функции
  • 5 Код
  • 6 См. Также
  • 7 Ссылки
  • 8 Внешние links
История

Разработка GeneNetwork началась в Центре медицинских наук Университета Теннесси в 1994 году как веб-версия Portable Dictionary of the Mouse Genome (1994). GeneNetwork - это первая и самая продолжительная непрерывно работающая веб-служба в области биомедицинских исследований [см. https://en.wikipedia.org/w/List_of_websites_founded_before_1995 ]. В 1999 г. Portable Gene Dictionary был объединен с программой картирования Map Manager QT Кеннета Ф. Мэнли для создания онлайн-системы для генетического анализа в реальном времени. В начале 2003 года были включены первые большие наборы данных по экспрессии генов Affymetrix (вся мРНК мозга мыши и гемопоэтические стволовые клетки), и система была переименована в WebQTL. GeneNetwork теперь разрабатывается международной группой разработчиков и имеет зеркала и сайты разработки в Европе, Азии и Австралии. Производственные службы размещаются в системах в Центре медицинских наук Университета Теннесси с резервным экземпляром в Европе.

Текущая производственная версия GeneNetwork (также известная как GN2) была выпущена в 2016 году. Текущая версия GeneNetwork использует ту же базу данных, что и ее предшественник, GN1, но имеет гораздо более модульный и поддерживаемый открытый исходный код ( доступно на GitHub ). GeneNetwork теперь также имеет важные новые функции, включая поддержку:

Организация и использование

GeneNetwork состоит из двух основных компонентов:

  • Massive коллекции генетических, геномных и фенотипических данных для больших групп лиц
  • Сложное программное обеспечение для статистического анализа и картирования генов, которое позволяет анализировать молекулярные и клеточные сети и взаимосвязь генотип-фенотип

Четыре уровня данных: обычно получается за каждый Семья или популяция:

  1. последовательности ДНК и генотипы
  2. Данные молекулярной экспрессии, часто генерируемые с использованием массивов, RNA-seq, эпигеномных, протеомных, метаболомных и метагеномных методов (молекулярные фенотипы)
  3. Стандартные количественные фенотипы, которые часто являются частью типичной медицинской документации (например, химический анализ крови, масса тела)
  4. Файлы аннотаций и метаданные для признаков и наборов данных

Объединенные типы данных размещаются вместе в реляционной базе данных и на файловом сервере IPSF и концептуально организованы и сгруппированы по видам, когорте и семейству. Система реализована в виде стека LAMP (программный пакет). Код и упрощенная версия базы данных MariaDB доступны на GitHub.

GeneNetwork в основном используется исследователями, но также была успешно принята на курсах бакалавриата и магистратуры по генетике и биоинформатике (см. YouTube, пример ), биоинформатики, физиологии и психологии. Исследователи и студенты обычно извлекают наборы генотипов и фенотипов из одной или нескольких семей и используют встроенные статистические и картографические функции, чтобы исследовать отношения между переменными и создавать сети ассоциаций. Ключевые шаги включают анализ следующих факторов:

  1. Диапазон вариации признаков
  2. Ковариация между признаками (диаграммы рассеяния и корреляции, анализ главных компонентов)
  3. Архитектура более крупных сетей признаков
  4. Локус количественных признаков картирование и причинные модели связи между различиями последовательностей и различиями фенотипов
Источники данных

Наборы данных по признакам и молекулярной экспрессии отправляются непосредственно исследователями или извлекаются из таких репозиториев, как Национальный центр биотехнологической информации Омнибус экспрессии генов. Данные охватывают множество клеток и тканей - от популяций отдельных клеток иммунной системы, конкретных тканей (сетчатка, префронтальная кора) до целых систем (весь мозг, легкие, мышцы, сердце, жир, почки, цветы, зародыши целых растений). Типичный набор данных охватывает сотни полностью генотипированных особей и может также включать технические и биологические копии. Генотипы и фенотипы обычно берутся из рецензируемых статей. GeneNetwork включает файлы аннотаций для нескольких платформ профилирования РНК (Affymetrix, Illumina и Agilent). RNA-seq и количественные протеомные, метаболомные, эпигенетические и метагеномные данные также доступны для нескольких видов, включая мыши и человека.

Инструменты и функции

На сайте есть инструменты для широкого спектра функций, которые варьируются от простых графических отображений вариаций в экспрессии генов или других фенотипов до диаграмм разброса пар признаков (Pearson или порядок ранжирования), построение как простых, так и сложных сетевых графов, анализ главных компонентов и синтетических признаков, отображение QTL с использованием маркерной регрессии, отображение интервалов и сканирование пар для эпистатических взаимодействий. Большинство функций работают со 100 признаками, а некоторые функции работают со всем транскриптомом .

. Базу данных можно просматривать и искать на главной странице search. Он-лайн учебник доступен. Пользователи также могут загрузить первичные наборы данных в виде текстовых файлов, Excel или, в случае сетевых графиков, как SBML. По состоянию на 2017 год GN2 доступен в виде бета-версии.

Код

GeneNetwork - это проект с открытым исходным кодом, выпущенный под Стандартной общественной лицензией Affero (AGPLv3). Большая часть кода написана на Python, но включает модули и другой код, написанный на C, R и JavaScript. Код в основном Python 2.4. GN2 в основном написан на Python 2.7 в среде Flask с HTML-шаблонами Jinja 2), но переход на Python 3.X запланирован в ближайшие несколько лет. GN2 вызывает множество статистических процедур, написанных на языке программирования R. Исходный исходный код 2010 года вместе с компактной базой данных доступны на SourceForge. Хотя GN1 активно поддерживался в течение 2019 GitHub, с 2020 года вся работа сосредоточена на GN2.

См. Также
Ссылки
Внешние ссылки
Связанные ресурсы

Другая системная генетика и сетевые базы данных

Последняя правка сделана 2021-05-21 14:19:35
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте