Браузер генома UCSC

редактировать
Интернет-браузер и загружаемый браузер генома, размещенный в Калифорнийском университете в Санта-Круз
Браузер генома UCSC
Database.png
Контент
ОписаниеБраузер генома UCSC
Связаться
Исследовательский центр Калифорнийский университет в Санта-Круз
Лаборатория Центр биомолекулярной науки и инженерии, Школа Баскина Engineering,
Основное упоминаниеLee al. (2020)
Доступ
Веб-сайтгеном.ucsc.edu

Браузер генома UCSC доступен для загрузки в режиме онлайн, браузер генома, размещенный в Калифорнийском университете, Санта-Крус (UCSC). Это интерактивный веб-сайт, предлагающий доступ к данным о последовательности генома различных видов позвоночных и беспозвоночных, а также основных модельных организмов, интегрированный с большой коллекцией выровненных аннотаций. Браузер - это средство просмотра с графическим интерфейсом, оптимизированное для поддержки быстрой интерактивной работы, и представляет собой набор веб-инструментов с открытым исходным кодом, созданный на основе базы данных MySQL для быстрой визуализации, изучения и запроса данных на многих уровнях. Базу данных Genome Browser, инструменты просмотра, загружаемые файлы данных и документацию можно найти на веб-сайте UCSC Genome Bioinformatics.

Содержание

  • 1 История
  • 2 Геномы
  • 3 Функциональность браузера
    • 3.1 Дорожки
      • 3.1.1 Картирование и секвенирование
      • 3.1.2 Гены и прогнозы генов
      • 3.1.3 Фенотип и литература
      • 3.1.4 мРНК и EST
      • 3.1.5 Экспрессия
      • 3.1.6 Регуляция
      • 3.1.7 Сравнительная геномика
      • 3.1.8 Данные вариации
      • 3.1.9 Повторы
  • 4 Инструменты анализа
  • 5 Открытый исходный код / ​​зеркала
  • 6 См. Также
  • 7 Ссылки
  • 8 Внешние ссылки

История

Первоначально построено и все еще управляется Джимом Кент, тогда аспирант, и Дэвид Хаусслер, профессор компьютерных наук (ныне биомолекулярная инженерия) в Калифорнийском университете в Санта-Круз в 2000 году, обозреватель генома UCSC началось как ресурс для распространения первых плодов проекта «Геном человека . При финансовой поддержке Медицинского института Говарда Хьюза и Национального исследовательского института генома человека, NHGRI (один из Национальных институтов здравоохранения США ), браузер предлагал графический отображение первого проекта сборки полной хромосомы последовательности генома человека. Сегодня браузер используют генетики, молекулярные биологи и врачи, а также студенты и преподаватели эволюции для доступа к геномной информации.

Геномы

Геномы UCSC

За годы, прошедшие с момента своего создания, браузер UCSC расширился, чтобы вместить последовательности генома всех видов позвоночных и избранных беспозвоночных, для которых доступны геномные последовательности с высоким охватом, включая теперь 46 видов. Высокое покрытие необходимо, чтобы обеспечить перекрытие для управления строительством более крупных смежных регионов. Геномные последовательности с меньшим охватом включены в дорожки множественного выравнивания в некоторых браузерах, но фрагментированный характер этих сборок не делает их пригодными для создания полнофункциональных браузеров. (подробнее о треках с несколькими трассами ниже). Виды, поддерживаемые полнофункциональными браузерами генома, показаны в таблице.

Геномы
человекообразных обезьян человек, павиана, бонобо, шимпанзе, гиббона, гориллы, орангутана
приматов, не являющихся обезьянамикустарник, мартышка, мышиный лемур, макака-резус, беличья обезьяна, долгопят, землеройка
млекопитающие, не являющиеся приматамимышь, альпака, броненосец, кошка, китайский хомяк, корова, собака, дельфин, слон, хорек, морская свинка, ёжик, лошадь, кенгуровая крыса, ламантин, малый полосатик, голый землекоп, опоссум, панда, свинья, пищуха, утконос, кролик, крыса, горный даман, овца, землеройка, ленивец, белка, тасманский дьявол, тенрек, валлаби, белый носорог
хордовые животныеамериканский аллигатор, атлантическая треска, волнистый попугайчик, курица, латимерия, слоновая акула, фугу, минога, ящерица, медака, средний зяблик, Нильская тилапия, окрашенная черепаха, колюшка, тетраодон, индейка, Xenopus tropicalis, зяблик зебра, рыбки данио
беспозвоночныеCaenorhabditis spp (5), Drosophila spp. (11), медоносная пчела, ланцетник, комар, P. Pacificus, морской заяц, морской брызг, морской еж, дрожжевые
вирусыЭбола, коронавирус SARS-CoV-2

С концентраторы сборок пользователи могут загружать уникальные сборки. Пример можно увидеть в сборочном узле Vertebrate Genomes Project.

Функциональность браузера

Большой объем данных о биологических системах, который накапливается в литературе, заставляет собирать и обрабатывать информацию с помощью инструментов биоинформатики. Браузер генома UCSC представляет разнообразную коллекцию наборов данных аннотаций (известных как «треки» и представленных в графическом виде), включая выравнивание мРНК, сопоставление повторяющихся элементов ДНК, прогнозы генов, данные об экспрессии генов, данные ассоциации с заболеваниями (представляющие отношения генов к заболеваниям), а также отображение коммерчески доступных генных чипов (например, Illumina и Agilent). Основная парадигма отображения - показать последовательность генома в горизонтальном измерении и показать графические представления расположения мРНК, прогнозов генов и т. Д. Цветные блоки вдоль оси координат показывают расположение выравнивания различных типов данных.. Возможность отображать это большое разнообразие типов данных на одной координатной оси делает браузер удобным инструментом для вертикальной интеграции данных.

Чтобы найти конкретный ген или область генома, пользователь может ввести название гена, последовательность ДНК, номер доступа для РНК, название цитологической полосы генома (например, 20p13 для полосы 13 на короткое плечо chr20) или хромосомное положение (chr17: 38 450 000-38 531 000 для области вокруг гена BRCA1 ).

Представление данных в графическом формате позволяет браузеру предоставлять доступ по ссылке для получения подробной информации о любой из аннотаций. На странице сведений о гене трека UCSC Genes имеется большое количество ссылок на более конкретную информацию о гене из многих других источников данных, таких как Online Mendelian Inheritance in Man (OMIM ) и SwissProt.

Браузер UCSC, разработанный для представления сложных и объемных данных, оптимизирован для скорости. Путем предварительного выравнивания 55 миллионов РНК GenBank с каждой из 81 сборки генома (многие из 46 видов имеют более одной сборки), браузер обеспечивает мгновенный доступ к выравниванию любой РНК с любой из размещенный вид.

Множественные генные продукты гена FOXP2 (вверху) и эволюционная консервация показаны в множественном выравнивании (внизу)

Сопоставление множества типов данных позволяет исследователям отображать именно ту комбинацию данных, которая будет ответьте на конкретные вопросы. Функция вывода в формате pdf / postscript позволяет экспортировать готовое к камере изображение для публикации в академических журналах.

Одна уникальная и полезная особенность, которая отличает браузер UCSC от других браузеров генома, - это непрерывно изменяющийся характер отображения. Может быть отображена последовательность любого размера, от единственного основания ДНК до всей хромосомы (человеческий chr1 = 245 миллионов оснований, МБ) с полными дорожками аннотации. Исследователи могут отображать один ген, один экзон или всю полосу хромосомы, показывая десятки или сотни генов и любую комбинацию множества аннотаций. Удобная функция перетаскивания и масштабирования позволяет пользователю выбрать любую область в изображении генома и развернуть ее, чтобы занять весь экран.

Исследователи также могут использовать браузер для отображения своих данных с помощью инструмента Custom Tracks. Эта функция позволяет пользователям загружать файл со своими данными и просматривать данные в контексте эталонной сборки генома. Пользователи также могут использовать данные, размещенные в UCSC, создавая подмножества данных по своему выбору с помощью инструмента просмотра таблиц (например, только SNP, которые изменяют аминокислотную последовательность белка) и отображать это конкретное подмножество. данных в браузере как пользовательский трек.

Любое представление браузера, созданное пользователем, в том числе содержащее настраиваемые треки, может быть доступно другим пользователям с помощью инструмента «Сохраненные сеансы».

Дорожки

Дорожки браузера генома UCSC

Ниже отображаемого изображения браузера генома UCSC находятся девять категорий дополнительных треков, которые можно выбрать и отобразить вместе с исходными данными. Эти категории: картирование и секвенирование, гены и предсказания генов, фенотип и литература, мРНК и EST, экспрессия, регуляция, сравнительная геномика, вариация и повторы.

Категории
КатегорияОписаниеПримеры трека
Отображение и последовательностьПозволяет управлять стилем отображаемой последовательности.Базовая позиция. Alt Map, Gap
Гены и прогнозы геновКакие программы прогнозируют гены и из каких баз данных отображать известные гены.GENCODE v24, Гены гена, Pfam в гене UCSC
Фенотип и литератураБазы данных, содержащие определенные стили фенотипических данных.OMIM Alleles, Cancer Gene Expr Super-track
мРНК и ESTДоступ к мРНК и EST для поиска конкретных людей или универсального универсального поиска.EST человека, Другие EST, Другие мРНК
ЭкспрессияОтображение уникальных выражений предопределенных последовательностей.Ген GTEx, Affy U133
РегламентИнформация, относящаяся к регуляции транскрипции, из различных исследований.Настройки супер-трека регулирования кодирования, ORegAnno
Сравнительная геномикаПозволяет сравнивать искомую последовательность с другими группами животных с секвенированными геномами.Сохранение, Против 7 Вертов, Против 30 Приматов
ВариацияСравнивает искомую последовательность с известными вариациями.Общие SNP (150), Все SNP (146), Помеченные SNP (144)
ПовторыПозволяет отслеживать различные виды повторяющихся последовательностей в запросе.RepeatMasker, Micros satellite, WM + SDust

Mapping and Sequencing

Эти треки позволяют пользователю управлять отображением геномных координат, последовательностей и пробелы. Исследователи имеют возможность выбирать треки, которые лучше всего представляют их запрос, что позволяет отображать более подходящие данные в зависимости от типа и глубины проводимого исследования. Дорожки сопоставления и секвенирования также могут отображать дорожки в процентах, чтобы показать исследователю, является ли конкретный генетический элемент более распространенным в указанной области.

Гены и прогнозы генов

Дорожки генов и прогнозов генов управляют отображением генов и их последующих частей. Различные дорожки позволяют пользователю отображать модели генов, белковые кодирующие области и некодирующие РНК, а также другие данные, связанные с генами. Доступно множество треков, позволяющих исследователям быстро сравнивать свой запрос с заранее выбранными наборами генов, чтобы искать корреляции между известными наборами генов.

Фенотип и литература

Следы фенотипа и литературы имеют дело с фенотипом, непосредственно связанным с генами, а также с генетическим фенотипом. Эти треки предназначены для использования в первую очередь врачами и другими специалистами, занимающимися генетическими нарушениями, исследователями-генетиками и продвинутыми студентами в области естественных наук и медицины. Исследователь также может отобразить трек, который показывает геномные позиции естественных и искусственных вариантов аминокислот.

мРНК и EST

Эти треки связаны с тегами экспрессируемой последовательности и информационной РНК. EST представляют собой последовательности однократного считывания, обычно длиной около 500 оснований, которые обычно представляют собой фрагменты транскрибируемых генов. Дорожки мРНК позволяют отображать данные о выравнивании мРНК у людей, а также у других видов. Есть также треки, позволяющие сравнивать с областями EST, которые показывают признаки сплайсинга при выравнивании с геномом.

Экспрессия

Дорожки экспрессии используются для соотнесения генетических данных с участками ткани, в которых они экспрессируются. Это позволяет исследователю определить, связан ли конкретный ген или последовательность с различными тканями по всему телу.. Дорожки экспрессии также позволяют отображать согласованные данные о тканях, которые выражают область запроса.

Регулирование

Регулирующие дорожки браузера генома UCSC представляют собой категорию дорожек, которые контролируют представление промоторных и контрольных областей в геноме. Исследователь может настроить треки регулирования, чтобы добавить график отображения в браузер генома. Эти дисплеи позволяют получить более подробную информацию о регуляторных областях, сайтах связывания факторов транскрипции, сайтах связывания РНК, регуляторных вариантах, гаплотипах и других регуляторных элементах.

Сравнительная геномика

Браузер генома UCSC позволяет пользователю отображать различные виды данных сохранения. Пользователь может выбирать из различных следов, включая приматов, позвоночных, млекопитающих и других, и видеть, как последовательность гена, которую они искали, сохраняется среди других видов. Сравнительные сопоставления дают графическое представление об эволюционных отношениях между видами. Это делает его полезным инструментом как для исследователя, который может визуализировать области сохранения среди группы видов и делать прогнозы о функциональных элементах в неизвестных областях ДНК, так и в классе как инструмент для иллюстрации одного из самых убедительных аргументов в пользу эволюция видов. 44-сторонняя сравнительная дорожка сборки человека ясно показывает, что чем дальше в эволюционное время, тем меньше гомологии последовательностей, но функционально важные области генома (например, экзоны и контрольные элементы, но обычно не интроны) сохраняются. гораздо дальше в эволюционное время.

Данные вариации

Также отображаются многие типы данных вариации. Например, все содержимое каждой версии базы данных dbSNP из NCBI сопоставлено с геномами человека, мыши и других геномов. Это включает в себя плоды проекта «1000 геномов», как только они будут выпущены в dbSNP. Другие типы данных об изменениях включают данные об изменении числа копий (CNV ) и частоты аллелей человеческой популяции из проекта HapMap.

Повторы

Повторяющиеся треки браузера генома позволяют пользователю видеть визуальное представление участков ДНК с низкой сложностью повторов. Возможность визуализировать повторы в последовательности позволяет быстро делать выводы о поисковом запросе в браузере генома. Исследователь может быстро увидеть, что указанный поиск содержит большое количество повторяющихся последовательностей, и соответствующим образом настроить отображение поиска или отслеживания.

Инструменты анализа

На сайте UCSC размещен набор инструментов анализа генома, в том числе полнофункциональный графический интерфейс для извлечения информации из базы данных браузера, инструмент для выравнивания последовательностей FAST BLAT, который также является полезен для простого поиска последовательностей в массивной последовательности (геном человека = 3,23 миллиарда оснований [ГБ]) любого из представленных геномов.

Инструмент liftOver использует выравнивание всего генома, чтобы обеспечить преобразование последовательностей из одной сборки в другую или между видами. Инструмент Genome Graphs позволяет пользователям просматривать сразу все хромосомы и отображать результаты полногеномных исследований ассоциации (GWAS). Сортировщик генов отображает гены, сгруппированные по параметрам, не связанным с расположением генома, например, паттерном экспрессии в тканях.

Открытый исходный код / ​​зеркала

Кодовая база браузера UCSC имеет открытый исходный код для некоммерческого использования и локально зеркалируется многими исследовательскими группами, что позволяет отображать данные в частном порядке в контексте общедоступные данные. Браузер UCSC зеркалируется в нескольких местах по всему миру, как показано в таблице.

официальные зеркальные сайты
Европейское зеркало - поддерживается UCSC в Университете Билефельда, Германия
Азиатское зеркало - поддерживается UCSC в RIKEN, Йокогама, Япония

Код браузера также используется в отдельных установках Браузер генома малярии UCSC и расширение.

См. Также

Ссылки

Внешние ссылки

Последняя правка сделана 2021-06-20 05:39:11
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте