Contig

редактировать
Набор перекрывающихся сегментов ДНК, которые вместе представляют собой консенсус область ДНК

A contig (от contiguous) представляет собой набор перекрывающихся сегментов ДНК, которые вместе представляют собой консенсусную область ДНК. В проектах восходящего упорядочивания контиг относится к перекрывающимся данным последовательности (чтения); в проектах секвенирования сверху вниз contig относится к перекрывающимся клонам, которые формируют физическую карту генома, которая используется для управления секвенированием и сборкой. Таким образом, контиги могут относиться как к перекрывающейся последовательности ДНК, так и к перекрывающимся физическим сегментам (фрагментам), содержащимся в клонах, в зависимости от контекста.

Содержание
  • 1 Исходное определение контига
  • 2 Контиги последовательности
  • 3 Контиги BAC
    • 3.1 Построение контигов BAC
    • 3.2 Разрывы между контигами
  • 4 См. Также
  • 5 Ссылки
  • 6 Внешние ссылки
Первоначальное определение contig

В 1980 году Штаден писал: Чтобы упростить обсуждение наших данных, полученных методом дробовика секвенирования, мы изобрели слово «contig ". Контиг - это набор показаний геля, которые связаны друг с другом перекрытием их последовательностей. Все показания геля принадлежат одному и только одному контигу, и каждый контиг содержит по крайней мере одно показание геля. Показания геля в контиге можно суммировать, чтобы сформировать непрерывную консенсусную последовательность, и длина этой последовательности равна длине контига.

Контиги последовательностей

Контиги последовательностей - это непрерывная (не непрерывная) последовательность, возникающая в результате повторной сборки небольших фрагментов ДНК, генерируемых стратегиями восходящего секвенирования. Это значение contig согласуется с исходным определением (1979). Стратегия секвенирования ДНК снизу вверх включает разрезание геномной ДНК на множество небольших фрагментов («нижний»), секвенирование этих фрагментов, повторную сборку их обратно в контиги и, в конечном итоге, на весь геном («вверх»). Поскольку современные технологии позволяют выполнять прямое секвенирование только относительно коротких фрагментов ДНК (300–1000 нуклеотидов), геномная ДНК должна быть фрагментирована на мелкие части перед секвенированием. В проектах по восходящему секвенированию амплифицированная ДНК случайным образом разрезается на фрагменты, размер которых подходит для секвенирования. Последующие чтения последовательности, которые представляют собой данные, содержащие последовательности небольших фрагментов, помещаются в базу данных. Программа сборки затем ищет в этой базе данных пары перекрывающихся чтений. Сборка считываний из такой пары (включая, конечно, только одну копию идентичной последовательности) дает более длинное непрерывное считывание (контиг) секвенированной ДНК. Повторяя этот процесс много раз, сначала с начальными короткими парами считываний, но затем используя все более длинные пары, которые являются результатом предыдущей сборки, можно определить последовательность ДНК всей хромосомы.

Перекрывающиеся считывания из контигов последовательности парных концов; контиги и пробелы известной длины образуют каркасы.

Сегодня общепринято использовать секвенирование парных концов, при котором секвенируются оба конца более длинных фрагментов ДНК одинакового размера. Здесь контиг по-прежнему относится к любому непрерывному отрезку данных последовательности, созданному в результате наложения чтения. Поскольку фрагменты имеют известную длину, известно расстояние между двумя концевыми считываниями каждого фрагмента. Это дает дополнительную информацию об ориентации контигов, построенных из этих считываний, и позволяет их сборку в каркасы в процессе, называемом каркасом.

Каркасы состоят из перекрывающихся контигов, разделенных промежутками известной длины. Новые ограничения, накладываемые на ориентацию контигов, позволяют размещать в геноме повторяющиеся последовательности. Если одно конечное считывание имеет повторяющуюся последовательность, пока его сопряженная пара находится внутри контига, его расположение известно. Оставшиеся промежутки между контигами в каркасах затем можно секвенировать различными методами, включая амплификацию ПЦР с последующим секвенированием (для меньших промежутков) и методы клонирования BAC с последующим секвенированием для больших промежутков.

BAC-контиги

Contig могут также относиться к перекрывающимся клонам, которые формируют физическую карту хромосомы, когда сверху вниз или используется иерархическая стратегия секвенирования. В этом методе секвенирования перед секвенированием создается карта map с низким разрешением, чтобы обеспечить основу для управления последующей сборкой считываний последовательности генома. Эта карта идентифицирует относительные положения и перекрытие клонов, используемых для секвенирования. Наборы перекрывающихся клонов, которые образуют непрерывный участок ДНК, называются контигами; минимальное количество клонов, образующих контиг, покрывающий всю хромосому, составляет тайлинг-путь, который используется для секвенирования. После того как траектория мозаики была выбрана, составляющие ее ВАС разрезаются на более мелкие фрагменты и упорядочиваются. Таким образом, контиги обеспечивают основу для иерархического упорядочивания. Сборка карты контигов включает несколько шагов. Сначала ДНК разрезается на более крупные (50–200 кб) части, которые клонируются в ВАС или РАС с образованием библиотеки ВАС . Поскольку эти клоны должны покрывать весь геном / хромосому, теоретически возможно собрать контиг ВАС, который покрывает всю хромосому. Однако реальность не всегда идеальна. Часто остаются зазоры, и первым результатом часто оказывается каркас, состоящий из контигов и пробелов, покрывающий область карты. Разрывы между контигами можно закрыть различными способами, описанными ниже.

Создание контигов ВАС

Контиги ВАС конструируют путем выравнивания областей ВАС с известным перекрытием с помощью множества методов. Одна из распространенных стратегий - использовать отображение содержимого сайта с тегами последовательностей (STS) для обнаружения уникальных сайтов ДНК, общих для ВАС. Степень перекрытия приблизительно оценивается количеством маркеров STS, общих между двумя клонами, при этом большее количество общих маркеров означает большее перекрытие. Поскольку эта стратегия обеспечивает только очень приблизительную оценку перекрытия, часто используется анализ фрагментов рестрикционного дайджеста, который обеспечивает более точное измерение перекрытия клонов. В этой стратегии клоны обрабатывают одним или двумя рестрикционными ферментами и полученные фрагменты разделяют с помощью гель-электрофореза. Если два клона, они, вероятно, будут иметь общие сайты рестрикции и, следовательно, будут иметь несколько общих фрагментов. Поскольку количество общих фрагментов и длина этих фрагментов известны (длина оценивается по сравнению со стандартом размера), степень перекрытия может быть определена с высокой степенью точности.

Разрывы между контигами

Разрывы часто остаются после первоначального построения контигов BAC. Эти пробелы возникают, если скрининговая библиотека искусственной бактериальной хромосомы (ВАС) имеет низкую сложность, что означает, что она не содержит большого количества STS или сайтов рестрикции, или если определенные области были менее стабильны при клонировании хозяев и, следовательно, недостаточно представлены в библиотеке. Если промежутки между контигами остаются после того, как было выполнено сопоставление ориентиров STS и снятие отпечатков ограничений, можно использовать упорядочение концов контигов, чтобы закрыть эти промежутки. Эта стратегия конечного секвенирования по существу создает новый STS, с помощью которого можно скринировать другие контиги. В качестве альтернативы, концевую последовательность контига можно использовать в качестве праймера для обхода праймера через разрыв.

См. Также
Ссылки
  1. ^ Gregory, S Сборка Contig. Энциклопедия наук о жизни, 2005.
  2. ^ Гибсон, Грег; Муза, Спенсер В. (2009). Учебник по геномной науке (3-е изд.). Sinauer Associates. п. 84. ISBN 978-0-878-93236-8.
  3. ^ Уважаемый, П. Х. Картирование генома. Энциклопедия наук о жизни, 2005. doi : 10.1038 / npg.els.0005353.
  4. ^Staden, R (1980). «Новый компьютерный метод хранения и обработки данных считывания геля ДНК». Исследования нуклеиновых кислот. 8 (16): 3673–3694. doi : 10.1093 / nar / 8.16.3673. PMC 324183. PMID 7433103.
  5. ^Стаден Р. (1979). «Стратегия секвенирования ДНК с использованием компьютерных программ». Исследования нуклеиновых кислот. 6 (7): 2601–2610. DOI : 10.1093 / nar / 6.7.2601. PMC 327874. PMID 461197.
  6. ^ Данхэм, I. Секвенирование генома. Энциклопедия наук о жизни, 2005.
  7. ^ Фулвуд MJ, Wei C, Liu ET, et al. (2009). «Секвенирование ДНК следующего поколения меток с парными концами (ПЭТ) для анализа транскриптома и генома». Геномные исследования. 19 (4): 521–532. doi : 10.1101 / gr.074906.107. PMC 3807531. PMID 19339662.
Внешние ссылки
Найдите contig в Wiktionary, бесплатном словаре.
Последняя правка сделана 2021-05-15 10:53:10
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте