A contig (от contiguous) представляет собой набор перекрывающихся сегментов ДНК, которые вместе представляют собой консенсусную область ДНК. В проектах восходящего упорядочивания контиг относится к перекрывающимся данным последовательности (чтения); в проектах секвенирования сверху вниз contig относится к перекрывающимся клонам, которые формируют физическую карту генома, которая используется для управления секвенированием и сборкой. Таким образом, контиги могут относиться как к перекрывающейся последовательности ДНК, так и к перекрывающимся физическим сегментам (фрагментам), содержащимся в клонах, в зависимости от контекста.
В 1980 году Штаден писал: Чтобы упростить обсуждение наших данных, полученных методом дробовика секвенирования, мы изобрели слово «contig ". Контиг - это набор показаний геля, которые связаны друг с другом перекрытием их последовательностей. Все показания геля принадлежат одному и только одному контигу, и каждый контиг содержит по крайней мере одно показание геля. Показания геля в контиге можно суммировать, чтобы сформировать непрерывную консенсусную последовательность, и длина этой последовательности равна длине контига.
Контиги последовательностей - это непрерывная (не непрерывная) последовательность, возникающая в результате повторной сборки небольших фрагментов ДНК, генерируемых стратегиями восходящего секвенирования. Это значение contig согласуется с исходным определением (1979). Стратегия секвенирования ДНК снизу вверх включает разрезание геномной ДНК на множество небольших фрагментов («нижний»), секвенирование этих фрагментов, повторную сборку их обратно в контиги и, в конечном итоге, на весь геном («вверх»). Поскольку современные технологии позволяют выполнять прямое секвенирование только относительно коротких фрагментов ДНК (300–1000 нуклеотидов), геномная ДНК должна быть фрагментирована на мелкие части перед секвенированием. В проектах по восходящему секвенированию амплифицированная ДНК случайным образом разрезается на фрагменты, размер которых подходит для секвенирования. Последующие чтения последовательности, которые представляют собой данные, содержащие последовательности небольших фрагментов, помещаются в базу данных. Программа сборки затем ищет в этой базе данных пары перекрывающихся чтений. Сборка считываний из такой пары (включая, конечно, только одну копию идентичной последовательности) дает более длинное непрерывное считывание (контиг) секвенированной ДНК. Повторяя этот процесс много раз, сначала с начальными короткими парами считываний, но затем используя все более длинные пары, которые являются результатом предыдущей сборки, можно определить последовательность ДНК всей хромосомы.
Перекрывающиеся считывания из контигов последовательности парных концов; контиги и пробелы известной длины образуют каркасы.Сегодня общепринято использовать секвенирование парных концов, при котором секвенируются оба конца более длинных фрагментов ДНК одинакового размера. Здесь контиг по-прежнему относится к любому непрерывному отрезку данных последовательности, созданному в результате наложения чтения. Поскольку фрагменты имеют известную длину, известно расстояние между двумя концевыми считываниями каждого фрагмента. Это дает дополнительную информацию об ориентации контигов, построенных из этих считываний, и позволяет их сборку в каркасы в процессе, называемом каркасом.
Каркасы состоят из перекрывающихся контигов, разделенных промежутками известной длины. Новые ограничения, накладываемые на ориентацию контигов, позволяют размещать в геноме повторяющиеся последовательности. Если одно конечное считывание имеет повторяющуюся последовательность, пока его сопряженная пара находится внутри контига, его расположение известно. Оставшиеся промежутки между контигами в каркасах затем можно секвенировать различными методами, включая амплификацию ПЦР с последующим секвенированием (для меньших промежутков) и методы клонирования BAC с последующим секвенированием для больших промежутков.
Contig могут также относиться к перекрывающимся клонам, которые формируют физическую карту хромосомы, когда сверху вниз или используется иерархическая стратегия секвенирования. В этом методе секвенирования перед секвенированием создается карта map с низким разрешением, чтобы обеспечить основу для управления последующей сборкой считываний последовательности генома. Эта карта идентифицирует относительные положения и перекрытие клонов, используемых для секвенирования. Наборы перекрывающихся клонов, которые образуют непрерывный участок ДНК, называются контигами; минимальное количество клонов, образующих контиг, покрывающий всю хромосому, составляет тайлинг-путь, который используется для секвенирования. После того как траектория мозаики была выбрана, составляющие ее ВАС разрезаются на более мелкие фрагменты и упорядочиваются. Таким образом, контиги обеспечивают основу для иерархического упорядочивания. Сборка карты контигов включает несколько шагов. Сначала ДНК разрезается на более крупные (50–200 кб) части, которые клонируются в ВАС или РАС с образованием библиотеки ВАС . Поскольку эти клоны должны покрывать весь геном / хромосому, теоретически возможно собрать контиг ВАС, который покрывает всю хромосому. Однако реальность не всегда идеальна. Часто остаются зазоры, и первым результатом часто оказывается каркас, состоящий из контигов и пробелов, покрывающий область карты. Разрывы между контигами можно закрыть различными способами, описанными ниже.
Контиги ВАС конструируют путем выравнивания областей ВАС с известным перекрытием с помощью множества методов. Одна из распространенных стратегий - использовать отображение содержимого сайта с тегами последовательностей (STS) для обнаружения уникальных сайтов ДНК, общих для ВАС. Степень перекрытия приблизительно оценивается количеством маркеров STS, общих между двумя клонами, при этом большее количество общих маркеров означает большее перекрытие. Поскольку эта стратегия обеспечивает только очень приблизительную оценку перекрытия, часто используется анализ фрагментов рестрикционного дайджеста, который обеспечивает более точное измерение перекрытия клонов. В этой стратегии клоны обрабатывают одним или двумя рестрикционными ферментами и полученные фрагменты разделяют с помощью гель-электрофореза. Если два клона, они, вероятно, будут иметь общие сайты рестрикции и, следовательно, будут иметь несколько общих фрагментов. Поскольку количество общих фрагментов и длина этих фрагментов известны (длина оценивается по сравнению со стандартом размера), степень перекрытия может быть определена с высокой степенью точности.
Разрывы часто остаются после первоначального построения контигов BAC. Эти пробелы возникают, если скрининговая библиотека искусственной бактериальной хромосомы (ВАС) имеет низкую сложность, что означает, что она не содержит большого количества STS или сайтов рестрикции, или если определенные области были менее стабильны при клонировании хозяев и, следовательно, недостаточно представлены в библиотеке. Если промежутки между контигами остаются после того, как было выполнено сопоставление ориентиров STS и снятие отпечатков ограничений, можно использовать упорядочение концов контигов, чтобы закрыть эти промежутки. Эта стратегия конечного секвенирования по существу создает новый STS, с помощью которого можно скринировать другие контиги. В качестве альтернативы, концевую последовательность контига можно использовать в качестве праймера для обхода праймера через разрыв.
Найдите contig в Wiktionary, бесплатном словаре. |