Секвенирование наношаров ДНК

редактировать
Рабочий процесс для секвенирования наношаров ДНК

Секвенирование ДНК-наношаров - это высокопроизводительная технология секвенирования, которая используется для определения всей геномной последовательности организма. В этом методе используется репликация по катящемуся кругу для амплификации небольших фрагментов геномной ДНК в наношарики ДНК. Флуоресцентные нуклеотиды связываются с комплементарными нуклеотидами и затем полимеризуются для закрепления последовательностей, связанных с известными последовательностями на матрице ДНК. Порядок оснований определяется по флуоресценции связанных нуклеотидов. Этот метод секвенирования ДНК позволяет секвенировать большое количество наношаров ДНК за цикл при более низких затратах на реагент по сравнению с на другие платформы секвенирования следующего поколения. Однако недостатком этого метода является то, что он генерирует только короткие последовательности ДНК, что создает проблемы для сопоставления считываний с эталонным геномом . После покупки Complete Genomics Пекинский институт геномики (BGI) усовершенствовал секвенирование ДНК-наношаров для секвенирования образцов нуклеотидов на своей собственной платформе.

Содержание
  • 1 Процедура
    • 1.1 Выделение ДНК, фрагментация и захват размера
    • 1.2 Присоединение последовательностей адаптеров
    • 1.3 Репликация по кругу
    • 1.4 Узорчатый массив ДНК-наношаров
    • 1.5 Визуализация
    • 1.6 Формат данных секвенирования
  • 2 Советы по информатике
    • 2.1 Выравнивание эталонного генома
    • 2.2 Считывание имен
    • 2.3 Дубликаты
  • 3 Преимущества
  • 4 Недостатки
  • 5 Приложения
  • 6 Значимость
  • 7 Ссылки
Процедура

Секвенирование наношара ДНК включает выделение ДНК, которая должна быть секвенирована, разрезая ее на маленькие 100-350 парные (п.н.) фрагменты, лигирование последовательностей адаптеров с фрагментами и циркуляризацию фрагментов. Круглые фрагменты копируются с помощью репликации по катящемуся кругу, в результате чего получается множество однонитевых копий каждого фрагмента. Копии ДНК соединяются голова к хвосту в длинную цепочку и уплотняются в наношар ДНК. Затем наношарики адсорбируются на проточной ячейке для секвенирования. Цвет флуоресценции в каждой запрашиваемой позиции записывается камерой высокого разрешения. Биоинформатика используются для анализа данных флуоресценции и определения основания, а также для картирования или количественной оценки одно- или парных чтений размером 50, 100 или 150 пар оснований.

Выделение ДНК, фрагментация, и захват размера

. Клетки лизируются, а ДНК экстрагируется из клеточного лизата. ДНК с высоким молекулярным весом, часто длиной в несколько пар мегабаз, фрагментируется физическими или ферментативными методами, чтобы разорвать двойные цепи ДНК через случайные промежутки времени. Биоинформатическое картирование считываний секвенирования наиболее эффективно, когда образец ДНК имеет узкий диапазон длин. Для секвенирования малых РНК выбор идеальной длины фрагментов для секвенирования выполняется с помощью гель-электрофореза ; для секвенирования более крупных фрагментов фрагменты ДНК разделяются путем выбора размера гранул.

Присоединение последовательностей адаптера

Последовательности адаптера ДНК должны быть присоединены к неизвестному фрагменту ДНК, чтобы сегменты ДНК с известными последовательностями фланкировать неизвестную ДНК. В первом раунде лигирования адаптера правый (Ad153_right) и левый (Ad153_left) адаптеры прикрепляются к правому и левому бокам фрагментированной ДНК, и ДНК амплифицируется с помощью ПЦР. Затем олигонуклеотид сплинта гибридизируется с концами фрагментов, которые лигируются, образуя круг. Добавляется экзонуклеаза, чтобы удалить все оставшиеся одноцепочечные и двухцепочечные продукты ДНК. Результатом является завершенная кольцевая ДНК-матрица.

Репликация по вращающемуся кругу

После создания однонитевой кольцевой ДНК-матрицы, содержащей образец ДНК, который лигирован с двумя уникальными адапторными последовательностями, был создан, полная последовательность амплифицируется в длинную цепочку ДНК. Это достигается посредством репликации по кругу с помощью ДНК-полимеразы Phi 29, которая связывает и реплицирует ДНК-матрицу. Вновь синтезированная цепь высвобождается из кольцевой матрицы, в результате чего получается длинная одноцепочечная ДНК, содержащая несколько копий кольцевой матрицы, расположенные от головы к хвосту. Полученные наночастицы самоорганизуются в плотный клубок ДНК размером примерно 300 нанометров (нм). Наношары остаются отделенными друг от друга, потому что они имеют отрицательный заряд, естественно отталкивают друг друга, уменьшая любое запутывание между разными длинами одноцепочечных ДНК.

Создание наношаров ДНК и адсорбция на проточной ячейке с структурированным массивом Создание наношаров ДНК и адсорбция на проточной ячейке с узорчатым массивом

Узорчатый массив наношаров с ДНК

Чтобы получить последовательность ДНК, наношарики ДНК прикрепляют к проточной ячейке с узором. Проточная ячейка представляет собой силиконовую пластину, покрытую диоксидом кремния, титаном, гексаметилдисилазаном (HMDS) и материалом фоторезистом. Наночастицы ДНК добавляются в проточную кювету и избирательно связываются с положительно заряженным аминосиланом в виде высокоупорядоченного паттерна, что позволяет секвенировать очень высокую плотность наношаров ДНК.

Визуализация

После На каждом этапе включения нуклеотидов в ДНК проточную кювету визуализируют, чтобы определить, какое нуклеотидное основание связано с наношаром ДНК. Флуорофор возбуждается лазером, который возбуждает определенные длины волн света. Эмиссия флуоресценции от каждого наношара ДНК фиксируется камерой высокого разрешения CCD. Затем изображение обрабатывается для удаления фонового шума и оценки интенсивности каждой точки. Цвет каждого наношара ДНК соответствует основанию в запрашиваемой позиции, и компьютер записывает информацию о положении основания.

Формат данных секвенирования

Данные, полученные из наношаров ДНК, имеют стандартный формат Файлы в формате FASTQ с непрерывными основами (без пробелов). Эти файлы могут использоваться в любом конвейере анализа данных, который настроен для чтения односторонних или парных файлов FASTQ.

Например:

Чтение 1, из 100 bp в паре конца пробеге от

@ CL100011513L1C001R013_126365 / 1 CTAGGCAACTATAGGTCTCAGTTAAGTCAAATAAAATTCACATCAAATTTTTACTCCCACCATCCCAACACTTTCCTGCCTGGCATATGCCGTGTCTGCC + FFFFFFFFFFFGFGFFFFFF; FFFFFFFGFGFGFFFFFF; FFFFGFGFGFFEFFFFFEDGFDFF @ FCFGFGCFFFFFEFFEGDFDFFFFFGDAFFEFGFF

Соответствующее прочтение 2:

@ CL100011513L1C001R013_126365 / 2 TGTCTACCATATTCTACATTCCACACTCGGTGAGGGAAGGTAGGCACATAAAGCAATGGCAGTACGGCETGTAATACATGCTAATGTAGE9: 9CB = E <7:-+>; 29: 7 + / 5D9)? 5F /:
Советы по информатике

Выравнивание эталонного генома

Достаточно параметров по умолчанию для популярных выравнивателей.

Имена чтения

В файле FASTQ, созданном секвенсорами BGI / MGI с использованием наношариков ДНК на проточной ячейке с структурированным массивом, имена чтения выглядят следующим образом:

BGISEQ прочитанное имя анатомия Анатомия имени чтения секвенсора BGI MGISEQ читать имя анатомия Анатомия имени чтения секвенсора MGI

BGISEQ-500: CL100025298L1C002R050_244547

MGISEQ-2000: V100006430L1C001R018613883

Имена чтения могут быть проанализированы для извлечения трех переменных, описывающих физическое расположение прочтите в массиве с рисунком: (1) плитка / область, (2) координата x и (3) координата y. Обратите внимание, что из-за порядка этих переменных эти считанные имена не могут быть изначально проанализированы программой Picard MarkDuplicates для идентификации оптических дубликатов. Однако, поскольку их нет на этой платформе, это не создает проблем для анализа данных на основе Пикара.

Дубликаты

Поскольку наношарики ДНК остаются ограниченными своими пятнами на структурированном массиве, нет оптических дубликатов, с которыми нужно бороться во время биоинформатического анализа считываний секвенирования. Рекомендуется запускать Picard MarkDuplicates следующим образом:

java -jar picard.jar MarkDuplicates I = input.bam O = MarkDuplicates.bam M = Mark_dup_metrics.txt READ_NAME_REGEX = null

Тест с дружественным к Picard, переформатированным чтением names демонстрирует отсутствие этого класса дублированного чтения:

Результаты теста Picard MarkDuplicates Тест дубликатов меток Пикарда с изменением параметра OPTICAL_DUPLICATE_PIXEL_DISTANCE

Единственное чтение, отмеченное как оптический дубликат, безусловно, является артефактом. В любом случае влияние на предполагаемый размер библиотеки незначительно.

Преимущества

Технология секвенирования наношаров ДНК предлагает некоторые преимущества по сравнению с другими платформами секвенирования. Одним из преимуществ является устранение оптических дубликатов. Наношарики ДНК остаются на месте в узорчатом массиве и не мешают соседним наношарам.

Еще одно преимущество секвенирования ДНК-наношаров включает использование высокоточной ДНК-полимеразы Phi 29 для обеспечения точной амплификации круглого шаблона, несколько сотен копий круглого шаблона уплотняются в небольшую область, что приводит к интенсивному сигналу, и прикрепление флуорофора к зонду на большом расстоянии от точки лигирования приводит к улучшенному лигированию.

Недостатки

Основным недостатком секвенирования наношара ДНК является малая длина считывания последовательностей ДНК полученные этим методом. Короткие чтения, особенно для ДНК с высоким содержанием ДНК-повторов, могут отображаться в двух или более областях эталонного генома. Второй недостаток этого метода заключается в том, что необходимо использовать несколько раундов ПЦР. Это может привести к смещению ПЦР и, возможно, к увеличению примесей на этапе конструирования шаблона. Однако эти недостатки являются общими для всех платформ секвенирования с коротким считыванием и не являются специфическими для наношаров ДНК.

Приложения

Секвенирование наношаров ДНК использовалось в недавних исследованиях. Ли и др. использовал эту технологию, чтобы найти мутации, присутствующие в раке легких, и сравнить их с нормальной тканью легких. Им удалось идентифицировать более 50 000 однонуклеотидных вариантов. Roach et al. использовали секвенирование ДНК-наношар для секвенирования геномов семьи из четырех родственников и смогли идентифицировать SNP, которые могут быть ответственны за менделевское расстройство, и смогли оценить скорость мутаций между поколениями. Институт системной биологии использовал эту технологию для секвенирования 615 полных образцов генома человека в рамках исследования, изучающего нейродегенеративные заболевания, а Национальный институт рака использует Секвенирование ДНК-наношара для определения последовательности 50 опухолей и соответствующих нормальных тканей детских раковых заболеваний.

Значимость

Массивно параллельные платформы секвенирования следующего поколения, такие как секвенирование ДНК-наношаров, могут способствовать диагностике и лечению многих генетических заболеваний. Стоимость секвенирования всего генома человека упала с одного миллиона долларов в 2008 году до 4400 долларов в 2010 году благодаря технологии наношаров ДНК. Секвенирование полных геномов пациентов с наследственными заболеваниями или раком, мутации, связанные с этими заболеваниями, были идентифицированы, открывая такие стратегии, как таргетная терапия для людей из группы риска и для генетического консультирования. Поскольку цена секвенирования всего генома человека приближается к отметке в 1000 долларов, секвенирование генома каждого человека может стать возможным в рамках обычной профилактической медицины.

Ссылки
Последняя правка сделана 2021-05-16 09:17:29
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте