Скимминг генома

редактировать
Метод секвенирования генома Скимминг генома позволяет собирать высококопийные фракции генома в непрерывные полные геномы.

Скимминг генома - это метод секвенирования, который использует низкопроходное неглубокое секвенирование генома (до 5%) для создания фрагментов ДНК, известных как анализ генома . Эти снимки генома содержат информацию о высококопийной фракции генома. Высококопийная фракция генома состоит из рибосомной ДНК, пластидного генома (пластом ), митохондриального генома (митогеном ) и ядерных повторов, таких как микроспутники и переносные элементы. Для создания этих снимков используется высокопроизводительная технология секвенирования следующего поколения. Хотя эти снимки - всего лишь «верхушка айсберга геномов», филогеномный анализ их все же может дать представление об эволюционной истории и биоразнообразии при меньших затратах и больший масштаб, чем традиционные методы. Из-за небольшого количества ДНК, необходимого для сканирования генома, его методология может применяться в других областях, помимо геномики. Подобные задачи включают определение возможности отслеживания продуктов в пищевой промышленности, обеспечение соблюдения международных норм, касающихся биоразнообразия и биологических ресурсов, а также судебную экспертизу.

Содержание
  • 1 Текущее использование
    • 1.1 Высококопийная ДНК
      • 1.1.1 Рибосомная ДНК
      • 1.1.2 Пластомы
      • 1.1.3 Митогеномы
      • 1.1.4 Ядерные повторы (сателлиты или мобильные элементы)
    • 1.2 Низкокопийная ДНК
    • 1.3 Низкое количество деградированной ДНК
  • 2 Рабочий процесс
    • 2.1 Извлечение ДНК
      • 2.1.1 Растения
      • 2.1.2 Прочее
    • 2.2 Подготовка библиотеки
    • 2.3 Секвенирование
    • 2.4 Сборка
      • 2.4.1 Пластомы
      • 2.4.2 Митогеномы
      • 2.4.3 Другое
    • 2.5 Аннотация
      • 2.5.1 Пластомы
      • 2.5.2 Митогеномы
      • 2.5.3 тРНК
      • 2.5.4 рРНК
      • 2.5.5 Другое
    • 2.6 Филогенетическое построение
      • 2.6.1 Максимальное правдоподобие (ML)
      • 2.6.2 Максимальная экономия (MP)
      • 2.6.3 Байесовский вывод (BI)
      • 2.6.4 Другое
  • 3 Инструменты и конвейеры
    • 3.1 Hyb-Seq
    • 3.2 GetOrganelle
    • 3.3 Skmer
    • 3.4 Geneious
  • 4 Лыжи In silico Genome mming
  • 5 Другие приложения
  • 6 Преимущества
  • 7 Ограничения
    • 7.1 Масштабируемость
  • 8 См. также
  • 9 Ссылки
Текущее использование

В дополнение к сборке Для меньших по размеру органеллярных геномов сканирование генома также может быть использовано для обнаружения консервативных последовательностей ортологов для филогеномных исследований. В филогеномных исследованиях многоклеточных патогенов анализ генома можно использовать для поиска эффекторных генов, обнаружения эндосимбионтов и характеристики геномной изменчивости.

Высокая копия ДНК

Рибосомная ДНК

Внутренние транскрибируемые спейсеры (ITS) представляют собой некодирующие области внутри рДНК 18-5.8-28S у эукариот и являются одним из признаков рДНК это использовалось в исследованиях скимминга генома. ITS используются для обнаружения различных видов в пределах рода из-за их высокой межвидовой изменчивости. Они обладают низкой индивидуальной изменчивостью, что не позволяет идентифицировать отдельные штаммы или особи. Они также присутствуют во всех эукариотах, имеют высокую скорость эволюции и использовались в филогенетическом анализе между видами и между видами.

При нацеливании на ядерную рДНК он Предполагается, что достигается минимальная конечная глубина секвенирования 100X, а последовательности с глубиной менее 5X замаскированы.

Пластомы

пластидный геном, или пластом, широко использовался в идентификации и эволюционных исследованиях с использованием скимминга генома из-за его высокой распространенности в растениях (~ 3-5% клеточной ДНК), небольшого размера, простой структуры, большей сохранности структуры гена, чем ядерная или митохондриальная гены. Ранее исследования пластид ограничивались количеством регионов, которые можно было оценить традиционными методами. Используя скимминг генома, секвенирование всего пластидного генома или пластома может быть выполнено за небольшую часть стоимости и времени, необходимых для типичных подходов к секвенированию, таких как секвенирование по Сэнгеру. Пластомы были предложены в качестве метода замены традиционных ДНК-штрих-кодов в растениях, таких как гены штрих-кода rbcL и matK. По сравнению с обычным штрих-кодом ДНК, сканирование генома производит пластомы за десятую часть стоимости основания. Недавнее использование снимков генома пластом позволило лучше разрешить филогении, более четко дифференцировать определенные группы внутри таксонов и получить более точные оценки биоразнообразия. Кроме того, пластом использовался для сравнения видов в пределах одного рода, чтобы посмотреть на эволюционные изменения и разнообразие внутри группы.

При нацеливании на пластомы предполагается, что минимальная конечная глубина секвенирования 30X достигается для одного - копировать регионы, чтобы гарантировать высокое качество сборки. Однонуклеотидные полиморфизмы (SNP) с глубиной менее 20X должны быть замаскированы.

Митогеномы

митохондриальный геном, или митогеном, используется в качестве молекулярный маркер в большом количестве исследований из-за его материнского наследования, высокого числа копий в клетке, отсутствия рекомбинации и высокой скорости мутаций. Он часто используется для филогенетических исследований, так как он очень однороден для групп многоклеточных животных, с круговой, двухцепочечной структурой молекулы ДНК, примерно от 15 до 20 килобаз, с 37 генами рибосомной РНК, 13 генами, кодирующими белок, и 22 генами РНК-переносчика. Последовательности митохондриальных штрих-кодов, такие как COI, NADH2, 16S рРНК и 12S рРНК, также могут быть использованы для таксономической идентификации. Увеличенная публикация полных митогеномов позволяет делать выводы о надежных филогенезах во многих таксономических группах и может фиксировать такие события, как перестройки генов и позиционирование мобильных генетических элементов. Использование скимминга генома для сборки полных митогеномов, филогенетическая история и биоразнообразие многих организмов могут быть решены.

При нацеливании на митогеномы нет конкретных предложений относительно минимальной конечной глубины секвенирования, поскольку митогеномы более изменчивы по размеру и более вариабельны в сложности у видов растений, что увеличивает сложность сборки повторяющихся последовательностей. Однако высококонсервативные кодирующие последовательности и неповторяющиеся фланкирующие области могут быть собраны с использованием сборки на основе ссылок. Последовательности должны быть замаскированы так же, как нацеленные на пластомы и ядерную рибосомную ДНК.

Ядерные повторы (сателлиты или мобильные элементы )

Ядерные повторы в геноме являются недостаточно используемым источником филогенетических данных. Когда ядерный геном является секвенированные на 5% генома будут присутствовать тысячи копий ядерных повторов. Хотя секвенированные повторы будут репрезентативными только для репрезентативных повторов всего генома, было показано, что эти секвенированные фракции точно отражают распространенность генома. Эти повторы могут быть сгруппированы de novo, и их численность оценивается. Распространение и встречаемость этих повторяющихся типов может быть филогенетически информативной и предоставлять информацию об эволюционной истории различных видов.

Низкокопийная ДНК

Низкая ДНК-копия может оказаться полезной для исследований эволюционного развития и филогенетических исследований. Ее можно добывать из высококопийных фракций различными способами, например, путем разработки праймеров из баз данных, содержащих n консервативных ортологичных генов, консервативных ортологичных генов с единственной копией и генов с общими копиями. Другой метод заключается в поиске новых зондов, нацеленных на низкокопийные гены с использованием транскриптомики через Hyb-Seq. В то время как ядерные геномы, собранные с использованием снимков генома, чрезвычайно фрагментированы, можно успешно собрать некоторые малокопийные однокопийные ядерные гены.

Низкое количество деградированной ДНК

Предыдущие методы попыток восстановления деградированной ДНК были основаны на секвенировании по Сэнгеру и опирались на большие интактные ДНК-матрицы и были подвержены влиянию контаминации и метода сохранения. Скимминг генома, с другой стороны, может использоваться для извлечения генетической информации из сохраненных видов в гербариях и музеях, где ДНК часто сильно деградирована и остается очень мало. Исследования на растениях показывают, что ДНК возрастом от 80 лет и всего лишь с 500 пг деградированной ДНК может использоваться при сканировании генома для вывода геномной информации. В гербариях, даже с низким выходом и низким качеством ДНК, одно исследование все же смогло произвести «высококачественные полные последовательности хлоропластной и рибосомной ДНК» в большом масштабе для последующего анализа.

В полевых исследованиях беспозвоночные хранятся в этаноле, который обычно выбрасывают во время исследований на основе ДНК. Было показано, что скимминг генома обнаруживает небольшое количество ДНК из этой этанольной фракции и предоставляет информацию о биомассе образцов во фракции, микробиоте внешних слоев ткани и содержимом кишечника (например, о жертве), выделяемом рвотным рефлексом. Таким образом, сканирование генома может предоставить дополнительный метод понимания экологии с помощью низкокопийной ДНК.

Рабочий процесс

экстракция ДНК

Протоколы экстракции ДНК будут различаться в зависимости от по источнику образца (т.е. растения, животные и т. д.). При сканировании генома использовались следующие протоколы выделения ДНК:

Растения

  • Растительный ДНКзол Реагент
  • Мини-набор Qiagen DNeasy Plant
  • Набор Tiangen DNAsecure Plant
  • Invitrogen Набор для экстракции гДНК ChargeSwitch для растений

Другое

  • Набор для экстракции Quick-DNA Plus
  • Метод с использованием бромида цетилтриметиламмония (CTAB)
  • Набор для экстракции тканей Qiagen DNeasy
  • Qiagen DNeasy Blood и Tissue kit

Подготовка библиотеки

Протоколы подготовки библиотеки будут зависеть от множества факторов: организма, типа ткани и т. д. В случае консервированных образцов могут потребоваться модификации конкретных протоколов подготовки библиотеки. При сканировании генома использовались следующие протоколы подготовки библиотеки:

  • Набор для подготовки образцов ДНК Illumina TruSeq
  • Набор Illumina TruSeq без ПЦР
  • Набор для секвенирования ДНК NEXTFlex
  • NEBNext ДНК Ultra II
  • NEBNext Multiplex Oligos
  • Набор для подготовки библиотеки ДНК Nextera XT
  • Набор для подготовки библиотеки TruSeq Nano DNA LT
  • Набор для быстрого секвенирования

Секвенирование

Секвенирование с короткими или длинными считываниями будет зависеть от целевого генома или генов. Микросателлиты в ядерных повторах требуют более длительных чтений. При сканировании генома использовались следующие платформы секвенирования:

  • платформа Illumina HiSeq 2000
  • платформа Illumina HiSeq 2500
  • платформа Illumina HiSeq 4000
  • платформа Illumina HiSeq X Ten
  • Платформа Illumina MiSeq
  • Платформа Illumina NextSeq 550
  • Платформа Illumina GAIIx
  • Oxford Nanopore Technologies (ONT) MinION

Выбрана платформа Illumina MiSeq некоторыми исследователями из-за большой длины чтения для коротких чтений.

Сборка

После сканирования генома органелларная ДНК с высоким числом копий может быть собрана с помощью справочного руководства или novo. Ядерные повторы с высоким числом копий могут быть сгруппированы de novo. Выбор ассемблеров будет зависеть от целевого генома и от того, используются ли короткие или длинные чтения. Следующие инструменты были использованы для сборки геномов из снимков генома:

Пластомы

  • Fast-Plast
  • NOVOPlasty
  • ORGanelle

Mitogenomes

  • Fast-Plast
  • NOVOPlasty
  • ORGanelle
  • MITObim

Other

  • Geneious
  • Canu
  • CLC
  • SPAdes
  • Velvet
  • MIRA
  • SOAPdenovo2
  • SOAPdenovo-Trans
  • Celera
  • IDBA-UD
  • Newbler
  • Ray-Meta
  • ASeMbler
  • Alignreads

Annotation

Annotation используется для идентификации генов в геномных сборках. Выбранный инструмент аннотации будет зависеть от целевого генома и целевых характеристик этого генома. Следующие инструменты аннотации использовались при сканировании генома для аннотирования органеллярных геномов:

Пластомы

  • cpGAVAS
  • Dual Organellar GenoMe Annotator (DOGMA)

Митогеномы

  • MITOS
  • MITOS2
  • Dual Organellar GenoMe Annotator (DOGMA)

тРНК

  • ARWEN
  • тРНКскан-SE

рРНК

  • RNAmmer

Other

  • BLAST
  • Geneious
  • ORF Finder
  • GeneWise
  • TransDecoder
  • EMBOSS Transeq

Филогенетическая конструкция

Собранные последовательности глобально выровнены, а затем филогенетические деревья конструируются с использованием программного обеспечения для построения филогении. Программное обеспечение, выбранное для построения филогении, будет зависеть от того, подходит ли метод максимального правдоподобия (ML), максимальной экономии (MP) или байесовского вывода (BI).. Следующие программы построения филогении использовались при сканировании генома:

Максимальное правдоподобие (ML)

  • RAxML
  • RAxML-HPC
  • PhyML
  • Geneious
  • IG-TREE

Максимальная экономия (MP)

  • PAUPRat
  • PAUP *

Байесовский вывод (BI)

  • MRBayes
  • BEAST
  • ExaBayes
  • PhyloBayes

Другое

  • MEGA4
  • MEGA6
  • MEGA7
Инструменты и конвейеры

Различные протоколы, конвейеры и биоинформатика были разработаны инструменты, помогающие автоматизировать последующие процессы сканирования генома.

Hyb-Seq

Hyb-Seq - это новый протокол для захвата низкокопийных ядерных генов, который сочетает в себе обогащение мишени и сканирование генома. Целевое обогащение локусов с низким числом копий достигается с помощью разработанных зондов обогащения для конкретных однокопийных экзонов, но требует ядерного чернового генома и транскриптома целевого организма. Затем библиотеки, обогащенные мишенью, секвенируются, а полученные считывания обрабатываются, собираются и идентифицируются. Используя считывания вне мишени, также можно собрать цистроны рДНК и полные пластомы. Благодаря этому процессу Hyb-Seq может создавать наборы данных в масштабе генома для филогеномики.

GetOrganelle

GetOrganelle - это набор инструментов, который собирает органелларные геномы с использованием считывания скимминга генома. Считывания, связанные с органеллами, набираются с использованием модифицированного подхода «наживки и итеративного картирования». Считывания , выравнивающие с целевым геномом с использованием Bowtie2, называются «начальными считываниями». Считанные значения используются в качестве «приманки» для привлечения большего количества операций чтения, связанных с органеллами, посредством нескольких итераций расширения. Алгоритм расширения чтения использует подход хеширования , при котором считываемые данные разрезаются на подстроки определенной длины, называемые «словами». На каждой итерации расширения эти «слова» добавляются в хэш-таблицу , называемую «пулом приманок», размер которой динамически увеличивается с каждой итерацией. Из-за низкого охвата секвенированием снимков генома нецелевые считывания, даже те, которые имеют большое сходство последовательностей с целевыми считываниями, в основном не рекрутируются. Используя последние набранные связанные с органеллами чтения, GetOrganelle проводит de novo сборку, используя SPAdes. Граф сборки фильтруется и распутывается, создавая все возможные пути графа и, следовательно, все конфигурации кольцевых органеллярных геномов.

Skmer

Skmer - это инструмент, не требующий сборки и выравнивания, для вычисления геномных расстояний между запрашиваемым и эталонным снимками генома. Скмер использует двухэтапный подход для вычисления этих расстояний. Сначала он генерирует профилирование частоты k-мер с помощью инструмента под названием JellyFish, а затем эти k-меры преобразуются в хеши. Случайное подмножество этих хешей выбирается для формирования так называемого «эскиза». На втором этапе Скмер использует Маш, чтобы оценить индекс Жаккара двух из этих эскизов. Комбинация этих двух этапов используется для оценки эволюционного расстояния.

Geneious

Geneious - это интегративная программная платформа, которая позволяет пользователям выполнять различные этапы биоинформатического анализа, такие как сборка, выравнивание и филогенетика путем включения других инструментов в платформу на основе графического интерфейса пользователя.

In silico Скимминг генома

Хотя скимминг генома обычно Выбранный в качестве экономичного метода секвенирования органеллярных геномов сканирование генома может быть выполнено in silico, если уже получены данные (глубокого) полногеномного секвенирования. Было продемонстрировано, что скимминг генома упрощает сборку органеллярного генома за счет субдискретизации считываний ядерного генома с помощью скимминга генома in silico. Поскольку органелларные геномы будут высококопийными в клетке, скимминг in silico генома по существу отфильтровывает ядерные последовательности, оставляя более высокое соотношение органелл и ядерных последовательностей для сборки, что снижает сложность парадигмы сборки. Скимминг in silico генома был сначала выполнен в качестве доказательства концепции, оптимизируя параметры для типа чтения, длины чтения и охвата секвенирования.

Другие приложения

Кроме перечисленных выше текущих применений Скимминг генома также применяется для решения других задач, таких как количественная оценка смесей пыльцы, мониторинг и сохранение определенных популяций. Скимминг генома также может использоваться для поиска вариантов, чтобы исследовать однонуклеотидный полиморфизм у разных видов.

Преимущества

Скимминг генома - это рентабельный, быстрый и надежный метод для создания больших неглубоких наборов данных, так как несколько наборов данных (пластидные, митохондриальные, ядерные) создаются за один прогон. Он очень прост в реализации, требует меньше лабораторных работ и оптимизации и не требует априорных знаний ни об организме, ни о размере его генома. Это дает возможность с низким уровнем риска для биологических исследований и генерации гипотез без огромных затрат ресурсов.

Скимминг генома - особенно выгодный подход в случаях, когда геномная ДНК может быть старой и деградировать в результате химических обработок, таких как образцы из гербарных и музейных коллекций, в значительной степени неиспользованный геномный ресурс. Скимминг генома позволяет дать молекулярную характеристику редких или вымерших видов. Процессы консервации в этаноле часто повреждают геномную ДНК, что препятствует успеху стандартных протоколов ПЦР и других подходов на основе ампликонов. Это дает возможность секвенировать образцы с очень низкими концентрациями ДНК без необходимости обогащения или амплификации ДНК. Было показано, что подготовка библиотеки для специфического скимминга генома работает всего с 37 нг ДНК (0,2 нг / мкл), что в 135 раз меньше, чем рекомендовано Illumina.

Хотя скимминг генома в основном используется для извлечения высококопийные пластомы и митогеномы, он также может обеспечивать частичные последовательности низкокопийных ядерных последовательностей. Эти последовательности могут быть недостаточно полными для филогеномного анализа, но могут быть достаточными для разработки праймеров и зондов для ПЦР для подходов, основанных на гибридизации.

Скимминг генома не зависит от каких-либо конкретных праймеров и не зависит от реаранжировки генов. 95>

Ограничения

Скимминг генома затрагивает поверхность генома, поэтому его будет недостаточно для биологических вопросов, требующих предсказания и аннотации генов. Эти последующие шаги необходимы для более глубокого и значимого анализа.

Хотя пластидные геномные последовательности в изобилии представлены на снимках генома, присутствие митохондриальных и ядерных псевдогенов пластидного происхождения может потенциально создавать проблемы для сборок пластома.

Сочетание глубины секвенирования и типа считывания, поскольку а также геномная мишень (пластом, митогеном и т. д.) будет влиять на успех сборок с одним и двумя концами, поэтому эти параметры необходимо тщательно выбирать.

Масштабируемость

И мокрый -lab и биоинформатика скимминга генома имеют определенные проблемы с масштабируемостью. Хотя стоимость секвенирования при сканировании генома в 2016 году доступна на уровне 80 долларов за 1 Гб, подготовка библиотеки к секвенированию все еще очень дорога, по крайней мере ~ 200 долларов за образец (по состоянию на 2016 год). Кроме того, большинство протоколов подготовки библиотек еще не полностью автоматизированы с помощью робототехники. Что касается биоинформатики, необходимо разрабатывать большие сложные базы данных и автоматизированные рабочие процессы для обработки больших объемов данных, возникающих в результате сканирования генома. Необходимо автоматизировать следующие процессы:

  1. Сборка стандартных штрих-кодов
  2. Сборка органеллярной ДНК (а также тандемных повторов ядерных рибосом)
  3. Аннотации различных собранных фрагментов
  4. Удаление потенциально загрязняющих последовательностей
  5. Оценка охвата секвенированием для генов с одной копией
  6. Извлечение прочтений, соответствующих генам с одной копией
  7. Идентификация неизвестных образец из небольшого секвенирования с дробовиком или любой фрагмент ДНК
  8. Идентификация различных организмов с помощью дробового секвенирования ДНК окружающей среды (метагеномика)

Некоторые из этих проблем масштабируемости уже реализованы, как показано выше в разделе «Инструменты» и трубопроводы ».

См. Также
Ссылки
Последняя правка сделана 2021-05-21 03:11:02
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте