Последовательный анализ экспрессии гена

редактировать

Краткое изложение SAGE. Внутри организмов гены транскрибируются и сплайсируются (у эукариот ) для получения зрелых транскриптов мРНК (красный). МРНК извлекается из организма, и обратная транскриптаза используется для копирования мРНК в стабильную двухцепочечную кДНК (ds -кДНК ; синий). В SAGE дц-кДНК расщепляется рестрикционными ферментами (в положении «X» и «X» + 11) с образованием 11-нуклеотидных «теговых» фрагментов. Эти теги объединяются и секвенируются с использованием «долгого чтения» секвенирования по Сэнгеру (разные оттенки синего указывают на теги из разных генов). Последовательности деконволюционируют, чтобы найти частоту каждого тега. Частота метки может использоваться для сообщения о транскрипции гена, из которого произошла метка.

Последовательный анализ экспрессии гена (SAGE ) - это транскриптомный метод, используемый молекулярными биологами для создания моментального снимка популяции информационной РНК в интересующей выборке в виде небольших тегов, которые соответствуют фрагментам этих транскриптов. С тех пор было разработано несколько вариантов, в первую очередь более надежная версия, LongSAGE, RL-SAGE и самая последняя версия SuperSAGE. Многие из них улучшили технику за счет захвата более длинных меток, что позволяет более уверенно идентифицировать исходный ген.

Содержание

1 Обзор
2 Анализ
3 История
4 Сравнение с ДНК-микрочипами
5 Варианты протоколов
- 5.1 Клонирование миРНК
- 5.2 LongSAGE и RL-SAGE
- 5.3 SuperSAGE
- 5.4 Секвенирование 3'-концов мРНК, массовый анализ концов кДНК
6 См. Также
7 Ссылки
8 Внешние ссылки

Обзор

Вкратце, эксперименты SAGE продолжаются следующим образом:

мРНК входного образца (например, опухоль ) выделяют и обратную транскриптазу и биотинилированные праймеры используются для синтеза кДНК из мРНК.
кДНК связывается с гранулами стрептавидина посредством взаимодействия с биотином, присоединенным к праймерам, а затем расщепляется с помощью эндонуклеазы рестрикции называется якорным ферментом (AE). Местоположение сайта расщепления и, следовательно, длина оставшейся кДНК, связанной с бусиной, будет варьироваться для каждой отдельной кДНК (мРНК).
Затем расщепленная кДНК ниже сайта расщепления отбрасывается, а оставшаяся неподвижная Фрагменты кДНК, расположенные выше сайтов расщепления, делятся пополам и подвергаются воздействию одного из двух адапторных олигонуклеотидов (A или B), содержащих несколько компонентов в следующем порядке выше сайта присоединения: 1) липкие концы с сайтом разрезания AE для присоединения к расщепленная кДНК; 2) сайт узнавания для эндонуклеазы рестрикции, известной как фермент-метка (TE), который разрезает примерно на 15 нуклеотидов ниже своего сайта узнавания (в пределах исходной последовательности кДНК / мРНК); 3) Короткая последовательность праймера, уникальная для адаптера A или B, которая позже будет использоваться для дальнейшей амплификации с помощью ПЦР.
После лигирования адаптера кДНК расщепляются с использованием TE, чтобы удалить их из гранулы, оставляя только короткую «метку» примерно из 11 нуклеотидов исходной кДНК (15 нуклеотидов минус 4, соответствующие сайту узнавания AE).
Затем расщепленные метки кДНК восстанавливаются с помощью ДНК-полимеразы для получения фрагментов кДНК с тупым концом.
Эти фрагменты тегов кДНК (с адапторными праймерами и присоединенными сайтами распознавания AE и TE) лигируют, соединяя две последовательности тегов вместе, и фланкирующие адаптеры A и B в любом конец. Эти новые конструкции, называемые ditags, затем амплифицируются с помощью ПЦР с использованием праймеров, специфичных для якоря A и B.
Затем ditags расщепляются с использованием исходных AE и позволяют связываться вместе с другими ditags, которые будут лигированы для создания кДНК конкатемера, причем каждый дитаг разделен сайтом узнавания AE.
Эти конкатемеры затем трансформируются в бактерии для амплификации посредством бактериальной репликации.
Конкатемеры кДНК затем могут быть выделены и секвенированы с использованием современных высокопроизводительных секвенсоров ДНК, и эти последовательности могут быть проанализированы с помощью компьютерных программ, которые количественно определяют повторяемость отдельных тегов.

Анализ

Результатом SAGE является список тегов короткой последовательности с указанием количества наблюдений. Используя базы данных последовательностей, исследователь обычно может с некоторой уверенностью определить, из какой исходной мРНК (и, следовательно, из какого гена ) был извлечен тег.

Статистические методы могут применяться к спискам тегов и подсчетов из разных образцов, чтобы определить, какие гены экспрессируются более высоко. Например, образец нормальной ткани можно сравнить с соответствующей опухолью, чтобы определить, какие гены имеют тенденцию быть более (или менее) активными.

История

В 1979 году команды из Гарварда и Калифорнийского технологического института расширили основную идею создания ДНК-копий мРНК in vitro на амплификацию их библиотеки в бактериальных плазмидах. В 1982–1983 годах идея выбора случайных или полуслучайных клонов из такой библиотеки кДНК для секвенирования была исследована Грегом Сатклиффом и его сотрудниками. и Putney et al. кто секвенировал 178 клонов из библиотеки кДНК мышц кролика. В 1991 году Адамс и его сотрудники ввели термин экспрессирующий тег последовательности (EST) и инициировали более систематическое секвенирование кДНК в качестве проекта (начиная с 600 кДНК мозга). Идентификация EST прошла быстро, миллионы EST теперь доступны в общедоступных базах данных (например, GenBank ).

В 1995 году идея сокращения длины тега со 100 до 800 п.н. до длины тега с 10 до 22 п.н. помогла снизить стоимость исследований мРНК. В этом году оригинальный протокол SAGE был опубликован Виктором Велкулеску в Онкологическом центре Университета Джона Хопкинса. Хотя SAGE изначально был задуман для использования в исследованиях рака, он был успешно использован для описания транскриптома других заболеваний и у самых разных организмов.

Сравнение с ДНК-микрочипами

Общая цель метода аналогична ДНК-микрочипам. Однако отбор образцов SAGE основан на секвенировании выхода мРНК, а не на гибридизации выхода мРНК с зондами, поэтому уровни транскрипции измеряются более количественно, чем с помощью микроматрицы. Кроме того, последовательности мРНК не обязательно должны быть известны априори, поэтому гены или варианты генов, которые неизвестны, могут быть обнаружены. Эксперименты с микрочипами намного дешевле проводить, поэтому в крупномасштабных исследованиях SAGE обычно не используется. Количественная оценка экспрессии генов более точна в SAGE, потому что она включает прямой подсчет количества транскриптов, тогда как интенсивность пятен в микроматрицах падает с недискретными градиентами и подвержена фоновому шуму.

Варианты протоколов

клонирование miRNA

MicroRNAs, или сокращенно miRNA, представляют собой небольшие (~ 22nt) сегменты РНК, которые, как было обнаружено, играют решающую роль в регуляции генов. Один из наиболее часто используемых методов клонирования и идентификации miRNA в клетке или ткани был разработан в Bartel Lab и опубликован в статье Lau et al. (2001). С тех пор появилось несколько вариантов протоколов, но большинство из них имеют один и тот же базовый формат. Процедура очень похожа на SAGE: малая РНК выделяется, затем к каждой добавляются линкеры, и РНК превращается в кДНК с помощью RT-PCR. После этого линкеры, содержащие внутренние сайты рестрикции, перевариваются соответствующим рестрикционным ферментом, и липкие концы лигируются вместе в конкатамеры. После конкатенации фрагменты лигируют в плазмиды и используют для трансформации бактерий для создания множества копий плазмиды, содержащей вставки. Затем их можно секвенировать для идентификации присутствующей miRNA, а также для анализа уровней экспрессии данной miRNA путем подсчета количества ее присутствий, аналогично SAGE.

LongSAGE и RL-SAGE

LongSAGE был более надежной версией оригинального SAGE, разработанного в 2002 году, который имел более высокую пропускную способность, используя 20 мкг мРНК для создания библиотеки кДНК из тысяч тегов.. Robust LongSage (RL-SAGE) Дальнейшее усовершенствование протокола LongSAGE с возможностью создания библиотеки с размером вставки 50 нг мРНК, что намного меньше, чем предыдущий размер вставки LongSAGE, равный 2 мкг мРНК, и с использованием меньшего размера. количество цепных реакций ditag-полимеразы (ПЦР ) для получения полной библиотеки кДНК.

SuperSAGE

SuperSAGE является производным SAGE, который использует тип III- эндонуклеаза EcoP15I фага P1, чтобы вырезать теги последовательности длиной 26 п.н. из кДНК каждого транскрипта, увеличивая размер метки по крайней мере на 6 п.н. по сравнению с предшествующими технологиями SAGE и LongSAGE. Более длинный размер тега позволяет более точно отнести тег к соответствующему транскрипту, поскольку каждая дополнительная база значительно увеличивает точность аннотации.

Как и в исходном протоколе SAGE, так называемые теги формируются с использованием тегов с тупым концом. Однако SuperSAGE позволяет избежать систематической ошибки, наблюдаемой во время менее случайного лигирования длинных последовательностей длиной 20 п.н. Посредством прямого секвенирования с использованием высокопроизводительных методов секвенирования (секвенирование следующего поколения, то есть пиросеквенирование ) сотни тысяч или миллионы тегов могут быть проанализированы одновременно, что дает очень точные и количественные результаты профили экспрессии генов. Следовательно, профилирование экспрессии генов на основе тегов, также называемое «цифровым профилированием экспрессии генов» (DGE), сегодня может обеспечить наиболее точные профили транскрипции, которые преодолевают ограничения микрочипов.

секвенирования 3'-конца мРНК, массового анализа концов кДНК

В середине 2010-х годов было разработано несколько методов в сочетании с секвенированием следующего поколения, в которых используется принцип «тегов» для «цифрового профилирования экспрессии генов», но без использования фермента-тега. Подход «MACE» (= массивный анализ концов кДНК) генерирует теги где-то в последних 1500 п.о. транскрипта. Этот метод больше не зависит от рестрикционных ферментов и, таким образом, позволяет избежать систематической ошибки, связанной с отсутствием или расположением сайта рестрикции в кДНК. Вместо этого кДНК фрагментируется случайным образом, а 3'-концы секвенируются от 5'-конца молекулы кДНК, которая несет поли-A-хвост. Длина последовательности тегов может быть выбрана произвольно. Благодаря этому теги могут быть собраны в контиги, и аннотация тегов может быть значительно улучшена. Таким образом, MACE также используется для анализа немодельных организмов. Кроме того, более длинные контиги могут быть проверены на полиморфизм. Поскольку UTR демонстрируют большое количество полиморфизмов между индивидуумами, подход MACE может применяться для определения аллелей, профилирования аллель-специфической экспрессии генов и поиска молекулярных маркеров для разведения. Кроме того, подход позволяет определять альтернативное полиаденилирование транскриптов. Поскольку MACE требует только 3 ’концов транскриптов, даже частично деградировавшая РНК может быть проанализирована с меньшим искажением, зависящим от деградации. Подход MACE использует уникальные молекулярные идентификаторы, позволяющие идентифицировать систематическую ошибку ПЦР.

См. Также

Ссылки

^Shafee, Thomas; Лоу, Рохан (2017). «Структура эукариотических и прокариотических генов». WikiJournal of Medicine. 4 (1). doi : 10.15347 / wjm / 2017.002. ISSN 2002-4436.
^Saha S, et al. (2002). «Использование транскриптома для аннотирования генома». Nat Biotechnol. 20 (5): 508–12. doi : 10.1038 / nbt0502-508. PMID 11981567.
^Gowda M; Джантасуриярат С; Декан Р.А.; Ван ГЛ. (2004). «Robust-LongSAGE (RL-SAGE): существенно улучшенный метод LongSAGE для обнаружения генов и анализа транскриптомов». Plant Physiol. 134 (3): 890–7. doi : 10.1104 / pp.103.034496. PMC 389912. PMID 15020752.
^Мацумура H; Ито А; Сайто Н; Winter P; Kahl G; Reuter M; Krüger DH; Тераучи Р. (2005). «СУПЕРСЕЙД». Cell Microbiol. 7 (1): 11–8. doi : 10.1111 / j.1462-5822.2004.00478.x. PMID 15617519.
^Sim GK; Кафатос ФК; Джонс CW; Koehler MD; Efstratiadis A; Маниатис Т. (декабрь 1979 г.). «Использование библиотеки кДНК для изучения эволюции и онтогенетической экспрессии мультигенных семейств хориона». Cell. 18 (4): 1303–16. DOI : 10.1016 / 0092-8674 (79) 90241-1. PMID 519770.
^Сатклифф JG; Milner RJ; Bloom FE; Лернер Р.А. (август 1982 г.). «Общая 82-нуклеотидная последовательность, уникальная для РНК мозга». Proc Natl Acad Sci U S. A. 79 (16): 4942–6. Bibcode : 1982PNAS... 79.4942S. doi : 10.1073 / pnas.79.16.4942. PMC 346801. PMID 6956902.
^Патни SD; Herlihy WC; Шиммель П. (1983). «Новые клоны тропонина Т и кДНК для 13 различных мышечных белков, обнаруженные путем секвенирования дробовика». Природа. 302 (5910): 718–21. Bibcode : 1983Natur.302..718P. doi : 10.1038 / 302718a0. PMID 6687628.
^Adams MD, Kelley JM, Gocayne JD, et al. (Июнь 1991 г.). «Комплементарное секвенирование ДНК: метки экспрессированной последовательности и проект генома человека». Наука. 252 (5013): 1651–6. Bibcode : 1991Sci... 252.1651A. doi : 10.1126 / science.2047873. PMID 2047873.
^ Velculescu VE; Zhang L; Фогельштейн B; Kinzler KW. (1995). «Серийный анализ экспрессии генов». Наука. 270 (5235): 484–7. Bibcode : 1995Sci... 270..484V. doi : 10.1126 / science.270.5235.484. PMID 7570003.
^ Saha, S., et al. (2002). «Использование транскриптома для аннотирования генома». Nat Biotechnol 20 (5): 508-512.
^Gowda, M., et al. (2004). «Robust-LongSAGE (RL-SAGE): существенно улучшенный метод LongSAGE для обнаружения генов и анализа транскриптомов». Физиология растений 134 (3): 890-897.
^Matsumura, H.; Reich, S.; Ито, А.; Saitoh, H.; Kamoun, S.; Winter, P.; Kahl, G.; Reuter, M.; Krüger, D.; Тераучи, Р. (2003). «Анализ экспрессии генов взаимодействий растения-хозяин-патоген с помощью SuperSAGE». Труды Национальной академии наук. 100 (26): 15718–15723. Bibcode : 2003PNAS..10015718M. doi : 10.1073 / pnas.2536670100. PMC 307634. PMID 14676315.
^Гоуда, Малали; Джантасуриярат, Чатчаван; Дин, Ральф А.; Ван, Го-Лян (2004-03-01). «Robust-LongSAGE (RL-SAGE): существенно улучшенный метод LongSAGE для обнаружения генов и анализа транскриптомов». Физиология растений. 134 (3): 890–897. doi : 10.1104 / pp.103.034496. ISSN 1532-2548. PMC 389912. PMID 15020752.
^Шендуре, Дж. (2008). «Начало конца для микрочипов?». Природные методы. 5 (7): 585–7. doi : 10.1038 / nmeth0708-585. PMID 18587314.
^Matsumura, H.; Bin Nasir, K. H.; Yoshida, K.; Ито, А.; Kahl, G.N.; Крюгер, Д. Х.; Тераучи, Р. (2006). «Массив SuperSAGE: прямое использование тегов транскрипции из 26 пар оснований в массивах олигонуклеотидов». Природные методы. 3 (6): 469–74. doi : 10,1038 / nmeth882. PMID 16721381.
^Завада, Адам (январь 2014 г.). «Массивный анализ концов кДНК (MACE) и профили экспрессии миРНК выявляют проатерогенные пути при хроническом заболевании почек». Эпигенетика. 9 (1): 161–172. doi : 10.4161 / epi.26931. PMC 3928179. PMID 24184689.