Филогенетический след

редактировать
Филогенетический след гена HOXA5

Филогенетический след - это метод, используемый для идентификации фактора транскрипции сайты связывания (TFBS) в некодирующей области интересующей ДНК путем сравнения ее с ортологичной последовательностью у различных видов. Когда этот метод используется с большим количеством близкородственных видов, это называется филогенетическое затенение .

. Исследователи обнаружили, что некодирующие части ДНК содержат сайты связывания для регуляторных белков, которые регулируют пространственно-временная экспрессия генов. Эти сайты связывания факторов транскрипции (TFBS) или регуляторные мотивы оказалось трудно идентифицировать, прежде всего потому, что они короткие по длине и могут демонстрировать вариацию последовательности. Важность понимания регуляции транскрипции для многих областей биологии побудила исследователей разработать стратегии прогнозирования присутствия TFBS, многие из которых привели к созданию общедоступных баз данных. Один из таких методов - Филогенетический Footprinting.

Филогенетический Footprinting основан на двух основных концепциях:

  1. Функция и DNA связывание предпочтения факторы транскрипции хорошо законсервированы между различными видами.
  2. Важные некодирующие последовательности ДНК, которые необходимы для регуляции экспрессии генов, будут демонстрировать дифференциальное селективное давление. В TFBS происходит более медленная скорость изменений, чем в других, менее критических, частях некодирующего генома.
Содержание
  • 1 История
  • 2 Протокол
  • 3 Не все TFBS обнаружены
    • 3.1 Специфические сайты связывания
    • 3.2 Очень короткие сайты связывания
    • 3.3 Менее специфические факторы связывания
    • 3.4 Недостаточно данных
    • 3.5 Области связывания соединений
  • 4 Точность
  • 5 Ссылки
История

Филогенетический след был впервые использован и опубликован Tagle et al. в 1988 г., что позволило исследователям предсказать эволюционно консервативные цис-регуляторные элементы, ответственные за эмбриональную экспрессию генов ε и γ глобулина у приматов.

До филогенетического следа ДНКаза, где белок будет связываться с сайтами связывания фактора транскрипции ДНК (TFBS), защищая его от расщепления ДНКазой. Одна из проблем, связанных с этой техникой, заключалась в количестве времени и трудозатрат. В отличие от ДНКазного следа, филогенетический след основан на эволюционных ограничениях в геноме, при этом «важные» части последовательности сохраняются у разных видов.

Протокол
Протокол метода филогенетического следа

При использовании этого метода важно решить, с каким геномом следует выровнять последовательность. Более дивергентные виды будут иметь меньшее сходство последовательностей между ортологичными генами. Следовательно, ключевым моментом является выбор видов, которые достаточно родственны, чтобы обнаружить гомологию, но достаточно расходятся, чтобы максимизировать «шум» несовпадения. Поэтапный подход к филогенетическому построению следов состоит из:

  1. Следует выбрать интересующий ген.
  2. Тщательно выбирать виды с ортологичными генами.
  3. Определить длину восходящего или, возможно, нижнего течения.
  4. Выровняйте последовательности.
  5. Найдите консервативные области и проанализируйте их.
Не все TFBS обнаружены

Не все сайты связывания транскрипции могут можно найти с помощью филогенетического отпечатка ног в связи со статистическим характером этого метода. Вот несколько причин, по которым некоторые TFBS не обнаруживаются:

Специфичные для вида сайты связывания

Некоторые сайты связывания, по-видимому, не имеют значимых совпадений у большинства других видов. Следовательно, обнаружение этих сайтов с помощью филогенетического отпечатка ног, вероятно, невозможно, если не доступно большое количество близкородственных видов.

Очень короткие сайты связывания

Некоторые сайты связывания демонстрируют отличную сохранность, но только в более короткой области, чем те, которые искали. Такие короткие мотивы (например, GC-бокс) часто возникают случайно в нефункциональных последовательностях, и обнаружение этих мотивов может быть сложной задачей.

Менее специфические факторы связывания

Некоторые сайты связывания демонстрируют некоторую консервацию, но имеют вставки или делеции. Не очевидно, функционируют ли эти последовательности со вставками или делециями. Хотя они могут продолжать работать, если фактор привязки менее конкретен (или менее «разборчив», если хотите). Поскольку делеции и вставки в сайтах связывания редки, рассмотрение вставок и делеций в последовательности позволит выявить еще несколько истинных TFBS, но, вероятно, может включать гораздо больше ложных срабатываний.

Недостаточно данных

Некоторые мотивы достаточно хорошо сохранены, но они статистически незначимы в конкретном наборе данных. Мотив мог появиться у разных видов случайно. Эти мотивы можно было бы обнаружить, если бы были доступны последовательности от большего количества организмов. Так что в будущем это не будет проблемой.

Области связывания соединения

Некоторые факторы транскрипции связываются как димеры. Следовательно, их сайты связывания могут состоять из двух консервативных областей, разделенных несколькими вариабельными нуклеотидами. Из-за переменной внутренней последовательности мотив не может быть обнаружен. Однако, если бы мы могли использовать программу для поиска мотивов, содержащих вариабельную последовательность в середине, без подсчета мутаций, эти мотивы можно было бы обнаружить.

Точность

Важно помнить, что не все сохраняемые последовательности находятся под давлением отбора. Чтобы исключить ложноположительные результаты, необходимо провести статистический анализ, который покажет, что указанные мотивы имеют значительно меньшую скорость мутаций, чем у окружающей нефункциональной последовательности.

Более того, результаты могут быть более точными, если учесть предварительные знания о последовательности. Например, некоторые регуляторные элементы повторяются 15 раз в области промотора (например, некоторые промоторы металлотионеина содержат до 15 элементов ответа на металл (MRE)). Таким образом, чтобы устранить ложные мотивы с непоследовательным порядком у разных видов, ориентация и порядок регуляторных элементов в промоторной области должны быть одинаковыми у всех видов. Этот тип информации может помочь нам идентифицировать регуляторные элементы, которые не являются адекватно законсервированными, но встречаются в нескольких копиях во входной последовательности.

Ссылки
  1. ^Филогенетическое отслеживание последовательностей приматов для поиска функциональных областей генома человека doi : 10.1126 / science.1081331
  2. ^Неф, С. и Томпа, М. 2006. MicroFootPrinter: инструмент для филогенетического следа в геномах прокариот. Исследования нуклеиновых кислот. 34: 366-368
  3. ^Tagle, DA, Koop, BF, Goodman, M., Slightom, JL, Hess, D., and Jones, RT 1988. Эмбриональные гены ε- и γ-глобина прозимия приматов (Galago crassicaudatis) : нуклеотидные и аминокислотные последовательности, регуляция развития и филогенетические следы. J. Mol. Биол. 203: 439-455.
  4. ^Zhang, Z. and Gerstein, M. 2003. О мышах и людях: филогенетический отпечаток ног помогает открытию регуляторных элементов. J. Biol.2: 11-11.4
  5. ^Бланшетт, М. и Томпа, М. 2002. Открытие регулирующих элементов с помощью вычислительного метода для филогенетических следов. Genome Res. 12: 739-748
Последняя правка сделана 2021-06-02 04:33:59
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте