Открыть рамку считывания

редактировать
Пример последовательности, показывающий три различных возможных рамки считывания. Стартовые кодоны выделены фиолетовым цветом, а стоп-кодоны выделены красным.

В молекулярной генетике открытая рамка считывания (ORF ) - это часть рамки считывания, которая может быть переведена. ORF представляет собой непрерывный участок кодонов, который начинается с стартового кодона (обычно AUG) и заканчивается стоп-кодоном (обычно UAA, UAG или UGA). Кодон ATG (AUG в терминах РНК ) в пределах ORF (не обязательно первый) может указывать, где начинается трансляция. Сайт терминации транскрипции расположен после ORF, за пределами трансляции стоп-кодона. Если бы транскрипция прекратилась до появления стоп-кодона, во время трансляции образовался бы неполный белок. В эукариотических генах с несколькими экзонами, интроны удаляются, а затем экзоны соединяются вместе после транскрипции для получения окончательной мРНК для перевода белков. В контексте поиска гена, определение старт-стоп ORF поэтому применимо только к сплайсированным мРНК, а не геномной ДНК, поскольку интроны могут содержать стоп-кодоны и / или вызывать сдвиги между рамки для чтения. Альтернативное определение гласит, что ORF - это последовательность, имеющая длину, кратную трем, и ограниченная стоп-кодонами. Это более общее определение также может быть полезно в контексте транскриптомики и / или метагеномики, где стартовый и / или стоп-кодон может не присутствовать в полученных последовательностях. Такая ORF соответствует частям гена, а не полному гену.

Содержание

  • 1 Биологическое значение
  • 2 Шестикадровый перевод
  • 3 Инструменты для поиска ORF
    • 3.1 ORF Finder
    • 3.2 ORF Investigator
    • 3.3 ORF Predictor
    • 3.4 ORFik
  • 4 См. Также
  • 5 Ссылки
  • 6 Внешние ссылки

Биологическое значение

Одним из распространенных способов использования открытых рамок считывания (ORF) является одно свидетельство, помогающее в прогнозировании генов . Длинные ORF часто используются, наряду с другими доказательствами, для первоначальной идентификации участков-кандидатов белок-кодирующих или функциональных областей, кодирующих РНК в последовательности ДНК. Наличие ORF не обязательно означает, что область всегда транслируется. Например, в случайно сгенерированной последовательности ДНК с равным процентом каждого нуклеотида, стоп-кодон будет ожидаться один раз на каждые 21 кодон. Простой алгоритм прогнозирования гена для прокариот может искать стартовый кодон, за которым следует открытая рамка считывания, достаточно длинная, чтобы кодировать типичный белок, где использование кодона этой области соответствует частотной характеристике для кодирующих областей данного организма. Поэтому некоторые авторы говорят, что ORF должна иметь минимальную длину, например 100 кодонов или 150 кодонов. Сама по себе даже длинная открытая рамка считывания не является убедительным доказательством присутствия гена . С другой стороны, было доказано, что некоторые короткие ОРС (кОРС), в которых отсутствуют классические признаки кодирующих белки генов (как из нкРНК, так и мРНК), могут продуцировать функциональные пептиды. Известно, что 5’NTR примерно 50% мРНК млекопитающих содержат одну или несколько кОРС. 64–75% экспериментально обнаруженных сайтов инициации трансляции кОРС консервативны в геномах человека и мыши и могут указывать на то, что эти элементы выполняют функцию. Однако кОРС часто можно найти только в минорных формах мРНК и избежать отбора; высокая консервативность сайтов инициации может быть связана с их расположением внутри промоторов соответствующих генов. Подобная ситуация характерна, например, для гена SLAMF1.

Шестикадровая трансляция

Поскольку ДНК интерпретируется группами из трех нуклеотидов (кодонов), ДНК нить имеет три отдельные рамки считывания. Двойная спираль молекулы ДНК имеет две антипараллельные нити; с двумя цепями, имеющими по три рамки считывания каждая, существует шесть возможных трансляций рамок.

Пример трансляции с шестью рамками. Нуклеотидная последовательность показана посередине с прямой трансляцией вверху и обратной трансляцией внизу. Выделены две возможные открытые рамки считывания с последовательностями.

Инструменты поиска ORF

ORF Finder

ORF Finder (Open Reading Frame Finder) - это инструмент графического анализа, который находит все открытые считывания кадры выбираемого минимального размера в пользовательской последовательности или в последовательности, уже имеющейся в базе данных. Этот инструмент идентифицирует все открытые рамки считывания с использованием стандартных или альтернативных генетических кодов. Выведенная аминокислотная последовательность может быть сохранена в различных форматах и ​​найдена в базе данных последовательностей с использованием сервера BLAST. ORF Finder должен быть полезен при подготовке полных и точных представлений последовательности. Он также поставляется с программным обеспечением для отправки последовательностей Sequin (анализатор последовательностей).

ORF Investigator

ORF Investigator - это программа, которая не только дает информацию о кодирующих и некодирующих последовательностях, но также может выполнять попарное глобальное выравнивание последовательностей различных участков гена / ДНК. Инструмент эффективно находит ORF для соответствующих аминокислотных последовательностей и преобразует их в их однобуквенный аминокислотный код, а также предоставляет их положения в последовательности. Попарное глобальное выравнивание между последовательностями делает удобным обнаружение различных мутаций, включая однонуклеотидный полиморфизм. Алгоритмы Нидлмана-Вунша используются для выравнивания генов. ORF Investigator написан на портативном языке программирования Perl и поэтому доступен пользователям всех распространенных операционных систем.

ORF Predictor

OrfPredictor - это веб-сервер, предназначенный для идентификации областей, кодирующих белок, в последовательностях, производных от тега экспрессируемой последовательности (EST). Для запрашиваемых последовательностей с попаданием в BLASTX программа предсказывает кодирующие области на основе рамок считывания трансляции, идентифицированных при выравнивании BLASTX, в противном случае она предсказывает наиболее вероятную кодирующую область на основе внутренних сигналов запрашиваемых последовательностей. Результатом являются предсказанные пептидные последовательности в формате FASTA и строка определения, которая включает идентификатор запроса, рамку считывания трансляции и положения нуклеотидов, в которых начинается и заканчивается кодирующая область. OrfPredictor упрощает аннотацию последовательностей, производных от EST, в частности, для крупномасштабных проектов EST.

ORF Predictor использует комбинацию двух разных определений ORF, упомянутых выше. Он ищет участки, начиная с стартового кодона и заканчивая стоп-кодоном. В качестве дополнительного критерия выполняется поиск стоп-кодона в 5 'нетранслируемой области (UTR).

ORFik

ORFik - это R-пакет в Bioconductor для поиска открытых рамок считывания и использования технологий секвенирования нового поколения для обоснования ORF.

См. Также

Ссылки

Внешние ссылки

  • Перевод и открытые рамки чтения
  • hORFeome V5.1 - интерактивный веб-инструмент для CCSB Human ORFeome Collection
  • ORF Marker - бесплатный, быстрый и многоплатформенный инструмент с графическим интерфейсом для рабочего стола для прогнозирования и анализа ORF
  • StarORF - многоплатформенный инструмент с графическим интерфейсом на основе Java для прогнозирования и анализа ORF и получения последовательности обратного дополнения
  • ORFPredictor - веб-сервер, предназначенный для предсказания ORF и трансляции пакета последовательностей EST или кДНК
Последняя правка сделана 2021-06-01 12:49:48
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте