A псевдоузел представляет собой вторичную структуру нуклеиновой кислоты, содержащую по меньшей мере две структуры петля-петля, в которых половина одного стержня вставлена между двумя половинами другого. стебель. Псевдоузел был впервые обнаружен в вирусе желтой мозаики репы в 1982 году. Псевдоязычные узлы складываются в трехмерные формы узлов, но не являются истинными топологическими узлами.
Структурная конфигурация псевдоузлов не подходит для биовычислительного обнаружения из-за своей контекстно-зависимой или «перекрывающейся» природы. Базовая пара в псевдоузлах плохо вложена; то есть встречаются пары оснований, которые «перекрывают» друг друга в положении последовательности. Это затрудняет прогнозирование с помощью стандартного метода динамического программирования, который использует рекурсивную систему оценки для идентификации парных оснований, и, следовательно, большинство из них не может обнаружить не -вложенные пары оснований. Более новый метод стохастических контекстно-свободных грамматик страдает той же проблемой. Таким образом, популярные методы прогнозирования вторичной структуры, такие как Mfold и Pfold, не будут прогнозировать структуры псевдоузлов, присутствующие в последовательности запроса; они будут идентифицировать только более устойчивый из двух оснований псевдоузла.
Можно идентифицировать ограниченный класс псевдоузлов с помощью динамического программирования, но эти методы не являются исчерпывающими и хуже масштабируются в зависимости от длины последовательности, чем алгоритмы без псевдоузлов. Было показано, что общая проблема прогнозирования структур с наименьшей свободной энергией с помощью псевдоузлов NP-полная.
Несколько важных биологических процессов основаны на молекулах РНК, которые образуют псевдоузлы, которые часто являются РНК с обширная третичная структура. Например, область псевдоузла РНКазы P является одним из наиболее консервативных элементов во всей эволюции. Компонент теломеразной РНК содержит псевдоузел, который имеет решающее значение для активности, а некоторые вирусы используют структуру псевдоязыка для формирования тРНК-подобного мотива для проникновения в клетку-хозяина.
Существует много типов псевдоузлов, различающихся тем, как они пересекаются и сколько раз пересекаются. Чтобы отразить эту разницу, псевдоузлы классифицируются на H-, K-, L-, M-типы, причем каждый последующий тип добавляет слой ступенчатой интеркаляции. Например, простой пример теломеразы P2b-P3 в статье представляет собой псевдоузел H-типа.
Вторичная структура РНК обычно представлена обозначением точечных скобок с парными круглыми скобками ()
, обозначающие пары оснований в стержне, а точки - петли. Прерывистые основы псевдоузлов означают, что такая нотация должна быть расширена дополнительными скобками или даже буквами, чтобы можно было представить различные наборы основ. Одно такое расширение использует в порядке вложенности ([{
edcba>}])
для закрытия. Структура для двух (слегка различающихся) примеров теломеразы в этих обозначениях следующая:
(((. (((((.........]]]]]]. Drawing 1 CGCGCGCUGUUUUCGCUGACUUUCAGCGGGCGA --- AAAAAAUGUCAGCU 50 ALIGN |. |||||||||||||||||||||||||. |. | |||||| ||||| |. 1ymo 1 --- GGGCUGUUUUUCUCGCUGACUUUCAGC - CCCAAACAAAAAA-GUCAGCA 47 (((((((.........]]]]]].
Обратите внимание, что выступ U в конце обычно присутствует в теломеразной РНК. Он был удален в модели раствора 1ymo для повышения стабильности псевдоузла.