В эволюционной биологии, пространство последовательностей является способом представления всех возможных последовательностей (для белка, ген или геном ). Пространство последовательностей имеет одно измерение на аминокислоту или нуклеотид в последовательности, ведущей к пространствам большой размерности.
. Большинство последовательностей в пространстве последовательностей не имеют функции, оставляя относительно небольшие области которые населены естественными генами. Каждая последовательность белка соседствует со всеми другими последовательностями, которые могут быть достигнуты с помощью единственной мутации . Было подсчитано, что все функциональное пространство белковых последовательностей было исследовано жизнью на Земле. Эволюцию можно представить себе как процесс выборки соседних последовательностей в пространстве последовательностей и перехода к любой с улучшенной пригодностью по сравнению с текущей.
Пространство последовательности обычно представляет собой сетку. Для пространств последовательностей белка каждый остаток в белке представлен размером с 20 возможными положениями вдоль этой оси, соответствующими возможным аминокислотам. Следовательно, существует 400 возможных дипептидов, расположенных в пространстве 20x20, но это число увеличивается до 10 даже для небольшого белка из 100 аминокислот, размещенного в пространстве со 100 измерениями. Хотя такую подавляющую многомерность нельзя визуализировать или представить схематически, она предоставляет полезную абстрактную модель для размышления о диапазоне белков и эволюции от одной последовательности к другой.
Эти многомерные пространства можно сжать до двух или трех измерений с помощью анализа главных компонентов. Фитнес-ландшафт - это просто пространство последовательностей с дополнительной вертикальной осью пригодности, добавленной для каждой последовательности.
Несмотря на разнообразие суперсемейств белков, пространство последовательностей чрезвычайно редко заселено функциональными белками. Большинство случайных белковых последовательностей не имеют складок или функций. Суперсемейства ферментов, следовательно, существуют как крошечные кластеры активных белков в огромном пустом пространстве нефункциональной последовательности.
Плотность функциональных белков в пространстве последовательностей, и близость различных функций друг к другу является ключевым фактором в понимании эволюционируемости. Степень взаимопроникновения двух нейтральных сетей различных действий в пространстве последовательностей будет определять, насколько легко будет переходить от одного действия к другому. Чем больше совпадений между различными активностями в пространстве последовательностей, тем больше будет загадочных вариаций для беспорядочной активности.
Пространство последовательностей белков сравнивалось с библиотекой of Babel, теоретическая библиотека, содержащая всевозможные книги объемом 410 страниц. В Вавилонской библиотеке найти какую-либо книгу, имеющую смысл, было невозможно из-за огромного количества и отсутствия порядка. То же самое было бы верно и для белковых последовательностей, если бы не естественный отбор, который отбирал только те белковые последовательности, которые имеют смысл. Кроме того, каждая последовательность белка окружена набором соседей (точечных мутантов), которые, вероятно, имеют хотя бы некоторую функцию.
С другой стороны, эффективный «алфавит» пространства последовательностей на самом деле может быть довольно небольшим, что снижает полезное количество аминокислот с 20 до гораздо меньшего числа. Например, в чрезвычайно упрощенном виде все аминокислоты можно разделить на два класса (гидрофобные / полярные) по гидрофобности, и при этом по-прежнему могут проявляться многие общие структуры. Ранняя жизнь на Земле может иметь только четыре или пять типов аминокислот, с которыми можно работать, и исследования показали, что функциональные белки могут быть созданы из белков дикого типа с помощью аналогичного процесса сокращения алфавита. Сокращенные алфавиты также полезны в биоинформатике, поскольку они обеспечивают простой способ анализа сходства белков.
Основное внимание в области белковой инженерии уделяется созданию библиотеки ДНК, которые отбирают области пространства последовательностей, часто с целью поиска мутантов белков с улучшенными функциями по сравнению с диким типом. Эти библиотеки создаются либо с использованием последовательности дикого типа в качестве матрицы и применения одного или нескольких методов мутагенеза для создания различных его вариантов, либо путем создания белков с нуля с использованием искусственного синтеза генов. Затем эти библиотеки подвергаются скринингу или отбору, и библиотеки с улучшенными фенотипами используются для следующего раунда мутагенеза.