A домен белка представляет собой консервативную часть данной последовательности белка и третичной структуры, которая может развиваться, функционировать и существовать независимо от остальная часть белковой цепи. Каждый домен образует компактную трехмерную структуру и часто может быть независимо устойчивым и сложенным. Многие белки состоят из нескольких структурных доменов. Один домен может присутствовать во множестве разных белков. Молекулярная эволюция использует домены в качестве строительных блоков, и они могут быть рекомбинированы в различных схемах для создания белков с разными функциями. Как правило, длина доменов варьируется от примерно 50 аминокислот до 250 аминокислот в длину. Самые короткие домены, такие как цинковые пальцы, стабилизируются ионами металлов или дисульфидными мостиками. Домены часто образуют функциональные единицы, такие как кальций-связывающий ручной домен EF из кальмодулина. Поскольку они независимо стабильны, домены могут быть «обменены» с помощью генной инженерии между одним белком и другим, чтобы получить химерные белки.
Концепция домена была впервые предложена в 1973 году Ветлауфером после Рентгеновские кристаллографические исследования куриного лизоцима и папаина и ограниченные исследования протеолиза иммуноглобулинов. Ветлауфер определил домены как стабильные единицы структуры белка, которые могут складываться автономно. Раньше домены описывались как единицы:
Каждое определение действительно и часто перекрывается, то есть компактный структурный домен который обнаруживается среди различных белков, вероятно, независимо сворачивается в своей структурной среде. Природа часто объединяет несколько доменов, чтобы сформировать мультидоменные и многофункциональные белки с огромным количеством возможностей. В мультидоменном белке каждый домен может выполнять свою собственную функцию независимо или согласованно со своими соседями. Домены могут служить модулями для создания больших сборок, таких как вирусные частицы или мышечные волокна, или могут обеспечивать определенные каталитические или связывающие сайты, обнаруженные в ферментах или регуляторных белках.
Подходящим примером является пируваткиназа (см. Первый рисунок), гликолитический фермент, который играет важную роль в регулировании оттока фруктозы-1., 6-бифосфат в пируват. Он содержит полностью β-нуклеотидный связывающий домен (синий), α / β-субстратный связывающий домен (серый) и α / β-регуляторный домен (оливково-зеленый), соединенные несколькими полипептидными линкерами. Каждый домен в этом белке встречается в различных наборах семейств белков.
Центральный α / β-цилиндрический домен связывания субстрата является одной из наиболее распространенных ферментных складок. Это наблюдается во многих различных семействах ферментов, катализирующих совершенно несвязанные реакции. Α / β-цилиндр обычно называют TIM-цилиндром в честь триозофосфат-изомеразы, которая была первой такой структурой, которая была решена. В настоящее время он подразделяется на 26 гомологичных семейств в базе данных домена CATH. Цилиндр TIM сформирован из последовательности мотивов β-α-β, замкнутых водородными связями первой и последней цепей вместе, образуя восьмицепочечный цилиндр. Есть споры об эволюционном происхождении этой области. Одно исследование показало, что один предковый фермент мог разделиться на несколько семейств, в то время как другое предполагает, что стабильная структура TIM-бочки возникла в результате конвергентной эволюции.
TIM-бочка в пируваткиназе «прерывистая», это означает, что для образования домена требуется более одного сегмента полипептида. Вероятно, это результат встраивания одного домена в другой во время эволюции белка. На основе известных структур показано, что около четверти структурных доменов являются разрывными. Встроенный регуляторный домен β-цилиндра является «непрерывным», состоящим из одного участка полипептида.
первичная структура (цепочка аминокислот) белка в конечном итоге кодирует его уникально сложенную трехмерную (3D) конформация. Наиболее важным фактором, управляющим сворачиванием белка в трехмерную структуру, является распределение полярных и неполярных боковых цепей. Сворачивание происходит за счет погружения гидрофобных боковых цепей внутрь молекулы, чтобы избежать контакта с водной средой. Обычно белки имеют ядро из гидрофобных остатков, окруженное оболочкой из гидрофильных остатков. Поскольку сами пептидные связи полярны, они нейтрализуются водородными связями друг с другом в гидрофобной среде. Это дает начало участкам полипептида, которые образуют регулярные трехмерные структурные паттерны, называемые вторичной структурой. Существует два основных типа вторичной структуры: α-спирали и β-листы.
Было обнаружено, что некоторые простые комбинации элементов вторичной структуры часто встречаются в структуре белка и упоминаются как сверхвторичная структура или мотивы. Например, мотив β-шпильки состоит из двух соседних антипараллельных β-тяжей, соединенных небольшой петлей. Он присутствует в большинстве антипараллельных β-структур как в виде изолированной ленты, так и в составе более сложных β-листов. Другой распространенной супервторичной структурой является мотив β-α-β, который часто используется для соединения двух параллельных β-цепей. Центральная α-спираль соединяет C-концы первой цепи с N-концами второй цепи, упаковывая ее боковые цепи против β-листа и, таким образом, экранируя гидрофобные остатки β-цепей от поверхности.
Ковалентная ассоциация двух доменов представляет собой функциональное и структурное преимущество, так как наблюдается повышение стабильности по сравнению с теми же нековалентно связанными структурами. Другими преимуществами являются защита промежуточных продуктов внутри междоменных ферментных щелей, которые в противном случае могут быть нестабильными в водной среде, и фиксированное стехиометрическое соотношение ферментативной активности, необходимое для последовательного набора реакций.
Структурное выравнивание является важный инструмент для определения доменов.
Несколько мотивов объединяются, образуя компактные, локальные, полунезависимые единицы, называемые доменами. Общая трехмерная структура полипептидной цепи упоминается как третичная структура белка. Домены - это фундаментальные единицы третичной структуры, каждый домен содержит индивидуальное гидрофобное ядро, построенное из вторичных структурных единиц, соединенных участками петель. Упаковка полипептида обычно намного плотнее внутри, чем снаружи домена, образуя твердое ядро и жидкую поверхность. Остатки ядра часто консервативны в семействе белков, тогда как остатки в петлях менее консервативны, если только они не участвуют в функции белка. Третичная структура белка может быть разделена на четыре основных класса на основании вторичного структурного содержания домена.
Домены имеют ограничения на размер. Размер отдельных структурных доменов варьируется от 36 остатков в E-селектине до 692 остатков в липоксигеназе-1, но большинство, 90%, имеют менее 200 остатков, в среднем около 100 остатков. Очень короткие домены, менее 40 остатков, часто стабилизируются ионами металлов или дисульфидными связями. Более крупные домены, более 300 остатков, вероятно, состоят из нескольких гидрофобных ядер.
Многие белки имеют четвертичную структуру, которая состоит из нескольких полипептидных цепей которые объединяются в олигомерную молекулу. Каждая полипептидная цепь в таком белке называется субъединицей. Гемоглобин, например, состоит из двух субъединиц α и двух β. Каждая из четырех цепей имеет α-глобиновую складку с гемовым карманом.
Обмен доменов - это механизм образования олигомерных сборок. При замене домена вторичный или третичный элемент мономерного белка заменяется таким же элементом другого белка. Обмен доменов может варьироваться от элементов вторичной структуры до целых структурных доменов. Он также представляет собой модель эволюции функциональной адаптации путем олигомеризации, например олигомерные ферменты, которые имеют свой активный сайт на границах раздела субъединиц.
Природа - мастерица, а не изобретатель, новые последовательности адаптированы из уже существующих последовательностей, а не изобретены. Домены - это обычный материал, используемый природой для создания новых последовательностей; их можно рассматривать как генетически мобильные единицы, называемые «модулями». Часто С- и N-концы доменов расположены близко друг к другу в пространстве, что позволяет им легко «вставляться» в родительские структуры в процессе эволюции. Многие доменные семейства встречаются во всех трех формах жизни: архей, бактерий и эукарий. Белковые модули - это подмножество белковых доменов, которые встречаются в ряде различных белков с особенно универсальной структурой. Примеры можно найти среди внеклеточных белков, связанных со свертыванием, фибринолизом, комплементом, внеклеточным матриксом, молекулами адгезии на клеточной поверхности и рецепторами цитокинов. Четыре конкретных примера широко распространенных белковых модулей - это следующие домены: SH2, иммуноглобулин, фибронектин типа 3 и крингл.
Молекулярная эволюция дает начало семействам родственных белков со сходной последовательностью и структурой. Однако сходство последовательностей между белками, имеющими одинаковую структуру, может быть чрезвычайно низким. Белковые структуры могут быть похожими, потому что белки ушли от общего предка. Альтернативно, некоторые складки могут быть более предпочтительными, чем другие, поскольку они представляют собой стабильные структуры вторичных структур, и некоторые белки могут сходиться к этим складкам в ходе эволюции. В настоящее время в Protein Data Bank (PDB) хранится около 110000 экспериментально определенных 3D-структур белков. Однако в этом наборе много идентичных или очень похожих структур. Все белки следует классифицировать по структурным семействам, чтобы понять их эволюционные отношения. Структурные сравнения лучше всего проводить на уровне предметной области. По этой причине было разработано множество алгоритмов для автоматического назначения доменов в белках с известной трехмерной структурой; см. «Определение домена по структурным координатам ».
База данных домена CATH классифицирует домены примерно на 800 групп; десять из этих складок очень густонаселенны и называются «суперскладками». Супер-складки определяются как складки, для которых существует по крайней мере три структуры без значительного сходства последовательностей. Наиболее популярной является суперсгибка α / β-ствола, как описано ранее.
Большинство белков, две трети у одноклеточных организмов и более 80% у метазоа, являются мультидоменными белками. Однако другие исследования пришли к выводу, что 40% прокариотических белков состоят из нескольких доменов, в то время как эукариоты содержат примерно 65% многодоменных белков.
Многие домены в многодоменных белках эукариот могут быть обнаружены как независимые белки у прокариот, что предполагает, что домены в мультидоменных белках когда-то существовали как независимые белки. Например, у позвоночных есть мультиферментный полипептид, содержащий домены GAR-синтетазы, AIR-синтетазы и GAR-трансформилазы (GARs-AIRs-GARt; GAR: глицинамид рибонуклеотид синтетаза / трансфераза; AIR: аминоимидазол-рибонуклеотидсинтетаза). У насекомых полипептид выглядит как GARs- (AIRs) 2-GARt, у дрожжей GARs-AIR кодируется отдельно от GARt, а у бактерий каждый домен кодируется отдельно.
(прокручиваемое изображение) Аттрактиноподобный белок 1 (ATRNL1) - это многодоменный белок, обнаруженный у животных, включая человека. Каждая единица представляет собой один домен, например EGF или домены Келча.Мультидоменные белки, вероятно, возникли из-за давления отбора во время эволюции, чтобы создать новые функции. Различные белки отличаются от общих предков различными комбинациями и ассоциациями доменов. Модульные единицы часто перемещаются внутри биологических систем и между ними посредством механизмов генетической перетасовки:
Простейшая мультидоменная организация, наблюдаемая в белках, - это организация одного домена, повторяющегося в тандеме. Домены могут взаимодействовать друг с другом (взаимодействие домен-домен ) или оставаться изолированными, как бусинки на нитке. Гигантский мышечный белок тайтин из 30 000 остатков включает около 120 доменов фибронектина-III-типа и Ig-типа. В сериновых протеазах событие дупликации гена привело к образованию фермента с двумя β-цилиндрическими доменами. Повторы разошлись настолько широко, что между ними нет очевидного сходства последовательностей. Активный сайт расположен в щели между двумя доменами β-бочонка, в которые функционально важные остатки вносятся из каждого домена. Было показано, что генно-инженерные мутанты химотрипсина сериновой протеазы обладают некоторой протеиназной активностью, даже несмотря на то, что их остатки в активном центре были отменены, и поэтому было высказано предположение, что событие дублирования усиливает активность фермента.
Модули часто отображают разные взаимосвязи связи, как показано на примере кинезинов и транспортеров ABC. Моторный домен кинезина может находиться на любом конце полипептидной цепи, которая включает область спиральной спирали и грузовой домен. Транспортеры ABC состоят из четырех доменов, состоящих из двух несвязанных модулей, АТФ-связывающей кассеты и встроенного мембранного модуля, расположенных в различных комбинациях.
Мало того, что домены рекомбинируют, но есть много примеров того, как домен был вставлен в другой. Последовательности или структурное сходство с другими доменами демонстрируют, что гомологи встроенного и родительского доменов могут существовать независимо. Примером могут служить «пальцы», вставленные в домен «ладонь» в полимеразах семейства Pol I. Поскольку один домен можно вставить в другой, в многодоменном белке всегда должен быть хотя бы один непрерывный домен. Это основное различие между определениями структурных доменов и эволюционных / функциональных доменов. Эволюционный домен будет ограничен одной или двумя связями между доменами, тогда как структурные домены могут иметь неограниченное количество связей в рамках заданного критерия существования общего ядра. К эволюционному домену можно отнести несколько структурных доменов.
Супердомен состоит из двух или более консервативных доменов номинально независимого происхождения, но впоследствии унаследованных как единая структурная / функциональная единица. Этот комбинированный супердомен может встречаться в различных белках, которые не связаны только дупликацией генов. Примером супердомена является пара протеинтирозинфосфатаза - домен C2 в PTEN, тензин, ауксилин и мембранный белок TPTE2. Этот супердомен содержится в белках животных, растений и грибов. Ключевой особенностью супердомена PTP-C2 является сохранение аминокислотных остатков на границе домена.
Сворачивание белка - нерешенная проблема : начиная с основополагающей работы Анфинсена в начале 1960-х годов, цель полностью понять механизм, с помощью которого полипептид быстро сворачивается в свою стабильную нативную конформацию, остается неуловимым. Многие экспериментальные исследования сворачивания внесли большой вклад в наше понимание, но принципы, управляющие сворачиванием белков, по-прежнему основаны на принципах, обнаруженных в самых первых исследованиях сворачивания. Анфинсен показал, что нативное состояние белка термодинамически стабильно, конформация находится в глобальном минимуме его свободной энергии.
Сворачивание - это направленный поиск конформационного пространства, позволяющий белку сворачиваться в биологически возможном масштабе времени. Парадокс Левинталя гласит, что если бы белок со средним размером отбирал бы все возможные конформации до того, как обнаружил бы одну с наименьшей энергией, весь процесс занял бы миллиарды лет. Белки обычно сворачиваются в пределах от 0,1 до 1000 секунд. Следовательно, процесс сворачивания белка должен осуществляться каким-то образом через определенный путь сворачивания. Силы, которые направляют этот поиск, вероятно, будут представлять собой комбинацию локальных и глобальных влияний, эффекты которых ощущаются на различных этапах реакции.
Успехи экспериментальных и теоретических исследований показали, что складчатость можно рассматривать с точки зрения энергетические ландшафты, где кинетика сворачивания рассматривается как прогрессивная организация ансамбля частично свернутых структур, через которые белок проходит на своем пути к свернутой структуре. Это было описано в терминах «складчатой воронки» , в которой развернутый белок имеет большое количество доступных конформационных состояний и меньшее количество состояний доступно для свернутого белка. Воронка означает, что для сворачивания белка происходит уменьшение энергии и потеря энтропии с увеличением образования третичной структуры. Локальная шероховатость воронки отражает кинетические ловушки, соответствующие накоплению неправильно свернутых промежуточных продуктов. Складывающаяся цепь продвигается к более низким внутрицепочечным свободным энергиям за счет увеличения своей компактности. Конформационные возможности цепочки в конечном итоге сужаются к одной нативной структуре.
Организация больших белков структурными доменами представляет собой преимущество сворачивания белков, при этом каждый домен может индивидуально сворачиваться, ускоряя процесс сворачивания и уменьшая потенциально большое сочетание остаточных взаимодействий. Кроме того, с учетом наблюдаемого случайного распределения гидрофобных остатков в белках, формирование домена представляется оптимальным решением для крупного белка, позволяющего скрыть свои гидрофобные остатки при сохранении гидрофильных остатков на поверхности.
Однако роль междоменные взаимодействия в сворачивании белков и в энергетике стабилизации нативной структуры, вероятно, различаются для каждого белка. В лизоциме Т4 влияние одного домена на другой настолько сильно, что вся молекула устойчива к протеолитическому расщеплению. В этом случае сворачивание - это последовательный процесс, при котором С-концевой домен требуется для независимого сворачивания на ранней стадии, а другой домен требует наличия свернутого С-концевого домена для сворачивания и стабилизации.
Было обнаружено, что сворачивание изолированного домена может происходить с той же скоростью, а иногда и быстрее, чем сворачивание интегрированного домена, предполагая, что во время сворачивания могут происходить неблагоприятные взаимодействия с остальной частью белка. Несколько аргументов предполагают, что самый медленный шаг в сворачивании больших белков - это спаривание свернутых доменов. Это происходит либо потому, что домены сложены не совсем правильно, либо потому, что небольшие корректировки, необходимые для их взаимодействия, являются энергетически невыгодными, например, удаление воды с границы раздела доменов.
Динамика белковых доменов играет ключевую роль во множестве процессов молекулярного распознавания и передачи сигналов. Белковые домены, соединенные внутренне неупорядоченными гибкими линкерными доменами, вызывают дальнодействующую аллостерию через динамику белковых доменов. Результирующие динамические режимы обычно не могут быть предсказаны на основе статических структур ни всего белка, ни отдельных доменов. Однако они могут быть выведены путем сравнения различных структур белка (как в База данных молекулярных движений ). Они также могут быть предложены путем отбора проб в обширных траекториях молекулярной динамики и анализа главных компонентов, или их можно непосредственно наблюдать с помощью спектров, измеренных с помощью нейтронного спинового эха спектроскопии.
Важность доменов как структурных строительных блоков и элементов эволюции привела к появлению множества автоматизированных методов их идентификации и классификации в белках известной структуры. Автоматические процедуры для надежного присвоения доменов необходимы для создания баз данных доменов, особенно в связи с увеличением количества известных белковых структур. Хотя границы области могут быть определены визуальным осмотром, создание автоматизированного метода непросто. Проблемы возникают, когда вы сталкиваетесь с доменами, которые прерываются или сильно связаны. Тот факт, что нет стандартного определения того, что на самом деле представляет собой домен, означает, что назначение доменов сильно различается, и каждый исследователь использует уникальный набор критериев.
Структурный домен - это компактная глобулярная подструктура. с большим количеством взаимодействий внутри него, чем с остальным белком. Следовательно, структурный домен можно определить по двум визуальным характеристикам: его компактности и степени изолированности. Меры локальной компактности в белках использовались во многих ранних методах назначения доменов и в нескольких более поздних методах.
Один из первых алгоритмов использовал a вместе с процедура иерархической кластеризации, в которой белки рассматриваются как несколько небольших сегментов длиной 10 остатков. Начальные сегменты были сгруппированы один за другим на основе расстояний между сегментами; сегменты с самыми короткими расстояниями были сгруппированы и впоследствии рассмотрены как отдельные сегменты. Пошаговая кластеризация, наконец, включала полный белок. Го также использовал тот факт, что расстояния между доменами обычно больше, чем расстояния внутри домена; все возможные были представлены в виде диагональных графиков, на которых были отчетливые узоры для спиралей, протяженных цепей и комбинаций вторичных структур.
Метод Соудхамини и Бланделла кластеризует вторичные структуры в белке на основе их расстояний Cα-Cα и идентифицирует домены по образцу в их дендрограммах. Поскольку процедура не рассматривает белок как непрерывную цепочку аминокислот, нет проблем с лечением прерывистых доменов. Конкретные узлы на этих дендрограммах идентифицируются как третичные структурные кластеры белка, они включают как супервторичные структуры, так и домены. Алгоритм DOMAK используется для создания базы данных домена 3Dee. Он вычисляет «значение разделения» из количества контактов каждого типа, когда белок произвольно делится на две части. Это значение разделения велико, когда две части структуры различны.
Метод Wodak и Janin был основан на вычисленных площадях поверхности раздела между двумя сегментами цепи, многократно расщепленными в различных положениях остатков. Площадь поверхности раздела рассчитывалась путем сравнения площадей поверхностей сколотых сегментов с площадями нативной структуры. Возможные границы домена можно определить на сайте, где площадь интерфейса была минимальной. Другие методы использовали меры доступности растворителя для расчета компактности.
Алгоритм PUU включает гармоническую модель, используемую для аппроксимации междоменной динамики. Основная физическая концепция заключается в том, что внутри каждого домена будет происходить множество жестких взаимодействий, а между доменами будут происходить свободные взаимодействия. Этот алгоритм используется для определения доменов в базе данных доменов FSSP.
Swindells (1995) разработал метод DETECTIVE для идентификации доменов в белковых структурах, основываясь на идее, что домены имеют гидрофобный интерьер. Было обнаружено, что недостатки возникают, когда гидрофобные ядра из разных доменов проходят через область интерфейса.
RigidFinder - это новый метод идентификации жестких блоков белка (доменов и петель) из двух различных конформаций. Жесткие блоки определяются как блоки, в которых все расстояния между остатками сохраняются в разных конформациях.
Метод RIBFIND, разработанный Pandurangan и Topf, позволяет идентифицировать твердые тела в белковых структурах, выполняя пространственную кластеризацию вторичных структурных элементов в белках. Жесткие тела RIBFIND использовались для гибкой подгонки белковых структур в криоэлектронную микроскопию карты плотности.
Общий метод идентификации динамических доменов, то есть участков белка, которые ведут себя примерно как жесткие единицы в ход структурных колебаний был представлен Potestio et al. и, среди других приложений, также использовался для сравнения согласованности основанных на динамике подразделений доменов со стандартными основанными на структуре. Метод, обозначенный как PiSQRD, общедоступен в виде веб-сервера. Последний позволяет пользователям оптимально подразделить одноцепочечные или мультимерные белки на квазижесткие домены на основе коллективных режимов флуктуации системы. По умолчанию последние рассчитываются с помощью модели эластичной сети; в качестве альтернативы пользователь может загрузить предварительно рассчитанные существенные динамические пространства.
Большая часть доменов имеет неизвестную функцию. Домен с неизвестной функцией (DUF) представляет собой домен белка, который не имеет охарактеризованной функции. Эти семейства были собраны вместе в базе данных Pfam с использованием префикса DUF, за которым следует номер, примерами являются DUF2992 и DUF1220. В настоящее время в базе данных Pfam содержится более 3000 семей DUF, что составляет более 20% известных семей. Удивительно, но количество DUF в Pfam увеличилось с 20% (в 2010 г.) до 22% (в 2019 г.), в основном из-за увеличения количества новых геномных последовательностей. Pfam версии 32.0 (2019) содержал 3961 DUF.
Эта статья включает текст и рисунки из диссертации Джорджа Р.А. (2002) «Предсказание структурных доменов в белках», Университетский колледж Лондона, которые были предоставлены автором.
Викискладе есть средства массовой информации, связанные с белковыми доменами. |