Дизайн белка

редактировать

Дизайн белка - это рациональный дизайн новых молекул белка для разработки новые виды деятельности, поведения или цели, а также для углубления базового понимания функции белков. Белки могут быть созданы с нуля (разработка de novo) или путем создания расчетных вариантов известной структуры белка и его последовательности (так называемая переработка белка). Рациональный дизайн белка подходы делают предсказания последовательности белков, которые будут складываться в конкретные структуры. Эти предсказанные последовательности могут быть затем подтверждены экспериментально с помощью таких методов, как синтез пептида, сайт-направленный мутагенез или синтез искусственного гена.

Рациональный дизайн белка восходит к середине -1970-е гг. Однако в последнее время появилось множество примеров успешного рационального дизайна водорастворимых и даже трансмембранных пептидов и белков, отчасти благодаря лучшему пониманию различных факторов, способствующих стабильности структуры белка, и разработке более совершенных вычислительных методов..

Содержание

  • 1 Обзор и история
  • 2 Базовые модели структуры и функции белка
    • 2.1 Целевая структура
    • 2.2 Пространство последовательностей
    • 2.3 Структурная гибкость
    • 2.4 Энергетическая функция
      • 2.4.1 Проблемы для эффективных расчетных функций энергии
  • 3 Как задача оптимизации
  • 4 Алгоритмы
    • 4.1 С математическими гарантиями
      • 4.1.1 Устранение тупика
      • 4.1.2 Ветвь и граница
      • 4.1.3 Целочисленное линейное программирование
      • 4.1.4 Основанные на передаче сообщений приближения к двойному линейному программированию
    • 4.2 Алгоритмы оптимизации без гарантий
      • 4.2.1 Монте-Карло и имитация отжига
      • 4.2.2 БЫСТРЕЕ
      • 4.2.3 Распространение убеждений
  • 5 Применение и примеры разработанных белков
    • 5.1 Дизайн ферментов
    • 5.2 Дизайн для аффинности
      • 5.2.1 Оценка предсказаний связывания
    • 5.3 Дизайн для специфичности
    • 5.4 Белок восстановление поверхности
    • 5.5 Дизайн глобулярных белков
    • 5.6 Дизайн мембранных белков
    • 5.7 Другие применения
  • 6 См. также
  • 7 Ссылки
  • 8 Дополнительная литература

Обзор и история

Цель рационального дизайна белка состоит в том, чтобы предсказать аминокислотные последовательности, которые будут свернуты до определенного белковая структура. Хотя количество возможных белковых последовательностей огромно и экспоненциально растет с размером белковой цепи, только часть из них будет надежно и быстро сворачиваться до одного нативного состояния. Дизайн белка включает идентификацию новых последовательностей в этом подмножестве. Нативное состояние белка - это конформационный минимум свободной энергии для цепи. Таким образом, дизайн белка - это поиск последовательностей, имеющих выбранную структуру как минимум свободной энергии. В некотором смысле это противоположно предсказанию структуры белка. В проекте указывается третичная структура и идентифицируется последовательность, которая будет сворачиваться к ней. Следовательно, это также называют обратным складыванием. В таком случае дизайн белка представляет собой проблему оптимизации: с использованием некоторых критериев оценки выбирается оптимизированная последовательность, которая будет сворачиваться до желаемой структуры.

Когда первые белки были рационально сконструированы в течение 1970-х и 1980-х годов, их последовательность была оптимизирована вручную на основе анализа других известных белков, состава последовательности, зарядов аминокислот и геометрии желаемой структуры. Первые разработанные белки приписываются Бернду Гутте, который разработал уменьшенную версию известного катализатора, бычьей рибонуклеазы и третичных структур, состоящих из бета-листов и альфа-спиралей, включая связующее вещество ДДТ. Урри и его коллеги позже сконструировали эластин -подобные волокнистые пептиды на основе правил, касающихся состава последовательностей. Ричардсон и его коллеги разработали белок из 79 остатков, не имеющий гомологии последовательности с известным белком. В 1990-х годах появление мощных компьютеров, библиотек конформаций аминокислот и силовых полей, разработанных в основном для молекулярно-динамического моделирования, позволило разработать инструменты компьютерного дизайна белков на основе структур. После разработки этих вычислительных инструментов за последние 30 лет был достигнут большой успех в дизайне белков. Первый белок, успешно созданный полностью de novo, был создан Стивеном Мэйо и его сотрудниками в 1997 году, а вскоре после этого, в 1999 году, Питер С. Ким и его сотрудники разработали димеры, тримеры и тетрамеры. неестественных правосторонних спиральных катушек. В 2003 г. лаборатория Дэвида Бейкера разработала полноценный белок в форме, невиданной ранее в природе. Позже, в 2008 году, группа Бейкера разработала компьютерные ферменты для двух разных реакций. В 2010 году одно из самых мощных нейтрализующих антител широкого спектра действия было выделено из сыворотки крови пациента с помощью белкового зонда, разработанного с помощью вычислений. Благодаря этим и другим успехам (например, см. примеры ниже) дизайн белка стал одним из наиболее важных инструментов, доступных для инженерии белка. Есть большая надежда, что разработка новых белков, больших и малых, найдет применение в биомедицине и биоинженерии.

.

Базовых моделях структуры и функции белков

Программы дизайна белков использовать компьютерные модели молекулярных сил, управляющих белками в in vivo средах. Чтобы сделать проблему разрешимой, эти силы упрощаются моделями конструкции белков. Хотя программы дизайна белков сильно различаются, они должны решать четыре основных вопроса моделирования: какова целевая структура дизайна, какая гибкость разрешена для целевой структуры, какие последовательности включаются в поиск и какое силовое поле будет использоваться для последовательности и структуры оценок.

Целевая структура

Белок Top7 был одним из первых белков, созданных для образования складок, которые раньше никогда не наблюдались в природе.

Функция белка в значительной степени зависит от структуры белка, а рациональный дизайн белков использует эту взаимосвязь для проектирования функции путем создания белков, которые имеют целевую структуру или складку. Таким образом, по определению, в рациональном дизайне белка целевая структура или ансамбль структур должны быть известны заранее. Это контрастирует с другими формами белковой инженерии, такими как направленная эволюция, где используются различные методы для поиска белков, которые выполняют определенную функцию, и с предсказанием структуры белка, где последовательность известно, но структура неизвестна.

Чаще всего целевая структура основана на известной структуре другого белка. Тем не менее, новые складки, невидимые в природе, становятся все более возможными. Питер С. Ким и его коллеги разработали тримеры и тетрамеры неестественных спиральных катушек, которые раньше не встречались в природе. Белок Top7, разработанный в лаборатории Дэвида Бейкера, был разработан полностью с использованием алгоритмов дизайна белков, в совершенно новой форме. Совсем недавно Бейкер и соавторы разработали серию принципов для создания идеальных структур глобулярных белков на основе белковых воронок сворачивания, которые служат мостом между предсказанием вторичной структуры и третичными структурами. Эти принципы, основанные как на предсказании структуры белка, так и на дизайне белка, были использованы для разработки пяти различных новых топологий белков.

Пространство последовательностей

FSD-1 (показано синим цветом, PDB id: 1FSV) было первый de novo вычислительный дизайн полного белка. Целевая складка представляла собой складку цинкового пальца в остатках 33-60 структуры белка Zif268 (показаны красным, PDB id: 1ZAA). Созданная последовательность имела очень небольшую идентичность последовательности с какой-либо известной последовательностью белка.

При рациональном дизайне белка белки можно реконструировать из последовательности и структуры известного белка или полностью с нуля в дизайне белков de novo. При редизайне белка большинство остатков в последовательности сохраняются как их аминокислоты дикого типа, в то время как некоторым разрешается мутировать. В дизайне de novo вся последовательность разрабатывается заново, без предшествующей последовательности.

И дизайн de novo, и редизайн белка могут устанавливать правила для пространства последовательностей : конкретных аминокислот, которые разрешены в каждом положении изменяемого остатка. Например, состав поверхности зонда RSC3 для отбора нейтрализующих ВИЧ антител был ограничен на основании данных эволюции и балансировки заряда. Многие из самых ранних попыток создания белков в значительной степени основывались на эмпирических правилах пространства последовательностей. Более того, конструкция волокнистых белков обычно следует строгим правилам в отношении пространства последовательностей. Белки, созданные на основе коллагена,, например, часто состоят из повторяющихся паттернов Gly-Pro-X. Появление вычислительных методов позволяет конструировать белки без вмешательства человека в выбор последовательности.

Структурная гибкость

Обычные программы конструирования белков используют библиотеки ротамеров для упрощения конформационного пространства боковых цепей белка. Эта анимация проходит через все ротамеры аминокислоты изолейцин на основе библиотеки предпоследних ротамеров.

В дизайне белка целевая структура (или структуры) белка известна. Однако подход рационального конструирования белка должен моделировать некоторую гибкость целевой структуры, чтобы увеличить количество последовательностей, которые могут быть созданы для этой структуры, и минимизировать вероятность сворачивания последовательности в другую структуру. Например, при редизайне белка одной небольшой аминокислоты (такой как аланин) в плотно упакованном ядре белка, очень небольшое количество мутантов может быть предсказано рациональным подходом к дизайну для сворачивания в целевую структуру, если окружающие боковые цепи не допускается переупаковка.

Таким образом, важным параметром любого процесса проектирования является степень гибкости, разрешенная как для боковых цепей, так и для магистрали. В простейших моделях остов протеина остается жестким, в то время как некоторым боковым цепям протеина позволяют изменять конформации. Однако боковые цепи могут иметь много степеней свободы в отношении длин связей, валентных углов и χдвугранных углов. Чтобы упростить это пространство, методы дизайна белков используют библиотеки ротамеров, которые принимают идеальные значения для длин связей и валентных углов, ограничивая при этом двугранные углы χнесколькими часто наблюдаемыми низкоэнергетическими конформациями, называемыми ротамерами <363.>Библиотеки ротамеров описывают ротамеры на основе анализа многих белковых структур. Базовые библиотеки ротамеров описывают все ротамеры. Зависимые от скелета библиотеки ротамеров, напротив, описывают ротамеры как вероятность их появления в зависимости от расположения белкового скелета вокруг боковой цепи. Ротамеры, описываемые библиотеками ротамеров, обычно представляют собой области в космосе. Большинство программ дизайна белков используют одну конформацию (например, модальное значение для двугранных углов ротамера в пространстве) или несколько точек в области, описываемой ротамером; программа OSPREY, напротив, моделирует всю непрерывную область.

Хотя рациональный дизайн белка должен сохранять общую структуру скелета белка, допущение некоторой гибкости скелета может значительно увеличить количество последовательности, которые складываются в структуру, сохраняя при этом общую укладку белка. Гибкость скелета особенно важна при редизайне белка, поскольку мутации последовательности часто приводят к небольшим изменениям в структуре скелета. Более того, гибкость основной цепи может быть существенной для более сложных приложений дизайна белков, таких как предсказание связывания и дизайн ферментов. Некоторые модели гибкости конструкции белка включают в себя небольшие и непрерывные глобальные движения позвоночника, дискретные образцы позвоночника вокруг целевой складки, движения спины и гибкость петли белка.

Энергетическая функция

Сравнение различных функций потенциальной энергии. Самая точная энергия - это те, которые используют квантово-механические вычисления, но они слишком медленные для дизайна белков. С другой стороны, эвристические функции энергии основаны на статистических терминах и работают очень быстро. В середине находятся энергетические функции молекулярной механики, которые основаны на физике, но не так затратны с точки зрения вычислений, как квантово-механическое моделирование.

Методы рационального конструирования белков должны иметь возможность отличать последовательности, которые будут стабильными в целевой складке, от тех, которые предпочли бы другие страны-конкуренты с низким энергопотреблением. Таким образом, конструкция белка требует точных энергетических функций, которые могут ранжировать и оценивать последовательности по тому, насколько хорошо они укладываются в целевую структуру. В то же время, однако, эти энергетические функции должны учитывать вычислительные проблемы, лежащие в основе дизайна белков. Одним из наиболее сложных требований для успешного проектирования является функция энергии, которая является точной и простой для вычислительных расчетов.

Наиболее точные функции энергии основаны на квантовомеханическом моделировании. Однако такое моделирование происходит слишком медленно и обычно нецелесообразно для дизайна белков. Вместо этого многие алгоритмы проектирования белков используют либо физические функции энергии, адаптированные из программ моделирования молекулярной механики, энергетические функции, основанные на знаниях, либо их гибридное сочетание. Возникла тенденция к использованию более физических функций потенциальной энергии.

Физические функции энергии, такие как AMBER и CHARMM, обычно выводятся из квантово-механических моделирования и экспериментальные данные из термодинамики, кристаллографии и спектроскопии. Эти энергетические функции обычно упрощают функцию физической энергии и делают их попарно разложимыми, что означает, что общая энергия конформации белка может быть вычислена путем добавления попарной энергии между каждой парой атомов, что делает их привлекательными для алгоритмов оптимизации. Энергетические функции на основе физики обычно моделируют притягивающий-отталкивающий член Леннарда-Джонса между атомами и попарный электростатический член между несвязанными атомами.

Водородные связи, опосредованные водой, играют ключевую роль в связывании белок-белок. Одно такое взаимодействие показано между остатками D457, S365 в тяжелой цепи ВИЧ-нейтрализующего широкого антитела VRC01 (зеленый) и остатками N58 и Y59 в белке оболочки ВИЧ GP120 (фиолетовый).

Статистические потенциалы, в отличие от Потенциалы, основанные на физике, имеют то преимущество, что их можно быстро вычислить, неявно учитывать сложные эффекты и они менее чувствительны к небольшим изменениям в структуре белка. Эти функции энергии основаны на получении значений энергии из частоты появления в базе данных конструкций.

Дизайн белков, однако, имеет требования, которые иногда могут быть ограничены в силовых полях молекулярной механики. Силовые поля молекулярной механики, которые использовались в основном в молекулярно-динамическом моделировании, оптимизированы для моделирования отдельных последовательностей, но конструкция белка ищет во многих конформациях многих последовательностей. Таким образом, силовые поля молекулярной механики должны быть адаптированы для дизайна белков. На практике энергетические функции дизайна белков часто включают как статистические, так и физические термины. Например, функция энергии Розетты, одна из наиболее часто используемых функций энергии, включает термины энергии, основанные на физике, происходящие из функции энергии CHARMM, и статистические термины энергии, такие как вероятность ротамера и электростатика, основанная на знаниях. Как правило, энергетические функции сильно настраиваются между лабораториями и специально подбираются для каждого проекта.

Проблемы, связанные с эффективными расчетными энергетическими функциями

Вода составляет большинство молекул, окружающих белки, и является основным двигателем белковая структура. Таким образом, моделирование взаимодействия между водой и белком жизненно важно при разработке белков. Количество молекул воды, которые взаимодействуют с белком в любой момент времени, огромно, и каждая из них имеет большое количество степеней свободы и партнеров по взаимодействию. Вместо этого программы проектирования белков моделируют большинство таких молекул воды как континуум, моделируя как гидрофобный эффект, так и поляризацию сольватации.

Отдельные молекулы воды иногда могут играть решающую структурную роль в ядре белков и в белке– белок или белок-лигандные взаимодействия. Неспособность смоделировать такие воды может привести к неправильному предсказанию оптимальной последовательности межбелкового интерфейса. В качестве альтернативы в ротамеры можно добавлять молекулы воды.

.

Как задача оптимизации

Эта анимация иллюстрирует сложность поиска дизайна белка, который обычно сравнивает все конформации ротамера из всех возможных мутаций по всем остаткам. В этом примере остаткам Phe36 и His 106 позволяют мутировать, соответственно, в аминокислоты Tyr и Asn. Phe и Tyr имеют по 4 ротамера в библиотеке ротамеров, в то время как Asn и His имеют 7 и 8 ротамеров, соответственно, в библиотеке ротамеров (из предпоследней библиотеки ротамеров Ричардсона). Анимация проходит через все (4 + 4) x (7 + 8) = 120 вариантов. Показанная структура соответствует миоглобину, PDB id: 1 мбн.

Цель дизайна белка - найти последовательность белка, которая будет сворачиваться в целевую структуру. Таким образом, алгоритм дизайна белка должен искать все конформации каждой последовательности относительно целевой складки и ранжировать последовательности в соответствии с конформацией с наименьшей энергией каждой из них, как определено функцией энергии дизайна белка. Таким образом, типичными входными данными для алгоритма конструирования белка являются целевая складка, пространство последовательностей, структурная гибкость и функция энергии, в то время как выходными данными являются одна или несколько последовательностей, которые, как прогнозируется, будут стабильно складываться в целевую структуру.

Число возможных белковых последовательностей, однако, растет экспоненциально с увеличением количества белковых остатков; например, имеется 20 белковых последовательностей длиной 100. Более того, даже если конформации боковой цепи аминокислот ограничиваются несколькими ротамерами (см.), это приводит к экспоненциальному количеству конформаций для каждой последовательности. Таким образом, в нашем белке из 100 остатков и при условии, что каждая аминокислота имеет ровно 10 ротамеров, алгоритм поиска, который ищет это пространство, должен будет искать более 200 конформаций белка.

Наиболее распространенные энергетические функции могут быть разложены на попарные члены между ротамерами и типами аминокислот, что делает проблему комбинаторной, и для ее решения можно использовать мощные алгоритмы оптимизации. В этих случаях полная энергия каждой конформации, принадлежащей каждой последовательности, может быть сформулирована как сумма индивидуальных и попарных членов между положениями остатков. Если проектировщика интересует только лучшая последовательность, алгоритм дизайна белка требует только конформацию с наименьшей энергией последовательности с наименьшей энергией. В этих случаях идентичность аминокислот каждого ротамера можно игнорировать, и все ротамеры, принадлежащие к разным аминокислотам, можно рассматривать одинаково. Пусть riбудет ротамером в положении остатка iв белковой цепи, а E(ri)- потенциальная энергия между внутренними атомами ротамера. Пусть E(ri, rj) будет потенциальной энергией между riи ротамером rjв положении остатка j. Затем мы определяем задачу оптимизации как задачу нахождения соответствия минимальной энергии (ET):

.

min ET = ∑ i [E i (ri) + ∑ i ≠ j E ij (ri, rj)] { \ displaystyle \ min E_ {T} = \ sum _ {i} {\ Big [} E_ {i} (r_ {i}) + \ sum _ {i \ neq j} E_ {ij} (r_ {i}, r_ {j}) {\ Big]} \,}\ min E _ {{T}} = \ sum _ {{i}} {\ Big [} E_ {i} (r_ {i}) + \ sum _ {{i \ neq j}} E _ {{ij}} (r_ {i}, r_ {j}) {\ Big]} \,

(1)

Проблема минимизации ETявляется NP-сложной проблемой. Несмотря на то, что класс проблем является NP-сложным, на практике многие примеры дизайна белков могут быть решены точно или удовлетворительно оптимизированы с помощью эвристических методов.

.

Алгоритмы

Несколько алгоритмов были разработаны специально для задачи дизайна белков. Эти алгоритмы можно разделить на два широких класса: точные алгоритмы, такие как устранение тупика, которые не имеют гарантий времени выполнения, но гарантируют качество решения; и эвристические алгоритмы, такие как Монте-Карло, которые быстрее точных алгоритмов, но не имеют гарантий оптимальности результатов. Точные алгоритмы гарантируют, что в процессе оптимизации были получены оптимальные результаты в соответствии с конструктивной моделью белка. Таким образом, если предсказания точных алгоритмов терпят неудачу, когда они экспериментально подтверждены, то источник ошибки может быть отнесен к функции энергии, допустимой гибкости, пространству последовательностей или целевой структуре (например, если она не может быть разработана для)

Некоторые алгоритмы конструирования белков перечислены ниже. Хотя эти алгоритмы затрагивают только самую базовую формулировку проблемы дизайна белка, уравнение (1), когда цель оптимизации изменяется из-за того, что разработчики вводят улучшения и расширения в модель дизайна белка, такие как улучшения допустимой структурной гибкости (например гибкость белковой основы) или включая сложные энергетические термины, многие из расширений дизайна белков, которые улучшают моделирование, построены на этих алгоритмах. Например, Rosetta Design включает в себя сложные энергетические термины и гибкость магистрали с использованием Монте-Карло в качестве основного алгоритма оптимизации. Алгоритмы OSPREY основаны на алгоритме устранения тупика и A *, чтобы включать непрерывные движения основной и боковой цепи. Таким образом, эти алгоритмы дают хорошее представление о различных типах алгоритмов, доступных для дизайна белков.

В июле 2020 года ученые сообщили о разработке процесса на основе ИИ с использованием геномных баз данных для эволюционного конструирования новых белков. Они использовали глубокое обучение для определения правил проектирования.

С математическими гарантиями

Устранение тупика

Алгоритм устранения тупика (DEE) итеративно сокращает пространство поиска проблемы, удаляя ротамеры, которые, как можно доказать, не являются частью глобальной конформации с наименьшей энергией (GMEC). На каждой итерации алгоритм исключения тупика сравнивает все возможные пары ротамеров в каждом положении остатка и удаляет каждый ротамер r′i, который, как можно показать, всегда имеет более высокую энергию, чем другой ротамер riи, таким образом, не является частью GMEC:

E (ri ') + ∑ j ≠ я мин rj E (ri', rj)>E (ri) + ∑ j ≠ i max rj E (ri, rj) {\ displaystyle E (r_ { i} ^ {\ prime}) + \ sum _ {j \ neq i} \ min _ {r_ {j}} E (r_ {i} ^ {\ prime}, r_ {j})>E (r_ {i }) + \ sum _ {j \ neq i} \ max _ {r_ {j}} E (r_ {i}, r_ {j})}E(r_{i}^{\prime })+\sum _{{j\neq i}}\min _{{r_{j}}}E(r_{i}^{\prime },r_{j})>E (r_ {i}) + \ sum _ {{j \ neq i}} \ max _ {{r_ {j}}} E (r_ {i}, r_ {j})

Другие мощные расширения алгоритма исключения тупика включают критерий исключения пар , и обобщенный критерий исключения тупика. Этот алгоритм также был расширен для работы с непрерывными ротамерами с доказываемыми гарантиями.

Alth Хотя алгоритм исключения тупика выполняется за полиномиальное время на каждой итерации, он не может гарантировать сходимость. Если после определенного количества итераций алгоритм исключения тупика больше не сокращает ротамеры, то необходимо либо объединить ротамеры, либо использовать другой алгоритм поиска для поиска оставшегося пространства поиска. В таких случаях устранение тупика действует как алгоритм предварительной фильтрации для уменьшения пространства поиска, в то время как другие алгоритмы, такие как A *, Монте-Карло, линейное программирование или FASTER, используются для поиска оставшегося пространства поиска.

Ветвление и граница

Конформационное пространство дизайна белка может быть представлено в виде дерева, в котором белковые остатки упорядочены произвольным образом, а ветви дерева на каждом из ротамеры в остатке. Алгоритмы ветвлений и границ используют это представление для эффективного изучения конформационного дерева: при каждом ветвлении, ветвлении и грани алгоритмы ограничивают пространство конформации и исследуют только перспективные ветви.

Популярный алгоритм поиска для Дизайн белка - это алгоритм поиска A *. A * вычисляет нижнюю границу оценки для каждого частичного пути дерева, которая ограничивает (с гарантиями) нижнюю границу энергии каждого из расширенных ротамеров. Каждое частичное подтверждение добавляется в очередь приоритетов, и на каждой итерации частичный путь с самой низкой нижней границей извлекается из очереди и расширяется. Алгоритм останавливается после того, как будет перечислено полное соответствие, и гарантирует, что соответствие является оптимальным.

Оценка A * fв дизайне белков состоит из двух частей: f = g + h. g- это точная энергия ротамеров, которая уже была присвоена в частичная конформация. h- это нижняя граница энергии ротамеров, которая еще не была назначена. Каждый разработан следующим образом, где d- это индекс последнего присвоенного остатка в частичной конформации.

g знак равно ∑ я знак равно 1 d (E (ri) + ∑ j = i + 1 d E (ri, rj)) {\ displaystyle g = \ sum _ {i = 1} ^ {d} (E ( r_ {i}) + \ sum _ {j = i + 1} ^ {d} E (r_ {i}, r_ {j}))}g = \ sum _ {{i = 1}} ^ {d} (E (r_ {i}) + \ sum _ {{j = i + 1}} ^ {d} E (r_ {i}, r_ {j}))

h = ∑ j = d + 1 n [min rj ( E (rj) + ∑ я знак равно 1 d E (ri, rj) + ∑ К = j + 1 n мин rk E (rj, rk))] {\ displaystyle h = \ sum _ {j = d + 1} ^ {n} [\ min _ {r_ {j}} (E (r_ {j}) + \ sum _ {i = 1} ^ {d} E (r_ {i}, r_ {j}) + \ sum _ {k = j + 1} ^ {n} \ min _ {r_ {k}} E (r_ {j}, r_ {k}))]}h = \ sum _ {{j = d + 1}} ^ {n} [\ min _ {{r_ {j }}} (E (r_ {j}) + \ sum _ {{i = 1}} ^ {d} E (r_ {i}, r_ {j}) + \ sum _ {{k = j + 1} } ^ {n} \ min _ {{r_ {k}}} E (r_ {j}, r_ {k}))]

Целочисленное линейное программирование

Проблема оптимизацию ET(Уравнение (1)) можно легко сформулировать как целочисленную линейную программу (ILP). Одна из наиболее эффективных формулировок использует бинарные переменные для представления присутствия ротамера и ребер в конечном растворе и ограничивает раствор, чтобы он имел ровно один ротамер для каждого остатка и одно попарное взаимодействие для каждой пары остатков:

мин ∑ я ∑ ри Е я (ри) ци (ри) + ∑ J ≠ я ∑ rj E ij (ri, rj) qij (ri, rj) {\ displaystyle \ \ min \ sum _ {i} \ sum _ {r_ { i}} E_ {i} (r_ {i}) q_ {i} (r_ {i}) + \ sum _ {j \ neq i} \ sum _ {r_ {j}} E_ {ij} (r_ {i }, r_ {j}) q_ {ij} (r_ {i}, r_ {j}) \,}\ \ min \ sum _ {{i}} \ sum _ {{r_ {i}}} E_ {i} (r_ {i}) q _ {i}} (r_ {i}) + \ sum _ {{j \ neq i}} \ sum _ {{r_ {j}}} E _ {{ij}} (r_ {i}, r_ {j}) q _ {{ij}} (r_ {i}, r_ {j}) \,

st

∑ riqi (ri) = 1, ∀ i {\ displaystyle \ sum _ {r_ {i}} q_ {i} (r_ {i}) = 1, \ \ forall i}\ sum _ {{r_ {i}} } q _ {{i}} (r_ {i}) = 1, \ \ forall i

∑ rjqij (ri, rj) знак равно qi (ri), ∀ я, ri, j {\ displaystyle \ sum _ {r_ {j}} q_ {ij} (r_ {i}, r_ {j}) = q_ {i} (r_ { i}), \ forall i, r_ {i}, j}\ sum _ {{r_ {j}}} q _ {{ ij}} (r_ {i}, r_ {j}) = q _ {{i}} (r_ {i}), \ forall i, r_ {i}, j

qi, qij ∈ {0, 1} {\ displaystyle q_ {i}, q_ {ij} \ in \ {0,1 \}}q_ {i}, q _ {{ij}} \ in \ { 0,1 \}

Решатели ILP, такие как CPLEX, могут вычислить точное оптимальное решение для больших примеров проблем проектирования белков. Эти решатели используют релаксацию линейного программирования задачи, где qiи qijмогут принимать непрерывные значения, в сочетании с алгоритмом ветвления и вырезанием для поиска только небольшая часть конформационного пространства для оптимального решения. Было показано, что решатели ILP решают многие примеры проблемы размещения боковой цепи.

Аппроксимации на основе передачи сообщений к двойным модулям линейного программирования

Решатели ILP зависят от алгоритмов линейного программирования (LP), такие как методы на основе симплексного или барьера для выполнения релаксации LP на каждой ветви. Эти алгоритмы LP были разработаны как универсальные методы оптимизации и не оптимизированы для решения задачи дизайна белков (уравнение (1)). Как следствие, релаксация LP становится узким местом для решателей ILP, когда размер проблемы велик. В последнее время несколько альтернатив, основанных на алгоритмах передачи сообщений, были разработаны специально для оптимизации LP-релаксации проблемы дизайна белка. Эти алгоритмы могут аппроксимировать как двойной, так и первичный экземпляры целочисленного программирования, но для обеспечения гарантий оптимальности они наиболее полезны, когда используются для приближения двойственного белка. проблема дизайна, потому что аппроксимация двойственности гарантирует, что никакие решения не будут упущены. Аппроксимации, основанные на передаче сообщений, включают в себя алгоритм передачи сообщений о максимальном продукте, взвешенном по дереву, и алгоритм линейного программирования для передачи сообщений.

Алгоритмы оптимизации без гарантий

Монте-Карло и имитация отжига

Монте-Карло - один из наиболее широко используемых алгоритмов для дизайна белков. В своей простейшей форме алгоритм Монте-Карло выбирает остаток случайным образом, и в этом остатке оценивается случайно выбранный ротамер (любой аминокислоты). Новая энергия белка, Eновый сравнивается со старой энергией Eстарый, и новый ротамер принимается с вероятностью:

p = e - β (E new - E old)), {\ displaystyle p = e ^ {- \ beta (E _ {\ text {new}} - E _ {\ text {old}}))},}p = e ^ {{- \ beta (E _ {{{{\ text {new}}}}} - E_ {{{\ text {old}}}}))}},

где β- постоянная Больцмана, и температура Tможет быть выбрана такой, чтобы на начальных этапах она была высокой и медленно отжигалась для преодоления локальных минимумов.

БЫСТРЕЕ

Алгоритм БЫСТРЕЕ использует комбинацию детерминированных и стохастических критериев для оптимизации аминокислотных последовательностей. FASTER сначала использует DEE для устранения ротамеров, которые не являются частью оптимального решения. Затем серия итерационных шагов оптимизирует назначение ротамера.

Распространение убеждений

В распространении убеждений для дизайна белка алгоритм обменивается сообщениями, которые описывают убеждение, что каждый остаток имеет примерно вероятность присутствия каждого ротамера в соседних остатках. Алгоритм обновляет сообщения на каждой итерации и выполняет итерацию до сходимости или до фиксированного количества итераций. Конвергенция не гарантируется в дизайне белков. Сообщение mi → j(rj, которое остаток iотправляет каждому ротамеру (rjв соседнем остатке j, определяется как:

mi → j (rj) знак равно макс ри (е - Е я (ри) - Е ij (ри, rj) T) ∏ К ∈ N (я) ∖ jmk → я (ри) {\ Displaystyle м_ {я \ к j} (r_ {j }) = \ max _ {r_ {i}} {\ Big (} e ^ {\ frac {-E_ {i} (r_ {i}) - E_ {ij} (r_ {i}, r_ {j}) } {T}} {\ Big)} \ prod _ {k \ in N (i) \ backslash j} m_ {k \ to i (r_ {i})}}m _ {{i \ to j}} (r_ {j}) = \ max _ {{r_ {i}}} {\ Big (} e ^ {{{\ frac {-E_ {i) } (r_ {i}) - E _ {{ij}} (r_ {i}, r_ {j})} {T}}}} {\ Big)} \ prod _ {{k \ in N (i) \ обратная косая черта j}} m _ {{k \ to i (r_ {i})}}

Максимальное произведение и сумма-произведение распространение убеждений использовалось для оптимизации дизайна белков.

Применение и примеры разработанных белков

Дизайн ферментов

Дизайн новых ферментов - это использование дизайна белков с огромными биоинженерными и биомедицинскими приложениями. В общем, создание структуры белка может отличаться от разработки фермента, потому что дизайн ферментов должен учитывать многие состояния, участвующие в каталитическом механизме. Однако дизайн белка является предпосылкой дизайна ферментов de novo, потому что, по крайней мере, конструкция катализаторов требует каркаса, в который может быть встроен каталитический механизм.

Большой прогресс в дизайне ферментов de novo и переделке, был изготовлен в первом десятилетии 21 века. В трех крупных исследованиях Дэвид Бейкер и его сотрудники de novo разработали ферменты для ретро- альдольной реакции, реакции элиминирования Кемпа и реакции Дильса-Альдера. Более того, Стивен Мэйо и его коллеги разработали итерационный метод создания наиболее эффективного известного фермента для реакции удаления Кемпа. Кроме того, в лаборатории Брюса Дональда компьютерный дизайн белка использовался для переключения специфичности одного из белковых доменов нерибосомальной пептидной синтетазы, которая продуцирует грамицидин S, от его природного субстрата фенилаланина до других непонятных субстратов, включая заряженные аминокислоты; модифицированные ферменты имели активность, близкую к активности дикого типа.

Дизайн для аффинности

Белковые взаимодействия участвуют в большинстве биотических процессов. Многие из тяжело поддающихся лечению заболеваний, такие как болезнь Альцгеймера, многие формы рака (например, TP53 ) и вирус иммунодефицита человека (ВИЧ ) инфекция включает белок-белковые взаимодействия. Таким образом, для лечения таких заболеваний желательно разработать белковые или протеиноподобные терапевтические средства, которые связывают одного из партнеров взаимодействия и, таким образом, нарушают вызывающее заболевание взаимодействие. Это требует разработки белковых терапевтических средств для сродства к партнеру.

Взаимодействия белок-белок могут быть разработаны с использованием алгоритмов дизайна белков, поскольку принципы, определяющие стабильность белка, также определяют связывание белок-белок. Дизайн белок-белкового взаимодействия, однако, представляет проблемы, обычно не встречающиеся при дизайне белков. Одна из наиболее важных проблем заключается в том, что, как правило, интерфейсы между белками более полярны, чем ядра белков, и связывание включает компромисс между десольватацией и образованием водородных связей. Чтобы преодолеть эту проблему, Брюс Тидор и его коллеги разработали метод повышения аффинности антител, сосредоточив внимание на электростатическом воздействии. Они обнаружили, что для антител, разработанных в исследовании, снижение затрат на десольватацию остатков в интерфейсе увеличивало аффинность пары связывания.

Оценка предсказания связывания

Энергетические функции дизайна белка должны быть адаптированным для оценки прогнозов связывания, поскольку связывание включает компромисс между конформациями с наименьшей энергией свободных белков (EPи EL) и конформацией с наименьшей энергией связанного комплекса (EPL):

Δ G = EPL - EP - EL {\ displaystyle \ Delta _ {G} = E_ {PL} -E_ {P} -E_ {L}}\ Delta _ {G} = E _ {{PL}} - E_ {P} -E_ {L} .

Алгоритм K * аппроксимирует привязку константа алгоритма путем включения конформационной энтропии в расчет свободной энергии. Алгоритм K * учитывает только конформации свободных и связанных комплексов с наименьшей энергией (обозначенные наборами P, Lи PL) для аппроксимации статистических сумм каждого комплекса:

K ∗ = ∑ x ∈ PL е - E (x) / RT ∑ x ∈ P e - E (x) / RT ∑ x ∈ L e - E (x) / RT {\ displaystyle K ^ {*} = {\ frac {\ sum \ limits _ {x \ in PL} e ^ {- E (x) / RT}} {\ sum \ limits _ {x \ in P} e ^ {- E (x) / RT} \ sum \ limits _ {x \ in L} e ^ {- E (x) / RT}}}}K ^ {*} = {\ frac {\ sum \ limits _ {{x \ in PL}} e ^ {{- E (x) / RT}}} {\ sum \ limits _ {{x \ in P}} e ^ {{- E (x) / RT}} \ sum \ limits _ {{x \ in L}} e ^ {{- E (x) / RT}}}}

Дизайн для специфичности

Дизайн белок-белковых взаимодействий должен быть высокоспецифичным, потому что белки могут взаимодействовать с большим количество белков; успешный дизайн требует отборных связующих. Таким образом, алгоритмы дизайна белков должны иметь возможность различать связывание на мишени (или положительный дизайн) и нецелевое связывание (или отрицательный дизайн). Одним из наиболее ярких примеров дизайна для специфичности является дизайн специфических bZIP -связывающих пептидов Эми Китинг и соавторов для 19 из 20 семейств bZIP; 8 из этих пептидов были специфичны для предполагаемого партнера по сравнению с конкурирующими пептидами. Кроме того, положительный и отрицательный дизайн также использовался Андерсоном и его сотрудниками для прогнозирования мутаций в активном сайте мишени лекарственного средства, которые придали устойчивость к новому лекарству; положительный дизайн использовали для поддержания активности дикого типа, тогда как отрицательный дизайн использовали для нарушения связывания лекарственного средства. Недавняя переработка вычислительной техники Костасом Маранасом и соавторами также позволила экспериментально переключить специфичность кофактора ксилозоредуктазы Candida boidinii с НАДФН на НАДН.

Поверхность протеина

Обновление поверхности протеина заключается в формировании поверхности протеина с сохранением общей складки, сердцевины и границ. области белка нетронутыми. Белковая шлифовка особенно полезна для изменения связывания белка с другими белками. Одним из наиболее важных применений обновления протеина было создание зонда RSC3 для отбора широко нейтрализующих антител к ВИЧ в Исследовательском центре вакцин NIH. Во-первых, для конструирования были отобраны остатки за пределами границы связывания между белком оболочки ВИЧ gp120 и ранее обнаруженным b12-антителом. Затем последовательность с разнесением была выбрана на основании информации об эволюции, растворимости, сходства с диким типом и других соображений. Затем программное обеспечение RosettaDesign было использовано для поиска оптимальных последовательностей в выбранном пространстве последовательностей. Позднее RSC3 был использован для обнаружения широко нейтрализующего антитела VRC01 в сыворотке долгосрочного ВИЧ-инфицированного человека, не прогрессирующего.

Дизайн глобулярных белков

Глобулярные белки - это белки, содержащие гидрофобное ядро ​​и гидрофильная поверхность. Глобулярные белки часто имеют стабильную структуру, в отличие от волокнистых белков, которые имеют множественные конформации. Трехмерную структуру глобулярных белков обычно легче определить с помощью рентгеновской кристаллографии и ядерного магнитного резонанса, чем волокнистых белков и мембранных белков, что делает глобулярные белки более привлекательны для дизайна белков, чем другие типы белков. Наиболее успешные конструкции белков включали глобулярные белки. И RSD-1, и Top7 были разработками глобулярных белков de novo. Еще пять белковых структур были разработаны, синтезированы и проверены в 2012 году группой Бейкера. Эти новые белки не выполняют никаких биотических функций, но структуры предназначены для использования в качестве строительных блоков, которые могут быть расширены для включения функциональных активных центров. Структуры были найдены компьютерным путем с использованием новой эвристики, основанной на анализе соединительных петель между частями последовательности, которые определяют вторичные структуры.

Дизайн мембранных белков

Были успешно разработаны несколько трансмембранных белков, а также со многими другими мембраносвязанными пептидами и белками. Недавно Костас Маранас и его коллеги разработали автоматизированный инструмент для изменения размера пор внешней мембраны поринового типа F (OmpF) из E.coli до любого желаемого субнометрового размера и собрали их в мембраны для выполнения точного разделения по шкале Ангстрема.

Другие применения

Одно из наиболее желательных применений для дизайна белков - это биосенсоры, белки, которые будут определять присутствие определенных соединений. Некоторые попытки создания биосенсоров включают датчики для неестественных молекул, включая TNT. Совсем недавно Кульман и его коллеги разработали биосенсор PAK1.

См. Также

Ссылки

Дополнительная литература

Последняя правка сделана 2021-06-02 08:34:27
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте