Первичная структура белка

редактировать
Линейная последовательность аминокислот в пептиде или белке Изображение выше содержит интерактивные ссылки Интерактивная диаграмма структуры белка с использованием PCNA в качестве примера. (PDB : 1AXC ​)

Первичная структура белка представляет собой линейную последовательность аминокислот в пептиде или белок. По соглашению, первичная структура белка указывается, начиная с амино -конца (N) до карбоксильного -конца (C) конец. Биосинтез белка чаще всего осуществляется рибосомами в клетках. Пептиды также могут быть синтезированы в лаборатории. Первичные структуры белков могут быть непосредственно секвенированы или выведено из последовательностей ДНК.

Содержание
  • 1 Образование
    • 1.1 Биологическое
    • 1.2 Химическое
  • 2 Обозначение
  • 3 Модификация
    • 3.1 Изомеризация
    • 3.2 Посттрансляционная модификация
    • 3.3 Расщепление и лигирование
  • 4 История
  • 5 Первичная структура в других молекулах
  • 6 Отношение к вторичной и третичной структуре
  • 7 См. Также
  • 8 Примечания и ссылки
Образование

Биологические

Аминокислоты полимеризуются через пептидные связи с образованием длинный остов с выступающими вдоль него боковыми цепями различных аминокислот. В биологических системах белки продуцируются во время трансляции рибосомами клетки. Некоторые организмы могут также производить короткие пептиды посредством синтеза нерибосомных пептидов, которые часто используют аминокислоты, отличные от стандартных 20, и могут быть циклизованы, модифицированы и сшиты.

Химический

Пептиды можно синтезировать химическим с помощью ряда лабораторных методов. Химические методы обычно синтезируют пептиды в порядке, обратном (начиная с C-конца) биологическому синтезу белка (начиная с N-конца).

Обозначение

Последовательность белка обычно обозначается строкой букв, в которой перечислены аминокислоты, начиная с амино -концевого конца и заканчивая карбоксилом -терминальный конец. Можно использовать трехбуквенный или однобуквенный код для обозначения 20 встречающихся в природе аминокислот, а также смесей или неоднозначных аминокислот (аналогично нотации нуклеиновых кислот ).

Пептиды могут быть непосредственно секвенированы, или выведено из последовательностей ДНК. В настоящее время существуют большие базы данных последовательностей, которые сопоставляют известные белковые последовательности.

Нотация 20 природных аминокислот
Аминокислота3 буквы1 буква
аланин AlaA
аргинин ArgR
аспарагин AsnN
аспарагиновая кислота AspD
цистеин CysC
глутаминовая кислота GluE
глутамин GlnQ
глицин GlyG
гистидин HisH
изолейцин IleI
лейцин LeuL
Lysine LysK
Methionine MetM
Phenylalanine PheF
Proline ProP
Serine SerS
Threonine ThrT
Триптофан TrpW
Тирозин TyrY
Валин ValV
Неоднозначное обозначение аминокислот
СимволОписаниеОстатки р Представлено
XЛюбая аминокислота или неизвестнаяВсе
BАспартат или аспарагинD, N
ZГлутамат или глутаминE, Q
JЛейцин или изолейцинI, L
ΦГидрофобный V, I, L, F, W, M
ΩАроматический F, W, Y, H
ΨАлифатический V, I, L, M
πМаленькийP, G, A, S
ζГидрофильный S, T, H, N, Q, E, D, K, R, Y
+Положительно заряженный K, R, H
-Отрицательно заряженный D, E
Модификация

Как правило, полипептиды представляют собой неразветвленные полимеры, поэтому их первичная структура часто может быть заданные последовательностью аминокислот вдоль их основной цепи. Однако белки могут стать сшитыми, чаще всего с помощью дисульфидных связей, и первичная структура также требует указания сшивающих атомов, например, указания цистеинов, участвующих в дисульфиде белка. облигации. Другие поперечные связи включают десмозин.

изомеризацию

. Хиральные центры полипептидной цепи могут подвергаться рацемизации. Хотя это не меняет последовательность, это влияет на химические свойства последовательности. В частности, L -аминокислоты, обычно присутствующие в белках, могут спонтанно изомеризоваться по атому C α {\ displaystyle \ mathrm {C ^ {\ alpha}}}\ mathrm {C ^ {\ alpha}} в образуют D -аминокислоты, которые не могут расщепляться большинством протеаз. Кроме того, пролин может образовывать стабильные транс-изомеры по пептидной связи.

Посттрансляционная модификация

Наконец, белок может претерпевать множество посттрансляционных модификаций, которые кратко описаны здесь.

N-концевая аминогруппа полипептида может быть модифицирована ковалентно, например,

Фиг. 1 N-концевое ацетилирование
  • ацетилирование - C (= O) - CH 3 {\ displaystyle \ mathrm {-C (= O) -CH_ {3}}}{\ mathrm {-C (= O) -CH _ {{3}}}}
положительный заряд на N-концевой аминогруппе можно устранить, заменив ее ацетильной группой (N-концевое блокирование).
  • формилирование - C (= O) H {\ displaystyle \ mathrm {- C (= O) H}}{\ mathrm {-C (= O) H}}
N-конец метионина, обычно обнаруживаемый после трансляции, имеет N-конец, заблокированный формильной группой. Эта формильная группа (а иногда и сам остаток метионина, если за ним следует Gly или Ser) удаляется ферментом.
  • пироглутамат
Рис. 2 Образование пироглутамата из N-концевого глутамина
N-концевой глутамин может атаковать сам себя, образуя циклическую пироглутаматную группу.
  • миристоилирование - C (= O) - (CH 2) 12 - CH 3 {\ displaystyle \ mathrm {-C (= O) - \ left (CH_ {2} \ right) _ {12} -CH_ {3}}}{\ mathrm {-C (= O) - \ left (CH _ {{2}} \ right) _ {{12}} - CH _ {{ 3}}}}
Аналогично ацетилированию. Вместо простой метильной группы миристоильная группа имеет хвост из 14 гидрофобных атомов углерода, что делает ее идеальной для закрепления белков на клеточных мембранах.

С-концевая карбоксилатная группа полипептида также может быть модифицирована, например,

Рис. 3 С-концевое амидирование
  • аминирование (см. Рисунок)
С-конец также может быть заблокирован (таким образом, нейтрализуя его отрицательный заряд) аминированием.
  • Присоединение гликозилфосфатидилинозитола (GPI)
Гликозилфосфатидилинозит (GPI) представляет собой большую гидрофобную фосфолипидную простетическую группу, которая прикрепляет белки к клеточным мембранам. Он присоединяется к С-концу полипептида через амидную связь, которая затем соединяется с этаноламином, затем с различными сахарами и, наконец, с липидным фрагментом фосфатидилинозита.

Наконец, пептид боковые цепи также могут быть модифицированы ковалентно, например,

  • фосфорилирование
Помимо расщепления, фосфорилирование, возможно, является наиболее важной химической модификацией белков. Фосфатная группа может быть присоединена к гидроксильной группе боковой цепи остатков серина, треонина и тирозина, добавляя отрицательный заряд на этом участке и производя неприродную аминокислоту. Такие реакции катализируются киназами, а обратная реакция катализируется фосфатазами. Фосфорилированные тирозины часто используются в качестве «ручек», с помощью которых белки могут связываться друг с другом, тогда как фосфорилирование Ser / Thr часто вызывает конформационные изменения, предположительно из-за введенного отрицательного заряда. Эффекты фосфорилирования Ser / Thr иногда можно моделировать путем мутации остатка Ser / Thr в глутамат.
Универсальное название для набора очень распространенных и очень гетерогенных химических модификаций. Фрагменты сахара могут быть присоединены к гидроксильным группам боковой цепи Ser / Thr или к амидным группам боковой цепи Asn. Такие присоединения могут выполнять множество функций, от увеличения растворимости до сложного распознавания. Все гликозилирование может быть заблокировано определенными ингибиторами, такими как дезамидирование Туникамицина (образование сукцинимида)
В этой модификации боковая цепь аспарагина или аспартата атакует следующую пептидную связь, образуя симметричный промежуточный сукцинимид. Гидролиз промежуточного продукта дает либо аспартат, либо β-аминокислоту изо (Asp). Для аспарагина любой продукт приводит к потере амидной группы, следовательно, к «дезамидированию».
Остатки пролина могут быть гидроксилатами по любому из двух атомов, как и лизин (по одному атому). Гидроксипролин является критическим компонентом коллагена, который становится нестабильным при его потере. Реакция гидроксилирования катализируется ферментом, которому требуется аскорбиновая кислота (витамин C), дефицит которого приводит к многим заболеваниям соединительной ткани, таким как цинга.
Некоторые белковые остатки могут метилироваться, особенно положительные группы лизина и аргинина. Остатки аргинина взаимодействуют с фосфатным остовом нуклеиновой кислоты и обычно образуют водородные связи с остатками оснований, особенно с гуанином, в комплексах белок-ДНК. Остатки лизина могут быть метилированы отдельно, дважды и даже трижды. Однако метилирование не изменяет положительный заряд на боковой цепи.
Ацетилирование аминогрупп лизина химически аналогично ацетилированию N-конца. Однако функционально ацетилирование остатков лизина используется для регулирования связывания белков с нуклеиновыми кислотами. Отмена положительного заряда лизина ослабляет электростатическое притяжение (отрицательно заряженных) нуклеиновых кислот.
  • сульфатирование
Тирозины могут сульфатироваться на их O η {\ displaystyle \ mathrm {O ^ {\ eta}}}{\ mathrm {O ^ {{\ eta}}}} атом. Несколько необычно, что эта модификация происходит в аппарате Гольджи, а не в эндоплазматическом ретикулуме. Подобно фосфорилированным тирозинам, сульфатированные тирозины используются для специфического распознавания, например, в рецепторах хемокинов на поверхности клетки. Как и при фосфорилировании, сульфатирование добавляет отрицательный заряд к ранее нейтральному сайту.
  • пренилирование и пальмитоилирование- C (= O) - (CH 2) 14 - CH 3 {\ displaystyle \ mathrm {-C (= O) - \ left (CH_ {2} \ right) _ {14} -CH_ {3}}}{\ mathrm {-C (= O) - \ left (CH _ {{2}} \ right) _ {{14}} - CH _ {{ 3}}}}
Гидрофобный изопрен (например, фарнезил, геранил и геранилгеранил группы) и пальмитоильные группы могут быть добавлены к атому S γ {\ displaystyle \ mathrm {S ^ {\ gamma}}}{\ mathrm {S ^ {\ gamma}}}} остатков цистеина для закрепления белков на клеточных мембранах. В отличие от GPI и миритоильных якорей, эти группы не обязательно добавляются на концах.
  • карбоксилирование
Относительно редкая модификация, которая добавляет дополнительную карбоксилатную группу (и, следовательно, двойной отрицательный заряд) к глутаматной боковой цепи, образуя остаток Gla. Это используется для усиления связывания с ионами «твердых» металлов, такими как кальций.
  • АДФ-рибозилирование
Большая АДФ-рибозильная группа может переноситься на несколько типов боковых цепей в белках с гетерогенными эффектами. Эта модификация является мишенью для мощных токсинов разрозненных бактерий, например, Vibrio cholerae, Corynebacterium diphtheriae и Bordetella pertussis.
Различные полноразмерные, свернутые белки могут быть присоединены на своих С-концах к аммониевым группам боковой цепи лизинов других белков. Убиквитин является наиболее распространенным из них и обычно сигнализирует о том, что белок, меченный убиквитином, должен быть разрушен.

Большинство модификаций полипептидов, перечисленных выше, происходят посттрансляционно, то есть после того, как белок был синтезирован на рибосоме, обычно встречающейся в эндоплазматическом ретикулуме, субклеточной органелле эукариотической клетки.

Многие другие химические реакции (например, цианилирование) были применены к белкам химиками, хотя они не обнаружены в биологических системах.

Расщепление и лигирование

Помимо перечисленных выше, наиболее важной модификацией первичной структуры является расщепление пептида (химическим гидролизом или протеазы ). Белки часто синтезируются в неактивной форме-предшественнике; как правило, N-концевой или C-концевой сегмент блокирует активный сайт белка, ингибируя его функцию. Белок активируется отщеплением ингибирующего пептида.

Некоторые белки даже способны расщепляться. Как правило, гидроксильная группа серина (редко треонина) или тиольная группа остатка цистеина атакуют карбонильный углерод предыдущей пептидной связи, образуя тетраэдрически связанный промежуточный продукт [классифицируемый как гидроксиоксазолидин (Ser / Thr) или гидрокситиазолидин ( Cys) промежуточный]. Этот промежуточный продукт имеет тенденцию превращаться в амидную форму, вытесняя атакующую группу, поскольку амидной форме обычно способствует свободная энергия (предположительно из-за сильной резонансной стабилизации пептидной группы). Однако дополнительные молекулярные взаимодействия могут сделать амидную форму менее стабильной; вместо этого удаляется аминогруппа, что приводит к образованию сложноэфирной (Ser / Thr) или тиоэфирной (Cys) связи вместо пептидной связи. Эта химическая реакция называется.

Связь сложный эфир / тиоэфир может быть разделена несколькими способами:

  • Простой гидролиз расщепляет полипептидную цепь, где смещенная аминогруппа становится новым N-концом. Это видно по созреванию гликозиласпарагиназы.
  • Реакция β-элиминирования также расщепляет цепь, но приводит к образованию пирувоильной группы на новом N-конце. Эта пирувоильная группа может использоваться в качестве ковалентно присоединенного каталитического кофактора в некоторых ферментах, особенно декарбоксилазах, таких как S-аденозилметиониндекарбоксилаза (SAMDC), которые используют электроноакцепторную способность пирувоильной группы.
  • Внутримолекулярная переэтерификация с образованием разветвленного полипептида. В интеинах новая сложноэфирная связь разрывается внутримолекулярной атакой аспарагина, который вскоре станет С-концевым.
  • Межмолекулярная переэтерификация может переносить целый сегмент от одного полипептида к другому, как видно на примере автопроцессинга белков Hedgehog.
История

Предположение, что белки представляют собой линейные цепи α-аминокислот, было сделано почти одновременно двумя учеными на той же конференции в 1902 году, 74-м заседании Общество немецких ученых и врачей, проходившее в Карловых Варах. Франц Хофмайстер сделал предложение утром, основываясь на своих наблюдениях за реакцией биурета в белках. Через несколько часов за Хофмайстером последовал Эмиль Фишер, который накопил множество химических деталей, подтверждающих модель пептидной связи. Для полноты предположение, что белки содержат амидные связи, было сделано еще в 1882 г. французским химиком Э. Гримо.

Несмотря на эти данные и более поздние доказательства того, что протеолитически расщепленные белки давали только олигопептиды, идея о том, что белки были линейными, неразветвленные полимеры аминокислот не сразу приняли. Некоторые уважаемые ученые, такие как Уильям Эстбери сомневались, что ковалентные связи были достаточно прочными, чтобы удерживать вместе такие длинные молекулы; они опасались, что тепловое возбуждение может расколоть такие длинные молекулы. Герман Штаудингер столкнулся с аналогичными предрассудками в 1920-х годах, когда он утверждал, что каучук состоит из макромолекул.

Таким образом, возникло несколько альтернативных гипотез. Гипотеза коллоидного белка утверждала, что белки представляют собой коллоидные сборки более мелких молекул. Эта гипотеза была опровергнута в 1920-х годах измерениями ультрацентрифугирования, проведенными Теодором Сведбергом, которые показали, что белки имеют четко определенную воспроизводимую молекулярную массу, и с помощью электрофоретических измерений, проведенных Арне Тизелиус, которые показали, что белки были одиночные молекулы. Вторая гипотеза, гипотеза циклола, выдвинутая Дороти Ринч, предполагала, что линейный полипептид претерпел химическую циклоловую перегруппировку C = O + HN → { \ displaystyle \ rightarrow}\ rightarrow C (OH) -N, который сшивает свои амидные группы основной цепи, образуя двумерную ткань. Другие первичные структуры белков были предложены различными исследователями, такими как модель дикетопиперазина Эмиля Абдерхалдена и пиррол / пиперидиновая модель Троенсегаарда в 1942 году. учитывая большое доверие, эти альтернативные модели были окончательно опровергнуты, когда Фредерик Сэнгер успешно секвенировал инсулин и кристаллографическим определением миоглобина и гемоглобина Максом Перуцем и Джон Кендрю.

Первичная структура в других молекулах

Можно сказать, что любой гетерополимер с линейной цепью имеет «первичную структуру» по аналогии с использованием термина для белков, но это использование редко по сравнению с чрезвычайно распространенное использование по отношению к белкам. В РНК, которая также имеет обширную вторичную структуру, линейная цепь оснований обычно называется просто «последовательностью», как в ДНК (которая обычно образует линейную двойную спираль с небольшой вторичной структурой). Другие биологические полимеры, такие как полисахариды, также могут считаться имеющими первичную структуру, хотя их использование не является стандартным.

Связь со вторичной и третичной структурой

Первичная структура биологического полимера в значительной степени определяет трехмерную форму (третичная структура ). Последовательность белка может использоваться для прогнозирования локальных особенностей, таких как сегменты вторичной структуры или трансмембранные области. Однако сложность сворачивания белка в настоящее время не позволяет предсказывать третичную структуру белка только по его последовательности. Знание структуры подобной гомологичной последовательности (например, члена того же семейства белков ) позволяет с высокой точностью предсказывать третичную структуру по гомологии моделирование. Если доступна полноразмерная белковая последовательность, можно оценить ее общие биофизические свойства, такие как его изоэлектрическая точка.

Семейства последовательностей часто определяются с помощью кластеризации последовательностей и проекты структурной геномики направлены на создание набора репрезентативных структур для покрытия пространства последовательностей возможных неизбыточных последовательностей.

См. Также
Примечания и ссылки
Последняя правка сделана 2021-06-02 08:34:55
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте