Секвенирование белков

редактировать

Использование секвенирования белков и пептидов Beckman-Spinco, 1970

Секвенирование белков - это практический процесс определения аминокислотная последовательность всего или части белка или пептида. Это может служить для идентификации белка или характеристики его посттрансляционных модификаций. Как правило, частичное секвенирование белка предоставляет достаточно информации (один или несколько тегов последовательности) для его идентификации со ссылкой на базы данных последовательностей белков, полученных в результате концептуальной трансляции генов.

Два основных прямых методами секвенирования белков являются масс-спектрометрия и деградация по Эдману с использованием секвенатора белков (секвенатор). В настоящее время методы масс-спектрометрии наиболее широко используются для секвенирования и идентификации белков, но деградация по Эдману остается ценным инструментом для характеристики N-конца.

белка. Содержание

1 Определение аминокислотного состава
- 1.1 Гидролиз
- 1.2 Разделение и количественный анализ
2 Анализ N-концевых аминокислот
3 Анализ C-концевых аминокислот
4 Деградация по Эдману
- 4.1 Расщепление до пептидных фрагментов
- 4.2 Реакция
- 4.3 Секвенатор белков
5 Идентификация с помощью масс-спектрометрии
- 5.1 Протеолитические гидролизаты
- 5.2 Секвенирование de novo
- 5.3 N- и C-концы
- 5.4 Посттрансляционные модификации
- 5.5 Определение всей массы
- 5.6 Ограничения
6 Прогнозирование по последовательностям ДНК / РНК
7 Инструменты биоинформатики
8 См. Также
9 Ссылки
10 Дополнительная литература

Определение аминокислотного состава

Это часто желательно знать неупорядоченный аминокислотный состав белка до попытки найти упорядоченную последовательность, так как эти знания можно использовать для облегчения обнаружения ошибок в процессе определения последовательности или для различения неоднозначных результатов. Знание частоты встречаемости определенных аминокислот также может быть использовано для выбора, какую протеазу использовать для переваривания белка. Также может быть определено неправильное включение низких уровней нестандартных аминокислот (например, норлейцина) в белки. Обобщенный метод, который часто называют аминокислотным анализом для определения частоты встречаемости аминокислот, заключается в следующем:

Гидролиз известного количества белка на составляющие его аминокислоты.
Разделите и определите количество аминокислот каким-либо образом.

Гидролиз

Гидролиз выполняется путем нагревания образца белка в 6 M соляной кислоте до 100–110 ° C в течение 24 часов или дольше. Белки с большим количеством объемных гидрофобных групп могут потребовать более длительных периодов нагревания. Однако эти условия настолько сильны, что некоторые аминокислоты (серин, треонин, тирозин, триптофан, глутамин и цистеин ) разлагаются. Чтобы обойти эту проблему, Biochemistry Online предлагает нагревать отдельные образцы в течение разного времени, анализировать каждый полученный раствор и экстраполировать обратно на нулевое время гидролиза. Расталл предлагает различные реагенты для предотвращения или уменьшения разложения, такие как тиол реагенты или фенол для защиты триптофана и тирозина от воздействия хлора и предварительного окисления. цистеин. Он также предлагает измерить количество выделившегося аммиака, чтобы определить степень гидролиза амида.

Разделение и количественный анализ

Аминокислоты можно разделить с помощью ионного обмена. хроматография затем дериватизировали, чтобы облегчить их обнаружение. Чаще всего аминокислоты дериватизируются, а затем разделяются с помощью ВЭЖХ с обращенной фазой.

Пример ионообменной хроматографии дается NTRC с использованием сульфированного полистирола в качестве матрицы, добавления аминокислот в кислотный раствор и прохождения буфер стабильно увеличивающегося pH через колонку. Аминокислоты элюируются, когда pH достигает их соответствующих изоэлектрических точек. После разделения аминокислот определяют их соответствующие количества, добавляя реагент, который образует окрашенное производное. Если количество аминокислот превышает 10 нмоль, для этого можно использовать нингидрин ; он дает желтый цвет при реакции с пролином и ярко-фиолетовый цвет с другими аминокислотами. Концентрация аминокислоты пропорциональна поглощению полученного раствора. При очень малых количествах, вплоть до 10 пмоль, флуоресцентные производные могут быть образованы с использованием таких реагентов, как орто-фтальдегид (OPA) или флуоресскамин.

. При дериватизации перед колонкой может использоваться реагент Эдмана для получения производная, обнаруживаемая УФ-светом. Более высокая чувствительность достигается при использовании реагента, образующего флуоресцентное производное. Дериватизированные аминокислоты подвергают обращенно-фазовой хроматографии, обычно с использованием колонки с диоксидом кремния C8 или C18 и оптимизированного градиента элюирования. Элюирующие аминокислоты обнаруживают с помощью УФ-детектора или флуоресцентного детектора, а площади пиков сравнивают с площадями для производных стандартов, чтобы количественно определить каждую аминокислоту в образце.

N-концевой аминокислотный анализ

Метод Сэнгера анализа концевых пептидных групп: A дериватизация N-концевого конца с помощью реагента Сэнгера (DNFB), B общий кислотный гидролиз динитрофенилпептида

Определение того, какая аминокислота образует N-конец цепи пептида, полезно по двум причинам: упорядочение последовательностей отдельных пептидных фрагментов в целую цепь, и потому что первый раунд деградации по Эдману часто загрязнен примесями и, следовательно, не дает точного определения N-концевой аминокислоты. Ниже приводится обобщенный метод анализа N-концевых аминокислот:

Взаимодействуйте с пептидом с реагентом, который будет селективно метить концевую аминокислоту.
Гидролизовать белок.
Определить аминокислоту. с помощью хроматографии и сравнения со стандартами.

Существует множество различных реагентов, которые можно использовать для мечения концевых аминокислот. Все они реагируют с аминогруппами и, следовательно, также будут связываться с аминогруппами в боковых цепях аминокислот, таких как лизин - по этой причине необходимо быть осторожным при интерпретации хроматограмм, чтобы убедиться, что выбрано правильное пятно. Двумя наиболее распространенными реагентами являются реагент Сенгера (1-фтор-2,4-динитробензол ) и производные дансила, такие как дансилхлорид. Фенилизотиоцианат, реагент для разложения Эдмана, также может быть использован. Здесь применяются те же вопросы, что и при определении аминокислотного состава, за исключением того, что окрашивание не требуется, поскольку реагенты производят окрашенные производные, и требуется только качественный анализ. Таким образом, аминокислоту не нужно элюировать из хроматографической колонки, а просто сравнивать со стандартом. Еще одно соображение, которое следует принять во внимание, заключается в том, что, поскольку любые аминогруппы будут реагировать с реагентом для метки, нельзя использовать ионообменную хроматографию и тонкослойную хроматографию или жидкостную хроматографию высокого давления следует использовать вместо этого.

Анализ C-концевых аминокислот

Количество доступных методов анализа C-концевых аминокислот намного меньше, чем количество доступных методов анализа N-концов. Наиболее распространенный метод - это добавление карбоксипептидаз к раствору белка, регулярный отбор образцов и определение конечной аминокислоты путем анализа графика зависимости концентраций аминокислот от времени. Этот метод будет очень полезен в случае полипептидов и N-концов, блокированных белком. С-концевое секвенирование может значительно помочь в проверке первичных структур белков, предсказанных на основе последовательностей ДНК, и для обнаружения пострансляционного процессинга генных продуктов из известных последовательностей кодонов.

деградация по Эдману

деградация по Эдману является очень важной реакцией для секвенирования белка, поскольку она позволяет обнаружить упорядоченный аминокислотный состав белка. В настоящее время широко используются автоматические секвенаторы Эдмана, которые способны секвенировать пептиды длиной примерно до 50 аминокислот. Схема реакции для секвенирования белка деградацией Эдмана следует; некоторые из шагов будут подробно описаны позже.

Разорвите любые дисульфидные мостики в белке с помощью восстанавливающего агента, такого как 2-меркаптоэтанол. защитная группа, такая как йодуксусная кислота, может быть необходима для предотвращения повторного образования связей.
Разделить и очистить отдельные цепи белкового комплекса, если они есть
Определите аминокислотный состав каждой цепи.
Определите концевые аминокислоты каждой цепи.
Разбейте каждую цепь на фрагменты, содержащие менее 50 аминокислот. long.
Разделить и очистить фрагменты.
Определить последовательность каждого фрагмента.
Повторить с другим шаблоном расщепления.
Построить последовательность

Расщепление до пептидных фрагментов

Пептиды длиной более 50-70 аминокислот не могут быть надежно секвенированы с помощью деградации по Эдману. Из-за этого длинные белковые цепи необходимо разбивать на небольшие фрагменты, которые затем можно секвенировать индивидуально. Переваривание осуществляется либо эндопептидазами, такими как трипсин или пепсин, либо химическими реагентами, такими как бромид цианогена. Различные ферменты дают разные модели расщепления, и перекрытие между фрагментами можно использовать для построения общей последовательности.

Реакция

Пептид, подлежащий секвенированию, адсорбируется на твердой поверхности. Одна распространенная подложка представляет собой стекловолокно, покрытое полибреном, катионным полимером. Реагент Эдмана, фенилизотиоцианат (PITC), добавляют к адсорбированному пептиду вместе со слабощелочным буферным раствором 12% триметиламина. Он реагирует с аминогруппой N-концевой аминокислоты.

Конечная аминокислота затем может быть избирательно отделена путем добавления безводной кислоты. Затем производное изомеризуется с образованием замещенного, которое можно смыть и идентифицировать с помощью хроматографии, и цикл можно повторить. Эффективность каждого этапа составляет около 98%, что позволяет надежно определить около 50 аминокислот.

Аппарат для секвенирования белков Beckman-Coulter Porton LF3000G

Секвенатор протеинов

A секвенатор протеинов - это аппарат, который выполняет деградацию по Эдману в автоматическом режиме. Образец белка или пептида иммобилизуют в реакционном сосуде секвенатора белка и проводят деградацию по Эдману. Каждый цикл высвобождает и дериватизирует одну аминокислоту с N-конца белка или пептида, а затем высвобожденное производное аминокислоты идентифицируется с помощью ВЭЖХ. Процесс секвенирования повторяется для всего полипептида до тех пор, пока не будет установлена вся измеряемая последовательность, или в течение заранее определенного количества циклов.

Идентификация с помощью масс-спектрометрии

Идентификация белка - это процесс присвоения имени интересующему белку (POI) на основе его аминокислотной последовательности. Обычно только часть последовательности белка необходимо определить экспериментально, чтобы идентифицировать белок со ссылкой на базы данных последовательностей белков, выведенных из последовательностей ДНК их генов. Дальнейшая характеристика белка может включать подтверждение фактических N- и C-концов POI, определение вариантов последовательности и идентификацию любых присутствующих посттрансляционных модификаций.

Протеолитические расщепления

Описана общая схема идентификации белка.

POI выделяют, обычно с помощью SDS-PAGE или хроматографии.
Выделенный POI может быть химически модифицирован для стабилизации остатков цистеина (например, S-амидометилирование или S-карбоксиметилирование).
POI расщепляется специфической протеазой с образованием пептидов. Трипсин, который избирательно расщепляет C-концевую сторону остатков лизина или аргинина, является наиболее часто используемой протеазой. Его преимущества включают i) частоту остатков Lys и Arg в белках, ii) высокую специфичность фермента, iii) стабильность фермента и iv) пригодность триптических пептидов для масс-спектрометрии.
пептиды можно обессолить для удаления ионизируемых примесей и подвергнуть MALDI-TOF масс-спектрометрии. Прямое измерение масс пептидов может предоставить достаточную информацию для идентификации белка (см. Фингерпринт массы пептидов ), но дальнейшая фрагментация пептидов внутри масс-спектрометра часто используется для получения информации о последовательностях пептидов. Альтернативно, пептиды можно обессолить и разделить с помощью ВЭЖХ с обращенной фазой и ввести в масс-спектрометр через источник ESI. LC-ESI-MS может предоставить больше информации, чем MALDI-MS для идентификации белков, но требует больше времени прибора.
В зависимости от типа масс-спектрометра, фрагментация пептидных ионов может происходить с помощью различных механизмов, таких как Диссоциация, вызванная столкновением (CID) или Распад после источника (PSD). В каждом случае структура фрагментных ионов пептида предоставляет информацию о его последовательности.
Информация, включая измеренную массу предполагаемых ионов пептида и массы их ионов-фрагментов, затем сопоставляется с расчетными значениями массы из концептуальных (in-silico) протеолиз и фрагментация баз данных белковых последовательностей. Успешное совпадение будет найдено, если его оценка превышает пороговое значение, определенное параметрами анализа. Даже если фактический белок не представлен в базе данных, устойчивое к ошибкам сопоставление позволяет предполагаемую идентификацию белка на основе сходства с гомологичными белками. Для выполнения этого анализа доступны различные программные пакеты.
Программные пакеты обычно генерируют отчет, показывающий идентичность (код доступа) каждого идентифицированного белка, его оценку соответствия и предоставляют меру относительной силы сопоставление, когда идентифицировано несколько белков.
Диаграмма сопоставленных пептидов в последовательности идентифицированного белка часто используется для демонстрации охвата последовательности (% белка, обнаруженного как пептиды). Если считается, что POI значительно меньше, чем соответствующий белок, диаграмма может предложить, является ли POI N- или C-концевым фрагментом идентифицированного белка.

De novo секвенирование

Образец последовательности фрагментация пептида позволяет напрямую определять его последовательность с помощью секвенирования de novo. Эта последовательность может использоваться для сопоставления баз данных последовательностей белков или для исследования посттрансляционных или химических модификаций. Это может предоставить дополнительные доказательства для идентификации белков, выполненной, как указано выше.

N- и C-концы

Пептиды, сопоставленные во время идентификации белка, не обязательно включают N- или C-концы, предсказанные для сопоставленного белка. Это может быть результатом того, что N- или C-концевые пептиды трудно идентифицировать с помощью MS (например, они слишком короткие или слишком длинные), посттрансляционно модифицированы (например, N-концевое ацетилирование) или действительно отличаются от предсказанных. Посттрансляционные модификации или усеченные концы могут быть идентифицированы путем более тщательного изучения данных (т.е. секвенирования de novo). Также может быть полезно повторное расщепление с использованием протеазы различной специфичности.

Посттрансляционные модификации

Хотя для определения посттрансляционных модификаций можно использовать подробное сравнение данных MS с прогнозами, основанными на известной последовательности белка, могут также использоваться целевые подходы к сбору данных. Например, специфическое обогащение фосфопептидами может помочь в идентификации сайтов фосфорилирования в белке. Альтернативные методы фрагментации пептидов в масс-спектрометре, такие как ETD или ECD, могут дать информацию о комплементарной последовательности.

Определение общей массы

Полная масса белка - это сумма масс его аминокислотных остатков плюс масса молекулы воды с поправкой на любые посттрансляционные модификации. Хотя белки ионизируются хуже, чем пептиды, полученные из них, белок в растворе может быть подвергнут ESI-MS и его масса измерена с точностью до 1 части из 20 000 или лучше. Этого часто бывает достаточно, чтобы подтвердить концы (таким образом, что измеренная масса белка совпадает с предсказанной по его последовательности) и сделать вывод о наличии или отсутствии многих посттрансляционных модификаций.

Ограничения

Протеолиз не всегда дает набор легко анализируемых пептидов, покрывающих всю последовательность POI. При фрагментации пептидов в масс-спектрометре часто не образуются ионы, соответствующие расщеплению каждой пептидной связи. Таким образом, выведенная последовательность для каждого пептида не обязательно является полной. Стандартные методы фрагментации не различают остатки лейцина и изолейцина, поскольку они изомерные.

Поскольку деградация по Эдману происходит от N-конца белка, это не сработает, если N-конец был химически модифицирован (например, путем ацетилирования или образования пироглутаминовой кислоты). Деградация по Эдману обычно не используется для определения положения дисульфидных мостиков. Также требуется количество пептида 1 пикомоль или выше для различимых результатов, что делает его менее чувствительным, чем масс-спектрометрия.

Прогнозирование на основе последовательностей ДНК / РНК

В биологии белки производятся посредством трансляции информационной РНК (мРНК) с белковой последовательностью, происходящей из последовательности кодонов в мРНК. Сама мРНК образуется в результате транскрипции генов и может быть дополнительно модифицирована. Эти процессы достаточно изучены, чтобы использовать компьютерные алгоритмы для автоматизации предсказаний последовательностей белков на основе последовательностей ДНК, например, из проектов секвенирования ДНК всего генома, и привели к созданию больших баз данных последовательностей белков, таких как UniProt. Предсказанные белковые последовательности являются важным ресурсом для идентификации белков с помощью масс-спектрометрии.

Исторически короткие последовательности белка (от 10 до 15 остатков), определенные деградацией по Эдману, были обратно транслированы в последовательности ДНК, которые можно было использовать в качестве зондов или праймеров для выделения молекулярных клонов соответствующего гена. или комплементарная ДНК. Затем определяли последовательность клонированной ДНК и использовали ее для определения полной аминокислотной последовательности белка.

Инструменты биоинформатики

Инструменты биоинформатики существуют для помощи в интерпретации масс-спектров (см. секвенирование пептидов De novo ), для сравнения или анализа последовательностей белков (см. Последовательность анализ ) или поиск в базах данных с использованием пептидных или белковых последовательностей (см. BLAST ).

См. Также

Ссылки

Дополнительная литература