Банк данных по белкам

редактировать
Международная база данных с открытым доступом по большим биологическим молекулам
Банк данных по белкам
Wwpdb-logo.png
Содержание
Описание
Контакт
Первичное цитированиеPMID 30357364
Доступ
Формат данных mmCIF, PDB
Веб-сайт

Банк данных белков (PDB ) - это база данных для трехмерных структурных данных больших биологических молекул, таких как белки и нуклеиновые кислоты. Данные, обычно получаемые с помощью рентгеновской кристаллографии, ЯМР-спектроскопии или, все чаще, криоэлектронной микроскопии и представляемые биологами и биохимики со всего мира, свободно доступны в Интернете через веб-сайты входящих в него организаций (PDBe, PDBj, RCSB и BMRB). PDB контролируется организацией под названием Worldwide Protein Data Bank, wwPDB.

PDB является ключом в областях структурной биологии, таких как структурная геномика. Большинство крупных научных журналов и некоторые финансирующие агентства теперь требуют от ученых предоставлять свои структурные данные в PDB. Многие другие базы данных используют белковые структуры, депонированные в PDB. Например, SCOP и CATH классифицируют белковые структуры, а PDBsum обеспечивает графический обзор записей PDB с использованием информации из других источников, таких как Онтология генов..

Содержание

  • 1 История
  • 2 Содержание
  • 3 Формат файла
  • 4 Просмотр данных
  • 5 См. Также
  • 6 Ссылки
  • 7 Внешние ссылки

История

Две силы сошлись, чтобы инициировать PDB: небольшой, но растущий набор наборов данных о структуре белка, определенных с помощью дифракции рентгеновских лучей; и недавно доступный (1968) дисплей молекулярной графики, (BRAD), для визуализации этих белковых структур в 3-D. В 1969 году, при спонсорской поддержке Уолтера Гамильтона из Брукхейвенской национальной лаборатории, Эдгар Мейер (Техасский университет AM ) начал писать программное обеспечение для хранения файлов с атомными координатами в общем формате. доступны для геометрической и графической оценки. К 1971 году одна из программ Мейера, SEARCH, позволила исследователям получать удаленный доступ к информации из базы данных для изучения белковых структур в автономном режиме. ПОИСК сыграл важную роль в создании сетей, тем самым положив начало функциональному началу PDB.

Банк данных по белкам был объявлен в октябре 1971 года в Nature New Biology как совместное предприятие Кембриджского центра структурных данных, Великобритания, и Брукхейвенской национальной лаборатории, США.

После смерти Гамильтона в 1973 году Том Кезтл взял на себя руководство PDB в течение следующих 20 лет. В январе 1994 года Джоэл Суссман из Института науки Вейцмана Израиля был назначен главой PDB. В октябре 1998 года PDB был передан Исследовательскому сотрудничеству в области структурной биоинформатики (RCSB); перевод был завершен в июне 1999 года. Новым директором была Хелен М. Берман из Университета Рутгерса (одно из управляющих учреждений RCSB, другое - Сан-Диего Суперкомпьютерный центр в Калифорнийский университет в Сан-Диего ). В 2003 году, с образованием wwPDB, PDB стала международной организацией. Членами-основателями являются PDBe (Европа), RCSB (США) и PDBj (Япония). BMRB присоединился в 2006 году. Каждый из четырех членов wwPDB может действовать как центры размещения, обработки и распространения данных PDB. Под обработкой данных понимается тот факт, что персонал wwPDB просматривает и аннотирует каждую поданную заявку. Затем данные автоматически проверяются на достоверность (исходный код этого программного обеспечения для валидации был предоставлен общественности бесплатно).

Содержание

Примеры структур белка из PDB (созданного с помощью UCSF Chimera) Скорость определения структуры белка по методу и году.

База данных PDB обновляется еженедельно (UTC +0 среда) вместе со своим списком владений. По состоянию на 1 апреля 2020 года PDB включала:

Экспериментальный. МетодБелки Нуклеиновые кислоты Комплексы белок / нуклеиновая кислота.ПрочиеВсего
Дифракция рентгеновских лучей 135170209769454144216
ЯМР 113371325264812934
Электронная микроскопия 347535113604646
Гибрид155531164
Другое2864613309
Итого :1504233466835426162269
134 146 структур в PDB имеют структурный фактор .
10 289 структур имеют файл ограничения ЯМР.
4814 структур в PDB имеют файл химических сдвигов.
4718 структур в PDB имеет файл карты 3DEM, депонированный в банке данных EM

Большинство структур определяется с помощью дифракции рентгеновских лучей, но около 10% структур определяются с помощью ЯМР белка. При использовании дифракции рентгеновских лучей получают приближения координат атомов белка, тогда как с помощью ЯМР оценивается расстояние между парами атомов белка. Окончательную конформацию белка получают с помощью ЯМР путем решения задачи геометрии расстояния. Некоторые белки определяют с помощью криоэлектронной микроскопии. При щелчке по числам в связанной внешней таблице отображаются примеры структур, определенных этим методом.

Для структур PDB, определенных с помощью дифракции рентгеновских лучей, которые имеют файл структурных факторов, можно просмотреть их карту электронной плотности. Данные таких структур хранятся на «сервере электронной плотности».

Исторически количество структур в PDB росло примерно экспоненциально: 100 зарегистрированных структур в 1982 г., 1000 структур в 1993 г. 10 000 в 1999 г. и 100 000 в 2014. С 2007 г. скорость накопления новых белковых структур, похоже, стабилизировалась.

Формат файла

Формат файла, изначально используемый PDB, назывался Формат файла PDB. Исходный формат был ограничен шириной компьютерных перфокарт до 80 символов в строке. Примерно в 1996 году был введен в действие формат «файла макромолекулярной кристаллографической информации», mmCIF, который является расширением формата CIF. MmCIF стал стандартным форматом для архива PDB в 2014 году. В 2019 году wwPDB объявила что осаждения для кристаллографических методов будут приниматься только в формате mmCIF.

Версия PDB XML, называемая PDBML, была описана в 2005 году. Файлы структуры можно загрузить в любом из этих трех форматы, хотя все большее количество структур не подходят для устаревшего формата PDB. Отдельные файлы легко загружаются в графические пакеты из Интернета URL-адреса :

  • Для файлов формата PDB используйте, например, http://www.pdb.org/pdb/files/4hhb.pdb.gzили http://pdbe.org/download/4hhb
  • Для файлов PDBML (XML) используйте, например, http://www.pdb.org/pdb/files/4hhb.xml.gzили http://pdbe.org/pdbml/4hhb

«4hhb» - это идентификатор PDB. Каждая структура, опубликованная в PDB, получает четырехзначный буквенно-цифровой идентификатор, свой PDB ID. (Это не уникальный идентификатор для биомолекул, потому что несколько структур для одной и той же молекулы - в разных средах или конформациях - могут содержаться в PDB с разными идентификаторами PDB.)

Просмотр данных

Файлы структуры можно просмотреть с помощью одной из нескольких бесплатных компьютерных программ с открытым исходным кодом, включая Jmol, Pymol, VMD и Расмол. Другие платные, условно-бесплатные программы включают ICM-Browser, MDL Chime, UCSF Chimera, Swiss-PDB Viewer, StarBiochem (интерактивный молекулярный просмотрщик на основе Java. со встроенным поиском в банке данных белков), Sirius и VisProt3DS (инструмент для визуализации белков в трехмерном стереоскопическом представлении в анаглите и других режимах) и Discovery Studio. Веб-сайт RCSB PDB содержит обширный список как бесплатных, так и коммерческих программ визуализации молекул и плагинов для веб-браузеров.

См. Также

Ссылки

Внешние ссылки

Викиданные имеют свойство:
Последняя правка сделана 2021-06-02 08:33:57
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте