![]() | |
---|---|
Содержание | |
Описание | |
Контакт | |
Первичное цитирование | PMID 30357364 |
Доступ | |
Формат данных | mmCIF, PDB |
Веб-сайт |
Банк данных белков (PDB ) - это база данных для трехмерных структурных данных больших биологических молекул, таких как белки и нуклеиновые кислоты. Данные, обычно получаемые с помощью рентгеновской кристаллографии, ЯМР-спектроскопии или, все чаще, криоэлектронной микроскопии и представляемые биологами и биохимики со всего мира, свободно доступны в Интернете через веб-сайты входящих в него организаций (PDBe, PDBj, RCSB и BMRB). PDB контролируется организацией под названием Worldwide Protein Data Bank, wwPDB.
PDB является ключом в областях структурной биологии, таких как структурная геномика. Большинство крупных научных журналов и некоторые финансирующие агентства теперь требуют от ученых предоставлять свои структурные данные в PDB. Многие другие базы данных используют белковые структуры, депонированные в PDB. Например, SCOP и CATH классифицируют белковые структуры, а PDBsum обеспечивает графический обзор записей PDB с использованием информации из других источников, таких как Онтология генов..
Две силы сошлись, чтобы инициировать PDB: небольшой, но растущий набор наборов данных о структуре белка, определенных с помощью дифракции рентгеновских лучей; и недавно доступный (1968) дисплей молекулярной графики, (BRAD), для визуализации этих белковых структур в 3-D. В 1969 году, при спонсорской поддержке Уолтера Гамильтона из Брукхейвенской национальной лаборатории, Эдгар Мейер (Техасский университет AM ) начал писать программное обеспечение для хранения файлов с атомными координатами в общем формате. доступны для геометрической и графической оценки. К 1971 году одна из программ Мейера, SEARCH, позволила исследователям получать удаленный доступ к информации из базы данных для изучения белковых структур в автономном режиме. ПОИСК сыграл важную роль в создании сетей, тем самым положив начало функциональному началу PDB.
Банк данных по белкам был объявлен в октябре 1971 года в Nature New Biology как совместное предприятие Кембриджского центра структурных данных, Великобритания, и Брукхейвенской национальной лаборатории, США.
После смерти Гамильтона в 1973 году Том Кезтл взял на себя руководство PDB в течение следующих 20 лет. В январе 1994 года Джоэл Суссман из Института науки Вейцмана Израиля был назначен главой PDB. В октябре 1998 года PDB был передан Исследовательскому сотрудничеству в области структурной биоинформатики (RCSB); перевод был завершен в июне 1999 года. Новым директором была Хелен М. Берман из Университета Рутгерса (одно из управляющих учреждений RCSB, другое - Сан-Диего Суперкомпьютерный центр в Калифорнийский университет в Сан-Диего ). В 2003 году, с образованием wwPDB, PDB стала международной организацией. Членами-основателями являются PDBe (Европа), RCSB (США) и PDBj (Япония). BMRB присоединился в 2006 году. Каждый из четырех членов wwPDB может действовать как центры размещения, обработки и распространения данных PDB. Под обработкой данных понимается тот факт, что персонал wwPDB просматривает и аннотирует каждую поданную заявку. Затем данные автоматически проверяются на достоверность (исходный код этого программного обеспечения для валидации был предоставлен общественности бесплатно).
База данных PDB обновляется еженедельно (UTC +0 среда) вместе со своим списком владений. По состоянию на 1 апреля 2020 года PDB включала:
Экспериментальный. Метод | Белки | Нуклеиновые кислоты | Комплексы белок / нуклеиновая кислота. | Прочие | Всего |
---|---|---|---|---|---|
Дифракция рентгеновских лучей | 135170 | 2097 | 6945 | 4 | 144216 |
ЯМР | 11337 | 1325 | 264 | 8 | 12934 |
Электронная микроскопия | 3475 | 35 | 1136 | 0 | 4646 |
Гибрид | 155 | 5 | 3 | 1 | 164 |
Другое | 286 | 4 | 6 | 13 | 309 |
Итого : | 150423 | 3466 | 8354 | 26 | 162269 |
Большинство структур определяется с помощью дифракции рентгеновских лучей, но около 10% структур определяются с помощью ЯМР белка. При использовании дифракции рентгеновских лучей получают приближения координат атомов белка, тогда как с помощью ЯМР оценивается расстояние между парами атомов белка. Окончательную конформацию белка получают с помощью ЯМР путем решения задачи геометрии расстояния. Некоторые белки определяют с помощью криоэлектронной микроскопии. При щелчке по числам в связанной внешней таблице отображаются примеры структур, определенных этим методом.
Для структур PDB, определенных с помощью дифракции рентгеновских лучей, которые имеют файл структурных факторов, можно просмотреть их карту электронной плотности. Данные таких структур хранятся на «сервере электронной плотности».
Исторически количество структур в PDB росло примерно экспоненциально: 100 зарегистрированных структур в 1982 г., 1000 структур в 1993 г. 10 000 в 1999 г. и 100 000 в 2014. С 2007 г. скорость накопления новых белковых структур, похоже, стабилизировалась.
Формат файла, изначально используемый PDB, назывался Формат файла PDB. Исходный формат был ограничен шириной компьютерных перфокарт до 80 символов в строке. Примерно в 1996 году был введен в действие формат «файла макромолекулярной кристаллографической информации», mmCIF, который является расширением формата CIF. MmCIF стал стандартным форматом для архива PDB в 2014 году. В 2019 году wwPDB объявила что осаждения для кристаллографических методов будут приниматься только в формате mmCIF.
Версия PDB XML, называемая PDBML, была описана в 2005 году. Файлы структуры можно загрузить в любом из этих трех форматы, хотя все большее количество структур не подходят для устаревшего формата PDB. Отдельные файлы легко загружаются в графические пакеты из Интернета URL-адреса :
http://www.pdb.org/pdb/files/4hhb.pdb.gz
или http://pdbe.org/download/4hhb
http://www.pdb.org/pdb/files/4hhb.xml.gz
или http://pdbe.org/pdbml/4hhb
«4hhb
» - это идентификатор PDB. Каждая структура, опубликованная в PDB, получает четырехзначный буквенно-цифровой идентификатор, свой PDB ID. (Это не уникальный идентификатор для биомолекул, потому что несколько структур для одной и той же молекулы - в разных средах или конформациях - могут содержаться в PDB с разными идентификаторами PDB.)
Файлы структуры можно просмотреть с помощью одной из нескольких бесплатных компьютерных программ с открытым исходным кодом, включая Jmol, Pymol, VMD и Расмол. Другие платные, условно-бесплатные программы включают ICM-Browser, MDL Chime, UCSF Chimera, Swiss-PDB Viewer, StarBiochem (интерактивный молекулярный просмотрщик на основе Java. со встроенным поиском в банке данных белков), Sirius и VisProt3DS (инструмент для визуализации белков в трехмерном стереоскопическом представлении в анаглите и других режимах) и Discovery Studio. Веб-сайт RCSB PDB содержит обширный список как бесплатных, так и коммерческих программ визуализации молекул и плагинов для веб-браузеров.
![]() | Викиданные имеют свойство: |