Содержание | |
---|---|
Описание | База данных консервативных доменов для функциональной аннотации белков. |
Контакт | |
Исследовательский центр | Национальный центр биотехнологической информации |
Авторы | Арон Марчлер-Бауэр |
Основная ссылка | Марчлер-Бауэр и др. (2013) |
Дата выпуска | 2003 |
Доступ | |
Веб-сайт | https://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml |
База данных консервативных доменов (CDD ) - это база данных хорошо аннотированных моделей множественного выравнивания последовательностей и производных моделей поиска в базе данных для древних доменов и полноразмерные белки.
Домены можно рассматривать как отдельные функциональные и / или структурные единицы белка. На самом деле, эти две классификации довольно часто совпадают, и то, что обнаруживается как независимо сворачивающаяся единица полипептидной цепи, также несет определенную функцию. Домены часто идентифицируются как повторяющиеся (последовательность или структура) единицы, которые могут существовать в различных контекстах. В молекулярной эволюции такие домены могут быть использованы в качестве строительных блоков и могут быть рекомбинированы в различных схемах для модуляции функции белка. CDD определяет консервативные домены как повторяющиеся единицы в молекулярной эволюции, протяженность которых может быть определена с помощью анализа последовательности и структуры.
Цель проекта курирования сохраняемых доменов NCBI - предоставить пользователям базы данных понимание того, как закономерности сохранения остатков и расхождения в семействе связаны с функциональными свойствами, а также предоставить полезные ссылки на более подробную информацию, которая может помочь чтобы понять эти отношения последовательность / структура / функция. Для этого кураторы CDD включают следующие типы информации, чтобы дополнить и обогатить традиционные множественные выравнивания последовательностей, которые составляют основу доменных моделей: трехмерные структуры и консервативные основные мотивы, консервативные особенности / сайты, филогенетическая организация, ссылки на электронные литературные ресурсы.
Контент CDD включает вручную курируемые NCBI модели предметной области и модели предметной области, импортированные из ряда внешних исходных баз данных (Pfam, SMART, COG, PRK, ТИГРФАМ ). Уникальность доменов, курируемых NCBI, заключается в том, что они используют информацию о трехмерной структуре для явного определения границ домена, выравнивания блоков, изменения деталей выравнивания и обеспечения понимания взаимосвязей последовательность / структура / функция. Модели, созданные вручную, организованы иерархически, если они описывают семейства доменов, которые явно связаны общим происхождением. Чтобы обеспечить неизбыточное представление данных, CDD объединяет похожие модели предметной области из различных источников в суперсемейства.
Коллекция также является частью системы запросов и поиска NCBI Entrez, связанной с многочисленными другими ресурсами. CDD обеспечивает аннотацию следов домена и консервативных функциональных сайтов на белковых последовательностях. Предварительно рассчитанная аннотация домена может быть получена для белковых последовательностей, отслеживаемых в системе Entrez NCBI, а коллекция моделей CDD может быть запрошена с новыми белковыми последовательностями через * «службу поиска CD». Национальный центр биотехнологической информации США. или * «Пакетный поиск по компакт-дискам». Национальный центр биотехнологической информации США., который позволяет вычислять и загружать аннотации для больших наборов запросов по белкам.