Содержание | |
---|---|
Описание | Каталог Ортологов. |
Контакты | |
Исследовательский центр | Швейцарский институт биоинформатики |
Лаборатория | Computational Evolutionary Genomics Group |
Авторы | Кривенцева Евгения Валентиновна |
Первичная ссылка | Кривенцева и др. (2015) |
Дата выпуска | 2007 |
Доступ | |
Веб-сайт | www.orthodb.org |
URL для загрузки | https: // www.orthodb.org /? page = filelist |
Sparql конечная точка | sparql.orthodb.org / sparql |
Разное | |
Лицензия | CC-BY -3.0 |
OrthoDB представляет каталог ортологичных генов, кодирующих белок у позвоночных, членистоногих, грибов, растения и бактерии. Ортология относится к последнему общему предку рассматриваемого вида, и, таким образом, OrthoDB явно очерчивает ортологи для каждого основного излучения в филогении вида. База данных ортологов представляет доступные дескрипторы белков вместе с атрибутами Gene Ontology и InterPro, которые служат для предоставления общих описательных аннотаций ортологичных групп и упрощения комплексных запросов к базе данных ортологов. OrthoDB также предоставляет вычисленные эволюционные характеристики ортологов, такие как профили дублируемости и потери генов, коэффициенты дивергенции, родственные группы и интрон-экзонную архитектуру генов.
В сравнительной геномике важность масштаба нельзя недооценивать. Поскольку разграничение генной ортологии требует специальных знаний и значительных вычислительных ресурсов, масштаб - это то, чего отдельные неспециализированные исследовательские группы не могут достичь самостоятельно. Эта сложная задача решается с помощью OrthoDB с очень полным набором видов и несколькими уникальными функциями, такими как обширные функциональные и эволюционные аннотации ортологических групп, с интеграцией множества полезных ссылок на другие ведущие в мире базы данных, которые сосредоточиться на сборе информации о функции генов. Ни один геном не может существовать как полезный источник данных без обширного сравнительного анализа с другими геномами - OrthoDB обеспечивает критически важный ресурс сравнительной геномики для всего сообщества исследователей, от тех, кто интересуется большими эволюционными вопросами до тех, кто сосредоточен на специфические биологические функции отдельных генов.
Ортология определяется относительно последнего общего предка рассматриваемого вида, тем самым определяя иерархический характер ортологических классификаций. Это явно рассматривается в OrthoDB путем применения процедуры очерчивания ортологии в каждой основной точке излучения рассматриваемой филогении. Реализация OrthoDB использует алгоритм кластеризации Best-Reciprocal-Hit (BRH), основанный на сравнении последовательностей белков «все против всех» Смита – Уотермана. Предварительная обработка набора генов выбирает самый длинный кодирующий белок транскрипт альтернативно сплайсированных генов и очень похожих копий генов. Процедура триангулирует BRH для постепенного построения кластеров и требует общего минимального перекрытия выравнивания последовательностей, чтобы избежать обхода доменов. Эти основные кластеры дополнительно расширяются и включают в себя всех более тесно связанных внутривидовых паралогов и ранее идентифицированные очень похожие копии генов.
База данных содержит около 600 видов эукариот и более 3600 бактерий, полученных из Ensembl, UniProt, NCBI, FlyBase и ряд других баз данных. Постоянно увеличивающийся объем выборки секвенированных геномов дает более четкое представление о большинстве генеалогий генов, что облегчит обоснованные гипотезы функции генов во вновь секвенированных геномах.
Примеры исследований, в которых использовались данные из OrthoDB, включают сравнительный анализ эволюции репертуара генов, сравнение генов развития плодовых мух и комаров, анализ изменений экспрессии генов, вызванных кровопролитием или инфекцией. у комаров, анализ эволюции молочной продуктивности млекопитающих, а также эволюция генов и генома комаров. Другие исследования, в которых упоминается OrthoDB, можно найти на PubMed и Google Scholar.
OrthoDB стабильно хорошо показывает себя в сравнительных оценках наряду с другими процедурами определения ортологии.. Результаты сравнивали с эталонными деревьями для трех хорошо консервативных семейств белков и с большим набором курируемых семейств белков.
Bнаборы энчмаркинга U универсальный Si ngle- C opy O rthologs - Ортологические группы выбираются из OrthoDB для классификации на корневом уровне членистоногих, позвоночных, многоклеточных, грибов и др. основные клады. Группы должны содержать однокопийные ортологи по крайней мере у 90% видов (в других они могут быть утеряны или дублированы), а отсутствующие виды не могут быть все из одной клады. Виды с частыми потерями или дупликациями исключаются из выборки, если они не занимают ключевую позицию в филогении. Таким образом, ожидается, что BUSCO будут обнаружены как ортологи с одной копией в любом недавно секвенированном геноме из соответствующей филогенетической клады, и их можно будет использовать для анализа вновь секвенированных геномов для оценки их относительной полноты. Инструмент оценки BUSCO и наборы данных (доступны здесь ) широко используются во многих проектах по геномике, при этом большинство редакторов журналов теперь требуют такой оценки качества перед принятием новых публикаций по геному.