OrthoDB

редактировать
OrthoDB
OrthoDB logo.png
Содержание
ОписаниеКаталог Ортологов.
Контакты
Исследовательский центр Швейцарский институт биоинформатики
Лаборатория Computational Evolutionary Genomics Group
Авторы Кривенцева Евгения Валентиновна
Первичная ссылкаКривенцева и др. (2015)
Дата выпуска2007
Доступ
Веб-сайтwww.orthodb.org
URL для загрузкиhttps: // www.orthodb.org /? page = filelist
Sparql конечная точкаsparql.orthodb.org / sparql
Разное
Лицензия CC-BY -3.0

OrthoDB представляет каталог ортологичных генов, кодирующих белок у позвоночных, членистоногих, грибов, растения и бактерии. Ортология относится к последнему общему предку рассматриваемого вида, и, таким образом, OrthoDB явно очерчивает ортологи для каждого основного излучения в филогении вида. База данных ортологов представляет доступные дескрипторы белков вместе с атрибутами Gene Ontology и InterPro, которые служат для предоставления общих описательных аннотаций ортологичных групп и упрощения комплексных запросов к базе данных ортологов. OrthoDB также предоставляет вычисленные эволюционные характеристики ортологов, такие как профили дублируемости и потери генов, коэффициенты дивергенции, родственные группы и интрон-экзонную архитектуру генов.

В сравнительной геномике важность масштаба нельзя недооценивать. Поскольку разграничение генной ортологии требует специальных знаний и значительных вычислительных ресурсов, масштаб - это то, чего отдельные неспециализированные исследовательские группы не могут достичь самостоятельно. Эта сложная задача решается с помощью OrthoDB с очень полным набором видов и несколькими уникальными функциями, такими как обширные функциональные и эволюционные аннотации ортологических групп, с интеграцией множества полезных ссылок на другие ведущие в мире базы данных, которые сосредоточиться на сборе информации о функции генов. Ни один геном не может существовать как полезный источник данных без обширного сравнительного анализа с другими геномами - OrthoDB обеспечивает критически важный ресурс сравнительной геномики для всего сообщества исследователей, от тех, кто интересуется большими эволюционными вопросами до тех, кто сосредоточен на специфические биологические функции отдельных генов.

Содержание
  • 1 Методология
  • 2 Содержание данных
  • 3 Производительность
  • 4 BUSCO
  • 5 Примечания и ссылки
  • 6 См. Также
  • 7 Внешние ссылки
Методология

Ортология определяется относительно последнего общего предка рассматриваемого вида, тем самым определяя иерархический характер ортологических классификаций. Это явно рассматривается в OrthoDB путем применения процедуры очерчивания ортологии в каждой основной точке излучения рассматриваемой филогении. Реализация OrthoDB использует алгоритм кластеризации Best-Reciprocal-Hit (BRH), основанный на сравнении последовательностей белков «все против всех» Смита – Уотермана. Предварительная обработка набора генов выбирает самый длинный кодирующий белок транскрипт альтернативно сплайсированных генов и очень похожих копий генов. Процедура триангулирует BRH для постепенного построения кластеров и требует общего минимального перекрытия выравнивания последовательностей, чтобы избежать обхода доменов. Эти основные кластеры дополнительно расширяются и включают в себя всех более тесно связанных внутривидовых паралогов и ранее идентифицированные очень похожие копии генов.

Содержание данных

База данных содержит около 600 видов эукариот и более 3600 бактерий, полученных из Ensembl, UniProt, NCBI, FlyBase и ряд других баз данных. Постоянно увеличивающийся объем выборки секвенированных геномов дает более четкое представление о большинстве генеалогий генов, что облегчит обоснованные гипотезы функции генов во вновь секвенированных геномах.

Примеры исследований, в которых использовались данные из OrthoDB, включают сравнительный анализ эволюции репертуара генов, сравнение генов развития плодовых мух и комаров, анализ изменений экспрессии генов, вызванных кровопролитием или инфекцией. у комаров, анализ эволюции молочной продуктивности млекопитающих, а также эволюция генов и генома комаров. Другие исследования, в которых упоминается OrthoDB, можно найти на PubMed и Google Scholar.

Performance

OrthoDB стабильно хорошо показывает себя в сравнительных оценках наряду с другими процедурами определения ортологии.. Результаты сравнивали с эталонными деревьями для трех хорошо консервативных семейств белков и с большим набором курируемых семейств белков.

BUSCO

Bнаборы энчмаркинга U универсальный Si ngle- C opy O rthologs - Ортологические группы выбираются из OrthoDB для классификации на корневом уровне членистоногих, позвоночных, многоклеточных, грибов и др. основные клады. Группы должны содержать однокопийные ортологи по крайней мере у 90% видов (в других они могут быть утеряны или дублированы), а отсутствующие виды не могут быть все из одной клады. Виды с частыми потерями или дупликациями исключаются из выборки, если они не занимают ключевую позицию в филогении. Таким образом, ожидается, что BUSCO будут обнаружены как ортологи с одной копией в любом недавно секвенированном геноме из соответствующей филогенетической клады, и их можно будет использовать для анализа вновь секвенированных геномов для оценки их относительной полноты. Инструмент оценки BUSCO и наборы данных (доступны здесь ) широко используются во многих проектах по геномике, при этом большинство редакторов журналов теперь требуют такой оценки качества перед принятием новых публикаций по геному.

Примечания и ссылки
См. Также
Внешние ссылки
Последняя правка сделана 2021-06-01 03:15:09
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте