![]() | |
---|---|
Содержание | |
Описание | Ресурс с контролируемым словарем для описания функции генов и генных продуктов |
Доступ | |
Веб-сайт | генеонтология.org |
Онтология гена (GO) является основной инициативой биоинформатики по унификации представления атрибутов гена и продукта гена для всех видов. В частности, проект направлен на: 1) поддержание и развитие его контролируемого словаря атрибутов генов и генных продуктов; 2) аннотировать гены и генные продукты, а также ассимилировать и распространять аннотационные данные; и 3) предоставить инструменты для легкого доступа ко всем аспектам данных, предоставляемых проектом, и для обеспечения функциональной интерпретации экспериментальных данных с использованием GO, например, посредством анализа обогащения. GO является частью более крупной системы классификации Открытых биомедицинских онтологий, являющейся одним из первых кандидатов в члены OBO Foundry.
, тогда как номенклатура генов фокусируется на генах и генных продуктов, онтология генов фокусируется на функциях генов и генных продуктах. GO также расширяет возможности, используя язык разметки, чтобы сделать данные (не только генов и их продуктов, но и курируемых атрибутов) машиночитаемыми, и сделать это в таким образом, который унифицирован для всех видов (тогда как соглашения о номенклатуре генов различаются в зависимости от биологического таксона ).
С практической точки зрения онтология - это представление того, о чем мы знаем. «Онтологии» состоят из представлений вещей, которые можно обнаружить или непосредственно наблюдаем, и отношений между этими вещами. В биологии и смежных областях не существует универсальной стандартной терминологии, и использование терминов может быть специфическим для вида, области исследования или даже конкретной исследовательской группы. Это затрудняет общение и обмен данными. Проект Gene Ontology предоставляет онтологию определенных терминов, представляющих свойства генного продукта. Онтология охватывает три области:
Каждый термин GO в онтологии имеет название термина, которое может быть словом или цепочкой слов; уникальный буквенно-цифровой идентификатор; определение с цитированием источников; и онтология, указывающая домен, к которому он принадлежит. У терминов также могут быть синонимы, которые классифицируются как полностью эквивалентные названию термина, более широкие, узкие или связанные; ссылки на эквивалентные концепции в других базах данных; и комментарии по значению или использованию термина. Онтология GO структурирована как направленный ациклический граф, и каждый термин определяет отношения с одним или несколькими другими терминами в том же домене, а иногда и с другими доменами. Словарь GO разработан так, чтобы не зависеть от вида, и включает термины, применимые к прокариотам и эукариотам, одиночным и многоклеточным организмам.
GO is не статичен, и дополнения, исправления и изменения предлагаются и запрашиваются членами исследовательских сообществ и сообществ аннотаций, а также теми, кто непосредственно участвует в проекте GO. Например, аннотатор может запросить конкретный термин для представления метаболического пути, или часть онтологии может быть изменена с помощью экспертов сообщества (например,). Предлагаемые изменения проверяются редакторами онтологий и при необходимости применяются.
Файлы онтологии GO и файлы аннотаций находятся в свободном доступе на веб-сайте GO в различных форматах или могут быть доступны онлайн с помощью браузера GO. Проект Gene Ontology также предоставляет загружаемые сопоставления своих терминов с другими системами классификации.
Источник данных:
Аннотации генома охватывает практику сбора данных о продукте гена, а в аннотациях GO используются термины из онтологии GO для Сделай так. Аннотации от кураторов GO интегрированы и распространяются на веб-сайте GO, где их можно скачать напрямую или просмотреть в Интернете с помощью AmiGO. В дополнение к идентификатору генного продукта и соответствующему термину GO, аннотации GO содержат как минимум следующие данные: ссылка, используемая для создания аннотации (например, журнальная статья); Код свидетельства, обозначающий тип свидетельства, на котором основывается аннотация; Дата и создатель аннотации
. Вспомогательная информация, в зависимости от термина GO и используемых свидетельств, а также дополнительная информация, такая как условия, при которых выполняется функция, также может быть включена в аннотацию GO.
Код свидетельства происходит из контролируемого словаря кодов, онтологии кода свидетельства, охватывающий как ручные, так и автоматизированные методы аннотации. Например, отслеживаемое заявление автора (TAS) означает, что куратор прочитал опубликованную научную статью, и в метаданных для этой аннотации есть ссылка на эту статью; Вывод на основе подобия последовательностей (ISS) означает, что куратор-человек просмотрел результат поиска сходства последовательностей и подтвердил его биологическое значение. Аннотации из автоматизированных процессов (например, повторное отображение аннотаций, созданных с использованием другого словаря аннотаций) получают код, полученный из электронных аннотаций (IEA). В 2010 году более 98% всех аннотаций GO были выведены с помощью вычислений, а не кураторами, но по состоянию на 2 июля 2019 года только около 30% всех аннотаций GO были выведены с помощью вычислений. Поскольку эти аннотации не проверяются человеком, Консорциум GO считает их несколько менее надежными, и они обычно относятся к более высокоуровневым и менее подробным условиям. Полные наборы аннотационных данных можно загрузить с веб-сайта GO. Чтобы поддержать разработку аннотаций, Консорциум GO проводит семинары и наставляет новые группы кураторов и разработчиков.
Многие алгоритмы машинного обучения были разработаны и реализованы для прогнозирования аннотаций генной онтологии.
Источник данных:
Существует большое количество инструментов, доступных как в Интернете, так и для загрузки, которые используют данные, предоставленные проектом GO. Подавляющее большинство из них поступает от третьих лиц; Консорциум GO разрабатывает и поддерживает два инструмента: AmiGO и OBO-Edit .
AmiGO - это веб-приложение, которое позволяет пользователям запрашивать, просматривать и визуализировать онтологии и данные аннотаций генных продуктов. Он также имеет инструмент BLAST, инструменты, позволяющие анализировать большие наборы данных, и интерфейс для прямого запроса базы данных GO.
AmiGO можно использовать онлайн на веб-сайте GO для доступа к данным предоставляется Консорциумом GO или может быть загружен и установлен для локального использования в любой базе данных, использующей схему базы данных GO (например,). Это бесплатное программное обеспечение с открытым исходным кодом и доступно как часть распространения программного обеспечения go-dev.
OBO-Edit - это независимый от платформы редактор онтологий с открытым исходным кодом, разработанный и поддерживаемый Gene Консорциум онтологий. Он реализован в Java и использует ориентированный на граф подход для отображения и редактирования онтологий. OBO-Edit включает в себя комплексный интерфейс поиска и фильтрации с возможностью отображать подмножества терминов, чтобы сделать их визуально различимыми; пользовательский интерфейс также можно настроить в соответствии с предпочтениями пользователя. OBO-Edit также имеет модуль рассуждений , который может выводить ссылки, которые не были явно указаны, на основе существующих отношений и их свойств. Хотя он был разработан для биомедицинских онтологий, OBO-Edit можно использовать для просмотра, поиска и редактирования любой онтологии. Его можно бесплатно загрузить.
Консорциум генных онтологий - это набор биологических баз данных и исследовательских групп, активно участвующих в проекте генной онтологии. Сюда входят несколько баз данных модельных организмов и баз данных многовидовых белков, группы разработки программного обеспечения и специальная редакция.
Генная онтология была первоначально создана в 1998 году консорциумом исследователей, изучающих геномы трех модельных организмов : Drosophila melanogaster (плодовая муха), Mus musculus (мышь) и Saccharomyces cerevisiae (пивные или пекарские дрожжи). Многие другие Базы данных модельных организмов присоединились к Консорциуму генных онтологий, предоставляя не только аннотационные данные, но также внося свой вклад в разработку онтологий и инструментов для просмотра и применения данных. Многие крупные базы данных по растениям, животным и микроорганизмам вносят свой вклад в этот проект. По состоянию на июль 2019 года GO содержит 44 945 терминов; имеется 6 408 283 аннотаций к 4 467 различным биологическим организмам. Существует значительный объем литературы по разработке и использованию GO, и он стал стандартным инструментом в арсенале биоинформатики. Их цели включают три аспекта: построение генной онтологии, присвоение онтологии генам / генным продуктам и разработка программного обеспечения и баз данных для первых двух объектов.
Некоторые анализы онтологии генов с использованием формальных, независимых от предметной области свойств классов (метасвойств) также начинают появляться. Например, онтологический анализ биологических онтологий см.
![]() | Викиданные имеют свойство: |