Генная онтология

редактировать
Генная онтология
Database.png
Содержание
Описание Ресурс с контролируемым словарным запасом для описания функций генов и генных продуктов
Доступ
Веб-сайт генеонтология.org

Джин Онтология ( ГО) является одним из основной биоинформатики инициативы унифицировать представление гена и ген продукта атрибутов во всех видах. В частности, проект направлен на: 1) поддержание и развитие своего контролируемого словаря генов и атрибутов генных продуктов; 2) аннотировать гены и генные продукты, а также ассимилировать и распространять аннотационные данные; и 3) предоставить инструменты для легкого доступа ко всем аспектам данных, предоставляемых проектом, и для обеспечения функциональной интерпретации экспериментальных данных с использованием GO, например, посредством анализа обогащения. GO является частью более крупной системы классификации, Open Biomedical Ontology, и является одним из первых кандидатов в члены OBO Foundry.

В то время как номенклатура генов фокусируется на генах и генных продуктах, онтология генов фокусируется на функциях генов и генных продуктах. GO также расширяет усилия, используя язык разметки, чтобы сделать данные (не только генов и их продуктов, но и курируемых атрибутов) машиночитаемыми, и сделать это унифицированным для всех видов способом (тогда как соглашения о номенклатуре генов варьируются в зависимости от биологического таксона ).

СОДЕРЖАНИЕ
  • 1 Термины и онтология
    • 1.1 Пример термина
  • 2 Аннотация
    • 2.1 Пример аннотации
  • 3 Инструменты
  • 4 Консорциум
  • 5 История
  • 6 См. Также
  • 7 ссылки
  • 8 Внешние ссылки
Термины и онтология

С практической точки зрения онтология - это представление того, о чем мы знаем. «Онтологии» состоят из представлений вещей, которые можно обнаружить или непосредственно наблюдать, и отношений между этими вещами. В биологии и смежных областях не существует универсальной стандартной терминологии, и использование терминов может быть специфическим для вида, области исследования или даже конкретной исследовательской группы. Это затрудняет обмен данными и обмен данными. Проект Gene Ontology предоставляет онтологию определенных терминов, представляющих свойства генного продукта. Онтология охватывает три области:

Каждый термин GO в онтологии имеет имя термина, которое может быть словом или цепочкой слов; уникальный буквенно-цифровой идентификатор; определение с цитированными источниками; и онтология, указывающая домен, к которому он принадлежит. У терминов также могут быть синонимы, которые классифицируются как точно эквивалентные названию термина, более широкие, узкие или связанные; ссылки на эквивалентные концепции в других базах данных; и комментарии по значению или использованию термина. Онтология GO структурирована как направленный ациклический граф, и каждый термин имеет определенные отношения с одним или несколькими другими терминами в том же домене, а иногда и с другими доменами. Словарь GO разработан так, чтобы не зависеть от вида, и включает термины, применимые к прокариотам и эукариотам, одноклеточным и многоклеточным организмам.

GO не статичен, и дополнения, исправления и изменения предлагаются и запрашиваются членами исследовательских сообществ и сообществ аннотаций, а также теми, кто непосредственно участвует в проекте GO. Например, аннотатор может запросить конкретный термин для представления метаболического пути, или часть онтологии может быть изменена с помощью экспертов сообщества (например). Предлагаемые изменения проверяются редакторами онтологий и при необходимости вносятся в них.

Файлы онтологии и аннотации GO находятся в свободном доступе на веб-сайте GO в различных форматах или могут быть доступны онлайн с помощью браузера GO AmiGO. Проект Gene Ontology также предоставляет загружаемые сопоставления своих терминов с другими системами классификации.

Пример термина

id: GO: 0000016
название: активность лактазы
онтология: молекулярная функция
def: «Катализ реакции: лактоза + H2O = D-глюкоза + D-галактоза». [EC: 3.2.1.108]
синоним: «активность лактазы-флоризингидролазы» ШИРОКО [EC: 3.2.1.108]
синоним: «активность лактозогидролазы» ТОЧНО [EC: 3.2.1.108]
xref: EC: 3.2.1.108
xref: MetaCyc: LACTASE-RXN
xref: Reactome: 20536
is_a: GO: 0004553! гидролазная активность, гидролизующие О-гликозильные соединения

Источник данных:

Аннотации

Аннотации генома включают в себя практику сбора данных о продукте гена, а в аннотациях GO для этого используются термины из GO. Аннотации от кураторов GO интегрированы и распространяются на веб-сайте GO, где их можно скачать напрямую или просмотреть в Интернете с помощью AmiGO. В дополнение к идентификатору генного продукта и соответствующему термину GO, аннотации GO содержат как минимум следующие данные: ссылка, используемая для создания аннотации (например, журнальная статья); Доказательства код, обозначающий тип доказательства, на которых базируется аннотаций; Дата и автор аннотации

В аннотацию GO также может быть включена вспомогательная информация, в зависимости от термина GO и используемых свидетельств, а также дополнительная информация, такая как условия, при которых наблюдается функция.

Код свидетельства происходит из контролируемого словаря кодов, онтологии кода свидетельства, охватывающего как ручные, так и автоматизированные методы аннотации. Например, отслеживаемое заявление автора (TAS) означает, что куратор прочитал опубликованную научную статью, и метаданные для этой аннотации содержат ссылку на эту статью; Вывод на основе подобия последовательностей (ISS) означает, что куратор-человек просмотрел результат поиска сходства последовательностей и подтвердил его биологическое значение. Аннотации из автоматизированных процессов (например, повторное отображение аннотаций, созданных с использованием другого словаря аннотаций) получают код, полученный из электронных аннотаций (IEA). В 2010 году более 98% всех аннотаций GO были выведены с помощью вычислений, а не кураторами, но по состоянию на 2 июля 2019 года только около 30% всех аннотаций GO были выведены с помощью вычислений. Поскольку эти аннотации не проверяются человеком, Консорциум GO считает их несколько менее надежными, и они обычно относятся к более высокоуровневым и менее подробным условиям. Полные наборы аннотационных данных можно загрузить с веб-сайта GO. Для поддержки разработки аннотаций Консорциум GO проводит семинары и наставляет новые группы кураторов и разработчиков.

Многие алгоритмы машинного обучения были разработаны и реализованы для прогнозирования аннотаций генных онтологий.

Пример аннотации

Генный продукт: актин, альфа-сердечная мышца 1, UniProtKB: P68032
GO термин: сокращение сердца; GO: 0060047 (биологический процесс)
Код доказательства: выведен из мутантного фенотипа (IMP)
Ссылка: PMID   17611253
Назначен: UniProtKB, 6 июня 2008 г.

Источник данных:

Инструменты

Существует большое количество инструментов, доступных как в Интернете, так и для загрузки, которые используют данные, предоставленные проектом GO. Подавляющее большинство из них поступает от третьих лиц; Консорциум GO разрабатывает и поддерживает два инструмента: AmiGO и OBO-Edit.

AmiGO - это веб-приложение, которое позволяет пользователям запрашивать, просматривать и визуализировать онтологии и данные аннотаций генных продуктов. Он также имеет инструмент BLAST, инструменты, позволяющие анализировать большие наборы данных, и интерфейс для прямого запроса базы данных GO.

AmiGO можно использовать онлайн на веб-сайте GO для доступа к данным, предоставленным Консорциумом GO, или можно загрузить и установить для локального использования в любой базе данных, использующей схему базы данных GO (например). Это бесплатное программное обеспечение с открытым исходным кодом и доступно как часть распространения программного обеспечения go-dev.

OBO-Edit - это независимый от платформы редактор онтологий с открытым исходным кодом, разработанный и поддерживаемый Gene Ontology Consortium. Он реализован на Java и использует графо-ориентированный подход для отображения и редактирования онтологий. OBO-Edit включает в себя обширный интерфейс поиска и фильтрации с возможностью отображать подмножества терминов, чтобы сделать их визуально различимыми; пользовательский интерфейс также можно настроить в соответствии с предпочтениями пользователя. OBO-Edit также имеет модуль рассуждений, который может выводить ссылки, которые не были явно указаны, на основе существующих отношений и их свойств. Хотя OBO-Edit был разработан для биомедицинских онтологий, его можно использовать для просмотра, поиска и редактирования любой онтологии. Он доступен для бесплатного скачивания.

Консорциум

Консорциум генных онтологий - это набор биологических баз данных и исследовательских групп, активно участвующих в проекте генной онтологии. Это включает в себя ряд баз данных модельных организмов и многовидовых баз данных белков, группы разработки программного обеспечения и специальную редакцию.

История

Онтология генов была первоначально создана в 1998 году консорциумом исследователей, изучающих геномы трех модельных организмов : Drosophila melanogaster (плодовая муха), Mus musculus (мышь) и Saccharomyces cerevisiae (пивные или пекарские дрожжи). Многие другие базы данных модельных организмов присоединились к Консорциуму генных онтологий, предоставляя не только аннотационные данные, но также внося свой вклад в разработку онтологий и инструментов для просмотра и применения данных. Многие основные базы данных по растениям, животным и микроорганизмам вносят свой вклад в этот проект. По состоянию на июль 2019 года GO содержит 44 945 терминов; есть 6 408 283 аннотаций к 4 467 различным биологическим организмам. Существует значительный объем литературы по разработке и использованию GO, и он стал стандартным инструментом в арсенале биоинформатики. Их цели включают три аспекта: построение генной онтологии, присвоение онтологии генным / генным продуктам и разработка программного обеспечения и баз данных для первых двух объектов.

Также начинает появляться несколько анализов генной онтологии с использованием формальных, независимых от предметной области свойств классов (метасвойств). Например, онтологический анализ биологических онтологий см.

Смотрите также
использованная литература
внешние ссылки
Последняя правка сделана 2023-03-21 10:48:07
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте