Генная онтология

редактировать
База знаний о функциях генов и генных продуктов
Онтология генов
Database.png
Содержание
ОписаниеРесурс с контролируемым словарем для описания функции генов и генных продуктов
Доступ
Веб-сайтгенеонтология.org

Онтология гена (GO) является основной инициативой биоинформатики по унификации представления атрибутов гена и продукта гена для всех видов. В частности, проект направлен на: 1) поддержание и развитие его контролируемого словаря атрибутов генов и генных продуктов; 2) аннотировать гены и генные продукты, а также ассимилировать и распространять аннотационные данные; и 3) предоставить инструменты для легкого доступа ко всем аспектам данных, предоставляемых проектом, и для обеспечения функциональной интерпретации экспериментальных данных с использованием GO, например, посредством анализа обогащения. GO является частью более крупной системы классификации Открытых биомедицинских онтологий, являющейся одним из первых кандидатов в члены OBO Foundry.

, тогда как номенклатура генов фокусируется на генах и генных продуктов, онтология генов фокусируется на функциях генов и генных продуктах. GO также расширяет возможности, используя язык разметки, чтобы сделать данные (не только генов и их продуктов, но и курируемых атрибутов) машиночитаемыми, и сделать это в таким образом, который унифицирован для всех видов (тогда как соглашения о номенклатуре генов различаются в зависимости от биологического таксона ).

Содержание

  • 1 Термины и онтология
    • 1.1 Пример термина
  • 2 Аннотация
    • 2.1 Пример аннотации
  • 3 Инструменты
  • 4 Консорциум
  • 5 История
  • 6 См. Также
  • 7 Ссылки
  • 8 Внешние ссылки

Термины и онтология

С практической точки зрения онтология - это представление того, о чем мы знаем. «Онтологии» состоят из представлений вещей, которые можно обнаружить или непосредственно наблюдаем, и отношений между этими вещами. В биологии и смежных областях не существует универсальной стандартной терминологии, и использование терминов может быть специфическим для вида, области исследования или даже конкретной исследовательской группы. Это затрудняет общение и обмен данными. Проект Gene Ontology предоставляет онтологию определенных терминов, представляющих свойства генного продукта. Онтология охватывает три области:

Каждый термин GO в онтологии имеет название термина, которое может быть словом или цепочкой слов; уникальный буквенно-цифровой идентификатор; определение с цитированием источников; и онтология, указывающая домен, к которому он принадлежит. У терминов также могут быть синонимы, которые классифицируются как полностью эквивалентные названию термина, более широкие, узкие или связанные; ссылки на эквивалентные концепции в других базах данных; и комментарии по значению или использованию термина. Онтология GO структурирована как направленный ациклический граф, и каждый термин определяет отношения с одним или несколькими другими терминами в том же домене, а иногда и с другими доменами. Словарь GO разработан так, чтобы не зависеть от вида, и включает термины, применимые к прокариотам и эукариотам, одиночным и многоклеточным организмам.

GO is не статичен, и дополнения, исправления и изменения предлагаются и запрашиваются членами исследовательских сообществ и сообществ аннотаций, а также теми, кто непосредственно участвует в проекте GO. Например, аннотатор может запросить конкретный термин для представления метаболического пути, или часть онтологии может быть изменена с помощью экспертов сообщества (например,). Предлагаемые изменения проверяются редакторами онтологий и при необходимости применяются.

Файлы онтологии GO и файлы аннотаций находятся в свободном доступе на веб-сайте GO в различных форматах или могут быть доступны онлайн с помощью браузера GO. Проект Gene Ontology также предоставляет загружаемые сопоставления своих терминов с другими системами классификации.

Пример термина

id: GO: 0000016
name: активность лактазы
онтология: молекулярная_функция
def: «Катализ реакции: лактоза. + H2O = D-глюкоза + D-галактоза ". [EC: 3.2.1.108]
синоним: «лактазно-флоризингидролазная активность» ШИРОКО [EC: 3.2.1.108]
синоним: «лактозогалакто-гидролазная активность» ТОЧНО [EC: 3.2.1.108 ]
xref: EC: 3.2.1.108
xref: MetaCyc: LACTASE-RXN
xref: Reactome: 20536
is_a: GO: 0004553! гидролазная активность, гидролизующие O-гликозильные соединения

Источник данных:

Аннотация

Аннотации генома охватывает практику сбора данных о продукте гена, а в аннотациях GO используются термины из онтологии GO для Сделай так. Аннотации от кураторов GO интегрированы и распространяются на веб-сайте GO, где их можно скачать напрямую или просмотреть в Интернете с помощью AmiGO. В дополнение к идентификатору генного продукта и соответствующему термину GO, аннотации GO содержат как минимум следующие данные: ссылка, используемая для создания аннотации (например, журнальная статья); Код свидетельства, обозначающий тип свидетельства, на котором основывается аннотация; Дата и создатель аннотации

. Вспомогательная информация, в зависимости от термина GO и используемых свидетельств, а также дополнительная информация, такая как условия, при которых выполняется функция, также может быть включена в аннотацию GO.

Код свидетельства происходит из контролируемого словаря кодов, онтологии кода свидетельства, охватывающий как ручные, так и автоматизированные методы аннотации. Например, отслеживаемое заявление автора (TAS) означает, что куратор прочитал опубликованную научную статью, и в метаданных для этой аннотации есть ссылка на эту статью; Вывод на основе подобия последовательностей (ISS) означает, что куратор-человек просмотрел результат поиска сходства последовательностей и подтвердил его биологическое значение. Аннотации из автоматизированных процессов (например, повторное отображение аннотаций, созданных с использованием другого словаря аннотаций) получают код, полученный из электронных аннотаций (IEA). В 2010 году более 98% всех аннотаций GO были выведены с помощью вычислений, а не кураторами, но по состоянию на 2 июля 2019 года только около 30% всех аннотаций GO были выведены с помощью вычислений. Поскольку эти аннотации не проверяются человеком, Консорциум GO считает их несколько менее надежными, и они обычно относятся к более высокоуровневым и менее подробным условиям. Полные наборы аннотационных данных можно загрузить с веб-сайта GO. Чтобы поддержать разработку аннотаций, Консорциум GO проводит семинары и наставляет новые группы кураторов и разработчиков.

Многие алгоритмы машинного обучения были разработаны и реализованы для прогнозирования аннотаций генной онтологии.

Пример аннотации

Продукт гена: актин, альфа-сердечная мышца 1, UniProtKB: P68032
Термин GO: сокращение сердца; GO: 0060047 (биологический процесс)
Код доказательства: выведен из мутантного фенотипа (IMP)
Ссылка: PMID 17611253
Назначено : UniProtKB, 6 июня 2008 г.

Источник данных:

Инструменты

Существует большое количество инструментов, доступных как в Интернете, так и для загрузки, которые используют данные, предоставленные проектом GO. Подавляющее большинство из них поступает от третьих лиц; Консорциум GO разрабатывает и поддерживает два инструмента: AmiGO и OBO-Edit .

AmiGO - это веб-приложение, которое позволяет пользователям запрашивать, просматривать и визуализировать онтологии и данные аннотаций генных продуктов. Он также имеет инструмент BLAST, инструменты, позволяющие анализировать большие наборы данных, и интерфейс для прямого запроса базы данных GO.

AmiGO можно использовать онлайн на веб-сайте GO для доступа к данным предоставляется Консорциумом GO или может быть загружен и установлен для локального использования в любой базе данных, использующей схему базы данных GO (например,). Это бесплатное программное обеспечение с открытым исходным кодом и доступно как часть распространения программного обеспечения go-dev.

OBO-Edit - это независимый от платформы редактор онтологий с открытым исходным кодом, разработанный и поддерживаемый Gene Консорциум онтологий. Он реализован в Java и использует ориентированный на граф подход для отображения и редактирования онтологий. OBO-Edit включает в себя комплексный интерфейс поиска и фильтрации с возможностью отображать подмножества терминов, чтобы сделать их визуально различимыми; пользовательский интерфейс также можно настроить в соответствии с предпочтениями пользователя. OBO-Edit также имеет модуль рассуждений , который может выводить ссылки, которые не были явно указаны, на основе существующих отношений и их свойств. Хотя он был разработан для биомедицинских онтологий, OBO-Edit можно использовать для просмотра, поиска и редактирования любой онтологии. Его можно бесплатно загрузить.

Консорциум

Консорциум генных онтологий - это набор биологических баз данных и исследовательских групп, активно участвующих в проекте генной онтологии. Сюда входят несколько баз данных модельных организмов и баз данных многовидовых белков, группы разработки программного обеспечения и специальная редакция.

История

Генная онтология была первоначально создана в 1998 году консорциумом исследователей, изучающих геномы трех модельных организмов : Drosophila melanogaster (плодовая муха), Mus musculus (мышь) и Saccharomyces cerevisiae (пивные или пекарские дрожжи). Многие другие Базы данных модельных организмов присоединились к Консорциуму генных онтологий, предоставляя не только аннотационные данные, но также внося свой вклад в разработку онтологий и инструментов для просмотра и применения данных. Многие крупные базы данных по растениям, животным и микроорганизмам вносят свой вклад в этот проект. По состоянию на июль 2019 года GO содержит 44 945 терминов; имеется 6 408 283 аннотаций к 4 467 различным биологическим организмам. Существует значительный объем литературы по разработке и использованию GO, и он стал стандартным инструментом в арсенале биоинформатики. Их цели включают три аспекта: построение генной онтологии, присвоение онтологии генам / генным продуктам и разработка программного обеспечения и баз данных для первых двух объектов.

Некоторые анализы онтологии генов с использованием формальных, независимых от предметной области свойств классов (метасвойств) также начинают появляться. Например, онтологический анализ биологических онтологий см.

См. Также

Ссылки

Внешние ссылки

Викиданные имеют свойство:
  • AmiGO - текущий официальный веб- набор инструментов для поиска и просмотра базы данных Gene Ontology
  • Консорциум генных онтологий - официальный сайт
  • PlantRegMap - аннотация GO для 165 видов растений и анализ обогащения GO
  • SimCT - на базе Интернета инструмент для отображения взаимосвязей между биологическими объектами, аннотированными в онтологию, в виде дерева кластеризации.
  • SerbGO - инструмент GO для сравнения возможностей различных программ, чтобы показать их общие черты и их различия, и найти, какие инструменты, если таковые имеются, обладают некоторыми необходимыми пользователю возможностями для анализа GO.
  • Доменно-ориентированная генная онтология - dat база доменно-ориентированных онтологий функций, фенотипов, заболеваний и др.
Последняя правка сделана 2021-05-21 14:23:10
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте