Аннотации ДНК

редактировать

Аннотации ДНК или аннотации генома - это процесс определения местоположения генов и все кодирующие области в геноме и определение того, что эти гены делают. Аннотация (независимо от контекста) - это примечание, добавленное в виде пояснения или комментария. После секвенирования генома его необходимо аннотировать, чтобы понять его смысл.

Для аннотации ДНК ранее неизвестное представление последовательности генетического материала обогащается информацией, относящейся к интрону - границы экзона, регуляторные последовательности, повторы, названия гена и белковые продукты. Эта аннотация хранится в таких файлах, как Mouse Genome Informatics, FlyBase и WormBase. Учебные материалы по некоторым аспектам биологической аннотации из лагеря аннотаций Gene Ontology 2006 г. и аналогичных мероприятий доступны на веб-сайте Gene Ontology.

Национальный центр биомедицинской онтологии (www.bioontology.org) разрабатывает инструменты для автоматического аннотирования записей базы данных на основе текстовых описаний этих записей.

В качестве общего метода dcGO имеет автоматизированную процедуру для статистического вывода ассоциаций между терминами онтологии и доменами белков или комбинациями доменов из существующих аннотаций на уровне гена / белка.

Процесс

Аннотация генома состоит из трех основных этапов:

  1. идентификация частей генома, которые не кодируют белки;
  2. идентификация элементов в геноме, процесс, называемый прогнозирование генов,
  3. присоединение биологической информации к этим элементам.

Инструменты автоматического аннотирования пытаются выполнить эти шаги посредством компьютерного анализа, в отличие от ручного аннотирования (также известного как курирование), в котором задействован человеческий опыт. В идеале эти подходы сосуществуют и дополняют друг друга в одной аннотации конвейер.

Простой метод аннотации генов основан на инструментах поиска на основе гомологии, таких как BLAST, для поиска гомологичных генов в В конкретных базах данных полученная информация затем используется для аннотирования генов и геномов. Однако по мере добавления информации на платформу аннотаций ручные аннотаторы становятся способными деконволюционировать расхождения между генами, которым даны одинаковые аннотации. Некоторые базы данных используют контекстную информацию генома, оценки сходства, экспериментальные данные и интеграцию других ресурсов для предоставления аннотаций генома через свой подход «Подсистемы». Другие базы данных (например, Ensembl ) полагаются на тщательно отобранные источники данных, а также на ряд различных программных инструментов в своем конвейере автоматизированной аннотации генома.

Структурная аннотация состоит из идентификации геномных элементов.

  • ОРС и их локализация
  • структура гена
  • кодирующие области
  • расположение регуляторных мотивов

Функциональная аннотация состоит из присоединения биологической информации к геномным элементам.

  • биохимическая функция
  • биологическая функция
  • включает регуляцию и взаимодействия
  • экспрессию

Эти этапы могут включать как биологические эксперименты, так и in silico анализ. Подходы, основанные на протеогеномике, используют информацию из экспрессируемых белков, часто получаемую из масс-спектрометрии, для улучшения аннотаций геномики.

Было разработано множество программных инструментов, позволяющих ученым просматривать и публиковать аннотации генома; например, MAKER.

аннотация генома остается серьезной проблемой для ученых, исследующих геном человека, теперь, когда последовательности генома более тысячи человек (The 100,000 Genomes Project, UK) и несколько модельных организмов в основном завершены. Определение местоположения генов и других элементов генетического контроля часто описывается как определение биологического «списка частей» для сборки и нормальной работы организма. Ученые все еще находятся на ранней стадии процесса составления этого списка частей и понимания того, как все части «сочетаются друг с другом».

Аннотации генома являются активной областью исследования и вовлекают ряд различных организаций в Сообщество наук о жизни, публикующее результаты своих усилий в общедоступных биологических базах данных, доступных через Интернет и другие электронные средства. Вот алфавитный список текущих проектов, имеющих отношение к аннотации генома:

В Википедии, аннотация генома начала автоматизировать под эгидой портала Gene Wiki, который управляет бот, который собирает данные о генах из исследовательских баз данных и создает на их основе заглушки.

Ссылки

Последняя правка сделана 2021-05-16 09:16:55
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте