KEGG

редактировать
KEGG
База данных KEGG logo.gif
Содержимое
ОписаниеБиоинформатический ресурс для расшифровки генома.
Организмы Все
Связаться
Исследовательский центр Киотский университет
Лаборатория Лаборатории Канехиса
Основное упоминаниеPMID 10592173
Дата выпуска1995
Доступ
Веб-сайтwww.kegg.jp
Веб-сервис URL-адресREST см. KEGG API
Инструменты
Интернет KEGG Mapper

KEGG (Киотская энциклопедия генов и геномов ) - это набор баз данных, касающихся геномов, биологических пути, болезни, наркотики и химические вещества. KEGG используется для биоинформатики исследований и образования, включая анализ данных в геномике, метагеномике, метаболомике и других омиках исследования, моделирование и моделирование в системной биологии и трансляционные исследования в разработке лекарств.

Содержание

  • 1 Введение
  • 2 Базы данных
    • 2.1 Системы информация
    • 2.2 Геномная информация
    • 2.3 Химическая информация
    • 2.4 Информация о здоровье
  • 3 Модель подписки
  • 4 См. также
  • 5 Ссылки
  • 6 Внешние ссылки

Введение

Проект базы данных KEGG был инициирован в 1995 году Минору Канехиса, профессором Института химических исследований, Киотский университет, в рамках осуществлявшейся тогда японской Программы генома человека. Предвидя потребность в компьютеризированном ресурсе, который можно использовать для биологической интерпретации данных последовательности генома, он начал разработку базы данных KEGG PATHWAY. Это набор составленных вручную карт путей KEGG, представляющих экспериментальные знания о метаболизме и различных других функциях клетки и организма. Каждая карта пути содержит сеть молекулярных взаимодействий и реакций и предназначена для связывания генов в геноме с продуктами генов (в основном белками ) в этом пути. Это позволило провести анализ, называемый картированием путей KEGG, при котором содержание гена в геноме сравнивается с базой данных KEGG PATHWAY, чтобы изучить, какие пути и связанные с ними функции, вероятно, закодированы в геноме.

По словам разработчиков, KEGG является «компьютерным представлением» биологической системы. Он объединяет строительные блоки и схемы соединений системы - в частности, генетические строительные блоки генов и белков, химические строительные блоки малых молекул и реакций, а также схемы соединений молекулярных взаимодействий и реакционных сетей. Эта концепция реализована в следующих базах данных KEGG, которые подразделяются на системы, геномную, химическую и медицинскую информацию.

Базы данных

Системная информация

База данных KEGG PATHWAY, w База данных диаграмм Иринга является ядром ресурса KEGG. Это набор карт путей, объединяющих множество объектов, включая гены, белки, РНК, химические соединения, гликаны и химические реакции, а также гены болезней и мишени для лекарств, которые хранятся в виде отдельных записей в других базах данных KEGG. Карты путей подразделяются на следующие разделы:

Раздел метаболизма содержит эстетически нарисованные глобальные карты, показывающие общую картину метаболизма, в дополнение к обычным картам метаболических путей. Глобальные карты с низким разрешением могут использоваться, например, для сравнения метаболических возможностей различных организмов в исследованиях геномики и различных образцов окружающей среды в исследованиях метагеномики. Напротив, модули KEGG в базе данных KEGG MODULE представляют собой локализованные электрические схемы с более высоким разрешением, представляющие более узкие функциональные единицы в пределах карты путей, такие как подпути, сохраненные среди определенных групп организмов и молекулярных комплексов. Модули KEGG определяются как характерные наборы генов, которые могут быть связаны с конкретными метаболическими возможностями и другими фенотипическими особенностями, чтобы их можно было использовать для автоматической интерпретации данных генома и метагенома.

Еще одна база данных, дополняющая KEGG PATHWAY, - это база данных KEGG BRITE. Это база данных онтологий , содержащая иерархические классификации различных сущностей, включая гены, белки, организмы, болезни, лекарства и химические соединения. В то время как KEGG PATHWAY ограничивается молекулярными взаимодействиями и реакциями этих сущностей, KEGG BRITE включает в себя множество различных типов отношений.

Геномная информация

Через несколько месяцев после начала проекта KEGG в 1995 г. был опубликован первый отчет о полностью секвенированном бактериальном геноме. С тех пор все опубликованные полные геномы накапливаются в KEGG как для эукариот, так и для прокариот. База данных KEGG GENES содержит информацию на уровне генов / белков, а база данных KEGG GENOME содержит информацию на уровне организма для этих геномов. База данных KEGG GENES состоит из наборов генов для полных геномов, и для генов в каждом наборе даны аннотации в форме установления соответствия схемам соединений карт путей KEGG, модулей KEGG и иерархий BRITE.

Эти соответствия производятся с использованием концепции ортологов. Карты путей KEGG составлены на основе экспериментальных данных на конкретных организмах, но они разработаны так, чтобы их можно было применить и к другим организмам, поскольку разные организмы, такие как человек и мышь, часто имеют одинаковые пути, состоящие из функционально идентичных генов, называемых ортологичными генами или ортологи. Все гены в базе данных KEGG GENES сгруппированы в такие ортологи в базе данных KEGG ORTHOLOGY (KO). Поскольку узлам (генным продуктам) карт путей KEGG, а также модулям KEGG и иерархиям BRITE присваиваются идентификаторы KO, соответствия устанавливаются после того, как гены в геноме аннотируются идентификаторами KO с помощью аннотации генома Процедура в KEGG.

Химическая информация

Карты метаболических путей KEGG составлены для представления двойных аспектов метаболической сети: геномной сети того, как кодируются геномом ферменты связаны, чтобы катализировать последовательные реакции и химическую сеть того, как химические структуры субстратов и продуктов трансформируются этими реакциями. Набор генов ферментов в геноме будет определять сети ферментных отношений при наложении на карты путей KEGG, которые, в свою очередь, характеризуют сети трансформации химической структуры, позволяя интерпретировать биосинтетические и биодеградационные потенциалы организм. В качестве альтернативы набор метаболитов, идентифицированных в метаболоме, приведет к пониманию ферментативных путей и вовлеченных ферментных генов.

Базы данных в категории химической информации, которые вместе называются KEGG LIGAND, организованы путем сбора информации о химической сети. В начале проекта KEGG KEGG LIGAND состоял из трех баз данных: KEGG COMPOUND для химических соединений, KEGG REACTION для химических реакций и KEGG ENZYME для реакций в номенклатуре ферментов. В настоящее время существуют дополнительные базы данных: KEGG GLYCAN для гликанов и две вспомогательные базы данных реакций, называемые RPAIR (выравнивание пар реагентов) и RCLASS (класс реакции). KEGG COMPOUND также был расширен за счет включения различных соединений, таких как ксенобиотики, помимо метаболитов.

Информация о здоровье

В KEGG заболевания рассматриваются как нарушенные состояния биологической системы, вызванные возмущающими воздействиями генетических факторов и факторов окружающей среды, а лекарственные препараты рассматриваются как различные типы возмущающих факторов. База данных KEGG PATHWAY включает не только нормальные состояния, но и возмущенные состояния биологических систем. Однако карты путей распространения болезни не могут быть составлены для большинства болезней, поскольку молекулярные механизмы недостаточно изучены. Альтернативный подход используется в базе данных KEGG DISEASE, которая просто каталогизирует известные генетические факторы и факторы окружающей среды болезней. Эти каталоги могут в конечном итоге привести к более полным схемам заболеваний.

База данных KEGG DRUG содержит активные ингредиенты из одобренных препаратов в Японии, США и Европе. Они различаются по химическим структурам и / или химическим компонентам и связаны с целевыми молекулами, метаболизирующими ферментами и другой сетевой информацией о молекулярных взаимодействиях в картах путей KEGG и иерархиях BRITE. Это позволяет проводить комплексный анализ взаимодействия лекарств с геномной информацией. Необработанные наркотики и другие вещества, влияющие на здоровье, которые не входят в категорию одобренных лекарств, хранятся в базе данных KEGG ENVIRON. Базы данных в категории информации о здоровье вместе называются KEGG MEDICUS, что также включает в себя вкладыши со всеми лекарствами, продаваемыми в Японии.

Модель подписки

В июле 2011 года KEGG представила модель подписки для загрузки по FTP из-за значительного сокращения государственного финансирования. KEGG по-прежнему находится в свободном доступе через его веб-сайт, но модель подписки вызвала дискуссии об устойчивости баз данных биоинформатики.

См. Также

Ссылки

Внешние ссылки

Викиданные имеют свойство:
Последняя правка сделана 2021-05-25 08:16:11
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: mail@alphapedia.ru
Соглашение
О проекте