База данных генома крысы

редактировать
RGD
Содержимое
ОписаниеБаза данных генома крысы
Организмы Rattus norvegicus (крыса)
Связаться
Исследовательский центр Медицинский колледж Висконсина
Лаборатория Биомедицинская инженерия
Авторы Энн Э. Квитек, доктор философии
Начальная школа citationPMID 25355511
Доступ
Веб-сайтrgd.mcw.edu
URL-адрес загрузкиRGD Data Release

The База данных генома крыс (RGD ) является основным местом для получения геномики, генетики, физиологии и функциональных данных крыс, а также данных для сравнительной геномики крыс, человека и мышь. RGD отвечает за прикрепление биологической информации к геному крысы с помощью структурированного словаря или онтологии, аннотаций, присвоенных генам и локусам количественных признаков (QTL), а также за консолидацию данных по линии крыс и их предоставление исследовательскому сообществу. RGD работает с такими группами, как Program for Genomic Applications at MCW и Национальный проект биоресурсов для крыс (NBPR-Rat) в Японии, чтобы собрать и предоставить исчерпывающие физиологические данные для различных линий крыс. Они также разрабатывают набор инструментов для добычи и анализа геномных, физиологических и функциональных данных для крыс, а также сравнительных данных для крыс, мышей и человека.

RGD возникла как совместная работа ведущих исследовательских институтов, занимающихся генетическими и геномными исследованиями крыс. Его целью, как указано в RFA: HL-99-013, было создание базы данных генома крыс для сбора, консолидации и интеграции данных, полученных в ходе текущих генетических и геномных исследований крыс, и обеспечения широкого доступа к этим данным научному сообществу. Вторичной, но важной целью было обеспечить отслеживание картированных позиций для локусов количественных признаков, известных мутаций и других фенотипических данных.

Крыса по-прежнему широко используется исследователями в качестве модельного организма для изучения фармакологии, токсикологии, общей физиологии, а также биологии и патофизиологии заболеваний. В последние годы наблюдается быстрый рост генетических и геномных данных крыс. В дополнение к этому, База данных генома крысы стала основным источником информации о крысах для исследований и теперь содержит информацию не только по генетике и геномике, но также по физиологии и молекулярной биологии. Для всех этих областей доступны инструменты и страницы с данными, которые курирует персонал RGD.

Содержание
  • 1 Данные
  • 2 Инструменты для генома
    • 2.1 Инструменты для генома, разработанные в RGD
    • 2.2 Сторонний геном инструменты, адаптированные для использования с данными RGD
  • 3 Дополнительные данные и инструменты
    • 3.1 Портал фенотипов и моделей
    • 3.2 Заболевания
    • 3.3 Пути развития
    • 3.4 Нокауты
  • 4 Информационно-просветительская деятельность и образование в сообществе
  • 5 Финансирование
  • 6 Номера доступа и сборка генома
  • 7 Ссылки
Данные

На странице данных RGD перечислены восемь типов данных, хранящихся в базе данных: Гены, QTL, Маркеры, Карты, Штаммы, Онтологии, Последовательности и Ссылки. Из них шесть активно используются и регулярно обновляются. Тип данных RGD «Карты» относится к устаревшим генетическим и радиационным гибридным картам. Эти данные были в значительной степени вытеснены последовательностью полного генома крысы. Тип данных «Последовательности» не является полным списком геномных, транскрипционных или белковых последовательностей, а скорее содержит последовательности праймеров ПЦР, которые определяют маркеры простого полиморфизма длины последовательности (SSLP) и маркеры экспрессируемой последовательности (EST). Такие последовательности полезны в первую очередь для исследователей, все еще использующих эти маркеры для генотипирования своих животных и для различения одноименных маркеров. Шесть основных типов данных в RGD следующие:

  • Гены : начальные записи генов импортируются / обновляются из базы данных генов Национального центра биотехнологической информации (NCBI ) на еженедельной основе. Данные, импортируемые во время этого процесса, включают идентификаторы генов, идентификаторы нуклеотидов и белков Genbank / RefSeq, идентификаторы групп HomoloGene и идентификаторы генов, транскриптов и белков Ensembl. Дополнительные данные, связанные с белками, импортируются из базы данных UniProtKB. Кураторы RGD просматривают литературу и вручную корректируют GO, болезни, фенотипы и пути для генов крыс, болезни и пути для генов мышей, а также болезни, фенотипы и пути для генов человека. Кроме того, сайт импортирует аннотации GO для генов мыши и человека из Консорциума GO, электронные аннотации крыс из UniProt и аннотации фенотипа мыши из Базы данных генома мышей / Mouse Genome Informatics (MGD / MGI ).
  • QTL : сотрудники RGD вручную обрабатывают данные для QTL крысы и человека из литературы, в которой существуют такие публикации, или из записей, непосредственно предоставленных исследователями. Записи QTL мыши, включая назначения онтологии фенотипа млекопитающих (MP), импортируются непосредственно из MGI.Для QTL крысы и человека курирование включает назначение аннотаций MP и онтологии заболевания. Положения QTL автоматически назначаются на основе геномных положений пика и / или фланкирующих маркеров или однонуклеотидных полиморфизмов (SNP). Записи QTL связаны с информацией о родственных штаммах, гены-кандидаты, ассоциированные маркеры и родственные QTL.
  • Штаммы : Что касается записей QTL, записи штаммов RGD либо вручную собраны из литературы, либо представлены исследователями. Записи о штаммах включают информацию о происхождении и доступности штамма, связанных фенотипах, о том, является ли штамм моделью для человеческого заболевания, и любую доступную информацию о разведении, поведении, содержании и т. Д. Записи о штаммах связаны с информацией о связанных генах и QTL, ассоциированные штаммы (например, родительские штаммы или субштаммы) и, если возможно, штамм-специфические варианты нуклеотидов. Для конгенных и мутантных штаммов положения генома присваиваются интрогрессивной области (конгенные штаммы) или местоположению мутированной последовательности (мутантные штаммы). RGD не импортирует данные для линий мышей.
  • Маркеры : поскольку генетические маркеры, такие как SSLP и EST, использовались и продолжают использоваться для QTL и штаммов, RGD хранит данные маркеров для крысы, человека и мыши. Данные маркеров включают последовательности связанных прямых и обратных праймеров ПЦР, геномные позиции и ссылки на базу данных зондов NCBI. Записи-маркеры связаны с соответствующими записями QTL, штаммов и генов.
  • Онтологии : Чтобы сделать данные RGD удобочитаемыми и доступными для вычислительного анализа и поиска, RGD полагается на использование нескольких онтологий. По состоянию на июль 2015 года RGD использовала 16 различных онтологий для выражения различных типов данных, применимых к различным типам данных RGD. Аннотации онтологий назначаются кураторами вручную или импортируются из внешних источников с помощью автоматизированных конвейеров. Шесть онтологий, используемых в RGD, были созданы или совместно созданы в RGD, а семь находятся в разработке сотрудниками и / или сотрудниками RGD, это онтологии для Pathway (PW), штаммов крыс (RS), признаков позвоночных (VT), Болезнь (RDO), клинические измерения (CMO), методы измерения (MMO) и экспериментальные условия (XCO). Онтологии, импортированные из внешних источников, обновляются еженедельно.
  • Ссылки : Ссылки на RGD - это научные публикации, которые использовались для кураторства, или источники для объектов данных, таких как QTL и штаммы. Для ссылок, доступных через PubMed NCBI, импортированные данные включают заголовок, авторов, цитирование и идентификатор PubMed. В некоторых случаях ссылка представляет собой внутреннюю запись для таких процессов, как автоматизированные конвейеры или личное общение, что дает пользователям базы данных указание на источник конкретной части данных. Записи PubMed для них недоступны. Каждая справочная запись связана со всеми данными, подобранными из этой статьи, включая гены, QTL, штаммы и аннотации онтологий.
Инструменты генома

Инструменты генома RGD включают как программные инструменты, разработанные в RGD, так и инструменты сторонних производителей. источники.

Геномные инструменты, разработанные в RGD

RGD разрабатывает сетевые инструменты, предназначенные для использования данных, хранящихся в базе данных RGD, для анализа на крысах и между видами. К ним относятся:

  • Gene Annotator : Инструмент Gene Annotator или GA принимает в качестве входных данных список символов генов, идентификаторы RGD, номера доступа GenBank, идентификаторы Ensembl и / или хромосомную область и извлекает ортологи генов, внешнюю базу данных идентификаторы и аннотации онтологий для соответствующих генов в RGD. Данные можно загрузить в электронную таблицу Excel или проанализировать в инструменте. Функция «Распространение аннотаций» отображает список терминов в каждой из семи категорий с процентным соотношением генов из входного списка с аннотациями к каждому термину. Функция «Comparison Heat Map» позволяет сравнивать аннотации для генов во входном списке в двух онтологиях или в двух ветвях одной и той же онтологии.
  • Variant Visualizer : Variant Visualizer (VV) - это инструмент просмотра и анализа для полиморфизм последовательностей, специфичный для штамма крыс. VV принимает в качестве входных данных список символов генов или область генома, определяемую хромосомой, положением начала и конца или двумя символами гена или маркеров. Пользователь также должен выбрать интересующие его штаммы из списка штаммов, для которых существуют полные геномные последовательности, и может установить параметры для вариантов в наборе результатов. Результатом является отображение вариантов в виде тепловой карты. Дополнительную информацию по отдельным вариантам можно просмотреть на «панели деталей».
  • OLGA - генератор и анализатор списка объектов : OLGA - это поисковая система, разработанная для того, чтобы пользователи могли выполнять несколько запросов, генерировать список объектов из каждый запрос и гибко комбинируйте результаты. OLGA принимает в качестве входных данных либо список символов объекта, либо параметры поиска на основе аннотаций онтологии или положения. Окончательный список генов, QTL или штаммов можно загрузить или отправить в инструмент GA, Variant Visualizer или Genome Viewer из инструмента.
  • Genome Viewer : инструмент Genome Viewer (GViewer) предоставляет пользователям полное представление генома генов, QTL и картированных штаммов с аннотированием функции, биологического процесса, клеточного компонента, фенотипа, заболевания, пути или химического взаимодействия. GViewer позволяет выполнять логический поиск в нескольких онтологиях. Выходные данные отображаются относительно кариотипа генома крысы.
  • Overgo Probe Designer : Overgo зонды представляют собой пары частично перекрывающихся 22-мерных олигонуклеотидов, полученных из геномной последовательности с замаскированным повторами и используемых в качестве зондов с высокой специфической активностью для картирования генома. Инструмент Overgo Probe Designer принимает в качестве входных данных нуклеотидную последовательность и выводит список оптимизированных последовательностей зондов, содержащих необходимые 8 нуклеотидов, перекрывающиеся на их 3'-концах.
  • Гаплотип ACP : Гаплотип ACP создает «визуальный гаплотип», который может быть использован для идентификации консервативных и неконсервативных хромосомных областей между любыми из 48 линий крыс, охарактеризованных в рамках проекта ACP. Для выбранной хромосомы и между выбранными штаммами инструмент сравнивает данные размера аллелей для микросателлитных маркеров на выбранной генетической карте или карте RH.
  • SNPlotyper : SNPlotyper - это инструмент визуализации и анализа данных SNP крыс, импортированных из dbSNP. и Ensembl. Он позволяет пользователям просматривать блоки гаплотипов, общие для штаммов, и определять информативные (полиморфные) маркеры между двумя или более штаммами. Данные в SNPlotyper являются устаревшими данными генотипирования и не включают штамм-специфические варианты, полученные из WGS линий крыс.

Сторонние инструменты для генома, адаптированные для использования с данными RGD

RGD предлагает несколько сторонних программ инструменты, адаптированные для использования на веб-сайте с использованием данных, хранящихся в базе данных RGD. К ним относятся:

  • Геномные браузеры : по состоянию на июль 2015 года RGD поддерживал два типа геномных браузеров для просмотра данных для крысы, мыши и человека. Оба инструмента, GBrowse и JBrowse, были разработаны или разрабатываются Базой данных Generic Model Organism. Эти инструменты позволяют пользователю просматривать местоположение генетического ориентира (последовательности, гена, локуса, маркера и / или олигонуклеотида) в геноме соответствующего вида. Они также позволяют проводить сравнения между видами с помощью «следов синтении» и ссылок между экземплярами браузеров для разных видов.
  • RatMine : RatMine - это ориентированная на крыс версия программного обеспечения InterMine. Он позволяет пользователям добывать и анализировать данные о крысах из различных баз данных, включая RGD, NCBI, UniProtKB и Ensembl, в одном месте с использованием согласованного формата. Платформа InterMine была адаптирована для нескольких видов в других базах данных и предназначена для взаимодействия между экземплярами, чтобы пользователи могли запрашивать разные виды из интерфейса RatMine.
  • Виртуальная сравнительная карта : Виртуальная сравнительная карта (VCMap) была первоначально был разработан для изучения синтенных взаимоотношений между геномами крысы, мыши и человека. Теперь доступна новая версия VCMap, которая также включает корову, свинью и курицу. Пользователи выбирают «основной» или «основной» вид, а затем могут просматривать синтенические области у одного или нескольких других видов.
Дополнительные данные и инструменты

Портал фенотипов и моделей

Портал RGD Phenotypes and Models фокусируется на штаммах, фенотипах и крысах как модельном организме для физиологии и болезни. Портал «Фенотипы и модели» состоит из пяти разделов: «Фенотипы», «Штаммы и модели», «Знакомьтесь, Джо Рэт», «PhenoMiner» и «Медицинские записи штаммов».

  • Фенотипы : раздел «Фенотипы» содержит большой объем данных из проекта PhysGen Program for Genomic Applications, проекта, финансируемого NHLBI, для «разработки консомных и нокаутных линий крыс, фенотипической характеристики этих линий и предоставления этих ресурсов для научное сообщество ". Категории данных включают измерения сердечно-сосудистой, почечной и респираторной функции, химического состава крови, морфологии тела и поведения. Также предоставляются ссылки на протоколы фенотипирования крыс и аналогичные высокопроизводительные данные фенотипирования в Национальном проекте биоресурсов для крыс в Японии (NBRP-Rat).
  • Штаммы и модели : раздел «Штаммы и модели» содержит общие сведения информация о линиях крыс, включая информацию о доступности линий и животноводстве, а также ссылки на поиск по линиям RGD и обзор статей о линиях крыс. Раздел также включает подраздел о моделях заболеваний, в котором дается подробная информация о том, какие линии крыс использовались в качестве моделей сердечно-сосудистых заболеваний человека, неврологических заболеваний, рака молочной железы, диабета, респираторных заболеваний, а также иммунных и воспалительных заболеваний.
  • Знакомьтесь, Джо Рэт. : «Знакомьтесь, Джо Рэт» разработан как общий информационный ресурс для исследователей крыс. Страницы Photos и Images содержат ссылки на изображения родительских и консомических штаммов PGA / PhysGen, которые, в свою очередь, ссылаются на данные по этим штаммам. "Ratday" ссылается на годовой календарь крыс RGD. «Представления сообщества» предоставляют информацию и формы для отправки фотографий, для регистрации штаммов и для предоставления количественных данных фенотипа для PhenoMiner. Последний подраздел содержит информацию о наличии штамма.
  • PhenoMiner : PhenoMiner - это база данных и веб-приложение для поиска и анализа количественных данных фенотипа крыс. Данные аннотируются онтологиями для линии крыс, клинических измерений, методов измерения и условий эксперимента. Эксперименты классифицируются по признаку или заболеванию, оцениваемому путем измерения. Использование стандартизированных словарей и форматов данных позволяет сравнивать значения в разных экспериментах для одного и того же измерения. Страница результатов PhenoMiner включает график значений измерений и загружаемую таблицу значений с соответствующими метаданными. Предоставляется ссылка, чтобы дать пользователям возможность отправлять свои собственные данные в базу данных.
  • Медицинские записи о штаммах : Медицинские записи о штаммах (SMR) RGD предназначены для обобщения того, что известно о конкретном штамме. Представлена ​​такая информация, как окраска шерсти, средний вес тела в разные моменты времени как для самцов, так и для самок, а также информация о воспроизводстве. Средние значения для количественных измерений фенотипа, таких как артериальное давление, частота сердечных сокращений и биохимический анализ крови для крыс этой линии в стандартных / контрольных условиях, приведены вместе с соответствующим диапазоном значений для других обычно используемых линий. Каждый SMR связан с источником (ами), из которого может быть получен штамм, с PhenoMiner для получения количественных данных фенотипа и с данными о вариантах, QTL и экспрессии микрочипов.

Заболевания

По состоянию на июль 2015 года в RGD было девять порталы болезней:

Порталы болезней объединяют данные в RGD для определенной категории болезней и представляют их в одной группе страниц. Перечислены гены, QTL и штаммы, аннотированные для любого заболевания в категории, с общегеномным обзором их местоположения у крысы, человека и мыши (см. «Genome Viewer» в Инструменты генома, разработанные в RGD ). Дополнительные разделы портала отображают данные о фенотипах, биологических процессах и путях, связанных с категорией заболевания. Страницы также предоставляют пользователям доступ к информации о линиях крыс, используемых в качестве моделей для одного или нескольких заболеваний в категории, инструментах, которые можно использовать для анализа данных, и дополнительных ресурсах, связанных с категорией болезней.

Pathways

Ресурсы Pathway RGD включают онтологию терминов путей (охватывающих не только метаболические пути, но также болезни, лекарственные препараты, регуляторные и сигнальные пути), а также интерактивные диаграммы компонентов и взаимодействий выбранных путей; «Наборы путей и сети наборов», то есть группы связанных путей, которые все вносят вклад в более широкий процесс, такой как гомеостаз глюкозы или регуляция экспрессии генов; и диаграммы физиологического пути, которые отображают сети органов, тканей, клеток и молекулярных путей на уровне всего животного или систем.

Нокауты

До недавнего времени прямые специфические геномные манипуляции с крысами были невозможны. Однако с появлением таких технологий, как технологии мутагенеза на основе нуклеазы цинкового пальца и CRISPR, это уже не так. Группы, продуцирующие нокауты генов у крыс и другие типы генетически модифицированных крыс, включают Центр генетики человека и молекулярной генетики в MCW. RGD ссылается на информацию о линиях крыс, полученных в этих исследованиях, на страницах о проекте PhysGen Knockout и Центре ресурсов крыс для редактирования генов MCW (GERRC), доступ к которым осуществляется из заголовков страниц RGD. Финансирование как проекта PhysGenKO, так и GERRC поступило от Национального института сердца, легких и крови (NHLBI). Заявленная цель обоих проектов состояла в том, чтобы получить крыс с изменениями в одном или нескольких конкретных генах, связанных с миссией NHLBI. Гены были выдвинуты исследователями на крысах. Кандидатуры рассматривал Внешний консультативный совет. В случае проекта PhysGenKO многие из крыс, произведенных в этой группе, были фенотипированы с использованием стандартизированного протокола высокопроизводительного фенотипирования, и данные доступны в инструменте RGD PhenoMiner.

Информационно-просветительская работа с сообществом

RGD обращается к сообществу исследователей крыс различными способами, включая форум по электронной почте, страницу новостей, страницу в Facebook, а также регулярное посещение научных встреч и презентации на них и конференции. Дополнительные образовательные мероприятия включают создание обучающих видео, как с описанием того, как использовать инструменты и данные RGD, так и по более общим темам, таким как биомедицинские онтологии и биологическая (то есть ген, QTL и штамм) номенклатура. Эти видео размещены на нескольких сайтах онлайн-видеохостинга, включая YouTube.

Финансирование

RGD финансируется грантом HL64541 Национального института сердца, легких и крови (NHLBI) от имени НАЦИОНАЛЬНЫЕ ИНСТИТУТЫ ЗДРАВООХРАНЕНИЯ США. Грант включает дополнительное финансирование Национального института исследования генома человека (NHGRI). По состоянию на июль 2015 года главным исследователем гранта была Мэри Э. Шимояма, доктор философии, которая в начале 2015 года заняла эту руководящую должность у доктора философии Ховарда Дж. Джейкоба.

Номера доступа и сборка генома

По состоянию на июль 2015 г. самая последняя геномная последовательность крысы доступна под номерами доступа AABR07000001-AABR07073554 в международных базах данных последовательностей (GenBank, DDBJ и EMBL). Самая последняя сборка - Rnor_6.0. Уровень сборки - «хромосома», а представление генома - «полное», включая последовательность Y-хромосомы (отсутствует во всех предыдущих сборках).

Ссылки
Последняя правка сделана 2021-06-03 08:50:17
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте