A эталонный геном (также известная как эталонная сборка ) представляет собой цифровую базу данных последовательностей нуклеиновых кислот, собранную учеными в качестве репрезентативного примера набора гены в одном идеализированном индивидуальном организме вида. Поскольку они собраны в результате секвенирования ДНК от ряда отдельных доноров, эталонные геномы неточно представляют набор генов какого-либо отдельного индивидуального организма. Вместо этого ссылка предоставляет гаплоидную мозаику различных последовательностей ДНК от каждого донора. Существуют эталонные геномы для нескольких видов вирусов, бактерий, грибов, растений и животных.
Например, эталонный геном человека GRCh38 от Genome Reference Consortium получен от тринадцати анонимных добровольцев.
Поскольку стоимость секвенирования ДНК падает, а новых полное секвенирование генома появляются технологии, продолжается создание новых последовательностей генома. Эталонные геномы обычно используются в качестве руководства для построения новых геномов, что позволяет собирать их гораздо быстрее и дешевле, чем первоначальный Проект генома человека. У большинства людей, у которых весь геном секвенирован, например, Джеймс Д. Уотсон, геном был собран таким образом. Для большей части генома эталон дает хорошее приближение ДНК любого отдельного человека. Но в регионах с высоким аллельным разнообразием, таких как главный комплекс гистосовместимости у людей и основные белки мочи мышей, эталонный геном может значительно отличаться от других лиц. Сравнение эталонного генома (сборка 36) и генома Ватсона выявило 3,3 миллиона однонуклеотидных полиморфизмов различий, в то время как около 1,4 процента его ДНК вообще не могли быть сопоставлены с эталонным геномом. Для регионов, где, как известно, существует крупномасштабная вариация, наборы альтернативных локусов собираются вместе с эталонным локусом.
Доступ к эталонным геномам можно получить в Интернете в нескольких местах с помощью специальных браузеров, таких как Ensembl или UCSC Genome Browser.
Длину генома можно измерить несколькими способами.
Простой способ измерить длину генома - это подсчитать количество пар оснований в сборке.
Золотой путь - это альтернативная мера длины, исключающая повторяющиеся области, такие как гаплотипы и псевдоавтосомные области. Обычно он создается путем наложения информации о последовательности на физическую карту для объединения информации о каркасе. Это «наилучшая оценка» того, как будет выглядеть геном, и обычно он содержит пробелы, что делает его длиннее, чем типичная сборка пары оснований.
Эталонные геномы человека и мыши поддерживаются и улучшаются Консорциумом эталонных геномов (GRC), группой из менее 20 ученых из ряда исследовательских институтов генома, включая Европейский институт биоинформатики, Национальный центр биотехнологической информации, Институт Сэнгера и Институт генома Макдоннелла в Вашингтонском университете в Сент-Луисе. GRC продолжает улучшать эталонные геномы, создавая новые выравнивания, содержащие меньше пробелов, и исправляя искажения в последовательности.
Контрольный геном человека GRCh38 был выпущен Genome Reference Consortium 17 декабря 2013 года. Эта сборка содержала около 250 пробелов, тогда как в первой версии было около 150 000 пробелов. Сборка ГРЧ38 позволила закрыть или уменьшить более 100 зазоров. Секвенирование нанопор показало закрытие 12 пробелов в эталонной сборке GRCh38 за счет использования сверхдлинных считываний.
Контрольный геном человека получен от тринадцати анонимных добровольцев из Buffalo, Нью-Йорк. Доноры были привлечены с помощью рекламы в The Buffalo News в воскресенье, 23 марта 1997 г. Первые десять мужчин и десять женщин-добровольцев были приглашены на прием к генетическим консультантам и сдать кровь, из которой была извлечена ДНК. В результате обработки образцов ДНК около 80 процентов эталонного генома было получено от восьми человек, а один мужчина, обозначенный как RP11, составляет 66 процентов от общего числа. Система групп крови ABO различается у людей, но эталонный геном человека содержит только аллель O, хотя другие аннотированы ).
Существуют ограничения для ссылки на человека Геном обусловлен тем, что это «единичная» отчетливая последовательность. Из-за этого он специально назван как «ссылка». Основная цель, для которой он предназначен, - это индекс или локатор генетических признаков. Проект 1000 геномов создает базу данных для предоставления информации о вариациях геномов в человеческой популяции.
Последние сборки генома следующие:
Название версии | Дата выпуска | Эквивалентная версия UCSC |
---|---|---|
GRCh38 | декабрь 2013 г. | hg38 |
GRCh37 | февраль 2009 г. | hg19 |
NCBI Build 36.1 | март 2006 | hg18 |
NCBI Build 35 | май 2004 | hg17 |
NCBI Build 34 | июль 2003 | hg16 |
Последние сборки генома мыши следующие:
Название версии | Дата выпуска | Эквивалентная версия UCSC |
---|---|---|
GRCm38 | декабрь 2011 г. | мм10 |
NCBI Build 37 | июль 2007 г. | мм9 |
NCBI Build 36 | февраль 2006 г. | мм8 |
сборка NCBI 35 | август 2005 г. | мм7 |
сборка NCBI 34 | Март 2005 г. | mm6 |