Пангеном

редактировать
Пангеномный анализ геномов Streptococcus agalactiae, выполненный с помощью программного обеспечения Anvi'o, разработку которого возглавляет А. Мурат Эрен. Геномы получены от Tettelin et al (2005). Каждый круг соответствует одному геному, а каждый радиус представляет семейство генов. Внизу и справа расположены основные семейства геномов. Некоторые семейства в ядре могут иметь более одного гомологичного гена на геном. В центре слева на рисунке показан геном раковины. В верхнем левом углу показаны семьи из необязательного генома и одиночки.

В области молекулярной биологии и генетики, A pangenome ( pangenome или supragenome) является всем набором генов от всех штаммов в пределах кладов. В более общем смысле, это объединение всех геномов клады. Пангеном может быть разбит на «сердцевинный пангеном», который содержит гены, присутствующие у всех индивидуумов, «пангеном оболочки», который содержит гены, присутствующие в двух или более штаммах, и «облачный пангеном», который содержит гены, встречающиеся только в одиночный штамм. Некоторые авторы также называют облачный геном «дополнительным геномом», содержащим «необязательные» гены, присутствующие в подмножестве штаммов и специфичных для штаммов генов. Обратите внимание, что использование термина «необязательный» подвергается сомнению, по крайней мере, в геномах растений, поскольку вспомогательные гены играют «важную роль в эволюции генома и в сложном взаимодействии между геномом и окружающей средой». Область изучения пангенома называется пангеномика.

Генетический репертуар бактериального вида намного больше, чем содержание генов отдельного штамма. У одних видов пангеномы открытые (или обширные), у других - закрытые. Для видов с закрытым пангеномом очень мало генов добавляется на секвенированный геном (после секвенирования многих штаммов), и размер полного пангенома можно теоретически предсказать. Виды с открытым пангеномом имеют достаточно добавленных генов на каждый дополнительный секвенированный геном, поэтому предсказать размер полного пангенома невозможно. Размер популяции и универсальность ниши были предложены как наиболее влиятельные факторы при определении размера пангенома.

Пангеномы изначально были созданы для видов бактерий и архей, но совсем недавно были разработаны пангеномы эукариот, особенно для видов растений. Исследования растений показали, что динамика пангенома связана с мобильными элементами. Значение пангенома возникает в контексте эволюции, особенно в отношении метагеномики, но также используется в более широком контексте геномики. Весной 2020 года была опубликована книга в открытом доступе, в которой рассматривается концепция пангенома и ее значение, под редакцией Теттелина и Медини.

СОДЕРЖАНИЕ

  • 1 Этимология
  • 2 части пангенома
    • 2.1 Ядро
    • 2.2 Оболочка
    • 2.3 Незаменимый
  • 3 Классификация
    • 3.1 Открытый пангеном
    • 3.2 Закрытый пангеном
  • 4 История
    • 4.1 Пангеном
    • 4.2 Супергеном
    • 4.3 Метапангеном
  • 5 примеров
    • 5.1 Прокариотный пангеном
    • 5.2 Пангеном эукариот
    • 5.3 Вирус пангеном
  • 6 Структуры данных
  • 7 Программные инструменты
  • 8 См. Также
  • 9 ссылки

Этимология

Термин «пангеном» был определен в его нынешнем значении Tettelin et al. в 2005 году; он происходит от греческого слова παν, означающего «весь» или «все», в то время как термин « геном» обычно используется для описания полного генетического материала организма. Tettelin et al. применил этот термин конкретно к бактериям, пангеном которых «включает основной геном, содержащий гены, присутствующие во всех штаммах, и необязательный геном, состоящий из генов, отсутствующих в одном или нескольких штаммах, и генов, уникальных для каждого штамма».

Части пангенома

В пангеноме мы можем идентифицировать три набора генов: Core, Shell и Cloud геном. Ядро генома включает гены, которые присутствуют во всех проанализированных геномах. Чтобы избежать исключения семейств из-за артефактов секвенирования, некоторые авторы рассматривают softcore (встречаемостьgt; 95%). Геном Shell состоит из генов, общих для большинства геномов (встречаемость 10-95%). Семейства генов, присутствующие только в одном геноме или встречающиеся менее 10%, описываются как Dispensable или Cloud геном.

Основной

Является частью пангенома, общей для каждого генома в тестируемом наборе. Некоторые авторы разделили основной пангеном на твердое ядро, те семейства гомологичных генов, которые имеют по крайней мере одну копию семейства, общую для каждого генома (100% геномов), и мягкое ядро ​​или расширенное ядро, эти семейства распределены выше определенного порога. (90%). В исследовании, в котором участвовали пангеномы Bacillus cereus и Staphylococcus aureus, некоторые из которых были выделены на международной пространственной станции, пороговые значения, используемые для сегментации пангеномов, были следующими: «Облако», «Оболочка» и «Ядро», соответствующие гену. семьи с присутствием в lt;10%, от 10 до 95% иgt; 95% геномов, соответственно.

Размер ядра генома и его соотношение с пангеномом зависит от нескольких факторов, но особенно зависит от филогенетического сходства рассматриваемых геномов. Например, ядро ​​двух идентичных геномов также будет полным пангеномом. Ядро рода всегда будет меньше основного генома вида. Гены, которые принадлежат к основному геному, часто связаны с функциями домашнего хозяйства и первичным метаболизмом клона, тем не менее, стержневой ген может также содержать некоторые гены, которые отличают вид от других видов рода, то есть патогенность может быть связана с нишевой приспособление.

Оболочка

Является частью пангенома, общей для большинства геномов пангенома. Не существует общепринятого порога для определения генома раковины, некоторые авторы считают семейство генов частью пангенома раковины, если оно разделяет более 50% геномов пангенома. Семья может быть частью оболочки благодаря нескольким эволюционным динамикам, например, из-за потери гена в линии, где она ранее была частью основного генома, как в случае ферментов в опероне триптофана у Actinomyces, или за счет приобретения и фиксации генов. семейства генов, которое ранее было частью необязательного генома, как, например, ген trpF у нескольких видов Corynebacterium.

Незаменимый

Незаменимый геном - это те семейства генов, общие для минимального подмножества геномов в пангеноме, он включает синглтоны или гены, присутствующие только в одном из геномов. Он также известен как облако или периферический геном. Семейства генов в этой категории часто связаны с экологической адаптацией.

Классификация

а) Закрытые пангеномы характеризуются большими основными геномами и небольшими дополнительными геномами. б) Открытые пангеномы, как правило, имеют небольшие основные геномы и большие дополнительные геномы. c) Размер открытых пангеномов имеет тенденцию увеличиваться с каждым добавленным геномом, в то время как размер закрытых пангеномов имеет тенденцию быть асимптотическим, несмотря на добавление большего количества геномов. Благодаря этой характеристике можно предсказать полный размер пангенома для закрытых пангеномов.

Пангеном можно классифицировать как открытый или закрытый на основе альфа-значения закона Кучи: N знак равно k п - α {\ Displaystyle N = kn ^ {- \ alpha}}

  • N {\ displaystyle N} Количество семейств генов.
  • п {\ displaystyle n} Количество геномов.
  • k {\ displaystyle k} Константа пропорциональности.
  • α {\ displaystyle \ alpha} Экспонента рассчитывается для корректировки кривой количества семейств генов по сравнению с новым геномом.
if     α  1 {\displaystyle \alpha \leq 1} then the pangenome is considered open. if     α gt; 1 {\displaystyle \alpha gt;1} then the pangenome is considered closed.

Обычно программное обеспечение пангенома может вычислить параметры закона Хипа, которые лучше всего описывают поведение данных.

Открытый пангеном

Открытый пангеном возникает, когда в одной таксономической линии продолжает увеличиваться количество новых семейств генов, и это приращение не кажется асимптотическим независимо от того, сколько новых геномов добавлено к пангеному. Escherichia coli - пример вида с открытым пангеномом. Размер любого генома E. coli находится в диапазоне 4000-5000 генов, а размер пангенома, оцененный для этого вида с приблизительно 2000 геномами, состоит из 89000 различных семейств генов. Пангеном доменных бактерий также считается открытым.

Закрытый пангеном

Закрытый пангеном возникает в линии, когда только несколько семейств генов добавляются, когда новые геномы включаются в анализ пангенома, и общее количество семейств генов в пангеноме кажется асимптотическим до одного числа. Считается, что паразитизм и виды, специализирующиеся в какой-либо экологической нише, имеют тенденцию к закрытым пангеномам. Staphylococcus lugdunensis - пример комменсальных бактерий с закрытым пангеномом.

История

Пангеном

Первоначальная концепция пангенома была разработана Tettelin et al. когда они проанализировали геномы восьми изолятов Streptococcus agalactiae, где они описали основной геном, общий для всех изолятов, составляющий примерно 80% любого отдельного генома, плюс необязательный геном, состоящий из частично общих и специфичных для штамма генов. Экстраполяция показала, что резервуар генов в пангеноме S. agalactiae огромен и что новые уникальные гены будут продолжать идентифицироваться даже после секвенирования сотен геномов. Пангеном включает в себя все гены, обнаруженные в секвенированных геномах данного вида микробов, и он может измениться, когда новые геномы секвенируются и включаются в анализ.

Супергеном определяется как все гены, доступные для определенного вида, пангеном, если было доступно секвенирование всех геномов одного вида. Метапангеном - это анализ пангенома, применяемый к метагеномным образцам, при котором объединение генов нескольких видов оценивается для данной среды обитания.

Пангеном геномной линии объясняет изменчивость содержания генов внутри линии. Пангеном развивается благодаря: дупликации генов, динамике роста и потери генов и взаимодействию генома с мобильными элементами, которые формируются в результате отбора и дрейфа. Некоторые исследования указывают на то, что пангеномы прокариот являются результатом адаптивной, а не нейтральной эволюции, которая наделяет виды способностью мигрировать в новые ниши.

Супергеном

Супергеном можно рассматривать как реальный размер пангенома, если все геномы вида были секвенированы. Он определяется как все гены, которые могут быть получены определенным видом. Его нельзя рассчитать напрямую, но его размер можно оценить по размеру пангенома, рассчитанному на основе имеющихся данных о геноме. Оценка размера необязательного генома может вызывать проблемы из-за его зависимости от встречаемости редких генов и геномов. В 2011 году геномная текучесть была предложена в качестве меры для классификации сходства на уровне генов между группами секвенированных изолятов. В некоторых линиях супергеномы действительно кажутся бесконечными, как в случае домена Bacteria.

Метапангеном

«Метапангеном» был определен как результат анализа пангеномов в сочетании с окружающей средой, где изобилие и преобладание кластеров генов и геномов восстанавливаются с помощью метагеномов дробовика. Комбинация метагеномов с пангеномами, также называемая «метапангеномикой», показывает результаты фильтрации пангеномного генофонда на уровне популяции.

Другие авторы считают, что Metapangenomics расширяет концепцию пангенома за счет включения последовательностей генов, полученных от некультивируемых микроорганизмов с помощью метагеномического подхода. Метаангеном включает как последовательности из геномов, собранных в метагеноме ( MAG ), так и из геномов, полученных из культивируемых микроорганизмов. Метаангеномика применялась для оценки разнообразия сообщества, адаптации микробной ниши, эволюции микробов, функциональной активности и сетей взаимодействия сообщества. Платформа Anvi'o разработала рабочий процесс, который объединяет анализ и визуализацию метапангеномов путем создания пангеномов и изучения их вместе с метагеномами.

Примеры

Прокариот пангеном

Пангеном S. pneumoniae. (а) Количество новых генов как функция количества секвенированных геномов. Прогнозируемое количество новых генов резко падает до нуля, когда количество геномов превышает 50. (b) Количество основных генов как функция количества секвенированных геномов. Число основных генов сходится к 1,647 для числа геномов n → ∞. Донати и др.

В 2018 году 87% доступных полногеномных последовательностей были бактериями, что подогревало интерес исследователей к расчету пангеномов прокариот на различных таксономических уровнях. В 2015 году пангеном 44 штаммов бактерий Streptococcus pneumoniae показывает несколько новых генов, обнаруженных при секвенировании каждого нового генома (см. Рисунок). Фактически, прогнозируемое количество новых генов упало до нуля, когда количество геномов превышает 50 (обратите внимание, однако, что это не характерно для всех видов). Это может означать, что S. pneumoniae имеет «закрытый пангеном». Основной источник новых генов в S. пневмонии был стрептококк тШз, из которого гены были переданы в горизонтальном направлении. Размер пангенома S. pneumoniae увеличивался логарифмически с количеством штаммов и линейно с количеством полиморфных сайтов в выбранных геномах, что позволяет предположить, что приобретенные гены накапливаются пропорционально возрасту клонов. Другой пример пангенома прокариот - Prochlorococcus, набор основных геномов намного меньше пангенома, который используется различными экотипами Prochlorococcus. Открытый пангеном наблюдали в изолятах из окружающей среды, таких как Alcaligenes sp. и Serratia sp., ведущие симпатический образ жизни. Тем не менее, открытый пангеном не ограничивается только свободноживущими микроорганизмами. В исследовании 2015 г., проведенном на бактериях Prevotella, выделенных от человека, сравнивались репертуары генов этого вида, полученные из разных участков тела человека. Он также сообщил об открытом пангеноме, демонстрирующем огромное разнообразие генофонда.

Археи также проводят исследования пангенома. Пангеном галобактерий показывает следующие семейства генов в подмножествах пангенома: ядро ​​(300), вариабельные компоненты (Softcore: 998, Cloud: 36531, Shell: 11784).

Пангеном эукариот

Организмы эукариот, такие как грибы, животные и растения, также продемонстрировали наличие пангеномов. У четырех видов грибов, пангеном которых был изучен, от 80 до 90% генных моделей были обнаружены как основные гены. Остальные вспомогательные гены в основном участвовали в патогенезе и устойчивости к противомикробным препаратам.

У животных изучается пангеном человека. В 2010 году исследование показало, что полный пангеном человека будет содержать ~ 19-40 мегабаз новой последовательности, отсутствующей в существующем эталонном геноме. В 2021 году консорциум Human Pangenome поставил цель признать разнообразие генома человека.

Среди растений есть примеры исследований пангенома на модельных видах, как диплоидных, так и полиплоидных, а также постоянно растущий список сельскохозяйственных культур. Возникающей растительной концепцией является концепция пан-NLRome, который представляет собой репертуар белков с богатыми лейцином повтора (NLR), связывающих нуклеотид, внутриклеточных иммунных рецепторов, которые распознают белки патогенов и придают устойчивость к болезням.

Вирус пангеном

Вирусы не обязательно должны иметь гены, широко распространенные среди кладов, как в случае с 16S у бактерий, поэтому основной геном полного вирусного домена пуст. Тем не менее, несколько исследований рассчитали пангеном некоторых вирусных линий. Основной геном шести видов пандоровирусов включает 352 семейства генов, всего 4,7% пангенома, что приводит к открытому пангеному.

Структуры данных

Число секвенированных геномов непрерывно растет, «простого увеличения масштабов существующих биоинформатических конвейеров будет недостаточно для использования всего потенциала таких богатых наборов геномных данных». Графы пангеномов - это новые структуры данных, предназначенные для представления пангеномов и эффективного сопоставления с ними чтения. Они были рассмотрены Eizenga et al.

Программные инструменты

Пангеномный анализ геномов Streptococcus agalactiae. Пример филогении, сделанного с помощью программного обеспечения BPGA. Это программное обеспечение позволяет нам создавать филогении на основе кластеризации основного генома или пангенома. Основные и панфилогенетические реконструкции не обязательно совпадают.

По мере роста интереса к пангеномам было разработано несколько программных инструментов, помогающих анализировать такие данные. Чтобы начать пангеномный анализ, первым шагом является гомогенизация аннотации генома. Для аннотирования всех используемых геномов следует использовать одно и то же программное обеспечение, такое как GeneMark или RAST. В 2015 году группа рассмотрела различные виды анализов и инструменты, которые могут быть доступны исследователю. Для анализа пангеномов разработано семь видов программного обеспечения: программное обеспечение, предназначенное для кластеризации гомологичных генов; идентифицировать SNP ; построить пангеномные профили; построить филогенетические отношения ортологичных генов / семейств штаммов / изолятов; поиск по функциям; аннотация и / или курирование; и визуализация.

Двумя наиболее цитируемыми программными инструментами для пангеномного анализа в конце 2014 года были Panseq и конвейер пангеномного анализа (PGAP). Другие варианты включают BPGA - конвейер пангеномного анализа прокариотических геномов, GET_HOMOLOGUES, Roary. и ПанДелос. В 2015 году был опубликован обзор пангеномов прокариот и пангеномов растений. Одним из первых пакетов программного обеспечения, разработанного для пангеномов растений, был PanTools. и GET_HOMOLOGUES-EST. В 2018 году был выпущен panX, интерактивный веб-инструмент, который позволяет изучать историю эволюции генных семейств. panX может отображать выравнивание геномов, филогенетическое дерево, картирование мутаций и выводы о приобретении и потере семьи на филогенезе ядра генома. В 2019 году OrthoVenn 2.0 позволил сравнительную визуализацию семейств гомологичных генов на диаграммах Венна до 12 геномов. В 2020 году Anvi'o была доступна как мультиомическая платформа, которая содержит пангеномический и метапангеномный анализ, а также рабочие процессы визуализации. В Anvi'o геномы отображаются в виде концентрических кругов, а каждый радиус представляет семейство генов, что позволяет сравнивать более 100 геномов в интерактивной визуализации.

В 2020 году было выпущено вычислительное сравнение инструментов для извлечения пангеномного содержимого на основе генов (таких как GET_HOMOLOGUES, PanDelos, Roary и других). Инструменты сравнивались с методологической точки зрения, анализируя причины, по которым данная методология превосходит другие инструменты. Анализ проводился с учетом различных бактериальных популяций, которые генерируются синтетически путем изменения параметров эволюции. Результаты показывают дифференциацию производительности каждого инструмента, которая зависит от состава входных геномов.

Пример возможных выходов программы BPGA. Пангеномный анализ геномов Streptococcus agalactiae. Слева показано распределение терминов Go по основному / необязательному / уникальному геному. В этом примере категории репликации, рекомбинации и репарации обогащены уникальными семействами генов. Справа показан типичный график пан / ядро, когда добавляется больше геномов, размер ядра уменьшается, и, наоборот, размер пангенома увеличивается.

Смотрите также

использованная литература

Последняя правка сделана 2023-03-19 12:02:35
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте