GC-content

редактировать
Процент гуанина и цитозина в молекулах ДНК или РНК. Нуклеотидные связи, показывающие пары AT и GC. Стрелки указывают на водородные связи.

В молекулярной биологии и генетике, GC-content (или содержание гуанин-цитозина ) представляет собой процентное содержание азотистых оснований в молекуле ДНК или РНК, которые представляют собой либо гуанин (G), либо цитозин. (К). Эта мера показывает долю оснований G и C из предполагаемых четырех оснований, включая также аденин и тимин в ДНК и аденин и урацил в РНК.

GC-содержание может быть указано для определенного фрагмента ДНК или РНК или для всего генома. Когда он относится к фрагменту, он может обозначать GC-содержание отдельного гена или участка гена (домена), группы генов или кластеров генов, некодирующей области, или синтетический олигонуклеотид, такой как праймер.

Содержание
  • 1 Структура
  • 2 Определение
  • 3 Геномное содержание
    • 3.1 Вариации внутри генома
    • 3.2 Кодирующие последовательности
    • 3.3 Вариации между геномами
  • 4 Приложения
    • 4.1 Молекулярная биология
    • 4.2 Систематика
  • 5 Программные инструменты
  • 6 См. Также
  • 7 Ссылки
  • 8 Внешние links
Структура

Качественно гуанин (G) и цитозин (C) претерпевают определенные водородные связи друг с другом, тогда как аденин (A) связывается конкретно с тимином (T) в ДНК и с урацилом (U) в РНК. Количественно каждая пара оснований GC удерживается вместе тремя водородными связями, в то время как пары оснований AT и AU удерживаются вместе двумя водородными связями. Чтобы подчеркнуть эту разницу, пары оснований часто представлены как «G≡C» по сравнению с «A = T» или «A = U».

ДНК с низким содержанием GC менее стабильна, чем ДНК с высоким содержанием GC; однако сами водородные связи не оказывают особенно значительного влияния на молекулярную стабильность, которая вместо этого вызывается в основном молекулярными взаимодействиями при укладке оснований. Несмотря на более высокую термостабильность, присущую нуклеиновой кислоте с высоким содержанием GC, было обнаружено, что по крайней мере некоторые виды бактерий с ДНК с высоким содержанием GC подвергаются автолиз легче, тем самым снижая долговечность клетки как таковой. Из-за термостабильности пар GC когда-то предполагалось, что высокое содержание GC было необходимой адаптацией к высоким температурам, но эта гипотеза была опровергнута в 2001 году. Несмотря на это, было показано, что существует сильная корреляция между оптимальным ростом прокариот при более высоких температурах и GC-содержанием структурных РНК, таких как рибосомная РНК, транспортная РНК и многие другие некодирующие РНК. Пары оснований AU менее стабильны, чем пары оснований GC, что делает структуры РНК с высоким содержанием GC более устойчивыми к воздействию высоких температур.

Совсем недавно было продемонстрировано, что наиболее важный фактор, способствующий термостабильности двухцепочечных нуклеиновых кислот, на самом деле связан с укладкой оснований соседних оснований, а не с количеством водородных связей между основаниями. Энергия стэкинга для пар GC более благоприятна, чем для пар AT или AU из-за относительного положения экзоциклических групп. Кроме того, существует корреляция между порядком расположения оснований и термостабильностью молекулы в целом.

Определение

GC-содержание обычно выражается в процентах, но иногда в виде отношения (называемого соотношением G + C или соотношением GC ). Процент содержания GC рассчитывается как

G + CA + T + G + C × 100% {\ displaystyle {\ cfrac {G + C} {A + T + G + C}} \ times 100 \%}{\ displaystyle {\ cfrac {G + C} {A + T + G + C}} \ times 100 \%}

, тогда как соотношение AT / GC рассчитывается как

A + TG + C {\ displaystyle {\ cfrac {A + T} {G + C}}}{\ cfrac {A + T} {G + C}} .

Процент содержания GC, а также GC- отношение может быть измерено несколькими способами, но один из простейших методов - это измерение температуры плавления двойной спирали ДНК с использованием спектрофотометрии. Поглощение ДНК на длине волны 260 нм довольно резко возрастает, когда двухцепочечная молекула ДНК разделяется на две одиночные цепи при достаточном нагревании. Наиболее часто используемый протокол для определения GC-соотношений использует проточную цитометрию для большого количества образцов.

В качестве альтернативы, если исследуемая молекула ДНК или РНК была надежно секвенированный, то содержание GC можно точно рассчитать с помощью простой арифметики или с помощью различных общедоступных программных инструментов, таких как бесплатный онлайн-калькулятор GC.

Геномное содержание

Внутри- вариабельность генома

GC-соотношение в геноме заметно варьируется. Эти вариации в GC-соотношении в геномах более сложных организмов приводят к мозаичному образованию с островковыми участками, называемыми изохорами. Это приводит к вариациям интенсивности окрашивания в хромосомах. GC-богатые изохоры обычно включают в себя множество генов, кодирующих белок, и, таким образом, определение GC-соотношений этих конкретных областей способствует картированию богатых генами областей генома.

Кодирующие последовательности

Внутри длинной области геномной последовательности гены часто характеризуются более высоким содержанием GC по сравнению с фоновым содержанием GC для всего генома. Доказательства соотношения GC и длины кодирующей области гена гена показали, что длина кодирующей последовательности прямо пропорциональна более высокому содержанию G + C. Это указывает на тот факт, что стоп-кодон имеет смещение в сторону нуклеотидов A и T, и, таким образом, чем короче последовательность, тем выше смещение AT.

Сравнение более чем 1000 ортологичных генов у млекопитающих показали заметные внутригеномные вариации содержания GC в положении третьего кодона с диапазоном от менее 30% до более 80%.

Межгеномная изменчивость

Содержание GC варьируется у разных организмов, и предполагается, что этому процессу будут способствовать вариации отбора, мутационная ошибка и необъективная рекомбинация. -ассоциированная репарация ДНК.

Среднее содержание GC в геномах человека колеблется от 35% до 60% по 100-килобайтным фрагментам, в среднем 41%. Содержание GC в дрожжах (Saccharomyces cerevisiae ) составляет 38%, а содержание другого распространенного модельного организма, талайского кресс-салата (Arabidopsis thaliana ), составляет 36%. Из-за природы генетического кода для организма практически невозможно иметь геном с содержанием GC, приближающимся к 0% или 100%. Однако разновидностью с чрезвычайно низким содержанием GC является Plasmodium falciparum (GC% = ~ 20%), и обычно принято называть такие примеры богатыми AT, а не бедными GC.

Несколько видов млекопитающих (например, землеройка, микробат, tenrec, кролик ) независимо друг от друга претерпели заметное увеличение в GC-содержании их генов. Эти изменения содержания GC коррелируют с признаками жизненного цикла видов (например, массой тела или продолжительностью жизни) и размером генома и могут быть связаны с молекулярным феноменом, называемым GC-biased. преобразование гена.

Применения

Молекулярная биология

В экспериментах полимеразной цепной реакции (ПЦР) GC-содержание коротких олигонуклеотидов, известных как праймеры часто используются для прогнозирования их температуры отжига с матричной ДНК. Более высокий уровень содержания ГХ указывает на относительно более высокую температуру плавления.

Систематика

проблема видов в неэукариотической таксономии привела к различным предложениям по классификации бактерий, и специальный комитет по согласованию подходов к бактериальной систематике рекомендовал использование GC-соотношений в иерархической классификации более высокого уровня. Например, актинобактерии характеризуются как «бактерии с высоким содержанием GC ». В Streptomyces coelicolor A3 (2) содержание GC составляет 72%.

Программные инструменты

GCSpeciesSorter и TopSort - программные инструменты для классификации видов на основе их содержания GC.

См. Также
Ссылки
Внешние ссылки
  1. Таблица с GC-содержанием всех секвенированных прокариот
  2. Таксономический браузер бактерий на основе соотношения GC на Веб-сайт NCBI.
  3. Коэффициент GC у различных видов.

Последняя правка сделана 2021-05-21 08:41:52
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте