Ka/Ksсоотношение

редактировать
Соотношение, оценивающее баланс между несинонимичными и синонимичными заменами

В генетике Ka/Ksотношение, также известное как ω или dN/dSсоотношение, используется для оценки баланса между нейтральными мутациями, очищающим отбором и полезными мутации, действующие на набор гомологичных генов, кодирующих белок. Он рассчитывается как отношение количества несинонимичных замен на несинонимичный сайт (K a) за заданный период времени к количеству синонимичных замен. на синонимичный сайт (K s) за тот же период. Последние считаются нейтральными, так что соотношение указывает на чистый баланс между вредными и полезными мутациями. Значения K a/Ks, значительно превышающие 1, маловероятны, если по крайней мере некоторые из мутаций не будут полезными. Если предполагается, что полезные мутации вносят небольшой вклад, то K s оценивает степень эволюционного ограничения.

Содержание
  • 1 Контекст
  • 2 Методы
    • 2.1 Приближенные методы
    • 2.2 Методы максимального правдоподобия
    • 2.3 Методы подсчета
  • 3 Интерпретация результатов
  • 4 Полезность
  • 5 Осложнения
  • 6 Ограничения
  • 7 Индивидуальный кодонный подход
  • 8 Примечания
  • 9 Ссылки
  • 10 Дополнительная литература
  • 11 Внешние ссылки
Контекст

Отбор воздействует на вариации фенотипов, которые часто являются результатом мутаций в генах, кодирующих белок . генетический код записан в последовательностях ДНК как кодоны, группы из трех нуклеотидов. Каждый кодон представляет собой единственную аминокислоту в белковой цепи. Однако кодонов (64) больше, чем аминокислот в белках (20), поэтому многие кодоны фактически являются синонимами. Например, кодоны ДНК TTT и TTC оба кодируют аминокислоту фенилаланин, поэтому изменение с третьего T на C не влияет на полученный белок. С другой стороны, кодон GAG кодирует глутаминовую кислоту, в то время как кодон GTG кодирует валин, поэтому переход от среднего A к T действительно изменяет полученный белок в лучшую или (скорее) хуже, значит изменение не синоним. Эти изменения показаны в таблицах ниже.

Отношение K a/Ksизмеряет относительные скорости синонимичных и несинонимичных замен на конкретном сайте.

A точечная мутация, вызывающая синонимичную замену
Тип структурыДоИзменениеПослеРезультат
Кодон в последовательности ДНК TTTбезвредная мутация;. Синонимическая замена TTC
↓ коды для↓ коды для↓ коды для
аминокислоты в белке фенилаланин без измененийфенилаланин нормальный белок, нормальное функционирование
A точечная мутация вызывает несинонимичную замену
Тип структурыДоИзменениеПослеРезультат
Кодон в последовательности ДНК GAGМиссенс-мутация ;. Несинонимичная замена GTG
↓ коды для↓ коды для↓ коды для
амино кислота в белке глутаминовая кислота структурное изменениевалин измененный белок может причинить или не причинить вред. (например, болезнь) или дать новое преимущество
Методы

Способы оценки K a и K s используют выравнивание последовательностей двух или нескольких re нуклеотидные последовательности гомологичных генов, которые кодируют белки (а не являются генетическими переключателями, контролирующими развитие или скорость активности других генов). Методы можно разделить на три группы: приближенные методы, методы максимального правдоподобия и методы подсчета. Однако, если сравниваемые последовательности не имеют отдаленного родства (в этом случае преобладают методы максимального правдоподобия), используемый класс метода оказывает минимальное влияние на полученные результаты; более важны предположения, заложенные в выбранном методе.

Приближенные методы

Приближенные методы включают три основных шага: (1) подсчет количества синонимичных и несинонимичных сайтов в двух последовательностях или оценка это число путем умножения длины последовательности на долю каждого класса замещения; (2) подсчет количества синонимичных и несинонимичных замен; и (3) исправление множественных замен.

Эти этапы, особенно последний, требуют упрощения допущений, если они должны быть достигнуты вычислительным способом; по причинам, обсуждаемым ниже, невозможно точно определить количество множественных замен.

Методы максимального правдоподобия

В подходе максимального правдоподобия используется теория вероятности для завершения всех три шага одновременно. Он оценивает критические параметры, включая расхождение между последовательностями и соотношение переход / трансверсия, путем выведения наиболее вероятных значений для получения входных данных.

Методы подсчета

Для количественной оценки количества замен, можно восстановить наследственную последовательность и записать предполагаемые изменения на участках (прямой подсчет - вероятно, даст заниженную оценку); подгонка коэффициентов замещения на сайтах в заранее определенные категории (байесовский подход; плохо для небольших наборов данных); и генерируют индивидуальную частоту замещения для каждого кодона (затратно с точки зрения вычислений). При наличии достаточного количества данных все три этих подхода будут стремиться к одному и тому же результату.

Интерпретация результатов

Отношение K a/Ksиспользуется для вывода направления и величины естественного отбора действует на гены, кодирующие белки. Отношение больше 1 подразумевает позитивный или дарвиновский отбор (движущее изменение); меньше 1 означает очищающий или стабилизирующий отбор (противодействие изменениям); а соотношение ровно 1 указывает на нейтральный (то есть отрицательный) выбор. Однако сочетание положительного и очищающего отбора в разных точках гена или в разное время его эволюции может нейтрализовать друг друга. Результирующее усредненное значение может замаскировать наличие одного из вариантов выбора и снизить кажущуюся величину другого выбора.

Конечно, необходимо выполнить статистический анализ, чтобы определить, значительно ли результат отличается от 1, или может возникнуть какое-либо очевидное различие в результате ограниченного набора данных. Соответствующий статистический тест для приближенного метода включает аппроксимацию dN - dS нормальным приближением и определение того, попадает ли 0 в центральную область приближения. Для анализа результатов анализа максимального правдоподобия можно использовать более сложные методы правдоподобия, выполняя критерий хи-квадрат, чтобы различать нулевую модель (K a/Ks= 1) и наблюдаемые результаты.

Полезность

Коэффициент K a/Ksявляется более мощным тестом нейтральной модели эволюции, чем многие другие, доступные в популяционной генетике, поскольку требует меньшего количества предположений.

Осложнения

Часто существует систематическая ошибка в частоте, с которой меняются местами различные нуклеотиды, поскольку одни мутации более вероятны, чем другие. Например, некоторые клоны могут заменять C на T чаще, чем они меняют C на A. В случае аминокислоты аспарагин, которая кодируется кодонами AAT или AAC, высокий C->T обменный курс увеличит долю синонимичных замен в этом кодоне, тогда как высокий обменный курс C → A увеличит скорость несинонимичных замен. Поскольку для переходов (T↔C и A↔G) довольно часто предпочтение отдается трансверсиям (другим изменениям), модели должны учитывать возможность неоднородных обменных курсов. Некоторые более простые приближенные методы, такие как методы Мията и Ясунага и Ней и Годжобори, не принимают их во внимание, что сокращает время вычислений за счет точности; эти методы будут систематически переоценивать N и недооценивать S.

Кроме того, может иметь место систематическая ошибка, при которой определенные кодоны являются предпочтительными в гене, поскольку определенная комбинация кодонов может улучшить эффективность трансляции.

Кроме того, с течением времени сайт может подвергаться множественным изменениям. Например, кодон может переключаться с AAA → AAC → AAT → AAA. Невозможно обнаружить множественные замены на одном сайте, поэтому оценка количества замен всегда занижена. Кроме того, в приведенном выше примере две несинонимичные и одна синонимичная замены произошли на третьем сайте; однако, поскольку замены восстанавливали исходную последовательность, нет никаких доказательств какой-либо замены. По мере увеличения времени расхождения между двумя последовательностями увеличивается и количество множественных замен. Таким образом, «длинные ветви» в анализе dN / dS могут привести к недооценке как dN, так и dS, и чем длиннее ветвь, тем сложнее исправить внесенный шум. Конечно, наследственная последовательность обычно неизвестна, и две сравниваемые линии эволюционировали параллельно со времени их последнего общего предка. Этот эффект можно смягчить путем построения наследственной последовательности; точность этой последовательности повышается за счет наличия большого количества последовательностей, происходящих от этого общего предка, для ограничения ее последовательности с помощью филогенетических методов.

Методы, которые учитывают ошибки в использовании и переходе кодонов / скорости трансверсии значительно более надежны, чем те, которые этого не делают.

Ограничения

Хотя коэффициент K a/Ksявляется хорошим индикатором давления отбора на уровне последовательности, часто могут иметь место эволюционные изменения в регуляторной области гена, которая влияет на уровень, время или место экспрессии гена. K a/Ksанализ не обнаружит такого изменения. Он будет рассчитывать только селективное давление в областях, кодирующих белок. Кроме того, отбор, который не вызывает различий на аминокислотном уровне, например, балансирующий отбор, не может быть обнаружен этими методами.

Другая проблема заключается в том, что гетерогенность внутри гена может вызвать результат трудно интерпретировать. Например, если K a/Ks= 1, это может быть связано с ослабленным отбором или с химерой положительного и очищающего отбора в локусе. Решением этого ограничения было бы применение анализа K a/Ksдля многих видов по отдельным кодонам.

Метод K a/Ksтребует достаточно сильного сигнала для обнаружения выделения. Чтобы выявить отбор между клонами, тогда отбор, усредненный по всем сайтам в последовательности, должен давать K a/Ksбольше единицы - настоящий подвиг, если участки гена сильно консервативны. Чтобы обнаружить отбор на определенных участках, тогда отношение K a/Ksдолжно быть больше единицы при усреднении по всем включенным линиям на этом участке - подразумевая, что участок должен находиться под давлением отбора во всех отобранных клонах. Это ограничение можно смягчить, разрешив коэффициенту K a/Ksпринимать несколько значений по сайтам и по линиям; включение большего количества клонов также увеличивает мощность подхода на основе сайтов.

Кроме того, в этом методе отсутствует возможность различать положительные и отрицательные несинонимичные замены. Некоторые аминокислоты химически похожи друг на друга, тогда как другие замены могут помещать аминокислоту с совершенно разными свойствами по отношению к ее предшественнику. В большинстве ситуаций меньшее химическое изменение с большей вероятностью позволит белку продолжать функционировать, а большое химическое изменение может нарушить химическую структуру и вызвать сбой в работе белка. Однако включить это в модель непросто, так как взаимосвязь между нуклеотидным замещением и эффектами измененных химических свойств очень трудно определить.

Дополнительная проблема заключается в том, что влияние времени должно быть включено в анализ, если сравниваемые линии тесно связаны; это потому, что может потребоваться несколько поколений для естественного отбора, чтобы «отсеять» вредные мутации из популяции, особенно если их влияние на приспособленность слабое. Это ограничивает полезность отношения K a/Ksдля сравнения близкородственных популяций.

Подход с использованием индивидуальных кодонов

Дополнительная информация может быть получена путем определения отношения K a/Ksв конкретных кодонах в последовательности гена. Например, область настройки частоты опсина может находиться под повышенным давлением отбора, когда вид колонизирует и адаптируется к новой среде, тогда как область, ответственная за инициализацию нервного сигнала, может подвергаться очищающей селекции. Чтобы обнаружить такие эффекты, в идеале следует рассчитать отношение K a/Ksна каждом участке. Однако это требует больших вычислительных ресурсов, и на практике устанавливается ряд классов K a/Ks, и каждый сайт вписывается в наиболее подходящий класс.

Первым шагом в определении того, действует ли положительный отбор на сайтах, является для сравнения теста, в котором отношение K a/Ksограничено величиной < 1 in all sites to one where it may take any value, and see if permitting Ka/Ksдо превышения 1 на некоторых участках, улучшает соответствие модели. Если это так, то сайты, попадающие в класс, где K a/Ks>1, являются кандидатами на положительный отбор. Эта форма теста может либо определить участки, которые могут быть изучены в ходе дальнейших лабораторных исследований для определения возможного давления отбора; или сайты, которые, как предполагается, имеют функциональную значимость, могут быть отнесены к различным классам K a/Ksдо запуска модели.

Примечания
Ссылки
Дополнительная литература
  • Для простое введение, см. Hurst, L. (2002). «Отношение Ka / Ks: диагностика формы эволюции последовательности». Тенденции в генетике. 18 (9): 486–489. DOI : 10.1016 / S0168-9525 (02) 02722-1. PMID 12175810.
Внешние ссылки
Последняя правка сделана 2021-05-25 09:23:45
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте