Частотный спектр аллелей

редактировать

В популяционной генетике, частотный спектр аллелей, иногда называемый частотный спектр сайта, является распределением частот аллелей данного набора локусов (часто SNP ) в совокупность или образец. Поскольку частотный спектр аллелей часто является суммой или сравнением с секвенированными выборками всей популяции, это гистограмма, размер которой зависит от количества секвенированных отдельных хромосом. Каждая запись в частотном спектре записывает общее количество локусов с соответствующей производной частотой аллеля. Предполагается, что локусы, вносящие вклад в частотный спектр, независимо изменяются по частоте. Кроме того, предполагается, что локусы двуаллельные (то есть с двумя аллелями), хотя существуют расширения для многоаллельных частотных спектров.

Многие сводные статистические данные наблюдаемых генетических вариаций сами по себе являются сводными данными частотного спектра аллелей, включая оценки θ {\ displaystyle \ theta}\ theta , такие как Уоттерсона θ W {\ displaystyle \ theta _ {W} }\ theta_W и Таджимы θ π {\ displaystyle \ theta _ {\ pi}}\ theta_ \ pi , D Таджимы, H Фэй и Ву и FST { \ displaystyle F_ {ST}}F_ {ST} .

Содержание

  • 1 Пример
  • 2 Расчет
  • 3 Многопопуляционный частотный спектр аллелей
    • 3.1 Пример
  • 4 Приложения
  • 5 Ссылки

Пример

Частотный спектр аллелей из выборки из n {\ displaystyle n}nхромосом вычисляется путем подсчета количества сайтов с производными частотами аллелей 1 ≤ i ≤ n - 1 {\ displaystyle 1 \ leq i \ leq n-1}1 \ leq i \ leq n-1 . Например, рассмотрим выборку из n = 6 {\ displaystyle n = 6}n = 6 лиц с восемью наблюдаемыми сайтами переменных. В этой таблице 1 указывает, что производный аллель наблюдается в этом сайте, а 0 указывает, что наблюдали предковый аллель.

SNP 1SNP 2SNP 3SNP 4SNP 5SNP 6SNP 7SNP 8
Образец 101000010
Образец 210100010
Образец 301100100
Образец 400001011
Образец 500100010
Образец 600010110
Всего12311251

Аллель частотный спектр может быть записан как вектор x = (x 1, x 2, x 3, x 4, x 5) {\ displaystyle \ mathbf {x} = (x_ {1}, x_ {2}, x_ {3}, x_ {4}, x_ {5})}\ mathbf {x} = (x_1, x_2, x_3, x_4, x_5) , где xi {\ displaystyle x_ {i}}x_ {i} - количество наблюдаемых сайтов с производным аллелем частота я {\ displaystyle i}i . В этом примере наблюдаемый частотный спектр аллеля равен (4, 2, 1, 0, 1) {\ displaystyle (4,2,1,0,1)}(4, 2,1,0,1) из-за четырех экземпляров одного наблюдаемого производного аллеля в конкретном локусе SNP, двух экземпляров двух производных аллелей и так далее.

Расчет

Ожидаемый частотный спектр аллелей может быть рассчитан с использованием подхода слияния или диффузии. Демографическая история популяции и естественный отбор влияют на динамику частоты аллелей, и эти эффекты отражаются в форме частотного спектра аллелей. Для простого случая селективной сегрегации нейтральных аллелей в популяции, которая достигла демографического равновесия (то есть без недавних изменений размера популяции или потока генов), ожидаемый частотный спектр аллелей x = (x 1,…, xn - 1) {\ displaystyle \ mathbf {x} = (x_ {1}, \ ldots, x_ {n-1})}\ mathbf {x} = (x_1, \ ldots, x_ {n-1}) для выборки размером n {\ displaystyle n}nзадается как

xi = θ 1 i, {\ displaystyle x_ {i} = \ theta {\ frac {1} {i}},}x_i = \ theta \ frac {1} {i},

где θ = 2 N μ { \ displaystyle \ theta = 2N \ mu}\ theta = 2N \ mu - частота мутаций в масштабе популяции. Отклонения от демографического равновесия или нейтральности изменят форму ожидаемого частотного спектра.

Для вычисления частотного спектра на основе данных наблюдаемых последовательностей необходимо уметь различать предковые и производные (мутантные) аллели, часто путем сравнения с последовательностью внешней группы. Например, в генетических исследованиях популяций людей, гомологичная эталонная последовательность шимпанзе обычно используется для оценки наследственного аллеля. Однако иногда предковый аллель не может быть определен, и в этом случае вместо него может быть рассчитан частотный спектр свернутого аллеля. В свернутом частотном спектре хранятся наблюдаемые подсчеты частот минорных (наиболее редких) аллелей. Свернутый спектр можно вычислить, объединяя вместе i {\ displaystyle i}i th и (n - i) {\ displaystyle (ni)}( ni) th записей из развернутого спектра, где n {\ displaystyle n}n- количество выбранных индивидуумов.

Многопопуляционный частотный спектр аллелей

Совместный частотный спектр аллелей (JAFS) - это совместное распределение частот аллелей в двух или более связанных популяциях. JAFS для популяций d {\ displaystyle d}d с nj {\ displaystyle n_ {j}}{\ displaystyle n_ { j}} выборкой хромосом в j {\ displaystyle j}j-я популяция - это d {\ displaystyle d}d -мерная гистограмма, в каждой записи которой хранится общее количество сегрегационных сайтов, в которых наблюдается производный аллель. с соответствующей частотой в каждой популяции. Каждая ось гистограммы соответствует генеральной совокупности, а индексы начинаются с 0 ≤ i ≤ nj {\ displaystyle 0 \ leq i \ leq n_ {j}}{\ displaystyle 0 \ leq i \ leq n_ {j}} для j {\ displaystyle j}jth популяция.

Пример

Предположим, мы секвенируем диплоидных особей из двух популяций, 4 особей из популяции 1 и 2 особей из популяции 2. JAFS будет матрица 9 × 5 {\ displaystyle 9 \ times 5}9 \ times5 , индексированная с нуля. Запись [3, 2] {\ displaystyle [3,2]}[3,2] будет записывать количество наблюдаемых полиморфных локусов с производной частотой аллеля 3 в популяции 1 и частотой 2 в популяции 2. [1, 0] {\ displaystyle [1,0]}[1,0] запись будет записывать те локусы с наблюдаемой частотой 1 в популяции 1 и частотой 0 в популяции 2. В [8, 3 ] {\ displaystyle [8,3]}[8, 3] запись будет записывать те локусы с производным аллелем, зафиксированным в популяции 1 (наблюдается во всех хромосомах), и с частотой 3 в популяции 2.

Приложения

Форма частотного спектра аллелей чувствительна к демографии, например, к изменениям размера популяции, миграции и субструктуре, а также к естественному отбору. Путем сравнения наблюдаемых данных, суммированных в частотном спектре, с ожидаемым частотным спектром, рассчитанным в рамках данной демографической модели и модели выбора, можно оценить степень соответствия этой модели данным и использовать вероятность теория для оценки наиболее подходящих параметров модели.

Например, предположим, что популяция пережила недавний период экспоненциального роста и n {\ displaystyle n}nвыборочные последовательности были получены из популяции в конце роста и Частотный спектр наблюдаемых (данных) аллелей был рассчитан с использованием предположительно нейтральной вариации. Демографическая модель будет иметь параметры для экспоненциального темпа роста ρ {\ displaystyle \ rho}\ rho , времени T {\ displaystyle T}T, за которое произошел рост, и эталонный размер популяции N ref {\ displaystyle N_ {ref}}N_ {ref} , предполагая, что популяция находилась в равновесии, когда начался рост. Ожидаемый частотный спектр для данного набора параметров (ρ, T, N ref) {\ displaystyle (\ rho, T, N_ {ref})}(\ rho, T, N_ {ref}) может быть получен с помощью теории диффузии или коалесценции., и по сравнению с частотным спектром данных. Параметры наилучшего соответствия можно найти с использованием максимального правдоподобия.

Этот подход использовался для вывода демографических и селекционных моделей для многих видов, включая человека. Например, Marth et al. (2004) использовали частотные спектры аллелей одной популяции для группы африканцев, европейцев и азиатов, чтобы показать, что узкие места населения имели место в азиатской и европейской демографической истории, но не в африканцах. Совсем недавно Gutenkunst et al. (2009) использовали общий частотный спектр аллелей для тех же трех популяций, чтобы сделать вывод о времени, когда популяции разошлись, и о количестве последующей продолжающейся миграции между ними (см. гипотезу выхода из Африки ). Кроме того, эти методы могут использоваться для оценки паттернов отбора на основе данных частоты аллелей. Например, Boyko et al. (2008) вывели распределение эффектов приспособляемости для вновь возникающих мутаций, используя данные человеческого полиморфизма, которые контролировали эффекты неравновесной демографии.

Ссылки

Последняя правка сделана 2021-06-11 00:45:53
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте