Принцип Харди - Вайнберга

редактировать

принцип в генетике

Пропорции Харди - Вайнберга для двух аллелей : горизонтальная ось показывает две частоты аллелей p и q, а вертикальная ось показывает ожидаемые частоты генотипов. Каждая линия показывает один из трех отдельных генотипов.

В популяционной генетике используется принцип Харди - Вайнберга, также известный как равновесие Харди - Вайнберга, модель, теорема, или закон, гласит, что частоты аллелей и генотипов в процессе роста остаются постоянными от поколения к поколению в отсутствие других эволюционных влияний. Эти влияния включают генетический дрейф, выбор партнера, ассортативное спаривание, естественный отбор, половой отбор, мутация, поток генов, мейотический драйв, генетический автостоп, узкое место популяции, эффект основателя и инбридинг.

В простейшем случае одного локуса с двумя аллелями, обозначенными A и a, с частотами f(A) = p и f(a) = q, соответственно ожидаемые частоты генотипов при случайном скрещивании равны f(AA) = p для AA гомозигот, f(aa) = q для гомозигот aa, и f(Aa) = 2pq для гетерозигот. В отсутствие отбора, мутации, генетического дрейфа или других частотах аллелей p и q постоянны между поколениями, поэтому равновесие достигается.

Принцип назван в честь G. Х. Харди и Вильгельм Вайнберг, которые осуществляли это математически. Статья Харди была сосредоточена на опровержении широко распространенного тогда мнения о том, что доминантный аллель автоматически имеет тенденцию к увеличению частоты; сегодня путаница между доминированием и отбором встречается реже. Сегодня тесты на частоту генотипов Харди - Вайнберга используются в основном для проверки стратификации населения и других форм неслучайного спаривания.

Содержание

1 Деривация
2 Отклонения от равновесия Харди - Вайнберга
3 Половая связь
4 Обобщения
- 4.1 Обобщение для более чем двух аллелей
- 4.2 Обобщение для полиплоидии
- 4.3 Полное обобщение
5 Тесты значимости отклонения
- 5.1 Пример $χ 2 {\ displaystyle \ chi ^ {2}}$ $\ чи ^ {2}$ тест отклонения
- 5.2 Точный тест Фишера (вероятностный тест)
6 Тесты на эквивалентность
7 Коэффициент инбридинга
8 История
- 8.1 Вывод результатов Харди
- 8.2 Числовой пример
  - 8.2.1 Оценка распределения генотипов
  - 8.2.2 Оценка Несущая частота
9 Графическое представление
10 См. Также
11 Примечания
12 Ссылки
- 12.1 Цитаты
- 12.2 Источники
13 Внешние ссылки

Производные

Рассмотрим популяцию однодомных диплоидов, где каждый производит мужские и женские гаметы с одинаковой величиной и имеет два аллеля в каждом локусе гена. Организмы размножаются путем случайного объединения гамет (популяционная модель «генофонда»). Локус в этой поплавке имеет два аллеля, A и a, которые встречаются с начальными частотами f 0 (A) = p и f 0 (a) = q, соответственно. Частоты аллелей в каждом поколении путем объединения аллелей из каждого генотипа одного поколения с ожидаемым вкладом гомозиготного и гетерозиготного генотипов, которые равны 1 и 1/2 соответственно:

ft (A) = ft (AA) + 1 2 ступени (Aa) {\ displaystyle f_ {t} ({\ text {A}}) = f_ {t} ({\ text {AA}}) + {\ tfrac {1} {2}} f_ {t} ({\ text {Aa}})}

{\ displaystyl e f_ {t} ({\ text {A}}) = f_ {t} ({\ text {AA}}) + {\ tfrac {1} {2}} f_ {t} ({\ text {Aa} })}

(1)

ft (a) = ft (aa) + 1 2 ft (Aa) {\ displaystyle f_ {t} ({\ text {a}}) = f_ {t} ({\ text {aa}}) + {\ tfrac {1} {2}} f_ {t} ({\ text {Aa}})}

{\ displaystyle f_ {t} ({\ text {a}}) = f_ {t} ( {\ text {aa}}) + {\ tfrac {1} {2}} f_ {t} ({\ text {Aa}})}

(2)

Длина p, q соответствует частотам аллелей (здесь p = 0,6, q = 0,4). Затем область прямоугольника представляет собой частоты генотипов (таким, AA: Aa: aa = 0,36: 0,48: 0,16).

Различные способы формирования генотипов следующего поколения могут быть показаны в квадрате Пеннета, где доля каждого генотипа равна произведению частот аллелей строки и столбца текущего поколения.

Таблица 1: Квадрат Пеннета для Харди - Вайнберга
		Самок
		A (p)	a (q)
Самцов	A (p)	AA (p)	Aa (pq)
Самцов	a (q)	Aa (qp)	aa (q)

Сумма записи - p + 2pq + q = 1, так как частоты генотипов должны в сумме равняться единице.

Заметим еще раз, что, поскольку p + q = 1, биномиальное разложение (p + q) = p + 2pq + q = 1 дает те же отношения.

Суммируя элементы квадрата Пеннета или биноми разложения, мы получаем ожидаемые пропорции генотипов среди потомков после одного поколения:

f 1 (AA) = p 2 = f 0 (A) 2 {\ displaystyle f_ {1} ({\ text {AA}}) = p ^ {2} = f_ {0} ({\ text {A}}) ^ {2}}

f_ {1} ({\ text {AA}}) = p ^ {2} = f_ {0} ({\ text {A}}) ^ {2}

(3)

е 1 (Aa) = pq + qp = 2 pq = 2 f 0 (A) f 0 (a) {\ displaystyle f_ {1} ({\ text {Aa}}) = pq + qp = 2pq = 2f_ {0} ({\ text {A }}) f_ {0} ({\ text {a}})}

f_ {1} ({\ text {Aa}}) = pq + qp = 2pq = 2f_ {0} ({\ t ext {A}}) f_ {0} ({\ text {a}})

(4)

f 1 (aa) = q 2 = f 0 (a) 2 {\ displaystyle f_ {1} ({ \ text {aa}}) = q ^ {2} = f_ {0} ({\ text {a}}) ^ {2}}

f_ {1} ({\ text {aa}}) = q ^ {2} = f_ {0} ({\ text {a}}) ^ {2}

(5)

Эти частоты определяют равновесие Харди - Вайнберга. Следует отметить, что частоты генотипов после первого поколения не обязательно должны совпадать с частотами генотипов от начального поколения, например, f 1 (AA) ≠ f 0 (AA). Однако частоты генотипов для всех будущих времен будут равны частотам Харди - Вайнберга, например f t (AA) = f 1 (AA) для t>1. Это следует из того, что частоты генотипов следующего поколения зависят от частот аллелей текущего поколения, которые вычисляются по уравнениям (1) и (2), сохраняются от исходного поколения:

f 1 (A) = f 1 ( AA) + 1 2 f 1 (Aa) = p 2 + pq = p (p + q) = p = f 0 (A) f 1 (a) = f 1 (aa) + 1 2 f 1 (Aa) = q 2 + pq = q (p + q) = q = f 0 (a) {\ displaystyle {\ begin {align} f_ {1} ({\ text {A}}) = f_ {1} ({\ текст {AA}}) + {\ tfrac {1} {2}} f_ {1} ({\ text {Aa}}) = p ^ {2} + pq = p (p + q) = p = f_ { 0} ({\ text {A}}) \\ f_ {1} ({\ text {a}}) = f_ {1} ({\ text {aa}}) + {\ tfrac {1} {2 }} f_ {1} ({\ text {Aa}}) = q ^ {2} + pq = q (p + q) = q = f_ {0} ({\ text {a}}) \ конец {выравнивается }}}

{\ displaystyle {\ begin {aligne d} f_ {1} ({\ text {A}}) = f_ {1} ({\ te xt {AA}}) + {\ tfrac {1} {2}} f_ {1} ({\ text {Aa}}) = p ^ {2} + pq = p (p + q) = p = f_ {0} ({\ text {A}}) \\ f_ {1} ({\ text {a}}) = f_ {1} ({\ text {aa}}) + {\ tfrac {1} {2}} f_ {1} ({\ text {Aa}}) = q ^ {2} + pq = q (п + д) = д = е_ {0} ({\ текст {а}}) \ конец {выровнено}}}

Для более общих случаев двудомных диплоидов [организмы либо самцы, либо самки], которые воспроизводятся путем случайного спаривания особей, это необходимо для расчета частот генотипов из девяти исполнителей спариваний между каждым родительским генотипом (AA, Aa и aa) любог о пола, взвешенных по ожидаемому генотипу роли каждого спаривания. Эквивалентно, можно рассмотреть шесть уникальных диплоид-диплоидных комбинаций:

[(AA, AA), (AA, Aa), (AA, aa), (Aa, Aa), (Aa, aa), (aa, aa))] {\ displaystyle \ left [({\ text {AA}}, {\ text {AA}}), ({\ text {AA}}, {\ text {Aa}}), ({\ text {AA }}, {\ text {aa}}), ({\ text {Aa}}, {\ text {Aa}}), ({\ text {Aa}}, {\ text {aa}}), ({ \ text {aa}}, {\ text {aa}}) \ right]}

{\ displaystyle \ left [({\ text {AA}}, {\ text {AA}) }), ({\ text {AA}}, {\ text {Aa}}), ({\ text {AA}}, {\ text {aa}}), ({\ text {Aa}}, {\ текст {Aa}}), ({\ text {Aa}}, {\ text {aa}}), ({\ text {aa}}, {\ text {aa}}) \ right]}

и строит квадрат Пеннета для каждого, чтобы вычислить его вклад в генотипы следующего поколения. Эти вклады взвешиваются в соответствии с вероятностью каждой диплоидно-диплоидной комбинации, которая следует полиномиальному распределению с k = 3. Например, вероятность брачной комбинации (AA, aa) составляет 2 f t (AA) f t (aa), и это может привести только к генотипу Aa: [0,1,0]. В целом, результирующие частоты генотипов рассчитываются как:

[ft + 1 (AA), ft + 1 (Aa), ft + 1 (aa)] = = ft (AA) ft (AA) [1, 0, 0 ] + 2 ft (AA) ft (Aa) [1 2, 1 2, 0] + 2 ft (AA) ft (aa) [0, 1, 0] + ft (Aa) ft (Aa) [1 4, 1 2, 1 4] + 2 ft (Aa) ft (aa) [0, 1 2, 1 2] + ft (aa) ft (aa) [0, 0, 1] = [(ft (AA) + 1 2 ft (Aa)) 2, 2 (ft (AA) + 1 2 ft (Aa)) (ft (aa) + 1 2 ft (Aa)), (ft (aa) + 1 2 ft (Aa)) 2 ] = [ft (A) 2, 2 ft (A) ft (a), ft (a) 2] {\ displaystyle {\ begin {align} \ left [f_ {t + 1} ({\ text {AA }}), f_ {t + 1} ({\ text {Aa}}), f_ {t + 1} ({\ text {aa}}) \ right] = \\ \ qquad = f_ {t} ( {\ text {AA}}) f_ {t} ({\ text {AA}}) \ left [1,0,0 \ right] + 2f_ {t} ({\ text {AA}}) f_ {t} ({\ text {Aa}}) \ left [{\ tfrac {1} {2}}, {\ tfrac {1} {2}}, 0 \ right] + 2f_ {t} ({\ text {AA} }) f_ {t} ({\ text {aa}}) \ left [0,1,0 \ right] \\ \ qquad \ qquad + f_ {t} ({\ text {Aa}}) f_ {t } ({\ text {Aa}}) \ left [{\ tfrac {1} {4}}, {\ tfrac {1} {2}}, {\ tfrac {1} {4}} \ right] + 2 ебат ь {т} ({\ text {Aa}}) f_ {t} ({\ text {aa}}) \ left [0, {\ tfrac {1} {2}}, {\ tfrac {1} {2 }} \ right] + f_ {t} ({\ text {aa}}) f_ {t} ({\ text {aa}}) \ left [0,0,1 \ right] \\ \ qquad = \ left [\ left (f_ {t} ({\ text {AA}}) + {\ tfrac {1} {2}} f_ {t} ({\ text {Aa}}) \ right) ^ {2}, 2 \ left (f_ {t} ({\ text {AA}}) + {\ tfrac {1} {2}} f_ {t} ({\ text {Aa}}) \ right) \ left (f_ {t } ({\ text {aa}}) + {\ tfrac {1} {2}} f_ {t} ({\ text {Aa}}) \ right), \ left (f_ {t} ({\ text { aa}}) + {\ tfrac {1} {2}} f_ {t} ({\ text {Aa}}) \ right) ^ {2} \ right] \\ \ qquad = \ left [f_ {t } ({\ text {A}}) ^ {2}, 2f_ {t} ({\ text {A}}) f_ {t} ({\ text {a}}), f_ {t} ({\ text {a}}) ^ {2} \ right] \ end {align}}}

{\ displaystyle {\ begin {al igned} \ left [f_ {t + 1} ({\ text {AA}}), f_ {t + 1} ({\ text {Aa}}), f_ {t + 1} ({\ text {aa}}) \ right] = \\ \ qquad = f_ {t} ({\ text {AA}}) f_ {t} ({\ text {AA}}) \ left [1,0,0 \ right] + 2f_ { t} ({\ text {AA}}) f_ {t} ({\ text {Aa}}) \ left [{\ tfrac {1} {2}}, {\ tfrac {1} {2}}, 0 \ right] + 2f_ {t} ({\ text {AA}}) f_ {t} ({\ text {aa}}) \ left [0,1,0 \ right] \\ \ qquad \ qquad + f_ {t} ({\ text {Aa}}) f_ {t} ({\ text {Aa}}) \ left [{\ tfrac {1} {4}}, {\ tfrac {1} {2}}, {\ tfrac {1} {4}} \ right] + 2f_ {t} ({\ text {Aa}}) f_ {t} ({\ text {aa}}) \ left [0, {\ tfrac {1 } {2}}, {\ tfrac {1} {2}} \ right] + f_ {t} ({\ text {aa}}) f_ {t} ({\ text {aa}}) \ left [0, 0,1 \ right] \\ \ qquad = \ left [\ left (f_ {t} ({\ text {AA}}) + {\ tfrac {1} {2}} f_ {t}) ({ \ text {Aa}}) \ right) ^ {2}, 2 \ left (f_ {t} ({\ text {AA}}) + {\ tfrac {1} {2}} f_ {t} ({\ text {Aa}}) \ right) \ left (f_ {t} ({\ text {aa}}) + {\ tfrac {1} {2}} f_ {t} ({\ text {Aa}}) \ right), \ left (f_ {t} ({\ text {aa }}) + {\ tfrac {1} {2}} f_ {t} ({\ text {Aa}}) \ right) ^ {2} \ right] \\ \ qquad = \ left [f_ {t} ({\ text {A}}) ^ {2}, 2f_ {t} ({\ text {A}}) f_ {t} ({\ text {a}}), f_ {t} ({\ text { a}}) ^ {2} \ right] \ end {align}}}

Как и раньше, можно показать, что частоты аллелей в момент времени t + 1 равны частотам в момент времени t, а значит, постоянны во времени.. Точно так же частоты генотипов зависят только от частот аллелей, и поэтому после времени t = 1 также остаются постоянными во времени.

Если у однодомных или раздельнополых организмов пропорций аллелей или генотипов изначально неодинаковы для обоих полов, можно показать, что постоянные пропорции достигаются после одного генерация случайного спаривания. Если раздельнополые организмы гетерогаметны и локус расположен на Х-хромосоме, можно показать, что если частоты аллелей изначально неодинаковы у двух полов [например, женщины XX и мужчины XY, как у людей], f′ (a) в гетерогаметных сексуальных «погонях» f(a) в гомогаметный пол предыдущего поколения, пока не достигнуто равновесие при средневзвешенном значении двух исходных частот.

Отклонения от равновесия Харди-Вайнберга

В основе равновесия Харди-Вайнберга лежат следующие семь допущений:

организмы диплоидны
происходит только половое размножение
поколения не пересекаются
случайное спаривание
размер популяции бесконечно большой
частоты аллелей равны у полов
миграция отсутствует, ген поток, примесь, мутация или отбор

Нарушение предположений Харди - Вайнберга может вызвать отклонения от ожидания. Как это влияет на население, зависит от допущений, которые нарушаются.

Случайная вязка. HWP утверждает, что популяция будет иметь данные генотипических частот (так называемые пропорции Харди - Вайнберга) после поколения случайных спариваний в популяции. Когда предположение о случайном скрещивании нарушается, популяция не будет иметь пропорции Харди - Вайнберга. Распространенной причиной неслучайного спаривания является инбридинг, который вызывает увеличение гомозиготности для всех генов.

Если популяция нарушает одно из следующих предположений, популяция может быть пропорции Харди - Вайнберга сохраняются в каждом поколении, но частоты аллелей со временем будут меняться.

Выбор, как правило, часто меняет частоты аллелей, довольно быстро. Хотя направленный отбор в конечном итоге приводит к потере всех аллелей, кроме предпочтительного (если один аллель является не доминирующим, и в этом случае рецессивные аллели могут выжить при низких частотах), некоторые формы отбора, такие как балансирующий отбор, приводит к равновесию без потерь аллелей.
Мутация будет иметь очень тонкий эффект на частоты аллелей. Частота мутаций составляет от 10 до 10, и изменение частоты аллелей будет, самое большее, в том же порядке. Повторяющаяся мутация будет поддерживать аллели в пополнении, даже если против них будет строгий отбор.
Миграция генетически связывает две или более популяции вместе. В целом частоты аллелей становятся более однородными среди популяций. Некоторые модели миграции по своей сути включают неслучайное спаривание (эффект Валунда, например). Для этих моделей пропорций Харди - Вайнберга обычно недействительны.
Небольшой размер популяции может вызвать случайное изменение частот аллелей. Это происходит из-за эффекта выборки и называется генетическим дрейфом. Эффекты выборки наиболее важны, когда аллель присутствует в небольшом количестве копий.

Половая связь

Если ген A сцеплен с полом, гетерогаметный пол (например, самцы млекопитающих; птичьи самки) имеют только одну копию гена (и называются гемизиготными), в то время как гомогаметный пол (например, человеческие самки) имеет две копии. Частоты генотипов в равновесии: p и q для гетерогаметного пола, но p, 2pq и q для гомогаметного пола.

Например, у людей красно-зеленая дальтонизм является Х-сцепленным рецессивным признаком. У западноевропейских мужчин этот признак показывает примерно 1 из 12 (q = 0,083), тогда как он рассматривает примерно 1 из 200 женщин (0,005 по сравнению с q = 0,007), что очень близко к пропорциям Харди - Вайнберга.

Если популяция объединяется с мужчинами и женщинами с разной аллелей в каждой субпопуляции (мужчины или женщины), то частота аллелей мужской популяции будет соответствовать пропорциям аллелей женской популяции, потому что каждый сын получает свою Х-хромосому от матери. Население очень быстро приходит к равновесию.

Обобщения

Простой вывод, приведенный выше, может быть обобщен для более чем двух аллелей и полиплоидии.

Обобщение для более чем двух аллелей

Квадрат Пеннета для трехаллельного случая ( слева) и четырехаллельный случай (справа). Белые области - гомозиготы. Цветные области - гетерозиготы.

Учитывайте частоту дополнительных аллелей, r. С двумя аллелями - это биномиальное расширение для (p + q), и, таким образом, случай с тремя аллелями - это триномиальное расширение (p + q + r).

(p + q + r) 2 = p 2 + q 2 + r 2 + 2 pq + 2 pr + 2 qr {\ displaystyle (p + q + r) ^ {2} = p ^ {2} + q ^ {2} + r ^ {2} + 2pq + 2pr + 2qr \,}

(p + q + r) ^ {2} = p ^ { 2} + q ^ {2} + r ^ {2} + 2pq + 2pr + 2qr \,

В целом, рассмотрим аллели A 1,..., A n задается частотами аллелей от p 1 до p n;

(p 1 + ⋯ + pn) 2 {\ displaystyle (p_ {1} + \ cdots + p_ {n}) ^ {2} \,}

(p_ {1} + \ cdots + p_ {n}) ^ {2} \,

дает для всех гомозигот :

f (A i A i) = pi 2 {\ displaystyle f (A_ {i} A_ {i}) = p_ {i} ^ {2} \,}

f (A_ {i} A_ {i}) = p_ {i} ^ {2} \,

и для всех гетерозигот :

f (A i A j) = 2 pipj {\ displaystyle f (A_ {i} A_ {j}) = 2p_ {i} p_ {j} \,}

е (A_ {i} A_ {j}) = 2p_ {i} p_ {j} \,

Обобщение для полиплоидии

Принцип Харди-Вайнберга также может быть обобщен на полиплоидные системы, то есть для организмов, которые имеют более двух копий каждой хромосомы. Рассмотрим снова только два аллеля. Диплоидный случай - это биномиальное разложение из:

(p + q) 2 {\ displaystyle (p + q) ^ {2} \,}

(p+q)^{2}\,

и, следовательно, полиплоидный случай - это полиномиальное разложение из:

(p + q) c {\ displaystyle (p + q) ^ {c} \,}

(p + q) ^ {c} \,

, где c - плоидность, например с тетраплоидом (c = 4):

Таблица 2: Ожидаемые частоты генотипов для тетраплоидии
Генотип	Частота
AAAA	$p 4 {\ displaystyle p ^ {4}}$ $p ^ {4}$
AAAa	$4 p 3 q {\ displaystyle 4p ^ {3} q}$ $4p ^ {3} q$
AAaa	$6 p 2 q 2 {\ displaystyle 6p ^ {2} q ^ {2}}$ $6p ^ {2} q ^ {2}$
AAaa	$4 pq 3 {\ displaystyle 4pq ^ {3}}$ $4pq ^ {3}$
aaaa	$q 4 {\ displaystyle q ^ {4}}$ $q ^ {4}$

От того, является ли организм «истинным» тетраплоидом или амфидиплоидом, будет зависеть, как Потребуется много времени, чтобы население достигло равновесия Харди - Вайнберга.

Полное обобщение

для $n {\ displaystyle n}$ $п$ различных аллелей в $c {\ displaystyle c}$ $c$ -плоидов, частоты генотипов в равновесии Харди - Вайнберга задаются отдельными членами в полиномиальном разложении из $(p 1 + ⋯ + pn) c {\ displaystyle (p_ {1} + \ cdots + p_ {n}) ^ {c}}$ $(p_ {1} + \ cdots + p_ {n}) ^ {c}$ :

(p 1 + ⋯ + pn) c = ∑ k 1,…, kn ∈ N: k 1 + ⋯ + kn = c (ck 1,…, kn) p 1 К 1 ⋯ pnkn {\ displaystyle (p_ {1} + \ cdots + p_ {n}) ^ {c} = \ sum _ {k_ {1}, \ ldots, k_ {n} \ \ in \ mathbb {N}: k_ {1 } + \ cdots + k_ {n} = c} {c \ select k_ {1}, \ ldots, k_ {n}} p_ {1} ^ {k_ {1}} \ cdots p_ {n} ^ {k_ { n}}}

(p_ {1 } + \ cdots + p_ {n}) ^ {c} = \ sum _ {{k_ {1}, \ ldots, k_ {n} \ \ in {\ mathbb {N}}: k_ {1} + \ cdots + k_ {n} = c}} {c \ выбрать k_ {1}, \ ldots, k_ {n}} p_ {1} ^ {{k_ {1}}} \ cdots p_ {n} ^ {{k_ { n}}}

Тесты значимости отклонения

Тестирование отклонения от HWP обычно выполняется с помощью критерия хи-квадрат Пирсона с использованием наблюдаемых частот генотипов, полученных из данных и ожидаемых значений генотипов, полученных, полученных с помощью HWP. Для систем с большим количеством аллелей это может привести к получению данных с множеством пустых генотипов и низким числом генотипов, потому что в выборе часто не хватает индивидов для адекватного представления всех классов генотипов. Если это так, предположение асимптотики для распределения хи-квадрат больше не будет, и может потребоваться использовать формулу точного критерия Фишера., для решения которой требуется компьютер . Совсем недавно был предложен ряд методов MCMC проверки отклонений от HWP (Guo Thompson, 1992; Wigginton et al. 2005)

Пример $χ 2 {\ displaystyle \ chi ^ {2 }}$ $\ чи ^ {2}$ тест на отклонение

Эти данные взяты из E. B. Ford (1971) на алой тигровой мотыльке, для которой были зарегистрированы фенотипы выборки популяции. Предполагается, что различие между генотипом и фенотипом пренебрежимо мало. нулевая гипотеза состоит в том, что популяция находится в пропорциях Харди-Вайнберга, а альтернативная гипотеза заключается в том, что популяция не имеет пропорций Харди-Вайнберга.

Таблица 3: Пример расчета по принципу Харди - Вайнберга
Фенотип	Белые пятна (AA)	Промежуточные (Aa)	Небольшие пятна (aa)	Всего
Число	1469	138	5	1612

Отсюда можно вычислить частоты аллелей:

p = 2 × набл (AA) + набл (Aa) 2 × (набл (AA) + набл (Aa) + набс (aa)) = 1469 × 2 + 138 2 × (1469 + 138 + 5) = 3076 3224 = 0,954 {\ displaystyle {\ begin {выровнено} p = {2 \ times \ mathrm {obs} ({\ text {AA}}) + \ mathrm {obs} ({\ text {Aa}}) \ более 2 \ times (\ mathrm {obs} ({\ текст {AA}}) + \ mathrm {obs} ({\ text {Aa}}) + \ mathrm {obs} ({\ text {aa}}))} \\\\ = {1469 \ times 2 + 138 \ более 2 \ раз (1469 + 138 + 5)} \\\\ = {3076 \ более 3224} \\\\ = 0,954 \ конец {выровнено}}

{\ begin {align} p = {2 \ times {\ mathrm {obs}} ({\ text {AA}}) + {\ mathrm {obs}} ({\ текст {Aa}}) \ более 2 \ раз ({\ mathrm {obs}} ({\ text {AA} }) + {\ mathrm {obs}} ({\ text {Aa}}) + {\ mathrm {obs}} ({\ text {aa}}))} \\\\ = {1469 \ times 2 + 138 \ более 2 \ раз (1469 + 138 + 5)} \\\\ = {3076 \ более 3224} \\\\ = 0,954 \ конец {выровнено}}

q = 1 - p = 1 - 0,954 = 0,046 {\ displaystyle {\ begin {align} q = 1-p \\ = 1-0,954 \\ = 0,046 \ end {align}}}

{\ begin {align} q = 1-p \\ = 1-0,954 \\ = 0,046 \ end {align}}

Итак, Харди– Вайнберг математическое ожидание равно:

E xp (AA) = p 2 n = 0,9 5 4 2 × 1612 = 1467,4 E xp (Aa) = 2 pqn = 2 × 0,954 × 0,046 × 1612 = 141,2 E xp (aa) = q 2 n = 0,046 2 × 1612 = 3,4 {\ displaystyle { \ begin {align} \ mathrm {Exp} ({\ text {AA}}) = p ^ {2} n = 0,954 ^ {2} \ times 1612 = 1467,4 \\\ mathrm {Exp} ({\ текст {Aa}}) = 2pqn = 2 \ times 0,954 \ times 0,046 \ times 1612 = 141,2 \\\ mathrm {Exp} ({\ text {aa}}) = q ^ {2} n = 0,046 ^ {2} \ times 1612 = 3,4 \ end {align}}}

{\ begin {align} {\ mathrm {Exp}} ({\ text {AA }}) = p ^ {2} n = 0,954 ^ {2} \ times 1612 = 1467,4 \\ {\ mathrm {Exp}} ({\ text {Aa}}) = 2pqn = 2 \ times 0,954 \ times 0,046 \ times 1612 = 141,2 \\ {\ mathrm {Exp}} ({\ text {aa}}) = q ^ {2} n = 0,046 ^ {2} \ times 1612 = 3,4 \ конец {выровнено}}

критерий хи-квадрат Пирсона утверждает:

χ 2 знак равно ∑ (O - E) 2 E = (1469 - 1467,4) 2 1467,4 + (138 - 141,2) 2 141,2 + (5 - 3,4) 2 3,4 = 0,001 + 0,073 + 0,756 = 0,83 {\ displaystyle {\ begin {выровнено } \ chi ^ {2} = \ sum {(OE) ^ {2} \ over E} \\ = {(1469-1467,4) ^ {2} \ over 1467,4} + {(138- 141,2) ^ {2} \ более 141,2} + {(5-3,4) ^ {2} \ более 3,4} \\ = 0,001 + 0,073 + 0,756 \\ = 0,83 \ конец {выровнено}}}

{\ begin {align} \ chi ^ {2} = \ sum {(OE) ^ {2} \ over E} \\ = {(1469-1467.4) ^ {2} \ over 1467,4} + {(138-141.2) ^ {2} \ ov на 141.2} + {(5-3.4) ^ {2} \ более 3,4} \\ = 0,001 + 0,073 + 0,756 \\ = 0,83 \ конец {выровнено}}

Имеется 1 степень свободы (степень свободы для теста на пропорции Харди - Вайнберга: # генотипов - # аллелей). 5% уровень значимости для 1 степени свободы составляет 3,84, а поскольку значение χ меньше этого, нулевая гипотеза о том, что популяция находится в частотах Харди - Вайнберга, составляет не отклонено.

Точный критерий Фишера (вероятностный тест)

Точный тест Фишера могут использовать условия для тестирования пропорций Харди - Вайнберга. Тест тест зависит от частот аллелей p и q, проблему можно рассматривать как проверка на правильное количество гетерозигот. Таким образом, гипотеза о пропорциях Харди-Вайнберга отвергается, если количество гетерозигот слишком велико или слишком мало. Условные вероятности гетерозиготы с учетом частот аллелей в Emigh (1980) как

вероятность ⁡ [n 12 | n 1] = (nn 11, n 12, n 22) (2 nn 1, n 2) 2 n 12, {\ displaystyle \ operatorname {prob} [n_ {12} | n_ {1}] = {\ frac {\ binom {n} {n_ {11}, n_ {12}, n_ {22}}} {\ binom {2n} {n_ {1}, n_ {2}}} } 2 ^ {n_ {12}},}

\ operatorname {prob} [n _ {{12}} | n_ {1}] = {\ frac {{\ binom {n} {n _ {11}}, n _ {{12}}, n _ {{22}}}}}} {{\ binom {2n} {n_ {1}, n_ {2}}}}} 2 ^ {{n _ {{12}}}},

где n 11, n 12, n 22 - наблюдаемые числа трех генотипов, AA, Aa и aa, соответственно, и n 1 - аллелей A, где $n 1 = 2 n 11 + n 12 {\ displaystyle n_ {1} = 2n_ {11} + n_ {12}}$ $n_ {1} = 2n _ {{11}} + п _ {{12}}$ .

Пример Используя один из примеров из Emigh (1980), мы можем рассмотреть случай, когда n = 100 и p = 0,34. Возможные наблюдаемые гетерозиготы и их точный уровень значимости в таблице 4.

Таблица 4: Пример точного критерия Фишера для n = 100, p = 0,34.
Количество гетерозигот	Уровень значимости
0	0,000
2	0,000
4	0,000
6	0,000
8	0,000
10	0,000
12	0,000
14	0,000
16	0,000
18	0,001
20	0,007
22	0,034
34	0,067
24	0,151
32	0,291
26	0,474
30	0,730
28	1.000

Используя эту таблицу, нужно найти уровень значимости теста на основе наблюдаемого количества гетерозигот. Например, если наблюдается 20 гетерозигот, уровень значимости для теста составляет 0,007. Как это типично для точного теста Фишера для небольших выборок, градация уровней значимости довольно грубая.

Однако такая таблица должна создаваться для каждого эксперимента, поскольку зависит от n, так и от p.

Тесты эквивалентности

Тесты эквивалентности разработаны для того, чтобы установить соответствующее соответствие наблюдаемых частот генотипов Харди-Вайнберга. Пусть $M {\ displaystyle {\ mathcal {M}}}$ ${\ displaystyle {\ mathcal {M}}}$ обозначает семейство распределений генотипов в предположении равновесия Харди Вайнберга. Расстояние между распределением генотипов $p {\ displaystyle p}$ $p$ и равновесием Харди Вайнберга определяется как $d (p, M) = min q ∈ M d (p, q) {\ displaystyle d ( p, {\ mathcal {M}}) = \ min _ {q \ in {\ mathcal {M}}} d (p, q)}$ ${\ displaystyle d (p, {\ mathcal {M}}) = \ min _ {q \ in {\ mathcal {M}}} d (p, q)}$ , где $d {\ displaystyle d}$ $d$ - некоторое расстояние. Задача теста на эквивалентность задается формулой $H 0 = {d (p, M) ≥ ε} {\ displaystyle H_ {0} = \ {d (p, {\ mathcal {M}}) \ geq \ varepsilon \} }$ ${\ displaystyle H_ {0} = \ {d (p, {\ mathcal {M}}) \ geq \ varepsilon \}}$ и $H 1 = {d (p, M) < ε } {\displaystyle H_{1}=\{d(p,{\mathcal {M}})<\varepsilon \}}$ ${\ displaystyle H_ {1} = \ {d (p, {\ mathcal {M}}) <\ varepsilon \}}$ , где $ε>0 {\ displaystyle \ varepsilon>0}$ $\ varepsilon>0$ является параметром допуска. Если гипотеза $. H 0 {\ displaystyle H_ {0}}$ ${\ displaystyle H_ {0}}$ можно отклонить, тогда популяция с высокой вероятностью близка к равновесию Харди Вайнберга. Тесты эквивалентности для двуаллельного случая разработаны, в Wellek (2004). множественных аллелей предложены в Ostrovski (2020).

Коэффициент инбридинга

Коэффициент инбридинга, F (см. Также F-статистика ), составляет единицу минус наблюдаемая частота гетерозигот по сравнению с ожидаемой из равновесия Харди - Вайнберга.

F = E ⁡ (f (A a)) - О ⁡ (е (Aa)) E ⁡ (f (Aa)) = 1 - O ⁡ (f (Aa)) E ⁡ (f (Aa)), {\ displaystyle F = {\ frac {\ operatorname {E} {(f ({\ text {Aa}}))} - \ operatorname {O} (f ({\ text {Aa}}))} {\ operatorname {E} (f ({\ text { Aa}}))}} = 1 - {\ frac {\ operatorname {O} (f ({\ text {Aa}}))} {\ operatorname {E} (f ({\ text {Aa}})) }},}

F = {\ frac {\ operatorname {E} {(f ({\ text {Aa}}))} - \ operatorname {O} (f ({\ text {Aa}}))} {\ operatorname {E} (f ({\ text {Aa}}))}} = 1 - {\ frac {\ operatorname {O} (f ({\ text {Aa}}))} {\ имя оператора {E} (е ({\ текст {Aa}}))}},

где ожидаемое значение из равновесия Харди - Вайнберга определяется как

E ⁡ (f (Aa)) = 2 pq {\ displaystyle \ operatorname {E} (f ({\ text {Aa}})) = 2pq}

\ operatorname {E} (f ({\ text {Aa}})) = 2pq

Например, для данных Ford выше;

F = 1 - 138 141,2 = 0,023. {\ displaystyle F = 1- {138 \ over 141,2} = 0,023.}

F = 1- {138 \ более 141,2} = 0,023.

Для двух аллелей критерия согласия по критерию хи-квадрат для соотношений Харди - Вайнберга эквивалентен тесту на инбридинг, F = 0.

Коэффициент инбридинга нестабилен, поскольку ожидаемое значение приближается к нулю, и, следовательно, бесполезен для редких и очень распространенных аллелей. Для: E = 0, O>0, F = −∞ и E = 0, O = 0, F не определено.

История

Менделевская генетика вновь открыты в 1900 году, однако остается несколько спорным в течение нескольких лет, так как не было тогда известно, как это может вызвать непрерывные характеристики. Удный Юл (1902) выступал против менделизма, потому что считал, что доминантные аллели увеличатся в популяции. Американец Уильям Э. Кастл (1903) показал, что без отбора частоты генотипов останутся стабильными. Карл Пирсон (1903) нашел одно положение равновесия со значениями p = q = 0,5. Реджинальд Паннетт, не в состоянии опровергнуть точку зрения Юла, представил проблему Г. Х. Харди, британский математик, с которым он играл в крикет. Харди был чистым математиком и относился к прикладной математике с некоторым презрением; его взгляд на использование биологами в его статье 1908 года, где он математически используется как «очень просто»:

Редактору журнала Science: Я не хочу вмешиваться в дискуссию, касающуюся вопросов, в которых у меня нет экспертных знаний. должен был ожидать, что очень простой момент, который я хочу сделать, был знаком биолог. Однако некоторые замечания г-на Удни Юла, на которые г-н Р.К. Паннет обратил мое внимание, предполагают, что, возможно, все же стоит сделать...

Предположим, что Aa - пара менделевских знаков, A - доминирующий, и что в любом поколении количество чистых доминантов (AA), гетерозигот (Aa) и чистых рецессивов (aa) равно p: 2q: r. Наконец, предположим, что их количество достаточно велико, так что спаривание можно рассматривать как случайное, что полы равномерно распределены между тремя разновидностями. Небольшой математики типа таблицы умножения, чтобы показать, что в следующем поколении будет иметь вид (p + q): 2 (p + q) (q + r) :( q + r) или p 1 : 2q 1:r1, например.

Интересный вопрос: при каких обстоятельствах это распределение будет таким же, как и в предыдущем поколении? Легко видеть, что условие для этого q = pr. И поскольку q 1 = p 1r1, какими бы ни были значения p, q и r, распределение в любом случае останется неизменным после второго поколения

. Таким образом, указан известен как Закон Харди в русскоязычном мире до 1943 года, когда Курт Стерн указал, что он был введан независимо в 1908 году немецким врачом Вильгельмом Вайнбергом. Уильям Кастл в 1903 году также вывел отношения для особого случая равных частот аллелей, и это иногда (но редко) называют законом Харди - Вайнберга - Кастла.

Вывод соотношений Харди

Утверждение Харди начинается с рекуррентного соотношения для частот p, 2q и r. Эти рекуррентные отношения вытекают из фундаментальных концепций вероятности, в частности, независимости и условной вероятности. Например, рассмотрим вероятность того, что потомство поколения $t {\ displaystyle \ textstyle t}$ $\ textstyle т$ будет гомозиготным доминантным. Аллели наследуются независимо от каждого родителя. Доминантный аллель может быть унаследован от гомозиготного доминантного родителя с вероятностью 1 или от гетерозиготного родителя с вероятностью 0,5. Чтобы представить это рассуждение в виде уравнения, пусть $A t {\ displaystyle \ textstyle A_ {t}}$ ${\ displaystyle \ textstyle A_ {t}}$ представляет наследование доминантного аллеля от родителя. Кроме того, пусть $AA t - 1 {\ displaystyle \ textstyle AA_ {t-1}}$ ${\ displaystyle \ textstyle AA_ {t-1}}$ и $A at - 1 {\ displaystyle \ textstyle Aa_ {t-1}}$ ${\ displaystyle \ textstyle Aa_ {t-1}}$ потенциальные родительские генотипы в последнем поколении.

pt = P (A t, A t) = P (A t) 2 = (P (A t | AA t - 1) P (AA t - 1) + P (A t | A at - 1) P (A at - 1)) 2 знак равно ((1) pt - 1 + (0,5) 2 qt - 1) 2 = (pt - 1 + qt - 1) 2 {\ displaystyle {\ begin {выровнено} p_ {t} = P (A_ {t}, A_ {t}) = P (A_ {t}) ^ {2} \\ = \ left (P (A_ {t} | AA_ {t-1})) P (AA_ {t-1}) + P (A_ {t} | Aa_ {t-1}) P (Aa_ {t-1}) \ right) ^ {2} \\ = \ left ((1) p_ {t-1} + (0,5) 2q_ {t-1} \ right) ^ {2} \\ = \ left (p_ {t-1} + q_ {t-1} \ right) ^ {2} \ end {align}}}

{\ displaystyle {\ begin {выровнено} p_ {t} = P (A_ {t}, A_ {t}) = P (A_ {t}) ^ {2} \\ = \ left (P (A_ {t} | AA_ {t- 1}) P (AA_ {t-1}) + P (A_ {t} | Aa_ {t-1}) P (Aa_ {t-1}) \ right) ^ {2} \\ = \ left ((1) p_ {t-1} + (0.5) 2q_ {t-1} \ right) ^ {2} \\ = \ left (p_ {t-1} + q_ {t-1} \ right) ^ {2} \ end {align}}}

Те же рассуждения, примененные к другим генотипам, дают два оставшихся рекуррентных отношений. Равновесие наступает, когда каждая пропорция постоянна между последующими поколениями. Более формально популяция находится в равновесии в поколении $t {\ displaystyle \ textstyle t}$ $\ textstyle т$ , когда

0 = pt - pt - 1 {\ displaystyle \ textstyle 0 = p_ {t} - p_ {t-1}}

{\ displaystyle \ textstyle 0 = p_ {t} -p_ {t-1}}

0 = qt - qt - 1 {\ displaystyle \ textstyle 0 = q_ {t} -q_ {t-1}}

{\ displaystyle \ textstyle 0 = q_ {t} -q_ {t-1}}

0 = rt - rt - 1 {\ displaystyle \ textstyle 0 = r_ {t} -r_ {t-1}}

{\ displaystyle \ textstyle 0 = r_ {t} -r_ {t-1}}

Решая эти уравнения, можно определить необходимые и достаточные условия для равновесия. Опять же, рассмотрим частоту гомозиготных доминантных животных. Равновесие подразумевает

0 = pt - pt - 1 = pt - 1 2 + 2 pt - 1 qt - 1 + qt - 1 2 - pt - 1 {\ displaystyle {\ begin {align} 0 = p_ {t} - p_ {t-1} \\ = p_ {t-1} ^ {2} + 2p_ {t-1} q_ {t-1} + q_ {t-1} ^ {2} -p_ {t- 1} \ end {align}}}

{\ displaystyle {\ begin {align} 0 = p_ {t} -p_ {t-1 } \ \ = p_ {t-1} ^ {2} + 2p_ {t-1} q_ {t-1} + q_ {t-1} ^ {2} -p_ {t-1} \ end {выровнено }}}

Сначала рассмотрим случай, когда $pt - 1 = 0 {\ displaystyle \ textstyle p_ {t-1} = 0}$ ${\ displaystyle \ textstyle p_ {t-1} = 0}$ , и обратите внимание, что он означает, что $qt - 1 = 0 {\ displaystyle \ textstyle q_ {t-1} = 0}$ ${\ displaystyle \ textstyle q_ {t-1} = 0}$ и $rt - 1 = 1 {\ displaystyle \ textstyle r_ {t -1} = 1}$ ${\ displaystyle \ textstyle r_ {t-1} = 1}$ . Теперь рассмотрим оставшийся случай, где $pt - 1 {\ displaystyle \ textstyle p_ {t-1}}$ ${\ displaystyle \ textstyle p_ {t-1}}$ ≠ $0 {\ displaystyle \ textstyle 0}$ $\ textstyle 0$

0 = pt - 1 (pt - 1 + 2 qt - 1 + qt - 1 2 / pt - 1 - 1) = qt - 1 2 / pt - 1 - rt - 1 {\ displaystyle {\ begin {align} 0 = p_ {t-1} (p_ {t- 1} + 2q_ {t-1} + q_ {t-1} ^ {2} / p_ {t-1} -1) \\ = q_ {t-1} ^ {2} / p_ {t-1 } -r_ {t-1} \ end {align}}}

{\ displaystyle {\ begin {align} 0 = p_ {t-1} (p_ {t-1} + 2q_ {t- 1} + q_ {t-1} ^ {2} / p_ {t-1} -1) \\ = q_ {t-1} ^ {2} / p_ {t-1} -r_ {t-1 } \ end {выровнено}}}

Где выполняется окончательное равенство, потому что пропорции аллелей должны в сумме равняться единице. В обоих случаях $qt - 1 2 = pt - 1 rt - 1 {\ displaystyle \ textstyle q_ {t-1} ^ {2} = p_ {t-1} r_ {t-1}}$ ${\ displaystyle \ textstyle q_ {t-1} ^ {2} = p_ {t -1} r_ {t -1}}$ . Можно показать, что два других состояния равновесия подразумевают то же уравнение. Вместе решения трех равновесия предполагают достаточность условий Харди для равновесия. Условие всегда выполняется для второго поколения, все последующие поколения имеют одинаковые пропорции.

Числовой пример

Оценка распределения генотипов

Полезен пример вычисления распределения генотипов, полученный с помощью исходных уравнений Харди. Распределение фенотипов из книги 3 выше будет Работа для начального распределения генотипов Харди. Обратите внимание, что значения p и q, используемые Харди, не совпадают с используемыми выше.

сумма = набл (AA) + 2 × набл (Aa) + набл (аа) = 1469 + 2 × 138 + 5 = 1750 {\ displaystyle {\ begin {align} {\ text {sum}} = { \ mathrm {obs} ({\ text {AA}}) + 2 \ times \ mathrm {obs} ({\ text {Aa}}) + \ mathrm {obs} ({\ text {aa}})} = { 1469 + 2 \ times 138 + 5} \\ = 1750 \ end {align}}}

{\ begin {align} {\ text {sum}} = {{\ mathrm {obs}} ({\ text {AA}}) + 2 \ times {\ mathrm {obs}} ({\ text {Aa}}) + {\ mathrm {obs} } ({\ text {aa}})} = {1469 + 2 \ times 138 +5} \\ = 1750 \ end {align}}

p = 1469 1750 = 0,83943 2 q = 2 × 138 1750 = 0,15771 r = 5 1750 = 0,00286 {\ displaystyle {\ begin {выровнено} p = {1469 \ более 1750} = 0,83943 \\ 2q = {2 \ times 138 \ более 1750} = 0,15771 \\ r = {5 \ более 1750} = 0,00286 \ end {align}}}

{\ begin {align} p = {1469 \ over 1750} = 0,83943 \\ 2q = {2 \ times 138 \ over 1750} = 0,15771 \ \ r = {5 \ более 1750} = 0,00286 \ end {align}}

В качестве проверки распределения вычислите

p + 2 q + r = 0,83943 + 0,15771 + 0,00286 = 1,00000 {\ displaystyle p + 2q + r = 0,83943 + 0,15771 + 0,00286 = 1,00000 \,}

p + 2q + r = 0,83943 + 0,15771 + 0,00286 = 1,00000 \,

E 0 = q 2 - pr = 0,00382. {\ displaystyle E_ {0} = q ^ {2} -pr = 0,00382. \,}

E_ {0} = q ^ {2} -pr = 0,00382. \,

Для следующего поколения уравнения Харди дают

q = 0,15771 2 = 0,07886 p 1 = (p + q) 2 = 0,84325 2 q 1 = 2 (p + q) (q + r) = 0,15007 r 1 = (q + r) 2 = 0,00668. {\ displaystyle {\ begin {align} q = {0,15771 \ over 2} = 0,07886 \\\\ p_ {1} = (p + q) ^ {2} = 0,84325 \\ 2q_ {1} = 2 ( p + q) (q + r) = 0,15007 \\ r_ {1} = (q + r) ^ {2} = 0,00668. \ end {align}}}

{\ begin {align} q = {0,15771 \ over 2} = 0,07886 \\\\ p_ {1} = (p + q) ^ {2} = 0,84325 \\ 2q_ {1} = 2 (p + q) (q + r) = 0,15007 \\ r_ {1} = (q + r) ^ {2} = 0,00668. \ End {выравнивается}}

Снова в качестве проверки распределения вычислите

p 1 + 2 q 1 + r 1 = 0,84325 + 0,15007 + 0,00668 = 1,00000 {\ displaystyle p_ {1} + 2q_ {1} + r_ {1} = 0,84325 + 0,15007 + 0,00668 = 1,00000 \,}

p_ {1} + 2q_ {1} + r_ {1} = 0,84325 + 0, 15007 + 0,00668 = 1,00000 \,

E 1 = q 1 2 - p 1 r 1 = 0,00000 {\ displaystyle E_ {1} = q_ {1} ^ {2} -p_ {1} r_ {1} = 0,00000 \,}

E_ {1} = q_ {1} ^ {2} -p_ {1} r_ {1} = 0,00000 \,

которые являются ожидаемыми значениями. Читатель может продемонстрировать, что последующее использование значений второго поколения для третьего поколения даст идентичные результаты.

Оценка несущей частоты

Принцип Харди – Вайнберга также можно использовать для оценки частоты носителей аутосомно-рецессивного состояния в популяции на основе частоты страдает.

Предположим, что примерно $1 2500 {\ displaystyle \ textstyle {\ frac {1} {2500}}}$ ${\ displaystyle \ textstyle {\ frac {1} {2500}}}$ младенцы рождаются с кистозным фиброзом, это о частоте гомозиготных особей, наблюдаемых в популяциях Северной Европы. Мы можем использовать уравнения Харди – Вайнберга для оценки несущей частоты, частоты гетерозиготных особей, $2 pq {\ displaystyle \ textstyle 2pq}$ ${\ displaystyle \ textstyle 2pq}$ .

q 2 = 1 2500 q = 1 50 p = 1 - q { \ displaystyle {\ begin {align} q ^ {2} = {\ frac {1} {2500}} \\ q = {\ frac {1} {50}} \\ p = 1-q \ end {align} }}

{\ displaystyle {\ begin {align} q ^ {2} = {\ frac {1} {2500}} \\ q = {\ frac {1} {50}} \\ p = 1 -q \ end {align}}}

Поскольку $1 50 {\ displaystyle \ textstyle {\ frac {1} {50}}}$ ${\ displaystyle \ textstyle {\ frac {1} {50}}}$ мало, мы можем взять p, $1–1 50 {\ displaystyle \ textstyle 1 - {\ frac {1} {50}}}$ ${\ displayst yle \ textstyle 1 - {\ frac {1} {50}}}$ , чтобы быть 1.

2 pq = 2 1 50 2 pq = 1 25 {\ displaystyle {\ begin {align} 2pq = 2 {\ frac {1} {50}} \\ 2pq = {\ frac {1} {25}} \ end {align}}}

{\ displaystyle {\ begin {align} 2pq = 2 {\ frac {1} {50}} \\ 2pq = {\ frac {1} {25}} \ end {align} }}

Таким образом, мы оцениваем скорость передачи данных как $1 25 { \ displaystyle \ textstyle {\ frac {1} {25}}}$ ${\ displaystyle \ textstyle {\ frac {1} {25}}}$ , что примерно соответствует частоте, наблюдаемой в популяциях Северной Европы.

Это можно упростить до несущей частоты, которая примерно в два раза больше квадратного корня из частоты рождения.

Графическое представление

A диаграмма де Финетти, представляющая распределение частот генотипов

Распределение частот генотипов для биаллельного локуса в популяции можно представить графически, используя Диаграмма де Финетти. Здесь используется треугольный график (также известный как трехлинейный, трехосный или тройной график ) для представления распределения трех частот генотипа по отношению друг к другу. Он отличается от других подобных графиков тем, что направление из осей было обратным. Изогнутая линия на диаграмме - это парабола Харди - Вайнберга и представляет состояние, в котором аллели находятся в равновесии Харди - Вайнберга. На таких графиках можно вызвать эффекты естественного отбора и его влияние на частоту аллелей. Диаграмма де Финетти была улучшена и широко использовалась А. У. Ф. Эдвардс в своей книге «Основы математической генетики».

См. Также

Регрессия к среднему
Полиномиальное распределение (Харди - Вайнберг - это трехчленное распределение с вероятностями $(θ 2, 2 θ (1 - θ), (1 - θ) 2) {\ displaystyle (\ theta ^ {2}, 2 \ theta (1- \ theta), (1- \ theta) ^ {2})}$ $(\ theta ^ {2}, 2 \ theta (1- \ theta), (1- \ theta) ^ {2})$ )
Аддитивное неравновесие и z-статистика