В популяционной генетике используется принцип Харди - Вайнберга, также известный как равновесие Харди - Вайнберга, модель, теорема, или закон, гласит, что частоты аллелей и генотипов в процессе роста остаются постоянными от поколения к поколению в отсутствие других эволюционных влияний. Эти влияния включают генетический дрейф, выбор партнера, ассортативное спаривание, естественный отбор, половой отбор, мутация, поток генов, мейотический драйв, генетический автостоп, узкое место популяции, эффект основателя и инбридинг.
В простейшем случае одного локуса с двумя аллелями, обозначенными A и a, с частотами f(A) = p и f(a) = q, соответственно ожидаемые частоты генотипов при случайном скрещивании равны f(AA) = p для AA гомозигот, f(aa) = q для гомозигот aa, и f(Aa) = 2pq для гетерозигот. В отсутствие отбора, мутации, генетического дрейфа или других частотах аллелей p и q постоянны между поколениями, поэтому равновесие достигается.
Принцип назван в честь G. Х. Харди и Вильгельм Вайнберг, которые осуществляли это математически. Статья Харди была сосредоточена на опровержении широко распространенного тогда мнения о том, что доминантный аллель автоматически имеет тенденцию к увеличению частоты; сегодня путаница между доминированием и отбором встречается реже. Сегодня тесты на частоту генотипов Харди - Вайнберга используются в основном для проверки стратификации населения и других форм неслучайного спаривания.
Рассмотрим популяцию однодомных диплоидов, где каждый производит мужские и женские гаметы с одинаковой величиной и имеет два аллеля в каждом локусе гена. Организмы размножаются путем случайного объединения гамет (популяционная модель «генофонда»). Локус в этой поплавке имеет два аллеля, A и a, которые встречаются с начальными частотами f 0 (A) = p и f 0 (a) = q, соответственно. Частоты аллелей в каждом поколении путем объединения аллелей из каждого генотипа одного поколения с ожидаемым вкладом гомозиготного и гетерозиготного генотипов, которые равны 1 и 1/2 соответственно:
(1) |
(2) |
Различные способы формирования генотипов следующего поколения могут быть показаны в квадрате Пеннета, где доля каждого генотипа равна произведению частот аллелей строки и столбца текущего поколения.
Самок | |||
---|---|---|---|
A (p) | a (q) | ||
Самцов | A (p) | AA (p) | Aa (pq) |
a (q) | Aa (qp) | aa (q) |
Сумма записи - p + 2pq + q = 1, так как частоты генотипов должны в сумме равняться единице.
Заметим еще раз, что, поскольку p + q = 1, биномиальное разложение (p + q) = p + 2pq + q = 1 дает те же отношения.
Суммируя элементы квадрата Пеннета или биноми разложения, мы получаем ожидаемые пропорции генотипов среди потомков после одного поколения:
(3) |
(4) |
(5) |
Эти частоты определяют равновесие Харди - Вайнберга. Следует отметить, что частоты генотипов после первого поколения не обязательно должны совпадать с частотами генотипов от начального поколения, например, f 1 (AA) ≠ f 0 (AA). Однако частоты генотипов для всех будущих времен будут равны частотам Харди - Вайнберга, например f t (AA) = f 1 (AA) для t>1. Это следует из того, что частоты генотипов следующего поколения зависят от частот аллелей текущего поколения, которые вычисляются по уравнениям (1) и (2), сохраняются от исходного поколения:
Для более общих случаев двудомных диплоидов [организмы либо самцы, либо самки], которые воспроизводятся путем случайного спаривания особей, это необходимо для расчета частот генотипов из девяти исполнителей спариваний между каждым родительским генотипом (AA, Aa и aa) любог о пола, взвешенных по ожидаемому генотипу роли каждого спаривания. Эквивалентно, можно рассмотреть шесть уникальных диплоид-диплоидных комбинаций:
и строит квадрат Пеннета для каждого, чтобы вычислить его вклад в генотипы следующего поколения. Эти вклады взвешиваются в соответствии с вероятностью каждой диплоидно-диплоидной комбинации, которая следует полиномиальному распределению с k = 3. Например, вероятность брачной комбинации (AA, aa) составляет 2 f t (AA) f t (aa), и это может привести только к генотипу Aa: [0,1,0]. В целом, результирующие частоты генотипов рассчитываются как:
Как и раньше, можно показать, что частоты аллелей в момент времени t + 1 равны частотам в момент времени t, а значит, постоянны во времени.. Точно так же частоты генотипов зависят только от частот аллелей, и поэтому после времени t = 1 также остаются постоянными во времени.
Если у однодомных или раздельнополых организмов пропорций аллелей или генотипов изначально неодинаковы для обоих полов, можно показать, что постоянные пропорции достигаются после одного генерация случайного спаривания. Если раздельнополые организмы гетерогаметны и локус расположен на Х-хромосоме, можно показать, что если частоты аллелей изначально неодинаковы у двух полов [например, женщины XX и мужчины XY, как у людей], f′ (a) в гетерогаметных сексуальных «погонях» f(a) в гомогаметный пол предыдущего поколения, пока не достигнуто равновесие при средневзвешенном значении двух исходных частот.
В основе равновесия Харди-Вайнберга лежат следующие семь допущений:
Нарушение предположений Харди - Вайнберга может вызвать отклонения от ожидания. Как это влияет на население, зависит от допущений, которые нарушаются.
Если популяция нарушает одно из следующих предположений, популяция может быть пропорции Харди - Вайнберга сохраняются в каждом поколении, но частоты аллелей со временем будут меняться.
Если ген A сцеплен с полом, гетерогаметный пол (например, самцы млекопитающих; птичьи самки) имеют только одну копию гена (и называются гемизиготными), в то время как гомогаметный пол (например, человеческие самки) имеет две копии. Частоты генотипов в равновесии: p и q для гетерогаметного пола, но p, 2pq и q для гомогаметного пола.
Например, у людей красно-зеленая дальтонизм является Х-сцепленным рецессивным признаком. У западноевропейских мужчин этот признак показывает примерно 1 из 12 (q = 0,083), тогда как он рассматривает примерно 1 из 200 женщин (0,005 по сравнению с q = 0,007), что очень близко к пропорциям Харди - Вайнберга.
Если популяция объединяется с мужчинами и женщинами с разной аллелей в каждой субпопуляции (мужчины или женщины), то частота аллелей мужской популяции будет соответствовать пропорциям аллелей женской популяции, потому что каждый сын получает свою Х-хромосому от матери. Население очень быстро приходит к равновесию.
Простой вывод, приведенный выше, может быть обобщен для более чем двух аллелей и полиплоидии.
Учитывайте частоту дополнительных аллелей, r. С двумя аллелями - это биномиальное расширение для (p + q), и, таким образом, случай с тремя аллелями - это триномиальное расширение (p + q + r).
В целом, рассмотрим аллели A 1,..., A n задается частотами аллелей от p 1 до p n;
дает для всех гомозигот :
и для всех гетерозигот :
Принцип Харди-Вайнберга также может быть обобщен на полиплоидные системы, то есть для организмов, которые имеют более двух копий каждой хромосомы. Рассмотрим снова только два аллеля. Диплоидный случай - это биномиальное разложение из:
и, следовательно, полиплоидный случай - это полиномиальное разложение из:
, где c - плоидность, например с тетраплоидом (c = 4):
Генотип | Частота |
---|---|
AAAA | |
AAAa | |
AAaa | |
AAaa | |
aaaa |
От того, является ли организм «истинным» тетраплоидом или амфидиплоидом, будет зависеть, как Потребуется много времени, чтобы население достигло равновесия Харди - Вайнберга.
для различных аллелей в -плоидов, частоты генотипов в равновесии Харди - Вайнберга задаются отдельными членами в полиномиальном разложении из :
Тестирование отклонения от HWP обычно выполняется с помощью критерия хи-квадрат Пирсона с использованием наблюдаемых частот генотипов, полученных из данных и ожидаемых значений генотипов, полученных, полученных с помощью HWP. Для систем с большим количеством аллелей это может привести к получению данных с множеством пустых генотипов и низким числом генотипов, потому что в выборе часто не хватает индивидов для адекватного представления всех классов генотипов. Если это так, предположение асимптотики для распределения хи-квадрат больше не будет, и может потребоваться использовать формулу точного критерия Фишера., для решения которой требуется компьютер . Совсем недавно был предложен ряд методов MCMC проверки отклонений от HWP (Guo Thompson, 1992; Wigginton et al. 2005)
Эти данные взяты из E. B. Ford (1971) на алой тигровой мотыльке, для которой были зарегистрированы фенотипы выборки популяции. Предполагается, что различие между генотипом и фенотипом пренебрежимо мало. нулевая гипотеза состоит в том, что популяция находится в пропорциях Харди-Вайнберга, а альтернативная гипотеза заключается в том, что популяция не имеет пропорций Харди-Вайнберга.
Фенотип | Белые пятна (AA) | Промежуточные (Aa) | Небольшие пятна (aa) | Всего |
---|---|---|---|---|
Число | 1469 | 138 | 5 | 1612 |
Отсюда можно вычислить частоты аллелей:
и
Итак, Харди– Вайнберг математическое ожидание равно:
критерий хи-квадрат Пирсона утверждает:
Имеется 1 степень свободы (степень свободы для теста на пропорции Харди - Вайнберга: # генотипов - # аллелей). 5% уровень значимости для 1 степени свободы составляет 3,84, а поскольку значение χ меньше этого, нулевая гипотеза о том, что популяция находится в частотах Харди - Вайнберга, составляет не отклонено.
Точный тест Фишера могут использовать условия для тестирования пропорций Харди - Вайнберга. Тест тест зависит от частот аллелей p и q, проблему можно рассматривать как проверка на правильное количество гетерозигот. Таким образом, гипотеза о пропорциях Харди-Вайнберга отвергается, если количество гетерозигот слишком велико или слишком мало. Условные вероятности гетерозиготы с учетом частот аллелей в Emigh (1980) как
где n 11, n 12, n 22 - наблюдаемые числа трех генотипов, AA, Aa и aa, соответственно, и n 1 - аллелей A, где .
Пример Используя один из примеров из Emigh (1980), мы можем рассмотреть случай, когда n = 100 и p = 0,34. Возможные наблюдаемые гетерозиготы и их точный уровень значимости в таблице 4.
Количество гетерозигот | Уровень значимости |
---|---|
0 | 0,000 |
2 | 0,000 |
4 | 0,000 |
6 | 0,000 |
8 | 0,000 |
10 | 0,000 |
12 | 0,000 |
14 | 0,000 |
16 | 0,000 |
18 | 0,001 |
20 | 0,007 |
22 | 0,034 |
34 | 0,067 |
24 | 0,151 |
32 | 0,291 |
26 | 0,474 |
30 | 0,730 |
28 | 1.000 |
Используя эту таблицу, нужно найти уровень значимости теста на основе наблюдаемого количества гетерозигот. Например, если наблюдается 20 гетерозигот, уровень значимости для теста составляет 0,007. Как это типично для точного теста Фишера для небольших выборок, градация уровней значимости довольно грубая.
Однако такая таблица должна создаваться для каждого эксперимента, поскольку зависит от n, так и от p.
Тесты эквивалентности разработаны для того, чтобы установить соответствующее соответствие наблюдаемых частот генотипов Харди-Вайнберга. Пусть обозначает семейство распределений генотипов в предположении равновесия Харди Вайнберга. Расстояние между распределением генотипов и равновесием Харди Вайнберга определяется как , где - некоторое расстояние. Задача теста на эквивалентность задается формулой и , где является параметром допуска. Если гипотеза можно отклонить, тогда популяция с высокой вероятностью близка к равновесию Харди Вайнберга. Тесты эквивалентности для двуаллельного случая разработаны, в Wellek (2004). множественных аллелей предложены в Ostrovski (2020).
Коэффициент инбридинга, F (см. Также F-статистика ), составляет единицу минус наблюдаемая частота гетерозигот по сравнению с ожидаемой из равновесия Харди - Вайнберга.
где ожидаемое значение из равновесия Харди - Вайнберга определяется как
Например, для данных Ford выше;
Для двух аллелей критерия согласия по критерию хи-квадрат для соотношений Харди - Вайнберга эквивалентен тесту на инбридинг, F = 0.
Коэффициент инбридинга нестабилен, поскольку ожидаемое значение приближается к нулю, и, следовательно, бесполезен для редких и очень распространенных аллелей. Для: E = 0, O>0, F = −∞ и E = 0, O = 0, F не определено.
Менделевская генетика вновь открыты в 1900 году, однако остается несколько спорным в течение нескольких лет, так как не было тогда известно, как это может вызвать непрерывные характеристики. Удный Юл (1902) выступал против менделизма, потому что считал, что доминантные аллели увеличатся в популяции. Американец Уильям Э. Кастл (1903) показал, что без отбора частоты генотипов останутся стабильными. Карл Пирсон (1903) нашел одно положение равновесия со значениями p = q = 0,5. Реджинальд Паннетт, не в состоянии опровергнуть точку зрения Юла, представил проблему Г. Х. Харди, британский математик, с которым он играл в крикет. Харди был чистым математиком и относился к прикладной математике с некоторым презрением; его взгляд на использование биологами в его статье 1908 года, где он математически используется как «очень просто»:
. Таким образом, указан известен как Закон Харди в русскоязычном мире до 1943 года, когда Курт Стерн указал, что он был введан независимо в 1908 году немецким врачом Вильгельмом Вайнбергом. Уильям Кастл в 1903 году также вывел отношения для особого случая равных частот аллелей, и это иногда (но редко) называют законом Харди - Вайнберга - Кастла.
Утверждение Харди начинается с рекуррентного соотношения для частот p, 2q и r. Эти рекуррентные отношения вытекают из фундаментальных концепций вероятности, в частности, независимости и условной вероятности. Например, рассмотрим вероятность того, что потомство поколения будет гомозиготным доминантным. Аллели наследуются независимо от каждого родителя. Доминантный аллель может быть унаследован от гомозиготного доминантного родителя с вероятностью 1 или от гетерозиготного родителя с вероятностью 0,5. Чтобы представить это рассуждение в виде уравнения, пусть представляет наследование доминантного аллеля от родителя. Кроме того, пусть и потенциальные родительские генотипы в последнем поколении.
Те же рассуждения, примененные к другим генотипам, дают два оставшихся рекуррентных отношений. Равновесие наступает, когда каждая пропорция постоянна между последующими поколениями. Более формально популяция находится в равновесии в поколении , когда
Решая эти уравнения, можно определить необходимые и достаточные условия для равновесия. Опять же, рассмотрим частоту гомозиготных доминантных животных. Равновесие подразумевает
Сначала рассмотрим случай, когда , и обратите внимание, что он означает, что и . Теперь рассмотрим оставшийся случай, где ≠
Где выполняется окончательное равенство, потому что пропорции аллелей должны в сумме равняться единице. В обоих случаях . Можно показать, что два других состояния равновесия подразумевают то же уравнение. Вместе решения трех равновесия предполагают достаточность условий Харди для равновесия. Условие всегда выполняется для второго поколения, все последующие поколения имеют одинаковые пропорции.
Полезен пример вычисления распределения генотипов, полученный с помощью исходных уравнений Харди. Распределение фенотипов из книги 3 выше будет Работа для начального распределения генотипов Харди. Обратите внимание, что значения p и q, используемые Харди, не совпадают с используемыми выше.
В качестве проверки распределения вычислите
и
Для следующего поколения уравнения Харди дают
Снова в качестве проверки распределения вычислите
и
которые являются ожидаемыми значениями. Читатель может продемонстрировать, что последующее использование значений второго поколения для третьего поколения даст идентичные результаты.
Принцип Харди – Вайнберга также можно использовать для оценки частоты носителей аутосомно-рецессивного состояния в популяции на основе частоты страдает.
Предположим, что примерно младенцы рождаются с кистозным фиброзом, это о частоте гомозиготных особей, наблюдаемых в популяциях Северной Европы. Мы можем использовать уравнения Харди – Вайнберга для оценки несущей частоты, частоты гетерозиготных особей, .
Поскольку мало, мы можем взять p, , чтобы быть 1.
Таким образом, мы оцениваем скорость передачи данных как , что примерно соответствует частоте, наблюдаемой в популяциях Северной Европы.
Это можно упростить до несущей частоты, которая примерно в два раза больше квадратного корня из частоты рождения.
Распределение частот генотипов для биаллельного локуса в популяции можно представить графически, используя Диаграмма де Финетти. Здесь используется треугольный график (также известный как трехлинейный, трехосный или тройной график ) для представления распределения трех частот генотипа по отношению друг к другу. Он отличается от других подобных графиков тем, что направление из осей было обратным. Изогнутая линия на диаграмме - это парабола Харди - Вайнберга и представляет состояние, в котором аллели находятся в равновесии Харди - Вайнберга. На таких графиках можно вызвать эффекты естественного отбора и его влияние на частоту аллелей. Диаграмма де Финетти была улучшена и широко использовалась А. У. Ф. Эдвардс в своей книге «Основы математической генетики».
Викискладе есть материалы, связанные с законом Харди - Вайнберга. |