Исправление index

редактировать
Мера дифференциации населения

индекс фиксации (FST) является мерой дифференциации населения из-за генетической структуры. Его часто оценивают на основе данных генетического полиморфизма, таких как однонуклеотидный полиморфизм (SNP) или микросателлиты. Разработанный как частный случай F-статистики Райта, он является одной из наиболее часто используемых статистик в популяционной генетике.

Содержание
  • 1 Определение
  • 2 Оценка
  • 3 Интерпретация
  • 4 F ST у человека
  • 5 Аутосомные генетические расстояния на основе классических маркеров
    • 5.1 Аутосомные генетические расстояния на основе SNP
  • 6 Программы для расчета F ST
  • 7 Модули для вычисления F ST
  • 8 Ссылки
    • 8.1 Дополнительная литература
  • 9 Внешние ссылки
Определение

Два наиболее часто используемых определения для F ST в данном локусе основаны на дисперсии частот аллелей между популяциями и на вероятности идентичности по происхождению.

If p ¯ {\ displaystyle {\ bar {p }}}\ bar {p} - средняя частота аллеля в общей популяции, σ S 2 {\ displaystyle \ sigma _ {S} ^ {2}}\ sigma _ {S} ^ {2} - дисперсия в частоте аллеля между различными субпопуляциями, взвешенной по размеру субпопуляций, и σ T 2 {\ displaystyle \ sigma _ {T} ^ {2}}\ sigma _ {T} ^ {2} - дисперсия аллельного состояния в общей популяции, F ST определяется как

FST знак равно σ S 2 σ T 2 знак равно σ S 2 p ¯ (1 - p ¯) {\ displaystyle F_ {ST} = {\ frac {\ sigma _ {S} ^ {2}} {\ sigma _ { T} ^ {2}}} = {\ frac {\ sigma _ {S} ^ {2}} {{\ bar {p}} (1 - {\ bar {p}})}}}F _ {{ST}} = {\ frac {\ sigma _ {S} ^ {2}} {\ sigma _ {T} ^ {2}}} = {\ frac {\ sigma _ {S} ^ {2}} {{\ bar {p}} (1 - {\ bar {p}})}}

Райта Определение иллюстрирует, что F ST измеряет величину генетической изменчивости, которая может быть объяснена структурой популяции. Это также можно рассматривать как долю от общего разнообразия, которая не является следствием среднего разнообразия внутри субпопуляций, где разнообразие измеряется вероятностью того, что два случайно выбранных аллеля различны, а именно 2 p (1 - p) {\ displaystyle 2p (1-p)}2p (1-p) . Если частота аллеля в i {\ displaystyle i}i -ой популяции равна pi {\ displaystyle p_ {i}}p_ {i} и относительный размер i {\ displaystyle i}i -я совокупность ci {\ displaystyle c_ {i}}c_ {i} , тогда

FST = p ¯ (1 - p ¯) - ∑ cipi (1 - pi) p ¯ (1 - p ¯) = p ¯ (1 - p ¯) - p (1 - p) ¯ p ¯ (1 - p ¯) {\ displaystyle F_ {ST} = {\ frac {{\ bar {p}} (1 - {\ bar {p}}) - \ sum c_ {i} p_ {i} (1-p_ {i})} {{\ bar {p}} (1 - {\ bar {p}})}} = {\ frac {{\ bar {p}} (1 - {\ bar {p}}) - {\ overline {p (1-p)}}} {{ \ bar {p}} (1 - {\ bar {p}})}}}F_ {{ST}} = {\ frac {{\ bar {p}} (1 - {\ bar {p}}) - \ sum c_ {i} p_ {i} (1-p_ {i})} {{ \ bar {p}} (1 - {\ bar {p}})}} = {\ frac {{\ bar {p}} (1 - {\ bar {p}}) - \ overline {p (1- p)}} {{\ bar {p}} (1 - {\ bar {p}})}}

В качестве альтернативы,

FST = f 0 - f ¯ 1 - f ¯ {\ displaystyle F_ {ST} = {\ frac {f_ {0} - {\ bar {f}}} {1 - {\ bar {f}}}}}F_ {{ST}} = {\ frac {f_ {0} - {\ bar {f}}} {1 - {\ bar {f}}}}

где f 0 {\ displaystyle f_ {0}}f_ {0} - вероятность идентичности по происхождению двух особей при условии, что эти два человека принадлежат к одной субпопуляции, а f ¯ {\ displaystyle {\ bar {f}}}{\ bar {f}} - вероятность того, что два человека от общей численности населения идентичны по происхождению. Используя это определение, F ST можно интерпретировать как измерение того, насколько близко находятся два человека из одной и той же субпопуляции по сравнению со всей популяцией. Если частота мутаций мала, эту интерпретацию можно сделать более явной, связав вероятность идентичности по спуску с временем слияния : Пусть T 0 и T обозначает среднее время слияния для особей из одной субпопуляции и всей популяции, соответственно. Тогда

FST ≈ 1 - T 0 T {\ displaystyle F_ {ST} \ приблизительно 1 - {\ frac {T_ {0}} {T}}}F _ {{ST}} \ приблизительно 1 - {\ frac {T_ { 0}} {T}}

Эта формулировка имеет то преимущество, что ожидаемое время до слияние можно легко оценить на основе генетических данных, что привело к разработке различных оценок для F ST.

Оценка

На практике ни одна из величин, используемых для определений, не может быть легко измерена. Как следствие, были предложены различные оценки. Особенно простая оценка, применимая к данным последовательности ДНК:

FST = π Between - π Within π Between {\ displaystyle F_ {ST} = {\ frac {\ pi _ {\ text {Between}} - \ pi _ { \ text {Within}}} {\ pi _ {\ text {Between}}}}}F _ {{ST}} = {\ frac {\ pi _ {{\ text {Between}}} - \ pi _ {{\ text {Within}}}} {\ pi _ {{\ text {Между}}}}}

где π Between {\ displaystyle \ pi _ {\ text {Between}}}\ pi _ {{\ text {Между}}} и π Within {\ displaystyle \ pi _ {\ text {Within}}}\ pi _ {{\ text {Within}}} представляют среднее количество парных различий между двумя людьми, отобранными из разных подгрупп (π Между {\ displaystyle \ pi _ {\ text {Between}}}\ pi _ {{\ text {Между}}} ) или из той же подгруппы населения (π Within {\ displaystyle \ pi _ {\ text {Within} }}\ pi _ {{\ text {Within}}} ). Среднюю парную разницу в популяции можно рассчитать как сумму парных различий, деленную на количество пар. Однако эта оценка оказывается необъективной, если размеры выборки малы или различаются между популяциями. Следовательно, на практике используются более сложные методы для вычисления F ST. Две из наиболее широко используемых процедур - это оценка Weir Cockerham (1984) или выполнение анализа молекулярной дисперсии. Список реализаций доступен в конце этой статьи.

Интерпретация

Это сравнение генетической изменчивости внутри и между популяциями часто используется в прикладной популяционной генетике. Диапазон значений от 0 до 1. Нулевое значение подразумевает полный панмиксис ; это означает, что две популяции свободно скрещиваются. Значение единицы означает, что все генетические вариации объясняются структурой популяции и что эти две популяции не имеют общего генетического разнообразия.

Для идеализированных моделей, таких как модель конечных островов Райта, F ST может использоваться для оценки скорости миграции. Согласно этой модели скорость миграции составляет

M = m μ ≈ 1 4 (1 FST - 1) {\ displaystyle M = {\ frac {m} {\ mu}} \ приблизительно {\ frac {1} {4 }} \ left ({\ frac {1} {F_ {ST}}} - 1 \ right)}{\ displaystyle M = {\ frac {m} {\ mu}} \ приблизительно { \ frac {1} {4}} \ left ({\ frac {1} {F_ {ST}}} - 1 \ right)} ,

где m - скорость миграции на поколение, а μ {\ displaystyle \ mu}\ mu - частота мутаций на поколение.

Интерпретация F ST может быть затруднена, если проанализированные данные сильно полиморфны. В этом случае вероятность идентичности по происхождению очень мала, и F ST может иметь произвольно низкую верхнюю границу, что может привести к неверной интерпретации данных. Кроме того, строго говоря, F ST не является расстоянием в математическом смысле, поскольку оно не удовлетворяет неравенству треугольника .

для популяций растений которые явно принадлежат к одному и тому же виду, значения F ST более 15% считаются «большой» или «значительной» дифференциацией, а значения ниже 5% считаются «небольшими» или «незначительная» дифференциация. Значения для популяций млекопитающих между подвидами или близкородственными видами, типичные значения составляют порядка от 5% до 20%. F ST между евразийской и североамериканской популяциями серого волка составляли 9,9%, между красным волком и Серые волки популяции составляют от 17% до 18%. Восточный волк, недавно признанный сильно смешанный «волкоподобный вид», имеет значения F ST ниже 10% по сравнению как с евразийскими (7,6%), так и с североамериканскими серыми волками ( 5,7%), с красным волком (8,5%), и даже более низкое значение в сочетании с Coyote (4,5%).

FSTу людей значения

FSTсильно зависят от выбора населения. Близкородственные этнические группы, такие как датчане vs. голландский или французский vs. испанцы показывают значения значительно ниже 1%, неотличимые от панмиксии. Было обнаружено, что в Европе самые разные этнические группы имеют значения порядка 7% (лопарей против сардинцев ).

Более высокие значения обнаруживаются при сравнении сильно расходящихся однородных групп: максимальное найденное значение было близко к 46%, между Mbuti и папуасами.

на основе аутосомных генетических расстояний по классическим маркерам

В своем исследовании «История и география генов человека» (1994) Кавалли-Сфорца, Меноцци и Пьяцца предоставляют одни из наиболее подробных и всеобъемлющих оценок генетических расстояний между человеческими популяциями внутри и между континентами.. Их исходная база данных содержит 76 676 частот генов (с использованием 120 полиморфизмов крови), что соответствует 6 633 образцам в разных местах. Отбирая и объединяя такие образцы, они ограничивают свой анализ 491 популяцией. Они сосредотачиваются на аборигенном населении, которое было на своем нынешнем месте в конце 15 века, когда начались великие европейские миграции. При изучении генетических различий на мировом уровне число сокращается до 42 репрезентативных популяций, объединяющих субпопуляции, характеризующиеся высоким уровнем генетического сходства. Для этих 42 популяций Кавалли-Сфорца и соавторы сообщают о двусторонних расстояниях, рассчитанных на основе 120 аллелей. Среди этого набора из 42 популяций мира наибольшее генетическое расстояние наблюдается между пигмеями мбути и жителями Папуа-Новой Гвинеи, где расстояние Fst составляет 0,4573, а наименьшее генетическое расстояние (0,0021) - между датчанами и англичанами. При рассмотрении более дезагрегированных данных по 26 европейским популяциям наименьшее генетическое расстояние (0,0009) находится между голландцами и датчанами, а наибольшее (0,0667) - между саамами и сардинцами. Среднее генетическое расстояние среди 861 доступной пары из 42 выбранных популяций оказалось равным 0,1338. Генетическое расстояние 0,1338 означает, что родство между неродственными особями одного и того же происхождения по отношению к мировой популяции эквивалентно родству между полукровными братьями и сестрами в одной случайное спаривание популяции. Это также означает, что если человек из данной предковой популяции имеет смешанного сводного брата, этот человек генетически ближе к неродственной особи их предковой популяции, чем к их смешанному сводному брату.

Аутосомные генетические расстояния на основе SNP

Исследование 2012 года, основанное на данных Международного проекта HapMap, оценивает F ST между тремя основными «континентальными» популяциями из европейцев (объединены из жителей Юты северного и западноевропейского происхождения из коллекции CEPH и итальянцев из Тосканы), выходцев из Восточной Азии (объединяют ханьцев из Пекина, китайцев из столичного Денвера и японцев из Токио, Япония) и африканцев к югу от Сахары (объединяющих Лухья из Вебуе, Кения, масаи из Киньявы, Кения и йоруба из Ибадан, Нигерия). Он сообщил о значении, близком к 12% между континентальными популяциями, и значениях, близких к панмиксия (менее 1%) в континентальных популяциях.

Межконтинентальные аутосомные генетические расстояния на основе SNP
Европа (CEU)Африка к югу от Сахары (йоруба)Восточная Азия (японский)
Африка к югу от Сахары (йоруба)0,153
Восточная Азия (яп.)0,1110,190
Восточная Азия (китайский)0,1100,1920,007
Внутри- Европейские / средиземноморские аутосомные генетические дистанции на основе SNP
итальянцыпалестинцышведыфинныиспанцынемцырусскиефранцузыгреки
палестинцы0,0064
шведы0,0064-0,00900,0191
Финны0,0130-0,02300,0050-0,0110
Испанский0,0010-0,00500,01010,0040-00550,0110-0,0170
немцы0,0029-0,00800,01360,0007-0,00100,0060-0,01300,0015-0,0030
Русские0,0088-0,01200,02020,0030-0,00360,0060-0,01200,0070-0,00790,0030-0,0037
французский0,0030 -0,00500,00200,0080-0,01500,00100,00100,0050
греки0,00000,00570,00840,00350,00390,0108
Программы для расчета F ST
Модули для расчета F ST
Ссылки

Дополнительная литература

Внешние ссылки
Последняя правка сделана 2021-05-20 07:38:01
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте