Нарушение равновесия по сцеплению

редактировать

Неслучайная ассоциация аллелей в двух или более генетических локусах (на одной или разных хромосомах)

В популяционной генетике, неравновесие по сцеплению (LD) представляет собой неслучайную ассоциацию аллелей в различных локусах в данной популяции. Считается, что локусы находятся в неравновесном сцеплении, когда частота ассоциации их различных аллелей выше или ниже, чем можно было бы ожидать, если бы локусы были независимыми и ассоциировались случайным образом.

На неравновесие по сцеплению влияют многие факторы, включая отбор, скорость генетической рекомбинации, скорость мутаций, генетический дрейф, система спаривания, популяционная структура и генетическая связь. В результате характер неравновесия по сцеплению в геноме является мощным сигналом популяционных генетических процессов, которые его структурируют.

Несмотря на свое название, неравновесие по сцеплению может существовать между аллелями в разных локусах без какой-либо генетической связи между ними и независимо от того, находятся ли частоты аллелей в равновесии (не меняются со временем). Кроме того, нарушение равновесия по сцеплению иногда называют гаметической фазой нарушением равновесия ; однако эта концепция также применяется к бесполым организмам и, следовательно, не зависит от наличия гамет.

Содержание

1 Формальное определение
2 Меры, полученные из $D { \ displaystyle D}$ $D$
3 Пример: два локуса и два аллеля
4 Роль рекомбинации
5 Пример: аллели лейкоцитарного антигена человека (HLA)
6 Ресурсы
7 Программное обеспечение для анализа
8 Программное обеспечение для моделирования
9 См. Также
10 Ссылки
11 Дополнительная литература

Формальное определение

Предположим, что среди гамет, которые образуются в популяции, размножающейся половым путем, аллель A встречается с частота $p A {\ displaystyle p_ {A}}$ $p_ {A}$ в одном локусе (т.е. $p A {\ displaystyle p_ {A}}$ $p_ {A}$ - это доля гамет с A в этом локусе), в то время как в другом локусе аллель B встречается с частотой $p B {\ displaystyle p_ {B}}$ $p_ {B}$ . Аналогично, пусть $p AB {\ displaystyle p_ {AB}}$ $p_ {AB }$ будет частотой, с которой оба A и B встречаются вместе в одной и той же гамете (т.е. $p AB {\ displaystyle p_ {AB }}$ $p_ {AB }$ - частота гаплотипа AB ).

Связь между аллелями A и B может рассматриваться как полностью случайная - что известно в статистике как независимость - когда наличие одной не влияет на возникновение другого, и в этом случае вероятность того, что и A, и B встречаются вместе, дается product $p A p B {\ displaystyle p_ {A} p_ {B}}$ $p_ {A} p_ {B}$ вероятностей. Говорят, что существует неравновесное сцепление между двумя аллелями всякий раз, когда $p AB {\ displaystyle p_ {AB}}$ $p_ {AB }$ отличается от $p A p B {\ displaystyle p_ {A} p_ { B}}$ ${\ displaystyle p_ {A} p_ {B}}$ по любой причине.

Уровень неравновесия по сцеплению между A и B можно количественно оценить с помощью коэффициента неравновесия по сцеплению $DAB {\ displaystyle D_ {AB}}$ $D_ {AB}$ , который определяется как

DAB = p AB - p A p B, {\ displaystyle D_ {AB} = p_ {AB} -p_ {A} p_ {B},}

{\ displaystyle D_ {AB} = p_ {AB} - p_ {A} p_ {B},}

при условии, что оба $p A {\ displaystyle p_ {A }}$ $p_ {A}$ и $p B {\ displaystyle p_ {B}}$ $p_ {B}$ больше нуля. Нарушение равновесия по сцеплению соответствует $D A B ≠ 0 {\ displaystyle D_ {AB} \ neq 0}$ $D_ {AB} \ neq 0$ . В случае $DAB = 0 {\ displaystyle D_ {AB} = 0}$ $D _ {{AB}} = 0$ мы имеем $p AB = p A p B {\ displaystyle p_ {AB} = p_ {A} p_ {B}}$ ${\ displaystyle p_ {AB} = p_ {A} p_ {B}}$ и аллели A и B, как говорят, находятся в равновесии сцепления. Нижний индекс «AB» в $D A B {\ displaystyle D_ {AB}}$ $D_ {AB}$ подчеркивает, что неравновесие по сцеплению является свойством пары {A, B} аллелей, а не их соответствующих локусов. Другие пары аллелей в тех же двух локусах могут иметь разные коэффициенты неравновесия по сцеплению.

Для двух двуаллельных локусов, где a и b - другие аллели в этих двух локусах, ограничения настолько сильны, что только одного значения D достаточно для представления всех неравновесных соотношений сцепления между этими аллелями. В этом случае $DAB = - DA b = - D a B = D ab {\ displaystyle D_ {AB} = - D_ {Ab} = - D_ {aB} = D_ {ab}}$ ${\ displaystyle D_ {AB} = - D_ {Ab} = - D_ {aB} = D_ {ab }}$ . Их отношения можно охарактеризовать следующим образом.

$D = PAB - PA ∗ PB {\ displaystyle D = P_ {AB} -P_ {A} * P_ {B}}$ ${\ displaystyle D = P_ {AB} -P_ {A} * P_ {B}}$

$- D = PA b - PA ∗ P б {\ displaystyle -D = P_ {Ab} -P_ {A} * P_ {b}}$ ${\ displaystyle -D = P_ {Ab} -P_ {A} * P_ {b}}$

$- D = P a B - P a ∗ PB {\ displaystyle -D = P_ {aB} -P_ {a } * P_ {B}}$ ${\ displaystyle -D = P_ {aB} -P_ {a} * P_ {B}}$

$D = P ab - P a ∗ P b {\ displaystyle D = P_ {ab} -P_ {a} * P_ {b}}$ ${\ displaystyle D = P_ {ab} -P_ {a} * P_ {b}}$

Знак D в этом случае выбирается произвольно. Величина D более важна, чем знак D, потому что величина D отражает степень неравновесия по сцеплению. Однако положительное значение D означает, что гамета встречается чаще, чем ожидалось, а отрицательное означает, что комбинация этих двух аллелей встречается реже, чем ожидалось.

Неравновесие по сцеплению в бесполых популяциях может быть определено аналогичным образом с точки зрения частот популяционных аллелей. Кроме того, также можно определить неравновесие сцепления между тремя или более аллелями, однако эти ассоциации более высокого порядка обычно не используются на практике.

Показатели, полученные из $D {\ displaystyle D}$ $D$
Коэффициент неравновесия по сцеплению $D {\ displaystyle D}$ $D$ не всегда является удобной мерой неравновесия по сцеплению, поскольку его диапазон возможных значений зависит от частот аллелей, к которым он относится. Это затрудняет сравнение уровня неравновесия по сцеплению между разными парами аллелей.

Левонтин предложил нормализовать D, разделив его на теоретическую максимальную разницу между наблюдаемыми и ожидаемыми частотами гаплотипов следующим образом:
$D ′ = DD max {\ displaystyle D '= {\ frac {D} {D_ {\ max}}}}$ $D'={\frac {D}{D_{\max }}}$
где
$D max = {max {- p A p B, - (1 - p A) (1 - p B)}, когда D < 0 min { p A ( 1 − p B), ( 1 − p A) p B } when D>0 {\ displaystyle D_ {\ max} = {\ begin {case} \ max \ {- p_ {A} p_ {B}, \, - (1-p_ {A}) (1-p_ {B}) \} {\ text {when}} D <0\\\min\{p_{A}(1-p_{B}),\,(1-p_{A})p_{B}\}{\text{when }}D>0 \ end {cases}}}$ $D_{\max }={\begin{cases}\max\{-p_{A}p_{B},\,-(1-p_{A})(1-p_{B})\}{\text{when }}D<0\\\min\{p_{A}(1-p_{B}),\,(1-p_{A})p_{B}\}{\text{when }}D>0 \ end {ases}}$
Альтернативой $D '{\ displaystyle D'}$ $D'$ является корреляция коэффициент между парами локусов, выраженный как
$r = D p A (1 - p A) p B (1 - p B). {\ displaystyle r = {\ frac {D} {\ sqrt {p_ {A} (1-p_ {A}) p_ {B} (1-p_ {B})}}}.}$ ${\ displaystyle r = {\ frac { D} {\ sqrt {p_ {A} (1-p_ {A}) p_ {B} (1-p_ {B})}}}.}$

Пример: два локуса и два аллеля

Рассмотрим гаплотипы для двух локусов A и B с двумя аллелями в каждом - двухлокусная, двухаллельная модель. Затем в следующей таблице определены частоты каждой комбинации:

Гаплотип	Частота
$A 1 B 1 {\ displaystyle A_ {1} B_ {1}}$ $A_ {1} B_ {1}$	$x 11 {\ displaystyle x_ {11}}$ $x_ {11}$
$A 1 B 2 {\ displaystyle A_ {1} B_ {2}}$ $A_ {1} B_ {2}$	$x 12 {\ displaystyle x_ {12}}$ $x_ {12}$
$A 2 B 1 {\ displaystyle A_ {2} B_ {1}}$ $A_{2}B_{1}$	$x 21 {\ displaystyle x_ {21}}$ $x_{21}$
$A 2 B 2 {\ displaystyle A_ {2} B_ {2}}$ $A_ {2} B_ {2}$	$x 22 {\ displaystyle x_ {22}}$ $x_ {22}$

Обратите внимание, что это относительные частоты. Вышеуказанные частоты можно использовать для определения частоты каждого из аллелей:

Allele	Frequency
$A 1 {\ displaystyle A_ {1}}$ $A_ {1}$	$p 1 = x 11 + x 12 {\ displaystyle p_ {1} = x_ {11} + x_ {12}}$ ${\ displaystyle p_ {1} = x_ {11} + x_ {12}}$
$A 2 {\ displaystyle A_ {2}}$ $A_ {2}$	$p 2 = x 21 + x 22 {\ displaystyle p_ {2} = x_ {21} + x_ {22}}$ ${\ displaystyle p_ { 2} = x_ {21} + x_ {22}}$
$B 1 {\ displaystyle B_ {1}}$ $B_ {1}$	$q 1 = x 11 + x 21 {\ displaystyle q_ {1} = x_ {11} + x_ { 21}}$ ${\ displaystyle q_ {1} = x_ {11} + x_ {21}}$
$B 2 {\ displaystyle B_ {2}}$ $B_ {2}$	$q 2 = x 12 + x 22 {\ displaystyle q_ {2} = x_ {12} + x_ {22}}$ ${\ displaystyle q_ {2} = x_ {12} + x_ {22}}$

Если два локуса и аллели независимы друг от друга, тогда можно выразить наблюдение $A 1 B 1 {\ displaystyle A_ {1} B_ {1}}$ $A_ {1} B_ {1}$ как " $A 1 {\ displaystyle A_ {1}}$ $A_ {1}$ найдено и $B 1 {\ displaystyle B_ {1}}$ $B_ {1}$ найдено ". В таблице выше перечислены частоты для $A 1 {\ displaystyle A_ {1}}$ $A_ {1}$ , $p 1 {\ displaystyle p_ {1}}$ $p_ {1}$ и для $B 1 {\ displaystyle B_ {1}}$ $B_ {1}$ , $q 1 {\ displaystyle q_ {1}}$ $q_ {1}$ , следовательно, частота $A 1 B 1 {\ displaystyle A_ {1} B_ {1}}$ $A_ {1} B_ {1}$ равно $x 11 {\ displaystyle x_ {11}}$ $x_ {11}$ , и согласно правилам элементарной статистики $x 11 = p 1 q 1 {\ displaystyle x_ {11} = p_ {1} q_ {1}}$ ${\ displaystyle x_ {11} = p_ {1} q_ {1}}$ .

Отклонение наблюдаемой частоты гаплотипа от ожидаемой - это величина, называемая неравновесием по сцеплению, и обычно обозначается заглавной буквой D:

D = x 11 - p 1 q 1 {\ displaystyle D = x_ {11} -p_ {1} q_ {1}}

D = x_ {11} -p_ {1} q_ {1}

Следующая таблица иллюстрирует взаимосвязь между частотами гаплотипов и частотами аллелей и D.

	$A 1 {\ displaystyle A_ {1}}$ $A_ {1}$	$A 2 {\ displaystyle A_ {2}}$ $A_ {2}$	Итого
$B 1 {\ displaystyle B_ {1}}$ $B_ {1}$	$x 11 = p 1 q 1 + D {\ displaystyle x_ {11} = p_ {1} q_ {1} + D}$ $x_ {11} = p_ {1} q_ {1} + D$	$x 21 = p 2 q 1 - D {\ displaystyle x_ {21} = p_ {2} q_ {1} -D}$ $x_ {21} = p_ {2} q_ {1} -D$	$q 1 {\ displaystyle q_ {1}}$ $q_ {1}$
$B 2 {\ displaystyle B_ {2}}$ $B_ {2}$	$x 12 = p 1 q 2 - D {\ displaystyle x_ {12} = p_ {1} q_ {2} - D}$ $x_ {12} = p_ {1} q_ {2} -D$	$x 22 = p 2 q 2 + D {\ displaystyle x_ {22} = p_ {2} q_ {2} + D}$ $x_ {22} = p_ {2 } q_ {2} + D$	$q 2 {\ displaystyle q_ {2}}$ $q_ {2}$
Итого	$p 1 {\ displaystyle p_ {1}}$ $p_ {1}$	$p 2 {\ displaystyle p_ {2}}$ $p_ {2}$	$1 {\ displaystyle 1}$ $1$

Роль рекомбинации

в отсутствие эволюционных сил, кроме случайного спаривания, менделевской сегрегации, случайного хромосомного набора и хромосомного кроссовера (т. е. в отсутствие естественного отбора, инбридинга и генетического дрейфа ), показатель неравновесия по сцеплению $D {\ displaystyle D}$ $D$ сходится к нулю вдоль оси времени со скоростью, зависящей от величины скорости рекомбинации $c {\ displaystyle c}$ $c$ между двумя локусами.

Используя обозначения выше, $D = x 11 - p 1 q 1 {\ displaystyle D = x_ {11} -p_ {1} q_ {1}}$ $D = x_ {11} -p_ {1} q_ {1}$ , мы можно продемонстрировать эту сходимость к нулю следующим образом. В следующем поколении $x 11 ′ {\ displaystyle x_ {11} '}$ $x_{11}'$ , частота гаплотипа $A 1 B 1 {\ displaystyle A_ {1} B_ {1} }$ $A_ {1} B_ {1}$ , становится

x 11 ′ = (1 - c) x 11 + cp 1 q 1 {\ displaystyle x_ {11} '= (1-c) \, x_ {11} + c \, p_ {1} q_ {1}}

x_{11}'=(1-c)\,x_{11}+c\,p_{1}q_{1}

Это следует потому, что часть $(1 - c) {\ displaystyle (1-c)}$ $(1-c)$ гаплотипов в потомстве не рекомбинированы и, таким образом, являются копиями случайного гаплотипа своих родителей. Дробь $x 11 {\ displaystyle x_ {11}}$ $x_ {11}$ из них равна $A 1 B 1 {\ displaystyle A_ {1} B_ {1}}$ $A_ {1} B_ {1}$ . Часть $c {\ displaystyle c}$ $c$ рекомбинирует эти два локуса. Если родители являются результатом случайного спаривания, вероятность того, что копия в локусе $A {\ displaystyle A}$ $A$ имеет аллель $A 1 {\ displaystyle A_ {1}}$ $A_ {1}$ равно $p 1 {\ displaystyle p_ {1}}$ $p_ {1}$ и вероятность того, что копия в локусе $B {\ displaystyle B}$ $B$ имеет аллель $B 1 {\ displaystyle B_ {1}}$ $B_ {1}$ равно $q 1 {\ displaystyle q_ {1}}$ $q_ {1}$ , и поскольку эти копии изначально находятся в двух разных гаметах, которые сформировали диплоидный генотип, это независимые события, так что вероятности можно умножить.

Эту формулу можно переписать как

x 11 ′ - p 1 q 1 = (1 - c) (x 11 - p 1 q 1) {\ displaystyle x_ {11} '- p_ {1 } q_ {1} = (1-c) \, (x_ {11} -p_ {1} q_ {1})}

x_{11}'-p_{1}q_{1}=(1-c)\,(x_{11}-p_{1}q_{1})

, так что

D 1 = (1 - c) D 0 {\ displaystyle D_ {1} = (1-c) \; D_ {0}}

D_{1}=(1-c)\;D_{0}

где $D {\ displaystyle D}$ $D$ в $n {\ displaystyle n}$ $n$ -ое поколение обозначается как $D n {\ displaystyle D_ {n}}$ $D_ {n}$ . Таким образом, мы имеем

D n = (1 - c) n D 0. {\ displaystyle D_ {n} = (1-c) ^ {n} \; D_ {0}.}

{\ displaystyle D_ {n} = (1-c) ^ {n} \; D_ {0}.}

Если $n → ∞ {\ displaystyle n \ to \ infty}$ $n \ to \ infty$ , затем $(1 - c) n → 0 {\ displaystyle (1-c) ^ {n} \ to 0}$ $(1-c) ^ {n} \ до 0$ , так что $D n {\ displaystyle D_ {n}}$ $D_ {n}$ сходится к нулю.

Если в какой-то момент мы наблюдаем неравновесие по сцеплению, оно исчезнет в будущем из-за рекомбинации. Однако чем меньше расстояние между двумя локусами, тем меньше будет скорость схождения $D {\ displaystyle D}$ $D$ к нулю.

Пример: Аллели лейкоцитарного антигена человека (HLA)

HLA составляют группу антигенов клеточной поверхности, также известную как MHC человека. Поскольку гены HLA расположены в соседних локусах в конкретной области хромосомы и предположительно проявляют эпистаз друг с другом или с другими генами, значительная часть аллелей находится в неравновесном сцеплении.

Примером такого неравновесия по сцеплению является аллели HLA-A1 и B8 у неродственных датчан, на которые ссылаются Vogel and Motulsky (1997).

Таблица 1. Ассоциация HLA-A1 и B8 у неродственных датчан
			Антиген j		Всего
			$+ {\ displaystyle +}$ $+$	$- {\ displaystyle -}$ $-$
			$B 8 + {\ displaystyle B8 ^ {+}}$ $B8 ^ {+}$	$B 8 - {\ displaystyle B8 ^ {-}}$ $B8 ^ {-}$
Антиген i	$+ {\ displaystyle +}$ $+$	$A 1 + {\ displaystyle A1 ^ {+}}$ $A1 ^ { +}$	$a = 376 {\ displaystyle a = 376 }$ $a = 376$	$b = 237 {\ displaystyle b = 237}$ $b = 237$	$C {\ displaystyle C}$ $C$
Антиген i	$- {\ displaystyle -}$ $-$	$A 1 - {\ displaystyle A1 ^ {-}}$ $A1 ^ {-}$	$c = 91 {\ displaystyle c = 91}$ $c=91$	$d = 1265 {\ displaystyle d = 1265}$ $d = 1265$	$D {\ displaystyle D}$ $D$
Всего			$A {\ displaystyle A}$ $A$	$B { \ displaystyle B}$ $B$	$N {\ displaystyle N}$ $N$
			Нет. индивидуумов

Поскольку HLA является кодоминантным, а экспрессия HLA проверяется только локусом за локусом в опросах, показатель LD должен оцениваться из такой таблицы 2 × 2 справа.

выражение ( $+ {\ displaystyle +}$ $+$ ) частота антигена $i {\ displaystyle i}$ $i$ :

pfi = CN = 0,311; {\ displaystyle pf_ {i} = {\ frac {C} {N}} = 0,311;}

{\ displaystyle pf_ {i} = {\ frac {C} {N }} = 0,311;}

выражение ( $+ {\ displaystyle +}$ $+$ ) частота антигена $j {\ displaystyle j}$ $j$ :

pfj = AN = 0,237; {\ displaystyle pf_ {j} = {\ frac {A} {N}} = 0,237;}

{\ displaystyle pf_ {j} = {\ frac {A} {N}} = 0,237;}

частота гена $i {\ displaystyle i}$ $i$ , учитывая, что люди с '+ Все генотипы / - ',' + / + 'и' - / + 'положительны по антигену $i {\ displaystyle i}$ $i$ :

gfi = 1-1 - pfi = 0,170, {\ displaystyle gf_ {i } = 1 - {\ sqrt {1-pf_ {i}}} = 0,170,}

{\ displaystyle gf_ {i} = 1 - {\ sqrt {1-pf_ {i}}} = 0,170,}

hfij = оценочная частота гаплотипа ij = gfigfj = 0,0215. {\ displaystyle hf_ {ij} = {\ text {оценочная частота гаплотипа}} ij = gf_ {i} \; gf_ {j} = 0,0215.}

{\ displaystyle hf_ {ij} = {\ text {приблизительная частота гаплотипа}} ij = gf_ {i} \; gf_ {j} = 0,0215.}

Обозначая '-' аллели антигена i как x, а если антиген j равен y, наблюдаемая частота гаплотипа xy равна

o [hfxy] = d N {\ displaystyle o [hf_ {xy}] = {\ sqrt {\ frac {d} {N}}} }

{\ displaystyle o [hf_ {xy}] = {\ sqrt {\ frac {d} {N}}}}

и предполагаемая частота гаплотипа xy составляет

e [hfxy] = DN ⋅ BN. {\ displaystyle e [hf_ {xy}] = {\ sqrt {{\ frac {D} {N}} \ cdot {\ frac {B} {N}}}}.}

{\ displaystyle e [hf_ {xy}] = {\ sqrt {{\ frac {D} {N}} \ cdot {\ frac {B} {N}}}}.}

Тогда измерение LD $Δ ij {\ displaystyle \ Delta _ {ij}}$ $\ Delta _ {ij}$ выражается как

Δ ij = o [hfxy] - e [hfxy] = N d - BDN = 0,0769. {\ displaystyle \ Delta _ {ij} = o [hf_ {xy}] - e [hf_ {xy}] = {\ frac {{\ sqrt {Nd}} - {\ sqrt {BD}}} {N}} = 0,0769.}

{\ displaystyle \ Delta _ {ij} = o [hf_ {xy}] - e [hf_ {xy}] = {\ frac {{\ sqrt {Nd }} - {\ sqrt {BD}}} {N}} = 0,0769.}

Стандартные ошибки $SE s {\ displaystyle SEs}$ $SE$ получаются следующим образом:

SE gfi = C 2 N) = 0,00628. {\ displaystyle SE {\ text {of}} gf_ {i} = {\ frac {\ sqrt {C}} {2N)}} = 0,00628.}

{\ displaystyle SE {\ text {of}} gf_ {i} = {\ frac {\ sqrt {C}} {2N)}} = 0,00628.}

SE для hfij = (1 - d / B) ( 1 - d / D) - hfij - hfij 2/2 2 N = 0,00514 {\ displaystyle SE {\ text {of}} hf_ {ij} = {\ sqrt {\ frac {(1 - {\ sqrt {d / B) }}) (1 - {\ sqrt {d / D}}) - hf_ {ij} -hf_ {ij} ^ {2} / 2} {2N}}} = 0,00514}

{\ displaystyle SE {\ text {of}} hf_ {ij} = {\ sqrt {\ frac {(1 - {\ sqrt {d / B}) }) (1 - {\ sqrt {d / D}}) - hf_ {ij} -hf_ {ij} ^ {2} / 2} {2N}}} = 0,00514}

SE от Δ ij = 1 2 N a - 4 N Δ ij (B + D 2 BD - BDN) = 0,00367. {\ displaystyle SE {\ text {of}} \ Delta _ {ij} = {\ frac {1} {2N}} {\ sqrt {a-4N \ Delta _ {ij} \ left ({\ frac {B + D} {2 {\ sqrt {BD}}}} - {\ frac {\ sqrt {BD}} {N}} \ right)}} = 0,00367.}

{\ displaystyle SE {\ текст {of}} \ Delta _ {ij} = {\ frac {1} {2N}} {\ sqrt {a-4N \ Delta _ {ij} \ left ({\ frac {B + D} {2 {\ sqrt {BD}}}} - {\ frac {\ sqrt {BD}} {N}} \ right)}} = 0,00367.}

Тогда, если

t = Δ ij SE для Δ ij {\ displaystyle t = {\ frac {\ Delta _ {ij}} {SE {\ text {of}} \ Delta _ {ij}}}}

{\ displaystyle t = {\ frac {\ Delta _ {ij}} {SE {\ text {of}} \ Delta _ {ij}}}}

превышает 2 по абсолютной величине, величина из $Δ ij {\ displaystyle \ Delta _ {ij}}$ $\ Delta _ {ij}$ статистически значимо велико. Для данных в таблице 1 это 20,9, таким образом, наличие статистически значимой LD между A1 и B8 в популяции допустимо.

Таблица 2. Неравновесие по сцеплению между аллелями HLA у панъевропейцев
аллелей HLA-A i	аллелей HLA-B j	$Δ ij {\ displaystyle \ Delta _ {ij }}$ $\ Delta _ {ij}$	$t {\ displaystyle t}$ $t$
A1	B8	0,065	16,0
A3	B7	0,039	10,3
A2	Bw40	0,013	4,4
A2	Bw15	0,01	3,4
A1	Bw17	0,014	5,4
A2	B18	0,006	2,2
A2	Bw35	-0,009	−2,3
A29	B12	0,013	6,0
A10	Bw16	0,013	5,9

В таблице 2 показаны некоторые комбинации HLA Аллели -A и B, при которых значительная LD наблюдалась у панъевропейцев.

Vogel and Motulsky (1997) спорили, сколько времени потребуется, чтобы исчезло неравновесие по сцеплению между локусами HLA-A и B. Рекомбинация между локусами HLA-A и B считалась величиной порядка 0,008. Ниже мы будем рассуждать аналогично Фогелю и Мотульскому. В случае, если показатель LD составлял 0,003 у панъевропейцев в списке Mittal, это в основном несущественно. Если $Δ 0 {\ displaystyle \ Delta _ {0}}$ $\ Delta _ {0}$ уменьшилось с 0,07 до 0,003 при эффекте рекомбинации, как показано как $Δ n = (1 - c) n Δ 0 {\ displaystyle \ Delta _ {n} = (1-c) ^ {n} \ Delta _ {0}}$ $\ Delta _ { n} = (1-c) ^ {n} \ Delta _ {0}$ , тогда $n ≈ 400 {\ displaystyle n \ приблизительно 400}$ $n \ приблизительно 400$ . Предположим, поколение заняло 25 лет, это означает 10 000 лет. Временной промежуток в истории человечества кажется довольно коротким. Таким образом, наблюдаемое неравновесие по сцеплению между локусами HLA-A и B может указывать на своего рода интерактивный отбор.

Наличие неравновесия по сцеплению между локусом HLA и предполагаемым основным геном восприимчивости к болезни соответствует любому из следующих явлений:

Относительный риск для человека, имеющего конкретный аллель HLA, заболеть определенным заболеванием, больше 1.
Частота встречаемости антигена HLA среди пациентов превышает таковую среди здорового населения. Это оценивается значением $δ {\ displaystyle \ delta}$ $\ delta$ , превышающим 0.

Таблица 3. Связь анкилозирующего спондилита с аллелем HLA-B27
		Пациенты	Контрольные здоровые	Всего
		Анкилозирующий спондилит		Всего
Аллели HLA	$B 27 + {\ displaystyle B27 ^ {+}}$ $B27 ^ {+}$	$a = 96 {\ displaystyle a = 96}$ $a = 96$	$b = 77 {\ displaystyle b = 77}$ $b = 77$	$C {\ displaystyle C}$ $C$
Аллели HLA	$B 27 - {\ displaystyle B27 ^ {-}}$ $B27 ^ {-}$	$c = 22 {\ displaystyle c = 22}$ $c = 22$	$d = 701 {\ displaystyle d = 701}$ $d = 701$	$D {\ displaystyle D}$ $D$
Итого		$A {\ displaystyle A}$ $A$	$B {\ displaystyle B}$ $B$	$N {\ displaystyle N}$ $N$

Таблица ассоциаций пациентов и здоровых людей из контрольной группы с аллелями HLA 2 × 2 показывает значительное отклонение от состояния равновесия, выведенное из предельных частот.

(1) Относительный риск

Относительный риск аллеля HLA для заболевания аппроксимируется отношением шансов в таблице ассоциации 2 × 2 аллеля с заболеванием. В таблице 3 показана связь HLA-B27 с анкилозирующим спондилитом среди голландского населения. Относительный риск $x {\ displaystyle x}$ $x$ этого аллеля приблизительно равен

x = a / b c / d = a d b c (= 39,7, в таблице 3). {\ displaystyle x = {\ frac {a / b} {c / d}} = {\ frac {ad} {bc}} \; (= 39,7, {\ text {в таблице 3}}).}

{\ displaystyle x = {\ frac {a / b} {c / d}} = {\ frac {ad} {bc}} \; (= 39,7, {\ text {в таблице 3}}).}

Для проверки наличия статистической значимости применяется метод Вульфа. Пусть

y = ln ⁡ (x) (= 3.68) {\ displaystyle y = \ ln (x) \; (= 3.68)}

y = \ ln (x) \; (= 3.68)

1 w = 1 a + 1 b + 1 c + 1 д (= 0,0703). {\ displaystyle {\ frac {1} {w}} = {\ frac {1} {a}} + {\ frac {1} {b}} + {\ frac {1} {c}} + {\ frac {1} {d}} \; (= 0,0703).}

{\ displaystyle {\ frac {1} {w}} = {\ frac {1} {a}} + { \ frac {1} {b}} + {\ frac {1} {c}} + {\ frac {1} {d}} \; (= 0,0703).}

Тогда

χ 2 = wy 2 [= 193>χ 2 (p = 0,001, df = 1) = 10,8] {\ displaystyle \ chi ^ {2} = wy ^ {2} \; \ left [= 193>\ chi ^ {2} (p = 0,001, \; df = 1) = 10,8 \ right]}

\chi ^{2}=wy^{2}\;\left[=193>\ chi ^ {2} (p = 0,001, \; df = 1) = 10,8 \ right]

следует распределению хи-квадрат с $df = 1 {\ displaystyle df = 1}$ $df = 1$ . В данных таблицы 3 значимая связь существует на уровне 0,1%. Модификация Холдейна применяется к случаю, когда любой из $a, b, c и d {\ displaystyle a, \; b, \; c, {\ text {и}} d}$ $a, \; b, \; c, {\ текст {и}} d$ равно нулю, где $x {\ displaystyle x}$ $x$ и $1 / w {\ displaystyle 1 / w}$ $1 / w$ заменяются на

Икс знак равно (a + 1/2) (d + 1/2) (b + 1/2) (c + 1/2) {\ displaystyle x = {\ frac {(a + 1/2) (d + 1 / 2)} {(b + 1/2) (c + 1/2)}}}

x = {\ frac {(a + 1/2) (d + 1/2)} { (b + 1/2) (c + 1/2)}}

1 вес = 1 a + 1 + 1 b + 1 + 1 c + 1 + 1 d + 1, {\ displaystyle {\ frac {1} {w}} = {\ frac {1} {a + 1} } + {\ frac {1} {b + 1}} + {\ frac {1} {c + 1}} + {\ frac {1} {d + 1}},}

{\ displaystyle {\ frac {1} {w}} = {\ frac {1} {a + 1}} + {\ frac {1} {b + 1}} + {\ frac {1} {c + 1}} + {\ frac {1} {d + 1}},}

соответственно.

Таблица 4. Связь аллелей HLA с ревматическими и аутоиммунными заболеваниями среди белого населения
Болезнь	Аллель HLA	Относительный риск (%)	FAD (%)	FAP (%)	$δ {\ displaystyle \ delta}$ $\ delta$
Анкилозирующий спондилит	B27	90	90	8	0,89
Реактивный артрит	B27	40	70	8	0,67
Спондилит при воспалительном заболевании кишечника	B27	10	50	8	0,46
Ревматоидный артрит	DR4	6	70	30	0,57
Системная красная волчанка	DR3	3	45	20	0,31
Рассеянный склероз	DR2	4	60	20	0,5
Сахарный диабет 1 типа	DR4	6	75	30	0,64

В таблице 4 представлены некоторые примеры ассоциации между аллелями HLA и заболеваниями.

(1a) Превышение частоты аллелей среди пациентов выше контрольной

Наблюдались даже высокие относительные риски между аллелями HLA и заболеваниями, o Только величина относительного риска не сможет определить силу связи. $δ {\ displaystyle \ delta}$ $\ delta$ значение выражается как

δ = FAD - FAP 1 - FAP, 0 ≤ δ ≤ 1, {\ displaystyle \ delta = {\ frac {FAD-FAP} {1-FAP}}, \; \; 0 \ leq \ delta \ leq 1,}

{\ displaystyle \ delta = {\ frac {FAD-FAP} {1-FAP}}, \; \; 0 \ leq \ delta \ leq 1,}

где $FAD {\ displaystyle FAD}$ $FAD$ и $FAP {\ displaystyle FAP}$ $FAP$ - частоты аллелей HLA среди пациентов и здоровых популяций соответственно. В таблице 4 к этой цитате добавлен столбец $δ {\ displaystyle \ delta}$ $\ delta$ . Помимо двух заболеваний с высоким относительным риском, оба из которых также имеют высокие значения $δ {\ displaystyle \ delta}$ $\ delta$ , среди других заболеваний, ювенильный сахарный диабет (тип 1) имеет сильную связь с DR4. даже при низком относительном риске $= 6 {\ displaystyle {} = 6}$ ${\ displaystyle {} = 6 }$ .

(2) Расхождения от ожидаемых значений от предельных частот в таблице ассоциации 2 × 2 аллелей HLA и заболевания

Это можно подтвердить по $χ 2 {\ displaystyle \ chi ^ {2}}$ $\ chi ^ {2}$ вычисление теста

χ 2 = (ad - bc) 2 NABCD (= 336, для данных в таблице 3; P < 0.001). {\displaystyle \chi ^{2}={\frac {(ad-bc)^{2}N}{ABCD}}\;(=336,{\text{ for data in Table 3; }}P<0.001).}

{\ displaystyle \ chi ^ {2} = {\ frac {(ad-bc) ^ {2} N} {ABCD}} \; (= 336, {\ text {для данных в таблице 3; }} P <0,001).}

где $df = 1 {\ displaystyle df = 1}$ $df = 1$ . Для данных с небольшим размером выборки, например, без предельного итога больше 15 (и, следовательно, $N ≤ 30 {\ displaystyle N \ leq 30}$ $N \ leq 30$ ) следует использовать поправку Йетса для непрерывности или точный тест Фишера.

Ресурсы

Сравнение различных показателей LD предоставляется Devlin Risch

The Международный проект HapMap позволяет изучать LD в популяциях людей онлайн. Проект Ensembl объединяет данные HapMap с другой генетической информацией из dbSNP.

Программное обеспечение для анализа

PLINK - набор инструментов для анализа ассоциации всего генома, который, помимо прочего, может вычислять LD
LDHat
Haploview
LdCompare - программное обеспечение с открытым исходным кодом для расчета LD.
SNP и Variation Suite - коммерческое программное обеспечение с интерактивным графиком LD.
GOLD - Графический обзор Linkage Disequilibrium
TASSEL - программа для оценки неравновесия по сцеплению, ассоциаций черт и эволюционных паттернов
rAggr - находит прокси-маркеры (SNP и индели), которые находятся в неравновесном сцеплении с набором запрашиваемых маркеров, с использованием баз данных генотипов 1000 Genomes Project и HapMap.
SNeP - Быстрое вычисление LD и Ne для больших наборов данных генотипов в формате PLINK.
LDlink - Набор веб-приложений для простого и эффективного изучения неравновесия по связям в подгруппах населения. Все данные о генотипах популяции взяты из фазы 3 проекта «1000 геномов», а номера вариантов RS индексируются на основе сборки 151 dbSNP.

Программное обеспечение для моделирования

Haploid - библиотека C для популяционно-генетической моделирование (GPL )

См. также

Ссылки

Дополнительная литература

Hedrick, Philip W. (2005). Genetics of Populations (3-е изд.). Садбери, Бостон, Торонто, Лондон, Сингапур: Jones и Bartlett Publishers. ISBN 978-0-7637-4772-5.
Библиография: Анализ неравновесного сцепления : библиография из более чем тысячи статей о неравновесии по сцеплению, опубликованных с 1918 года.