В популяционной генетике, неравновесие по сцеплению (LD) представляет собой неслучайную ассоциацию аллелей в различных локусах в данной популяции. Считается, что локусы находятся в неравновесном сцеплении, когда частота ассоциации их различных аллелей выше или ниже, чем можно было бы ожидать, если бы локусы были независимыми и ассоциировались случайным образом.
На неравновесие по сцеплению влияют многие факторы, включая отбор, скорость генетической рекомбинации, скорость мутаций, генетический дрейф, система спаривания, популяционная структура и генетическая связь. В результате характер неравновесия по сцеплению в геноме является мощным сигналом популяционных генетических процессов, которые его структурируют.
Несмотря на свое название, неравновесие по сцеплению может существовать между аллелями в разных локусах без какой-либо генетической связи между ними и независимо от того, находятся ли частоты аллелей в равновесии (не меняются со временем). Кроме того, нарушение равновесия по сцеплению иногда называют гаметической фазой нарушением равновесия ; однако эта концепция также применяется к бесполым организмам и, следовательно, не зависит от наличия гамет.
Предположим, что среди гамет, которые образуются в популяции, размножающейся половым путем, аллель A встречается с частота в одном локусе (т.е. - это доля гамет с A в этом локусе), в то время как в другом локусе аллель B встречается с частотой . Аналогично, пусть будет частотой, с которой оба A и B встречаются вместе в одной и той же гамете (т.е. - частота гаплотипа AB ).
Связь между аллелями A и B может рассматриваться как полностью случайная - что известно в статистике как независимость - когда наличие одной не влияет на возникновение другого, и в этом случае вероятность того, что и A, и B встречаются вместе, дается product вероятностей. Говорят, что существует неравновесное сцепление между двумя аллелями всякий раз, когда отличается от по любой причине.
Уровень неравновесия по сцеплению между A и B можно количественно оценить с помощью коэффициента неравновесия по сцеплению , который определяется как
при условии, что оба и больше нуля. Нарушение равновесия по сцеплению соответствует . В случае мы имеем и аллели A и B, как говорят, находятся в равновесии сцепления. Нижний индекс «AB» в подчеркивает, что неравновесие по сцеплению является свойством пары {A, B} аллелей, а не их соответствующих локусов. Другие пары аллелей в тех же двух локусах могут иметь разные коэффициенты неравновесия по сцеплению.
Для двух двуаллельных локусов, где a и b - другие аллели в этих двух локусах, ограничения настолько сильны, что только одного значения D достаточно для представления всех неравновесных соотношений сцепления между этими аллелями. В этом случае . Их отношения можно охарактеризовать следующим образом.
Знак D в этом случае выбирается произвольно. Величина D более важна, чем знак D, потому что величина D отражает степень неравновесия по сцеплению. Однако положительное значение D означает, что гамета встречается чаще, чем ожидалось, а отрицательное означает, что комбинация этих двух аллелей встречается реже, чем ожидалось.
Неравновесие по сцеплению в бесполых популяциях может быть определено аналогичным образом с точки зрения частот популяционных аллелей. Кроме того, также можно определить неравновесие сцепления между тремя или более аллелями, однако эти ассоциации более высокого порядка обычно не используются на практике.
Коэффициент неравновесия по сцеплению не всегда является удобной мерой неравновесия по сцеплению, поскольку его диапазон возможных значений зависит от частот аллелей, к которым он относится. Это затрудняет сравнение уровня неравновесия по сцеплению между разными парами аллелей.
Левонтин предложил нормализовать D, разделив его на теоретическую максимальную разницу между наблюдаемыми и ожидаемыми частотами гаплотипов следующим образом:
где
Альтернативой является корреляция коэффициент между парами локусов, выраженный как
Рассмотрим гаплотипы для двух локусов A и B с двумя аллелями в каждом - двухлокусная, двухаллельная модель. Затем в следующей таблице определены частоты каждой комбинации:
Гаплотип | Частота |
Обратите внимание, что это относительные частоты. Вышеуказанные частоты можно использовать для определения частоты каждого из аллелей:
Allele | Frequency |
Если два локуса и аллели независимы друг от друга, тогда можно выразить наблюдение как " найдено и найдено ". В таблице выше перечислены частоты для , и для , , следовательно, частота равно , и согласно правилам элементарной статистики .
Отклонение наблюдаемой частоты гаплотипа от ожидаемой - это величина, называемая неравновесием по сцеплению, и обычно обозначается заглавной буквой D:
Следующая таблица иллюстрирует взаимосвязь между частотами гаплотипов и частотами аллелей и D.
Итого | |||
Итого |
в отсутствие эволюционных сил, кроме случайного спаривания, менделевской сегрегации, случайного хромосомного набора и хромосомного кроссовера (т. е. в отсутствие естественного отбора, инбридинга и генетического дрейфа ), показатель неравновесия по сцеплению сходится к нулю вдоль оси времени со скоростью, зависящей от величины скорости рекомбинации между двумя локусами.
Используя обозначения выше, , мы можно продемонстрировать эту сходимость к нулю следующим образом. В следующем поколении , частота гаплотипа , становится
Это следует потому, что часть гаплотипов в потомстве не рекомбинированы и, таким образом, являются копиями случайного гаплотипа своих родителей. Дробь из них равна . Часть рекомбинирует эти два локуса. Если родители являются результатом случайного спаривания, вероятность того, что копия в локусе имеет аллель равно и вероятность того, что копия в локусе имеет аллель равно , и поскольку эти копии изначально находятся в двух разных гаметах, которые сформировали диплоидный генотип, это независимые события, так что вероятности можно умножить.
Эту формулу можно переписать как
, так что
где в -ое поколение обозначается как . Таким образом, мы имеем
Если , затем , так что сходится к нулю.
Если в какой-то момент мы наблюдаем неравновесие по сцеплению, оно исчезнет в будущем из-за рекомбинации. Однако чем меньше расстояние между двумя локусами, тем меньше будет скорость схождения к нулю.
HLA составляют группу антигенов клеточной поверхности, также известную как MHC человека. Поскольку гены HLA расположены в соседних локусах в конкретной области хромосомы и предположительно проявляют эпистаз друг с другом или с другими генами, значительная часть аллелей находится в неравновесном сцеплении.
Примером такого неравновесия по сцеплению является аллели HLA-A1 и B8 у неродственных датчан, на которые ссылаются Vogel and Motulsky (1997).
Антиген j | Всего | ||||
---|---|---|---|---|---|
Антиген i | |||||
Всего | |||||
Нет. индивидуумов |
Поскольку HLA является кодоминантным, а экспрессия HLA проверяется только локусом за локусом в опросах, показатель LD должен оцениваться из такой таблицы 2 × 2 справа.
выражение () частота антигена :
выражение () частота антигена :
частота гена , учитывая, что люди с '+ Все генотипы / - ',' + / + 'и' - / + 'положительны по антигену :
и
Обозначая '-' аллели антигена i как x, а если антиген j равен y, наблюдаемая частота гаплотипа xy равна
и предполагаемая частота гаплотипа xy составляет
Тогда измерение LD выражается как
Стандартные ошибки получаются следующим образом:
Тогда, если
превышает 2 по абсолютной величине, величина из статистически значимо велико. Для данных в таблице 1 это 20,9, таким образом, наличие статистически значимой LD между A1 и B8 в популяции допустимо.
аллелей HLA-A i | аллелей HLA-B j | ||
---|---|---|---|
A1 | B8 | 0,065 | 16,0 |
A3 | B7 | 0,039 | 10,3 |
A2 | Bw40 | 0,013 | 4,4 |
A2 | Bw15 | 0,01 | 3,4 |
A1 | Bw17 | 0,014 | 5,4 |
A2 | B18 | 0,006 | 2,2 |
A2 | Bw35 | -0,009 | −2,3 |
A29 | B12 | 0,013 | 6,0 |
A10 | Bw16 | 0,013 | 5,9 |
В таблице 2 показаны некоторые комбинации HLA Аллели -A и B, при которых значительная LD наблюдалась у панъевропейцев.
Vogel and Motulsky (1997) спорили, сколько времени потребуется, чтобы исчезло неравновесие по сцеплению между локусами HLA-A и B. Рекомбинация между локусами HLA-A и B считалась величиной порядка 0,008. Ниже мы будем рассуждать аналогично Фогелю и Мотульскому. В случае, если показатель LD составлял 0,003 у панъевропейцев в списке Mittal, это в основном несущественно. Если уменьшилось с 0,07 до 0,003 при эффекте рекомбинации, как показано как , тогда . Предположим, поколение заняло 25 лет, это означает 10 000 лет. Временной промежуток в истории человечества кажется довольно коротким. Таким образом, наблюдаемое неравновесие по сцеплению между локусами HLA-A и B может указывать на своего рода интерактивный отбор.
Наличие неравновесия по сцеплению между локусом HLA и предполагаемым основным геном восприимчивости к болезни соответствует любому из следующих явлений:
Анкилозирующий спондилит | Всего | |||
---|---|---|---|---|
Пациенты | Контрольные здоровые | |||
Аллели HLA | ||||
Итого |
(1) Относительный риск
Относительный риск аллеля HLA для заболевания аппроксимируется отношением шансов в таблице ассоциации 2 × 2 аллеля с заболеванием. В таблице 3 показана связь HLA-B27 с анкилозирующим спондилитом среди голландского населения. Относительный риск этого аллеля приблизительно равен
Для проверки наличия статистической значимости применяется метод Вульфа. Пусть
и
Тогда
следует распределению хи-квадрат с . В данных таблицы 3 значимая связь существует на уровне 0,1%. Модификация Холдейна применяется к случаю, когда любой из равно нулю, где и заменяются на
и
соответственно.
Болезнь | Аллель HLA | Относительный риск (%) | FAD (%) | FAP (%) | |
---|---|---|---|---|---|
Анкилозирующий спондилит | B27 | 90 | 90 | 8 | 0,89 |
Реактивный артрит | B27 | 40 | 70 | 8 | 0,67 |
Спондилит при воспалительном заболевании кишечника | B27 | 10 | 50 | 8 | 0,46 |
Ревматоидный артрит | DR4 | 6 | 70 | 30 | 0,57 |
Системная красная волчанка | DR3 | 3 | 45 | 20 | 0,31 |
Рассеянный склероз | DR2 | 4 | 60 | 20 | 0,5 |
Сахарный диабет 1 типа | DR4 | 6 | 75 | 30 | 0,64 |
В таблице 4 представлены некоторые примеры ассоциации между аллелями HLA и заболеваниями.
(1a) Превышение частоты аллелей среди пациентов выше контрольной
Наблюдались даже высокие относительные риски между аллелями HLA и заболеваниями, o Только величина относительного риска не сможет определить силу связи. значение выражается как
где и - частоты аллелей HLA среди пациентов и здоровых популяций соответственно. В таблице 4 к этой цитате добавлен столбец . Помимо двух заболеваний с высоким относительным риском, оба из которых также имеют высокие значения , среди других заболеваний, ювенильный сахарный диабет (тип 1) имеет сильную связь с DR4. даже при низком относительном риске .
(2) Расхождения от ожидаемых значений от предельных частот в таблице ассоциации 2 × 2 аллелей HLA и заболевания
Это можно подтвердить по вычисление теста
где . Для данных с небольшим размером выборки, например, без предельного итога больше 15 (и, следовательно, ) следует использовать поправку Йетса для непрерывности или точный тест Фишера.
Сравнение различных показателей LD предоставляется Devlin Risch
The Международный проект HapMap позволяет изучать LD в популяциях людей онлайн. Проект Ensembl объединяет данные HapMap с другой генетической информацией из dbSNP.