Однонуклеотидный полиморфизм

редактировать
Положение одного нуклеотида в геномной ДНК, в котором существуют разные альтернативы последовательности Верхняя молекула ДНК отличается от нижней молекулы ДНК в месте расположения одной пары оснований (полиморфизм C / A)

A однонуклеотидный полиморфизм (SNP ; ; множественное число ) представляет собой замену одного нуклеотида в конкретном положении в геноме, который присутствует в достаточно большой части популяции (например, 1% или более).

Например, в определенном положении основания в геноме человека нуклеотид C может появляться у большинства людей, но у меньшинства людей это положение занимает А. Это означает, что в этом конкретном положении есть SNP, и два возможных варианта нуклеотидов - C или A - считаются аллелями для этого конкретного положения.

SNP выявляют различия в нашей восприимчивости к широкому спектру заболеваний (например, серповидноклеточной анемии, β-талассемии и кистозный фиброз результат SNP). Тяжесть болезни и то, как организм реагирует на лечение, также являются проявлением генетических вариаций. Например, одноосновная мутация в гене APOE (аполипопротеин E ) связана с более низким риском болезни Альцгеймера.

A однонуклеотидного варианта (SNV ) представляет собой вариацию одного нуклеотида без каких-либо ограничений по частоте. SNV отличается от SNP, потому что, когда SNV обнаруживается в образце от одного организма вида, SNV потенциально может быть SNP, но это не может быть определено только для одного организма. Однако SNP означает, что нуклеотид варьируется в популяции организмов вида. SNV могут возникать в соматических клетках. соматическое однонуклеотидное изменение (например, вызванное раком) также может называться однонуклеотидным изменением . SNV также часто возникают в молекулярной диагностике. Например, при разработке праймеров для ПЦР для обнаружения вирусов вирусная РНК или ДНК в одном образце пациента может содержать SNV.

Содержание

  • 1 Типы
  • 2 Приложения
  • 3 Частота
    • 3.1 В геноме
    • 3.2 В популяции
  • 4 Важность
    • 4.1 Клинические исследования
    • 4.2 Судебная экспертиза
    • 4.3 Фармакогенетика
    • 4.4 Заболевания
  • 5 Примеры
  • 6 Базы данных
  • 7 Номенклатура
  • 8 Анализ SNP
  • 9 Программы для прогнозирования эффектов SNP
  • 10 См. Также
  • 11 Ссылки
  • 12 Дополнительная литература
  • 13 Внешние ссылки

Типы

Типы SNP
Типы однонуклеотидного полиморфизма (SNP)

однонуклеотидные полиморфизмы могут подпадать под кодирующие последовательности генов, некодирующих областей генов или в межгенных областях (областях между генами). SNP в кодирующей последовательности не обязательно изменяют последовательность аминокислот продуцируемого белка из-за вырожденности генетического кода.

SNP в кодирующей области бывают двух типов: синонимичные и несинонимичные SNP. Синонимичные SNP не влияют на последовательность белка, в то время как несинонимичные SNP изменяют аминокислотную последовательность белка. Несинонимичные SNP бывают двух типов: missense и nonsense.

SNP, которые не находятся в областях, кодирующих белок, могут по-прежнему влиять на сплайсинг генов, фактор транскрипции связывание, деградация информационной РНК, или последовательность некодирующей РНК. Экспрессия гена, на которую влияет этот тип SNP, называется eSNP (SNP экспрессии) и может располагаться выше или ниже гена.

Приложения

  • Исследования ассоциаций могут определить, связан ли генетический вариант с заболеванием или признаком.
  • SNP метки представляет собой типичный однонуклеотидный полиморфизм в области геном с высоким неравновесием сцепления (неслучайная ассоциация аллелей в двух или более локусах). Теговые SNP полезны в исследованиях ассоциации SNP для всего генома, в которых генотипируются сотни тысяч SNP по всему геному.
  • Картирование гаплотипа : наборы аллелей или последовательностей ДНК могут быть сгруппированы таким образом, чтобы один SNP мог быть идентифицируют множество связанных SNP.
  • Неравновесие по сцеплению (LD), термин, используемый в популяционной генетике, указывает на неслучайную ассоциацию аллелей в двух или более локусах, не обязательно на одной и той же хромосоме. Это относится к феномену, когда аллель SNP или последовательность ДНК, которые находятся близко друг к другу в геноме, как правило, наследуются вместе. На LD влияют два параметра: 1) Расстояние между SNP [чем больше расстояние, тем ниже LD]. 2) Скорость рекомбинации [чем ниже скорость рекомбинации, тем выше LD].

Частота

Более 335 миллионов SNP были обнаружены у людей из разных популяций. Типичный геном отличается от эталонного генома человека 4–5 миллионами сайтов, большинство из которых (более 99,9%) состоит из SNP и коротких индексов.

внутри генома

Геномное распределение SNP не однородны; SNP встречаются в некодирующих областях чаще, чем в кодирующих областях или, в общем, там, где действует естественный отбор и «фиксирует» аллель (устраняя другие варианты) SNP, который составляет наиболее благоприятную генетическую адаптацию. Другие факторы, такие как генетическая рекомбинация и частота мутаций, также могут определять плотность SNP.

Плотность SNP можно предсказать по наличию микросателлитов : микросателлиты AT, в частности, являются мощные предикторы плотности SNP, с длинными (AT) (n) повторяющимися участками, которые имеют тенденцию обнаруживаться в регионах со значительно сниженной плотностью SNP и низким содержанием GC.

внутри популяции

Существуют различия между человеческие популяции, поэтому аллель SNP, распространенный в одной географической или этнической группе, может быть намного реже в другой. Внутри популяции SNP можно присвоить частоту минорного аллеля - самую низкую частоту аллеля в локусе, которая наблюдается в конкретной популяции. Это просто меньшая из двух частот аллелей однонуклеотидных полиморфизмов.

Обладая этими знаниями, ученые разработали новые методы анализа популяционных структур у менее изученных видов. Благодаря использованию методов объединения стоимость анализа значительно снижается. Эти методы основаны на секвенировании популяции в объединенной выборке, а не на секвенировании каждого человека в популяции отдельно. С новыми инструментами биоинформатики появляется возможность исследовать структуру популяции, поток генов и миграцию генов, наблюдая частоты аллелей внутри всей популяции. Эти протоколы позволяют объединить преимущества SNP с микроспутниковыми маркерами. Однако в процессе теряется информация, такая как неравновесие сцепления и информация о зиготности.

Важность

Вариации в последовательностях ДНК человека могут влиять на то, как у людей развиваются заболевания и как они реагируют на патогены, химические вещества, лекарства, вакцины и другие агенты. SNP также важны для персонализированной медицины. Примеры включают биомедицинские исследования, судебную экспертизу, фармакогенетику и причинно-следственные связи, как указано ниже.

Клинические исследования

Наибольшее значение SNP в клинических исследованиях имеют для сравнения участков генома между когортами (например, с согласованными когортами с заболеванием и без) в полногеномные ассоциации исследований. SNP использовались в полногеномных ассоциативных исследованиях в качестве маркеров высокого разрешения при картировании генов, связанных с заболеваниями или нормальными признаками. SNP, не оказывающие заметного влияния на фенотип (так называемые молчащие мутации ), по-прежнему полезны в качестве генетических маркеров в полногеномных ассоциативных исследованиях из-за их количества и стабильной наследственности на протяжении поколений.

Криминалистика

SNP изначально использовались для сопоставления судебно-экспертного образца ДНК с подозреваемым, но постепенно отказались от него с развитием методик STR -содержащих дактилоскопии ДНК. Текущие методы секвенирования следующего поколения (NGS) могут позволить лучше использовать SNP-генотипирование в судебно-медицинском приложении, если избежать проблемных локусов. В будущем SNP могут быть использованы в криминалистике для определения некоторых фенотипических ключей, таких как цвет глаз, цвет волос, этническая принадлежность и т. Д. Kidd et al. продемонстрировали, что панель из 19 SNP может идентифицировать этническую группу с хорошей вероятностью совпадения (Pm = 10) в 40 изученных группах населения. Один из примеров того, как это может быть потенциально полезным, - это художественная реконструкция возможных преджизненных проявлений скелетных останков неизвестных людей. Хотя реконструкция лица может быть довольно точной, основанной исключительно на антропологических особенностях, другие данные, которые могут позволить более точное представление, включают цвет глаз, цвет кожи, цвет волос и т. Д.

В ситуации с небольшим количеством судебно-медицинских экспертиз образца или деградированного образца, методы SNP могут быть хорошей альтернативой методам STR из-за обилия потенциальных маркеров, возможности автоматизации и потенциального сокращения необходимой длины фрагмента до 60–80 п.н. При отсутствии совпадения STR в базе данных профиля ДНК ; различные SNP могут быть использованы для получения информации об этнической принадлежности, фенотипе, происхождении и даже идентичности.

Фармакогенетика

Некоторые SNP связаны с метаболизмом различных лекарств. SNP могут быть мутациями, такими как делеции, которые могут ингибировать или способствовать ферментативной активности; такое изменение ферментативной активности может привести к снижению скорости метаболизма лекарства. Связь широкого спектра заболеваний человека, таких как рак, инфекционные заболевания (СПИД, проказа, гепатит и т. д.) аутоиммунные, нейропсихиатрические и многие другие заболевания с разными SNP могут быть использованы в качестве фармакогеномных мишеней для лекарственной терапии.

Заболевание

Один SNP может вызвать менделевскую болезнь, хотя для сложных заболеваний SNP обычно не функционируют индивидуально, скорее, они работают в координации с другими SNP для проявления заболевание, описанное в разделе Остеопороз. Одним из первых успехов в этой области было обнаружение мутации одного основания в некодирующей области APOC3 (ген аполипопротеина C3), которая связана с более высоким риском гипертриглицеридемии и атеросклероза.

Все типы SNP могут иметь наблюдаемый фенотип или может привести к заболеванию:

  • SNP в некодирующих областях могут проявляться в более высоком риске рака и могут влиять на структуру мРНК и восприимчивость к заболеванию. Некодирующие SNP также могут изменять уровень экспрессии гена как eQTL (локус количественного признака экспрессии).
  • SNPs в кодирующих областях :
    • синонимичные замены по определению не приводят к замене аминокислоты в белке, но все же могут влиять на его функцию другими способами. Примером может служить кажущаяся молчаливая мутация в гене 1 множественной лекарственной устойчивости (MDR1 ), который кодирует клеточный мембранный насос, который выталкивает лекарства из клетки, может замедлять трансляцию и позволять пептидной цепи складываться в необычная конформация, из-за которой мутантный насос становится менее функциональным (в белке MDR1, например, полиморфизм C1236T изменяет кодон GGC на GGT в положении 412 аминокислоты полипептида (оба кодируют глицин), а полиморфизм C3435T изменяет ATC на ATT в положении 1145 ( оба кодируют изолейцин)).
    • несинонимичные замены :

Примеры

Базы данных

Как и для генов, биоинформатические базы данных существуют для SNP.

  • dbSNP - это база данных SNP из Национального центра биотехнологической информации (NCBI). По состоянию на 8 июня 2015 г. в dbSNP было зарегистрировано 149 735 377 SNP у людей.
  • Kaviar представляет собой сборник SNP из нескольких источников данных, включая dbSNP.
  • SNPedia - это база данных в стиле вики, поддерживающая аннотации личного генома., интерпретация и анализ.
  • База данных OMIM описывает связь между полиморфизмами и заболеваниями (например, дает заболевания в текстовой форме)
  • dbSAP - база данных полиморфизма одиночных аминокислот для обнаружения вариаций белков
  • База данных мутаций генов человека предоставляет генные мутации, вызывающие или связанные с наследственными заболеваниями человека и функциональными SNP
  • Международный проект HapMap, где исследователи определяют Пометьте SNP, чтобы иметь возможность определять набор гаплотипов, присутствующих в каждом субъекте.
  • GWAS Central позволяет пользователям визуально запрашивать фактические данные ассоциации на уровне сводки в одном или подробнее полногеномные ассоциации исследований.

Рабочая группа International SNP Map составила карту последовательность, фланкирующая каждый SNP, путем выравнивания с геномной последовательностью клонов с большими вставками в генбанке. Эти выравнивания были преобразованы в хромосомные координаты, которые показаны в таблице 1. Этот список значительно увеличился с тех пор, как, например, база данных Kaviar теперь перечисляет 162 миллиона однонуклеотидных вариантов (SNV).

ХромосомаДлина(bp)Все SNPTSC SNP
Всего SNPkb на SNPВсего SNPkb на SNP
1214,066,000129,9311,6575,1662,85
2222,889,000103,6642,1576,9852,90
3186,938,00093,1402.0163,6692,94
4169,035,00084,4262,0065,7192,57
5170,954,000117,8821,4563,5452,69
6165,022,00096,3171,7153,7973,07
7149,414,00071,7522,0842,3273,53
8125,148,00057,8342,1642,6532,93
9107,440,00062,0131,7343,0202,50
10127,894,00061,2982,0942,4663,01
11129,193,00084,6631,5347,6212,71
12125,198,00059,2452,1138,1363,28
1393,711,00053,0931,7735,7452,62
1489,344,00044,1122,0329,7463,00
1573,467,00037,8141,9426,5242,77
1674,037,00038,7351,9123,3283,17
1773,367,00034,6212,1219,3963,78
1873,078,00045,1351,6227,0282,70
1956,044,00025,6762,1811,1855,01
2063,317,00029,4782,1517,0513,71
2133,824,00020,9161,629,1033,72
2233,786,00028,4101,1911,0563,06
X131,245,00034,8423,7720,4006,43
Y21,753,0004,1935,191,78412,19
RefSeq15,696,67414,5341,08
Итого2,710,164,0001,419,1901,91887,4503,05

Номенклатура

Номенклатура для SNP может сбивать с толку: для отдельного SNP может существовать несколько вариантов, и консенсус еще не достигнут достигнуто.

Стандарт rs ### - это тот, который был принят dbSNP и использует префикс «rs» для «ссылочного SNP», за которым следует уникальный и произвольный номер. SNP часто упоминаются по их номеру dbSNP rs, как в примерах выше.

Общество вариации генома человека (HGVS) использует стандарт, который предоставляет дополнительную информацию о SNP. Примеры:

  • c.76A>T: "c." для кодирующей области, за которым следует число для положения нуклеотида, за которым следует однобуквенное сокращение для нуклеотида (A, C, G, T или U), за которым следует знак больше (">"), чтобы указать замену с последующим сокращением нуклеотида, который заменяет прежний
  • p.Ser123Arg: "p." для белка, за которым следует трехбуквенное сокращение для аминокислоты, за которым следует номер для положения аминокислоты, за которым следует сокращение аминокислоты, которая заменяет предыдущую.

Анализ SNP

SNP обычно двуаллельны и поэтому легко поддаются анализу. Аналитические методы для обнаружения новых SNP и выявления известных SNP включают:

Программы для прогнозирования эффектов SNP

Важной группой SNP являются те, которые соответствуют миссенс-мутациям, вызывающим амино кислотное изменение на уровне белка. Точечная мутация определенного остатка может по-разному влиять на функцию белка (от отсутствия эффекта до полного нарушения его функции). Обычно изменение аминокислот с аналогичным размером и физико-химическими свойствами (например, замена лейцина на валин) имеет мягкий эффект, и наоборот. Аналогичным образом, если SNP разрушает элементы вторичной структуры (например, замена пролина в области альфа-спирали ), такая мутация обычно может повлиять на структуру и функцию всего белка. Используя эти простые и многие другие правила, полученные из машинного обучения, была разработана группа программ для прогнозирования эффекта SNP:

  • SIFT Эта программа дает представление о том, как лабораторно индуцированная миссенс или несинонимичная мутация будет влияют на функцию белка на основе физических свойств аминокислот и гомологии последовательностей.
  • СПИСОК (местная идентичность и общие таксоны) оценивает потенциальную вредоносность мутаций, возникающих в результате изменения их функций белков. Он основан на предположении, что вариации, наблюдаемые у близкородственных видов, более значительны при оценке сохранения по сравнению с вариациями у отдаленно родственных видов.
  • SNAP2
  • SuSPect
  • PolyPhen-2
  • PredictSNP
  • MutationTaster : официальный сайт
  • Variant Effect Predictor из проекта Ensembl
  • SNPViz Эта программа обеспечивает трехмерное представление затронутого белка с выделением аминокислотного изменения. так врачи могут определить патогенность мутантного белка.
  • PROVEAN
  • PhyreRisk - это база данных, которая сопоставляет варианты экспериментальным и прогнозируемым белковым структурам.
  • Missense3D - это инструмент, который предоставляет стереохимический отчет о влияние миссенс-вариантов на структуру белка.

См. также

Ссылки

Дополнительная литература

Внешние ссылки

На Викискладе есть материалы, связанные с однонуклеотидным полиморфизмом.
Последняя правка сделана 2021-06-08 02:39:00
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте