Однонуклеотидный полиморфизм

редактировать

Положение одного нуклеотида в геномной ДНК, в котором существуют разные альтернативы последовательности

Верхняя молекула ДНК отличается от нижней молекулы ДНК в месте расположения одной пары оснований (полиморфизм C / A)

A однонуклеотидный полиморфизм (SNP ; ; множественное число ) представляет собой замену одного нуклеотида в конкретном положении в геноме, который присутствует в достаточно большой части популяции (например, 1% или более).

Например, в определенном положении основания в геноме человека нуклеотид C может появляться у большинства людей, но у меньшинства людей это положение занимает А. Это означает, что в этом конкретном положении есть SNP, и два возможных варианта нуклеотидов - C или A - считаются аллелями для этого конкретного положения.

SNP выявляют различия в нашей восприимчивости к широкому спектру заболеваний (например, серповидноклеточной анемии, β-талассемии и кистозный фиброз результат SNP). Тяжесть болезни и то, как организм реагирует на лечение, также являются проявлением генетических вариаций. Например, одноосновная мутация в гене APOE (аполипопротеин E ) связана с более низким риском болезни Альцгеймера.

A однонуклеотидного варианта (SNV ) представляет собой вариацию одного нуклеотида без каких-либо ограничений по частоте. SNV отличается от SNP, потому что, когда SNV обнаруживается в образце от одного организма вида, SNV потенциально может быть SNP, но это не может быть определено только для одного организма. Однако SNP означает, что нуклеотид варьируется в популяции организмов вида. SNV могут возникать в соматических клетках. соматическое однонуклеотидное изменение (например, вызванное раком) также может называться однонуклеотидным изменением . SNV также часто возникают в молекулярной диагностике. Например, при разработке праймеров для ПЦР для обнаружения вирусов вирусная РНК или ДНК в одном образце пациента может содержать SNV.

Содержание

1 Типы
2 Приложения
3 Частота
- 3.1 В геноме
- 3.2 В популяции
4 Важность
- 4.1 Клинические исследования
- 4.2 Судебная экспертиза
- 4.3 Фармакогенетика
- 4.4 Заболевания
5 Примеры
6 Базы данных
7 Номенклатура
8 Анализ SNP
9 Программы для прогнозирования эффектов SNP
10 См. Также
11 Ссылки
12 Дополнительная литература
13 Внешние ссылки

Типы

Типы SNP
Некодирующая область Кодирующая область Синонимическая Несинонимная Missense Нонсенс

Типы однонуклеотидного полиморфизма (SNP)

однонуклеотидные полиморфизмы могут подпадать под кодирующие последовательности генов, некодирующих областей генов или в межгенных областях (областях между генами). SNP в кодирующей последовательности не обязательно изменяют последовательность аминокислот продуцируемого белка из-за вырожденности генетического кода.

SNP в кодирующей области бывают двух типов: синонимичные и несинонимичные SNP. Синонимичные SNP не влияют на последовательность белка, в то время как несинонимичные SNP изменяют аминокислотную последовательность белка. Несинонимичные SNP бывают двух типов: missense и nonsense.

SNP, которые не находятся в областях, кодирующих белок, могут по-прежнему влиять на сплайсинг генов, фактор транскрипции связывание, деградация информационной РНК, или последовательность некодирующей РНК. Экспрессия гена, на которую влияет этот тип SNP, называется eSNP (SNP экспрессии) и может располагаться выше или ниже гена.

Приложения

Исследования ассоциаций могут определить, связан ли генетический вариант с заболеванием или признаком.
SNP метки представляет собой типичный однонуклеотидный полиморфизм в области геном с высоким неравновесием сцепления (неслучайная ассоциация аллелей в двух или более локусах). Теговые SNP полезны в исследованиях ассоциации SNP для всего генома, в которых генотипируются сотни тысяч SNP по всему геному.
Картирование гаплотипа : наборы аллелей или последовательностей ДНК могут быть сгруппированы таким образом, чтобы один SNP мог быть идентифицируют множество связанных SNP.
Неравновесие по сцеплению (LD), термин, используемый в популяционной генетике, указывает на неслучайную ассоциацию аллелей в двух или более локусах, не обязательно на одной и той же хромосоме. Это относится к феномену, когда аллель SNP или последовательность ДНК, которые находятся близко друг к другу в геноме, как правило, наследуются вместе. На LD влияют два параметра: 1) Расстояние между SNP [чем больше расстояние, тем ниже LD]. 2) Скорость рекомбинации [чем ниже скорость рекомбинации, тем выше LD].

Частота

Более 335 миллионов SNP были обнаружены у людей из разных популяций. Типичный геном отличается от эталонного генома человека 4–5 миллионами сайтов, большинство из которых (более 99,9%) состоит из SNP и коротких индексов.

внутри генома

Геномное распределение SNP не однородны; SNP встречаются в некодирующих областях чаще, чем в кодирующих областях или, в общем, там, где действует естественный отбор и «фиксирует» аллель (устраняя другие варианты) SNP, который составляет наиболее благоприятную генетическую адаптацию. Другие факторы, такие как генетическая рекомбинация и частота мутаций, также могут определять плотность SNP.

Плотность SNP можно предсказать по наличию микросателлитов : микросателлиты AT, в частности, являются мощные предикторы плотности SNP, с длинными (AT) (n) повторяющимися участками, которые имеют тенденцию обнаруживаться в регионах со значительно сниженной плотностью SNP и низким содержанием GC.

внутри популяции

Существуют различия между человеческие популяции, поэтому аллель SNP, распространенный в одной географической или этнической группе, может быть намного реже в другой. Внутри популяции SNP можно присвоить частоту минорного аллеля - самую низкую частоту аллеля в локусе, которая наблюдается в конкретной популяции. Это просто меньшая из двух частот аллелей однонуклеотидных полиморфизмов.

Обладая этими знаниями, ученые разработали новые методы анализа популяционных структур у менее изученных видов. Благодаря использованию методов объединения стоимость анализа значительно снижается. Эти методы основаны на секвенировании популяции в объединенной выборке, а не на секвенировании каждого человека в популяции отдельно. С новыми инструментами биоинформатики появляется возможность исследовать структуру популяции, поток генов и миграцию генов, наблюдая частоты аллелей внутри всей популяции. Эти протоколы позволяют объединить преимущества SNP с микроспутниковыми маркерами. Однако в процессе теряется информация, такая как неравновесие сцепления и информация о зиготности.

Важность

Вариации в последовательностях ДНК человека могут влиять на то, как у людей развиваются заболевания и как они реагируют на патогены, химические вещества, лекарства, вакцины и другие агенты. SNP также важны для персонализированной медицины. Примеры включают биомедицинские исследования, судебную экспертизу, фармакогенетику и причинно-следственные связи, как указано ниже.

Клинические исследования

Наибольшее значение SNP в клинических исследованиях имеют для сравнения участков генома между когортами (например, с согласованными когортами с заболеванием и без) в полногеномные ассоциации исследований. SNP использовались в полногеномных ассоциативных исследованиях в качестве маркеров высокого разрешения при картировании генов, связанных с заболеваниями или нормальными признаками. SNP, не оказывающие заметного влияния на фенотип (так называемые молчащие мутации ), по-прежнему полезны в качестве генетических маркеров в полногеномных ассоциативных исследованиях из-за их количества и стабильной наследственности на протяжении поколений.

Криминалистика

SNP изначально использовались для сопоставления судебно-экспертного образца ДНК с подозреваемым, но постепенно отказались от него с развитием методик STR -содержащих дактилоскопии ДНК. Текущие методы секвенирования следующего поколения (NGS) могут позволить лучше использовать SNP-генотипирование в судебно-медицинском приложении, если избежать проблемных локусов. В будущем SNP могут быть использованы в криминалистике для определения некоторых фенотипических ключей, таких как цвет глаз, цвет волос, этническая принадлежность и т. Д. Kidd et al. продемонстрировали, что панель из 19 SNP может идентифицировать этническую группу с хорошей вероятностью совпадения (Pm = 10) в 40 изученных группах населения. Один из примеров того, как это может быть потенциально полезным, - это художественная реконструкция возможных преджизненных проявлений скелетных останков неизвестных людей. Хотя реконструкция лица может быть довольно точной, основанной исключительно на антропологических особенностях, другие данные, которые могут позволить более точное представление, включают цвет глаз, цвет кожи, цвет волос и т. Д.

В ситуации с небольшим количеством судебно-медицинских экспертиз образца или деградированного образца, методы SNP могут быть хорошей альтернативой методам STR из-за обилия потенциальных маркеров, возможности автоматизации и потенциального сокращения необходимой длины фрагмента до 60–80 п.н. При отсутствии совпадения STR в базе данных профиля ДНК ; различные SNP могут быть использованы для получения информации об этнической принадлежности, фенотипе, происхождении и даже идентичности.

Фармакогенетика

Некоторые SNP связаны с метаболизмом различных лекарств. SNP могут быть мутациями, такими как делеции, которые могут ингибировать или способствовать ферментативной активности; такое изменение ферментативной активности может привести к снижению скорости метаболизма лекарства. Связь широкого спектра заболеваний человека, таких как рак, инфекционные заболевания (СПИД, проказа, гепатит и т. д.) аутоиммунные, нейропсихиатрические и многие другие заболевания с разными SNP могут быть использованы в качестве фармакогеномных мишеней для лекарственной терапии.

Заболевание

Один SNP может вызвать менделевскую болезнь, хотя для сложных заболеваний SNP обычно не функционируют индивидуально, скорее, они работают в координации с другими SNP для проявления заболевание, описанное в разделе Остеопороз. Одним из первых успехов в этой области было обнаружение мутации одного основания в некодирующей области APOC3 (ген аполипопротеина C3), которая связана с более высоким риском гипертриглицеридемии и атеросклероза.

Все типы SNP могут иметь наблюдаемый фенотип или может привести к заболеванию:

SNP в некодирующих областях могут проявляться в более высоком риске рака и могут влиять на структуру мРНК и восприимчивость к заболеванию. Некодирующие SNP также могут изменять уровень экспрессии гена как eQTL (локус количественного признака экспрессии).
SNPs в кодирующих областях :
- синонимичные замены по определению не приводят к замене аминокислоты в белке, но все же могут влиять на его функцию другими способами. Примером может служить кажущаяся молчаливая мутация в гене 1 множественной лекарственной устойчивости (MDR1 ), который кодирует клеточный мембранный насос, который выталкивает лекарства из клетки, может замедлять трансляцию и позволять пептидной цепи складываться в необычная конформация, из-за которой мутантный насос становится менее функциональным (в белке MDR1, например, полиморфизм C1236T изменяет кодон GGC на GGT в положении 412 аминокислоты полипептида (оба кодируют глицин), а полиморфизм C3435T изменяет ATC на ATT в положении 1145 ( оба кодируют изолейцин)).
- несинонимичные замены :
  - missense - однократное изменение основания приводит к изменению аминокислоты белка и его нарушению, что приводит к заболеванию (например, c1580G>T SNP в LMNA ген - положение 1580 (нуклеотид) в последовательности ДНК (кодон CGT), вызывающее замену гуанина на тимин, что дает кодон CTT в последовательности ДНК, приводит к уровень белка при замене аргинина на лейцин в позиции 527 на уровне фенотипа это проявляется в перекрытии мандибулоакральной дисплазии и синдрома прогерии )
  - нонсенс - точечной мутации в последовательность ДНК, которая приводит к преждевременному стоп-кодону или бессмысленному кодону в транскрибированной мРНК и в усеченной, неполный и обычно нефункциональный белковый продукт (например, Муковисцидоз, вызванный мутацией G542X в гене трансмембранного регулятора проводимости кистозного фиброза ).

Примеры

rs6311 и rs6313 являются SNP в гене рецептора серотонина 5-HT2A на хромосоме 13 человека.
SNP в гене F5 вызывает лейденскую тромбофилию фактора V.
является пример триаллельного SNP в гене CRP на хромосоме человека 1.
TAS2R38 кодирует PTC способность дегустации и содержит 6 аннотированных SNP.
rs148649884 и rs138055828 в гене FCN1, кодирующем M-фиколин, нарушили способность рекомбинантного M-фиколина связывать лиганд.
интронный SNP в Исправление несоответствия ДНК ген PMS2 (rs1059060, Ser775Asn) связано с повышенным сперматозоидом повреждением ДНК и риском мужского бесплодия.

Базы данных

Как и для генов, биоинформатические базы данных существуют для SNP.

dbSNP - это база данных SNP из Национального центра биотехнологической информации (NCBI). По состоянию на 8 июня 2015 г. в dbSNP было зарегистрировано 149 735 377 SNP у людей.
Kaviar представляет собой сборник SNP из нескольких источников данных, включая dbSNP.
SNPedia - это база данных в стиле вики, поддерживающая аннотации личного генома., интерпретация и анализ.
База данных OMIM описывает связь между полиморфизмами и заболеваниями (например, дает заболевания в текстовой форме)
dbSAP - база данных полиморфизма одиночных аминокислот для обнаружения вариаций белков
База данных мутаций генов человека предоставляет генные мутации, вызывающие или связанные с наследственными заболеваниями человека и функциональными SNP
Международный проект HapMap, где исследователи определяют Пометьте SNP, чтобы иметь возможность определять набор гаплотипов, присутствующих в каждом субъекте.
GWAS Central позволяет пользователям визуально запрашивать фактические данные ассоциации на уровне сводки в одном или подробнее полногеномные ассоциации исследований.

Рабочая группа International SNP Map составила карту последовательность, фланкирующая каждый SNP, путем выравнивания с геномной последовательностью клонов с большими вставками в генбанке. Эти выравнивания были преобразованы в хромосомные координаты, которые показаны в таблице 1. Этот список значительно увеличился с тех пор, как, например, база данных Kaviar теперь перечисляет 162 миллиона однонуклеотидных вариантов (SNV).

Хромосома	Длина(bp)	Все SNP		TSC SNP
		Всего SNP	kb на SNP	Всего SNP	kb на SNP
1	214,066,000	129,931	1,65	75,166	2,85
2	222,889,000	103,664	2,15	76,985	2,90
3	186,938,000	93,140	2.01	63,669	2,94
4	169,035,000	84,426	2,00	65,719	2,57
5	170,954,000	117,882	1,45	63,545	2,69
6	165,022,000	96,317	1,71	53,797	3,07
7	149,414,000	71,752	2,08	42,327	3,53
8	125,148,000	57,834	2,16	42,653	2,93
9	107,440,000	62,013	1,73	43,020	2,50
10	127,894,000	61,298	2,09	42,466	3,01
11	129,193,000	84,663	1,53	47,621	2,71
12	125,198,000	59,245	2,11	38,136	3,28
13	93,711,000	53,093	1,77	35,745	2,62
14	89,344,000	44,112	2,03	29,746	3,00
15	73,467,000	37,814	1,94	26,524	2,77
16	74,037,000	38,735	1,91	23,328	3,17
17	73,367,000	34,621	2,12	19,396	3,78
18	73,078,000	45,135	1,62	27,028	2,70
19	56,044,000	25,676	2,18	11,185	5,01
20	63,317,000	29,478	2,15	17,051	3,71
21	33,824,000	20,916	1,62	9,103	3,72
22	33,786,000	28,410	1,19	11,056	3,06
X	131,245,000	34,842	3,77	20,400	6,43
Y	21,753,000	4,193	5,19	1,784	12,19
RefSeq	15,696,674	14,534	1,08
Итого	2,710,164,000	1,419,190	1,91	887,450	3,05

Номенклатура

Номенклатура для SNP может сбивать с толку: для отдельного SNP может существовать несколько вариантов, и консенсус еще не достигнут достигнуто.

Стандарт rs ### - это тот, который был принят dbSNP и использует префикс «rs» для «ссылочного SNP», за которым следует уникальный и произвольный номер. SNP часто упоминаются по их номеру dbSNP rs, как в примерах выше.

Общество вариации генома человека (HGVS) использует стандарт, который предоставляет дополнительную информацию о SNP. Примеры:

c.76A>T: "c." для кодирующей области, за которым следует число для положения нуклеотида, за которым следует однобуквенное сокращение для нуклеотида (A, C, G, T или U), за которым следует знак больше (">"), чтобы указать замену с последующим сокращением нуклеотида, который заменяет прежний
p.Ser123Arg: "p." для белка, за которым следует трехбуквенное сокращение для аминокислоты, за которым следует номер для положения аминокислоты, за которым следует сокращение аминокислоты, которая заменяет предыдущую.

Анализ SNP

SNP обычно двуаллельны и поэтому легко поддаются анализу. Аналитические методы для обнаружения новых SNP и выявления известных SNP включают:

Программы для прогнозирования эффектов SNP

Важной группой SNP являются те, которые соответствуют миссенс-мутациям, вызывающим амино кислотное изменение на уровне белка. Точечная мутация определенного остатка может по-разному влиять на функцию белка (от отсутствия эффекта до полного нарушения его функции). Обычно изменение аминокислот с аналогичным размером и физико-химическими свойствами (например, замена лейцина на валин) имеет мягкий эффект, и наоборот. Аналогичным образом, если SNP разрушает элементы вторичной структуры (например, замена пролина в области альфа-спирали ), такая мутация обычно может повлиять на структуру и функцию всего белка. Используя эти простые и многие другие правила, полученные из машинного обучения, была разработана группа программ для прогнозирования эффекта SNP:

SIFT Эта программа дает представление о том, как лабораторно индуцированная миссенс или несинонимичная мутация будет влияют на функцию белка на основе физических свойств аминокислот и гомологии последовательностей.
СПИСОК (местная идентичность и общие таксоны) оценивает потенциальную вредоносность мутаций, возникающих в результате изменения их функций белков. Он основан на предположении, что вариации, наблюдаемые у близкородственных видов, более значительны при оценке сохранения по сравнению с вариациями у отдаленно родственных видов.
SNAP2
SuSPect
PolyPhen-2
PredictSNP
MutationTaster : официальный сайт
Variant Effect Predictor из проекта Ensembl
SNPViz Эта программа обеспечивает трехмерное представление затронутого белка с выделением аминокислотного изменения. так врачи могут определить патогенность мутантного белка.
PROVEAN
PhyreRisk - это база данных, которая сопоставляет варианты экспериментальным и прогнозируемым белковым структурам.
Missense3D - это инструмент, который предоставляет стереохимический отчет о влияние миссенс-вариантов на структуру белка.

См. также

Ссылки

Дополнительная литература

Внешние ссылки

На Викискладе есть материалы, связанные с однонуклеотидным полиморфизмом.

ресурсы NCBI - Введение в SNP от NCBI
The SNP Consortium LTD - Поиск SNP
База данных NCBI dbSNP - «центральный репозиторий для замен одноосновных нуклеотидов и коротких делеций и вставок полиморфизмов»
HGMD - База данных мутаций генов человека, включает редкие мутации и функциональные SNP
GWAS Central - центральную базу данных результатов генетических ассоциаций на итоговом уровне
Проект 1000 геномов - Глубокий Каталог генетических вариаций человека
WatCut - онлайн-инструмент для разработки анализов SNP-RFLP
SNPStats - SNPStats, веб-инструмент для анализа исследований генетических ассоциаций
Restriction HomePage - набор инструментов для рестрикции ДНК и обнаружения SNP, включая дизайн мутагенных праймеров
Американская ассоциация исследований рака Cancer Concepts Fa ctsheet по SNP
PharmGKB - База знаний по фармакогенетике и фармакогеномике, ресурс для SNP, связанных с ответом на лекарства и исходами заболевания.
GEN-SNiP - онлайн-инструмент, который определяет полиморфизмы в тестовых последовательностях ДНК.
Правила номенклатуры генов, генетических маркеров, аллелей и мутаций у мышей и крыс
Рекомендации HGNC по номенклатуре генов человека
Предиктор эффекта SNP с интеграцией галактик
Открытый SNP - портал для обмен собственными результатами теста SNP
dbSAP - база данных SNP для обнаружения вариаций белков