Исследование ассоциации всего эпигенома

редактировать

Исследование ассоциации всего эпигенома (EWAS ) - это исследование общегеномного набора поддающихся количественной оценке эпигенетических меток, таких как метилирование ДНК, у разных людей для установления связи между эпигенетической изменчивостью и конкретным идентифицируемым фенотипом / признаком. Когда паттерны меняются, например, метилирование ДНК в определенных локусах, что позволяет отличить фенотипически затронутые случаи от контрольных индивидуумов, это считается признаком того, что произошло эпигенетическое нарушение, которое причинно или косвенно связано с фенотипом. 133>Рабочий процесс EWAS

Содержание
  • 1 Предпосылки
  • 2 Методы
    • 2.1 Типы дизайна исследования
      • 2.1.1 Ретроспектива (случай-контроль)
      • 2.1.2 Семейные исследования
      • 2.1.3 Исследования монозиготных близнецов
      • 2.1.4 Продольные когорты
    • 2.2 Представляющая интерес ткань
    • 2.3 Метод количественной оценки: метилирование ДНК
  • 3 Анализ и интерпретация данных
    • 3.1 Посайтовый анализ
    • 3.2 Анализ региональных изменений
    • 3.3 Предварительная кластеризация или группировка сайтов CpG
    • 3.4 Функциональное обогащение и обогащение генетического набора
    • 3.5 Соотношение шансов метилирования
    • 3.6 Репликация
  • 4 Ограничения и проблемы
    • 4.1 Причинная связь или Последствия
    • 4.2 Неоднородность образца
    • 4.3 Доступность тканей
  • 5 Связанная база данных
    • 5.1 Атлас EWAS
    • 5.2 EWAS Data Hub
  • 6 См. Также
  • 7 Ссылки
Предпосылки

Эпигеном регулируется как генетическими, так и средовыми факторами, что делает его очень динамичным и сложный. Эпигенетическая информация существует в клетке в виде меток ДНК и гистонов, а также некодирующих РНК. Паттерны метилирования ДНК (ДНКm) меняются со временем и варьируются в зависимости от стадии развития и типа ткани. Основным типом ДНКm является цитозины в пределах CpG динуклеотидов, которые, как известно, участвуют в регуляции экспрессии гена. Изменения структуры ДНКm широко изучаются при сложных заболеваниях, таких как рак и диабет. В нормальной клетке основная часть генома сильно метилирована по CpG, тогда как CpG-островки (CPI) в участках промотора гена остаются в высокой степени неметилированными. Аберрантная ДНКm является наиболее распространенным типом молекулярных аномалий в раковых клетках, где основная масса генома из-за глобального «гипометилирования» и CPI в промоторных областях становится «гиперметилированной», что обычно приводит к подавлению генов-супрессоров опухолей. Совсем недавно исследования диабета выявили дополнительные доказательства в поддержку эпигенетического компонента заболеваний, включая различия в связанных с заболеванием эпигенетических метках между монозиготными близнецами, рост заболеваемости диабетом 1 типа у популяция в целом и события перепрограммирования развития, при которых в утробе или в условиях детства могут влиять на исход заболевания во взрослом возрасте.

Посттрансляционные модификации гистонов включают, но не ограничиваются ими, метилирование, ацетилирование и фосфорилирование хвостов сердцевинных гистонов. Эти посттрансляционные модификации считываются белками, которые затем могут изменять состояние хроматина в этом локусе. Эпигенетическая изменчивость возникает тремя разными способами; он может быть унаследован и быть, следовательно, присутствует во всех клетках взрослого включая зародышевой (процесс, известный как трансгенерационной эпигенетическое наследования ; спорный феномен, который до сих пор не наблюдалось у людей) ; он может происходить случайным образом и присутствовать в подмножестве клеток у взрослого человека, количество которых зависит от того, насколько рано в развитии происходит изменение; или это может быть вызвано поведенческими факторами или факторами окружающей среды. EWAS ранее связывал изменения в метилировании с несколькими заболеваниями и сложными состояниями, эпидемиология которых не известна и поэтому имеет решающее значение для идентификации эпигенетических факторов, которые способствуют или являются следствием патогенеза этих заболеваний.

Методы

Типы планов исследования

Ретроспективные (случай-контроль)

Ретроспективные исследования сравнивают неродственных людей, которые попадают в две категории: контрольные группы без интересующего заболевания или фенотипа и случаи у кого есть интересующий фенотип. Преимущество таких исследований состоит в том, что уже существует множество групп образцов случай-контроль с доступными данными о генотипе и экспрессии, которые можно интегрировать с данными эпигенома. Обратной стороной, однако, является то, что они не могут определить, являются ли эпигенетические различия результатом генетических различий, связанных с заболеванием, процессов после заболевания или лекарственного вмешательства, связанного с заболеванием.

Семейные исследования

Полезно для изучить образцы трансгенеративного наследования эпигенетических меток. Основным ограничением EWAS является расшифровка, связан ли фенотип с эпигенетическими изменениями в результате рассматриваемой переменной или в результате предыдущих геномных вариантов, ведущих к эпигенетическим изменениям. Сравнение геномных и эпигеномных данных родителей и потомков позволяет исключить возможность того, что заболевание или фенотип связаны с геномными вариациями. Ограничением этого дизайна исследования является то, что существует очень мало когорт, которые достаточно велики.

Исследования монозиготных близнецов

Монозиготные близнецы несут идентичную геномную информацию. Следовательно, если они не соответствуют определенному заболеванию или фенотипу, это, вероятно, является результатом эпигенетических различий. Однако до тех пор, пока близнецы не будут изучены продольно, невозможно определить, является ли эпигенетическая изменчивость причиной или следствием заболевания. Другим ограничением является набор достаточно большой когорты дискордантных монозиготных близнецов с изучаемым заболеванием.

Лонгитюдные когорты

Лонгитюдные исследования отслеживают когорту людей в течение длительного периода времени, обычно с момента рождения или до начала болезни. Берутся образцы и хранятся записи на протяжении многих лет, что делает эти исследования чрезвычайно полезными для определения причинной связи определенных фенотипов. Поскольку за одними и теми же людьми наблюдают в моменты времени до и после начала заболевания, это устраняет смешанные эффекты различий между случаями и контролем. Лонгитюдные исследования полезны не только для исследований риска (с использованием образцов ДНК до начала заболевания), но и для интервенционных исследований с использованием до и после лечения с конкретными воздействиями для изучения воздействия окружающей среды на эпигеном. Главный недостаток - длительные сроки исследований, а также расходы. Лонгитюдные исследования с использованием дискордантных по болезни монозиготных близнецов дают дополнительное преимущество исключения генетического влияния на эпигенетические вариации.

Интересующая ткань

Тканевая специфичность эпигеномных меток создает еще одну проблему при разработке EWAS. Выбор ткани ограничен как доступностью, так и стабильностью эпигенетического паттерна. Крайне важно выбрать ткань, в которой эпигенетические метки изменчивы в популяции, но стабильны во времени. Если это невозможно, потребуется использовать несколько серийно собранных образцов от одних и тех же людей, чтобы сообщить о надежных ассоциациях с определенным фенотипом. EWAS для заболеваний часто измеряется с помощью метилирования ДНК в образцах крови, потому что трудно получить соответствующие ткани. В некоторых случаях характер метилирования не обязательно биологически релевантен предлагаемому фенотипу. Выбор крови также требует строгого анализа и тщательной интерпретации из-за изменчивого состава клеток. Поэтому для выбора суррогатной ткани требуется, чтобы межиндивидуальные различия коррелировали между исследуемой тканью и суррогатной тканью, а также чтобы воздействие индуцировало аналогичные изменения в обеих тканях. На сегодняшний день основная проблема заключается в отсутствии четких доказательств того, что в целом эпигенетические метки одинаково реагируют на воздействие окружающей среды во всех тканях.

Рабочий процесс анализа метилирования. Источник: Анализ метилирования Illumina

Метод количественной оценки: метилирование ДНК

Платформа для количественного определения ДНКm всего эпигенома использует высокопроизводительную технологию анализа метилирования Illumina. В прошлом массив 27k Illumina охватывал в среднем два сайта CpG в промоторных областях примерно 14 000 генов и представлял менее 0,1% из 28 миллионов сайтов CpG в геноме человека. Это не является репрезентативным для всего эпигенома человека. Ни один из ранних EWAS, использующих этот массив, не использовал независимую проверку для проверки связанных зондов. Интересным наблюдением стало смещение различий между случаями и контролями в сторону зондов, не относящихся к CpG-островкам (которые были значительно недостаточно представлены в этом дизайне массива), что явилось сильным аргументом в пользу использования недавно разработанного массива 450k, который действительно охватывает не-CpG-островки с более высокая плотность зондов. В настоящее время массив Illumina 450k является наиболее широко используемой платформой за последние два года для исследований, посвященных EWAS. Массив по-прежнему покрывает менее 2% сайтов CpG в геноме, но пытается покрыть все известные гены с высокой плотностью зондов в промоторах (включая островки CpG и окружающие последовательности), но также покрывает с более низкой плотностью. в телах гена, 3'-нетранслируемые области и другие межгенные последовательности.

Анализ и интерпретация данных

Посайтовый анализ

метилирование ДНК обычно количественно оценивается по шкале от 0 до 1, так как массив метилирования измеряет долю молекул ДНК, которые метилированы в конкретном сайте CpG. Первоначальный проведенный анализ представляет собой одномерный тест ассоциации для выявления участков, где метилирование ДНК изменяется в зависимости от воздействия и / или фенотипа. За этим следуют множественные корректировки тестирования и использование аналитической стратегии для уменьшения пакетных эффектов и других технических затрудняющих эффектов при количественной оценке метилирования ДНК. Также принимаются во внимание потенциальные мешающие эффекты, возникающие из-за изменений в составе ткани. Кроме того, проводится корректировка на смешивающие факторы, такие как возраст, пол и поведение, которые могут влиять на статус метилирования, как ковариаты. В результаты ассоциации также вносят поправку на фактор инфляции геномного контроля, чтобы учесть стратификацию населения.

Как правило, средние уровни метилирования CpG сравниваются по категориям с использованием линейной регрессии, которая позволяет корректировать вмешивающиеся факторы и групповые эффекты. Пороговое значение P P < 1e-7 is generally used to identify CpGs associated with the tested phenotype/stimulus. These CpGs are considered to reach epigenome-wide significance. An effect size is also calculated at this significance level, indicating the difference in methylation when comparing two qualitative groups, or different quantitative values depending on your phenotype. CpG sites significantly associated with the phenotype and/or treatment/environmental stimulus are typically represented in a manhattan plot.

Анализ региональных изменений

Отдельные сайты CpG подвержены эффектам естественной вариации на одном сайте и техническим вариациям, таким как плохие зонды микроматрицы и выбросы. Чтобы получить более надежные ассоциации и учесть такое изменение, использование соседних измерений может помочь увеличить мощность. В предыдущих исследованиях функционально значимые результаты были связаны с областями генома, а не с отдельными CpG. Следовательно, рассмотрение на региональном уровне может помочь идентифицировать ассоциированные регионы с большей уверенностью, направляя последующие функциональные исследования.

Предварительная кластеризация или группировка сайтов CpG

Другой метод анализа заключается в использовании неконтролируемой кластеризации для создания классов сайтов CpG на основе сходства вариаций метилирования в образцах. Средние значения метилирования внутри каждого класса используются для построения наборов данных с уменьшенной размерностью, облегчая эффективные тесты ассоциации между метилированием ДНК и интересующими фенотипами. Это используется для уменьшения размерности больших наборов данных и использования существенной биологически индуцированной корреляции. Этот метод полезен для определения общих паттернов метилирования, связанного с тестируемой переменной, но может пропускать конкретные интересующие сайты CpG. Помимо различий в средних уровнях метилирования, различия в вариациях метилирования ДНК в разных образцах также могут быть биологически значимыми, что мотивирует сканирование для выявления дифференциальной вариабельности между группами.

Функциональное обогащение и обогащение набора генов

Расположение связанные сайты CpG или островки / регионы затем могут быть проанализированы in silico для подтверждения возможной функциональной значимости. Например, рассмотрение того, находятся ли ассоциированные CpG в промоторной области, или определение расстояния от сайта начала транскрипции, которое может иметь значение, особенно когда мы предполагаем, что метилирование ДНК, связанное с фенотипом, действует путем регулирования транскрипции гена. Многие другие выводы, основанные на прошлых биологических знаниях, могут быть сделаны, если эта конкретная область CpG была изучена и связана с изменениями в транскрипции. Это можно использовать в качестве дополнительного фильтра для идентификации регионов, которые необходимо провести для функциональной проверки. Некоторые биоинформатические инструменты, которые были разработаны для анализа функционального обогащения, могут быть применены к дифференциально метилированным областям, сначала сопоставив эти области с генами. Это делается путем картирования расстояния между CpG и промотором гена, который потенциально регулируется этой областью. Таким образом, анализ обогащения, основанный на области генома, был предложен в качестве дополнительного подхода и дает значительный потенциал интерпретации. Затем дифференциально метилированные области можно сравнить с каталогом геномных областей, включая, например, сайты, обогащенные специфическими модификациями хроматина, или сайты связывания факторов транскрипции.

Отношение шансов метилирования

Отношение шансов метилирования можно рассчитать, если мы рассмотрим среднюю скорость метилирования на сайте в случаях (или в контроле), чтобы представить вероятность метилирования для случайно выбранной цепи ДНК в случайные (или контрольные) образцы тканей. Отношение шансов метилирования - это шансы метилирования случайной цепи ДНК в образце ткани из случайного случая, деленные на такие же шансы для контроля. Это обеспечивает меру величины эффекта, которая включает относительные величины, но также не учитывает различия между случаями и элементами контроля характеристик спектра метилирования, таких как дисперсия. Отношение шансов метилирования также сопоставимо в проспективных и ретроспективных исследованиях, и его значение измеряет только связь и не подразумевает причинно-следственную связь. Также были рассчитаны баллы риска метилирования, которые могут объединить информацию по сайтам CpG путем расчета взвешенной оценки риска метилирования как суммы значений метилирования по каждому из маркеров, связанных с фенотипом, взвешенных по размеру специфичного для маркера эффекта

Репликация

Репликация с использованием независимой когорты необходима для исключения ложноположительных результатов, выявленных в первоначальном исследовании. Это может быть сделано в когорте людей или более целенаправленно на моделях животных. Важно, чтобы при выборе репликационной когорты индивидуумы отражали исходную когорту и чтобы учитывались те же смешивающие переменные. Однако репликация может быть ограничена из-за наличия отдельных лиц и образцов.

Ограничения и опасения

Причинная связь или следствие

Вариации в эпигеноме могут вызывать заболевание, но могут также возникать как следствие заболевания, и различие между ними является основным ограничением в EWAS. Способ обойти это - определить, присутствует ли эпигенетическая изменчивость до появления каких-либо симптомов заболевания, предпочтительно с помощью продольных исследований с участием одной и той же когорты людей в течение многих лет (это само по себе имеет свои собственные недостатки в плане затрат и сроков исследования). Также необходимо принять во внимание возможность того, что эпигенетические вариации, возникающие до начала заболевания, не обязательно являются причиной заболевания.

Неоднородность образца

Наиболее часто используемой тканью для EWAS является кровь. Однако образцы крови содержат несколько разных типов клеток, каждый из которых имеет уникальную эпигенетическую подпись. Таким образом, чрезвычайно сложно определить, является ли взятый вами образец однородным, и поэтому трудно определить, вызваны ли вариации эпигенетических меток различиями в фенотипе / стимулах или неоднородностью образца.

Доступность ткани

В настоящее время многие EWAS используют кровь в качестве суррогатной ткани из-за ее доступности и простоты сбора. Однако эпигенетические изменения в крови могут не быть связаны с изменениями в конкретной ткани, связанной с заболеванием. Многие интригующие расстройства, которые могут иметь эпигенетические причинные факторы, влияют на ткани, такие как мозг, легкие, сердце и т. Д. Однако при изучении пациентов-людей нельзя брать эти ткани для отбора проб, и поэтому они остаются неизученными.

Связанная база данных

Атлас EWAS

Атлас EWAS (http://bigd.big.ac.cn/ewas ) - это тщательно отобранная база знаний о EWAS, который предоставляет исчерпывающий набор знаний EWAS. В отличие от существующих эпигенетических ресурсов, ориентированных на данные, EWAS Atlas предлагает ручное копирование знаний EWAS из обширных публикаций. В текущей реализации EWAS Atlas фокусируется на метилировании ДНК - одном из ключевых эпигенетических признаков; он объединяет большое количество из 388 851 высококачественных ассоциаций EWAS, включающих 126 тканей / клеточных линий и охватывающих 351 признак, 2230 когорт и 390 онтологических объектов, которые полностью основаны на ручном курировании из 649 исследований, опубликованных в 495 публикациях. Кроме того, он оснащен мощным инструментом анализа обогащения признаков, который способен профилировать отношения признака-признака и признак-эпигеном. Будущие разработки включают регулярное отслеживание недавних публикаций EWAS, включение большего количества эпигенетических меток и возможную интеграцию EWAS с GWAS. В совокупности Атлас EWAS посвящен курированию, интеграции и стандартизации знаний EWAS и имеет большой потенциал, чтобы помочь исследователям проанализировать молекулярные механизмы эпигенетических модификаций, связанных с биологическими признаками.

EWAS Data Hub

EWAS Data Hub (https://bigd.big.ac.cn/ewas/datahub ) - это ресурс для сбора и нормализации метилирования ДНК. массив данных, а также архивирование связанных метаданных. Текущая версия EWAS Data Hub объединяет обширный набор данных массивов метилирования ДНК из 75 344 образцов и использует эффективный метод нормализации для удаления пакетных эффектов между различными наборами данных. Соответственно, используя преимущества массивных высококачественных данных о метилировании ДНК и стандартизированных метаданных, EWAS Data Hub предоставляет эталонные профили метилирования ДНК в различных контекстах, включая 81 тип тканей / клеток (которые содержат 25 частей мозга и 25 типов клеток крови), шесть предков категории и 67 заболеваний (в том числе 39 онкологических). Таким образом, EWAS Data Hub обещает помочь в поиске и открытии биомаркеров на основе метилирования для характеристики фенотипа, клинического лечения и здравоохранения.

См. Также
  • значок Портал биологии
Ссылки
Последняя правка сделана 2021-05-19 12:12:53
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте