Байесовский инструмент для анализа метилирования

редактировать

Байесовский инструмент для анализа метилирования, также известный как BATMAN, представляет собой статистический инструмент для анализа профилей иммунопреципитации метилированной ДНК (MeDIP). Его можно применять к большим наборам данных, созданным с использованием либо массивов олигонуклеотидов (MeDIP-chip), либо секвенирования следующего поколения (MeDIP-seq), обеспечивая количественную оценку абсолютного метилирования. состояние в интересующей области.

Рабочий процесс Бэтмена
Содержание
  • 1 Теория
  • 2 Развитие Бэтмена
  • 3 Ограничения
  • 4 Ссылки
Теория

MeDIP (иммунопреципитация метилированной ДНК) - это экспериментальный метод, используемый для оценки уровней метилирования ДНК с использованием антитела для выделения метилированных последовательностей ДНК. Выделенные фрагменты ДНК либо гибридизуют с микрочипом (MeDIP-chip), либо секвенируют с помощью секвенирования следующего поколения (MeDIP-seq). Хотя это говорит вам, какие области генома метилированы, он не дает абсолютных уровней метилирования. Представьте себе две разные области генома, A и B. Область A содержит шесть CpG (метилирование ДНК в соматических клетках млекопитающих обычно происходит по CpG динуклеотидам ), три из которых метилированы. Область B имеет три CpG, все из которых метилированы. Поскольку антитело просто распознает метилированную ДНК, оно будет связывать обе эти области в равной степени, и, следовательно, последующие шаги будут показывать одинаковые сигналы для этих двух областей. Это не дает полной картины метилирования в этих двух областях (в области A только половина CpG метилирована, тогда как в области B все CpG метилированы). Следовательно, чтобы получить полную картину метилирования для данной области, вы должны нормализовать сигнал, полученный в эксперименте MeDIP, на количество CpG в регионе, и это то, что делает алгоритм Бэтмена . Анализ сигнала MeDIP в приведенном выше примере даст оценку Бэтмена 0,5 для области A (т.е. область метилирована на 50%) и 1 для области B (т.е. область метилирована на 100%). Таким образом, Бэтмен преобразует сигналы экспериментов MeDIP в уровни абсолютного метилирования.

Разработка Бэтмена

Основной принцип алгоритма Бэтмена состоит в моделировании эффектов различной плотности динуклеотидов CpG и их влияния на обогащение MeDIP фрагментов ДНК. Основные предположения Бэтмена:

  1. Почти все метилирование ДНК у млекопитающих происходит в динуклеотидах CpG.
  2. Большинство бедных CpG областей метилированы конститутивно, в то время как большинство областей, богатых CpG (CpG-островки) конститутивно неметилированы.
  3. В эксперименте MeDIP нет смещений по фрагментам (приблизительный диапазон размеров фрагментов ДНК составляет 400–700 п.н.).
  4. Ошибки на микрочипе составляют нормально распределяются с точностью.
  5. Только метилированные CpG вносят вклад в наблюдаемый сигнал.
  6. Состояние метилирования CpG обычно сильно коррелирует по сотням оснований, поэтому CpG сгруппированы вместе в окнах из 50 или 100 п.н. будет иметь такое же состояние метилирования.

Основные параметры в Batman:

  1. Ccp: коэффициент связи между зондом p и CpG-динуклеотидом c, определяется как доля молекул ДНК, гибридизующихся с зондом p, которые содержат CpG c.
  2. Ctot : общий параметр влияния CpG, определяется как сумма коэффициентов связи для любого данного датчика, которая обеспечивает измерение re локальной плотности CpG
  3. mc: статус метилирования в положении c, который представляет долю хромосом в образце, в которой он метилирован. m c рассматривается как непрерывная переменная, поскольку большинство образцов, используемых в исследованиях MeDIP, содержат несколько типов ячеек.

Исходя из этих предположений, сигнал из канала MeDIP Эксперимент с MeDIP-чипом или MeDIP-seq зависит от степени обогащения фрагментов ДНК, перекрывающих этот зонд, что, в свою очередь, зависит от количества и, следовательно, от количества метилированных CpG на этих фрагментах. В модели Бэтмена полный набор данных из эксперимента MeDIP / чип, A, может быть представлен статистической моделью в форме следующего распределения вероятностей :

f (A ∣ m) = ∏ p ϕ (A p ∣ A base + r ∑ c C cp, ν - 1), {\ displaystyle f (A \ mid m) = \ prod _ {p} \ phi \ left (A_ {p} \ mid A _ {\ text {base}) } + r \ sum _ {c} C_ {cp}, \ nu ^ {- 1} \ right),}{\ displaystyle f (A \ mid m) = \ prod _ {p} \ phi \ left (A_ {p } \ mid A _ {\ text {base}} + r \ sum _ {c} C_ {cp}, \ nu ^ {- 1} \ right),}

где ϕ {\ displaystyle \ phi}\ phi (x | μ, σ) представляет собой гауссову функцию плотности вероятности. Стандартные байесовские методы могут использоваться для вывода f (m | A), то есть распределения вероятных состояний метилирования с учетом одного или нескольких наборов выходных сигналов MeDIP-chip / MeDIP-seq. Чтобы решить эту проблему вывода, Бэтмен использует вложенную выборку (http://www.inference.phy.cam.ac.uk/bayesys/ ) для генерации 100 независимых выборок из f ( m | A) для каждой мозаичной области генома, затем суммирует наиболее вероятное состояние метилирования в окнах размером 100 п.н., подбирая бета-распределения для этих образцов. В качестве финальных вызовов метилирования использовались режимы наиболее вероятных бета-распределений.

Ограничения

При рассмотрении вопроса об использовании Бэтмена может быть полезно принять во внимание следующие моменты:

  1. Бэтмен не является частью программного обеспечения ; это алгоритм, выполняемый с использованием командной строки . Как таковой, он не особенно удобен для пользователя и представляет собой довольно сложный в вычислительном отношении процесс.
  2. Поскольку это некоммерческий характер, при использовании Бэтмена очень мало поддержки, кроме того, что указано в руководстве.
  3. Это довольно трудоемко (анализ одной хромосомы может занять несколько дней). (Примечание: в одной правительственной лаборатории запуск Бэтмена на наборе из 100 массивов Agilent для метилирования человеческой ДНК (около 250 000 зондов на массив) занял менее часа в программном обеспечении Agilent Genomic Workbench. Наш компьютер имел процессор 2 ГГц и 24 ГБ ОЗУ., 64-битная Windows 7.)
  4. Необходимо учитывать изменение количества копий (CNV). Например, оценку для области с 1,6 в раке (потеря 0,4 по сравнению с нормой) нужно будет умножить на 1,25 (= 2 / 1,6), чтобы компенсировать потерю.
  5. Одно из основных предположений Бэтмена состоит в том, что все метилирование ДНК происходит в динуклеотидах CpG. Хотя это обычно относится к соматическим клеткам позвоночных, существуют ситуации, когда широко распространено метилирование не-CpG, например, в растительных клетках и эмбриональных стволовых клетках.
Ссылки
Последняя правка сделана 2021-05-12 07:57:51
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте