Байесовский инструмент для анализа метилирования, также известный как BATMAN, представляет собой статистический инструмент для анализа профилей иммунопреципитации метилированной ДНК (MeDIP). Его можно применять к большим наборам данных, созданным с использованием либо массивов олигонуклеотидов (MeDIP-chip), либо секвенирования следующего поколения (MeDIP-seq), обеспечивая количественную оценку абсолютного метилирования. состояние в интересующей области.
Рабочий процесс БэтменаMeDIP (иммунопреципитация метилированной ДНК) - это экспериментальный метод, используемый для оценки уровней метилирования ДНК с использованием антитела для выделения метилированных последовательностей ДНК. Выделенные фрагменты ДНК либо гибридизуют с микрочипом (MeDIP-chip), либо секвенируют с помощью секвенирования следующего поколения (MeDIP-seq). Хотя это говорит вам, какие области генома метилированы, он не дает абсолютных уровней метилирования. Представьте себе две разные области генома, A и B. Область A содержит шесть CpG (метилирование ДНК в соматических клетках млекопитающих обычно происходит по CpG динуклеотидам ), три из которых метилированы. Область B имеет три CpG, все из которых метилированы. Поскольку антитело просто распознает метилированную ДНК, оно будет связывать обе эти области в равной степени, и, следовательно, последующие шаги будут показывать одинаковые сигналы для этих двух областей. Это не дает полной картины метилирования в этих двух областях (в области A только половина CpG метилирована, тогда как в области B все CpG метилированы). Следовательно, чтобы получить полную картину метилирования для данной области, вы должны нормализовать сигнал, полученный в эксперименте MeDIP, на количество CpG в регионе, и это то, что делает алгоритм Бэтмена . Анализ сигнала MeDIP в приведенном выше примере даст оценку Бэтмена 0,5 для области A (т.е. область метилирована на 50%) и 1 для области B (т.е. область метилирована на 100%). Таким образом, Бэтмен преобразует сигналы экспериментов MeDIP в уровни абсолютного метилирования.
Основной принцип алгоритма Бэтмена состоит в моделировании эффектов различной плотности динуклеотидов CpG и их влияния на обогащение MeDIP фрагментов ДНК. Основные предположения Бэтмена:
Основные параметры в Batman:
Исходя из этих предположений, сигнал из канала MeDIP Эксперимент с MeDIP-чипом или MeDIP-seq зависит от степени обогащения фрагментов ДНК, перекрывающих этот зонд, что, в свою очередь, зависит от количества и, следовательно, от количества метилированных CpG на этих фрагментах. В модели Бэтмена полный набор данных из эксперимента MeDIP / чип, A, может быть представлен статистической моделью в форме следующего распределения вероятностей :
где (x | μ, σ) представляет собой гауссову функцию плотности вероятности. Стандартные байесовские методы могут использоваться для вывода f (m | A), то есть распределения вероятных состояний метилирования с учетом одного или нескольких наборов выходных сигналов MeDIP-chip / MeDIP-seq. Чтобы решить эту проблему вывода, Бэтмен использует вложенную выборку (http://www.inference.phy.cam.ac.uk/bayesys/ ) для генерации 100 независимых выборок из f ( m | A) для каждой мозаичной области генома, затем суммирует наиболее вероятное состояние метилирования в окнах размером 100 п.н., подбирая бета-распределения для этих образцов. В качестве финальных вызовов метилирования использовались режимы наиболее вероятных бета-распределений.
При рассмотрении вопроса об использовании Бэтмена может быть полезно принять во внимание следующие моменты: