Отображение архитектуры генома

редактировать

В молекулярной биологии отображение архитектуры генома (GAM) - это метод криосекции для сопоставления колокализованных участков ДНК независимым способом лигирования. Он преодолевает некоторые ограничения захвата конформации хромосомы (3C), поскольку эти методы основаны на расщеплении и лигировании для захвата взаимодействующих сегментов ДНК. GAM - это первый общегеномный метод определения трехмерной близости между любым количеством геномных локусов без лигирования.

Содержание
  • 1 Принцип
  • 2 Криосекция и лазерная микродиссекция
  • 3 Анализ данных (метод биоинформатики)
    • 3.1 GAMtools
      • 3.1.1 Отображение данных секвенирования
      • 3.1.2 Вызов Windows
      • 3.1.3 Создание матриц близости
      • 3.1.4 Выполнение проверок контроля качества
    • 3.2 SLICE
      • 3.2.1 SLICE Модель
      • 3.2.2 Расчет распределения в профиле одного ядра
      • 3.2.3 Оценка среднего радиуса ядра
      • 3.2.4 Расчет вероятности пар локусов в одном ядре профиль
      • 3.2.5 Эффективность обнаружения
      • 3.2.6 Оценка вероятностей взаимодействия пар
  • 4 Преимущества
  • 5 Ссылки
Принцип

Отображение архитектуры генома было разработано в лаборатории Ана Помбо, основанный на концепции теоретического подхода к картированию сцепления генома человека, опубликованной в 1989 г., GAM реализует меру физического Расчетное расстояние между областями генома посредством криосрезов и лазерных микродиссекций. Чтобы изучить взаимодействие локусов в геноме, GAM использует набор срезов, собранных со случайных направлений ядер. Вот простая схема GAM:

GAM overview.png

Во-первых, сделайте ультратонкий ядерный срез путем криосекции. Затем выделите один профиль ядра с помощью микродиссекции лазерного захвата. После этого извлеките ДНК из ядерных профилей и выполните амплификацию. Затем идентифицируйте последовательности ДНК, присутствующие в каждом ядерном срезе, с помощью секвенирования следующего поколения. С помощью этих данных последовательности постройте попарные матрицы ко-сегрегации для отображения попарных контактов хроматина. Используйте таблицы совместной сегрегации, чтобы выполнить анализ SLICE, чтобы получить вероятности взаимодействия.

Криосекция и лазерная микродиссекция

Криосрезы производятся в соответствии с методом Токуясу, включая строгую фиксацию для сохранения ядерной и клеточной архитектуры, криозащиту с помощью раствора сахароза-PBS перед замораживанием в жидком азоте. В картировании архитектуры генома секционирование является необходимым шагом для изучения трехмерной топологии генома перед лазерной микродиссекцией. Затем с помощью лазерной микродиссекции можно выделить каждый профиль ядра перед выделением ДНК и секвенированием.

Анализ данных (метод биоинформатики)

GAMtools

GAMtools - это набор программных утилит для картографирования архитектуры генома, разработанный Робертом Бигри. Bowtie2 требуется перед запуском GAMtools. Формат Fastq данные - входной файл. Программа сначала выполнит отображение последовательности. Затем звонят окна, производят матрицы близости и проверки качества.

Блок-схема

Сопоставление данных последовательности

Для реализации задачи сопоставления Gamtools использует команду gamtools process_nps . Он отображает необработанные данные последовательности из ядерных профилей.

Вызов Windows

Вычислить количество считываний из каждого ядерного профиля, которые перекрываются с каждым окном в фоновом файле генома. Размер окна по умолчанию - 50 КБ. После этого он создает таблицу разделения.

Создание матриц близости

Команда для этого процесса - матрица gamtools . Входной файл - это таблица разделения, рассчитанная на основе вызовов Windows.

Выполнение проверок контроля качества

Эта функция включена в gamtools process_nps . С помощью проверки контроля качества gamtools может исключить ядерные профили низкого качества.

SLICE

SLICE (статистический вывод совместной сегрегации) играет ключевую роль в анализе данных GAM. Он был разработан в лаборатории Марио Никодеми, чтобы предоставить математическую модель для определения наиболее специфических взаимодействий между локусами на основе данных о косегрегации GAM. Он оценивает долю конкретного взаимодействия для каждой пары локусов в данный момент времени. Это своего рода вероятностный метод. Первым шагом SLICE является предоставление функции ожидаемой доли ядерных профилей GAM. Затем найдите результат с наилучшей вероятностью, чтобы объяснить экспериментальные данные.

Flow диаграмма SLICE

Модель SLICE

Модель SLICE основана на гипотезе о том, что вероятность того, что невзаимодействующие локусы попадают в тот же ядерный профиль, предсказуема. Вероятность зависит от расстояния этих локусов. Модель SLICE рассматривает пару локусов как два типа: один взаимодействует, а другой не взаимодействует. Согласно гипотезе, пропорции состояния ядерных профилей могут быть предсказаны математическим анализом. Получая функцию вероятности взаимодействия, эти данные GAM также можно использовать для поиска заметных взаимодействий и исследования чувствительности GAM.

Рассчитать распределение в профиле одного ядра

SLICE считает, что пара локусов может быть взаимодействием или отсутствием взаимодействия в популяции клеток. Первый шаг этого расчета - описание одного локуса. Пара локусов A и B может иметь два возможных состояния: первое - это то, что A и B не взаимодействуют друг с другом. Другое дело, что у них есть. Первая проблема заключается в том, можно ли найти единственный локус в ядерном профиле.. Математическое выражение:

Вероятность одного локуса: v 0, v 1 {\ displaystyle v_ {0}, v_ {1}}{\ displaystyle v_ {0}, v_ {1}} . - <v 1 {\ displaystyle v_ {1}}v_ {1} >вероятность того, что локус найден в ядерном профиле.. - <v 0 {\ displaystyle v_ {0}}v_ { 0} >= 1 - {\ displaystyle = 1-}{\ displaystyle = 1-} <v 1 {\ displaystyle v_ {1}}v_ {1} >вероятность того, что локус не найден в ядерном профиле.. - <v 1 {\ displaystyle v_ {1}}v_ {1} >=Ядро VNP / V {\ displaystyle V_ {NP} / V_ {nucleus}}{\ displaystyle V_ {NP} / V_ {nucleus}}

Оценка среднего радиуса ядра

Как указано в уравнении выше, объем Ядерная - необходимая величина для расчета. Радиусы этих ядерных профилей можно использовать для оценки радиуса ядра. Прогноз SLICE для радиуса соответствует моделированию Монте-Карло (более подробная информация об этом шаге будет обновлена ​​после получения лицензии на рисунок в исходной статье автора). С помощью результата оценки радиуса можно оценить вероятность двух локусов в состоянии невзаимодействия и вероятность того, что эти два локуса находятся во взаимодействующем состоянии.. Вот математическое выражение невзаимодействия:. <ui {\ displaystyle u_ {i}}u_ {i} >, i = 0, 1, 2 представляет: найти 0, 1 или 2 локуса пары невзаимодействующих локусов.. Два локуса в не взаимодействующих локусах. -взаимодействующее состояние: ui {\ displaystyle u_ {i}}u_ {i} . < u 0>=< v 0 2>, < u 1>=< v 1 v 0>, < u 2>=< v 1 2>{\ displaystyle =,=,=}{\displaystyle <u_{0}>=<v_{0}^{2}>,<u_{1}>=<v_{1}v_{0}>,<u_{2}>=<v_{1}^{2}>} . Вот математическое выражение взаимодействия:. Оценка состояния взаимодействия двух локусов: ti {\ displaystyle t_ {i}}t_ {i} вероятность. < t 2>{\ displaystyle }{\displaystyle <t_{2}>} ~ < v 1>{\ displaystyle }{\ displaystyle <v_{1}>}, < t 1>{\ displaystyle }{\ displaystyle <t_ {1}>} ~ 0, < t 0>{\ displaystyle }{\ displaystyle <t_{0}>}~ < v 0>= 1 - < v 1>{ \ displaystyle = 1- }{\displaystyle <v_{0}>= 1- <v_{1}>}

Вычислить вероятность пар локусов в одном ядерном профиле

На основе результатов предыдущих процессов вероятность появления пары локусов в одном ядерном профиле можно рассчитать статистическим методом. Пара локусов может существовать в трех разных состояниях. Каждый из них имеет вероятность P i, i = 0, 1, 2 {\ displaystyle P_ {i}, i = 0,1,2}{\ displaystyle P_ {i}, i = 0, 1,2} . Вероятность появления пар локусов в профилях одного ядра: P 2, P 1, P 0 {\ displaystyle P_ {2}, P_ {1}, P_ {0}}{\ displaystyle P_ {2 }, P_ {1}, P_ {0}} . P 2 {\ displaystyle P_ {2}}P_ {2} : вероятность двух пар локусов находятся в состоянии взаимодействия;. P 1 {\ displaystyle P_ {1}}P_ {1} : вероятность того, что один взаимодействует с другим, но другой не взаимодействует;. P 0 {\ displaystyle P_ {0}}P_ {0} : вероятность того, что двое не взаимодействуют.. Статистический анализ SLICE. N 0, 0 / N = < t 0 2>P 2 + < t 0 u 0>P 1 + < u 0 2>P 0 {\ displaystyle N_ {0,0} / N = P_ {2} + P_ {1} + P_ {0} }{\displaystyle N_{0,0}/N=<t_{0}^{2}>P_ {2} + <t_{0}u_{0}>P_ {1} + <u_{0}^{2}>P_ {0}} . N 2, 0 / N = N 0, 2 = < t 1 2>P 2 + < t 1 u 1>P 1 + < u 1 2>P 0 {\ displaystyle N_ {2,0} / N = N_ {0,2} = P_ {2} + P_ {1} + P_ {0}}{\displaystyle N_{2,0}/N=N_{0,2}=<t_{1}^{2}>P_ {2} + <t_{1}u_{1}>P_ {1} + <u_{1}^{2}>P_ {0}} . N i, j {\ displaystyle N_ {i, j}}{\ displaystyle N_ {i, j}} представляют: число i соответствует A. Число j соответствует B. (i и j равны 0, 1 или 2 локуса).

Эффективность обнаружения

Поскольку количество экспериментов ограничено, должна быть некоторая эффективность обнаружения. Рассмотрение эффективности обнаружения может расширить эту SLICE-модель, чтобы учесть дополнительные сложности. Это статистический метод для улучшения результата расчета. В этой части данные GAM делятся на два типа: первый заключается в том, что локус в срезе обнаруживается в экспериментах, а другой - что локус в срезе не обнаруживается в экспериментах.

Оценка вероятностей взаимодействия пар

На основе оценки эффективности обнаружения и предыдущей вероятности u 0, u 1, u 2 {\ displaystyle u_ {0}, u_ {1 }, u_ {2}}{\ displaystyle u_ {0}, u_ {1}, u_ {2}} , вероятность взаимодействия пар может быть вычислена. Локусы обнаруживаются с помощью секвенирования следующего поколения.

Преимущества

По сравнению с методами на основе 3C, GAM обеспечивает три ключевых преимущества.

  • В методе C используется метод парного взаимодействия, что означает, что он может дать только парные результаты. Но GAM может обнаруживать кластеризацию нескольких локусов генов.
  • Ферменты рестрикции играют важную роль в C-методе. В этом случае сайты рестрикционных ферментов ограничивают методы, основанные на лигировании. GAM не имеет этого ограничения.
  • C-методы требуют больше ячеек, чем GAM.
Ссылки
Последняя правка сделана 2021-05-21 03:10:55
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте