Оценка гаплотипа

редактировать

В генетика, оценка гаплотипа (также известная как «фазирование») относится к процессу статистической оценки гаплотипов из данных генотипа. Чаще всего возникает ситуация, когда генотипы собираются на множестве полиморфных сайтов у группы людей. Например, в генетике человека полногеномные ассоциативные исследования собирают генотипы у тысяч индивидуумов в диапазоне от 200 000 до 5 000 000 SNP с использованием микроматриц. При анализе этих наборов данных используются методы оценки гаплотипов, которые позволяют вменять генотип аллелей из справочных баз данных, таких как HapMap Project и Проект 1000 геномов.

Содержание
  • 1 Генотипы и гаплотипы
  • 2 Методы оценки гаплотипов
  • 3 См. Также
  • 4 Ссылки
Генотипы и гаплотипы

Генотипы измеряют неупорядоченную комбинацию аллелей в каждом сайте, тогда как гаплотипы являются две последовательности аллелей, унаследованные вместе от родителей человека. Когда в индивидуальном наборе генотипов присутствует N {\ displaystyle N}N гетерозиготных генотипов, будет 2 N {\ displaystyle 2 ^ {N}}2 ^ {{N}} возможные пары гаплотипов, которые могут лежать в основе генотипов. Например, когда N = 2 {\ displaystyle N = 2}N = 2 , мы имеем следующие гаплотипы: AA / TT, AT / TA, TA / AT и TT / AA. Если отсутствуют генотипы, количество возможных пар гаплотипов увеличивается.

Методы оценки гаплотипов

Многие статистические методы были предложены для оценки гаплотипов. Некоторые из самых ранних подходов использовали простую полиномиальную модель, в которой каждому возможному гаплотипу, соответствующему выборке, давали неизвестный частотный параметр, и эти параметры оценивались с помощью алгоритма максимизации ожидания. Эти подходы были способны обрабатывать только небольшое количество сайтов одновременно, хотя позже были разработаны последовательные версии, в частности метод SNPHAP.

Наиболее точные и широко используемые методы оценки гаплотипов используют некоторую форму скрытой марковской модели (HMM) для выполнения вывода. Долгое время ФАЗА была самым точным методом. PHASE был первым методом, который использовал идеи из теории слияния относительно совместного распределения гаплотипов. В этом методе использовался подход выборки Гиббса, в котором гаплотипы каждого индивидуума обновлялись в зависимости от текущих оценок гаплотипов из всех других выборок. Аппроксимации распределения гаплотипа, обусловленного набором других гаплотипов, использовались для условных распределений сэмплера Гиббса. ФАЗА использовалась для оценки гаплотипов из HapMap Project. ФАЗА была ограничена своей скоростью и неприменима к наборам данных из общегеномных ассоциативных исследований.

Методы fastPHASE и BEAGLE представили модели кластеров гаплотипов, применимые к наборам данных размером GWAS. Впоследствии были представлены методы IMPUTE2 и MaCH, которые были похожи на подход PHASE, но намного быстрее. Эти методы итеративно обновляют оценки гаплотипов каждой выборки в зависимости от подмножества K оценок гаплотипов других выборок. IMPUTE2 представил идею тщательного выбора подмножества гаплотипов для повышения точности. Точность увеличивается с увеличением K, но с квадратичной O (K 2) {\ displaystyle O (K ^ {2})}{\ displaystyle O (K ^ {2})} вычислительной сложностью.

Метод SHAPEIT1 значительно продвинулся вперед, введя линейный метод O (K) {\ displaystyle O (K)}{\ displaystyle O (K)} сложности, который работает только с пространством гаплотипов, совместимым с генотипы человека. Впоследствии метод HAPI-UR предложил очень похожий метод. SHAPEIT2 сочетает в себе лучшие функции SHAPEIT1 и IMPUTE2 для повышения эффективности и точности.

См. Также
Ссылки
Последняя правка сделана 2021-05-22 13:11:20
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте