Перестановка дерева

редактировать

Перестановка дерева используется в эвристике алгоритмы, предназначенные для поиска оптимальной древовидной структуры. Они могут применяться к любому набору данных, которые естественным образом организованы в дерево, но имеют большинство приложений в вычислительная филогенетика, особенно в поисках максимальной экономичности и максимальной вероятности филогенетических деревьев, которые стремятся идентифицировать одно из множества возможных деревьев, которое лучше всего объясняет эволюционная история конкретного гена или виды.

Содержание

1 Основные преобразования дерева
2 Объединение деревьев
3 Секториальный поиск
4 Дрейф дерева
5 Объединение деревьев
6 Ссылки

Основные преобразования деревьев

Обмен ближайшего соседа (NNI)
Отсечение и повторная прививка поддерева (SPR)
Деление дерева пополам и повторное соединение (TBR)

Простейшая перегруппировка дерева, известная как обмен ближайшего соседа, меняет возможность подключения четырех поддеревьев в основном дереве. Поскольку существует три возможных способа соединения четырех поддеревьев, и один из них - исходное соединение, каждый обмен создает два новых дерева. Исчерпывающий поиск возможных ближайших соседей для каждого возможного набора поддеревьев - самый медленный, но наиболее оптимизирующий способ выполнения этого поиска. Альтернативный, более широкий поиск, обрезка и пересадка поддерева (SPR), выбирает и удаляет поддерево из основного дерева и повторно вставляет его в другое место в основном дереве для создания нового узла. Наконец, разделение дерева пополам и повторное соединение (TBR) отделяет поддерево от главного дерева во внутреннем узле, а затем пытается все возможные соединения между ребрами двух созданных таким образом деревьев. Возрастающая сложность метода перестройки дерева коррелирует с увеличением вычислительного времени, необходимого для поиска, хотя не обязательно с их производительностью.

SPR можно далее разделить на uSPR: некорневой SPR, rSPR: корневой SPR. uSPR применяется к некорневым деревьям и выглядит так: сломайте любой край. Присоедините один конец ребра (выбранный произвольно) к любому другому ребру в дереве. rSPR применяется к корневым деревьям * и идет: ломает любое ребро, кроме ребра, ведущего к корневому узлу. Присоединитесь к одному концу ребра (а именно: к самому дальнему от корня концу ребра) и прикрепите его к любому другому ребру дерева.

* В этом примере корень дерева отмечен узел первой степени, что означает, что все узлы в дереве имеют степень 1 или степень 3. Альтернативный подход, используемый в Bordewich и Semple, состоит в том, чтобы рассматривать корневой узел как имеющий степень 2 и иметь специальное правило для rSPR.

Количество перемещений SPR или TBR, необходимых для перехода от одного дерева к другому, может быть рассчитано путем создания леса максимального согласования, включающего (соответственно) корневые или неукорененные деревья. Эта проблема является сложной NP, но с фиксированными параметрами.

Слияние деревьев

Простейший тип слияния деревьев начинается с двух деревьев, которые уже определены как почти оптимальные; таким образом, они, скорее всего, имеют правильное большинство своих узлов, но могут не правильно разрешить отдельные «листья» дерева; например, разделение ((A, B), (C, D)) на конце ответвления по сравнению с ((A, C), (B, D)) может быть неразрешенным. Слияние деревьев меняет местами эти два решения между двумя деревьями, которые в остальном почти оптимальны. В вариантах метода используются стандартные генетические алгоритмы с определенной целевой функцией для замены поддеревьев с высокими показателями в основные деревья, которые в целом имеют наибольший результат.

Секториальный поиск

Альтернативная стратегия состоит в том, чтобы отделить часть дерева (которую можно выбрать случайным образом или с использованием более стратегического подхода) и выполнить TBR / SPR / NNI для этого поддерева. Это оптимизированное поддерево затем можно заменить в основном дереве, что, как мы надеемся, улучшит p-оценку.

Дрейф дерева

Чтобы избежать попадания в локальные оптимумы, можно применить подход «имитационного отжига». используется, при этом алгоритму иногда разрешается использовать неоптимальные деревья кандидатов с вероятностью, связанной с тем, насколько они далеки от оптимума.

Объединение деревьев

Один раз диапазон одинаково оптимальных деревья были собраны, часто можно найти лучшее дерево, объединив «хорошие части» отдельных деревьев. Подгруппы с идентичным составом, но разной топологией могут быть переключены и полученные деревья оцениваются.

Ссылки

^ Felsenstein J. (2004). Вывод о филогенезе Sinauer Associates: Сандерленд, Массачусетс.
^Такахаши К., Ней М. (2000). Эффективность быстрых алгоритмов филогенетического вывода по критериям максимальной экономии, минимальной эволюции и максимального правдоподобия при использовании большого количества последовательностей. Mol Biol Evol 17 (8): 1251-8.
^Bordewich M, Semple C. 2005. О вычислительной сложности отсечения корневого поддерева и расстояния повторного трансплантата Ann. Расческа. 8: 409–23
^WHIDDEN, C., BEIKO, R.G. и ZEH, N. 2016. Алгоритмы с фиксированными параметрами и приближения для максимума многораздельных деревьев. Algorithmica, 74, 1019–1054
^CHEN, J., FAN, J.-H. и SZE, S.-H. 2015. Параметризованные и аппроксимационные алгоритмы для леса максимального согласия в многофуркационных деревьях. Теоретическая информатика, 562, 496–512.
^Мацуда Х. (1996). Филогенетический вывод белков с использованием максимального правдоподобия с помощью генетического алгоритма. Тихоокеанский симпозиум по биокомпьютингу 1996, стр. 512-23.
^ Голобов, П. (1999). Анализ больших наборов данных в разумные сроки: решения для Composite Optima. Кладистика, 15 (4), 415–428. doi :10.1006/clad.1999.0122