Оригинальный автор (ы) | Йозеф Фельзенштейн |
---|---|
Разработчики) | Вашингтонский университет |
Первый выпуск | Октябрь 1980 г. ; 40 лет назад ( 1980-10 ) |
Стабильный выпуск | 3.697 / 2 ноября 2014 г. ; 6 лет назад ( 2014-11-02 ) |
Репозиторий | |
Написано в | C |
Операционная система | Windows, Mac OS X, Linux |
Платформа | x86, x86-64 |
Доступно в | английский |
Тип | Филогенетика |
Лицензия | =gt; v3.697: open-source = lt;v3.695: проприетарное бесплатное ПО |
Веб-сайт | evolution.genetics.washington.edu / phylip.html |
Пакет PHYLogeny Inference ( PHYLIP ) - это бесплатный пакет программ для компьютерной филогенетики для вывода эволюционных деревьев ( филогении ). Она состоит из 35 портативных программ, т.е. исходный код записывается на языке программирования C. Начиная с версии 3.696, это программное обеспечение с открытым исходным кодом ; версии 3.695 и более ранние были проприетарным бесплатным программным обеспечением. Релизы происходят в виде исходного кода и предварительно скомпилированных исполняемых файлов для многих операционных систем, включая Windows (95, 98, ME, NT, 2000, XP, Vista), Mac OS 8, Mac OS 9, OS X, Linux ( Debian, Red Hat ) ; и FreeBSD с FreeBSD.org. Полная документация написана для всех программ в пакете и включена в него. Автор пакета - профессор Джозеф Фельзенштейн из Департамента геномных наук и Департамента биологии Вашингтонского университета в Сиэтле.
Методы (реализованные каждой программой), доступные в пакете, включают экономию, матрицу расстояний и методы правдоподобия, включая бутстрапирование и деревья консенсуса. Типы данных, с которыми можно работать, включают молекулярные последовательности, частоты генов, сайты и фрагменты рестрикции, матрицы расстояний и дискретные символы.
Каждая программа управляется через меню, которое спрашивает пользователей, какие параметры они хотят установить, и позволяет им начать вычисления. Данные считываются в программу из текстового файла, который пользователь может подготовить с помощью любого текстового редактора или текстового редактора (но этот текстовый файл не может быть в специальном формате этого текстового процессора, вместо этого он должен быть в простом ASCII или только текстовом формате. формат). Некоторые программы анализа последовательностей, такие как программа выравнивания Clustal W, могут записывать файлы данных в формате PHYLIP. Большинство программ ищут данные в файле с именем infile. Если они не находят этот файл, они затем просят пользователя ввести имя файла данных.
Вывод записывается в файлы с такими именами, как outfile
и outtree
. Деревья написаны outtree
в формате Ньюика, неофициальном стандарте, согласованном в 1986 году авторами семи основных пакетов филогении.
Название программы | Описание |
---|---|
протпарс | Оценивает филогенез пептидных последовательностей с помощью метода экономии. |
днапарс | Оценивает филогенез последовательностей ДНК, используя метод экономии. |
днапенный | Метод экономии ветвей и связей ДНК, находит все наиболее экономные филогении для последовательностей нуклеиновых кислот с помощью поиска по ветвям и связям. |
dnamove | Интерактивное построение филогений из последовательностей нуклеиновых кислот с их оценкой методом экономии ДНК, с совместимостью и отображением реконструированных оснований предков |
dnacomp | Оценивает филогении по данным последовательностей нуклеиновых кислот с использованием критерия совместимости. |
днамл | Оценивает филогении по нуклеотидным последовательностям с использованием метода максимального правдоподобия. |
dnamlk | Метод максимального правдоподобия ДНК с молекулярными часами; совместное использование dnaml и dnamlk позволяет провести проверку отношения правдоподобия для гипотезы молекулярных часов. |
промл | Оценивает филогении по аминокислотным последовательностям белков с использованием метода максимального правдоподобия. |
промлк | Метод максимального правдоподобия белковой последовательности с молекулярными часами |
restml | Оценка филогенеза по максимальной вероятности с использованием данных рестрикционных сайтов; не по рестрикционным фрагментам, а по наличию или отсутствию отдельных сайтов |
днаинвар | Для данных о последовательностях нуклеиновых кислот по четырем видам вычисляет филогенетические инварианты Лейка и Кавендера, которые проверяют альтернативные топологии деревьев. |
dnadist | Метод расстояния ДНК, который вычисляет четыре различных расстояния между видами по последовательностям нуклеиновых кислот; расстояния могут затем использоваться в программах матрицы расстояний |
протдист | Метод расстояния между последовательностями белков, который вычисляет меру расстояния для последовательностей с использованием оценок максимального правдоподобия на основе матрицы Дейхоффа PAM, приближения к ней Кимуры 1983 года или модели, основанной на генетическом коде плюс ограничение на переход на другую категорию аминокислот. |
рестдист | Расстояния, рассчитанные на основе данных сайтов ограничения или данных фрагментов ограничения |
seqboot | Программа начальной загрузки-складывания; читает набор данных и генерирует из него несколько наборов данных путем повторной выборки при начальной загрузке |
фитч | Метод матрицы расстояний Фитча-Марголиаша ; оценивает филогении на основе данных матрицы расстояний в рамках модели аддитивного дерева, согласно которой предполагается, что расстояния равны сумме длин ветвей между видами |
китч | Метод матрицы расстояний Фитча-Марголиаша с молекулярными часами; оценивает филогении на основе данных матрицы расстояний в рамках ультраметрической модели, которая аналогична модели аддитивного дерева, за исключением того, что предполагается наличие эволюционных часов |
сосед | Реализация методов объединения соседей и UPGMA |
contml | Максимальное правдоподобие непрерывных символов и частот генов; оценивает филогении на основе данных о частоте генов по максимальной вероятности в рамках модели, в которой все расхождения происходят из-за генетического дрейфа в отсутствие новых мутаций; также проводится анализ максимального правдоподобия непрерывных персонажей, которые развиваются по модели броуновского движения, предполагая, что персонажи развиваются с одинаковой скоростью и некоррелированным образом; не учитывает корреляции персонажей |
контраст | Считывает дерево из файла дерева и набор данных с данными о непрерывных символах и генерирует независимые контрасты для этих символов для использования в любом пакете многомерной статистики. |
гендер | Программа генетической дистанции, которая вычисляет одну из трех различных формул генетической дистанции на основе данных частоты генов. |
парсы | Неупорядоченный метод экономии дискретных символов с несколькими состояниями |
смешивание | Оценивает филогении с помощью некоторых методов экономии для дискретных символьных данных с двумя состояниями (0, 1); позволяет использовать методы: Вагнера, Камин-Сокаля или произвольные смеси |
пенни | Смешанный метод ветвей и границ, который находит все самые экономные филогении для дискретно-символьных данных с двумя состояниями, для критериев Вагнера, Камина-Сокаля и смешанной экономии с использованием метода точного поиска по ветвям и границам. |
двигаться | Интерактивное построение филогении из дискретных символьных данных с двумя состояниями (0, 1); оценивает критерии экономии и совместимости для этих филогений и отображает реконструированные состояния по всему дереву |
ложка | Оценивает филогении с помощью критериев экономии Долло или полиморфизма для дискретных символьных данных с двумя состояниями (0, 1) |
долпенный | Находит все или наиболее экономные филогении для дискретных данных с двумя состояниями, для критериев экономии Долло или полиморфизма с использованием метода точного поиска по ветвям и границам |
долман | Интерактивное построение филогении из дискретных символьных данных с двумя состояниями (0, 1) с использованием критериев экономии Долло или полиморфизма; оценивает критерии экономии и совместимости для этих филогений; отображает реконструированные состояния по всему дереву |
клика | Находит наибольшую группу взаимно совместимых символов и рекомендуемую ими филогению для дискретных символьных данных с двумя состояниями (0, 1); самая большая клика (или все клики в пределах заданного диапазона размеров самой большой) обнаруживаются с помощью метода быстрого поиска по ветвям и границам |
фактор | Программа перекодирования символов, которая принимает дискретные данные с несколькими состояниями с деревьями состояний символов и выдает соответствующий набор данных с двумя состояниями (0, 1) |
Drawgram | Программа для рисования корневого дерева, которая отображает корневые филогении, кладограммы и фенограммы в большом количестве контролируемых пользователем форматов. Программа является интерактивной и позволяет просматривать дерево на графических экранах ПК или Macintosh, а также на графических терминалах Tektronix или Digital. |
дерево | Программа для рисования деревьев без корней похожа на DRAWGRAM, но отображает филогении. |
согласие | Программа дерева консенсуса, которая вычисляет деревья методом дерева большинства правил, что также позволяет легко находить дерево строгого консенсуса; невозможно вычислить дерево консенсуса Адамса |
лесник | Вычисляет симметричное разностное расстояние Робинсона – Фулдса между деревьями, которое допускает различия в топологии дерева. |
отступать | Программа интерактивной перестановки дерева, которая считывает дерево (с указанием длины ветвей, если необходимо) и позволяет изменять корень дерева, переворачивать ветви, изменять названия видов и длину ветвей, а затем записывать результат; может использоваться для преобразования между корневыми и некорневыми деревьями |
Преобразование между форматом множественного выравнивания последовательностей PHYLIP и форматом Multi- FASTA можно выполнить с помощью Genozip, используя genocat --fasta или genocat --phylip.