Список программного обеспечения для выравнивания последовательностей

редактировать
Статья списка Википедии

Этот список программного обеспечения для выравнивания последовательностей является компиляцией программных средств и веб-порталов, используемых для попарного выравнивания последовательностей и множественного выравнивания последовательностей. См. программное обеспечение структурного выравнивания для структурного выравнивания белков.

Содержание

  • 1 Только поиск в базе данных
  • 2 Попарное выравнивание
  • 3 Выравнивание множественных последовательностей
  • 4 Анализ геномики
  • 5 Поиск мотивов
  • 6 Бенчмаркинг
  • 7 Программы просмотра выравнивания, редакторы
  • 8 Выравнивание последовательности коротким чтением
  • 9 См. Также
  • 10 Ссылки

Только поиск в базе данных

ИмяОписаниеТип последовательности *АвторыГод
BLAST Локальный поиск с быстрой эвристикой k-кортежей (инструмент Basic Local Alignment Search Tool)ОбаAltschul SF, Gish W, Miller W, Myers EW, Lipman DJ 1990
многоузловая и многоядерная оболочка BLAST, совместимая с NCBI. Распространяемая с последней версией BLAST, эта оболочка облегчает распараллеливание алгоритма на современных гибридных архитектурах с множеством узлов и множеством ядер в каждом узле.Белок,2017
CS-BLAST BLAST, зависящий от контекста последовательности, более чувствительный, чем BLAST, FASTA и SSEARCH. Позиционно-зависимая итерационная версия CSI-BLAST более чувствительна, чем PSI-BLASTProteinAngermueller C, Biegert A, Soeding J2013
CUDASW ++Алгоритм Смита-Ватермана с ускорением на GPU для нескольких GPU с общим хостомProteinLiu Y, Maskell DL and Schmidt B2009/2010
DIAMONDBLASTX и выравниватель BLASTP на основе двойной индексацииProteinBuchfink B, Xie, C и Huson DH2015
FASTA Локальный поиск с быстрая эвристика из k кортежей, медленнее, но более чувствительна, чем BLASTОба
GGSEARCH, GLSEARCHGlobal: Global (GG), Global: Local (GL) согласование со статистикойProtein
Genome MagicianПрограммное обеспечение для сверхбыстрого поиска локальных мотивов последовательности ДНК и попарного выравнивания данных NGS (FASTA, FASTQ).ДНКHepperle D (www.sequentix.de)2020
GenoogleGenoogle использует методы индексирования и параллельной обработки для поиска последовательностей ДНК и белков. Он разработан на Java и с открытым исходным кодом.ОбаAlbrecht F2015
HMMER Локальный и глобальный поиск с профилем Скрытые модели Маркова, более чувствительные чем PSI-BLASTОбаДурбин Р., Эдди SR, Крог А., Митчисон Дж.1998
HH-suite Попарное сравнение профильных скрытых марковских моделей; очень чувствительныйбелокSöding J2005/2012
IDFобратная частота документаоба
адскийПрофиль SCFG поискРНКEddy S
KLASTВысокопроизводительный инструмент поиска сходства последовательностей общего назначенияОба2009/2014
LAMBDAВысокопроизводительный локальный выравниватель, совместимый с BLAST, но намного быстрее; поддерживает SAM / BAMProteinHannes Hauswedell, Jochen Singer, Knut Reinert2014
MMseqs2Программный пакет для поиска и кластеризации огромных последовательностей наборы. Аналогичная чувствительность к BLAST и PSI-BLAST, но на несколько порядков быстрееProteinSteinegger M, Mirdita M, Galiez C, Söding J2017
USEARCHСверхбыстрый инструмент анализа последовательностиОбаЭдгар Р.К. (2010). «Поиск и кластеризация на порядки быстрее, чем BLAST». Биоинформатика. 26 (19): 2460–2461. doi : 10.1093 / bioinformatics / btq461. PMID 20709691.публикация2010
OSWALDOpenCL Smith-Waterman на FPGA Altera для больших баз данных белковПротеинРуччи Э., Гарсия К., Ботелла Дж., Де Джусти А., Найуф М., Прието-Матиас М.2016
водный парашютФаст Смит- Поиск Waterman с использованием распараллеливания SIMDОбаDaily J2015
PSI-BLAST Итеративный BLAST, зависящий от позиции, локальный поиск с позицией- специальные оценочные матрицы, намного более чувствительные, чем BLASTProteinAltschul SF, Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ 1997
PSI-SearchСочетание алгоритма поиска Смита-Уотермана со стратегией построения профиля PSI-BLAST для поиска отдаленно связанных белковых последовательностей и предотвращения гомологичные ошибки избыточного удлинения.ProteinLi W, McWilliam H, Goujon M, Cowley A, Lopez R, Pearson WR2012
ScalaBLASTВысокопараллельный Scalab le BLASTОбаOehmen et al.2011
SequilabСвязывание и профилирование данных выравнивания последовательностей из результатов NCBI-BLAST с основной последовательностью серверы / службы анализаНуклеотид, пептид2010
SAMЛокальный и глобальный поиск с профилем Скрытые модели Маркова, более чувствительные, чем PSI-BLASTОбаKarplus K, Krogh A 1999
SSEARCHПоиск по Смиту-Уотерману, медленнее, но более чувствителен, чем FASTAОба
Сначала параллельный алгоритм, использующий разрабатываемый Intel Xeon Phis для ускорения поиска в базе данных белков Смита-ВатерманаProteinЛю И и Шмидт Б.2014
Первый параллельный алгоритм Смита-Ватермана использование кластеров Intel Xeon Phi для ускорения выравнивания длинных последовательностей ДНКДНКLiu Y, Tran TT, Lauenroth F, Schmidt B2014
SWIMMРеализация Смита-Ватермана для архитектур Intel Multicore и ManycoreProteinRucci E, García C, Botel la G, De Giusti A, Naiouf M и Prieto-Matías M2015
SWIMM2.0Enhanced Smith-Waterman на архитектурах Intel Multicore и Manycore на основе векторных расширений AVX-512БелокРуччи Э., Гарсия С., Ботелла Дж., Де Джусти А., Найуф М. и Прието-Матиас М.2018
SWIPEБыстрый поиск Смита-Уотермана с использованием распараллеливания SIMDОбаRognes T2011

*Тип последовательности: белок или нуклеотид

Попарное выравнивание

ИмяОписаниеТип последовательности *Тип соответствия **АвторГод
ACANAПопарное выравнивание на основе быстрой эвристической привязкиОбаОбаХуанг, Умбах, Ли2005
AlignMeВыравнивания для последовательностей мембранных белковБелокОбаM. Штамм, К. Хафизов, Р. Старицбихлер, Л. Forrest2013
ALLALIGNДля молекул ДНК, РНК и белков размером до 32 МБ выравнивает все последовательности размером K или больше. Подобные сопоставления группируются для анализа. Автоматический фильтр повторяющейся последовательности.ОбаЛокальныйE. Wachtel2017
Bioconductor Biostrings :: pairwiseAlignmentДинамическое программированиеОбаОба + без концовП. Aboyoun2008
BioPerl dpAlignДинамическое программированиеОбаОба + без концовY. M. Chan2003
BLASTZ, LASTZПосеянное сопоставление с образцомНуклеотидЛокальныйSchwartz et al.2004,2009
CUDAlignВыравнивание последовательностей ДНК неограниченного размера в одном или нескольких графических процессорахНуклеотидЛокальный, полуглобальный, глобальныйЭ. Sandes2011-2015
DNADotВеб-инструмент для построения точечных графиковNucleotideGlobalR. Bowen1998
DNASTAR Lasergene Molecular Biology SuiteПрограммное обеспечение для выравнивания последовательностей ДНК, РНК, белка или ДНК + белок с помощью алгоритмов попарного и множественного выравнивания последовательностей, включая MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson и анализ Dotplot.ОбаОбаDNASTAR 1993-2016
DOTLETИнструмент точечной печати на основе JavaОбаGlobalM. Пагни и Т. Джунье1998
ПИРЛокальное расширение на основе заднего плана с описательной моделью эволюцииНуклеотидЛокальныйА. К. Худек и Д. Г. Браун2010
Компилятор генома Компилятор геномаВыровняйте файлы хроматограмм (.ab1,.scf) по шаблонной последовательности, обнаруживайте ошибки и мгновенно исправляйте их.НуклеотидЛокальныйGenome Compiler Corporation2014
G-PASДинамическое программирование на базе графического процессора с обратным отслеживаниемОбалокальный, полуглобальный, глобальныйW. Frohmberg, M. Kierzynka et al.2011
GapMisВыполняет попарное выравнивание последовательностей с одним пробеломОбаSemiGlobalК. Frousios, T. Flouri, CS Iliopoulos, K. Park, SP Pissis, G. Tischler2012
Genome MagicianПрограммное обеспечение для сверхбыстрого поиска локальных мотивов последовательности ДНК и попарного выравнивания для Данные NGS (FASTA, FASTQ).DNALocal, SemiGlobal, GlobalHepperle D (www.sequentix.de)2020
GGSEARCH, GLSEARCHГлобальное: Глобальное (GG), Глобальное: Локальное (GL) выравнивание со статистикойБелокГлобальное в запросеW. Pearson2007
JAligner Java с открытым исходным кодом реализация Smith-WatermanОбаLocalА. Moustafa2005
K * SyncВыравнивание последовательности белка со структурой, которое включает вторичную структуру, структурную консервативность, профили последовательностей, производных от структуры, и оценки согласованного выравниванияБелокОбаD. Chivian D. Baker2003
LALIGNМножественное неперекрывающееся локальное сходство (тот же алгоритм, что и SIM)ОбаЛокальный неперекрывающиесяW. Пирсон1991 (алгоритм)
NW-alignСтандартный алгоритм динамического программирования Нидлмана-ВуншаProteinGlobalY Zhang2012
mAlignвыравнивание моделирования; моделирует информационное содержание последовательностейНуклеотидОбаD. Пауэлл, Л. Эллисон и Т.И. Дикс2004
сопоставительЛокальное выравнивание Уотермана-Эггерта (на основе LALIGN)ОбаЛокальноеИ. Лонгден (модифицировано из У. Пирсона)1999
MCALIGN2явные модели эволюции indelДНКGlobalДж. Wang et al.2006
MUMmerсуффиксное дерево на основеNucleotideGlobalS. Курц и др.2004
иглаNeedleman-Wunsch динамическое программированиеОбаSemiGlobalA. Bleasby1999
Ngilaзатраты на логарифмический и аффинный разрыв и явные модели эволюции indelОбаGlobalR. Cartwright2007
NWNeedleman-Wunsch динамическое программированиеОбаGlobalA.C.R. Мартин1990-2015
parasailБиблиотека динамического программирования C / C ++ / Python / Java SIMD для SSE, AVX2ОбаGlobal, Без концов, местноеJ. Daily2015
ПутьСмит-Уотерман на protein назад-перевод график (обнаруживает сдвигов рамки на уровне белка)БелокЛокальныйM. Gîrdea et al.2009
PatternHunter Посеянное сопоставление с образцомНуклеотидЛокальныйB. Ма и др.2002–2004 гг.
ProbA (также propA)Выборка стохастической функции распределения с помощью динамического программирования ОбаGlobalУ. Mückstein2002
PyMOLКоманда "align" выравнивает последовательность и применяет ее к структуреProteinGlobal (по выбору)В. Л. ДеЛано2007
REPuterсуффиксное дерево на основеНуклеотидЛокальныйS. Kurtz et al.2001
SABERTOOTHВыравнивание с использованием предсказанных профилей связностиProteinGlobalF. Тейхерт, Дж. Миннинг, У. Бастолла и М. Порто2009
СацумаПараллельные выравнивания синтении всего геномаДНКЛокальныйMG Grabherr et al.2010
SEQALNРазличное динамическое программированиеОбаЛокальное или глобальноеM.S. Уотерман и П. Харди1996
SIM, GAP, NAP, LAPЛокальное сходство с различной обработкой пробеловОбаЛокальное или глобальноеХ. Хуан и У. Миллер1990-6
SIMЛокальное сходствоОбаЛокальноеX. Хуанг и В. Миллер1991
SPA: Супер-парное выравниваниеБыстрое попарное глобальное выравниваниеНуклеотидГлобальноеШен, Ян, Яо, Хван2002
SSEARCHЛокальное (Смит-Уотерман ) сопоставление со статистикойБелокМестноеW. Пирсон1981 (алгоритм)
Sequences StudioJava-апплет, демонстрирующий различные алгоритмы изGeneric sequenceLocal и globalА.Мескаускас1997 (справочник)
SWIFOLDУскорение Смита-Ватермана на ПЛИС Intel с OpenCL для длинных последовательностей ДНКНуклеотидМестныйE. Rucci2017-2018
иск SWIFTFast Local Alignment SearchingDNALocalK. Расмуссен, В. Герлах2005,2008
носилкиОптимизация памяти Needleman-Wunsch динамическое программированиеОбаГлобальныйI. Longden (модифицировано из G. Myers and W. Miller)1999
tranalignВыравнивает последовательности нуклеиновых кислот с учетом белкового выравниванияНуклеотидNAG. Williams (модифицировано из Б. Пирсона)2002
UGENEСмит-Ватерман с открытым исходным кодом для SSE / CUDA, поиск повторов на основе суффиксного массива и точечная диаграммаОбаОбаUniPro2010
водаДинамическое программирование Смита-ВатерманаОбаЛокальноеА. Bleasby1999
wordmatchk-кортежное попарное соответствиеОбаNAI. Лонгден1998
YASS Посеянное сопоставление с образцомНуклеотидЛокальныйL. Ноэ и Г. Кучеров2004

*Тип последовательности: белок или нуклеотид ** Тип выравнивания: локальное или глобальное

Множественное выравнивание последовательностей

ИмяОписаниеТип последовательности *Тип согласования **АвторГодЛицензия
ABAВыравнивание A-БрейнаБелокГлобальныйB.Raphael et al.2004Собственный, бесплатное ПО для образования, исследований, некоммерческих организаций
ALEвыравнивание вручную; некоторая помощь в программном обеспеченииНуклеотидыЛокальныеJ. Blandy and K. Fogel1994 (последняя версия 2007)Free, GPL 2
ALLALIGNДля молекул ДНК, РНК и белков размером до 32 МБ, выравнивает все последовательности размера K или больше, MSA или внутри одной молекулы. Подобные сопоставления группируются для анализа. Автоматический фильтр повторяющейся последовательности.ОбаЛокальныйE. Wachtel2017Бесплатно
AMAP Последовательный отжигОбаГлобальныйA. Шварц и Л. Пачтер 2006
анон.быстрое оптимальное выравнивание трех последовательностей с использованием линейных затрат на разрывнуклеотидовGlobalD. Пауэлл, Л. Эллисон и Т. И. Дикс2000
Бали-Фи Дерево + множественное выравнивание; вероятностно-байесовский; совместная оценкаОба + CodonsGlobalBD Redelings и MA Suchard2005 (последняя версия 2018)Бесплатно, GPL
Base-By-BaseРедактор множественного выравнивания последовательностей на основе Java со встроенными инструментами анализаОбаЛокальный или глобальныйР. Brodie et al.2004Собственное, бесплатное ПО, необходимо зарегистрировать
CHAOS, DIALIGNИтеративное выравниваниеОбаЛокальный (предпочтительно)M. Брудно и Б. Моргенштерн2003
Clustal WПрогрессивное выравниваниеОбаЛокальное или глобальноеТомпсон и др.1994Бесплатно, LGPL
CodonCode Aligner Мульти-выравнивание; Поддержка ClustalW и PhrapНуклеотидыЛокальные или глобальныеP. Richterich et al.2003 (последняя версия 2009 г.)
Compass Сравнение множественных выравниваний последовательностей белков с оценкой статистической значимостиБелокГлобальныйRI Садреев и др.2009
DECIPHER Прогрессивно-итеративное выравниваниеОбаГлобальноеЭрик С. Райт2014Бесплатно, GPL
DIALIGN-TX и DIALIGN-TМетод на основе сегментовОбаЛокальный (предпочтительно) или GlobalARSubramanian2005 (последняя версия 2008 г.)
Выравнивание ДНКМетод на основе сегментов для внутривидового выравниванияОбаЛокальный (предпочтительно) или ГлобальныйA.Roehl2005 (последняя версия 2008 г.)
Ассемблер ДНК Baser Sequence AssemblerМножественное выравнивание; Полное автоматическое выравнивание последовательностей; Автоматическая коррекция неоднозначности; Внутренний базовый вызывающий абонент; Выравнивание последовательностей в командной строкеНуклеотидыЛокальные или глобальныеHeracle BioSoft SRL2006 (последняя версия 2018)Коммерческие (некоторые модули являются бесплатными)
DNADynamo связал ДНК с белком множественное выравнивание с MUSCLE, Clustal и Smith-WatermanОбаЛокальный или глобальныйDNADynamo2004 (новейшая версия 2017 г.)
DNASTAR Lasergene Molecular Biology SuiteПрограммное обеспечение для выравнивания ДНК, РНК, белок или ДНК + белковые последовательности с помощью алгоритмов попарного и множественного выравнивания последовательностей, включая MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson и анализ Dotplot.ОбаЛокальное или глобальноеDNASTAR 1993-2016
EDNAЭнергетическое выравнивание множественных последовательностей для сайтов связывания ДНКНуклеотидыЛокальный или глобальныйСалама, РА. и др.2013
FAMSAПрогрессивное выравнивание для чрезвычайно больших семейств белков (сотни тысяч членов)БелокГлобальныйДеорович и др.2016
FSA Отжиг последовательностиОбаГлобальныйR. К. Брэдли и др.2008
Прогрессивно-итеративное выравнивание; Плагин ClustalWОбаЛокальный или глобальныйA.J. Drummond et al.2005 (последняя версия 2017)
KalignПрогрессивное выравниваниеОбаGlobalT. Лассманн2005
MAFFT Прогрессивно-итеративное выравниваниеОбаЛокальное или глобальноеK. Katoh et al.2005Free, BSD
MARNAМножественное выравнивание РНКРНКМестныйС. Siebert et al.2005
MAVID Прогрессивное выравниваниеОбаGlobalN. Брей и Л. Pachter 2004
MSAДинамическое программированиеОбаЛокальное или глобальноеD.J. Lipman et al.1989 (изменено в 1995 г.)
MSAProbsДинамическое программированиеProteinGlobalY. Лю, Б. Шмидт, Д. Маскелл2010
MULTALINДинамическое программирование-кластеризацияОбаЛокальные или глобальныеF. Corpet1988
Multi-LAGANВыравнивание прогрессивного динамического программированияОбаGlobalM. Brudno et al.2003
MUSCLE Прогрессивно-итеративное выравниваниеОбаЛокальное или глобальноеR. Эдгар2004
OpalПрогрессивно-итеративное выравниваниеОбаЛокальное или глобальноеT. Уиллер и Дж. Кесечиоглу2007 (последняя стабильная версия 2013 г., последняя бета-версия 2016 г.)
ПеканВероятностная согласованностьДНКГлобальнаяБ. Paten et al.2008
Phylo Человеческая вычислительная среда для сравнительной геномики для решения множественного выравнивания НуклеотидовЛокальные или глобальныеMcGill Bioinformatics2010
PMFastRПрогрессивное выравнивание с учетом структурыРНКГлобальноеD. DeBlasio, J Braund, S Zhang2009
PralineВыравнивание с прогрессивной итеративной последовательностью и расширенным гомологическим анализом с предварительным профилированием и прогнозированием вторичной структурыБелокGlobalДж. Heringa1999 (последняя версия 2009 г.)
PicXAAНепрогрессивное выравнивание с максимальной ожидаемой точностьюОба вариантаGlobalS.M.E. Сахрейян и Б.Дж. Юн2010
POAМодель Маркова с частичным порядком / скрытаяБелокЛокальный или глобальныйC. Ли2002
Probalign Вероятность / согласованность с вероятностями функции распределенияProteinGlobalРошан и Ливси2006Бесплатно, общественное достояние
ProbCons Вероятность / согласованностьБелокЛокальный или глобальныйC. Do et al.2005Бесплатно, общественное достояние
PROMALS3DПрогрессивное выравнивание / скрытая марковская модель / Вторичная структура / 3D-структураПротеинГлобалJ. Pei et al.2008
PRRN / PRRPИтерационное выравнивание (особенно уточнение)БелокЛокальное или глобальноеY. Тотоки (на основе О. Гото)1991 и позже
PSAlignНеэвристическое сохранение выравниванияОбаЛокальное или глобальноеШ Sze, Y. Lu, Q. Yang.2006
RevTransОбъединяет выравнивание ДНК и белка путем обратного преобразования выравнивания белка в ДНК.ДНК / Белок (специальный)Локальный или глобальныйВернерссон и Педерсен2003 (новейшая версия 2005 г.)
SAGAВыравнивание последовательностей с помощью генетического алгоритмаБелокЛокальный или глобальныйC. Notredame et al.1996 (новая версия 1998)
SAMСкрытая марковская модельБелокЛокальный или глобальныйА. Krogh et al.1994 (последняя версия 2002)
Se-AlРучное выравниваниеОбаМестноеА. Rambaut2002
StatAlignБайесовская совместная оценка выравнивания и филогении (MCMC)ОбаGlobalA. Новак и др.2008
Stemloc Множественное выравнивание и предсказание вторичной структурыРНКЛокальное или глобальноеI. Холмс2005Бесплатно, GPL 3 (parte de)
T-Coffee Более чувствительное прогрессивное выравниваниеОбаЛокальный или глобальныйC. Notredame et al.2000 (новейшая версия 2008)Бесплатно, GPL 2
UGENE Поддерживает множественное выравнивание с MUSCLE, KAlign, Clustal и MAFFT плагиныОбаЛокальный или глобальныйКоманда UGENE2010 (новейшая версия 2020)Бесплатно, GPL 2
VectorFriendsVectorFriends Aligner, MUSCLE плагин и Clustal W плагинОбаЛокальный или глобальныйКоманда BioFriends2013Собственное, бесплатное ПО для академического использования
GLProbsПодход на основе адаптивной пары-скрытой модели МарковаProteinGlobalY. Ye et al.2013

*Тип последовательности: белок или нуклеотид. ** Тип сопоставления: локальный или глобальный

Геномный анализ

ИмяОписаниеТип последовательности *
EAGLEAn сверхбыстрый инструмент для поиска относительных отсутствующих слов в геномных данныхНуклеотид
ACT (Artemis Comparison Tool)Синтения и сравнительная геномикаНуклеотид
AVIDПопарное глобальное выравнивание с целыми геномамиНуклеотид
BLATВыравнивание последовательностей кДНК с геномом.Нуклеотид
DECIPHER Выравнивание реаранжированных геномов с использованием 6-рамочной трансляцииНуклеотид
FLAKНечеткое выравнивание и анализ всего геномаНуклеотид
GMAPВыравнивание последовательности кДНК в геном. Идентифицирует соединения сайтов сплайсинга с высокой точностью.Нуклеотид
SplignВыравнивание последовательностей кДНК с геномом. С высокой точностью определяет стыки в местах соединения. Способен распознавать и разделять дупликации генов.Нуклеотид
СиреневыйМножественное выравнивание реаранжированных геномовНуклеотид
MGAМножественный выравниватель геномаНуклеотид
MulanЛокальное множественное выравнивание последовательностей длины геномаНуклеотид
MultizМножественное выравнивание геномовНуклеотид
PLAST-ncRNAПоиск ncRNA в геномах по локальному выравниванию функции распределенияНуклеотид
Sequerome Профилирование данных выравнивания последовательностей с основными серверами / службамиНуклеотид, пептид
SequilabПрофилирование данных выравнивания последовательностей из результатов NCBI-BLAST с основными серверами-службамиНуклеотид, пептид
Shuffle-LAGANПопарное глокальное выравнивание завершенных участков геномаНуклеотид
SIBsim4, Sim4 Программа, разработанная для выравнивания экспрессированной последовательности ДНК с геномной последовательностью, позволяющей использовать интроныНуклеотид
SLAMПоиск генов, выравнивание t, аннотация (идентификация гомологии человека и мыши)Нуклеотид
SRPRISMЭффективный выравниватель для сборок с явными гарантиями, выравнивание считываний без сплайсовНуклеотид

*Тип последовательности: белок или нуклеотид

.

Поиск мотива

ИмяОписаниеТип последовательности *
PMSПоиск и обнаружение мотиваИ
FMMПоиск и обнаружение мотивов (можно также получать положительные и отрицательные последовательности в качестве входных данных для поиска расширенных мотивов)Нуклеотид
БЛОКИРОВКИИдентификация незаполненных мотивов из базы данных BLOCKSОба
eMOTIFИзвлечение и идентификация более коротких мотивовОба
семплер мотивов ГиббсаСтохастический извлечение мотива по статистической вероятностиИ
HMMTOPПрогноз трансмембранных спиралей и топологии белковБелок
I-сайтыЛокальный библиотека структурных мотивовБелок
JCoilsПрогнозирование Coiled-coil и d Leucine Zipper Protein
MEME / MASTОбнаружение и поиск мотивовОба
CUDA-MEMEс ускорением на GPU Алгоритм MEME (v4.4.0) для кластеров GPUОба
MERCIОбнаружение дискриминационных мотивов и поискОба
PHI-BlastИнструмент поиска и совмещения мотивовОба
Phyloscan Инструмент поиска мотивовНуклеотид
PRATTГенерация шаблона для использования с ScanPrositeProtein
ScanPrositeИнструмент поиска по базе данных мотивовProtein
TEIRESIASИзвлечение мотивов и поиск по базе данныхОба
BASALTПоиск по множественным мотивам и регулярным выражениямОба

*Тип последовательности: белок или нуклеотид

.

Бенчмаркинг

ИмяАвторы
PFAM 30.0 (2016)
SMART (2015)Летуник, Копли, Шмидт, Чиккарелли, Доеркс, Шульц, Понтинг, Борк
BAliBASE 3 (2015)Томпсон, Плевняк, Поч
Oxbench (2011)Рагхава, Сирл, Одли, Ба rber, Barton
Коллекция тестов (2009)Эдгар
HOMSTRAD (2005)Mizuguchi
PREFAB 4.0 (2005)Эдгар
SABmark (2004)Van Walle, Lasters, Wyns

Средства просмотра совмещений, редакторы

См. Список программного обеспечения для визуализации выравнивания.

Краткосрочное выравнивание последовательностей

ИмяОписаниеопция парного концаИспользовать качество FASTQGappedМногопоточнаяЛицензияСсылкаГод
AriocВычисляет выравнивания по Смиту-Ватерману и качество сопоставления на одном или нескольких графических процессорах. Поддерживает выравнивание по BS-seq. Обрабатывает от 100 000 до 500 000 операций чтения в секунду (зависит от данных, оборудования и настроенной чувствительности).ДаНетДаДаБесплатно, BSD 2015
BarraCUDAУскоренная программа GPGPU преобразование Барроуза-Уиллера (FM-индекс) программа выравнивания короткого чтения на основе BWA, поддерживает выравнивание отступов с отверстиями и расширениями зазоров.ДаНетДаДа, POSIX Threads и CUDA Free, GPL
BBMapИспользует короткие kmers для быстрой индексации генома; нет ограничений по размеру или количеству строительных лесов. Более высокая чувствительность и специфичность, чем у выравнивателей Берроуза-Уиллера, с аналогичной или большей скоростью. Выполняет глобальное выравнивание, оптимизированное для аффинного преобразования, которое медленнее, но точнее, чем Смит-Ватерман. Обрабатывает данные Illumina, 454, PacBio, Sanger и Ion Torrent. С учетом стыковки; способен обрабатывать длинные индели и RNA-seq. Чистая Java; работает на любой платформе. Используется Объединенным институтом генома.ДаДаДаДаБесплатно, BSD 2010
BFAST Явный компромисс времени и точности с априорной оценкой точности, поддерживаемый индексированием эталонных последовательностей. Оптимально сжимает индексы. Может обрабатывать миллиарды коротких чтений. Может обрабатывать вставки, удаления, SNP и цветовые ошибки (может отображать чтение цветового пространства ABI SOLiD). Выполняет полное выравнивание по Smith Waterman.Да, POSIX Threads бесплатно, GPL 2009
BigBWAЗапускает Burrows-Wheeler Aligner -BWA на Hadoop кластер. Он поддерживает алгоритмы BWA-MEM, BWA-ALN и BWA-SW, работая с парными и одиночными чтениями. Это подразумевает значительное сокращение времени вычислений при работе в кластере Hadoop, добавляя масштабируемость и отказоустойчивость.ДаОбрезка низкокачественной основыДаДаБесплатно, GPL 32015
BLASTNПрограмма нуклеотидного выравнивания BLAST, медленная и неточная для коротких считываний, и использует базу данных последовательностей (EST, последовательность Сэнгера), а не эталонный геном.
BLAT Сделано Джимом Кентом. Может справиться с одним несоответствием на начальном этапе выравнивания.Да, клиент-серверСобственное, бесплатное программное обеспечение для академического и некоммерческого использования2002
Bowtie Использует преобразование Барроуза-Уиллера для создания постоянного многоразового индекса генома; Объем памяти 1,3 ГБ для генома человека. Выполняет согласование более 25 миллионов операций чтения Illumina за 1 час ЦП. Поддерживает Maq-подобные и SOAP-подобные политики выравниванияДаДаНетДа, POSIX Threads Бесплатно, Художественный 2009
BWAИспользует преобразование Барроуза-Уиллера для создания индекса генома. Он немного медленнее, чем Bowtie, но позволяет выравнивать отступы.ДаОбрезка баз низкого качестваДаДаБесплатно, GPL 2009
BWA-PSSMВероятностный выравниватель короткого чтения, основанный на использовании оценочных матриц, зависящих от позиции (PSSM). Выравниватель можно адаптировать в том смысле, что он может учитывать показатели качества считываний и модели систематических ошибок данных, например, наблюдаемых в Ancient DNA, данных PAR-CLIP или геномах со смещенными нуклеотидными составами.ДаДаДаДаБесплатно, GPL 2014
CASHXКоличественно и управлять большими объемами данных последовательности короткого чтения. CASHX pipeline содержит набор инструментов, которые можно использовать вместе или по отдельности как модули. Этот алгоритм оченьточен для идеальных совпадений с эталонным геномом.НетСобственное, бесплатное ПО для академического и некоммерческого использования
CloudburstКратковременное отображение с использованием Hadoop MapReduceДа, Hadoop MapReduce Free, Artistic
CUDA-ECКоррекция ошибок выравнивания при кратковременном чтении с использованием графических процессоров.Да, с поддержкой графического процессора
CUSHAWСовместимый с CUDA выравниватель короткого чтения для больших геномов на основе преобразования Барроуза-УиллераДаДаНетДа (включен графический процессор)Бесплатно, GPL 2012
CUSHAW2На основе выравнивания короткого и длинного чтения с пропусками по семенам точного совпадения. Этот выравниватель поддерживает выравнивание по базовому пространству (например, от секвенсоров Illumina, 454, Ion Torrent и PacBio), так и по цветому пространству ABI SOLiD.ДаНетДаДаБесплатно, GPL 2014
CUSHAW2-GPUУстройство выравнивания короткого чтения CUSHAW2 с ускорением на GPU.ДаНетДаДаБесплатно, GPL
CUSHAW3Чувствительное и точное выравнивание кратковременного чтения по базовому и цветовому пространству с гибридным заполнениемДаНетДаДаБесплатно, GPL 2012
drFASTПрограммное обеспечение для выравнивания отображения чтения, которое реализует игнорирование кеша для минимизации передачи / кэш-памяти, например, mrFAST и mrsFAST, однако разработано для платформы секвенирования SOLiD ( цвет пробел читает). Он также возвращает все возможные местоположения на карте для более точного обнаружения структурных вариаций.ДаДа, для структурных измененийДаНетБесплатно, BSD
ELANDРеализовано Иллюмина. Включает выравнивание без пробелов с конечной длиной чтения.
ERNEРасширенный рандомизированный числовой выравниватель для точного выравнивания показаний NGS. Он может отображать чтения, обработанные бисульфитом.ДаНизкое качество обрезки базДаМногопоточность и поддержка MPIБесплатно, GPL 3
GASSSTНаходит глобальное выравнивание коротких последовательностей ДНК с банками ДНК.Лицензия CeCILL версия 2.2011
GEMВысококачественный механизм выравнивания (полный дисплей с заменами и отступами). Точнее и в несколько раз быстрее, чем BWA или Bowtie 1/2. Предоставляется множество автономных биологических приложений (картограф, сплит-картограф, картографирование и другие).ДаДаДаДаДвойное, бесплатное ПО для некоммерческого использования; Исходный код GEM в настоящее время недоступен2012
Genalice MAPСверхбыстрый и комплексный выравниватель чтения NGS с высокой точностью и небольшим объемом памяти.ДаОбрезка низкокачественных базДаДаСобственный, коммерческий
Geneious AssemblerБыстрый и точный ассемблер перекрытия с возможностью обработки любой комбинации технологии секвенирования, длины считывания, любых ориентаций спаривания, с любым размером спейсера для спаривания, с референсным геномом или без него.ДаСобственный, коммерческий
GensearchNGSПолная среда с удобным графическим интерфейсом для анализа данных NGS. Он объединяет высококачественный алгоритм выравнивания и возможности расширения для распространения различных общедоступных выравнивателей в форматах, позволяющих импортировать короткие чтения, выравнивать их, воспроизводить варианты и отчеты. Это сделано для переупорядочения проектов, а именно в диагностической установке.ДаНетДаДаСобственный, коммерческий
GMAP и GSNAPНадежное и быстрое выравнивание по короткому чтению. GMAP: более длинные чтения с множественными вставками и сращиваниями (см. Запись выше в разделе «Геномический анализ»); GSNAP: более короткие чтения, с одной вставкой или до двух соединений за одно чтение. Полезно для цифрового экспрессии генов, SNP и генотипирования инд. Разработано Томасом Ву из Genentech. Используется Национальным центром геномных ресурсов (NCGR) в Alpheus.ДаДаДаДаСобственное, бесплатное ПО для академического и некоммерческого использования
GNUMAPТочно выполняет выравнивание с разрывом данных последовательностей, полученных с помощью секвенирующих машин следующего поколения (в частности, Solexa-Illumina), с геномом любого размера. Включает обрезку адаптера, вызов SNP и Анализ бисульфитной исходной.Да, также поддерживает файлы Illumina * _int.txt и * _prb.txt со всеми 4 показателями качества для каждой базыМногопоточность и MPI-совместимый2009
HIVE-hexagonИспользует хэш-таблицу и матрица Блума для создания и установки позиций в геноме. Для более высокой эффективности используется перекрестное сходство между короткими считываниями и позволяет избежать повторного совмещения неуникальных избыточных последовательностей. Он работает быстрее, чем Bowtie и BWA, и позволяет проводить инсерции и дивергентные чувствительные выравнивания вирусов, бактерий и более консервативные выравнивания эукариот.ДаДаДаДаСобственное, бесплатное ПО для академических и некоммерческих пользователей, Зарегистрированный на Экземпляр развертывания HIVE2014
IMOSУлучшенный мета-выравниватель и Minimap2 On Spark. Распределенный выравниватель для длительного чтения на платформе Apache Spark с линейной масштабируемостью w.r.t. одноузловое исполнение.ДаДаДаБесплатно
ИсаакПолностью использует всю вычислительную мощность, доступную на одном серверном узле; таким образом, он хорошо масштабируется в широком диапазоне аппаратных архитектур, обеспечение согласования возможностей оборудованияДаДаДаДаБесплатно, GPL
LASTИспользует адаптивные семена и более эффективно справляется с последовательностями, богатыми повторами (например, геномами). Например: он может выравнивать чтение по геному без повторной маскировки.ДаДаДаНетБесплатно, GPL 2011
MAQВыравнивание без пробелов, учитывающее показатели качества для каждой базы.Бесплатное, GPL
mrFAST, mrsFASTПрограммное обеспечение для выравнивания с пробелами (mrFAST) и без пробелов (mrsFAST), которое реализует игнорирование кеша для минимизации передачи / кэш-памяти. Они разработаны для платформы секвенирования Illumina и могут возвращать все возможные местоположения на карте для более точного обнаружения структурных вариаций.ДаДа, для структурных вариацийДаНетБесплатно, BSD
MOMMOM или максимальный охват олигонуклеотидов - это инструмент сопоставления запросов, который фиксирует совпадение максимальной длины в коротком считывании.Да
Устройство для выравнивания с быстрым зазором и сборщик с ориентирами. Выравнивает использование с использованием полосатого алгоритма Смита-Уотермана, засеянного схемы хеширования k-mer. Поддерживает чтение размером от очень короткого до очень длинного.Да
MPscanБыстрый выравниватель на основе стратегии фильтрации (без индексации, использование q-граммов и обратное недетерминированное DAWG сопоставление)2009
Novoalign NovoalignCSВыравнивание одинарного и парного концов с промежутками. Illumina GA I и II, цветовое пространство ABI и показания ION Torrent. Высокая специфичность, использование базовых качеств на всех этапах выравнивания. Включает подгонку адаптера, калибровку базового качества, выравнивание Bi-Seq и опции для отчета о нескольких выравниваниях за одно положение. Неоднозначных кодов IUPAC для общего SNP может улучшить вспоминание SNP и устранить аллельное смещение.ДаДаДаМногопоточные версии и версии MPI доступны с платной лицензиейСобственное, бесплатное ПО однопоточная версия для академического и некоммерческого использования
NextGENeРазработана для использования биологами, выполняющими анализ данных секвенирования следующего поколения с помощью Roche Genome Sequencer FLX, Illumina GA / HiSeq, SOLiD System от Life Technologies Applied BioSystems, Платформы PacBio и Ion Torrent.ДаДаДаДаСобственный, коммерческий
NextGenMapГибкая и быстрая программа картографирования (в два раза быстрее, чем BWA), обеспечивает чувствительность картографирования, сопоставимую с Stampy. Внутренне использует эффективную с точки зрения памяти индекс (хеш-таблицу) для хранения позиций всех 13-меров, присутствующих в эталонном геноме. Области отображения, где требуется попарное выравнивание, динамическое положение для каждого считывания. Использует быстрые инструкции SIMD (SSE) для ускорения вычислений выравнивания на ЦП. Если возможно, выравнивает вычисление на GPU (с использованием OpenCL / CUDA), что сокращает время выполнения на 20-50%.ДаНетДаДа, POSIX Threads, OpenCL / CUDA, SSEБесплатно2013
Variant ToolkitВключает высокочувствительные и высокоточные инструменты для обнаружения SNP и индексов. Он предлагает решение для картирования коротких чтений NGS на умеренном расстоянии (до 30% расхождения последовательностей) от эталонных геномов. Он не накладывает ограничений на размер ссылок, что в сочетании с его высокой чувствительностью делает Variant Toolkit хорошим подходом для целевых проектов секвенирования и диагностики.ДаДаДаДаСобственный, коммерческий
PALMapperЭффективно вычисляет совмещение со сращиванием и без сращивания с высокой точностью. Опираясь на стратегию машинного обучения в сочетании с быстрым отображением на основе ленточного алгоритма, подобного алгоритму Смита-Уотермана, он выравнивает около 7 миллионов операций чтения в час на одном процессоре. Он уточняет используемый предложенный подход QPALMA.ДаБесплатно, GPL
Partek FlowДля использования биологами и биоинформатиками. Он поддерживает выравнивание без зазоров, зазоров и сплайс-стыков из одинарных и парных считываний из необработанных данных Illumina, Life technologies Solid TM, Roche 454 и Ion Torrent (с информацией о качестве или без нее). Он объединяет мощный контроль качества на уровне FASTQ / Qual и согласованных данных. Дополнительные функции включают обрезку и проверку необработанных считываний, определение SNP и InDel, количественное определение мРНК и микроРНК и обнаружение гибридных генов.ДаДаДаВозможна многопроцессорная установка клиент-серверСобственный, коммерческий, бесплатная пробная версия
PASSИндексирует геном, затем расширяет семена, используя вычисленное выравнивание слов. Работает с базовым пространством, цветовым пространством (SOLID) и может выравнивать геномные и сплайсированные чтения РНК-seq.ДаДаДаДаСобственное, бесплатное ПО для академического и некоммерческого использования
PerMИндексирует геном с помощью периодических семян для быстрого поиска совпадений с полной чувствительностью до четырех несовпадений. Он может отображать показания Illumina и SOLiD. Скорость чтения картографических изображений размера чтения.ДаБесплатно, GPL
PRIMEXИндексирует геном с помощью таблицы поиска к-мер с полной чувствительностью до регулируемого количества несовпадений. Лучше всего для картирования последовательностей 15-60 пар оснований на геном.НетНетДаНет, несколько процессов на поиск[1] 2003
QPalmaМожет использовать оценки качества, длины интронов и предсказания места склейки вычислений для выполнения и выполнения беспристрастного выравнивания. Может быть обучен специфике эксперимента по РНК-секвенированию и геному. Полезно для открытия сайтов сплайсинга / интронов и для построения генных моделей. (См. Более быструю версию в PALMapper).Да, клиент-серверБесплатно, GPL 2
RazerSБез ограничения длины чтения. Хэмминга или редактирование карт расстояний с настраиваемой ошибки. Настраиваемая и предсказуемая чувствительность (компромисс между временем выполнения и чувствительностью). Поддерживает отображение парного чтения.Free, LGPL
REAL, cREALREAL - это эффективный, точный и чувствительный инструмент для согласования коротких считываний, полученных в результате секвенирования следующего поколения. Программа может обрабатывать огромное количество односторонних считываний, генерируемого анализатором генома Illumina / Solexa следующего поколения. cREAL - это простое расширение REAL для сопоставления коротких считываний, полученных в результате секвенирования следующего поколения, с геномом с круговой структурой.ДаДаБесплатно, GPL
RMAPМожет отображать считывание с информацией о вероятности ошибки или без нее (оценки качества) и поддерживает считывание на парном конец или считывания, обработанного бисульфитом. Нет ограничений на длину чтения или количество несовпадений.ДаДаДаБесплатно, GPL 3
rNAРандомизированный числовой выравниватель для точного выравнивания NGS читаетДаНизкое качество обрезки базДаМногопоточность и поддержка MPIБесплатно, GPL 3
RTG InvestigatorЧрезвычайно быстрый, устойчивый к большому количеству инделей и замен. Включает полное выравнивание чтения. Продукт включает в себя комплексные конвейеры для обнаружения вариантов и метагеномного анализа с любой комбинацией данных Illumina, Complete Genomics и Roche 454.ДаДа, для варианта вызоваДаДаСобственное, бесплатное ПО для индивидуального исследователя использовать
SegemehlМожет обрабатывать вставки, удаление, несоответствия; использует расширенные массивы суффиксовДаНетДаДаСобственное, бесплатное ПО для некоммерческого использование2009
SeqMapДо 5 смешанных замен и вставок-удалений; различные параметры настройки и форматы ввода-выводаСобственное, бесплатное ПО для академического и некоммерческого использования
ShrecКоррекция ошибок краткого чтения с суффикснымом структура данныхДа, Java
SHRiMPИндексирует эталонный геном, начиная с версии 2. Использует маски для генерации ключей ключей. Может отображать цветовое пространство ABI SOLiD читает.ДаДаДаДа, OpenMP Бесплатно, [[лицензии BSD | style = "background: # 9FF; color: black; vertical-align: middle; text-align: center;" class = "бесплатный стол без стола" | Бесплатно, BSD ]] производная2009 -2011
SLIDERSlider - это приложение для вывода результатов анализа последовательности Illumina, которое использует файлы «вероятности» вместо файлов последовательностей в качестве файлов последовательностей в качестве исходной последовательности. входных данных для выравнивания с эталонной последовательностью или набором эталонных последовательностей.ДаДаНетНет2009-2010
SOAP, SOAP2, SOAP3, SOAP3-dpМЫЛО: надежный с небольшим (1-3) пробелов и несоответствий. Повышение скорости по сравнению с BLAT, использует хеш-таблицу из 12 букв. SOAP2: двунаправленного BWT для индекса ссылок, использования и быстрее, чем первая версия. SOAP3: версия с ускорением на графическом процессоре, которая может находить все выравнивания с 4 несоответствиями за десятки секунд на миллион чтений. SOAP3-dp, а также ускорение на графическом процессоре, поддерживает количество несоответствий и пропусков в соответствии с оценками штрафа аффинных пробелов.ДаНетДа, SOAP3-dpДа, POSIX Threads ; SOAP3, SOAP3-dp требуется графический процессор с поддержкой CUDA Бесплатно, GPL
SOCSдля технологий ABI SOLiD. Значительное увеличение времени считывания карты с несоответствием (или ошибками цвета). Использует итеративную версию алгоритма поиска строки Рабина-Карпа.ДаБесплатно, GPL
SparkBWAИнтегрирует Burrows-Wheeler Aligner —BWA на Apache Spark фреймворк, работающий поверх Hadoop. Версия 0.2 от октября 2016 г. Поддерживает алгоритмы BWA-MEM, BWA-backtrack и BWA-ALN. Все они работают с однократным и парным чтением.ДаОбрезка баз низкого качестваДаДаБесплатно, GPL 32016
SSAHA, SSAHA2Fast для небольшого количества вариантовСобственное, бесплатное ПО для академического и некоммерческого использования
StampyДля Illumina читает. Высокая специфичность и чувствительность к считыванию индексами, структурными вариантами или множеством SNP. Медленно, но быстро увеличилась за счет использования BWA для первого прохода выравнивания.ДаДаДаНетСобственное, бесплатное ПО для академического и некоммерческого использования2010
STORMДля чтения Illumina или ABI SOLiD с SAM собственным выводом. Высокая чувствительность к чтению с большим количеством ошибок, индексам (полное от 0 до 15, в состоянии расширенная поддержка). Использует разнесенные начальные числа (одиночное совпадение) и очень быстрый полосовой фильтр выравнивания SSE - SSE2 - AVX2 - AVX-512. В случае авторы рекомендуют SHRiMP2 только для чтения фиксированной обратной прочности.НетДаДаДа, OpenMP Бесплатно2010
Subread, SubjuncСверхбыстрое и точное считывание выравнивателей. Подпрочитать сообщение для картирования чтения как gDNA-seq, так и RNA-seq. Subjunc открывает соединение экзон-экзон и отображает чтение РНК-seq. Они используют новую парадигму картографирования под названием «семя и голосование».ДаДаДаДаБесплатно, GPL 3
ТайпанАссемблер De-novo для Illumina читаетСобственное, бесплатное ПО для академического и некоммерческого использования
UGENE Визуальный интерфейс для Bowtie и BWA, а также встроенный выравнивательДаДаДаДаБесплатно, GPL
VelociMapperЭталонное ускорение FPGA инструмент сопоставления выравнивания последовательностей из TimeLogic. Быстрее, чем алгоритмы преобразования Барроуза-Уиллера на основе, такие как BWA и Bowtie. Поддерживает 7 несовпадений и / или несоответствий до потерь производительности. Обеспечивает чувствительное выравнивание по Смиту-Уотерману с зазором.ДаДаДаДаСобственный, коммерческий
XpressAlignСредство выравнивания короткого считывания на основе скользящего окна на основе ПЛИС, которое использует неловко параллельное считывание выравнивания при коротком считывании. Производительность линейно масштабируется с транзисторов на кристалле (т.е. производительность гарантированно удваивается с каждой итерацией закона Мура без модификации алгоритма). Низкое энергопотребление полезно для оборудования центра обработки данных. Прогнозируемое время выполнения. Лучшее соотношение цена / производительность, чем программные выравнивающие окна на текущем оборудовании, но не лучше, чем программные выравниватели на основе BWT в настоящее время. Может управлять большим количеством (>2) несоответствий. Найдет все позиции попадания для всех семян. Экспериментальная версия с одной ПЛИС, требуется доработка, чтобы превратить ее в производственную версию с использованием ПЛИС.Собственное, бесплатное программное обеспечение для академического и некоммерческого использования
ZOOM100% чувствительность для считываний между 15–240 п.о. с практическими несоответствиями. Очень быстро. Поддержка вставки и удаления. Работает с инструментами Illumina и SOLiD, а не с 454.Да (GUI), нет (CLI)Собственный, коммерческий

См. Также

Ссылки

Последняя правка сделана 2021-05-28 12:57:45
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте