Apertium-tolk, простой настольный пользовательский интерфейс для Apertium, который переводится как пользовательский ввод | |
Стабильный выпуск | 3.6.1 / 24 октября 2019 г.; 11 месяцев назад (24.10.2019) |
---|---|
Репозиторий | github.com / apertium |
Написано на | C ++ |
Операционная система | POSIX-совместимая и Windows NT (ограниченная поддержка) |
Доступно на | 35 языках, см. ниже |
Тип | Машинный перевод на основе правил |
Лицензия | Стандартная общественная лицензия GNU |
Веб-сайт | www.apertium.org |
Apertium - это free/open-source машина на основе правил перевод платформа. Это бесплатное программное обеспечение, выпущенное в соответствии с условиями Стандартной общественной лицензии GNU.
Apertium - это система с мелким переносом машинного перевода, которая использует преобразователи конечного состояния для всех своих лексических преобразований, и скрытые марковские модели для тегирования части речи или устранения неоднозначности категории слова. Тегеры грамматики ограничений также используются для некоторых языковых пар (например, бретонский - французский ).
Существующие системы машинного перевода, доступные в настоящее время, в основном коммерческие или используют проприетарные технологии, что затрудняет их адаптацию к новым условиям использования; кроме того, они используют разные технологии в языковых парах, что очень затрудняет, например, их интеграцию в единый многоязычный система управления контентом.
Apertium использует не зависящую от языка спецификацию, чтобы упростить участие в Apertium, повысить эффективность разработки и увеличить общий рост проекта.
В настоящее время, Apertium выпустил 40 стабильных языковых пар, обеспечивающих быстрый перевод с разумно понятными результатами (ошибки легко исправляются). Являясь проектом с открытым исходным кодом, Apertium предоставляет потенциальным разработчикам инструменты для создания собственной языковой пары и содействия проект.
Apertium возник как одна из машин машинного перевода в проекте, который финансировался испанским правительством и разработан исследовательской группой Transducens в Universitat d'Alacant. Первоначально он был разработан для перевода между тесно связанными языками, хотя недавно он был расширен для обработки более расходящихся языковых пар. Чтобы создать новую систему машинного перевода, достаточно разработать лингвистические данные (словари, правила) в четко определенных форматах XML.
Языковые данные, разработанные для него (в сотрудничестве с Universidade de Vigo, Universitat Politècnica de Catalunya и Universitat Pompeu Fabra ) в настоящее время поддержка (в стабильной версии) арабский, арагонский, астурийский, баскский, белорусский, Бретон, болгарский, каталонский, крымскотатарский, датский, английский, эсперанто, французский, галисийский, хинди, исландский, индонезийский, итальянский, казах, македонский, малазийский, мальтийский, северносаамский, норвежский (букмол и нюнорск ), окситанский, польский, португальский, румынский, русский, сардинский, сербохорватский, силезский, словенский, испанский, шведский, татарский, украинский, ур du и валлийский языки. Полный список доступен ниже. Несколько компаний также участвуют в разработке Apertium, в том числе, и.
Проект принимал участие в редакциях Google Summer of Code 2009, 2010, 2011, 2012, 2013 и 2014 годов, а также в редакциях 2010, 2011, 2012, 2013, 2014, 2015, Выпуски 2016 и 2017 годов Google Code-In.
Это общий пошаговый обзор того, как работает Apertium.
На диаграмме показаны шаги, предпринимаемые Apertium для перевода текста исходного языка (текста, который мы хотим перевести) в текст целевого языка (переведенный текст).
Список стабильных на данный момент языковых пар, наведите указатель мыши на коды языков, чтобы увидеть языки, которые они представляют.
af | ar | an | ast | eu | br | bg | ca | da | nl | en | eo | fr | gl | hin | is | id | it | kaz | mk | ms | mt | sme | nb | nn | oc | pt | ro | sc | hbs | slv | es | sv | тат | urd | cy | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
африкаанс | — | нет | нет | нет | нет | нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Арабский | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (←) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Арагонский | Нет | Нет | — | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет |
Астурийский | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет |
Баскский язык | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Да (→) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (→) | Нет | Нет | Нет | Нет |
Бретонский | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Да (→) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Болгарский | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Каталонский | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | — | Нет | Нет | Да (⇄) | Да (→) | Да s (⇄) | Нет | Нет | Нет | Нет | Да (←) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Да (⇄) | Нет | Да (→) | Нет | Нет | Да ( ⇄) | Нет | Нет | Нет | Нет |
Датский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Да ( ⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (←) | Нет | Нет | Нет |
Голландский | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Английский | Нет | Нет | Нет | Нет | Да (←) | Нет | Нет | Да (⇄) | Нет | Нет | — | Да (⇄) | Нет | Да (⇄) | Нет | Да (←) | Нет | Нет | Нет | Да (←) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (←) | Нет | Да (⇄) | Нет | Нет | Нет | Да (←) |
Эсперанто | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (←) | Нет | Нет | Да (⇄) | — | Да (←) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (←) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Французский | Нет | Нет | Нет | Нет | Нет | Да (←) | Нет | Да (⇄) | Нет | Нет | Нет | Да (→) | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (→) | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет |
Галисийский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет |
Хинди | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет |
Исландский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (→) | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет |
индонезийский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Итальянский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (→) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (→) | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Казах | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет |
Македонский | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Да (→) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (←) | Нет | Нет | Нет | Нет | Нет | Нет |
Малазийский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Мальтийский | Нет | Да (→) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Северные саамы | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Да (→) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Норвежский (букмол ) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (←) | — | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Норвежский (нюнорск ) | нет | нет | нет | нет | нет | нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Окситан | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | Да (←) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет |
Португальский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет |
Румынский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Да (←) | Нет | Нет | Нет | Нет |
Сардинский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (←) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (←) | Нет | Н o | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
сербохорватский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (→) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да ( →) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Да (⇄) | Нет | Нет | Нет | Нет | Нет |
Словенский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | — | Нет | Нет | Нет | Нет | Нет |
Испанский | Нет | Нет | Да (⇄) | Да (⇄) | Да (←) | Нет | Нет | Да (⇄) | Нет | Нет | Да (⇄) | Да (→) | Да (⇄) | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Да (⇄) | Да (←) | Нет | Нет | Нет | — | Нет | Нет | Нет | Нет |
Испанский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (→) | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет | Нет |
Татарский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет | Нет |
Урду | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (⇄) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — | Нет |
Валлийский | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Да (→) | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | — |
(Все услуги основаны на движке Apertium)