машинный перевод на основе переноса - это тип машинного перевода (MT). В настоящее время это один из наиболее широко используемых методов машинного перевода. В отличие от более простой прямой модели МП, перенос МП разбивает перевод на три этапа: анализ текста на исходном языке для определения его грамматической структуры, перенос полученной структуры в структуру, подходящую для создания текста в целевой язык, и, наконец, создание этого текста. Таким образом, системы машинного перевода на основе передачи могут использовать знание исходного и целевого языков.
Машинный перевод на основе перевода и интерлингва имеет одну и ту же идею: чтобы сделать перевод, необходимо иметь промежуточное представление, которое фиксирует «значение» исходное предложение, чтобы получить правильный перевод. В МП на основе интерлингва это промежуточное представление должно быть независимым от рассматриваемых языков, тогда как в МП на основе передачи оно имеет некоторую зависимость от задействованной языковой пары.
Способы работы систем машинного перевода на основе переноса существенно различаются, но в целом они следуют одному шаблону: они применяют наборы лингвистических правил, которые определены как соответствия между структурой исходного языка и структурой языка целевой язык. Первый этап включает анализ входящего текста на предмет морфологии и синтаксиса (а иногда и семантики ) для создания внутреннего представления. Перевод создается из этого представления с использованием как двуязычных словарей, так и грамматических правил.
Эта стратегия перевода позволяет получать переводы довольно высокого качества с точностью около 90% (хотя это сильно зависит от рассматриваемой языковой пары, например, расстояния между ними).
В системе машинного перевода на основе правил исходный текст сначала анализируется морфологически и синтаксически, чтобы получить синтаксическое представление. Затем это представление может быть уточнено до более абстрактного уровня, делая акцент на частях, относящихся к переводу, и игнорируя другие типы информации. Затем процесс передачи преобразует это окончательное представление (все еще на исходном языке) в представление того же уровня абстракции на целевом языке. Эти два представления называются «промежуточными» представлениями. Из представления целевого языка этапы затем применяются в обратном порядке.
Перед получением окончательного результата можно использовать различные методы анализа и преобразования. Наряду с этими статистическими подходами могут быть дополнены генерирующие гибридные системы. Выбранные методы и акценты во многом зависят от конструкции системы, однако большинство систем включают как минимум следующие этапы:
Одной из основных особенностей систем машинного перевода на основе переноса является этап, на котором "переносится" промежуточное представление текста на исходном языке до промежуточного представления текста на целевом языке. Это может работать на одном из двух уровней лингвистического анализа или где-то посередине. Уровни: