Машинный перевод на основе переноса

редактировать
Пирамида Бернара Вокуа, показывающая сравнительную глубину посредничества представление с межъязыковым машинным переводом на пике, за которым следует перевод на основе переноса, затем прямой перевод.

машинный перевод на основе переноса - это тип машинного перевода (MT). В настоящее время это один из наиболее широко используемых методов машинного перевода. В отличие от более простой прямой модели МП, перенос МП разбивает перевод на три этапа: анализ текста на исходном языке для определения его грамматической структуры, перенос полученной структуры в структуру, подходящую для создания текста в целевой язык, и, наконец, создание этого текста. Таким образом, системы машинного перевода на основе передачи могут использовать знание исходного и целевого языков.

Содержание
  • 1 Дизайн
  • 2 Эксплуатация
  • 3 Анализ и преобразование
  • 4 Типы передачи
  • 5 Ссылки
  • 6 См. Также
Дизайн

Машинный перевод на основе перевода и интерлингва имеет одну и ту же идею: чтобы сделать перевод, необходимо иметь промежуточное представление, которое фиксирует «значение» исходное предложение, чтобы получить правильный перевод. В МП на основе интерлингва это промежуточное представление должно быть независимым от рассматриваемых языков, тогда как в МП на основе передачи оно имеет некоторую зависимость от задействованной языковой пары.

Способы работы систем машинного перевода на основе переноса существенно различаются, но в целом они следуют одному шаблону: они применяют наборы лингвистических правил, которые определены как соответствия между структурой исходного языка и структурой языка целевой язык. Первый этап включает анализ входящего текста на предмет морфологии и синтаксиса (а иногда и семантики ) для создания внутреннего представления. Перевод создается из этого представления с использованием как двуязычных словарей, так и грамматических правил.

Эта стратегия перевода позволяет получать переводы довольно высокого качества с точностью около 90% (хотя это сильно зависит от рассматриваемой языковой пары, например, расстояния между ними).

Операция

В системе машинного перевода на основе правил исходный текст сначала анализируется морфологически и синтаксически, чтобы получить синтаксическое представление. Затем это представление может быть уточнено до более абстрактного уровня, делая акцент на частях, относящихся к переводу, и игнорируя другие типы информации. Затем процесс передачи преобразует это окончательное представление (все еще на исходном языке) в представление того же уровня абстракции на целевом языке. Эти два представления называются «промежуточными» представлениями. Из представления целевого языка этапы затем применяются в обратном порядке.

Анализ и преобразование

Перед получением окончательного результата можно использовать различные методы анализа и преобразования. Наряду с этими статистическими подходами могут быть дополнены генерирующие гибридные системы. Выбранные методы и акценты во многом зависят от конструкции системы, однако большинство систем включают как минимум следующие этапы:

  • Морфологический анализ . Поверхностные формы входного текста подразделяются на части речи (например, существительное, глагол и т. Д.) И подкатегории (число, род, время и т. Д.). Все возможные "анализы" для каждой формы поверхности обычно выводятся на этом этапе вместе с леммой слова.
  • Лексическая категоризация . В любом данном тексте некоторые слова могут иметь более одного значения, вызывая двусмысленность в анализе. Лексическая категоризация смотрит на контекст слова, чтобы попытаться определить правильное значение в контексте ввода. Это может включать тегирование части речи и устранение неоднозначности словесного смысла.
  • Лексический перенос . Это в основном словарный перевод; лемма исходного языка (возможно, со смысловой информацией) ищется в двуязычном словаре и выбирается перевод.
  • Структурный перенос . В то время как предыдущие этапы имеют дело со словами, этот этап имеет дело с более крупными составляющими, например фразами и фрагментами. Типичные особенности этого этапа включают соответствие пола и числа, а также изменение порядка слов или словосочетаний.
  • Морфологическая генерация . На основе результатов этапа структурного переноса генерируются поверхностные формы целевого языка.
Типы переноса

Одной из основных особенностей систем машинного перевода на основе переноса является этап, на котором "переносится" промежуточное представление текста на исходном языке до промежуточного представления текста на целевом языке. Это может работать на одном из двух уровней лингвистического анализа или где-то посередине. Уровни:

  • Поверхностный перенос (или синтаксический) . Этот уровень характеризуется переносом «синтаксических структур» между исходным и целевым языками. Он подходит для языков одной семьи или одного типа, например, для романских языков между испанским, каталонским, французским, итальянским и т. Д.
  • Глубокий перенос (или семантический) . Этот уровень создает семантическое представление, зависящее от исходного языка. Это представление может состоять из ряда структур, представляющих смысл. В этих системах передачи обычно создаются предикаты. Перевод также обычно требует структурного переноса. Этот уровень используется для перевода между более отдаленными родственными языками (например, испанско-английский или испанско-баскский и т. Д.)
Ссылки
См. Также
Последняя правка сделана 2021-06-11 09:46:28
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте