Реализация (лингвистика)

редактировать

В лингвистике, реализация - это процесс, посредством которого какое-то представление поверхности получается из его базового представления; то есть способ, которым некоторый абстрактный объект лингвистического анализа появляется в реальном языке. Часто говорят, что фонемы реализуются звуками речи. Различные звуки, которые могут реализовывать конкретную фонему, называются ее аллофонами.

. Реализация также является подзадачей генерации естественного языка, которая включает создание фактического текста на человеческом языке (английский, французский, и т. д.) из синтаксического представления. Для реализации доступен ряд пакетов программного обеспечения, большинство из которых были разработаны академическими исследовательскими группами в NLG. Остальная часть статьи посвящена реализации такого рода.

Содержание
  • 1 Пример
  • 2 Обработка
  • 3 Системы
  • 4 Ссылки
  • 5 Внешние ссылки
Пример

Например, следующий Java код заставляет simplenlg system [2] распечатать текст Женщины не курят.:

NPPhraseSpec subject = nlgFactory.createNounPhrase ("the", "woman "); subject.setPlural (правда); Предложение SPhraseSpec = nlgFactory.createClause (тема, «дым»); предложение.setFeature (Feature.NEGATED, истина); System.out.println (realiser.realiseSentence (предложение));

В этом примере компьютерная программа определила лингвистические составляющие предложения (глагол, подлежащее), а также лингвистические особенности (субъект множественного числа, отрицание), и на основе этой информации реализатор построил фактическое предложение.

Обработка

Реализация включает три вида обработки:

Синтаксическая реализация : использование грамматических знаний для выбора флексий, добавления функциональных слов, а также для определения порядка компонентов. Например, в английском языке подлежащее обычно предшествует глаголу, а отрицательная форма дыма - не курить.

Морфологическая реализация : Вычисление склоняемых форм, например, множественная форма женщины - это женщина (не женщина).

Орфографическая реализация : Работа с регистром, пунктуацией и форматированием. Например, использование заглавной буквы The, потому что это первое слово предложения.

Приведенные выше примеры являются очень простыми, большинство реализаторов способны выполнять значительно более сложную обработку.

Системы

За последние 20 лет был разработан ряд реализаций. Эти системы различаются по сложности и изощренности обработки, надежности в работе с необычными случаями, а также по тому, получают ли они программный доступ через API или принимают ли они текстовое представление синтаксической структуры в качестве входных данных.

Существуют также существенные различия в прагматических факторах, таких как документация, поддержка, условия лицензирования, скорость и использование памяти и т. Д.

Здесь невозможно описать всех реализаций, но некоторые из них к новым областям относятся:

  • Simplenlg[3] : документ, реализующий движок с API, который предназначен для простоты изучения и использования, сосредоточен на ограничении области действия только нахождением области поверхности документ.
  • KPML [4] : это самый старый реализатор, который разрабатывался под разными видами с 1980-х годов. Он поставляется с грамматиками для десяти разных языков.
  • FUF / SURGE [5] : реализатор, который широко использовался в 1990-х годах и до сих пор используется в некоторых проектах
  • OpenCCG [6] : реализатор с открытым исходным кодом, который имеет ряд полезных функций, таких как возможность использовать статистические языковые модели для принятия решений о реализации.
Ссылки
Внешние ссылки
  • - ACL NLG Portal (содержит ссылки на вышеуказанные и многие другие реализации)
Последняя правка сделана 2021-06-03 10:03:27
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте