Концепция теории абстрактного языка
Обобщенная контекстно-свободная грамматика (GCFG) - это грамматический формализм, который расширяет контекстно-свободные грамматики, добавляя потенциально неконтекстно-свободную композицию функции для перезаписи правил. Головная грамматика (и ее слабые эквиваленты) является примером такой GCFG, которая, как известно, особенно хорошо справляется с широким спектром не-CF свойств естественного языка.
Содержание
- 1 Описание
- 2 Пример
- 3 Линейные системы перезаписи без контекста (LCFRS)
- 4 См. Также
- 5 Ссылки
Описание
A GCFG состоит из двух компонентов: набора функций композиции, которые объединяют строковые кортежи, и набора правил перезаписи. Все композиционные функции имеют вид , где - это либо однострочный кортеж, либо некоторое использование (потенциально другой) функции композиции, которая сводится к строковому кортежу. Правила перезаписи выглядят так: , где , ,... - строковые кортежи или нетерминальные символы.
Семантика перезаписи GCFG довольно проста. Появление нетерминального символа переписывается с использованием правил перезаписи, как в контекстно-свободной грамматике, что в конечном итоге дает только композиции (функции композиции, применяемые к строковым кортежам или другим композициям). Затем применяются функции композиции, последовательно сокращая кортежи до одного кортежа.
Пример
Простой перевод контекстно-свободной грамматики в GCFG может быть выполнен следующим образом. Учитывая грамматику в (1), которая порождает язык палиндрома , где - строка, обратная , мы можем определить композиционную функцию conc, как в (2a), и правила перезаписи, как в (2b).
| | (1) |
| | (2a) |
| | (2b) |
Производство CF для abbbba составляет
- S
- aSa
- abSba
- abbSbba
- abbbba
и соответствующая продукция GCFG равна
Линейные контекстно-свободные системы перезаписи (LCFRS)
Вейр (1988) описывает два свойства композиционных функций: линейность и регулярность. Функция, определяемая как является линейным тогда и только тогда, когда каждая переменная появляется не более одного раза по обе стороны от =, что делает линейный, но не . Функция, определяемая как является правильным, если левая и правая стороны имеют точно такие же переменные, что делает обычный, но не или .
Грамматика, в которой все функции композиции являются как линейными, так и регулярными, называется Линейной системой перезаписи без контекста (LCFRS). LCFRS - это надлежащий подкласс GCFG, то есть он имеет строго меньшую вычислительную мощность, чем GCFG в целом.
С другой стороны, LCFRS строго более выразительны, чем линейно-индексированные грамматики и их слабо эквивалентный вариант граммматик, примыкающих к дереву (TAG). Головная грамматика - еще один пример LCFRS, который строго менее эффективен, чем класс LCFRS в целом.
LCFRS слабо эквивалентны (локально установленным) многокомпонентным тегам (), а также (MCFG [1] ). и минималистские грамматики (MG). Языки, сгенерированные LCFRS (и их слабые эквиваленты), могут быть проанализированы за полиномиальное время.
См. Также
Ссылки
- ^ Weir, David Jeremy (сентябрь 1988 г.). Характеризация формально-зависимых грамматических формальностей (PDF) (Ph.D.). Бумага. AAI8908403. Университет Пенсильвании в Анн-Арборе.
- ^Лаура Каллмейер (2010). Анализ вне контекстно-свободных грамматик. Springer Science Business Media. п. 33. ISBN 978-3-642-14846-0.
- ^Лаура Каллмейер (2010). Анализ вне контекстно-свободных грамматик. Springer Science Business Media. п. 35-36. ISBN 978-3-642-14846-0.
- ^Йохан F.A.K. ван Бентем; Алиса тер Мёлен (2010). Справочник по логике и языку (2-е изд.). Эльзевир. п. 404. ISBN 978-0-444-53727-0.