Обобщенная контекстно-свободная грамматика

редактировать
Концепция теории абстрактного языка

Обобщенная контекстно-свободная грамматика (GCFG) - это грамматический формализм, который расширяет контекстно-свободные грамматики, добавляя потенциально неконтекстно-свободную композицию функции для перезаписи правил. Головная грамматика (и ее слабые эквиваленты) является примером такой GCFG, которая, как известно, особенно хорошо справляется с широким спектром не-CF свойств естественного языка.

Содержание
  • 1 Описание
  • 2 Пример
  • 3 Линейные системы перезаписи без контекста (LCFRS)
  • 4 См. Также
  • 5 Ссылки
Описание

A GCFG состоит из двух компонентов: набора функций композиции, которые объединяют строковые кортежи, и набора правил перезаписи. Все композиционные функции имеют вид f (⟨x 1,..., xm⟩, ⟨y 1,..., yn⟩,...) = γ {\ displaystyle f (\ langle x_ {1 },..., x_ {m} \ rangle, \ langle y_ {1},..., y_ {n} \ rangle,...) = \ gamma}{\ displaystyle f (\ langle x_ {1},..., x_ {m} \ rangle, \ langle y_ {1},..., y_ {n} \ rangle,...) = \ gamma} , где γ {\ displaystyle \ gamma}\ gamma - это либо однострочный кортеж, либо некоторое использование (потенциально другой) функции композиции, которая сводится к строковому кортежу. Правила перезаписи выглядят так: X → f (Y, Z,...) {\ Displaystyle X \ to f (Y, Z,...)}{\ displaystyle Икс \ к е (Y, Z,...)} , где Y {\ displaystyle Y}Y, Z {\ displaystyle Z}Z ,... - строковые кортежи или нетерминальные символы.

Семантика перезаписи GCFG довольно проста. Появление нетерминального символа переписывается с использованием правил перезаписи, как в контекстно-свободной грамматике, что в конечном итоге дает только композиции (функции композиции, применяемые к строковым кортежам или другим композициям). Затем применяются функции композиции, последовательно сокращая кортежи до одного кортежа.

Пример

Простой перевод контекстно-свободной грамматики в GCFG может быть выполнен следующим образом. Учитывая грамматику в (1), которая порождает язык палиндрома {ww R: w ∈ {a, b} ∗} {\ displaystyle \ {ww ^ {R}: w \ in \ {a, b \} ^ {*} \}}{\ displaystyle \ {ww ^ {R}: w \ in \ {a, б \} ^ {*} \}} , где w R {\ displaystyle w ^ {R}}{\ displaystyle w ^ {R}} - строка, обратная w {\ displaystyle w }w , мы можем определить композиционную функцию conc, как в (2a), и правила перезаписи, как в (2b).

S → ϵ | a S a | б S б {\ Displaystyle S \ к \ эпсилон ~ | ~ aSa ~ | ~ bSb}{\ displaystyle S \ to \ epsilon ~ | ~ aSa ~ | ~ bSb}

(1)

конц (⟨x⟩, ⟨y⟩, ⟨z⟩) = ⟨xyz⟩ {\ displaystyle conc (\ langle x \ rangle, \ langle y \ rangle, \ langle z \ rangle) = \ langle xyz \ rangle}{\ displaystyle conc (\ langle x \ rangle, \ langle y \ rangle, \ langle z \ rangle) = \ langle xyz \ rangle}

(2a)

S → conc (⟨ϵ⟩, ⟨ϵ⟩, ⟨ϵ ⟩) | c o n c (⟨a⟩, S, ⟨a⟩) | конц (⟨б⟩, S, ⟨б⟩) {\ displaystyle S \ to conc (\ langle \ epsilon \ rangle, \ langle \ epsilon \ rangle, \ langle \ epsilon \ rangle) ~ | ~ conc (\ langle a \ rangle, S, \ langle a \ rangle) ~ | ~ conc (\ langle b \ rangle, S, \ langle b \ rangle)}{\ Displaystyle S \ к conc (\ langle \ epsilon \ rangle, \ langle \ epsilon \ rangle, \ langle \ epsilon \ rangle) ~ | ~ conc (\ langle a \ rangle, S, \ langle a \ rangle) ~ | ~ conc (\ langle b \ rangle, S, \ langle b \ rangle)}

(2b)

Производство CF для abbbba составляет

S
aSa
abSba
abbSbba
abbbba

и соответствующая продукция GCFG равна

S → conc (⟨a⟩, S, ⟨a⟩) {\ displaystyle S \ to conc (\ langle a \ rangle S, \ langle a \ rangle)}{\ displaystyle S \ to conc (\ langle a \ rangle, S, \ langle a \ rangle)}
conc (⟨a⟩, conc (⟨b⟩, S, ⟨b⟩), ⟨a⟩) {\ displaystyle conc (\ langle a \ rangle, conc (\ langle b \ rangle, S, \ langle b \ rangle), \ langle a \ rangle)}{\ displaystyle conc (\ langle a \ rangle, conc (\ langle b \ rangle, S, \ langle b \ rangle), \ langle a \ rangle)}
conc (⟨a⟩, conc (⟨b⟩, conc (⟨b⟩, S, ⟨b⟩), ⟨ б⟩), ⟨a⟩) {\ displaystyle conc (\ langle a \ rangle, conc (\ langle b \ rangle, conc (\ langle b \ rangle, S, \ langle b \ rangle), \ langle b \ rangle), \ langle a \ rangle)}{\ displaystyle conc (\ langle a \ rangle, conc (\ langle b \ rangle, conc (\ langle b \ rangle, S, \ langle b \ rangle), \ langle b \ rangle), \ langle a \ rangle)}
conc (⟨a⟩, conc (⟨b⟩, conc (⟨b⟩, conc (⟨ϵ⟩, ⟨ϵ⟩, ⟨ϵ⟩), ⟨b⟩), ⟨) б⟩), ⟨a⟩) {\ Displaystyle conc (\ langle a \ rangle, conc (\ langle b \ rangle, conc (\ langle b \ rangle, conc (\ langle \ epsilon \ rangle, \ langle \ epsilon \ rangle, \ langle \ epsilon \ rangle), \ langle b \ rangle), \ langle b \ rangle), \ langle a \ rangle)}{\ displaystyle conc (\ langle a \ rangle, conc (\ langle b \ rangle, conc (\ langle b \ rangle, conc (\ langle \ epsilon \ rangle, \ langle \ epsilon \ rangle, \ langle \ epsilon \ rangle), \ langle b \ rangle), \ langle b \ rangle), \ langle a \ rangle)}
conc (⟨a⟩, conc (⟨b⟩, conc (⟨b⟩, ⟨ϵ⟩, ⟨b⟩), ⟨ б⟩), ⟨a⟩) {\ displaystyle conc (\ langle a \ rangle, conc (\ langle b \ rangle, conc (\ langle b \ rangle, \ langle \ epsilon \ rangle, \ langle b \ rangle), \ langle b \ rangle), \ langle a \ rangle)}{\ displaystyle conc (\ langle a \ rangle, conc (\ langle b \ rangle, conc (\ langle b \ rangle, \ langle \ epsilon \ rangle, \ langle b \ rangle), \ langle b \ rangle), \ langle a \ rangle)}
conc (⟨a⟩, conc (⟨b⟩, ⟨bb⟩, ⟨b⟩), ⟨a⟩) {\ displaystyle conc (\ langle a \ rangle, conc (\ langle b \ rangle, \ langle bb \ rangle, \ langle b \ rangle), \ langle a \ rangle)}{\ displaystyle conc (\ langle a \ rangle, conc (\ langle b \ rangle, \ langle bb \ rangle, \ langle b \ rangle), \ langle a \ rangle)}
conc (⟨a⟩, ⟨bbbb⟩, ⟨a⟩) {\ displaystyle conc (\ langle a \ rangle, \ langle bbbb \ rangle, \ langle a \ rangle)}{\ displaystyle conc (\ langle a \ rangle, \ langle bbbb \ rangle, \ langle a \ rangle)}
⟨abbbba⟩ {\ displaystyle \ langle abbbba \ rangle}{\ displaystyle \ langle abbbba \ rangle}
Линейные контекстно-свободные системы перезаписи (LCFRS)

Вейр (1988) описывает два свойства композиционных функций: линейность и регулярность. Функция, определяемая как f (x 1,..., X n) =... {\ displaystyle f (x_ {1},..., x_ {n}) =...}{\ displaystyle f (x_ {1},..., x_ {n}) =...} является линейным тогда и только тогда, когда каждая переменная появляется не более одного раза по обе стороны от =, что делает f (x) = g (x, y) {\ displaystyle f (x) = g (x, y)}{\ displaystyle f (x) = g (x, y)} линейный, но не f (x) = g (x, х) {\ Displaystyle е (х) = г (х, х)}{\ displaystyle f (x) = g (x, x)} . Функция, определяемая как f (x 1,..., X n) =... {\ displaystyle f (x_ {1},..., x_ {n}) =...}{\ displaystyle f (x_ {1},..., x_ {n}) =...} является правильным, если левая и правая стороны имеют точно такие же переменные, что делает f (x, y) = g (y, x) {\ displaystyle f (x, y) = g (y, x)}{\ displaystyle f (x, y) = g (y, x)} обычный, но не f (x) = g ( икс, y) {\ displaystyle f (x) = g (x, y)}{\ displaystyle f (x) = g (x, y)} или f (x, y) = g (x) {\ displaystyle f (x, y) = g (x)}{\ displaystyle f (x, y) = g (x)} .

Грамматика, в которой все функции композиции являются как линейными, так и регулярными, называется Линейной системой перезаписи без контекста (LCFRS). LCFRS - это надлежащий подкласс GCFG, то есть он имеет строго меньшую вычислительную мощность, чем GCFG в целом.

С другой стороны, LCFRS строго более выразительны, чем линейно-индексированные грамматики и их слабо эквивалентный вариант граммматик, примыкающих к дереву (TAG). Головная грамматика - еще один пример LCFRS, который строго менее эффективен, чем класс LCFRS в целом.

LCFRS слабо эквивалентны (локально установленным) многокомпонентным тегам (), а также (MCFG [1] ). и минималистские грамматики (MG). Языки, сгенерированные LCFRS (и их слабые эквиваленты), могут быть проанализированы за полиномиальное время.

См. Также
Ссылки
  1. ^ Weir, David Jeremy (сентябрь 1988 г.). Характеризация формально-зависимых грамматических формальностей (PDF) (Ph.D.). Бумага. AAI8908403. Университет Пенсильвании в Анн-Арборе.
  2. ^Лаура Каллмейер (2010). Анализ вне контекстно-свободных грамматик. Springer Science Business Media. п. 33. ISBN 978-3-642-14846-0.
  3. ^Лаура Каллмейер (2010). Анализ вне контекстно-свободных грамматик. Springer Science Business Media. п. 35-36. ISBN 978-3-642-14846-0.
  4. ^Йохан F.A.K. ван Бентем; Алиса тер Мёлен (2010). Справочник по логике и языку (2-е изд.). Эльзевир. п. 404. ISBN 978-0-444-53727-0.
Последняя правка сделана 2021-05-21 14:48:54
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте