Комбинаторная категориальная грамматика

редактировать

Абстрактный грамматический формализм

Комбинаторная категориальная грамматика (CCG ) эффективно разборчивый, но лингвистически выразительный грамматический формализм. Он имеет прозрачный интерфейс между поверхностным синтаксисом и базовым семантическим представлением, включая структуру предиката-аргумента, количественную оценку и информационную структуру. Формализм генерирует структуры на основе контингентов (в отличие от структур на основе зависимостей) и, следовательно, является типом грамматики структуры фраз (в отличие от грамматики зависимостей ).

CCG опирается на комбинаторную логику, которая имеет ту же выразительную силу, что и лямбда-исчисление, но строит свои выражения по-другому. Первые лингвистические и психолингвистические аргументы в пользу построения грамматики на комбинаторах были выдвинуты Стидманом и Сабольчи. Более поздними видными сторонниками этого подхода являются Полин Якобсон и Джейсон Болдридж.

. Например, комбинатор B (композитор) полезен для создания зависимостей на большом расстоянии, например, "Как вы думаете, о ком говорит Мэри?" и комбинатор W (дубликатор) полезен в качестве лексической интерпретации возвратных местоимений, как в «Мэри говорит о себе». Вместе с I (тождественное отображение) и C (перестановщик) они образуют набор примитивных, взаимоопределимых комбинаторов. Якобсон интерпретирует личные местоимения как комбинатор I, и их связыванию помогает сложный комбинатор Z, как в «Мэри сбилась с пути». Z определяется с помощью W и B.

Содержание

1 Части формализма
- 1.1 Синтаксические типы
- 1.2 Комбинаторы приложений
- 1.3 Комбинаторы композиции
- 1.4 Комбинаторы повышения типа
2 Пример
3 Формальные свойства
4 См. Также
5 Ссылки
6 Дополнительная литература
7 Внешние ссылки

Части формализма

Формализм CCG определяет ряд комбинаторы (наиболее распространены применение, состав и набор). Они работают с синтаксически типизированными лексическими элементами с помощью доказательств стиля естественного вывода. Цель доказательства - найти способ применения комбинаторов к последовательности лексических элементов до тех пор, пока в доказательстве не останется неиспользованных лексических элементов. Тип, полученный после завершения доказательства, является типом всего выражения. Таким образом, доказательство того, что некоторая последовательность слов является предложением некоторого языка, равносильно доказательству того, что слова сводятся к типу S.

Синтаксические типы

Синтаксический тип лексического элемента может быть либо примитивный тип, такой как S, N или NP, или сложный, такой как S \ NP или NP / N.

Сложные типы, схематизируемые как X / Y и X \ Y, обозначают типы функторов, которые принимают аргумент типа Y и возвращают объект типа X. Косая черта означает, что аргумент должен отображаться справа., а обратная косая черта означает, что аргумент должен появиться слева. Любой тип может заменять здесь X и Y, что делает синтаксические типы в CCG рекурсивной системой типов.

Комбинаторы приложений

Комбинаторы приложений, часто обозначаемые>для прямого приложения и < for backward application, apply a lexical item with a functor type to an argument with an appropriate type. The definition of application is given as:

α: X / Y β: Y α β: X>{\ displaystyle {\ dfrac {\ alpha: X / Y \ qquad \ beta: Y} {\ alpha \ beta: X}}>}

{\ dfrac {\ alpha: X / Y \ qquad \ beta: Y} {\ alpha \ beta: X }}>

β: Y α: X ∖ Y β α: X < {\displaystyle {\dfrac {\beta :Y\qquad \alpha :X\backslash Y}{\beta \alpha :X}}<}

{\ dfrac {\ beta: Y \ qquad \ alpha: X \ backslash Y} {\ beta \ alpha: X}} <

Комбинаторы композиции

Комбинаторы композиции, Комбинаторы композиции часто обозначается $B>{\ displaystyle B _ {>}}$ $B_{>}$ для прямой композиции и $B < {\displaystyle B_{<}}$ $B _ {<}$ для обратной композиции, аналогичны композиции функций из математики и могут быть определены следующим образом:

α: X / Y β: Y / Z α β: X / ZB>{\ displaystyle {\ dfrac {\ alpha: X / Y \ qquad \ beta: Y / Z} {\ alpha \ beta: X / Z}} B _ {>}}

{\dfrac {\alpha :X/Y\qquad \beta :Y/Z}{\alpha \beta :X/Z}}B_{>}

β: Y ∖ Z α: X ∖ Y β α: X ∖ ZB < {\displaystyle {\dfrac {\beta :Y\backslash Z\qquad \alpha :X\backslash Y}{\beta \alpha :X\backslash Z}}B_{<}}

{\ dfrac {\ beta: Y \ backslash Z \ qquad \ alpha: X \ backslash Y} {\ beta \ alpha: X \ backslash Z}} B _ {<}

Наборные комбинаторы

Комбинаторы повышения типа, часто обозначаемые как $T>{\ displaystyle T _ {>}}$ $T_{>}$ для прямого повышения типа и $T < {\displaystyle T_{<}}$ $T _ {<}$ для обратного повышения типа принимает типы аргументов (обычно примитивные типы) для типов функторов, которые берут в качестве аргументов функторы, которые до повышения типа принимали бы их в качестве аргументов.

α: Икс α: T / (T ∖ X) T>{\ displaystyle {\ dfrac {\ alpha: X} {\ alpha: T / (T \ backslash X)}} T _ {>}}

{\dfrac {\alpha :X}{\alpha :T/(T\backslash X)}}T_{>}

α : X α: T ∖ (T / X) T < {\displaystyle {\dfrac {\alpha :X}{\alpha :T\backslash (T/X)}}T_{<}}

{\ dfrac {\ alpha: X} {\ alpha: T \ backslash (T / X)}} T _ {<}

Пример

Предложение «собака укусила Джона» имеет ряд различных возможных доказательств. Ниже приведены некоторые из них. Разнообразие доказательств демонстрирует тот факт, что в CCG предложения не имеют единой структуры, как в других моделях грамматики.

Пусть типы этих лексических элементов будут

: NP / N dog: N John: NP бит: (S ∖ NP) / NP {\ displaystyle {\ text {the}}: NP / N \ qquad {\ text {dog}}: N \ qquad {\ text {John}}: NP \ qquad {\ text {bit}} :( S \ backslash NP) / NP}

{\ displaystyle {\ text {the}}: NP / N \ qquad {\ text {dog}}: N \ qquad {\ текст {Джон}}: NP \ qquad {\ text {bit}} :( S \ обратная косая черта NP) / NP}

Мы можем выполнить простейшее доказательство (немного изменив обозначения для краткости) как:

NP / N dog NNP>бит (S ∖ NP) / NP Джон NPS ∖ NP>S < {\displaystyle {\dfrac {{\dfrac {{\dfrac {\text{the}}{NP/N}}\qquad {\dfrac {\text{dog}}{N}}}{NP}}>\ qquad {\ dfrac {{\ dfrac {\ text {bit}} {(S \ backslash NP) / NP}} \ qquad {\ dfrac {\ tex t {John}} {NP}}} {S \ backslash NP}}>} {S}} <}

{\dfrac {{\dfrac {{\dfrac {\text{the}}{NP/N}}\qquad {\dfrac {\text{dog}}{N}}}{NP}}>\ qquad {\ dfrac {{\ dfrac {\ text {bit}} {(S \ backslash NP) / NP}} \ qquad {\ dfrac {\ text {John}} {NP}}} {S \ backslash NP}}>} {S}} <

Выбирая набор текста и сочиняя некоторые, мы могли бы получить полностью пошаговое доказательство слева направо. Возможность построить такое доказательство является аргументом в пользу психолингвистической правдоподобности CCG, потому что слушатели действительно создают частичные интерпретации (синтаксические и семантические) высказываний до того, как они будут завершены.

NP / N собака NNP>S / (S ∖ NP) T>бит (S ∖ NP) / NPS / NPB>John NPS>{\ displaystyle {\ dfrac {{\ dfrac {{\ dfrac {{\ dfrac {{\ dfrac {\ text {the}} {NP / N}} {\ dfrac {\ text {dog}} {N}} \ qquad} {NP}}>} {S / (S \ обратная косая черта NP) }} T _ {>} \ qquad {\ dfrac {\ text {bit}} {(S \ backslash NP) / NP}}} {S / NP}} B _ {>} \ qquad {\ dfrac {\ text {Джон }} {NP}}} {S}}>}

${\dfrac {{\dfrac {{\dfrac {{\dfrac {{\dfrac {\text{the}}{NP/N}}{\dfrac {\text{dog}}{N}}\qquad }{NP}}>} {S / (S \ backslash NP)}} T _ {>} \ qquad {\ dfrac {\ text {bit}} {(S \ backslash NP) / NP}}} {S / NP}} B _ {>} \ qquad {\ dfrac {\ text {John}} {NP}}} {S}}>$

Формальные свойства

CCG, как известно, могут для создания языка $anbncndn: n ≥ 0 {\ displaystyle {a ^ {n} b ^ {n} c ^ {n} d ^ {n}: n \ geq 0}}$ ${a ^ {n} b ^ { n} c ^ {n} d ^ {n}: n \ geq 0}$ ( который является неконтекстно-независимым индексированным языком ). Грамматику для этого языка можно найти в Vijay-Shanker and Weir (1994).

Vijay-Shanker and Weir (1994) демонстрирует, что линейная индексированная грамматика s, Комбинаторные категориальные грамматики, грамматики, примыкающие к дереву и главные грамматики являются слабо эквивалентными формализмами, поскольку все они определяют одни и те же строковые языки. Kuhlmann et al. (2015) показывают, что эта эквивалентность и способность CCG описывать $anbncndn {\ displaystyle {a ^ {n} b ^ {n} c ^ {n} d ^ {n}}}$ ${\ displaystyle {a ^ {n} b ^ {n} c ^ {n} d ^ {n}}}$ , в решающей степени полагаться на способность ограничивать использование комбинаторных правил определенными категориями способами, не описанными выше.

См. Также

Ссылки

Болдридж, Джейсон (2002), «Лексически определенная производная Контроль в категориальной комбинаторной грамматике. " Кандидатская диссертация. Univ. Эдинбурга.
Карри, Хаскелл Б. и Ричард Фейс (1958), Combinatory Logic, Vol. 1. Северная Голландия.
Якобсон, Полин (1999), «К семантике без переменных ». Linguistics and Philosophy 22, 1999. 117–184
Стидман, Марк (1987), «Комбинаторные грамматики и паразитические пробелы ». Естественный язык и лингвистическая теория 5, 403–439.
Стидман, Марк (1996), Структура поверхности и интерпретация. The MIT Press.
Стидман, Марк (2000), Синтаксический процесс. The MIT Press.
Сабольчи, Анна (1989), «Связанные переменные в синтаксисе (есть ли какие-нибудь?).» Семантика и контекстное выражение, под ред. Барчем, ван Бентемом и ван Эмде Боасом. Foris, 294–318.
Сабольчи, Анна (1992), «Комбинаторная грамматика и проекция из лексикона ». Лексические вопросы. CSLI Lecture Notes 24, ed. Сага и Сабольчи. Стэнфорд, CSLI Publications. 241–269.
Сабольчи, Анна (2003), «Связывание на лету: анафора с перекрестными предложениями в семантике без переменных ». Чувствительность к ресурсам в связывании и анафоре, под ред. Авторы Kruijff и Oehrle. Kluwer, 215–229.

Дополнительная литература

Майкл Мортгат, Логика категориального типа, глава вторая в книге Дж. Ван Бентема и А. тер Мейлена (ред.) «Справочник по логике и языку». Elsevier, 1997, ISBN 0-262-22053-9
homepages.inf.ed.ac.uk

Внешние ссылки

Сайт комбинаторной категориальной грамматики
( вероятно, будет более современным, чем этот)
Семантический анализ с комбинаторными категориальными грамматиками - Учебное пособие, описывающее общие принципы построения семантических анализаторов