Комбинаторная категориальная грамматика (CCG ) эффективно разборчивый, но лингвистически выразительный грамматический формализм. Он имеет прозрачный интерфейс между поверхностным синтаксисом и базовым семантическим представлением, включая структуру предиката-аргумента, количественную оценку и информационную структуру. Формализм генерирует структуры на основе контингентов (в отличие от структур на основе зависимостей) и, следовательно, является типом грамматики структуры фраз (в отличие от грамматики зависимостей ).
CCG опирается на комбинаторную логику, которая имеет ту же выразительную силу, что и лямбда-исчисление, но строит свои выражения по-другому. Первые лингвистические и психолингвистические аргументы в пользу построения грамматики на комбинаторах были выдвинуты Стидманом и Сабольчи. Более поздними видными сторонниками этого подхода являются Полин Якобсон и Джейсон Болдридж.
. Например, комбинатор B (композитор) полезен для создания зависимостей на большом расстоянии, например, "Как вы думаете, о ком говорит Мэри?" и комбинатор W (дубликатор) полезен в качестве лексической интерпретации возвратных местоимений, как в «Мэри говорит о себе». Вместе с I (тождественное отображение) и C (перестановщик) они образуют набор примитивных, взаимоопределимых комбинаторов. Якобсон интерпретирует личные местоимения как комбинатор I, и их связыванию помогает сложный комбинатор Z, как в «Мэри сбилась с пути». Z определяется с помощью W и B.
Формализм CCG определяет ряд комбинаторы (наиболее распространены применение, состав и набор). Они работают с синтаксически типизированными лексическими элементами с помощью доказательств стиля естественного вывода. Цель доказательства - найти способ применения комбинаторов к последовательности лексических элементов до тех пор, пока в доказательстве не останется неиспользованных лексических элементов. Тип, полученный после завершения доказательства, является типом всего выражения. Таким образом, доказательство того, что некоторая последовательность слов является предложением некоторого языка, равносильно доказательству того, что слова сводятся к типу S.
Синтаксический тип лексического элемента может быть либо примитивный тип, такой как S, N или NP, или сложный, такой как S \ NP или NP / N.
Сложные типы, схематизируемые как X / Y и X \ Y, обозначают типы функторов, которые принимают аргумент типа Y и возвращают объект типа X. Косая черта означает, что аргумент должен отображаться справа., а обратная косая черта означает, что аргумент должен появиться слева. Любой тип может заменять здесь X и Y, что делает синтаксические типы в CCG рекурсивной системой типов.
Комбинаторы приложений, часто обозначаемые>для прямого приложения и < for backward application, apply a lexical item with a functor type to an argument with an appropriate type. The definition of application is given as:
Комбинаторы композиции, Комбинаторы композиции часто обозначается для прямой композиции и для обратной композиции, аналогичны композиции функций из математики и могут быть определены следующим образом:
Комбинаторы повышения типа, часто обозначаемые как для прямого повышения типа и для обратного повышения типа принимает типы аргументов (обычно примитивные типы) для типов функторов, которые берут в качестве аргументов функторы, которые до повышения типа принимали бы их в качестве аргументов.
Предложение «собака укусила Джона» имеет ряд различных возможных доказательств. Ниже приведены некоторые из них. Разнообразие доказательств демонстрирует тот факт, что в CCG предложения не имеют единой структуры, как в других моделях грамматики.
Пусть типы этих лексических элементов будут
Мы можем выполнить простейшее доказательство (немного изменив обозначения для краткости) как:
Выбирая набор текста и сочиняя некоторые, мы могли бы получить полностью пошаговое доказательство слева направо. Возможность построить такое доказательство является аргументом в пользу психолингвистической правдоподобности CCG, потому что слушатели действительно создают частичные интерпретации (синтаксические и семантические) высказываний до того, как они будут завершены.
CCG, как известно, могут для создания языка ( который является неконтекстно-независимым индексированным языком ). Грамматику для этого языка можно найти в Vijay-Shanker and Weir (1994).
Vijay-Shanker and Weir (1994) демонстрирует, что линейная индексированная грамматика s, Комбинаторные категориальные грамматики, грамматики, примыкающие к дереву и главные грамматики являются слабо эквивалентными формализмами, поскольку все они определяют одни и те же строковые языки. Kuhlmann et al. (2015) показывают, что эта эквивалентность и способность CCG описывать , в решающей степени полагаться на способность ограничивать использование комбинаторных правил определенными категориями способами, не описанными выше.