Катена (лингвистика)

редактировать
Единица синтаксиса и морфологии

В лингвистике катена (английское произношение:, множественное число catenas или catenae ; от латинского для «цепи») - единица синтаксиса и морфологии, тесно связанных с грамматиками зависимостей. Это более гибкая и всеобъемлющая единица, чем составляющая, и поэтому она может лучше подходить, чем составляющая, для использования в качестве фундаментальной единицы синтаксического и морфосинтаксического анализа.

Катена служила в качестве основа для анализа ряда явлений синтаксиса, таких как идиосинкразическое значение, многоточие механизмы (например, пробел, удаление, VP-многоточие, псевдогэппинг, sluicing, многоточие в ответах, сравнительное удаление), предикат - аргумент структуры и разрывы (актуализация, wh-fronting, скремблирование, экстрапозиция и т. Д.). Концепция катены также была взята за основу теории морфосинтаксиса, то есть для расширения зависимостей в слова; Признаны зависимости между морфами, составляющими слова.

Хотя концепция катены применялась в основном к синтаксису английского языка, другие работы также демонстрируют ее применимость к синтаксису и морфологии других языков.

Содержание
  • 1 Описания и определения
  • 2 Четыре единицы
  • 3 История
  • 4 Идиосинкратический язык
    • 4.1 Некоторые словосочетания
    • 4.2 Правильные идиомы
  • 5 Многоточие
  • 6 Структуры предикатов и аргументов
  • 7 См. Также
  • 8 Примечания
  • 9 Ссылки
Описания и определения

Теперь даны два описания и два определения единицы катены.

Катена (повседневное описание)
Любое отдельное слово или любая комбинация слов, связанных между собой зависимостями.
Катена (теоретико-графическое описание)
С точки зрения теории графов, любое синтаксическое дерево или связный подграф дерева является катеной. Любой отдельный элемент (слово или морф) или комбинация элементов, связанных вместе в вертикальном измерении, является катеной. Предполагается, что структура предложения существует в двух измерениях. Комбинации, организованные по горизонтальному измерению (с точки зрения приоритета), называются цепочками, тогда как комбинации, организованные по вертикальному измерению (с точки зрения доминирования), являются катенами. В терминах декартовой системы координат, строки существуют вдоль оси x, а катены - вдоль оси y.
Catena (неформальное теоретико-графическое определение)
Любое отдельное слово или любая комбинация слов, которые являются непрерывными в вертикальном измерении, то есть относительно доминирования (ось Y).
Catena (формальное теоретико-графическое определение)
Для данного дерева зависимостей T катена - это множество S таких узлов в T, что есть один и только один член S, над которым не доминирует сразу какой-либо другой член S.
Иллюстрация морфовых катен
Четыре элемента

Понимание катены - это устанавливается путем различения катены и других, аналогичным образом определенных единиц. В этом отношении уместны четыре единицы (включая катену): строка, катена, компонент и составляющая. Неформальное определение катены повторяется для удобства сравнения с определениями трех других единиц:

Строка
Любой отдельный элемент или комбинация элементов, непрерывных в горизонтальном измерении (ось x).
Катена
Любой отдельный элемент или комбинация элементов, непрерывных в вертикальном измерении (ось Y).
Компонент
Любой отдельный элемент или комбинация элементов, которые образуют как строку, так и катену.
Компонент
Завершенный компонент.

Компонент считается завершенным, если он включает в себя все элементы, над которыми доминирует его корневой узел. Строка и катена очевидным образом дополняют друг друга, и определение составляющей по существу такое же, как и в большинстве теорий синтаксиса, где составляющая понимается как состоящая из любого узла плюс все узлы, над которыми этот узел доминирует. Эти определения теперь будут проиллюстрированы с помощью следующего дерева зависимостей. Заглавные буквы служат для сокращения слов:

Иллюстрация катены

Все отдельные строки, категории, компоненты и составляющие в этом дереве перечислены здесь:

Отдельные строки
A, B, C, D, E, F, AB, BC, CD, DE, EF, ABC, BCD, CDE, DEF, ABCD, BCDE, CDEF, ABCDE, BCDEF и ABCDEF.
Четкие категории
A, B, C, D, E, F, AB, BC, CF, DF, EF, ABC, BCF, CDF, CEF, DEF, ABCF, BCDF, BCEF, CDEF, ABCDF, ABCEF, BCDEF и ABCDEF.
Отдельные компоненты
A, B, C, D, E, F, AB, BC, EF, ABC, DEF, CDEF, BCDEF и ABCDEF.
Отдельные составляющие
A, D, E, AB, DEF и ABCDEF.

Обращает на себя внимание тот факт, что дерево содержит 39 различных словосочетаний, не являющихся катенами, например AC, BD, CE, BCE, ADF, ABEF, ABDEF и т. Д. Также обратите внимание, что есть всего шесть составляющих, но 24 катены. Таким образом, в дереве в четыре раза больше катен, чем составных частей. Становится очевидной инклюзивность и гибкость блока катены. Следующая диаграмма Венна дает обзор того, как эти четыре единицы соотносятся друг с другом:

Диаграмма Венна, которая иллюстрирует взаимосвязь между четырьмя ключевыми единицами синтаксиса и морфологии
История

Концепция катены присутствует в лингвистике уже несколько десятилетий. В 1970-е годы немецкий специалист по грамматике зависимости Юрген Кунце назвал эту единицу поддеревом Тейльбаума. В начале 1990-х годов психолингвисты Мартин Пикеринг и Гай Барри признали единицу катены, назвав ее составной частью зависимости. Однако концепция катены не вызывала особого интереса у лингвистов, пока Уильям О'Грэйди не заметил в своей статье 1998 года, что слова, образующие идиомы, хранятся в лексиконе как катены. О'Грэйди назвал соответствующую синтаксическую единицу цепочкой, но не катеной. Термин катена был введен позже Тимоти Осборном и его коллегами как средство избежать путаницы с существовавшей ранее концепцией цепочки минималистской теории. С тех пор концепция катены была развита за пределами анализа идиом О'Грэйди, чтобы служить основой для анализа ряда центральных явлений в синтаксисе естественных языков (например, многоточия и структур предикат-аргумент).

Идиосинкразический язык

Идиосинкразический язык всех видов может быть описан в терминах катен. Когда значение конструируется таким образом, что не позволяет признавать смысловые фрагменты в качестве составных частей, задействуется катена. Единицы, несущие значение, являются катенами, а не составными частями. Эта ситуация проиллюстрирована здесь с помощью различных словосочетаний и правильных идиом.

Некоторые словосочетания

Простые словосочетания (т. Е. Одновременное употребление определенных слов) хорошо демонстрируют концепцию катены. Идиосинкразический характер словосочетаний глаголов дает первую группу примеров: брать после, брать, брать, брать, брать и т. Д. В чистом виде глагол брать означает «захватить, захватить»., владеть '. Однако в этих сочетаниях с различными частицами значение take каждый раз значительно меняется в зависимости от частицы. Частица и take вместе передают различное значение, при этом это различное значение не может быть понято как прямое сочетание значения только take и значения одного предлога. В таких случаях говорят, что значение не композиционно. Некомпозиционный смысл можно уловить в терминах катен. Словосочетания, которые принимают некомпозиционное значение, образуют катены (но не составляющие):

четыре дубля дерева

Оба предложения a и b показывают, что хотя глагол и его частица не образуют составной части, они каждый раз образуют катену. Контраст порядка слов в предложениях каждой пары иллюстрирует то, что известно как сдвиг. Сдвиг происходит с учетом относительного веса задействованных компонентов. Тяжелые составляющие предпочитают появляться справа от более легких сестринских составляющих. Сдвиг не меняет того факта, что глагол и частица каждый раз образуют катену, даже если они не образуют строку.

Многочисленные комбинации глагола и предлога являются идиосинкразическими словосочетаниями, поскольку выбор предлога сильно ограничен глаголом, например учитывать, рассчитывать, заполнять, полагаться, принимать после, ждать и т. д. Значение многих из этих комбинаций также не композиционно, как и в случае глаголов частиц. Как и в случае с глаголами-частицами, комбинации образуют катены (но не составляющие) в простых повествовательных предложениях:

Комбинации глагол-предлог

Глагол и предлог, которые он требует, образуют единую смысловую единицу, посредством чего эта единица является катеной. Таким образом, эти смысловые единицы могут храниться как катены в ментальном лексиконе говорящих. Как катены, они представляют собой конкретные единицы синтаксиса.

Последний тип словосочетания, созданный здесь для иллюстрации катен, - это сложный предлог, например из-за, из-за, внутри, вопреки, вне, снаружи и т. д. Образец интонации для этих предлогов предполагает, что орфографические соглашения верны при написании их как двух (или более) слов. Эта ситуация, однако, может рассматриваться как проблема, поскольку неясно, можно ли каждый раз рассматривать два слова как составляющие. В этом отношении они, конечно, квалифицируются как катена, например

деревья глаголов частиц

Словосочетания, проиллюстрированные в этом разделе, сосредоточены в основном на предлогах и частицах, и поэтому они представляют собой лишь небольшой набор смысловых словосочетаний. Однако они довольно многозначительны. Кажется вероятным, что все смысловые словосочетания хранятся как катены в ментальном лексиконе пользователей языка.

Правильные идиомы

Полные идиомы - это канонические случаи несоставного значения. Фиксированные слова идиом не несут своего продуктивного значения, например возьми его за подбородок. Тот, кто «берет его на подбородок», на самом деле не испытывает никакого физического контакта со своим подбородком, а это означает, что подбородок не имеет своего нормального продуктивного значения и, следовательно, должен быть частью более широкого сочетания. Это более крупное словосочетание идиома, в данном случае состоящая из пяти слов. Хотя идиома может быть сохранена как составляющая ВП (и, следовательно, не является проблемой для теорий, основанных на составляющих), существует множество идиом, которые явно не могут быть сохранены как составляющие. Эти идиомы являются проблемой для теорий, основанных на конституентах, именно потому, что они не могут быть квалифицированы как составляющие. Однако они, конечно, квалифицируются как катены. Обсуждение здесь сосредоточено на этих идиомах, поскольку они особенно хорошо иллюстрируют ценность концепции катены.

Многие идиомы в английском языке состоят из глагола и существительного (и более), при этом существительное принимает обладателя, который индексируется вместе с подлежащим, и, таким образом, будет меняться в зависимости от подлежащего. Эти идиомы хранятся как катены, но явно не как составляющие, например

Идиомы 1

Подобные идиомы имеют более свободный обладатель, поскольку он не обязательно совпадает с индексом субъекта. Эти идиомы также хранятся как катены (но не как составные части), например

Катена: Идиомы 2

Следующие идиомы включают глагол, объект и как минимум один предлог. Снова должно быть очевидно, что фиксированные слова идиом никоим образом не могут рассматриваться как составляющие:

Идиомы 3

Следующие идиомы включают глагол и предложную фразу в то же время, когда объект свободен:

Идиомы 4

И следующие идиомы, включающие дитранзитивный глагол, включают второй объект в то же время, когда первый объект свободен:

Идиомы 5

Конечно, высказывания также являются идиоматическими. Когда в высказывании появляется наречие (или какое-либо другое дополнение), оно не является его частью. Тем не менее, слова из поговорки по-прежнему образуют катену:

Деревья высказываний
Эллипсис

Эллипсис механизмы (пробелы, разделение, VP-эллипсис, псевдогаппинг, фрагменты ответов, слияние, сравнительное удаление) исключают катены, в результате чего эти катены не входят в состав. Следующие ниже примеры иллюстрируют пробел :

Изображение с многоточием 1

Пункты a являются допустимыми примерами пробелов; материал с зазором соответствует катене зеленого цвета. Пункты b - неудачные попытки пробелов; они терпят неудачу, потому что материал с зазором не соответствует катене. Следующие ниже примеры иллюстрируют удаление. Многие лингвисты рассматривают зачистку как частное проявление разрыва, когда в предложении с разрывом / разделением остается только один остаток:

Изображение с многоточием 2

Пункты a являются приемлемыми примерами снятия изоляции, отчасти потому, что очищенный материал соответствует катене (выделено зеленым цветом). Пункты b снова терпят неудачу; они терпят неудачу, потому что очищенный материал не квалифицируется как катена. Следующие примеры иллюстрируют многоточие в ответах:

Многоточие, изображение 4

В каждом из допустимых фрагментов ответа (a – e) исключенный материал соответствует катене. Напротив, исключенный материал соответствует некатене в каждом из неприемлемых фрагментов ответа (f – h).

Предикат - структуры аргументов

Единица катены подходит для понимания предикатов и их аргументов - предикат - это присваиваемое свойство к аргументу или как отношение, которое устанавливается между аргументами. Данный предикат появляется в структуре предложения как катена, как и его аргументы. Стандартный матричный предикат в предложении состоит из содержательного глагола и потенциально одного или нескольких вспомогательных глаголов. Следующие примеры иллюстрируют, как предикаты и их аргументы проявляются в синонимичных предложениях в разных языках:

Первое изображение, иллюстрирующее структуры предиката-аргумента

Слова, выделенные зеленым цветом, являются основным предикатом, а слова красным цветом - аргументами этого предиката. Однословное предикат, сказанное в английском предложении слева, соответствует двухсловному предикату hat gesagt в немецком языке. Каждый показанный предикат и каждый из показанных его аргументов - это катена.

Следующий пример аналогичен, но на этот раз для пояснения используется французское предложение:

Второе изображение, иллюстрирующее структуры аргументов предиката

Предикаты матрицы снова отображаются зеленым цветом, а их аргументы - красным. Край зависимости со стрелкой отмечает добавочный элемент - это соглашение не использовалось в приведенных выше примерах. В этом случае основное сказуемое в английском языке состоит из двух слов, соответствующих одному слову во французском языке.

Следующие примеры дают представление о том, как основной предикат предложения остается катеной по мере увеличения количества вспомогательных глаголов:

Пред-аргумент 3

Предложение a содержит один вспомогательный глагол, предложение b - два и предложение c - три.. Внешний вид этих вспомогательных глаголов добавляет функциональную информацию к основному содержанию, обеспечиваемому глаголом содержания измененный. По мере добавления каждого дополнительного вспомогательного глагола предикат растет, а предикат catena получает связи.

При оценке подхода к структурам предикат – аргумент с точки зрения катен важно помнить, что составная единица грамматики структуры фразы гораздо менее полезна для характеристики реальных словосочетаний, которые квалифицируются как предикаты и их аргументы. Этот факт должен быть очевиден из приведенных здесь примеров, где словосочетания, выделенные зеленым цветом, не могут считаться составными частями в грамматиках структуры фраз.

См. Также
Примечания
Ссылки
  • О'Грэйди, В. 1998. Синтаксис идиом. Естественный язык и лингвистическая теория 16. 279–312.
  • Groß, T. 2014. Клитики в морфологии зависимости. В лингвистике сегодня Vol. 215: Зависимая лингвистика, изд. Э. Гайчова и др., стр. 229–252. Амстердам / Филадельфия: Издательство Джона Бенджамина.
  • Гросс, Т. и Т. Осборн, 2013. Katena und Konstruktion: Ein Vorschlag zu einer dependenziellen Konstruktionsgrammatik. Zeitschrift für Sprachwissenschaft 32, 1, 41–73.
  • Imrényi, A. 2013a. Синтаксис венгерских вспомогательных средств: учетная запись грамматики зависимостей. Труды Второй Международной конференции по лингвистике зависимостей (DepLing 2013). Прага, 27–30 августа 2013 г. Карлов университет в Праге / Матфизпресс. 118–127.
  • Имреньи А. 2013б. A magyar mondat viszonyhálózati modellje. (Модель реляционной сети венгерского предложения.) Будапешт: Akadémiai Kiadó. (154 стр.).
  • Имреньи, А. 2013c. Избирательный округ или зависимость? Заметки о синтаксической модели венгерского языка Самуэля Брассая. В: Szigetvári, Péter (ed.), VLlxx. Документы, представленные Ласло Варге в день его 70-летия. Будапешт: Тинта. 167–182.
  • Kunze, J. 1975. Abhängigkeitsgrammatik. Studia Grammatica XII. Берлин: Akademie Verlag.
  • Osborne, T. 2005. Помимо составляющих: DG-анализ цепей. Folia Linguistica 39, 3–4. 251–297.
  • Осборн, Т. 2012. Краевые особенности, категории и минимализм на основе зависимостей. Лингвистический анализ 34, 3–4, 321–366.
  • Осборн, Т. 2014. Грамматика зависимостей. В Справочнике по синтаксису Routledge, изд. А. Карни, Я. Сато и Д. Саддики, стр. 604–626. Лондон: Рутледж.
  • Осборн, Т. 2015. Грамматика зависимостей. В Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science (HSK) 42, 2, 1027–1044.
  • Osborne, T. 2019. Ellipsis in Dependency Grammar. В Jeroen van Craenenbrock и Tanja Temmerman (ред.), The Oxford Handbook of Ellipsis, 142–161. Оксфорд, Великобритания: Oxford University Press.
  • Osborne, T. 2019. Грамматика зависимостей английского языка: введение и не только. Амстердам: Джон Бенджаминс. https://doi.org/10.1075/z.224
  • Осборн, Т. и Т. Грос, 2012a. Конструкции являются катенами: строительная грамматика встречается с грамматикой зависимостей. Когнитивная лингвистика 23, 1, 163–214.
  • Осборн, Т. и Т. Грос, 2012b. Антецедентное сдерживание: решение грамматики зависимостей в терминах катен. Studia Linguistica 66, 2, 94–127.
  • Осборн, Т. и Т. Гросс. 2016. Самодиагностика: против конечных ВП и для плоских не конечных ВП. Folia Linguistica 50, 1, 97–35.
  • Осборн, Т. и Т. Гросс. 2018. Фрагменты ответов. The Linguistic Review 35, 1, 161–186.
  • Осборн Т., М. Патнэм и Т. Гросс. 2011. Простая структура фраз, деревья без меток и синтаксис без спецификаторов: становится ли минимализм грамматикой зависимостей? The Linguistic Review 28: 315–364.
  • Осборн, Т., М. Патнэм и Т. Грос, 2012. Катены: введение в новую единицу синтаксического анализа. Синтаксис 15, 4, 354–396.
  • Пикеринг, М. и Дж. Барри, 1993. Категориальная грамматика зависимостей и координация. Linguistics 31, 855–902.
На Викискладе есть материалы, связанные с Catena (лингвистика).
Последняя правка сделана 2021-05-14 12:08:36
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте