Hapax legomenon

редактировать
График частоты рангов для слов в романе Моби-Дик. Около 44% различных слов в этом романе, таких как «супружеский», встречаются только один раз, как и hapax legomen (красный). Около 17%, такие как «ловкость», появляются дважды (так называемые «дизомены», выделены синим цветом). Закон Ципфа предсказывает, что слова на этом графике должны приближаться к прямой линии с наклоном -1.

В корпусной лингвистике hapax legomenon (также или ; мн. Hapax legomen; иногда сокращенно hapax) - это слово, которое встречается только один раз в контексте, либо в письменной записи всего языка, в работах автора, либо в отдельном тексте. Этот термин иногда неправильно используется для описания слова, которое встречается только в одной из работ автора, но более одного раза в этой конкретной работе. Hapax legomenon - это транслитерация греческого ἅπαξ λεγόμενον, что означает «(что-то), сказанное (только) один раз».

Связанные термины dis legomenon, tris legomenon и tetrakis legomenon соответственно (,, ) относятся к двойным, тройным или учетверенным вхождениям, но используются гораздо реже.

Легомены Hapax довольно распространены, что и предсказывается законом Ципфа, который гласит, что частота любого слова в корпусе обратно пропорциональна его рангу в частоте Таблица. Для больших корпусов от 40% до 60% слов являются hapax legomen, а еще от 10% до 15% являются отклонениями. Таким образом, в Brown Corpus американского английского языка около половины из 50 000 различных слов являются hapax legomen в этом корпусе.

Hapax legomenon относится к появлению слова в тексте, а не на его происхождение или распространенность в речи. Таким образом, оно отличается от одноразового слова, которое может никогда не быть записано, может иметь ценность и может быть широко записано, или может несколько раз появляться в произведении, которое его чеканило, и так далее.

Содержание

  • 1 Значение
  • 2 Информатика
  • 3 Примеры
    • 3.1 Арабские примеры
    • 3.2 Китайские и японские символы
    • 3.3 Примеры на английском языке
    • 3.4 Примеры на немецком языке
    • 3.5 Древнегреческие примеры
    • 3.6 Примеры на иврите
    • 3.7 Ирландский пример
    • 3.8 Итальянские примеры
    • 3.9 Латинские примеры
    • 3.10 Славянские примеры
  • 4 В популярной культуре
  • 5 См. Также
  • 6 Ссылки
  • 7 Внешние ссылки

Значение

Workman'sPaulineHapaxes.svg Workman'sShakespearePlays.svg

Легомены Hapax в древних текстах обычно трудно расшифровать, поскольку легче вывести значение из нескольких контекстов, чем из одного. Например, многие из оставшихся нерасшифрованных глифов майя являются hapax legomen, а библейские (особенно иврит ; см. § Примеры на иврите) hapax legomen иногда создают проблемы при переводе. Легомены Hapax также создают проблемы при обработке естественного языка.

Некоторые ученые считают, что легомены Hapax полезны при определении авторства письменных работ., в "Проблема пастырских посланий" (1921) сделал hapax legomen популярным среди библеистов, когда он утверждал, что их значительно больше в трех пастырских посланиях, чем в других Послания Павла. Он утверждал, что количество hapax legomen в корпусе предполагаемого автора указывает на его или ее словарный запас и характерно для автора как личности.

Теория Харрисона потеряла значение из-за ряда проблем, поднятых другими учеными. Например, в 1896 году в каждом Послании Павла было обнаружено следующее количество hapax legomen: Римлянам 113, I Кор. 110, II Кор. 99, Гал. 34, Еф. 43 Фил. 41, Кол. 38, I Фес. 23, II Фес. 11, Филимону 5, 1 Тим. 82, II Тим. 53, Титу 33. На первый взгляд, последние три итога (для пастырских посланий) не расходятся с другими. Чтобы учесть различную длину посланий, Уоркман также подсчитал среднее количество hapax legomen на страницу греческого текста, которое варьировалось от 3,6 до 13, как показано на диаграмме справа. Хотя пастырские послания содержат больше hapax legomen на странице, Уоркман обнаружил, что различия умеренные по сравнению с вариациями среди других посланий. Это было подтверждено, когда Уоркман просмотрел несколько пьес Шекспира, которые показали похожие вариации (от 3,4 до 10,4 на страницу однотомного издания Ирвинга), как показано на второй диаграмме на справа.

Помимо личности автора, есть несколько других факторов, которые могут объяснить количество hapax legomen в произведении:

  • длина текста: это напрямую влияет на ожидаемое количество и процент hapax legomen; краткость пастырских посланий также делает любой статистический анализ проблематичным.
  • тема текста: если автор пишет на разные темы, конечно, много тематических слов будет встречаться только в ограниченном контексте.
  • текстовая аудитория: если автор пишет коллеге, а не студенту, или их супругу, а не работодателю, снова появится совсем другой словарный запас.
  • время: с течением времени и язык, и язык знание автором языка и его использование изменятся.

В конкретном случае пастырских посланий все эти переменные сильно отличаются от тех, что в остальной части корпуса Павла, и hapax legomen больше не считаются сильными индикаторами авторство (хотя авторство Пасторалей является предметом споров по другим причинам).

Есть также субъективные вопросы относительно того, составляют ли две формы «одно и то же слово»: собака против собаки, подсказка против невежества, подпись vs. подпись; также возникает много других серых случаев. Еврейская энциклопедия указывает, что, хотя в Еврейской Библии содержится 1500 гапаксов, только около 400 явно не связаны с другими подтвержденными словоформами.

Это не будет особенно сложно для Фальсификатор, чтобы построить работу с любым желаемым процентным соотношением hapax legomen. Однако кажется маловероятным, что фальсификаторы задолго до 20-го века придумали бы такую ​​уловку, а тем более сочли бы, что это стоит затраченных усилий.

Последняя трудность с использованием hapax legomen для определения авторства заключается в том, что существует значительная различия среди работ, о которых известно, что они принадлежат одному автору, и разные авторы часто демонстрируют схожие ценности. Другими словами, hapax legomen - ненадежный индикатор. В настоящее время исследования авторства обычно используют широкий спектр методов для поиска закономерностей, а не полагаются на отдельные измерения.

Информатика

В областях компьютерной лингвистики и обработки естественного языка (NLP), особенно. корпусной лингвистики и машинного обучения НЛП обычно игнорируют hapax legomen (а иногда и другие редко встречающиеся слова), поскольку они, вероятно, не имеют большого значения для вычислительной техники. Это игнорирование имеет дополнительное преимущество в виде значительного сокращения использования памяти приложением, поскольку в соответствии с законом Ципфа многие слова являются hapax legomen.

Примеры

Ниже приведены несколько примеров hapax legomen в языках или корпусов.

арабских примеров

В Коране :

  • Существительные собственные Ирам (Q 89: 7, Ирам Столпов ), Вавил (Q 2: 102, Вавилон ), Бакка (т) (Q 3:96, Бакка ), Джибт (Q 4:51), Раманан (Q 2: 185, Рамадан ), ар-Рам (Q 30: 2, Византийская империя ), Тасним (Q 83:27), Qurayš (Q 106: 1, Курайшиты ), Маджу (Q 22:17, Волхвы ), Марут (Q 2: 102, Харут и Марут ), Мекка (t) (Q 48:24, Мекка ), Наср (Q 71:23), (Ḏū) ан-Нун (Q 21:87) и Харут (Q 2: 102, Харут и Марут ) встречаются только один раз.
  • zanjabīl (زَنْجَبِيل - имбирь ) - это коранический гапакс (Q 76:17).
  • эпитетон ornans aṣ-amad (الصَّمَد - Просимый ) является кораническим гапаксом (Q 112: 2). 261>Китайские и японские иероглифы

    Классическая китайская и японская литература содержит множество китайских иероглифов, которые встречаются только один раз в корпусе, и их значение и произношение часто теряются. Известные по-японски как кого (孤 語), буквально «одинокие персонажи», их можно рассматривать как разновидность hapax legomenon. Например, в Классике поэзии (около 1000 г. до н.э.) иероглиф используется ровно один раз в стихе «伯 氏 吹 埙 , 仲 氏 篪», и это было только благодаря открытию описания Гуо Пу (276-324 г. н.э.), что персонаж может быть связан с определенным типом древней флейты.

    Примеры на английском языке

    Слово «honorificabilitudinitatibus » в первом издании пьесы Уильяма Шекспира Потерянный труд любви
    • Flother, как синоним снежинки, является hapax legomenon письменного английского языка, найденным в рукописи, озаглавленной XI Pains of Hell (около 1275 г.).
    • Hebenon, яд, упомянутый в «Гамлет» Шекспира только один раз.
    • Honorificabilitudinitatibus - это hapax legomenon из произведений Шекспира.
    • Manticratic, что означает «правила» семья или клан Пророка ", по-видимому, был изобретен Т. Э. Лоуренса и появляется один раз в «Семи столпах мудрости».
    • Nortelrye, слово, обозначающее «образование», встречается только один раз в Chaucer.
    • Sassigassity, возможно, со значением «дерзость» встречается только один раз в рассказе Диккенса «Рождественская елка».
    • Slæpwerigne «усталый от сна» встречается ровно один раз в староанглийском corpus в Exeter Book. Ведутся споры о том, означает ли оно «усталый от сна» или «усталый от сна».
    • Сатир, хотя и широко распространенное слово в английском языке в целом, является hapax legomenon для Шекспира, как это происходит только один раз в его трудах.

    Примеры на немецком языке

    Муспилли строка 57: «dar nimac denne mak andremo helfan uora demo muspille» (Баварская государственная библиотека Clm 14098, ф. 121r)

    Древнегреческие примеры

    • Согласно классическому исследователю Клайду Фарру, «в Илиаде указано 1097 hapax legomen, а в Odyssey - 868 ". Другие, однако, определяют этот термин по-другому и насчитывают всего 303 в Илиаде и 191 в Одиссее.
    • panaōrios (παναώριος), древнегреческий для «очень несвоевременно», это одно из многих слов, которые встречаются в Илиаде только один раз.
    • Греческий Новый Завет содержит 686 местных hapax legomen, которые иногда называют «новозаветными hapaxes». 62 из них встречаются в 1 Петра, а 54 встречаются в 2 Петра.
    • Epiousios, что переводится на английский как ″ daily ″ в Отче наш, в Матфея 6:11 и Луки 11: 3, больше нигде не встречается во всей известной древнегреческой литературе и, таким образом, является hapax legomenon в самом сильном смысле.
    • слово aphedrōn (ἀφεδρών) «уборная» в греческом Новом Завете встречается только дважды, в Матфея 15:17 и Марка 7:19, но поскольку широко распространено мнение, что автор Евангелия Матфей использовал Евангелие от Марка в качестве источника, его можно рассматривать как hapax legomenon. Оно было ошибочно переведено как «кишечник», пока надпись из Lex de astynomis Pergamenorum («Закон городских клерков Пергама ») не подтвердила, что оно означало «уборная».

    Примеры на иврите

    Число различных hapax legomen в еврейской Библии составляет 1 480 (из 8 679 использованных слов). Однако из-за еврейских корней , суффиксов и префиксов только 400 являются "истинными" hapax legomen. Полный список можно увидеть в статье Еврейской энциклопедии для "Hapax Legomen".

    Вот некоторые примеры:

    • Akut (אקוט - сражался), встречается только один раз в еврейской Библии., в Псалме 95:10.
    • Ацей Гофер (עֲצֵי-גֹפֶר - Гофер дерево ) упоминается один раз в Библии, в Бытии 6:14, в инструкции по созданию Ноева ковчега " из дерева гофер ». Из-за его единственного внешнего вида теряется его буквальное значение. Суслик - это просто транслитерация, хотя ученые предварительно предполагают, что предполагаемое дерево - кипарис.
    • Гвина (גבינה - сыр ) - это hapax legomenon из библейского иврита, встречается только в Иове 10:10. Это слово стало чрезвычайно распространенным в современном иврите.
    • Захучиф (זכוכית) - это hapax legomenon библейского иврита, встречается только в Иове 28:17. Слово происходит от корня זכה z-ch-h, что означает «прозрачный / прозрачный» и относится к стеклу или кристаллу. В современном иврите это слово означает «стекло».
    • Лилит (לילית) встречается однажды в еврейской Библии, в Исаии 34:14, где описывается запустение Эдома.. Это переводится несколькими способами.

    Пример на ирландском

    • chomneibi, прилагательное неизвестного значения, описывающее планку, встречается только в Triads of Ireland # 169.

    Итальянский Примеры

    Латинские примеры

    • Deproeliantis, причастие слова deproelior, что означает «яростно сражаться» или «сражаться яростно», встречается только в строке 11 Оды 1.9 Горация.
    • Mactatu, единственная аблатива от mactatus, означающая «из-за убийство ». Это происходит только в De rerum natura от Лукреция.
    • Мнемозин, предположительно означающий памятную или памятную записку, появляется только в стихотворении 12 из Катулла. Кармина.
    • Scortillum, уменьшительная форма, означающая «маленькая проститутка», встречается только в стихотворении 10 из Кармина Катулла, строка 3.
    • Terricrepo, прилагательное, очевидно, относящееся к thun метод ораторского искусства встречается только в 8-й книге Августина Исповедей.
    • Romanitas, существительное, обозначающее "романизм", "римский путь" или "римский стиль", встречается только в Тертуллиане де Паллио.
    • Арепо - имя собственное, встречающееся только в квадратах Сатора. Оно образовано путем написания оперы в обратном порядке.

    Славянские образцы

    • Витол (вытол) - это гапакс-наследник известного корпуса средневековых русских берестяных рукописей. Слово встречается в надписи № 600 из Новгород, датируемый ок. 1220–1240, в контексте «вытол был пойман» (вытоло изловили). По словам Андрея Зализняка, это слово больше нигде не встречается, и его значение неизвестно. Были предложены различные интерпретации, такие как личное имя или социальный статус человека.

    В массовой культуре

    • Режиссер-авангардист Холлис Фрэмптон снял серию из семи фильмов 1971 года. до 1972 года под названием Hapax Legomen I: Nostalgia to Hapax Legomen VII: Special Effects.
    • Термин «Hapax legomenon» на короткое время стал популярным в Великобритании после 2014–2015 гг. Финал, после того, как видео стало вирусным с Гонвиллом и Каем, студент Тед Ловдей быстро дал это как правильный ответ, когда ведущий Джереми Паксман успел только спросить «означающее« сказал только один раз », какой двухсловный греческий термин обозначает слово...».
    • Слово насмешливо процитировал Всауче хозяин Майкл Стивенс в 2015 году в качестве примера hapax legomenon, когда Google одновременно возвращал только один результат поиска по слову. С тех пор этот термин на короткое время стал интернет-мемом, и теперь он возвращает более 20 000 результатов поиска Google.
    • Видео YouTube под названием «Universally Challenged» https://m.youtube.com / watch? index = 437 list = LLRkJJbOLmHeUZhohgmR3TDA v = 3WwvBIHh5Ck - это юмористическая редакция эпизода University Challenge, созданная аккаунтом YouTube JustJames. Отрывок Гонвилла и Кая ученика Теда Лавдей, который отвечает на вопрос «Hapax legomenon», был повторяющейся шуткой в ​​видео.

    См. Также

    Ссылки

    Внешние ссылки

    Найдите hapax legomenon в Викисловаре, бесплатном словаре.
Последняя правка сделана 2021-05-22 13:07:38
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте