A диграф или биграм (от греческого : δίς dís, «двойной» и γράφω gráphō, «писать») представляет собой пару символов , используется в орфографии языка языка для записи либо одной фонемы (отдельный звук), либо использовать фонем, который не соответствует нормальным значениям двух символов вместе.
Некоторые орграфы представляют собой фонемы, которые не могут быть представлены одним символом в системе письма языка, как, например, английский sh в кораблях и рыбах. Другие орграфы представляют собой фонемы, которые также могут быть представлены одиночными символами. Орграф, который имеет общее произношение с одним символом, может быть пережитком более раннего периода языка, когда у орграфа было другое произношение, или может быть различие, которое делается только в определенных диалектах, например Английский wh. Некоторые такие орграфы используются по чисто этимологическим причинам, например rh на английском языке. Диграфы используются в некоторых схемах романизации, например, zh, который часто используется для обозначения русской буквы ж. В качестве альтернативы орграфам в орфографии и схемах романизации иногда используются буквы с диакритическими знаками, например чешский š, который ту же функцию, что и орграф sh.
В орфографии некоторых языков орграфы (а иногда и триграфы ) занимают отдельные буквами, что означает, что они занимают свое место в алфавите и не могут быть разделены на составляющие графемы при сортировке, сокращении или переносе слов. Примеры этого можно найти на венгерском (cs, dz, dzs, gy, ly, ny, sz, ty, zs), чешском (ch), словацком (ch, dz, dž), албанском (dh, gj, ll, nj, rr, sh, th, xh, zh) и латинский алфавит Гая (lj, nj, dž). В голландском языке, когда орграф ij пишется с большой буквы, обе буквы пишутся с большой буквы (IJ).
Диграфы могут развиваться в лигатуры, но это отдельная концепция: лигатура включает графическую комбинацию из двух символов, например, когда a и e объединяются в æ.
Диграфы могут состоять из двух разных символов (разнородные орграфы) или двух экземпляров одного и того же символа (однородные орграфы). В последнем случае их обычно называют двойные (или удвоенные ). буквы .
Двойные гласные буквы обычно используются для обозначения долгий гласный звук. Так обстоит дело, например, в финском и эстонском, где ⟨uu⟩ представляет собой более длинную версию гласной, обозначаемую ⟨u⟩, ⟨ää⟩ представляет собой более длинную версию гласный, обозначаемый Ä⟩, и так далее. В среднеанглийском следовать ⟨ee⟩ и ⟨oo⟩ использовались аналогичным образом для обозначения удлиненных звуков «е» и «о» соответственно; оба написания были сохранены в современной английской орфографии, но Великий сдвиг гласных и другие исторические звуковые изменения означают, что современное произношение сильно отличается от оригинального.
Двойные согласные буквы также обозначения длинных или удвоенных согласных звуков. В итальянском, например, двойные согласные произносятся длиннее, чем одиночные. Это было первоначальное назначение удвоенных согласных букв в древнеанглийском, но в период среднеанглийского и раннего современного английского длина фонематической согласной была утрачена и орфография использования Разработано соглашением, согласно которому соответствующий удвоенный согласный служит для обозначения того, что предшествующий гласный произносится кратко. На современном английском языке, например, ⟨pp ta постукивания отличает первый гласный звук от звука записи. В редких случаях удвоенные согласные буквы представляют собой истинный родственный согласный на современном английском языке; это может произойти, когда два экземпляра одного и того же согласного происходят от разных морфем, например ⟨nn⟩ в неестественном (не + естественном).
В некоторых случаях представленный удвоенной согласной буквой отличается от другого звука одиночной согласной буквы способом, кроме длины:
В нескольких системах письма, включая английскую, удвоение буквы c⟩ или ⟨k⟩ представляются как гетерогенный орграф ⟨ck⟩ вместо cc⟩ или ⟨kk⟩ соответственно. В исконно немецких словах удвоение ⟨z⟩, которое соответствует / ts /, заменяется орграфом ⟨tz⟩.
Некоторые языки унифицированную орфографию с диграфами, которые представляют различные произношения на разные диалектах (диафонемы ). Например, в бретонском есть орграф ⟨zh⟩, который представляет [z] в большинстве диалектов, но [h] в Vannetais. Точно так же в диалекте французского Saintongeais есть диграф ⟨jh⟩, представляет [h] в словах, которые соответствуют [ʒ] в стандартном французском языке. Точно так же в каталонском есть диграф ⟨ix⟩, который представляет [ʃ] в восточном каталонском, но [jʃ] или [js] в западном каталонском - валенсийском.
Пара букв, составляющих фонему, не всегда смежна. Так обстоит дело с английским silent e. Например, последовательность a... на английском языке имеет звук / e in /. Это результат трех исторических звуковых изменений: торт изначально был / kakə /, открытый слог / ka / стал произноситься с долгой гласной, а позже заключительный schwa упал, оставив / каːк /. Еще позже гласная / aː / стала / eɪ /. На английском языке существует шесть таких орграфов: ⟨a-e, e-e, i-e, o-e, u-e, y-e⟩.
Однако алфавиты также могут быть прерывистыми орграфами.. В татарском кириллице, например, буква ю используется для написания как / ju /, так и / jy /. Обычно разница очевидна по остальной части слова, но когда это не так, последовательность ю... ь используется для / jy /, как в юнь / jyn / 'дешевый'.
Индийские алфавиты отличаются наличием прерывистых гласных, таких как тайский เ... อ / ɤː / in เก อ / kɤː /. Однако технически они могут быть диакритическими знаками, а не считанными буквами; являются ли они орграфами, поэтому вопрос определения.
Категория: английские термины с псевдодиграфами в Викисловаре, бесплатном определ. |
Некоторые пары букв не должны интерпретироваться как орграфы, но появляются из-за сложения : хогсхед и сотрудничать. Часто они никаким образом не помечаются, поэтому их следует запоминать как исключения. Некоторые авторы, однако, указывают на это, разбивая орграф с помощью дефиса, как в hogs-head, кооперируйте, или с помощью trema mark, как в сотрудничестве, но использование диэрезиса сокращлось в английском в течение последнего столетия. Когда он встречается в таких именах, как Клэпхэм, Тауншенд и Хартсхорн, он никогда не помечается. Позиционные альтернативные глифы могут помочь устранить неоднозначность в конкретных случаях: когда круглый, использовался как последний вариант длинного ⟨ſ⟩, а английский орграф, напоминающий / ʃ /, всегда был ⟨ſh⟩.
В латинизации японского составляющие звуки (morae ) обычно обозначаются диграфами, но некоторые обозначаются одной буквой, а некоторые - триграфом. Случай двусмысленности - слоговое ん, которое записывается как n (или иногда m), за исключением передсными или y, где за ним следует апостроф как n ’. Например, данное имя じ ゅ ん い ち ろ う латинизируется как Jun’ichirō, поэтому оно анализируется как /jun.i.chi.rou/, а не как /ju.ni.chi.rou/. Похожее использование апострофа наблюдается в пинь, где написано записывается Chang'e, потому что g принадлежит финалу (-ang) первого слога, а не началу второй слог. Без апострофа Изменение будет пониматься как слог chan (конечный -an), за которым следует слог ge (начальный g-).
Несколько славянских языков, например Чешский, в составных словах могут встречаться двойные буквы, но они не считаются диграфами. Примеры: bezzubý «беззубый», cenný «ценный», черный «черноглазый».
некоторыми видами орграфы и триграфы имеют отдельные буквами сами по себе и назначаются определенному месту в алфавите, отдельно от последовательности символы, составляющие их, для целей орфографии и сопоставления. Например:
Большинство других языков, включая английский, французский, немецкий, польский и т. Д., Рассматривают орграфы как комбинации букв для целей алфавитного преобразования.
Английский язык имеет как однородные орграфы (удвоенные буквы), так и разнородные орграфы (орграфы, состоящие из двух разных букв). К последнему типу класса следующие:
Диграфы также могут состоять из гласных. Некоторые буквы ⟨a, e, o⟩ другие предпочтительны для первой позиции, - для второй i, u⟩. Последние имеют аллографы y, w⟩ в английской орфографии.
вторая буква →. первая буква ↓ | ⟨... e⟩ | ⟨... i⟩ ¦ ⟨... y⟩ | ⟨... u⟩ ¦ ⟨... w⟩ | ⟨... а⟩ | ... o⟩ |
---|---|---|---|---|---|
⟨o...⟩ | ⟨oe¦œ⟩>⟨e⟩ - / i / | oi¦ oy⟩ - / ɔɪ / | ou¦ow⟩ - / aʊ¦uː¦oʊ / | oa⟩ - / oʊ¦ɔː / | oo⟩ - / uː¦ʊ ( ¦ʌ) / |
a...⟩ | ⟨ae¦æ⟩>⟨e⟩ - / i / | ai¦ay⟩ - / eɪ¦ɛ / | au¦aw⟩ - / ɔː /. (в заимствованных словах: / aʊ /) | (в заимствованных словах и в именах собственных: ⟨aa⟩ - / ə¦ ɔː¦ɔl /) | (в заимствованиях из китайского: ⟨ao⟩ - / aʊ /) |
⟨e...⟩ | ee⟩ - / iː / | ⟨Ei¦ey ⟩ - / aɪ¦eɪ¦ (iː) / | eu¦ew⟩ - / juː¦uː / | ⟨ea⟩ - / iː¦ɛ¦ (eɪ¦ ɪə) / | |
⟨u...⟩ | ue⟩ - / uː¦u / | ui⟩ - / ɪ¦uː / | |||
⟨i...⟩ | ⟨Ie⟩ - / iː (¦aɪ) / |
В сербохорватском :
) Обратите внимание, что в кириллической орфографии эти звуки отдельными буквами (љ, њ, џ).
В норвежском несколько звуков могут быть представлены только диграфом или комбинацией букв. Это наиболее распространенные сочетания, но существуют крайние региональные различия, особенно восточные диалекты. Заслуживающим внимания различием является стремление от rs в восточных диалектах, где оно соответствует skj и sj . Среди многих молодых людей, особенно в западных регионах Норвегии и в крупных городах или вокруг них, разница между ç и ʃ полностью стерта и теперь объявляется такой же.
На голландском :
В французском :
⟨... i⟩ | ... u⟩ | |
---|---|---|
a...⟩ | ai⟩ - / ɛ¦e / | au⟩ - / o / |
⟨e...⟩ | ei⟩ - / ɛ / | eu⟩ - / œ¦ø / |
⟨o...⟩ | oi⟩ - / wa / | ⟨ou⟩ - / u (¦w) / |
См. Также Французская фонология.
В немецком :
В венгерский :
В итальянском :
В мэнском гэльском, ⟨ch⟩ представляет / χ /, но ⟨çh⟩ представляет / tʃ /.
В польском языке :
в португальском :
В испанском :
В валлийском :
Перечисленные выше диграфы предоставляют фонемы и обрабатываются как отдельные буквы для целей сопоставления. С другой стороны, орграфы ⟨mh ⟩, ⟨nh ⟩ и триграф ⟨ngh ⟩, которые обозначают глухие согласные, но встречаются только в начале слова в результате носовой мутации, не включаются как отдельные буквы и, следовательно, не включаются в алфавит.
Даиги тонгонг пингим, система транскрипции, используемая для тайваньского хоккиена, включает или, которые включают / ə / (среднюю центральную гласную ) или / o / (закругленная гласная с закругленной спиной ), а также другие орграфы.
В йоруба :
Современные языки, написанные кириллицей, мало используют диграфы, кроме ⟨дж⟩ для / dʐ /, ⟨дз⟩ для / dz / (на украинском, белорусском и болгарском языках), ⟨жж⟩ и ⟨зж⟩ Для необычной русской фонемы / ʑː /. В английском языке используются ⟨дж и ⟨дз⟩ встречаются (в основном в заимствованных словах), но произносятся как комбинации имплозивного (иногда трактуемого как аффрикат) и фрикативного; имплозивы исследуют как аллофоны взрывного / d̪ / и поэтому эти исследуют не орграфами. В кириллице мало диграфов, если только она не используется для записи неславянских языков, особенно кавказских языков.
iPhone обычно не пишутся, диграфы в абджадах встречаются редко. как арабский. Например, если sh использовалось для š, то последовательность sh могла означать либо ša, либо saha. Однако диграфы используются для придыхательных и бормотанных согласных (тех, которые пишутся с h-диграфами в латинской транскрипции) на языках Южной Азии, таких как Урду, которые используются только для устремленных букв h, используется только для устремленных форм, что можно увидеть со соединительными органными (kh) и несоединяющими (h) согласными:
Урду | соединяющий | несоединяющий | ||||
рисунок: | ا | / kʰɑː / | ا | / ɖʱɑː / | ||
последовательность: | ا | / kəɦɑː / | ا | / ɖəɦɑː / |
На армянском языке, орграф ու ⟨ou⟩ транскрибирует / u /, соглашение, пришедшее из греческого языка.
Грузинский алфавит использует несколько диакритических знаков для написания других языков. Например, в Сван, / ø / пишется ჳე we, а / y / как ჳი ⟨wi⟩.
Новогреческий имеет следующие орграфы:
Их называют «дифтонги» по-гречески; в классические обычно из них представляли дифтонги, и название прижилось.
Древнегреческий язык также имел перечисленные выше «дифтонги», хотя их произношение в древние времена оспаривается. Кроме того, древнегреческий язык также использовал букву γ в сочетании с velar stop для создания следующих орграфов:
Цаконян имеет несколько дополнительных орграфов: ρζ / ʒ / (исторически возможно щелевой трель ), κχ / kʰ /, τθ / tʰ /, πφ / pʰ /, σχ / /. Кроме того, небные согласуются гласной буквой ι, что, однако, в степени предсказуемо. Когда / n / и / l / не палатализированы перед ι, они записываются как νν и λλ.
В Бактрии орграфы ββ, δδ, γγ использовались для / b /, / d /, / ŋg /.
В еврейском алфавите, תס и תש могут иногда встречаться для צ / ts /. В современных иврите также используются диграфы, состоящие из символов ׳ для неродных звуков: ג׳ / dʒ /, ז׳ / ʒ /, צ׳ / tʃ /; и другие диграфы букв, когда он написан без гласных: для согласной буквы, в середине слова и יי для / aj / или / aji / и т. д., то есть согласная буква в тех местах, где этого нельзя было ожидать. Идиш имеет свою традицию транскрипции, поэтому для некоторых одних и тех же звуков используются разные диграфы: דז / dz /, זש / ʒ /, טש / tʃ / и דזש (буквально dzš) для / dʒ /, וו / v /, также доступны как один символ Unicode װ, וי или как один символ в Unicode ױ / oj /, יי Или ײ / ej / и ײַ / aj /. Односимвольные диграфы в Юникоде называются «лигатурами ». י может также использоваться после согласной для обозначения палатализации в славянском заимствованных словах.
Большинство индийских письменностей имеют составные гласные диакритические знаки, которые невозможно предсказать по их основным элементам. Это можно проиллюстрировать с помощью тайского, в котором диакритический знак เ, произносимый отдельно / eː /, изменяет произношение других гласных:
одинарный гласный знак: | กา | / kaː /, | เก | / keː /, | กอ | / kɔː / |
знак гласной плюс เ: | เกา | /kaw/, | แก | /kɛː/, | เก อ | / kɤː / |
Кроме того, комбинация ร ร произносит / a / или / am /, есть некоторые слова, в которых комбинации ทร и ศร обозначают / s / и букву ห, как приставка к согласному, меняет его тонический класс на высокий, изменяя тон слога.
слоговые буквы инуктитут добавить к кри два диграфа:
и
Последний образует триграфы и тетраграфы.
Два кана могут быть объединены в слог C V с помощью индексации второго; конвенция отменяет гласную первую. Обычно это делается для слогов CyV, которые называются yon, например ひ ょ hyo ⟨hi yo ⟩. Они не являются диграфами, поскольку обеспечивают нормальное последовательное чтение двух глифов. Однако некоторые устаревшие придерживаются больше не сохраняют это чтение, как в ゎ kwa, ぐ ゎ gwa и む ゎ mwa, которые теперь произносятся как ka, ga, ma. Кроме того, для иностранных займов используются непоследовательные орграфы, которые не соответствуют обычным японским шаблонам ассибиляции, таким как テ ィ ti, ト ゥ tu, チ ェ tye / che, ス ェ swe, ウ ィ wi, ツ ォ tso, ズ ィzi. (См. Полные таблицы катакана и транскрипция на японский язык.)
Длинные гласные записываются путем добавления каны к этой гласной, фактически удваивая ее. Однако длинное ō может быть написано либо oo, либо ou, как в と う き ょ toukyou «Tōkyō». Для диалектов, которые не различают ē и ei, последнее написание используется для длинного e, как в へ い せ い heisei 'Heisei '. В заимствованных словах chōonpu, строка, следующая по направлению текста, как в ビ ー ル bīru bīru 'пиво'. За исключением слогов, начинающихся с n, удвоенные согласные звуки записываются с помощью префикса меньшей версии цу (пишется っ и ッ в хирагане и катакане соответственно), как в き っ て kitte «штамп». Согласные, начинающиеся с n, вместо этого используют символ kana n (пишется ん или ン).
Существует несколько условных обозначений окинавской каны, которые включают подстрочные диграфы или лигатуры. Например, в системе Университета Рюкю ウ - это / ʔu /, ヲ - это / o /, а ヲ ゥ - это / u /.
Как и в случае с греческим, в корейском языке гласные произошли от дифтонгов, которые по-прежнему пишутся двумя буквами. Эти орграфы, ㅐ / ɛ / и ㅔ / e / (также ㅒ / jɛ /, ㅖ / je /), а в некоторых диалектах ㅚ / ø / и ㅟ / y /, все оканчиваются на исторические ㅣ / i /.
Хангыль был разработан с серией орграфов для представления "мутных " согласных: ㅃ * [b], ㄸ * [d], ㅉ * [dz], ㄲ * [ɡ], ㅆ * [z], ㆅ * [ɣ]; также ᅇ с неопределенным значением. Эти значения теперь устарели, но большинство удвоенных букв были возрождены в 19 веке для написания согласных, которых не существовало, когда был изобретен хангыль: ㅃ / p͈ /, ㄸ / t͈ /, ㅉ / t͈ɕ /, ㄲ / k͈ /, ㅆ / s͈ /.
Иногда диграфы записываются как одна лигатура. Со временем лигатуры могут превратиться в новые буквы или буквы с диакритическими знаками. Например, sz превратилось в ß на немецком языке, а «nn» стало на - на испанском.
Обычно орграф просто представлен двумя символами в Unicode. Однако по разным причинам Unicode иногда предоставляет отдельную кодовую точку для орграфа, закодированную как один символ.
Орграфы DZ и IJ и сербские / хорватские диграфы DŽ, LJ и NJ имеют отдельные кодовые точки в Unicode.
Два символа | Диграф | Кодовая точка Unicode | HTML |
---|---|---|---|
DZ, Dz, dz | DZ, Dz, dz | U + 01F1 U + 01F2 U + 01F3 | DZ Dz dz |
DŽ, Dž, dž | DŽ, Dž, dž | U + 01C4 U + 01C5 U + 01C6 | DŽ Dž dž |
IJ, ij | IJ, ij | U + 0132 U + 0133 | IJ ij |
LJ, Lj, lj | LJ, Lj, lj | U + 01C7 U + 01C8 U + 01C9 | LJ Lj lj |
NJ, Nj, nj | NJ, Nj, nj | U + 01CA U + 01CB U + 01CC | NJ Nj nj |
th | ᵺ | U + 1D7A |
См. Также Лигатуры в Unicode.