Арабский алфавит

редактировать
Алфавит для арабского и других языков
Арабский алфавит.
Arabic Language.svg
ТипАбджад
ЯзыкиАрабский
Период времени3-й или 4-й век нашей эры до наших дней
Родительские системыЕгипетские
НаправлениеСправа налево
ISO 15924 Арабский, 160
псевдоним UnicodeАрабский
Диапазон Unicode
Страны, которые используют арабский алфавит: в качестве единственного официального письма в качестве второго официального письма

Арабский алфавит ( арабский : الْأَبْجَدِيَّة الْعَرَبِيَّة, al-abjadīyah l-arabīyah или الْحُرُوف الْعَرَبِيَّ ة, al-urūf l-arabīyah, IPA: ), или арабский абджад, это арабское письмо как он кодифицирован для написания арабского. Он написан справа налево в стиле курсивом и состоит из 28 букв. Большинство букв имеют контекстные формы букв.

Арабский алфавит считается абджад, то есть в нем используются только согласные, но теперь он считается «нечистым абджад ». Как и в случае с другими нечистыми абджадами, такими как еврейский алфавит, писцы позже изобрели средства обозначения гласных звуков отдельными гласными диакритическими знаками.

Содержание

  • 1 Согласные
    • 1.1 Алфавитный порядок
      • 1.1.1 Абджади
      • 1.1.2 Хиджаи
    • 1.2 Формы букв
      • 1.2.1 Таблица основных букв
      • 1.2.2 Варианты
      • 1.2.3 Алиф
      • 1.2.4 Модифицированные буквы
      • 1.2.5 Лигатуры
      • 1.2.6 Близнецы
      • 1.2.7 Нунация
  • 2 гласных
    • 2.1 Короткие гласные
    • 2.2 Длинные гласные
    • 2.3 Дифтонги
    • 2.4 Отсутствие гласных
  • 3 Дополнительные буквы
    • 3.1 Региональные различия
    • 3.2 Неродные буквы стандартного арабского
    • 3.3 Используются в языках, отличных от арабского
  • 4 Цифры
    • 4.1 Буквы цифрами
  • 5 История
    • 5.1 Арабские печатные машины
  • 6 Компьютеры
    • 6.1 Unicode
    • 6.2 Клавиатуры
    • 6.3 Распознавание рукописного ввода
  • 7 См. также
  • 8 Ссылки
  • 9 Внешние ссылки

Согласные

Базовый арабский алфавит содержит 28 букв. Адаптация арабского письма для других языков добавила и удалила некоторые буквы, например, для персидского, османского турецкого, центральнокурдского, Урду, синдхи, малайский, пушту, арви и малаялам (араби Малаялам ), каждая из которых имеет дополнительные буквы, как показано ниже. Не существует отдельных букв верхнего и нижнего регистров.

Многие буквы похожи друг на друга, но отличаются друг от друга точками (ʾiʿjām ) выше или ниже их центральной части (rasm ). Эти точки являются неотъемлемой частью буквы, поскольку они различают буквы, обозначающие разные звуки. Например, арабские буквы ب (b), ت (t) и ث (th) имеют одинаковую базовую форму, но имеют одну точку внизу, две точки вверху и три точки вверху соответственно. Буква ن (n) также имеет одинаковую форму в начальной и средней формах, с одной точкой вверху, хотя она несколько отличается в изолированной и конечной формах.

И печатный, и письменный арабский язык курсив, при этом большинство букв в слове напрямую связаны с соседними буквами.

Алфавитный порядок

Существует две основных последовательности упорядочивания для арабского алфавита: абджад и хиджа.

Первоначальный порядок abjadīy (أَبْجَدِيّ), используемый для букв, происходит от порядка финикийского алфавита и, следовательно, аналогичен порядку других финикийских - производные алфавиты, такие как еврейский алфавит. В этом порядке буквы также используются как числа, цифры абджада, и имеют тот же буквенно-цифровой код / ​​шифр, что и на иврите гематрия и греческом изопсефи.

Порядок хиджаи (هِجَائِي) или алифбани (أَلِفْبَائِي), используемый при сортировке списков имен и слов, как в телефонных книгах, списках классных комнат и словарях, группирует буквы по сходству формы.

Абджади

Орден Табджади не является простым историческим продолжением более раннего северно-семитского алфавитного порядка, поскольку он занимает позицию, соответствующую арамейской букве самех / семкат ס, однако исторически ни одна буква арабского алфавита не произошла от этой буквы. Утрата же была компенсирована разделением шин ש на две независимые арабские буквы (shīn) и ﺱ (sīn), которые переместились вверх, чтобы занять место sameḵ. Шесть других букв, не соответствующих ни одной северно-семитской букве, помещены в конец.

Обычная последовательность абджади
غظضذخثتشرقصفعسنملكيطحزوهدجبأ
ghdhkhthtshrqfʿsnmlkyzwhdjbʾ
28272625242322212019181716151413121110090807060504030201

Это обычно озвучивается следующим образом:

шабджад хавваз шути каламан саʿфаṣ карашат тхакадх Саагах.

Другой вариант вокализации звучит так:

Магрибский последовательность абджади (вероятно, более древняя)
شغظذخثتسرقضفعصنملكيطحزوهدجبأ
shghdhkhthtsrqfʿnmlkyzwhdjbʾ
28272625242322212019181716151413121110090807060504030201
Цвета показывают, какие буквы занимают другие позиции из предыдущей таблицы

Это можно озвучить как:

шабуджадин хавазин шусия калман шафаф курисат тахуд Тагхуш

хиджаи

Современные словари и другие справочники не используют порядок абджади для сортировки по алфавиту; вместо этого используется более новый порядок хиджани, в котором буквы частично сгруппированы вместе по сходству формы. Порядок хиджани никогда не используется в качестве числительных.

Общий порядок хиджани
يوهنملكقفغعظطضصشسزرذدخحجثتبا
ywhnmlkqfghʿshszrdhdkhjthtbā

Другой вид ордена хиджани широко использовался в Магрибе до недавнего времени, когда он был заменен приказом Машрики.

Магрибским приказом хиджани
يوهشسقفغعضصنملكظطزرذدخحجثتبا
ywhshsqfghʿnmlkzrdhdkhjthtbā
Цвета указывают, какие буквы имеют положение, отличное от положения в предыдущей таблице.

Формы букв

Арабский алфавит всегда курсивный, а форма букв зависит от их положения в слове. Буквы могут иметь до четырех различных форм, соответствующих начальному, среднему (среднему), конечному или изолированному положению (IMFI ). В то время как некоторые буквы сильно различаются, другие остаются практически идентичными во всех четырех позициях. Обычно буквы в одном слове соединяются с обеих сторон короткими горизонтальными линиями, но шесть букв (و, ز, ر, ذ, د, ا) могут быть связаны только с их предыдущей буквой. Например, رارات (Арарат ) имеет только изолированные формы, потому что каждая буква не может быть связана со следующей за ней. Кроме того, некоторые комбинации букв записываются как лигатуры (особые формы), в частности lām-alif لا, которая является единственной обязательной лигатурой (нелигированная комбинация لـا считается трудной для чтения).

Таблица основных букв

Использование арабских букв в литературном арабском языке
ОбычноеМагрибское Буква. имя

(Классическое произношение)

Буква. имя в арабском письмеТранс-. литература Значение в литературном арабском языке (IPA )Ближайший английский эквивалент в произношенииКонтекстные формыИзолированная. форма
АбджадиХиджаниʾАбджадиХиджаниОкончательныйМедиалНачальный
1.1.1.1.alifأَلِفā / ʾ

(также â)

различные,. включая / aː /, ∅car, c atـاا
2.2.2.2.bāʾبَاءb/b /barnـببـبـب
22.3.22.3.tāʾتَاءt/t /stickتتـتـت
23.4.23.4.thāʾثَاءth

(также ṯ)

/θ /thчернилаـثـثـثـث
3.5.3.5.jīmجِيمj

(также ǧ)

/d͡ʒ /gemـجـجـجـج
8.6.8.6.āʾحَاء

(также ḩ)

/ħ /нет эквивалента

(«гортанный» h, может быть приблизительно равен hземля)

ـححـحـح
24.7.24.7.khāʾخَاءkh

(также ḫ, ḵ, ẖ)

/x /шотландский lo chـخـخـخـخ
4.8.4.8.dālدَالd/d /dухоـدد
25.9.25.9.dhālذَالdh

(также ḏ)

/ð /thatـذذ
20.10.20.10.rāʾرَاءr/r /шотландский английский cu r d, испанский свернул r, как в pe rroـرر
7.11.7.11.zāy / zaynايz/z /zebraـزز
15.12.21.24.sīnسِينs/s /sinسسـسـس
21.13.28.25.shīnشِينsh

(также š)

/ʃ /shвـشـشـشـش
18.14.15.18.ādصَاد

(также ş)

/ /нет эквивалента

(может быть приблизительно выражено с помощью s auce, но с зажатым горлом)

ـصـصـصـص
26.15.18.19.ḍādاد

(также ḑ)

/ /нет эквивалента

(может быть аппроксимирован с помощью d awn, но с зажатым горлом)

ـضـضـضـض
9.16.9.12.āʾاء

(также ţ)

/ /нет эквивалента

(может быть приблизительно выражено с помощью s t все, но с суженным горлом)

ـطـطـطـط
27.17.26.13.āʾاء

(также z̧)

/ðˤ /нет эквивалента

(может быть аппроксимирован fa th er, но с горлом сужено)

ـظـظـظـظ
16.18.16.20.aynعَيْنʿ/ʕ /без эквивалента

(«гортанный» озвученный h; аналогично ḥāʾ выше)

ـععـعـع
28.19.27.21.ghaynغَيْنgh

(также ġ, ḡ)

/ɣ /нет эквивалента

французский Па r равно

ـغـغـغـغ
17.20.17.22.fāʾاءf/f /farـفـفـفـف
19.21.19.23.qāfقَافq/q /без эквивалента

(аналогично c, но произносится дальше во рту.)

ـقـقـقـق
11.22.11.14.kāfافk/k /capـكـكـكـك
12.23.12.15.lāmلاَمl/l /lampللـلـل
13.24.13.16.mīmمِيمm/m /meممـمـم
14.25.14.17.nūnنُونn/n /nunننـنـن
5.26.5.26.hāʾاءh/h /ـهـهـهـه
6.27.6.27.wāwوَاوw / ū / ∅/w /, / /, ∅wet, p oolـوو
10.28.10.28.yāʾيَاءy / ī/j /, / /Yoshi, m eetـيـيـيـي

(не считается буквой в алфавите, но играет важную роль в арабском правописании)

[обозначает большинство неправильных женских существительных]

hamzah هَمْزةʾ/ʔ /uh–oh

(он же «гортанный упор »)

ء

(используется в основном в средней и конечной позиции, что является несвязанной буквой)

alif hamzahأَلِف هَمْزةـأأ
ـإإ
wāw hamzahوَاو هَمْزةـؤؤ
yāʾ hamzahيَاء هَمْزةـئـئـئـئ
alif maddahأَلِف مَدَّةʾā/ʔ a ː /ـآآ
(не считается буквой в алфавите, но играет важную роль в арабской грамматике и лексике, включая указание [обозначающее большинство существительных женского пола] и правописание). Альтернативная форма ت («связанный tāʼ» / تاء مربوطة) используется в конце слов для обозначения женского рода существительных и прилагательных. Он обозначает последний звук / -h / или / -t /. Стандартный tā, чтобы отличать его от tāʼ marbūṭah, упоминается как tāʼ maftūḥah (تاء مفتوحة, «открытый tā»).Tāʼ marbūṭahتاء مربوطةـة(только конец)ة
(не считается буквой в алфавите, но играет важную роль в арабской грамматике и лексика, включая указание [обозначает глаголы] и правописание). Он используется в конце слов со звуком / aː / в современном стандартном арабском языке, которые не относятся к категории использования tāʼ marbūṭah (ة) [в основном, времена глаголов и арабские мужские имена].'alif maqsouraالف مقصورةـى(только конец)

ى

Примечания

  • См. Статью Романизация арабского языка подробнее о различных схемах транслитерации; однако носители арабского языка обычно могут не следовать стандартной схеме при расшифровке имен. Также имена обычно транскрибируются так, как произносятся на местном уровне, а не так, как произносятся в литературном арабском (если они были арабского происхождения).
  • Что касается произношения, приведенные фонематические значения соответствуют современным стандартным арабским, который преподается в школах и университетах. На практике произношение может значительно отличаться от региона к региону. Дополнительные сведения о произношении арабского языка см. В статьях Арабская фонология и разновидности арабского языка.
  • Названия арабских букв можно рассматривать как абстракции от более старой версии, в которой они имели смысл. слова на протосемитском языке. Имена арабских букв в народе могут иметь совершенно разные названия.
  • Шесть букв (و ز ر ذ د ا) не имеют четкой средней формы и должны быть записаны в их окончательной форме без связи со следующей буквой. Их первоначальная форма соответствует изолированной форме. Следующая буква записывается в ее начальной форме или изолированной форме, если она является последней буквой в слове.
  • Буква алиф возникла в финикийском алфавите как знак согласной, указывающий на гортанная смычка. Сегодня он утратил свою функцию согласного и вместе с ya 'и wāw является mater lectionis, согласным знаком, заменяющим долгую гласную (см. Ниже), или как поддержку некоторых диакритических знаков. (мадда и хамза ).
  • арабский язык в настоящее время использует диакритический знак, ء, называемый хамза, для обозначения гортанной остановки [ʔ], написанной отдельно или с носителем:
    • в одиночку: ء
    • с носителем: إ أ (над или под алифом), ؤ (над wāw), ئ (над yā 'или yā' hamzah без точки).
В академической работе хамза (ء) транслитерируется с помощью модификатора буква правого полукольца (ʾ), тогда как модификатор буква левого полукольца (ʿ) транслитерирует букву 'ayn (ع), что представляет собой другой звук, не встречающийся в английском языке.
Хамза имеет единственную форму, так как он никогда не связан с предшествующей или следующей буквой. Однако иногда он сочетается с wāw, yā 'или alif, и в этом случае носитель ведет себя как обычный wāw, yā' или alif.

варианты

Современная последовательность хиджаи и последовательность абджади 15 шрифтов:
ي و ه ن م ل ك ق ف غ ع ظ ط ض ص ش س ز ر ذ د خ ح ج ث ت ب ا последовательность хиджаи
Арабский в 15 шрифтах 2020-03-25 1554.png Ното Насталик Урду
Шахерезада
Латиф
Ното Насх Арабский
Маркази Текст
Ното Санс Арабский
Эль-Мессири
Лимонада
Чанга
Мада
Ното Куфи Арабский
Рим Куфи
Лалезар
Джомхурия
Раккас
غ ظ ض ذ خ ث ت ش ر ق ص ف ع س ن م ل ك ي ط ح ز و ه د ج ب أ последовательность абджади
Арабский в 15 шрифтов 2020-03-24 2228.png Ното Насталик урду
Шахерезада
Латиф
Ното Насх Арабский
Маркази Текст
Ното Санс Арабский
Эль Мессири
Лимонада
Чанга
Мада
Ното Куфи арабский
Рим Куфи
Лалезар
Джомхурия
Раккас

Алиф

КонтекстФормаЗначениеБлижайший английский эквивалент
Без диакритических знаков ا
  • изначально: a, i / a, i / или иногда молчит в определенном артикле ال (a) l-
  • медиально или окончательно: ā / aː /
  • молчит в مِائة
  • Исходное положение : f a there h ip
  • Среднее / конечное положение: f a ther
С хамза над

(хамза алиф)

أ
  • Начальный / средний / конечный: за ним следует фаттах - a или ammah - ʾu
  • Отдельно или отдельно без гласной (обычно после сукуна): / ʔ / встречается в некоторых словарных формах
  • Начальный / Среднее / Конечное положение: ʾa - f a тер; ʾU - p our
  • Изолировано или само по себе без гласной: гортанная остановка в uh-oh
С hamzah под

(hamzah alif)

إ
  • изначально: ʾi / /i /
  • не появляется медиально (см. хамза и U + 02E4)
  • Исходное положение: ʾi - h ip
С маддах آ
  • ā / aː /
  • Начальное / Среднее / Конечное положение: art
С waslah ٱ
  • Начальное / Среднее / Конечное положение: молчаливое
  • / Mark / Маркер / коннектор / соединитель между двумя словами, либо с помощью Арабский определенный артикль аль или с алиф или хамза алиф для образования фразы, фразового существительного или даже имени: например 'Абд' Аллах عَبْدَ ٱلله -"слуга Аллаха (Бога)"
  • Глоттал остановился на ух-ох или молчал

Измененные буквы

Это не отдельные буквы, а довольно разные контекстные варианты некоторых арабских букв.

Условные формыИмяТранслит.Фонематическое значение (IPA)
ИзолированноеОкончательноеСреднееНачальное
آـآآalif maddah

(أَلِفْ مَدَّة)

ʾā/ ʔaː / (он же «удлинение / подчеркивание 'алиф»)
ةةtāʾ marbūṭah

(تَاءْ مَرْبُوطَة)

h или. t / ẗ(также известный как "коррелированное та '")

используется только в последней позиции и для обозначения существительного / слова женского рода или для придания существительному / слову женского рода; однако в редких случаях неправильного употребления существительных / слов он, кажется, означает «мужской род»; существительные в единственном числе: / a /,

существительные во множественном числе: āt (предшествующая буква, за которой следует фаттах алиф + tāʾ = ـَات)

ى-ـىalif maqṣūrah (أَلِفْ مَقْصُورَة)ā / á / ỳБуква называется أَلِفْ مَقْصُورَة alif maqṣūrah или لِف لَيِّنَة alif layyinah, и используется только в конце слов, представляя / aː / в современном стандартном арабском языке <. 426>В некоторых особых случаях, обозначающих нейтральный / нефеминный аспект слова (в основном глаголы), где tā 'marbūṭah не может использоваться.

Версия без точек была традиционной способ написания буквы ي yāʾ в конечной позиции, и ее еще предстоит использовать в регионе долины Нила.

Лигатуры

Компоненты лигатуры для «Аллаха»:. 1. alif. 2. hamzat waṣl (ْهَمْزَة وَصْل). 3. lām. 4. lām. 5. shadda ( شَدَّة). 6. dagger alif (أَلِفْ خَنْجَریَّة). 7. hāʾ

Использование лигатуры в арабском является общий. Есть один ком пульсорная лигатура для lām ل + alif ا, которая существует в двух формах. Все остальные лигатуры, которых много, необязательны.

Контекстные формыИмяПер.Значение
ОкончательноеСреднееНачальноеИзолированное
lām + aliflaa/ lā /
yāʾ + mīmīm/ i /m /
lam + mīmlm/ lm /

Более сложная лигатура, которая объединяет до семи различных компонентов, обычно используется для представления слова Аллах.

Единственная лигатура в пределах основного диапазона арабского письма в Юникоде (U + 06xx) это лам + алиф. Это единственное обязательное условие для шрифтов и обработки текста. Другие диапазоны предназначены для совместимости со старыми стандартами и содержат другие лигатуры, которые не являются обязательными.

  • lām + alif
    لا

Примечание: Unicode также имеет в своем диапазоне FExx формы представления B код для этой лигатуры. Если ваш браузер и шрифт правильно настроены для арабского языка, лигатура, отображаемая выше, должна быть идентична этой: U + FEFBАРАБСКАЯ ЛИГАТУРА С ИЗОЛИРОВАННОЙ ФОРМОЙ ALEF:

  • U + 0640АРАБСКАЯ ТАБЕЛЬ + lām + alif
    ـلا

Примечание. Unicode также имеет в своей форме представления B диапазон U + FExx код для этой лигатуры. Если ваш браузер и шрифт правильно настроены для арабского языка, отображаемая выше лигатура должна быть идентична этой:

  • U + FEFCARABIC LIGATURE LAM WITH ALEF FINAL FORM

Другая лигатура в Unicode Форма представления Диапазон от U + FB50 до U + FDxx - это специальный код для символа лигатуры Аллах («Бог»), U + FDF2ИЗОЛИРОВАННАЯ ФОРМА АРАБСКОЙ ЛИГАТУРЫ АЛЛАХ:

Это обход недостатков большинства текстовых процессоров, которые неспособны отображать правильные знаки гласных для слова Аллах в Коране. Поскольку арабский шрифт используется для написания других текстов, а не только Корана, отображение lām + lām + hā 'в качестве предыдущей лигатуры считается ошибочным: если один из нескольких шрифтов (Noto Naskh Arabic, mry_KacstQurn, KacstOne, DejaVu Sans, Harmattan, Scheherazade, Lateef, Iranian Sans) установлен на компьютере (Iranian Sans поддерживается веб-шрифтами Викимедиа), слово будет отображаться без диакритических знаков.

  • lām + lām + hā '= LILLĀH (что означает «Аллаху [только Аллаху]»)
    لله или لله
  • alif + lām + lām + hā' = ALLĀH (исламское название для " Бог »)
    الله или الله
  • alif + lām + lām + U + 0651ARABIC SHADDA + U + 0670АРАБСКАЯ БУКВА ЗАПИСАННАЯ ALEF + hā '
    اللّٰه (DejaVu Sans и KacstOne не показывают добавленный верхний индекс Alef)

Попытка показать их на неисправных шрифтах без автоматического добавления знака геминации и верхнего индекса alif, хотя может не отображаться по желанию во всех браузерах, это добавление U + 200d(объединитель нулевой ширины) после первого или второго lām

  • (alif +) lām + lām + U + 200dСОЕДИНИТЕЛЬ НУЛЕВОЙ ШИРИНЫ + hā '
    الل‍ه لل‍ه

Gemination

Gemination - это удвоение согласной. Вместо того, чтобы писать дважды, арабский язык помещает W-образный знак, называемый шадда, над ним. Обратите внимание, что если между двумя согласными встречается гласная, буква будет просто написана дважды. Диакритический знак только p появляется там, где согласная в конце одного слога идентична начальной согласной в следующем слоге. (Общий термин для таких диакритических знаков - arakāt ).

Общий UnicodeИмяИмя арабским шрифтомТранслитерация
0651

ــّـ

шаддаشَدَّة(удвоенный согласный)

Нунация

Нунация (арабский : تنوين tanwīn) - это добавление последнего -n к существительному или прилагательное. Гласная перед ним указывает на грамматический падеж. В письменном арабском нунация обозначается удвоением гласного диакритического знака в конце слова.

Гласные

Пользователи арабского языка обычно пишут длинные гласные, но опускают короткие, поэтому читатели должны использовать свои знания языка, чтобы восполнить отсутствующие гласные. Однако в системе образования, особенно на уроках арабской грамматики, эти гласные используются, поскольку они имеют решающее значение для грамматики. Арабское предложение может иметь совершенно другое значение за счет тонкой смены гласных. Вот почему в таком важном тексте, как Коран, обязательны три основных гласных знака (см. Ниже), такие как arakāt и все другие диакритические знаки или другие типы знаков, например кантилляционные знаки.

Краткие гласные

В повседневном арабском письме, в публикациях общего характера и на уличных знаках короткие гласные обычно не пишутся. С другой стороны, копии Корана не могут быть одобрены религиозными институтами, которые их рассматривают, если не включены диакритические знаки. Детские книги, тексты для начальной школы и грамматики арабского языка в целом будут в некоторой степени содержать диакритические знаки. Они известны как тексты «вокализированные ».

Краткие гласные могут быть записаны с диакритическими знаками, расположенными над или под согласным, который предшествует им в слоге, называемом arakāt. Все арабские гласные, длинные и короткие, идут после согласной; в арабском языке такие слова, как «Али» или «алиф», например, начинаются с согласной: «Алийы, алиф.

Краткие гласные. (полностью вокализированный текст)КодИмяИмя арабским шрифтомTrans.ЗначениеПримечания

ــَـ

064Eжир · ahفَتْحَةa/ a /фатх ( полукороткая «а») звучит как английская «Е» (например, «h en», «m an») по сравнению с буквой alif (ا), которая является полной -whole "A" (= как английская буква "A" как в "ark", "up")

например حَرَكَة arakah произносится больше как «erekeh»; شَمْس shams больше произносится как «shems»

. ــُـ064Fammahمَّةu/ u /английское «U» (как «f ull»)
.

ــِـ

0650kasrahكَسْرَةi/ i /английский «I» (как в «p ick ")

Длинные гласные

В полностью озвученном арабском тексте, найденном в таких текстах, как Коран, длинная ā, следующая за согласным, кроме хамза записывается с коротким знаком (фаттах) на согласном и халифом после него; длинный ī пишется как знак краткого i (касра) плюс йах; и длинное ū как знак краткого u (ammah) плюс wāw. Вкратце, ᵃa = ā; ⁱy = ī; и ᵘw = ū. Долгое ā, следующее за хамзой, может быть представлено хамзой хамза или бесплатным хамзой, за которой следует халиф (два последовательных халифа никогда не допускаются на арабском языке).

В таблице ниже показаны гласные, расположенные выше или ниже пунктирного круга, заменяющие первую согласную букву или знак шадда. Для наглядности в таблице основные буквы слева, используемые для обозначения этих долгих гласных, показаны только в их изолированной форме. Обратите внимание, что большинство согласных соединяются слева с alif, wāw и yā, записанными затем с их средней или конечной формой. Кроме того, буква йам в последнем ряду может соединяться с буквой слева от нее, а затем будет использовать среднюю или начальную форму. Используйте таблицу первичных букв, чтобы посмотреть на их фактические глифы и типы соединения.

Длинные гласные (полностью озвученный текст)
UnicodeБуква с диакритическим знакомИмяПер.ВариантыЗначение
064E 0627اfatḥah ʾalifāaa/ aː /
064E 0649ـَىٰfatḥah alif maqṣūrahāaa
ـِىٖкасрах alif maqṣūrahyiy/ iː /
064F 0648ـُوammah wāwūuw / ou/ uː /
0650 064Aـِيкасрах йāʾīiy/ iː /

В невокализованном тексте (в котором короткие гласные не отмечены) длинные гласные представлены рассматриваемым гласным: ʾalif ṭawīlah / maqṣūrah, wāw или yā. Длинные гласные, написанные в середине слова беззвучного текста, рассматриваются как согласные с сукуном (см. Ниже) в тексте с полными диакритическими знаками. Здесь также для ясности в таблице длинные гласные буквы показаны только в изолированном виде.

Комбинации وا и يا всегда произносятся как wā и yāʾ соответственно. Исключением является суффикс ـوا۟ в окончаниях глаголов, где alif молчит, в результате чего получается ū или aw.

Длинные гласные. (беззвучный текст)ИмяПер.Значение
0627. ا(подразумевается fatah) alifā/ aː /
0649. ى(подразумевается fatah) alif maqṣūrahā / y
0648. و(подразумевается ammah) wāwū/ uː /
064A. ي(подразумевается kasrah) yāʾī/ iː /

Кроме того, при транслитерации имен и заимствованных слов носители арабского языка записывают большинство или все гласные имеют длину (ā с ا ʾalif, ē и ī с ي yaʾ, и ō и ū с و wāw), что означает, что он приближается к истинному алфавиту.

Дифтонги

дифтонги / aj / и / aw / представлены в вокализированном тексте следующим образом:

Дифтонги. (полностью вокализированные текст)ИмяПер.Значение
064A 064E. ـَيfatḥah yāʾay/ aj /
0648 064E. ـَوfatḥah wāwaw/ aw /

Пропуск гласных

Арабский слог может быть открытым (окончание с гласной) или закрытый (оканчивающийся на согласный):

  • открытый: CV [согласный-гласный] (долгий или короткий гласный)
  • закрытый: CVC (только короткий гласный)

Обычный текст состоит только из серии согласных плюс удлиняющие гласные буквы; таким образом, слово qalb, «сердце», пишется qlb, а слово qalaba «он повернулся» также пишется qlb.

Чтобы написать калабу без этой двусмысленности, мы могли бы указать, что после l следует короткое a, написав над ним фатах.

Чтобы написать qalb, мы бы вместо этого указали, что за l не следует гласный, отметив его диакритическим знаком , называемым сукун (ْ), например: قلْب.

Это на одну ступень ниже полной вокализации, где гласная после q также будет обозначаться фатой: قَلْب.

Коран традиционно написан полностью озвученным.

Длинный звук i в некоторых изданиях Корана записывается с помощью касры, за которой следует y без диакритики, а после длинного u - хамма с последующим голым w. В других случаях эти y и w несут сукун. Вне Корана последнее соглашение встречается крайне редко, до такой степени, что y с сукун будет однозначно читаться как дифтонг / aj /, а w с сукун будет читаться как / aw /.

Например, буквы m-y-l можно читать как английский meel или mail, или (теоретически) также как mayyal или майил. Но если сукун добавляется к y, тогда m не может иметь сукун (потому что две буквы подряд не могут быть сукунаты), не может иметь ammah (потому что в арабском языке никогда не бывает звука uy, если после y не стоит другой гласный звук.), и не может иметь касру (потому что касра перед сукунатом у никогда не встречается за пределами Корана), поэтому у нее должен быть фаттах, и единственное возможное произношение - / маджл / (что означает миля или даже электронная почта). Точно так же m-y-t с сукуном над y может быть mayt, но не mayyit или встречаться, а m-w-t с сукуном на w может быть только mawt, а не спорным (iw невозможно, когда w закрывает слог).

Знаки гласных всегда записываются так, как если бы гласные i‘rāb действительно произносились, даже если их нужно пропускать при фактическом произношении. Таким образом, при написании имени Ахмад необязательно помещать сукун на ḥ, но сукун запрещен на d, потому что он будет нести хамма, если последует любое другое слово, как в Aḥmadu zawjī «Ахмад - мой муж».

Другой пример: предложение, которое на правильном литературном арабском языке должно быть произнесено Aḥmadu zawjun shirrīr «Ахмад - злой муж», обычно неправильно произносится (из-за влияния местных арабских разновидностей) как Aḥmad zawj shirrīr. Тем не менее, для целей арабской грамматики и орфографии это трактуется так, как если бы оно не было неправильно произнесено и как если бы за ним следовало еще одно слово, то есть при добавлении каких-либо знаков гласных они должны добавляться, как если бы произношение было Aḥmadu zawjun sharrīrun с tanwīn 'un' в конце. Итак, добавление знака un tanwīn к последнему r правильно, но на самом деле произнесение этого было бы гиперкоррекцией. Кроме того, никогда не правильно писать сукун на этом r, даже если в реальном произношении оно (и в правильном арабском языке ДОЛЖНО быть) сукунэ.

Конечно, если иараб является сукуном, его можно записать по желанию.

Общие. UnicodeИмяИмя арабским шрифтомТранслит.Фонематическое значение (IPA)
0652ــْـsukūnسُكُون(без гласной с этой согласной буквой или. дифтонг с этой длинной гласной буквой)
0670ــٰـ{alif khanjariyyah [кинжал 'алиф - меньший' алиф написано над согласным]أَلِف خَنْجَرِيَّةā/ aː /

ٰٰ Сукун также используется для транслитерации слов в арабское письмо. Например, персидское слово ماس m (маск, от английского слова «маска») может быть написано с сукуном над ﺱ, чтобы обозначить, что между этой буквой и нет гласного звука.

Дополнительные буквы

Региональные различия

Некоторые буквы принимают традиционно другую форму в определенных регионах:

БукваОбъяснение
ИзолированныйОкончательныйСреднийНачальный
ڛـڛـڛـڛـТрадиционная форма для обозначения буква sīn س, редко используется в областях, на которые влияет персидское письмо и бывшее османское письмо.
ڢـڢـڢـڢـТрадиционный вариант Магриба (кроме Ливии и Алжира) слова fā 'ف.
ڧ / ٯـڧ / ـٯـڧـڧـТрадиционный вариант магрибского кафа (кроме Ливии и Алжира) qāf ق. Обычно без точек в изолированном и конечном положениях и с точками в начальной и медиальной формах.
کـکـکـکـАльтернативная версия kāf ك, особенно используемая в Магриби под влияние османской письменности или сценария Персидского залива под влиянием персидской письменности.
یـیـیـیـТрадиционный стиль написания или печати букв, и остается таковым в регионе долины Нила (Египет, Судан, Южный Судан и т. Д.), А иногда и в Магрибе; yā ’ي без точки в изолированном и конечном положении. Визуально идентичен alif maqṣūrah ى ; напоминая персидско-арабскую букву یـ ـیـ ـی ی, которая также использовалась в Османском турецком.

неродных буквах стандартного арабского

Некоторые модифицированные буквы используются для обозначения не -родные звуки современного стандартного арабского языка. Эти буквы используются в транслитерированных именах, заимствованиях и диалектных словах.

БукваЗначениеПримечание
Иностранные буквы
پ /p /Иногда используется при транслитерации иностранных имен и заимствованных слов. Может быть заменено на bā ’ب и произносится как таковое.
ڤ /v /Используется в заимствованных словах и диалектных словах вместо fā ’ف. Не путать с ڨ.
ڥ Используется в Тунисе, Алжире и Марокко.
چ /t͡ʃ /Иногда используется при транслитерации иностранных имен и заимствований, а также в диалектах Персидского залива и арабского. Последовательность تش tāʼ - shīn обычно предпочтительна (например, تشاد для «Чад »).
/ʒ /Используется в Египте и может быть сокращением от / d͡ʒ /, где ج произносится / ɡ /.
/ɡ /Используется в Израиле, например, на дорожных знаках.
گ Используется в Северо-Западной Африке и Западной Азии.
ڨ Используется в Тунисе и Алжире для заимствований и диалектного произношения qāf ق в некоторых словах. Не путать с ڤ.
ڭ Используется в Марокко.
  1. /t͡ʃ / считается родной фонемой / аллофоном в некоторых диалектах, например Кувейтский и иракский диалекты.
  2. /ʒ / считается родной фонемой в левантийских и североафриканских диалектах и ​​как аллофон в других диалектах.
  3. /ɡ / считается родной фонемой / аллофоном в большинстве современных арабских диалектов.

Используется в других языках. кроме арабского

Цифры

Западный. (Магриб, Европа)Центральный. (Ближний Восток)Восточный
ПерсидскийУрду
0٠۰۰
1١۱۱
2٢۲۲
3٣۳۳
4٤۴۴
5٥۵۵
6٦۶۶
7٧۷۷
8٨۸۸
9٩۹۹
10١٠۱۰۱۰

Существует два основных вида цифр, используемых вместе с арабским текстом; западные арабские цифры и восточные арабские цифры. На большей части территории современной Северной Африки используются обычные западные арабские цифры. Как и западные арабские цифры, в восточных арабских цифрах единицы всегда крайние правые, а максимальное значение - крайнее левое.

Буквы в виде цифр

Кроме того, для представления чисел может использоваться арабский алфавит (цифры Абджада ). Это использование основано на порядке алфавита шабджади. أ alif - 1, ب bāʾ - 2, ج jīm - 3, и так далее, пока ي yāʾ = 10, ك kāf = 20, ل lām = 30,..., ر rāʾ = 200,..., غ ghayn = 1000. Иногда это используется для создания хронограмм.

История

Эволюция ранней арабской каллиграфии (9–11 века). Басмала взята в качестве примера из рукописей Куфика Корана. (1) В письме начала IX века не использовались точки или диакритические знаки; (2) и (3) в IX – X веках во времена династии Аббасидов система Абу аль-Асвада использовала красные точки, где каждое расположение или положение указывало на разные короткие гласные. Позже была использована вторая система черных точек, чтобы различать такие буквы, как fā ’и qāf; (4) в XI веке (система аль-Фарахиди ) точки были изменены на формы, напоминающие буквы, чтобы транскрибировать соответствующие длинные гласные. Эта система используется сегодня.

Арабский алфавит восходит к набатейскому алфавиту, который использовался для записи набатейского. Первый известный текст арабского алфавита - это надпись конца IV века из Джабаль Рамма (50 км к востоку от 'Акабы ) в Иордании, но первая датированная одна - трехъязычная надпись в Сирии от 512. Однако эпиграфическая запись чрезвычайно редка, и только пять, безусловно, доисламских арабских надписей сохранились, хотя некоторые другие могут быть доисламскими. Позже над и под буквами были добавлены точки, чтобы различать их. (В арамейском языке было меньше фонем, чем в арабском, и некоторые изначально отдельные арамейские буквы стали неразличимы по форме, так что в ранних произведениях 15 различных форм букв должны были отвечать за 28 звуков; ср. Столь же неоднозначные Пехлеви алфавит.) Первым сохранившимся документом, который определенно использует эти точки, является также первый сохранившийся арабский папирус (PERF 558 ), датированный апрелем 643 года, хотя они не стали обязательными. пока гораздо позже. Важные тексты часто заучивались и до сих пор часто заучиваются, особенно в заучивании Корана.

Еще позже были введены гласные знаки и хамза, начиная с некоторого времени во второй половине VII века, до первого изобретения Сирийский и ивритская вокализация. Первоначально это было сделано с помощью системы красных точек, которая, как говорят, была введена в действие в эпоху Омейядов Абу аль-Асвад аль-Дуали точкой над = a, a точка ниже = i, точка на линии = u и сдвоенные точки обозначают соединение. Однако это было громоздко, и его легко спутать с точками, различающими буквы, поэтому примерно 100 лет спустя была принята современная система. Система была доработана около 786 г. аль-Фарахиди.

арабскими печатными машинами

, хотя Наполеон Бонапарт обычно получает признание за внедрение печатного станка в Египет во время его вторжения в эту страну в 1798 году, и хотя он действительно принес печатные станки и станки с арабским шрифтом, чтобы напечатать официальную газету французских оккупантов Al-Tanbiyyah («Курьер»), печатание на арабском языке началось несколькими веками ранее.

В 1514 году, после того, как Гутенберг изобрел печатный станок в 1450 году, Грегорио де Грегори, венецианец, опубликовал целый молитвенник арабским шрифтом; он назывался Китаб Салат ас-Саваи и предназначался для восточных христианских общин.

Между 1580 и 1586 годами шрифтовой дизайнер Роберт Гранжон разработал арабские шрифты для Кардинала. Фердинандо Медичи и Медичи пресс опубликовали множество христианских молитв и научных арабских текстов в конце XVI века.

Маронитские монахи в монастыре Маар Кужай в Гора Ливан опубликовала первые арабские книги на Ближнем Востоке с использованием подвижного шрифта. Монахи транслитерировали арабский язык, используя сирийский шрифт.

Ювелир (например, Гутенберг) разработал и внедрил на Ближнем Востоке печатный станок с подвижным шрифтом арабского алфавита. Греческий православный монах установил арабский печатный станок с подвижным шрифтом в монастыре Святого Иоанна в городе Дхур Эль Шувайр в Горном Ливане, первая самодельная пресса в Ливане с использованием арабского письма. Он лично вырезал формы для шрифта и создал шрифт. Первая книга вышла из печати в 1734 году; этот печатный станок использовался до 1899 года.

Компьютеры

Арабский алфавит может быть закодирован с использованием нескольких наборов символов , включая ISO-8859-6, Windows-1256 и Unicode (см. Ссылки в информационном окне выше), последнее благодаря «арабскому сегменту», записи от U + 0600 до U + 06FF. Однако ни один из наборов не указывает форму, которую должен принимать каждый символ в контексте. Механизму рендеринга остается выбрать правильный глиф для отображения для каждого символа.

Каждая буква имеет независимую от позиции кодировку в Unicode, и программное обеспечение для визуализации может определить правильную форму глифа (начальную, среднюю, конечную или изолированную) из контекста соединения. Это текущая рекомендация. Однако для совместимости с предыдущими стандартами начальная, медиальная, конечная и изолированные формы также могут кодироваться отдельно.

Unicode

Начиная с Unicode 13.0, арабский шрифт содержится в следующих блоках :

Базовый арабский диапазон кодирует стандартные буквы и диакритические знаки, но не кодирует контекстные формы (U + 0621-U + 0652 напрямую основан на ISO 8859-6 ). Он также включает наиболее распространенные диакритические знаки и арабско-индийские цифры. U + 06D6 - U + 06ED кодируют знаки аннотации Корана, такие как «конец аята » ۝ۖ и «начало руб эль-хизб » ۞. Диапазон дополнений на арабском языке кодирует варианты букв, которые в основном используются для написания африканских (неарабских) языков. Арабский диапазон Extended-A кодирует дополнительные коранические аннотации и варианты букв, используемые для различных неарабских языков.

Диапазон форм арабского представления - диапазон кодирует контекстные формы и лигатуры вариантов букв, необходимых для персидского, урду, синдхи и языков Центральной Азии. Диапазон арабских форм представления-B кодирует формы интервалов арабских диакритических знаков и более контекстные формы букв. Блок арабских математических алфавитных символов кодирует символы, используемые в арабских математических выражениях.

См. Также примечания к разделу измененные буквы.

Клавиатуры

Арабская раскладка клавиатуры Mac Арабская раскладка клавиатуры ПК Intellark, наложенная на раскладку клавиатуры QWERTY

Клавиатуры, разработанные для разных стран, имеют разную раскладку, поэтому владение одним стилем клавиатуры, например Ираком, не переходит в владение другим, например Саудовской Аравией. Различия могут включать расположение не алфавитных символов.

Все арабские клавиатуры позволяют вводить латинские символы, например, для URL-адреса в веб-браузере. Таким образом, на каждой арабской клавиатуре нанесены как арабские, так и латинские символы. Обычно латинские символы на арабской клавиатуре соответствуют раскладке QWERTY, но в Северной Африке, где французский является наиболее распространенным языком, набираемым с использованием латинских символов, арабские клавиатуры: AZERTY.

Для кодирования определенной письменной формы символа в Unicode предусмотрены дополнительные кодовые точки, которые можно использовать для точного выражения желаемой письменной формы. Диапазон форм арабского представления A (от U + FB50 до U + FDFF) содержит лигатуры, а диапазон форм арабского представления B (от U + FE70 до U + FEFF) содержит позиционные варианты. Эти эффекты лучше достигаются в Юникоде при использовании объединителя нулевой ширины и не-соединителя, поскольку эти формы представления не рекомендуются в Юникоде и обычно должны использоваться только во внутреннем устройстве программное обеспечение для визуализации текста при использовании Unicode в качестве промежуточной формы для преобразования между кодировками символов или для обратной совместимости с реализациями, которые полагаются на жесткое кодирование форм глифов.

Наконец, кодировка Unicode арабского языка находится в логическом порядке, то есть символы вводятся и сохраняются в памяти компьютера в том порядке, в котором они пишутся и произносятся, не беспокоясь о направлении в которые они будут отображаться на бумаге или на экране. Опять же, механизму визуализации остается представить символы в правильном направлении, используя функции Unicode двунаправленного текста. В этом отношении, если арабские слова на этой странице написаны слева направо, это указывает на то, что механизм обработки Unicode, используемый для их отображения, устарел.

Существуют конкурирующие онлайн-инструменты, например Редактор ямли, который позволяет вводить арабские буквы без поддержки арабского языка, установленной на ПК, и без знания раскладки арабской клавиатуры.

Распознавание рукописного ввода

Первая в мире программа такого рода, которая определяет арабский почерк в режиме реального времени, была разработана исследователями из Университета Бен-Гуриона (BGU).

Прототип позволяет пользователю писать арабские слова вручную на электронном экране, который затем анализирует текст и переводит его в печатные арабские буквы за тысячную долю секунды. По словам доктора Джихада Эль-Саны из отдела компьютерных наук Университета штата Вашингтон, который разработал систему вместе со магистрантом Фади Биадси, частота ошибок составляет менее трех процентов.

См. Также

Wikimedia Commons содержит материалы, связанные с арабским алфавитом.

Ссылки

Внешние ссылки


Эта статья содержит основные разделы текста из очень подробной статьи арабский алфавит Из французской Википедии, которая частично переведена на английский. Дальнейший перевод этой страницы и включение в текст приветствуются.

Последняя правка сделана 2021-06-11 23:14:06
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте