Транслитерация деванагари

редактировать
Транслитерация деванагари в латинский алфавит

Деванагари - это индийский сценарий используется для языков, включая хинди, маратхи, непальский и санскрит. Существует несколько схожих методов транслитерации от деванагари до латинского алфавита (процесс, который иногда называют романизацией ), включая влиятельные и без потерь IAST нотация.

Содержание

  • 1 IAST
  • 2 Система Хантера
  • 3 Альтернативные методы транслитерации
    • 3.1 Схемы с диакритическими знаками
      • 3.1.1 Национальная библиотека в латинизации Калькутты
      • 3.1.2 ISO 15919
    • 3.2 Схемы ASCII
      • 3.2.1 Гарвард-Киото
      • 3.2.2 Схема ITRANS
      • 3.2.3 Velthuis
      • 3.2.4 SLP1
      • 3.2. 5 Другое
  • 4 Сравнение транслитерации
    • 4.1 Гласные
    • 4.2 Согласные
    • 4.3 Неправильные группы согласных
    • 4.4 Другие согласные
    • 4.5 Сравнение IAST с ISO 15919
  • 5 Подробности
    • 5.1 Обработка врожденных шва
    • 5.2 Ретрофлексные согласные
    • 5.3 Придыхательные согласные
  • 6 Использование компьютера как средство латинизации
  • 7 История санскритской транслитерации
  • 8 См. Также
  • 9 Ссылки
  • 10 Внешние ссылки

IAST

The Международный алфавит санскритской транслитерации (IAST) - это подмножество стандарта ISO 15919, используемого для транслитерации санскрита, пракрита и Пани на латиницу с диакритическими знаками. IAST - широко используемый стандарт. Он использует диакритические знаки для устранения неоднозначности фонетически похожих, но не идентичных санскритских глифов. Например, зубные и ретрофлексные согласные устраняются с помощью нижней точки: зубной द = d и ретрофлексный ड = ḍ. Важной особенностью IAST является то, что он обратим без потерь, то есть транслитерация IAST может быть преобразована обратно в правильный деванагари или другие южноазиатские сценарии без двусмысленности. Многие шрифты Unicode полностью поддерживают отображение и печать IAST.

Система Хантера

Система Хантера - это «национальная система латинизации в Индии», официально принятая Правительством Индии.

Система Хантера была разработана в девятнадцатом веке Уильямом Уилсоном Хантером, тогдашним генеральным инспектором Индии. Когда он был предложен, он сразу же встретил сопротивление сторонников ранее практиковавшегося несистематического и часто искажающего «метода сэра Роджера Даулера» (раннее искажение Сирадж уд-Даула ) фонетической транскрипции, что достигло апогея. в драматическом противостоянии на заседании Совета Индии 28 мая 1872 года, когда победил новый метод Хантера. Метод Хантера был по своей сути более простым и расширяемым до нескольких индийских алфавитов, потому что он систематизировал графему транслитерацию, и он стал преобладающим и получил признание правительства и академических кругов. Противники модели транслитерации графемы продолжали предпринимать безуспешные попытки изменить политику правительства до начала века, при этом один критик призвал «правительство Индии отказаться от всех попыток научной (т. Е. Хантеровской) транслитерации и решить один раз и для всех за возврат к старому фонетическому правописанию ".

Со временем Хантерский метод расширился и охватил несколько индийских алфавитов, включая бирманский и тибетский. Положения для делеции schwa в индоарийских языках также были сделаны там, где это применимо, например хинди कानपुर транслитерируется как kānpur (а не kānapura), но санскритский क्रम транслитерируется как krama (а не kram). Система со временем претерпела некоторые изменения. Например, долгие гласные были помечены диакритическим знаком в исходной версии, но позже он был заменен в обновлении правительства Индии 1954 года на макрон. Таким образом, जान (жизнь) ранее латинизировалась как джан, но стала романизироваться как джан. Система Хантера на протяжении многих лет подвергалась критике за то, что не давала фонетически точных результатов и была «беззастенчиво ориентирована на англоязычную аудиторию получателей». В частности, отсутствие различий между ретрофлексом и зубным согласными (например, द и ड представлены как d) неоднократно подвергалось критике и вдохновляло на несколько предложенных модификаций Хантера, в том числе с использованием диакритический знак под ретрофлексами (например, создание द = d и ड = ḍ, что более читабельно, но требует диакритической печати) или их заглавные буквы (например, создание making = d и ड = D, что не требует диакритической печати, но менее читаемо, потому что смешивает строчные и заглавные буквы в словах).

Альтернативные методы транслитерации

Схемы с диакритическими знаками

Национальная библиотека в латинизации Калькутты

Национальная библиотека в Латинизация Калькутты, предназначенная для латинизации всех индийских сценариев, является расширением IAST. Он отличается от IAST использованием символов ē и ō для ए и ओ (e и o используются для коротких гласных, присутствующих во многих индийских языках), использованием 'ḷ' для согласных (в Kannada ) ಳ, а также отсутствие символов для ॠ, ऌ и ॡ.

ISO 15919

Стандартное соглашение транслитерации не только для деванагари, но и для всех южноазиатских языков было кодифицировано в стандарте ISO 15919 2001 года, обеспечивая основу для современные электронные библиотеки, соответствующие нормам Международной организации по стандартизации (ISO). ISO 15919 определяет общую основу Unicode для латинской транслитерации южноазиатских текстов на самых разных языках / сценариях.

Транслитерация ISO 15919 - это платформенно-независимые тексты, поэтому их можно одинаково использовать во всех современных операционных системах и программных пакетах, если они соответствуют нормам ISO. Это предварительное условие для всех современных платформ, так что ISO 15919 стал новым стандартом для цифровых библиотек и архивов для транслитерации всех южноазиатских текстов.

ISO 15919 использует диакритические знаки для отображения гораздо больших набор брахмических графем на латинице. Часть, относящаяся к деванагари, почти идентична академическому стандарту IAST : «Международный алфавит санскритской транслитерации» и ALA-LC, стандарту Библиотеки Конгресса США. 79>

Другой стандарт, Системы латинизации географических названий Организации Объединенных Наций (UNRSGN), был разработан Группой экспертов ООН по географическим названиям (UNGEGN) и охватывает многие брахмические шрифты. Между ISO 15919 и UNRSGN есть некоторые различия.

Схемы ASCII

Гарвард-Киото

По сравнению с IAST, Гарвард-Киото выглядит намного проще. Он не содержит диакритических знаков , которые содержит IAST. Вместо диакритических знаков Гарвард-Киото использует заглавные буквы. Использование заглавных букв значительно упрощает набор текста в Гарвард-Киото, чем в IAST, но позволяет получать слова с заглавными буквами внутри.

Схема ITRANS

ITRANS является расширением Гарвард-Киото. Многие веб-страницы написаны на ITRANS. Многие форумы также написаны на ITRANS.

Схема транслитерации ITRANS была разработана для программного пакета ITRANS, препроцессора для индийских скриптов. Пользователь вводит латинские буквы, и препроцессор ITRANS преобразует латинские буквы в деванагари (или другие индийские сценарии). Последней версией ITRANS является версия 5.30, выпущенная в июле 2001 года.

Velthuis

Недостатком вышеупомянутых схем ASCII является чувствительность к регистру, Это означает, что имена в транслитерации не должны начинаться с заглавной буквы. Этой трудности можно избежать с помощью системы, разработанной в 1996 году Франсом Велтуисом для TeX, которая частично основана на IAST, и в этом случае это не имеет значения.

SLP1

SLP1 (Фонетическая библиотека санскрита) - это чувствительная к регистру схема, первоначально использовавшаяся Библиотекой санскрита, которая была разработана Питером Шарфом и (покойным) Малкольмом Хайманом, которые впервые описали это в приложении B своей книги «Лингвистические проблемы кодирования санскрита». Преимущество SLP1 перед другими кодировками заключается в том, что для каждой буквы деванагари используется один символ ASCII, что облегчает обратную транслитерацию.

Другое

Другие менее популярные схемы ASCII включают WX нотация, Vedatype и 7-битный ISO 15919. Нотация WX - это схема транслитерации для представления индийских языков в ASCII. Он возник в IIT Kanpur для вычислительной обработки индийских языков и широко используется в сообществе обработки естественного языка (NLP) в Индии. Эта схема описана в НЛП Панини (Приложение B). Он похож на SLP1, но не так универсален, как охват ведического санскрита. Сравнение WX с другими схемами можно найти в Huet (2009), приложение A.. Ведатип - еще одна схема, используемая для кодирования ведических текстов в Университете управления Махариши. Утилита онлайн-транскодирования для всех этих схем доступна в Sanskrit Library. ISO 15919 включает в себя так называемую опцию «ограниченного набора символов» для замены диакритических знаков префиксами, чтобы он был совместим с ASCII. Наглядное объяснение здесь из Энтони Стоуна.

Сравнение транслитерации

Ниже приводится сравнение основных методов транслитерации, используемых для Деванагари.

Гласные

Деванагари IAST ISO 15919 Гарвард-Киото ITRANS Велтуис SLP1 WX
aaaaaaa
āāAA / aaaaAA
iiiiiii
īīII / iiiiII
uuuuuuu
ūūUU/uuuuUU
eēeeeee
aiaiaiaiaiEE
oōooooo
auauauauauOO
RRRi/R^i.rfq
r̥̄RRRRI/R^I.rrFQ
lRLLi / L ^ i.lxL
l̥̄lRRLLI / L ^ I.llXLY
अंMM /.n /.m.mMM
अःHH.hHH
अँ.N~az
''.a.a'Z

Согласные

За отдельными согласными буквами деванагари следует неявное шва (/ Ə /). Во всех системах транслитерации это / Ə / должно быть явно представлено с помощью буквы «a» или любого эквивалента слова shwa.

Деванагари IAST ISO 15919 Гарвард-Киото ITRANS Велтуис SLP1 WX
kakakakakakaka
khakhakhakhakhaKaKa
gagagagagagaga
ghaghaghaghaghaGaGa
ṅaṅaGa~Na"naNafa
cacacachacacaca
chachachaChachaCaCa
jajajajajajaja
jhajhajhajhajhaJaJa
ñañaJa~na~ naYaFa
ṭaṭaTaTa.tawata
ṭhahaThaTha.thaWaTa
ḍaḍaDaDa.daqada
ḍhahaDhaDha.dhaQaDa
ṇaṇaNaNa.naRaNa
tatatatatatawa
thathaтхатхатхаTaва
dadadadadadaха
дхадхадхадхаdhaDaXa
nanananananana
papapapapapapa
phaphaphaphaphaPaПа
babababababaба
бхабхабхабхабхаBaБа
mamamamamamaма
yayayayayayaя
rarararararaра
lalalalalalaла
vavavaва / ваvavaва
śaśazaша"саSaСа
ṣaṣaSaШ a.sazaRa
sasasasasasasa
hahahahahahaha

Нерегулярные группы согласных

Деванагари ISO 15919 Гарвард-Киото ITRANS Велтуис SLP1 WX
क्षkṣakSakSa / kSha / xak.sakzakRa
त्रtratratratratrawra
ज्ञjñajJaGYa / j ~ naj ~ najYajFa
श्रśrazrashra"srasraSra

Другие согласные

Деванагари ISO 15919 ITRANS WX
क़qaqakZa
ख़k͟haKaKZa
ग़ġaGagZa
ज़zazajZa
फ़fafaPZa
ड़ṛa.DadZa
ढ़ṛha.Dha/RhaDZa

Сравнение IAST с ISO 15919

В таблице ниже показаны только различия между ISO 15919 и IAST для транслитерации деванагари.

ДеванагариISO 15919IASTКомментарий
ए / ेēeЧтобы различать длинную и короткую 'e' в дравидийских языках, 'e' теперь представляет ऎ / ॆ (короткое). Обратите внимание, что использование ē считается необязательным в ISO 15919, а использование e вместо ए (длинного) допустимо для языков, которые не различают длинное и короткое e.
ओ / ोōoЧтобы различать длинное и короткое «о» в дравидийских языках, «о» теперь представляет ऒ / ॊ (короткое). Обратите внимание, что использование считается необязательным в ISO 15919, а использование o для ओ (длинного) допустимо для языков, которые не различают длинное и короткое o.
ऋ / ृВ ISO 15919, ṛ используется для обозначения ड़.
ॠ / ॄr̥̄Для согласованности с r̥
ऌ / ॢВ ISO 15919, ḷ используется для обозначения ळ.
ॡ / ॣl̥̄Для согласования с l̥
◌ंISO 15919 имеет два варианта анусвары. (1) В упрощенном варианте назализации анусвара всегда транслитерируется как ṁ. (2) В варианте строгой назализации, anusvāra перед согласным класса транслитерируется как назальный класс - ṅ перед k, kh, g, gh, ṅ; ñ перед c, ch, j, jh, ñ; ṇ перед ṭ, ṭh, ḍ, ḍh, ṇ; n перед t, th, d, dh, n; м перед p, ph, b, bh, m. ṃ иногда используется для обозначения Гурмукхи Типпи ੰ.
ṅ ñ ṇ nm
◌ँНазализация гласных транслитерируется как тильда над транслитерированной гласной (над второй гласной в случай орграфа, такого как aĩ, aũ), кроме санскрита.

Подробности

Обработка врожденных шва

согласных деванагари включает звук «врожденный а», называемый шва, который должен быть явно представлен через «а» символ в транслитерации. Многие слова и имена, транслитерированные с деванагари, заканчиваются на «а», чтобы обозначить произношение в оригинальном санскрите. Эта шва обязательно удаляется в нескольких современных индоарийских языках, таких как хинди, пенджаби, маратхи и другие. Это приводит к разным транслитерациям для санскрита и языков, удаляющих шва, которые сохраняют или удаляют шва в зависимости от ситуации:

  • Санскрит: Махабхарата, Рамаяна, Шива, Самаведа
  • Хинди: Махабхарат, Рамаях, Шив, 378>В некоторых словах может оставаться финальная буква а, как правило, потому что без нее было бы трудно произнести их:

    • Кришна, Ваджра, Маурья

    Ретрофлексные согласные

    Большинство индийских языков составляют различие ретрофлексной и зубной форм зубных согласных. В формальных схемах транслитерации стандартные латинские буквы используются для обозначения стоматологической формы, а ретрофлексная форма обозначается специальными знаками или использованием других букв. Например, в транслитерации IAST ретрофлексными формами являются ṇ, ṭ, ḍ и ṣ.

    В большинстве неофициальных транскрипций не указывается различие между ретрофлексными и зубными согласными. Однако многие используют ретрофлексные согласные на QWERTY-клавиатуре в неформальном обмене сообщениями. Это обычно устраняет необходимость в транслитерации.

    Придыхательные согласные

    Если буква «h» появляется после взрывного согласного в транслитерации деванагари, это всегда указывает на стремление. Таким образом, «ph» произносится как p в «яме» (с небольшим выпуском воздуха, как говорится), но никогда как ph на «фото» (IPA / f /). (С другой стороны, «р» произносится как «р» в «плевать» без выпуска воздуха.) Точно так же «й» - это придыхаемое «т», ни й из «этого» (звучит, IPA / ð /) ни й из «тонких» (неголосовых, IPA / θ /).

    Стремление обычно указывается как в формальной, так и в неформальной системах транслитерации.

    Использование компьютера как движущая сила для латинизации

    Поскольку английский широко используется в качестве профессионального языка и языка высшего образования в Индии, доступность клавиатур деванагари затмевается английскими клавиатурами. Точно так же программное обеспечение и пользовательские интерфейсы, выпускаемые и продвигаемые в Индии, ведутся на английском языке, как и большая часть доступного там компьютерного образования. Из-за низкой осведомленности о раскладке клавиатуры Деванагари многие индийские пользователи вводят хинди латинскими буквами.

    До того, как Деванагари был добавлен в Unicode, для отображения Деванагари в Интернете использовалось множество обходных путей, и многие сайты и службы продолжали их использовать, несмотря на широкую доступность шрифтов Unicode, поддерживающих Деванагари. Хотя существует несколько соглашений о транслитерации хинди в римский, в большинстве из них используются диакритические знаки. Поскольку большинство индийцев знакомы с латинским письмом через английский язык (который традиционно не использует диакритические знаки), эти системы транслитерации гораздо менее известны. Большинство таких «романагари» транслитерируются произвольно, чтобы имитировать английское правописание, что приводит к многочисленным несоответствиям.

    Это также вредно для поисковых систем, которые не классифицируют текст на хинди с латинским шрифтом как хинди. Этот же текст также нельзя отнести к английскому.

    Независимо от раскладки физической клавиатуры, можно в большинстве современных операционных систем. Существует множество доступных онлайн-сервисов, которые точно транслитерируют текст, написанный с римского на деванагари, используя словари хинди для справки, например Google transliteration. Это решение похоже на Метод ввода Редакторы, которые традиционно используются для ввода текста на языках, использующих сложные символы, таких как китайский, японский или корейский..

    История транслитерации санскрита

    Ранние санскритские тексты первоначально передавались путем запоминания и повторения. В постхараппской Индии не было системы письменности индийских языков до создания (в IV-III вв. До н. Э.) Письменностей Харошти и брахми. Эти системы письма, хотя и подходили для среднеиндийских языков, не были хорошо приспособлены для написания санскрита. Однако более поздние потомки Брахми были модифицированы так, чтобы они могли записывать санскрит с точными фонетическими деталями. Самый ранний физический текст на санскрите - это наскальная надпись западного кшатрапа правителя Рудрадамана, написанная ок. 150 г. н. Э. В Джунагадх, Гуджарат. Из-за значительного распространения различных разновидностей брахми в средние века, сегодня нет единого письма, используемого для написания санскрита; скорее, ученые, изучающие санскрит, могут писать на этом языке с помощью любого шрифта, который используется для написания на их местном языке. Однако, начиная с позднего средневековья, существует тенденция использовать деванагари для написания санскритских текстов для широкого круга читателей.

    Западные ученые в XIX веке использовали деванагари для печатных изданий санскритских текстов. editio princeps из Ригведы автора Макса Мюллера находился в Деванагари. Лондонские наборщики Мюллера соревновались со своими петербургскими коллегами, работавшими над словарем Бётлингка и Рота, в вырезании всех необходимых типов лигатур.

    С самого начала западная санскритская филология также ощущала потребность в латинизированном написании языка. Франц Бопп в 1816 году использовал схему латинизации наряду с деванагари, которая отличается от IAST по длине гласных. с циркумфлексом (â, î, û), а стремление - с помощью spiritus asper (например, bʽ для IAST bh). Сибилянты IAST ṣ и ś он выразил с помощью spiritus asper и lenis, соответственно (sʽ, sʼ). Монье-Уильямс в своем словаре 1899 года использовал ć, ṡ и sh для обозначений IAST c, ś и ṣ соответственно.

    С конца 19 века интерес Запада к верстке деванагари уменьшился. Теодор Ауфрехт опубликовал свое издание Ригведы 1877 года на латинизированном санскрите, а Артур Макдонелл в 1910 году. Ведическая грамматика (и ведическая грамматика 1916 года для студентов) также обходятся без Деванагари (в то время как его вводная грамматика санскрита для студентов сохраняет деванагари вместе с латинизированным санскритом). Современные западные издания санскритских текстов появляются в основном в IAST.

    См. Также

    Ссылки

    Внешние ссылки

    В Wikibooks есть книга на тему: Деванагари
    Викигид есть путеводитель по Learning Devanagari.
Последняя правка сделана 2021-05-17 03:31:55
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте