Транслитерация Баквальтера

редактировать
Система транслитерации арабского алфавита в латинский алфавит

Баквальтер Арабская транслитерация был разработан в рамках арабского проекта ALPNET, проводимого доктором Кеном Бисли в 1988 году.

Содержание

  • 1 Начало
    • 1.1 Комментарий к системе
  • 2 Ключевые концепции в разработке таблицы
  • 3 Таблица транслитерации Баквальтера
  • 4 Объяснение мнемоники, используемой в транслитерации Баквальтера
  • 5 Пример
    • 5.1 Арабский текст
    • 5.2 Транслитерация Баквальтера
    • 5.3 Английский текст
  • 6 Примечания
  • 7 Внешние ссылки

Начало

Первым аналитиком по арабскому языку для проекта был студент бакалавриата BYU по имени Дерек Фоксли, нанятый на полставки. В то время Дерек учился на 4-м курсе арабских курсов в BYU. (см. первую страницу одной из первых презентаций, сделанных доктором Бисли в 1989 году в Университете штата Юта, в сносках перечислены участники в порядке до этого момента). [1] Тим Баквалтер был несколько месяцев спустя был принят на работу в ALPNET на полную ставку. Тим также был докторантом арабского языка в то время. Одна из его задач в проекте заключалась в том, чтобы сотрудничать с Дереком, работающим неполный рабочий день, и назначать ему задания на арабском языке.

Доктор. Бизли наставлял Тима и Дерека в некоторых тонкостях лингвистики (поскольку все они сидели в одном офисе 20x20 в Прово, штат Юта, используя рабочие станции DEC и Sun Sparc). И однажды у доски доктор Бизли подтолкнул Дерека и Тима к созданию схемы транслитерации в этот момент. Дерек вводил большую часть данных на тот момент в проекте, поэтому был готов заняться этим. Тем не менее, в тесном сотрудничестве с Тимом он придумал почти все символы, используемые для таблицы транслитерации. Тим следил за задачами Дерека на арабском языке и внес последние корректировки и уточнения в таблицу транслитерации. В то время у него не было названия, однако Тим за несколько лет после проекта ввел тысячи текстовых элементов, используя схему транслитерации, и представил ее, и отстаивал ее также много раз. Поэтому он был назван в его честь.

В то время такая индивидуальная буквенная транслитерация не использовалась, или, по крайней мере, ни одна из них не была известна команде.

Доктор. Позже Бисли перешел в Xerox, которая купила права на данные ALPNET в 1990-х годах. Это задокументировано в нескольких других статьях, опубликованных доктором Кеном Бисли за эти годы.

Комментарий к системе

Баквальтерская транслитерация - это схема транслитерации только ASCII, представляющая арабскую орфографию строго один к одному, в отличие от более распространенной латинизации схемы, которые добавляют морфологическую информацию, не выраженную арабским шрифтом. Так, например, wāw будет транслитерироваться как w независимо от того, реализован ли он как гласный / uː / или согласный / w /. Только когда wāw изменено на hamzah (ؤ), транслитерация меняется на. Это позволяет пользователю вводить или преобразовывать текст в точности так, как он отображается.

Однако была некоторая критика схемы транслитерации. Некоторые пользователи заявляют, что неизмененные буквы легко читать (за исключением * = dhaal и E = ayin, v = thaa), но транслитерации букв с диакритическими знаками и характером требуется некоторое время, чтобы привыкнуть к, например, nunated -un, -an, -in появляются как N, F, K, а сукун («без гласных») как o. Taʾ marbūṭah ة - p. Сложность, вероятно, возникла из-за того, что обычно используется и / или представляется Баквальтерская транслитерация без объяснения букв. Хотя эти буквы кажутся случайными, на самом деле они мнемонически связаны с исходной буквой.

Кроме того, с тех пор, как была разработана оригинальная схема Баквальтера, появилось несколько других вариантов, хотя не все они стандартизированы. Транслитерация Баквальтера несовместима с XML, поэтому в «безопасных для XML» версиях часто изменяются следующие символы: <>(أ إ и ؤ соответственно; Баквалтер предлагает транслитерировать их как I O W, соответственно). В полностью «безопасных» схемах транслитерации все не буквенно-цифровые символы (например, $ '; *) заменяются буквенно-цифровыми. Полное описание различных схем Баквальтера, а также более подробное обсуждение компромиссов между различными схемами см. В.

При транслитерации арабского текста может возникнуть ряд других проблем. Во-первых, некоторые арабские символы не указаны в таблице транслитерации, включая неалфавитные символы, такие как ۞ и ۝, знаки препинания, такие как ؛ ؟ И «хинди» или «восточноарабские» цифры. Точно так же иногда арабские предложения будут заимствовать неарабские буквы из персидского, некоторые из которых определены в полной таблице Баквальтера. Символы, которые не определены в таблице транслитерации, могут быть удалены, сохранены как нелатинские символы, встроенные в транслитерированный текст, или транслитерированы в другие (не конфликтующие) латинские символы. (Например, легко преобразовать числа хинди в арабские.) Другая проблема, которая возникает, - как обрабатывать транслитерацию арабского текста со встроенным текстом ASCII; например, предложение на арабском языке, относящееся к «IBM», или предложение на арабском языке, содержащее цитату на английском языке. Если латинский текст не обозначен явно, то отличить транслитерированный арабский язык от латинского - проблема. Если транслитерированный текст со встроенной латиницей позже транслитерируется обратно на арабский язык, латинский текст будет транслитерирован на мусорный арабский язык. Наконец, еще одно важное решение, которое необходимо принять, - насколько нормализация арабского текста должна выполняться во время транслитерации. Это может включать удаление ـ кашида, удаление коротких гласных и / или других диакритических знаков и / или нормализацию правописания.

С другой стороны, все типичные обозначения, которые можно было бы использовать при письме -! @ #%?.,; :() + = не использовались, потому что они также используются в арабском тексте. Таким образом, если английское слово IBM действительно появилось на английском языке, то в арабском тексте оно в исходной концепции должно было быть помечено двойными кавычками «IBM». Этот механизм позволяет выполнять автоматическую языковую обработку, оставляя неарабский текст как есть, необработанный, когда он видит двойные кавычки. Первоначально даже <>не использовались, особенно <>, которые являются заимствованными французскими кавычками, потому что они иногда используются в арабском тексте. Они были добавлены позже по необходимости. Их безопасные XML-версии сохраняются с разработанным мнемоническим устройством (и обсуждается ниже) в том смысле, что I O W соответствуют (если неточно) каждому из издаваемых звуков.

Ключевые концепции при разработке таблицы

В схеме транслитерации использовались три ключевых концепции:

Первый заключался в том, что каждая арабская буква (звук) может соответствовать только одной Персонаж английского языка. Некоторые арабские буквы при написании издают звук, соответствующий двум английским буквам. Следовательно, для них необходимо использовать одну букву или общий символ.

Вторая концепция заключалась в том, чтобы по возможности использовать знакомое. Если бы арабская буква всегда ассоциировалась с буквой «s» в английском языке, например, тогда было бы легче запомнить, если бы ее можно было сохранить таким образом. (Не изобретайте велосипед!)

Третья ключевая концепция заключалась в том, что таблица должна быть полностью и легко мнемонической. Следовательно, каждый отдельный элемент соотносится в следующем порядке предпочтения: а) со звуком арабской буквы или б) с физическим аспектом исходной арабской буквы или, в) в имя, которое оно называется.

Механика

Предпочтительно использовались строчные буквы. Однако, когда есть несколько арабских букв, которые имеют похожие звуки, тогда для более открытых звуков использовалась строчная буква, а для более близких / ограниченных звуков использовалась буква верхнего регистра. Например, в арабском языке есть 2 буквы со звуком «д». Более открытый звук получил маленькую букву «d», а более тяжелый и закрытый звук получил верхний регистр «D».

Другими словами, верхний регистр указывает на то, что буква похожа на строчную букву, но имеет некоторое качественное отличие.

Таблица транслитерации Баквальтера

Арабскими буквами ا ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ه و ي ی
DIN 31635 ʾ / ā bt ǧ d rzsš ʿ ġ fqklmnhс ū yī
БаквалтеромAvjHx*$SDTZEgwyY
Калам '/ aathkhdhsh`ghy
BATR A / aacKz 'xEgw / uuyii
IPA (MSA )ʔ, aːb t θ . ɡ. ʒ ħ x d ð r z s ʃ ðˤ. ʕ ɣ f q k l m n h w, uːj, iː
хамза
  • одинокий хамза: '
  • хамза на алиф:>
  • хамза ниже алифа: <
  • хамза он ва:
  • хамза он я:}
алиф
  • мадда на алиф: |
  • алиф аль-васла: {
  • кинжал алиф: `
  • алиф максура: Й
харакат
  • фатха: а
  • дамма: и
  • касра: я
  • фатхатайн: Ф
  • дамматайн: Н
  • касратайн К
  • шадда: ~
  • сукун: о
та марбута: п
tatwil: _

Объяснение мнемоники, используемой в транслитерации Баквальтера

ا AЭта буква издает звук «А». Это не строчная буква «а», поскольку это противоречит диакритическому знаку «фета», который имеет более мягкий звук «а»
ب bЭта буква а звук «б» и почти всегда пишется как «б» на английском языке.
ة pЭто «тах марбутах», и буква «р» очень похожа на то, как она написана, когда она связана с предыдущей буквой.
ت tЭта буква издает открытый звук «т» и почти всегда пишется как «т» на английском языке.
ث vЭта буква издает звук «ый», встречающийся в слове «театр». Над ним есть 3 точки, которые при написании выглядят как перевернутая буква «v», поэтому была использована буква «v».
ج jЭта буква в MSA произносится как «j» и почти всегда пишется как «j» на английском языке.
ح HЭта буква издает тяжелый звук «х», издаваемый в задней части рта / горла, и он конфликтует с мягким звуком «х» другой буквы, поэтому используется верхний регистр «H».
خ xЭта буква издает звук «кх», аналогичный тому, как говорящий по-английски произносит название буквы «х».
د dЭта буква - мягкий звук «д» и конфликтует с другой буквой «д», найденной позже, поэтому использовалась строчная буква «д».
ذ *Эта буква издает звук «ый», встречающийся в слове «это». Часто пишется как «ж». Над ним есть точка, поэтому использовалась единственная звездочка, которая похожа на точку над линией.
ر rЭта буква звучит как «р» и почти всегда пишется как «р» на английском языке. Строчная буква «r».
ز zЭта буква звучит как «z» и почти всегда пишется как «z» на английском языке. Строчная буква «z».
س sЭта буква звучит как «s» и почти всегда пишется как «s» на английском языке. Строчная буква «s».
ش $Эта буква похожа на «s», но звучит как «sh», поэтому был использован знак доллара, потому что он выглядит как «s», но также имеет дополнительное свойство (перечеркнутую линию). Мы не могли использовать заглавную букву «S» из-за следующей ниже буквы, которая звучит тяжело. S
ص SЭта буква звучит как «s», но глубже, дальше во рту / горле, поэтому ей дали верхний регистр. Регистр «S», чтобы он не противоречил программным «s», показанным ранее.
ض DЭта буква звучит как «d», но глубже, глубже во рту / горле, поэтому ей присвоена заглавная буква «d», поэтому она не конфликтует с мягким «d», показанным ранее.
ط TЭта буква звучит как «т», но глубже, глубже во рту / горле, поэтому ей присвоена заглавная буква «т», поэтому она не конфликтует с мягким «т», показанным ранее.
ظ ZЭта буква звучит как «th» или «zh», но глубже, дальше во рту / горле, поэтому ей присвоена заглавная буква «Z», поэтому она не конфликтует с мягкой буквой «z», показанной ранее.
ع EУ этой буквы нет эквивалента на английском языке. Итак, использовалась чисто физическая мнемоника . Когда вы смотрите на арабскую букву полностью и на английскую заглавную букву «E» (особенно на написанную от руки букву «E»), они очень похожи.
غ gУ этой буквы нет эквивалента на английском языке. Его часто писали как «gh». Итак, мы сохранили букву "g" и использовали также физическую мнемонику . Он похож на строчную букву «g».
ف fЭта буква звучит как «f» и почти всегда пишется как «f» на английском языке. Строчная буква «f»
ق qЭта буква похожа на букву «q» и в английском языке часто пишется как «q». Нижний регистр «q»
ك kЭта буква звучит как «k» и почти всегда пишется как «k» в английском языке. Строчная буква «k»
ل lЭта буква звучит как «l» и почти всегда пишется как «l» в английском языке. Нижний регистр «l»
م mЭта буква звучит как «м» и почти всегда пишется как «м» в английском языке. Строчная буква «m»
ن nЭта буква звучит как «n» и почти всегда пишется как «n» в английском языке. Нижний регистр «n»
ه hЭта буква звучит как «h» и мягкая. Это противоречит другому более тяжелому звуку «h», показанному выше. Так как этот дает более мягкое звучание «h», был использован нижний регистр.
و wЭта буква звучит как «w», а на английском языке часто пишется как «s».
ی YМы использовали здесь физическую мнемонику, так как она выглядит как следующая буква, но не имеет точек под ней. То же самое и в нашей английской транслитерации (это верхний регистр)
ي yЭта буква звучит как «Y» и часто пишется как «y» на английском языке. Это строчные буквы, а буква выше - верхний регистр.
ًFПо-арабски это называется «fethatain », двойная фетха. Верхний регистр «F», потому что нижний регистр уже используется, а F - напоминание о «Fethatain»
ٌNДвойная «demma» часто упоминается в классах английского языка как «Nunation », это произносится как мягкий звук «ун». Строчные буквы «n» уже используются, плюс согласованность с «F» для удвоенной маркировки означает, что мы использовали прописные буквы «N»
ٍKЭто «Kesratain », двойное «kesra», оно издает звук «внутри». Строчная буква «k» уже используется, плюс согласованность с буквой «F» для удвоенной маркировки означает, что мы использовали заглавную букву «K».
َaЭто одиночный «фетха», издающий короткий звук «а», который многие использовали «A», чтобы представить это, плюс были использованы «F» и «f». Поэтому традиционно использовалась строчная буква «а».
ُuЭто единственная «демма», издающая короткий гласный звук «оо», многие использовали «u» для обозначения этого в английском тексте. Так что традиционно использовалась строчная «u».
ِiЭто одиночный «кесра», издающий короткий гласный звук «i», многие использовали нижний регистр «i», чтобы представить это в английском тексте,
ّ~Это «шедда», которая представляет собой удвоение звук / буква выше. Тильда также является знаком, который находится над буквой и встречается на большинстве английских клавиатур. Это физическая мнемоника.
ْoЭто «суккун» и означает, что на этой букве нет гласного звука. Мы использовали близкую физическую мнемонику строчной буквы «o»

. Первоначальная команда ALPNET быстро приняла эту схему. Несмотря на то, что доктор Бисли не знал арабского языка, он быстро понял и использовал его. Сила Баквальтерской транслитерации состоит в том, что каждая арабская буква представлена ​​отчетливо. Тем не менее, его использование традиционных транслитераций или мнемонических устройств для чего-либо нетрадиционного делает его очень простым в изучении.

Образец

Первая статья Всеобщей декларации прав человека :

текст на арабском языке

يُولَدُ جَمِيعُ ٱلنَّاسِ أَحْرَارًا مَتَسَاوِينَ فِي ٱلة وو. وقد وهبوا عقلا وضميرا وعليهم أن يعامل بعضهم بعضا بروح ٱلإخاء.

Buckwalter транслитерации

yuwladu jamiyEu {пер ~ Ääsi>aHoraArFA mutasaAwiyna fiy {lokaraAmapi ва {loHuquwqi. waqado wuhibuwA EaqolFA waDamiyrFA waEalayohimo>ano yuEaAmila baEoDuhumo baEoDFA biruwHi {lo

Текст на английском языке

Все люди рождаются свободными и равными в своем достоинстве и правах. Они наделены разумом и совестью и должны действовать по отношению друг к другу в духе братства.

Примечания

Внешние ссылки

Последняя правка сделана 2021-05-13 03:50:41
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте