Латинизация

редактировать
Языки могут быть латинизированы несколькими способами, как показано здесь: Китайский

Латинизация или романизация в лингвистике - это преобразование письма из другой системы письма в римское (латинское) письмо или систему для делать это. Методы латинизации включают транслитерацию для представления письменного текста и транскрипцию для представления устного слова и их комбинации. Методы транскрипции можно разделить на фонематическую транскрипцию, которая записывает фонемы или единицы семантического значения в речи, и более строгую фонетическую транскрипцию, который точно записывает звуки речи.

Содержание
  • 1 Методы
    • 1.1 Транслитерация
    • 1.2 Транскрипция
      • 1.2.1 Фонематическая
      • 1.2.2 Фонетическая
    • 1.3 Компромиссные варианты
  • 2 Романизация конкретных систем письма
    • 2,1 Арабский
    • 2,2 Персидский
    • 2,3 Армянский
    • 2,4 Грузинский
    • 2,5 Греческий
    • 2,6 Иврит
    • 2,7 Индийские (брахмические) письменности
      • 2.7.1 Деванагари-настаглик (хиндустани)
    • 2.8 Китайский
      • 2.8.1 Мандарин
        • 2.8.1.1 Материковый Китай
        • 2.8.1.2 Тайвань
        • 2.8.1.3 Сингапур
      • 2.8.2 Кантонский диалект
      • 2.8.3 Min Nan или Hokkien
        • 2.8.3.1 Teochew
      • 2.8.4 Min Dong
      • 2.8.5 Min Bei
    • 2.9 Японский
    • 2.10 Корейский
    • 2.11 Филиппинские языки
    • 2.12 Тайский
    • 2,13 Кириллица
      • 2.13.1 Белорус
      • 2.13.2 Болгарский
      • 2.13.3 Киргизский
      • 2.13.4 Македонский
      • 2.13.5 Русский
      • 2.13.6 Сирийский
      • 2.13.7 Украинский
  • 3 Обзор и сводка
  • 4 См. Также
  • 5 Ссылки
  • 6 Внешние ссылки
Методы

Существует множество согласованных или стандартизованных систем латинизации. Их можно классифицировать по характеристикам. Характеристики конкретной системы могут сделать ее более подходящей для различных, иногда противоречащих друг другу приложений, включая поиск документов, лингвистический анализ, легкость чтения, точное представление произношения.

  • Исходный или донорский язык. Система может быть адаптирована для латинизации текста определенного языка, ряда языков или любого языка в конкретной системе письма. Система, ориентированная на конкретный язык, обычно сохраняет языковые особенности, такие как произношение, в то время как общая может быть лучше для каталогизации международных текстов.
  • Целевой язык или язык получателя - Большинство систем предназначены для аудитории, которая говорит или читает на определенном языке. (Так называемые международные системы латинизации кириллического текста основаны на центральноевропейских алфавитах, таких как чешский и хорватский алфавит.)
  • Простота - поскольку базовый латинский алфавит имеет меньшее количество букв, чем во многих других системах письма, диграфов, диакритических знаков или специальных символов должны использоваться для их представления в латинском алфавите. Это влияет на простоту создания, цифрового хранения и передача, воспроизведение и чтение латинизированного текста.
  • Обратимость - возможность восстановления оригинала из преобразованного текста. Некоторые обратимые системы допускают необратимую упрощенную версию.

Транслитерация

Если латинизация пытается транслитерировать исходный сценарий, руководящим принципом является взаимно однозначное сопоставление символов исходного языка с целевым сценарием с меньшим упором на то, как звучит результат при произнесении в соответствии с языком читателя. Например, Нихон-ш iki латинизация японского позволяет информированному читателю восстановить исходные японские слоги кана со 100% точностью, но требует дополнительных знаний для правильного произношения.

Транскрипция

Фонематическая

Большая часть латинизации предназначена для того, чтобы случайный читатель, незнакомый с исходным письмом, мог достаточно точно произнести исходный язык. Такая латинизация следует принципу фонематической транскрипции и пытается максимально точно передать значимые звуки (фонемы ) оригинала на целевом языке. Популярная романизация Хепберна японского языка - это пример транскриптивной латинизации, предназначенной для англоговорящих.

Фонетическое

A фонетическое преобразование идет еще дальше и пытается отобразить все телефоны на исходном языке, при необходимости жертвуя разборчивостью, используя символы или условные обозначения, которых нет в целевом сценарий. На практике такое представление почти никогда не пытается представить все возможные аллофоны - особенно те, которые возникают естественным образом из-за эффектов коартикуляции - и вместо этого ограничивается наиболее значительными аллофоническими различиями. Международный фонетический алфавит - наиболее распространенная система фонетической транскрипции.

Компромиссы

Для большинства языковых пар построение удобной латинизации предполагает компромисс между двумя крайностями. Чистая транскрипция, как правило, невозможна, поскольку исходный язык обычно содержит звуки и различия, которых нет в целевом языке, но которые должны быть показаны, чтобы романизированная форма была понятной. Кроме того, из-за диахронической и синхронной вариации ни один письменный язык не представляет любой разговорный язык с идеальной точностью и вокальной интерпретацией сценарий может сильно различаться в зависимости от языка. В наше время цепочка транскрипции обычно включает разговорный иностранный язык, письменный иностранный язык, письменный родной язык, разговорный (читаемый) родной язык. Уменьшение количества этих процессов, то есть удаление одного или обоих этапов письма, обычно приводит к более точной устной артикуляции. В целом, за пределами ограниченной аудитории ученых латинизация имеет тенденцию больше склоняться к транскрипции. В качестве примера рассмотрим японское боевое искусство 柔 術: романизация Nihon-shiki zyûzyutu может позволить кому-то, кто знает японский язык, восстановить слоги кана じ ゅ う じ ゅ つ, но большинству носителей английского языка или, скорее, читателей будет легче угадать произношение из версии Хепберн, дзюдзюцу.

Романизация определенных систем письма
Приведенный ниже список может быть неполным, см. также Категория: Романизация

Арабский

Арабский алфавит используется для написания арабского, персидского, урду и пушту, а также многих других языков мусульманского мира, в частности, африканские и азиатские языки без собственных алфавитов. Стандарты романизации включают следующее:

Персидский

Армянский

Грузинский

Греческий

Существуют системы латинизации как для современного, так и для древнегреческого.

Heb rew

Еврейский алфавит романизирован с использованием нескольких стандартов:

  • ANSI Z39.25 (1975)
  • UNGEGN (1977)
  • ISO 259 (1984): Транслитерация.
  • ISO 259-2 (1994): Упрощенная транслитерация.
  • : Фонематическая транскрипция.
  • ALA-LC

Индийские (брахмические) скрипты

Брахмическая семья из abugidas используется для языков Индийского субконтинента и Юго-Восточной Азии. На западе существует давняя традиция изучать санскрит и другие индийские тексты в латинской транслитерации. Различные соглашения о транслитерации использовались для индийских алфавитов со времен сэра Уильяма Джонса.

  • ISO 15919 (2001): стандартное соглашение транслитерации было кодифицировано в стандарте ISO 15919. Он использует диакритические знаки для сопоставления гораздо большего набора брахмических согласных и гласных с латинским шрифтом. См. Также Транслитерация индийских шрифтов: как использовать ISO 15919. Часть, относящаяся к деванагари, очень похожа на академический стандарт IAST : «Международный алфавит санскритской транслитерации» и на Библиотеку Конгресса США стандартный, ALA-LC, хотя есть несколько отличий
  • Национальная библиотека Калькутты в латинизации, предназначена для латинизации всех индийских алфавитов, является расширением IAST
  • Harvard-Kyoto : использует верхний и нижний регистр и удвоение букв, чтобы избежать использования диакритических знаков и ограничить диапазон 7-битным ASCII.
  • ITRANS : схема транслитерации в 7-битный код ASCII, созданная с помощью схемы, которая использовалась ранее в Usenet.
  • ISCII (1988)

Devanagari – nastaʿlīq (Hindustani)

Hindustani - это индоарийский язык с крайней диграфией и диглоссией, возникшей в результате противоречий между хинди и урду, начавшимся в 1800-х годах. Технически сам хиндустани не признается ни языковым сообществом, ни правительствами. Два стандартизованных регистра, стандартный хинди и стандартный урду признаны официальными языками в Индии и Пакистане. Однако на практике ситуация такова:

  • В Пакистане: стандартный (сааф или халис) урду - это «высокий» вариант, тогда как хиндустани - «низкий» вариант, используемый массами (так называемый урду, написано на nastaʿlīq скрипт ).
  • В Индии и стандартный (шудд) хинди, и стандартный (сааф или халис) урду являются разновидностями "H" (написаны на деванагари и настахлик соответственно), тогда как хиндустани - разновидность "L" используется массами и написано либо на деванагари, либо на настахлике (и называется «хинди» или «урду» соответственно).

Диграфия делает любую работу на любом алфавите в значительной степени недоступной для пользователей другого алфавита, хотя в остальном хиндустани является совершенно взаимно понятный язык, что по существу означает, что любое текстовое сотрудничество с открытым исходным кодом невозможно среди читателей devanagari и nastaʿlīq.

Инициатива Hamari Boli, инициированная в 2011 году, представляет собой полномасштабную открытую -источник языковое планирование инициатива, направленная на хиндустанский алфавит, стиль, статус лексическая реформа и модернизация. Одна из основных заявленных целей Хамари Боли - избавить хиндустани от разрушительной диграфии деванагари-настаглик путем латинизации.

китайский

романизация ситских языков, в частности Мандарин, оказалось очень сложной проблемой, хотя проблема еще больше осложняется политическими соображениями. Из-за этого многие таблицы латинизации содержат китайские иероглифы плюс одну или несколько латинизации или Zhuyin.

мандаринский

Материковый Китай
  • Ханью Пиньинь (1958): В материковом Китае использовался Ханью Пиньинь официально латинизировать мандаринский в течение десятилетий, в первую очередь как лингвистический инструмент для обучения стандартизированному языку. Система также используется в других китайскоязычных регионах, таких как Сингапур и части Тайвань, и была принята большей частью международного сообщества в качестве стандарта для написания китайских слов и имен. латиницей. Ценность Ханью Пиньинь для образования в Китае заключается в том, что Китай, как и любой другой населенный пункт с сопоставимой площадью и населением, имеет множество различных диалектов, хотя существует только один общий письменный язык и один общий стандартизированный язык. устная форма. (Эти комментарии относятся к латинизации в целом)
  • ISO 7098 (1991): на основе Hanyu Pinyin.
Тайвань
  1. Gwoyeu Romatzyh (GR, 1928–1986, на Тайване 1945–1986 ; Тайвань использовал японские ромадзи до 1945 г.),
  2. мандаринские фонетические символы II (MPS II, 1986–2002 гг.),
  3. Тонгён Пиньинь (2002–2008 гг.) И
  4. Ханью Пиньинь (с 1 января 2009 г.)
Сингапур

кантонский

Мин Нан или Хоккиен

Теочью

Мин Донг

Мин Бэй

Японский

Романизация (или, в более общем смысле, латинские буквы ) называется «ромадзи "на японском. Наиболее распространены следующие системы:

  • Хепберн (1867): фонетическая транскрипция англо-американских практик, используется в географических названиях
  • Nihon-shiki (1885): транслитерация. Также принят как (ISO 3602 Strict ) в 1989 году.
  • Кунрей-сики (1937): фонематическая транскрипция. Также принят как (ISO 3602 ).
  • JSL (1987): фонематическая транскрипция. Назван в честь книги Элеоноры Джорден «Японский: разговорный язык».
  • ALA-LC : Подобно Modified Hepburn
  • Wāpuro : («латинизация текстового процессора») транслитерация. Не строго система, а набор общих практик, позволяющих вводить японский текст.

Корейский

Хотя для латинизации потребовались различные и, временами кажущиеся неструктурированными формы, некоторые наборы правил действительно существуют:

  • McCune – Reischauer (MR; 1937?), первая транскрипция, получившая некоторое признание. Слегка измененная версия MR была официальной системой для Корейский в Южной Корее с 1984 по 2000 год, и все же другая модификация все еще является официальной системой в Северной Корее. Использует breves, апострофы и diereses, последние два указывают орфографические границы слогов в случаях, которые в противном случае были бы неоднозначными.. То, что называется MR, во многих случаях может быть любым из числа o f системы, которые отличаются друг от друга и от оригинального MR главным образом тем, отделяются ли окончания слов от основы пробелом, дефисом или - согласно системе МакКьюна и Райшауэра - совсем нет; и если используется дефис или пробел, отражается ли изменение звука в последней согласной букве основы и первой согласной букве окончания (например, pur-i против pul-i). Хотя эти отклонения в большинстве своем не имеют отношения к транскрибированию непереключаемых слов, они настолько распространены, что любое упоминание «романизации МакКьюна-Рейшауэра» не обязательно относится к исходной системе, опубликованной в 1930-х годах.
    • Существует, например, система ALA-LC / Библиотеки Конгресса США, основанная на MR, но с некоторыми отклонениями. Разделение слов рассматривается подробно, с щедрым использованием пробелов для отделения окончаний слов от основ, чего не видно в MR. Слоги в именах всегда разделяются дефисом, что категорически не делает MR. Звуковые изменения игнорируются чаще, чем в MR. Различия между 'и ’.

. Несколько проблем с MR привели к разработке более новых систем:

  • Yale (1942): эта система стала установленной стандартной латинизацией корейского языка среди лингвисты. Длина гласного в старом или диалектном произношении обозначается макроном. В случаях, которые в противном случае были бы неоднозначными, орфографические границы слогов обозначаются точкой. Эта система также указывает согласные звуки, которые исчезли из южнокорейской орфографии и стандартного произношения слова.
  • Пересмотренная романизация корейского языка (RR; 2000): включает правила как для транскрипции, так и для транслитерации. Южная Корея теперь официально использует эту систему, которая была одобрена в 2000 году. Дорожные знаки и учебники должны были следовать этим правилам как можно скорее, что, по оценке правительства, составляет не менее 20 миллионов долларов США. Изменены все дорожные знаки, названия железнодорожных станций и станций метро на линейных картах и ​​знаках и т. Д. Это изменение было либо проигнорировано, либо унаследовано в некоторых случаях, особенно из-за латинизации имен и существующих компаний. RR в целом похож на MR, но не использует диакритических знаков или апострофов и использует разные буквы для ㅌ / ㄷ (t / d), ㅋ / ㄱ (k / g), ㅊ / ㅈ (ch / j) и ㅍ / ㅂ ( п / б). В случаях двусмысленности орфографические границы слогов должны были обозначаться дефисом, но на практике это непоследовательно применяется.
  • ISO / TR 11941 (1996): На самом деле это два разных стандарты под одним названием: один для Северной Кореи (КНДР) и другой для Южной Кореи (РК). Первоначальное представление в ISO было в значительной степени основано на Йельском университете и было совместным усилием обоих государств, но они не смогли согласовать окончательный вариант.
  • Лукофф романизация, разработанная в 1945–47 для его учебников разговорного корейского языка

Филиппинские языки

Почти все языки Филиппин (включая тагальский, илокано, биколские языки, кебуано и другие висайские языки, капампанган и испанские креольские чавакано ) используют современный филиппинский алфавит.

. Когда Испания колонизировала Филиппины в конце 16 века, многие языки Филиппин были написаны различными шрифтами, такими как Baybayin. Первоначально они были продвинуты колонистами, но позже заменены испанскими транскрипциями, которые все еще очевидны в названиях мест и фамилиях. Такие буквы, как C, Ll и Ñ, были сочтены латиноамериканскими добавками и удалены в Abakada, попытке более местного алфавита, разработанного Лопе К. Сантосом в 1940 году. В конечном итоге они были заменены пилипинским алфавитом и 28-буквенным современным филиппинским алфавитом, который добавляет Ñ и родной Ng к стандартному 26-буквенному латинскому алфавиту.

В то время как в самом испанском языке используется очень фонематическое написание, романизированное написание, созданное для филиппинских языков, даже в большей степени. Например, в испанском caballo ([kaˈβa.ʎo], «лошадь») то же слово на тагальском языке - kabayo (демонстрирующее yeismo в произношении испанского диграфа «Ll»).

Тайский

Тайский, на котором говорят в Таиланде и некоторых районах Лаоса, Бирмы и Китая, написан собственным письмом, вероятно, происходящим от смесь тайско-лаосского и древнекхмерского, в семье брахманов.

Кириллица

В англоязычных библиотечных каталогах, библиографиях и большинстве академических публикаций во всем мире используется метод транслитерации Библиотеки Конгресса.

В лингвистике научная транслитерация используется как для кириллицы, так и для глаголицы. Это относится к старославянскому, а также к современным славянским языкам, которые используют эти алфавиты.

Белорусский

Болгарский

Система, основанная на научной транслитерации и ISO / R 9: 1968 считался официальным в Болгарии с 1970-х годов. С конца 1990-х годов власти Болгарии перешли на так называемую оптимизированную систему, избегая использования диакритических знаков и оптимизированную для совместимости с английским языком. Эта система стала обязательной для общественного использования в соответствии с законом, принятым в 2009 году. Если старая система использует <č,š,ž,št,c,j,ă>, новая система использует .

. для официального использования также ООН в 2012 г. и BGN и PCGN в 2013 г.

Кыргызский

Македонский

Русский

Не существует единой общепринятой системы письма Русский с использованием латиницы - на самом деле существует огромное количество таких систем: некоторые адаптированы для определенного целевого языка (например, Немецкий или французский), некоторые выполнены в виде библиотечной транслитерации, некоторые прописаны в паспортах российских путешественников; транскрипция некоторых имен чисто традиционная. Все это привело к большому дублированию имен. Например. имя русского композитора Чайковский может также записываться как Чайковский, Чайковский, Чайковский, Чайковский, Чайковский, Чайковский, Чайковский, Чайковский, Чайковский, Чайковский, Чайковский, Чайковский, Чайковский, Чайковский и др. включают:

  • BGN / PCGN (1947): Система транслитерации (Совет США по географическим названиям и Постоянный комитет по географическим названиям для официального использования в Великобритании).
  • ГОСТ 16876-71 (1971): Советский стандарт транслитерации, ныне не существующий. Заменен ГОСТ 7.79, который является эквивалентом ISO 9.
  • Система латинизации Организации Объединенных Наций для географических названий (1987): На основе ГОСТ 16876-71.
  • ISO 9 (1995): Транслитерация. Из Международной организации по стандартизации.
  • ALA-LC (1997)
  • Кодировка "Volapuk" (1990-е годы): сленговый термин (на самом деле это не Volapük ) для метод письма, который на самом деле не является транслитерацией, но используется для аналогичных целей (см. статью).
  • Традиционная английская транслитерация основана на BGN / PCGN, но не соответствует определенному стандарту. Подробно описано в Латинизации русского языка.
  • Оптимизированная система для латинизации русского языка.
  • Сравнительная транслитерация русского языка на разных языках (западноевропейский, арабский, грузинский, шрифт Брайля, Морзе)

Сирийский

Латинская графика для сирийского языка была разработана в 1930-х годах в соответствии с государственной политикой в ​​отношении языков меньшинств Советского Союза, и некоторые материалы были опубликованы.

Украинский

Украинская национальная система 2010 года была принята UNGEGN в 2012 году и BGN / PCGN в 2020 году. Она также очень близка к модифицированной (упрощенной) системе ALA-LC, которая оставалась неизменной с 1941 года.

  • ALA-LC
  • ISO 9
  • Украинская национальная транслитерация
  • Украинская национальная система и системы BGN / PCGN, в Рабочей группе ООН по системам романизации
  • Сравнение Томаса Т. Педерсена пяти систем

См. также: Украинский латинский алфавит

Обзор и резюме

В таблице ниже показаны наиболее распространенные фонематические тр романизация надписи, используемая для нескольких разных алфавитов. Хотя этого достаточно для многих случайных пользователей, существует несколько альтернатив для каждого алфавита и множество исключений. Для получения подробной информации обратитесь к каждому из языковых разделов выше. (Символы хангыля разбиты на компоненты jamo.)

Романизированныйгреческий русский (кириллица )амазиг иврит арабский Персидский Катакана хангыль Бопомофо
AAАַ, ֲ, ָَ, اا, آ
AEΑΙ
AIי ַ
BΜΠ, ΒБבּﺏ ﺑ ﺒ ﺐﺏ ﺑ
CΞ
CHTΣ̈Чצ׳چ
CHI
DΝΤ, ΔДⴷ, ⴹדﺩ - ﺪ, ﺽ ﺿ ﻀ ﺾد
DHΔדֿﺫ - ﺬ
DZΤΖЅ
EΕ, ΑΙЭ, ֱ, י ֵֶ, ֵ, י ֶエ, ヱ
EO
EU
FΦФפ (или его окончательная форма ף)ﻑ ﻓ ﻔ ﻒ
FU
GΓΓ, ΓΚ, ΓГⴳ, ⴳⵯגگ
GHΓҒגֿ, עֿﻍ ﻏ ﻐ ﻎق غ
HΗҺⵀ, ⵃח, הﻩ ﻫ ﻬ ﻪ, ﺡ ﺣ ﺤ ﺢه ح ﻫ
HA
HE
HI
HO
IΗ, Ι, Υ, ΕΙ, ΟΙИ, Іִ, י ִدِイ, ヰ
IYدِي
JTZ̈ДЖ, Џג׳ﺝ ﺟ ﺠ ﺞج
JJ
KΚКⴽ, ⴽⵯכּﻙ ﻛ ﻜ ﻚک
KA
KE
KHXХכ, חֿ (или его окончательная форма ך)ﺥ ﺧ ﺨ ﺦخ
KI
KK
KO
KU
LΛЛלﻝ ﻟ ﻠ ﻞل
MΜМמ (или его окончательная форма ם)ﻡ ﻣ ﻤ ﻢم
MA
ME
MI
MO
MU
NΝНנ (или его окончательная форма ן)ﻥ ﻧ ﻨ ﻦن
NA
NE
NG
NI
NO
NU
OΟ, ΩО, ֳ, וֹֹُا
OE
PΠПפּپ
PP
PSΨ
QΘקﻕ ﻗ ﻘ ﻖغ ق
RΡРⵔ, ⵕרﺭ - ﺮر
RA
RE
RI
RO
RU
SΣСⵙ, ⵚס, שׂﺱ ﺳ ﺴ ﺲ, ﺹ ﺻ ﺼ ﺺس ث ص
SA
SE
SHΣ̈Шשׁﺵ ﺷ ﺸ ﺶش
ЩЩ
ШИ
SO
SS
SU
TΤТⵜ, ⵟט, תּ, תﺕ ﺗ ﺘ ﺖ, ﻁ ﻃ ﻄ ﻂت ط
TA
TE
THΘתֿﺙ ﺛ ﺜ ﺚ
TO
TSΤΣЦצ (или его окончательная форма ץ)
TSU
TT
UΟΥ, ΥУ, וֻּدُ
UI
UWدُو
VBВבو
WΩו, ווﻭ - ﻮ
WA
WAE
WE
WI
WO
XΞ, Χ
YΥ, Ι, ΓΙ, Ы, Јיﻱ ﻳ ﻴ ﻲی
YAЯ
YAE
YE, Є
YEO
YIЇ
YOЁ
YUЮ
ZΖЗⵣ, ⵥזﺯ - ﺰ, ﻅ ﻇ ﻈ ﻆز ظ ذ ض
ZHΖ̈Жז׳ژ
См. Также
Ссылки
Внешние ссылки
Викискладе есть медиафайлы, связанные с романизацией.

О романизации:

Онлайн-латинизация:

Последняя правка сделана 2021-06-04 09:30:39
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте