Неформальная латинизация кириллицы

редактировать

Неформальная или специальная латинизация кириллицы использовалась с первых дней электронная связь, начиная с ранних электронная почта и системы досок объявлений. Их использование уменьшилось с развитием русского Интернета, которое сделало поддержку кириллицы стандартом, но вновь появилось с распространением обмена мгновенными сообщениями, SMS и мобильный телефон обмен сообщениями в России.

Содержание
  • 1 Разработка
  • 2 Транслит
    • 2.1 Транслит в Болгарии
    • 2.2 Транслит в Азербайджане
  • 3 Кодировка Волапука
    • 3.1 Этимология
    • 3.2 История
    • 3.3 Правила
    • 3.4 Таблица
    • 3.5 Пример
  • 4 Русский алфавит чата
  • 5 См. Также
  • 6 Ссылки
  • 7 Библиография
  • 8 Внешние ссылки
    • 8.1 Внешние ссылки Translit
Разработка

Из-за неформального характера не существовало ни устоявшегося стандарта, ни общего названия. На заре электронной почты иногда использовался юмористический термин «кодировка волапука » (русский : кодировка «воляпюк» или «волапюк», кодировка волапюк).

Совсем недавно термин «транслит » появился для неизбирательного обозначения как программ, транслитерирующих кириллицу (и другие нелатинские алфавиты) на латынь, так и результатов такой транслитерации. Это слово является сокращением термина транслитерация, и, скорее всего, его использование возникло в нескольких местах. Примером раннего «транслита» является программа DOS TRANSLIT Яна Лабановски, которая запускается из командной строки для преобразования кириллического файла в латинский с использованием указанной таблицы транслитерации.

Существует два основных варианта латинизации русского языка: транслитерация и Leetspeak -тип обработки русского текста. Последний часто сильно насыщен общими английскими словами, которые часто намного короче, чем соответствующие русские, и иногда упоминается как рунглиш или русский.

Транслит

Транслит - метод кодирования букв кириллицы буквами латиницы. Термин происходит от транслитерации, системы замены букв одного алфавита буквами другого. Translit нашел свое применение в веб-форумах, чатах, мессенджерах, электронной почте, MMORPG и других сетевых играх. Некоторые сайты с кириллицей имели версию транслита на случай проблем с кодировкой.

Поскольку компьютерные и сетевые технологии стали поддерживать кириллицу, транслит приобрел дурную славу. Иногда пользователей транслита игнорировали или даже забанивали в сообществах, использующих кириллицу.

Транслит получил последний импульс развития с увеличением доступности мобильных телефонов в странах, где используется кириллица. Сначала ситуация была такая же, как с компьютерами; ни мобильные телефоны, ни операторы мобильной связи не поддерживают кириллицу. Хотя технология мобильных телефонов теперь поддерживает Юникод, включая все варианты кириллических алфавитов, одиночное SMS в Юникоде ограничено 70 символами, тогда как латинское SMS может содержать до 160 символов. Если сообщение превышает ограничение на количество символов, оно разбивается на несколько частей. Это удорожает сообщения, написанные кириллицей.

Общие транслитерации в транслите
БукваТранслитерацияБукваТранслитерацияБукваТранслитерация
аaкk, cчch, č, Ψ, 4
бb, 6лl, Jl, Λшsch, sh, š, w, Ψ, 6
вv, wмmщsh, shch, sch,. šč, shh, w
гg, Γ, sнn
дd, Δ, gоoъ', y, j,' ', #,. или отсутствует
еe, ye, je, т.е.пp, Π, n
ёyo, jo, io, eрrыy, i, q, bl
жzh, ž, j, z, g, *,>| <сsь', y, j, b. или отсутствует
зz, 3тt, m
иi, uуu, yэe, e', eh
йy, j, i, u,. или отсутствует;. ий → iy, ый → yy;. -ий / ый → i, yфf, Φ
хh, kh, xюyu, ju, iu, u
цc, z, ts, tc, uяya, ja, ia, ea, a, q, 9, 9I

Иногда ⟨y⟩, ⟨yu⟩, ⟨yo⟩, ⟨ye⟩, ya⟩ служат транслитерацией для й⟩, ю⟩, ⟨Ё⟩, ⟨е⟩, я⟩.

В последнее время появилась более агрессивная форма транслита, отличительной особенностью которой является использование цифр для замены некоторых букв. Например, 4 читается как «ч» и используется для транслитерации буквы «ч» из транслитерации четырех слов «четыре» в русском языке («Четыре»), или, возможно, внешнего вида буквы, аналогичной этой из четырех в арабских цифрах. Кроме того, номер может заменять свое полное имя как часть слова: «sov7» вместо «sovsem» («полностью») или «posmo3» вместо «posmotri» («посмотреть», императив).

Общеупотребительные сокращения для цифр
ЧислоОбычная транслитерацияОригинальное слово для него в ТранслитеОригинальное слово на русском языке
1ododinодин
2dvdvaдва
3trtriтри
4chchetyreчетыре
5ppyat'пять
6shшест 'шесть
7sсем'семь
8voвосем'восемь
9dtдевять'девять

Такой транслит часто настолько искажен, что носители языка с трудом его читают. Использование транслита запрещено на многих интернет-форумах.

Россия и другие бывшие советские республики приняли стандарт транслитерации ISO 9 для официального использования (под обозначением 7.79- 2000), заменив старый советский ГОСТ 16876-71.

Транслит в Болгарии

Модифицированная версия Транслита, получившая название Шлёкавица или Маймуница, широко используется в Интернете в Болгарии. Он похож на русский транслит, за исключением следующих отличий:

  • ⟨ъ⟩ может транслитерироваться как a⟩, ⟨u⟩ и ⟨y⟩ и редко как ⟨1⟩
  • ⟨я⟩ - обычно транслитерируется как q⟩, но можно увидеть ya⟩ и ia⟩
  • ⟨ч⟩ транслитерируется как ⟨4⟩ или ch⟩
  • ⟨ц⟩ транслитерируется как либо ⟨ts⟩, либо ⟨c⟩
  • ⟨ж⟩ транслитерируется как ⟨j⟩, иногда ⟨v⟩
  • ⟨ю⟩ транслитерируется как ⟨iu⟩, ⟨yu⟩ или ⟨ u⟩
  • ⟨й⟩ транслитерируется как i⟩, ⟨y⟩ или ⟨j⟩
  • ⟨ш⟩ транслитерируется как ⟨6⟩ или ⟨sh⟩
  • ⟨В⟩ в основном транслитерируется как v⟩, но w⟩ было замечено из-за размещения буквы на болгарской традиционной фонетической клавиатуре
  • ⟨щ⟩ транслитерируется как ⟨sht⟩

Транслит в Азербайджане

Несмотря на использование турецкого латинского алфавита, в Азербайджане соблюдаются соглашения, подобные транслиту:

  • ə отображается как e, но иногда можно увидеть
  • ş. отображается как sh или s
  • ç отображается как ch или c
  • ğ отображается красный как g или gh
  • с точками и без точек I пишутся с заглавной буквы без точки I и строчной точки I
  • буквы с умляутами пишутся без умляутов
кодировка волапука
Для язык, см. Volapük.

Кодировка Volapuk (русский : кодировка «волапюк», кодировка «волапюк») или latinica (латиница) - сленговый термин для передачи букв Кириллица с латиницей. В отличие от Translit, в котором символы заменяются, чтобы звучать одинаково, в volapuk символы можно заменять, чтобы они выглядели или звучали одинаково.

Этимология

Название кодировки Volapuk происходит от сконструированного языка Volapük по двум причинам. Кириллица, написанная таким образом, выглядит странно и часто забавно, как и текст на языке волапюк. В то же время само слово «Волапюк» («Волапюк / Воляпюк» по-русски звучит забавно для русского уха, поэтому название прижилось.

Термин был популяризирован благодаря его использованию в первых советских коммерчески доступных UUCP и TCP / IP сетях, RELCOM (типичный сетевой пакет программного обеспечения включал кириллицу KOI-8 в утилиты перекодирования Volapuk под названием tovol и fromvol, первоначально реализованные Вадимом Антоновым ), что делает его вероятным источником использования Volapuk применительно к кодировке кириллицы.

История

Волапук и Транслит использовались с первых дней Интернета для написания электронной почты сообщения и другие тексты на русском языке, в которых поддержка кириллических шрифтов была ограничена: либо у отправителя не было клавиатуры с кириллическими буквами, либо у получателя не обязательно были кириллические экранные шрифты. Вначале ситуация усугублялась наличием ряда несовместимых компьютерных кодировок кириллицы, так что отправитель и получатель не гарантированно имели одинаковые коды. Кроме того, 7-битный символ в кодировке первых дней был дополнительным препятствием.

Некоторые российские провайдеры электронной почты даже включили кодировку Volapuk в список доступных вариантов для электронной почты, направляемой за границу, например,

«MIME / BASE64, MIME / Quoted-Printable, volapuk, uuencode»

К концу 90-х проблема кодирования была почти полностью решена благодаря усилению поддержки со стороны производителей программного обеспечения и поставщиков интернет-услуг. Volapuk по-прежнему поддерживает уровень использования текстовых SMS-сообщений, потому что в латинизированное SMS-сообщение можно уместить больше символов, чем в Unicode. Он также используется в компьютерных играх, которые не позволяют использовать кириллический текст в чате, в частности, Правила Counter-Strike.

Волапук часто заменяет кириллические буквы латинскими, чтобы они выглядели так же или, по крайней мере, аналогично набранным или рукописным кириллическим буквам.

  1. Заменить «такими же» буквами: а, д, к, м, т, о. При необходимости используйте заглавные буквы для большего сходства (к: K лучше, чем k, м: M лучше, чем m, т: T лучше, чем t (что в рукописной кириллице выглядит точно как m).
  2. Заменить похожим буквы: в - B, г - r (рукописное сходство), з - 3 (т.е. цифра три), л - J | или / \ (последнее опять же рукописное сходство), н - Н, п - n (рукописное сходство), р - p, с - c, у - y, х - x, ч - 4, я - R, и - N. Это может варьироваться.
  3. Заменить все другие неочевидные, трудно представимые символы, использующие leet (любая комбинация латинских букв, цифр или знаков препинания, которая может иметь отдаленное сходство с рассматриваемой буквой кириллицы); для каждой буквы существует множество вариантов (например, буква 'щ' может можно закодировать более чем 15 различными способами) Примеры: ж - *, щ - LLI_, э - -) и так далее. Выбор каждой буквы зависит от предпочтений отдельного пользователя.

Кодировка также зависит от языка. Например, у украинских пользователей есть свои традиции, отличные от русских.

Таблица

КириллицаВолапук
АA
Б6, b
ВB
ГF, I ", I¯, r, 2, s (зеркально строчные буквы)
ДD, g (нижний регистр)
ЕE
ЁE, E ", Ë (латиница)
Ж*,} I {,>I <,>K
З3
ИN, u (нижний регистр), I / I
ЙN ', Ñ, u' или ú (обе строчные)
КK
ЛJI, / \, JT
МM
НH
ОO
ПII, n, TT (две латинские "T" -s)
РP
СC
ТT, m (строчные буквы)
Уy
ФØ, qp, @ (" в знаке "), (|), Q, o | o, 0 (ноль), cp
ХX
Ц" U, ", LL (две латинские" L "-s)
Ч4
ШW, LLI
Щ" W, "или" W_ "или LLL
Ъb или 'b
Ыbl
Ьb
Э~), € (знак евро)
ЮIO, IO
ЯR, 91, 9I, ° / I

Пример

  • Советский Союз (кириллица) [Советский Союз]
  • CoBeTcKuu 'CoIO3 («волапук»)
  • Советский Союз (транслитерация)
Русский чат-алфавит

Русский чат-алфавит - это быстро набираемое сочетание транслита и Волапук, в основном транслируемое, но дающее возможность заменить некоторые 2- или 3-символьные транслитерации на более короткий 1 символ. аналоги от Волапука. Это ускоряет набор текста; однако в некоторых случаях символы могут быть закодированы волапуком, из-за чего текст отображается некорректно и поэтому его труднее или невозможно прочитать. В России и странах, где русский язык регулярно используется для общения через мобильный телефон и чат, он используется как альтернативный и свободный стиль транслитерации.. Он также позволяет обойти ограничения программ и / или устройств, где кириллица недоступна.

В России одной из причин использовать транслитерацию для русского текста является то, что мобильные символы позволяют использовать больше латинских символов, чем кириллических символов в SMS: латинские и заглавные греческие буквы охватывается семибитным алфавитом GSM, позволяющим использовать до 160 таких символов в сообщении, в то время как буквы кириллицы - нет, требуя 16-битной кодировки, которая ограничивает сообщения до 70 символов. В этом случае, конечно же, основное внимание уделяется получению одного латинского символа (всего 26) для каждого символа кириллицы (из которых 33 в русском языке, а также дополнительных символов в украинском и других языках, использующих кириллицу. сценарий). Здесь приведены примеры только тех, которые используются для русского языка.

В тех случаях, когда приводятся варианты, первый является наиболее распространенным, а последний - менее распространенным, хотя тенденции быстро меняются и различаются от человека к человеку. Отсутствие стандартизации - самая большая слабость этой неформальной транслитерации, поскольку разные стили противоречат друг другу и могут сделать чтение медленнее, чем необходимо.

КириллицаПо произношениюПо формеПримечания
Ааa
Ббb6
ВвvB
Ггgr, Γ
Ддdgнапоминающие рукописные строчные буквы «д» ( только в шрифтах с открытым хвостом g)
Ееe, ye, jee
Ёёyo, joe, поскольку эта буква не является обязательной в письменном русском языке, она обычно просто транскрибируется как «e»
Жжzh, j, g*,} I {
Ззz3, z
Ииiu
Ййi, y, ju, u '
Ккk
ЛлlJI, / \, Λ
МмMТолько заглавная M имеет сходство в кириллице
НнnH
Ооo
Ппpn, Π
Ррrp
Ссsc
Ттtm, напоминающее рукописное строчное «т»
Ууuy
ФфfØ, Φ
Ххh, khx
Ццts, c«U,»
Ччч, 44
Шшш, 6ш, «ЛЛИ», Ψ
Щщш, ш, шш, ш, шш«ш,»
Ъъ'(апостроф), "(кавычки)иногда без транслитерации
Ыыy, i, ɨ#, bl
Ьь' (апостроф)иногда без транслитерации - обычно транскрибируется только с «ль»
Ээe, ė
Ююyu, u, iu, juIO
Яяya, ia, ja9, R, q
См. также
Литература
  1. ^ Уведомление об отмене автоматического кодирования волапук (1997) (русский язык, в кодировке KOI8-R)
  2. ^Транслит начала 1990-х (Архивная версия Wayback Machine )
  3. ^поиск «Правила форума: транслит запрещен», (например, правила форума: транслит запрещен)
  4. ^ Примечание об отмене автоматической кодировки волапука (1997) (на русском языке)
  5. ^Инструкции на украинском чат-сервере Нышпорка Архивировано 01.01.2007 на Wayback Machine (на русском)
Библиография
  • Фролов А.В., Фролов Г.В. Электронная почта. Ваш спутник в Интернете (А.В. Фролов, Г.В. Фролов, "Электронная почта. Ваш спутник в Интернете") Издательство "Русская Редакция" (2000) ISBN 5-7502-0156-2, Глава 6 онлайн (на русском языке)
Внешние ссылки

Внешние ссылки транслита

  • Kbd.winrus.com Онлайн-сервис для кириллицы (русский и украинский) - Виртуальная клавиатура «Без транслита!»
  • Устаревшие транслитераторы Известные проблемы служб транслитерации и современные альтернативы
  • Translit.biz Нетривиальная русско-английская транслитерация (для доменных имен и URL-адресов).
  • Translit Ru / En Онлайн-русско-английская транслитерация, поддерживает несколько стандарты транслитерации и проверка орфографии.
  • Translit.ru Русско-английский транслитератор и средство проверки правописания (на русском языке).
  • Transliter.org Англо-русское и русско-английское преобразование букв.
  • Транслит.tv Русско-латинский транслитератор, проверка орфографии и переводчик (на русском языке).
  • Русский ТРАНСЛИТ транслитератор, который также работает на мобильных устройствах
Последняя правка сделана 2021-05-24 14:43:07
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте