Код языка

редактировать
Символ для идентификации языка, диалекта или группы языков

A код языка - это код , который назначает буквы или цифры в качестве идентификаторов или классификаторов для языков. Эти коды могут использоваться для организации библиотечных коллекций или презентаций данных, для выбора правильных локализаций и переводов в вычислительной технике, а также в качестве сокращенного обозначения для более длинных форм названий языков.

Содержание

  • 1 Трудности классификации
  • 2 Общие схемы
  • 3 См. Также
  • 4 Ссылки
  • 5 Внешние ссылки

Трудности классификации

Попытка схем языковых кодов классифицировать сложный мир человеческих языков, диалектов и вариантов. Большинство схем делают некоторые компромиссы между общностью и достаточной полнотой для поддержки определенных диалектов.

Например, большинство людей в Центральной и Южной Америке говорят по-испански. Испанский, на котором говорят в Мексике, будет немного отличаться от испанского, на котором говорят в Перу. В разных регионах Мексики диалекты и акценты испанского языка немного отличаются. Схема языкового кода может сгруппировать все это как «испанский» для выбора раскладки клавиатуры, в большинстве случаев как «испанский» для общего использования, или разделить каждый диалект, чтобы разрешить идиомы, специфичные для региона.

Общие схемы

Некоторые общеязыковые схемы кодов включают:

СхемаПримечанияПример для английского языкаПример для испанского
Glottolog кодыСозданы для языков меньшинств как научная альтернатива промышленному стандарту ISO 639-3.. Умышленно не похожи на аббревиатуры.
  • stan1293 - стандартный английский
  • macr1271 - макроанглийский (современный английский, включая креолы)
  • midd1317 - среднеанглийский
  • merc1242 - мерсийский (средний - Современный английский)
  • olde1238 - Староанглийский
  • angl1265 - Anglian (Старый - современный английский, включая шотландский)
  • stan1288 - стандартный испанский
  • olds1249 - Старый испанский
  • cast1243 - Кастильский (Старый - современный испанский, включая экстремадурский и креольский)
Языковой тег IETF Передовой метод IETF, указанный в BCP 47, для языковых тегов, которые легко анализировать компьютер. Система тегов расширяется до региона, диалекта и частных обозначений. Он ссылается на ISO 639, ISO 3166 и ISO 15924.
  • en- английский, как самый короткий код ISO 639.
  • en-US - английский, используемый в США (США - ISO 3166‑ 1 код страны для США)

Источник: IETF памятка

  • es- испанский, как самый короткий код ISO 639.
  • es-419 - испанский, соответствующий В регионе Латинской Америки и Карибского бассейна используется региональный код UN M.49
ISO 639‑1 Двухбуквенная система кодирования, официально принятая в 2002 году и содержащая 136 кодов. Во многих системах используются двухбуквенные коды ISO 639‑1, дополненные трехбуквенными кодами ISO 639‑2, когда двухбуквенный код не применим.

См.: Список кодов ISO 639-1

  • en
  • es- Испанский
ISO 639‑2 Трехбуквенная система из 464 кодов.

См.: Список кодов ISO 639-2

  • eng - трехбуквенный код
  • enm - среднеанглийский язык, c. 1100–1500
  • анг - Древнеанглийский, ок. 450–1100
  • cpe - другие креолы и пиджины на английском языке
  • spa - испанский
ISO 639‑3 Расширение ISO 639‑2 для охвата всех известных, живых или мертвых, устных или письменных языках в 7 589 статьях.

См.: Список кодов ISO 639-3

  • eng - трехбуквенный код
  • enm - среднеанглийский язык, c. 1100–1500
  • aig - креольский английский Антигуа и Барбуда
  • ang - древнеанглийский, c. 450–1100
  • svc - Винсентский креольский английский
  • spa - испанский
  • spq - испанский, лорето-учаяли
  • ssp - испанский язык жестов
Linguasphere Register кодовая системаДвухзначная + от одной до шести букв кодовая система Linguasphere Register, опубликованная в 2000 году, содержащая более 32000 кодов в 10 секторах справки, охватывающая мировые языковые и речевые сообщества.

Перемещайтесь также по иерархии кодовой системы Linguasphere Register, опубликованной в Интернете на сайте hortensj-garden.org

Внутри иерархии кодовой системы Linguasphere Register:

  • 5=индоевропейский филосектор
  • 52 = германский филозона
  • 52-A германский набор
  • 52-AB английский + англо-креольская цепочка
  • 52-ABA английский net
  • 52-ABA-c глобальный Английский. внешний блок. 52-ABA-ca to. 52-ABA-cwe . (186 вариантов)

Сравните: 52-ABA-a Шотландцы + Нортумбрия. внешняя единица 52-ABA-b «англо-английская» внешняя единица. (= традиционные разновидности Южной Великобритании + древнеангло-ирландские)

В пределах иерархии Кодовая система Регистра Лингвасферы:

  • 5=индоевропейский филозектор
  • 51 = романская филозона
  • 51-A Романтический набор
  • 51-AA Романтическая цепочка
  • 51- AAA West Romance net
  • 51-AAA-b Español / Castellano. внешнее устройство. 51-AAA-ba to. 51-AAA-bkk . (58 разновидностей)

Сравните: 51-AAA-a Português + внешний блок Galego 51-AAA-c Astur + Leon és внешний блок и т. д.

коды SIL (10–14 выпуски)Коды, созданные для использования в Ethnologue, публикации SIL International это список языковой статистики. В публикации теперь используются коды ISO 639-3.ENGSPN
коды языковСоставленные коды, начинающиеся со старых кодов SIL и добавляющие дополнительную информацию.ENGSPN

См. Также

Ссылки

Внешние ссылки

Последняя правка сделана 2021-05-26 13:09:14
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте