Z-вариант

редактировать
Посмотреть вверх z- вариант в Wiktionary, бесплатном словаре.

В Unicode два символа называются Z-варианты (часто пишутся zVariants ), если они имеют одну и ту же этимологию, но имеют немного другой внешний вид и разные кодовые точки Unicode . Например, символы Unicode U + 8AAA 說 и U + 8AAC 説 являются Z-вариантами. Понятие Z-вариации применимо только к «скриптам CJKV » - китайскому, японскому, корейскому и вьетнамскому - и является подтемой Ханьское объединение.

Содержание
  • 1 Различия в ось Z
  • 2 Путаница
  • 3 См. также
  • 4 Ссылки
Различия по оси Z

Философия Unicode в распределении кодовых точек для языков CJK организована по трем принципам « оси. ” Ось X представляет различия в семантике; например, латинская заглавная A (U + 0041 A) и греческая заглавная альфа (U + 0391 Α) представлены двумя разными кодовыми точками в Unicode и могут быть названы «X-вариантами» (хотя этот термин не является общим). Ось Y представляет значительные различия во внешнем виде, но не в семантике; например, традиционный китайский иероглиф мао «кошка» (U + 8C93 貓) и упрощенный китайский иероглиф (U + 732B 猫) являются вариантами Y.

Ось Z представляет незначительные типографические различия. Например, китайские иероглифы (U + 838A 莊) и (U + 8358 荘) являются Z-вариантами, как и (U + 8AAA 說) и (U + 8AAC 説). В глоссарии на Unicode.org «Z-вариант» определяется как «Два унифицированных идеографа CJK с идентичной семантикой и унифицируемыми формами», где «унифицируемый» понимается в смысле объединения Хань.

Таким образом, если бы ханьское объединение было совершенно успешным, Z-вариантов не существовало бы. Они существуют в Unicode, потому что считалось полезным иметь возможность «двустороннего» обмена документами между Unicode и другими кодировками CJK, такими как Big5 и CCCII. Например, символ 莊 имеет кодировку CCCII 21552D, а его Z-вариант 荘 имеет кодировку CCCII 2D552D. Таким образом, этим двум вариантам были присвоены разные кодовые точки Unicode, так что преобразование документа CCCII в Unicode и обратно было бы операцией без потерь.

Путаница

Есть некоторая путаница по поводу точного определения «Z-вариант». Например, в Интернет-черновике (из RFC 3743 ) от 2002 года можно найти bù «нет» (U + 4E0D ) и (U + F967 ), описанный как «варианты шрифта», причем термин «Z-вариант», очевидно, зарезервирован для межъязыковых пар, таких как мандаринский китайский tù «кролик» (U + 5154 ), а японцы - на «кролик» (U + 514E ). Однако база данных Unihan Консорциума Unicode обрабатывает обе пары как Z-варианты.

См. Также
Ссылки
Последняя правка сделана 2021-06-23 05:06:38
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте