Посмотреть вверх z- вариант в Wiktionary, бесплатном словаре. |
В Unicode два символа называются Z-варианты (часто пишутся zVariants ), если они имеют одну и ту же этимологию, но имеют немного другой внешний вид и разные кодовые точки Unicode . Например, символы Unicode U + 8AAA 說 и U + 8AAC 説 являются Z-вариантами. Понятие Z-вариации применимо только к «скриптам CJKV » - китайскому, японскому, корейскому и вьетнамскому - и является подтемой Ханьское объединение.
Философия Unicode в распределении кодовых точек для языков CJK организована по трем принципам « оси. ” Ось X представляет различия в семантике; например, латинская заглавная A (U + 0041 A) и греческая заглавная альфа (U + 0391 Α) представлены двумя разными кодовыми точками в Unicode и могут быть названы «X-вариантами» (хотя этот термин не является общим). Ось Y представляет значительные различия во внешнем виде, но не в семантике; например, традиционный китайский иероглиф мао «кошка» (U + 8C93 貓) и упрощенный китайский иероглиф (U + 732B 猫) являются вариантами Y.
Ось Z представляет незначительные типографические различия. Например, китайские иероглифы (U + 838A 莊) и (U + 8358 荘) являются Z-вариантами, как и (U + 8AAA 說) и (U + 8AAC 説). В глоссарии на Unicode.org «Z-вариант» определяется как «Два унифицированных идеографа CJK с идентичной семантикой и унифицируемыми формами», где «унифицируемый» понимается в смысле объединения Хань.
Таким образом, если бы ханьское объединение было совершенно успешным, Z-вариантов не существовало бы. Они существуют в Unicode, потому что считалось полезным иметь возможность «двустороннего» обмена документами между Unicode и другими кодировками CJK, такими как Big5 и CCCII. Например, символ 莊 имеет кодировку CCCII 21552D, а его Z-вариант 荘 имеет кодировку CCCII 2D552D. Таким образом, этим двум вариантам были присвоены разные кодовые точки Unicode, так что преобразование документа CCCII в Unicode и обратно было бы операцией без потерь.
Есть некоторая путаница по поводу точного определения «Z-вариант». Например, в Интернет-черновике (из RFC 3743 ) от 2002 года можно найти bù «нет» (U + 4E0D 不 ) и (U + F967 不 ), описанный как «варианты шрифта», причем термин «Z-вариант», очевидно, зарезервирован для межъязыковых пар, таких как мандаринский китайский tù «кролик» (U + 5154 兔 ), а японцы - на «кролик» (U + 514E 兎 ). Однако база данных Unihan Консорциума Unicode обрабатывает обе пары как Z-варианты.