на языке CJK (китайский, яп. anese и корейский), графические символы традиционно классифицируются как полноширинные (в Тайване и Гонконге : 全形 ; в CJK: 全 角 ) и половинная ширина (в Тайване и Гонконге : 半形 ; в CJK: 半角 ) символов. В шрифтах фиксированной ширины символ половинной ширины занимает половину ширины символа полной ширины, отсюда и название.
Формы половинной и полной ширины - это также имя блока Unicode U + FF00 – FFEF, при условии, что более старые кодировки, содержащие символы как половинной, так и полной ширины, могут иметь перевод без потерь в / из Unicode.
Во времена текстового режима вычислений символы западного алфавита обычно располагались в виде сетки на экране, часто 80 столбцов на 24 или 25 строк. Каждый символ отображался в виде небольшой точечной матрицы, часто около 8 пикселей шириной, и SBCS (однобайтовый набор символов) обычно использовался для кодирования символов. западных языков.
По ряду практических и эстетических причин символы Han должны быть квадратными, примерно в два раза шире, чем эти символы SBCS фиксированной ширины. Поскольку они обычно кодировались в DBCS (двухбайтовый набор символов), это также означало, что их ширина на экране с использованием двухшумного шрифта была пропорциональна их длине байта. Некоторые терминалы и программы редактирования не могли обрабатывать двухбайтовые символы, начинающиеся с нечетных столбцов, только четные (некоторые не могли даже помещать двухбайтовые и однобайтовые символы в одну строку). Таким образом, наборы DBCS обычно включают латинские символы и цифры для использования вместе с символами CJK в одной строке.
С другой стороны, ранние японские вычисления использовали однобайтовую кодовую страницу с названием JIS X 0201 для катакана. Они будут отображаться с той же шириной, что и другие однобайтовые символы, что сделает их символами половинной ширины кана, а не обычными пропорциями каны. Хотя стандарт JIS X 0201 сам по себе не определяет отображение половинной ширины для катаканы, это стало визуально отличительной особенностью в Shift JIS между однобайтовым JIS X 0201 и двухбайтовым JIS X 0208 катакана. Некоторые кодовые страницы IBM использовали аналогичную обработку для корейского джамо, основанную на N-байтовом коде хангыль и его переводе EBCDIC.
Для совместимости с существующими наборами символов, которые содержат версии одного и того же символа как с половинной, так и с полной шириной, Unicode выделяет один блок в U + FF00 – FFEF содержащие необходимые символы «альтернативной ширины». Это включает в себя полноширинную версию всех символов ASCII и некоторые знаки препинания, отличные от ASCII, такие как знак йены, версии половинной ширины катаканы и хангыль, а также версии половинной ширины некоторых естественно квадратных символов, таких как как круги. Были выделены только символы, необходимые для обхода без потерь к существующим наборам символов, а не (например) создание полноразмерной версии каждого символа с латинским акцентом.
Unicode присваивает каждой кодовой точке свойство «Восточно-азиатская ширина» . Это может быть:
Аббревиатура | Имя | Описание |
---|---|---|
W | Широкий | Естественно широкий символ, например Хирагана. |
Na | Узкий | Естественно узкий символ, например Базовый латинский алфавит ISO. |
F | Fullwidth | Широкий вариант с нормализацией совместимости на естественно узкий символ, например полноразмерный латинский шрифт. |
H | Halfwidth | Узкий вариант с нормализацией совместимости до естественно широкого символа, например Кана половинной ширины. Включает U + 20A9 (₩ ) в качестве исключения. |
A | Неоднозначное | Символы, включенные в коды DBCS для Восточной Азии, но также и в коды SBCS для Европы, например Греческий алфавит. Следовательно, дуоширинное поведение может варьироваться. |
N | Нейтрально | Символы, которых нет в восточноазиатских кодах DBCS, например Деванагари. |
Эмуляторы терминала могут использовать это свойство, чтобы решить, должен ли персонаж занимать один или два «столбца» при определении вкладок и положения курсора.
OpenType имеет теги функций "fwid", "halt", "hwid" и "vhal", которые используются для обеспечения полной или половинной ширины символа.