Формы с половинной и полной шириной

редактировать
Символы альтернативной ширины в Восточноазиатская типографика Командная строка (cmd.exe ) с корейской локализацией, отображающая символы половинной и полной ширины

на языке CJK (китайский, яп. anese и корейский), графические символы традиционно классифицируются как полноширинные (в Тайване и Гонконге : 全形 ; в CJK: 全 角 ) и половинная ширина (в Тайване и Гонконге : 半形 ; в CJK: 半角 ) символов. В шрифтах фиксированной ширины символ половинной ширины занимает половину ширины символа полной ширины, отсюда и название.

Формы половинной и полной ширины - это также имя блока Unicode U + FF00 – FFEF, при условии, что более старые кодировки, содержащие символы как половинной, так и полной ширины, могут иметь перевод без потерь в / из Unicode.

Содержание

  • 1 Обоснование
  • 2 В Unicode
  • 3 В OpenType
  • 4 См. Также
  • 5 Ссылки
  • 6 Внешние ссылки

Обоснование

Символы в обоих JIS X 0201 (однобайтный) и JIS X 0208 / JIS X 0213 (двухбайтный) имеют как полуширину, так и полную ширину в Shift JIS.

Во времена текстового режима вычислений символы западного алфавита обычно располагались в виде сетки на экране, часто 80 столбцов на 24 или 25 строк. Каждый символ отображался в виде небольшой точечной матрицы, часто около 8 пикселей шириной, и SBCS (однобайтовый набор символов) обычно использовался для кодирования символов. западных языков.

По ряду практических и эстетических причин символы Han должны быть квадратными, примерно в два раза шире, чем эти символы SBCS фиксированной ширины. Поскольку они обычно кодировались в DBCS (двухбайтовый набор символов), это также означало, что их ширина на экране с использованием двухшумного шрифта была пропорциональна их длине байта. Некоторые терминалы и программы редактирования не могли обрабатывать двухбайтовые символы, начинающиеся с нечетных столбцов, только четные (некоторые не могли даже помещать двухбайтовые и однобайтовые символы в одну строку). Таким образом, наборы DBCS обычно включают латинские символы и цифры для использования вместе с символами CJK в одной строке.

С другой стороны, ранние японские вычисления использовали однобайтовую кодовую страницу с названием JIS X 0201 для катакана. Они будут отображаться с той же шириной, что и другие однобайтовые символы, что сделает их символами половинной ширины кана, а не обычными пропорциями каны. Хотя стандарт JIS X 0201 сам по себе не определяет отображение половинной ширины для катаканы, это стало визуально отличительной особенностью в Shift JIS между однобайтовым JIS X 0201 и двухбайтовым JIS X 0208 катакана. Некоторые кодовые страницы IBM использовали аналогичную обработку для корейского джамо, основанную на N-байтовом коде хангыль и его переводе EBCDIC.

В Unicode

Для совместимости с существующими наборами символов, которые содержат версии одного и того же символа как с половинной, так и с полной шириной, Unicode выделяет один блок в U + FF00 – FFEF содержащие необходимые символы «альтернативной ширины». Это включает в себя полноширинную версию всех символов ASCII и некоторые знаки препинания, отличные от ASCII, такие как знак йены, версии половинной ширины катаканы и хангыль, а также версии половинной ширины некоторых естественно квадратных символов, таких как как круги. Были выделены только символы, необходимые для обхода без потерь к существующим наборам символов, а не (например) создание полноразмерной версии каждого символа с латинским акцентом.

Unicode присваивает каждой кодовой точке свойство «Восточно-азиатская ширина» . Это может быть:

Свойства символа Юникода на основе ширины
АббревиатураИмяОписание
WШирокийЕстественно широкий символ, например Хирагана.
NaУзкийЕстественно узкий символ, например Базовый латинский алфавит ISO.
FFullwidthШирокий вариант с нормализацией совместимости на естественно узкий символ, например полноразмерный латинский шрифт.
HHalfwidthУзкий вариант с нормализацией совместимости до естественно широкого символа, например Кана половинной ширины. Включает U + 20A9 ( ) в качестве исключения.
AНеоднозначноеСимволы, включенные в коды DBCS для Восточной Азии, но также и в коды SBCS для Европы, например Греческий алфавит. Следовательно, дуоширинное поведение может варьироваться.
NНейтральноСимволы, которых нет в восточноазиатских кодах DBCS, например Деванагари.

Эмуляторы терминала могут использовать это свойство, чтобы решить, должен ли персонаж занимать один или два «столбца» при определении вкладок и положения курсора.

В OpenType

OpenType имеет теги функций "fwid", "halt", "hwid" и "vhal", которые используются для обеспечения полной или половинной ширины символа.

См. Также

Ссылки

Внешние ссылки

Последняя правка сделана 2021-05-22 11:15:56
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте