Вариант формы (Unicode)

редактировать

A Вариант формы - это другой глиф для символа, закодированный в Unicode с помощью механизма последовательностей вариантов : последовательностей в Юникоде, которые состоят из базового символа, за которым следует символ селектора вариантов .

Вариант формы обычно имеет очень похожий внешний вид и значение, что и его основная форма. Механизм предназначен для вариантных форм, где, как правило, если вариантная форма недоступна, отображение основного символа не меняет смысла текста и может даже не быть заметным для многих читателей.

Unicode определяет два типа последовательностей вариантов:

  • Стандартизированные последовательности вариантов, определенные в StandardizedVariants.txt
  • Идеографические последовательности вариаций, определенные в базе данных идеографических вариаций (IVD)

Символы выбора варианта находятся в нескольких блоках Unicode:

Селекторы вариантов не требуются для арабских и латинских символов курсива, где замена глифов может происходить в зависимости от контекста: глифы могут быть соединены вместе в зависимости от того, является ли символ начальным символом в слове, последним символом, медиальный или изолированный характер. Эти типы замены глифов легко обрабатываются контекстом символа без участия других исходных данных. Авторы также могут использовать специальные символы, такие как присоединяющиеся и не присоединяющиеся, для принудительного использования альтернативной формы глифа там, где она иначе не появилась бы. Лигатуры представляют собой аналогичные случаи, когда глифы можно заменить простым включением или отключением лигатур в качестве атрибута форматированного текста.

Для замены других глифов намерение автора может быть закодировано с текстом и не может быть определено контекстно. Так обстоит дело с символом / глифами, называемыми гайдзи, где разные глифы используются для одного и того же символа либо исторически, либо для идеограмм для фамилий. Это одна из серых областей при различении глифа и символа: если имя семейства немного отличается от символа идеограммы, от которого оно происходит, то это простой вариант глифа или вариант символа?

Подстановки символов могут также происходить вне Unicode, например, с тегами макета OpenType.

Содержание

  • 1 Блоки со стандартизованными последовательностями вариантов
  • 2 Блоки с последовательностями идеографических вариантов
  • 3 См. Также
  • 4 Ссылки

Блоки со стандартизованными последовательностями вариантов

Начиная с Unicode 13.0, стандартизованные последовательности вариантов, специально предназначенные для представления эмодзи / текста, определены для базовых символов в двадцати блоках:

Другие стандартные варианты Последовательности действий формируются из базовых символов в следующих одиннадцати блоках:

Блоки с последовательностями идеографических вариаций

По состоянию на 12 декабря 2017 года идеографические вариации последовательности определены для основных символов в восьми блоках:

См. Также

Ссылки

Последняя правка сделана 2021-06-18 09:53:13
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте