Набор дополнительных символов Гонконга

редактировать

Дополнительный Character Hong Kong Set ( китайский : 香港增補字符集, обычно сокращенно HKSCS ) представляет собой набор китайских иероглифов - 4702 в общей сложности в первоначальном релизе используемые в кантонском, а также при написании названия некоторых мест в Гонконге Kong письменном кантонском или стандартном китайском языках ). Он произошел от предыдущего набора государственных китайских символов ( 政府 通用 字庫 ) или GCCS. GCCS - это набор дополнительных китайских символов, закодированных в пользовательских областях набора символов Big5. Первоначально он использовался правительством Гонконга, а затем использовался населением. Позже он превратился в Гонконгский дополнительный набор символов, когда символы из набора были переданы в ISO-10646 для кодирования.

Содержание
  • 1 История развития
    • 1.1 История версий
    • 1.2 Дополнительный набор символов для Макао
  • 2 Совместимость
    • 2.1 Операционные системы
      • 2.1.1 Microsoft Windows
      • 2.1.2 IBM
      • 2.1.3 Linux
      • 2.1.4 Mac OS
    • 2.2 Приложения и Интернет
  • 3 См. Также
  • 4 Примечания
  • 5 ссылки
  • 6 Внешние ссылки
История развития
Расширение HKSCS Big-5
MIME / IANA Big5-HKSCS
Псевдоним (а) big5hk, csBig5HKSCS
Язык (и) Традиционный китайский, кантонский диалект
Классификация 8-битный CJK DBCS
Расширяется Big5 ETen
  • v
  • т
  • е

Из-за существенных различий между стандартным письменным китайским и письменным кантонским диалектом правительство Гонконга признало необходимость в стандартизированном наборе патентованных символов, который позволил бы упростить электронную коммуникацию; в то время схема кодирования китайского языка Big5 не содержала подавляющего большинства этих символов (некоторые были ошибочно включены в перекрестный список с похожими символами).

Китайское правительство Character Set ( 政府通用字庫 ) или GCCS , таким образом, разработанный правительством. Набор символов состоит из китайских иероглифов, обычно используемых в Гонконге. Некоторые символы относятся к кантонскому диалекту, а некоторые представляют собой альтернативные формы символов. Набор не очень хорошо организован, и персонажи не изучены внимательно.

Впоследствии был разработан HKSCS-1999 (спецификация HKSCS 1999). После его принятия новые версии были выпущены в 2001 году (добавлено 116 новых символов) и в 2004 году (добавлено 123 новых символа), всего 4941 символ. 106 символов GCCS были удалены из HKSCS-1999 в результате унификации, а их кодовые точки Big5 зарезервированы для совместимости. Устаревшие «не поддающиеся проверке» символы GCCS находятся в источниках UTC (UTC-00877 – UTC-00898), где они получены из Adobe-CNS1-1, дополнения Adobe-CNS1, реализованного для поддержки GCCS.

HKSCS кодируется в Big5 (Big5-HKSCS, big5hk) и ISO 10646 ( Unicode ). Начиная с HKSCS-2004, все символы, ранее использовавшиеся в разделе «Частное использование» Unicode, переназначаются, причем многие из них переназначаются в блок расширения B или блок совместимости с дополнительной идеографической плоскостью. Однако для сохранения совместимости с программами, которые генерируют кодовые точки PUA, выделенные кодовые точки зарезервированы, и никакие новые символы не будут отображаться в PUA.

История версий

HKSCS прошел несколько итераций.

Версия Всего персонажей Дата публикации
GCCS 3049 1995 г.
HKSCS-1999 4 702 09/1999
HKSCS-2001 4818 12/2001
HKSCS-2004 4941 05/2005
HKSCS-2008 5 009 12/2009
HKSCS-2016 5 033 05/2017

Последней версией HKSCS для кодирования всех своих символов в Big5 был HKSCS-2008, в то время как символы, добавленные в HKSCS-2016, отображаются только в Unicode (как горизонтальное расширение глифов CJK Unified Ideographs, где это необходимо).

Дополнительный набор символов Макао

Как и в случае с Гонконгом, существуют также символы, которые необходимы Макао, но не включены ни в Big5, ни в HKSCS, поэтому был разработан дополнительный набор символов Макао, основанный на HKSCS с дополнительными символами, отображенными в Unicode. Первая партия из 121 символа MSCS была представлена ​​для добавления или горизонтального расширения в Unicode (при необходимости) в 2009 году, а первая окончательная версия MSCS была создана в 2020 году.

Совместимость

Операционные системы

Майкрософт Виндоус

В Microsoft Windows 98, NT 4.0, 2000, XP поддержку HKSCS можно включить с помощью патча Microsoft. В реализации Microsoft приложение, использующее кодовую страницу 950, автоматически использует таблицу скрытых кодовых страниц 951 для кодировки Big5 расширений HKSCS. Таблица поддерживает все кодовые точки в HKSCS-2001, за исключением кодовых точек совместимости, указанных в стандарте. Кроме того, шрифт MingLiU изменен с помощью патча Microsoft. Известно, что этот патч создает конфликты в таких приложениях, как Microsoft Office, или в любом приложении, использующем шрифты, поддерживающие упрощенные китайские символы (например, Simsun ). Если целевая среда содержит настраиваемый шрифт, сопоставленный кодовым точкам, затронутым патчем Microsoft, пользовательские шрифты могут отменить патч Microsoft. Кроме того, патч нарушает работу редактора EUDC, поставляемого с уязвимыми версиями Windows.

Начиная с Windows Vista, символы HKSCS-2004 поддерживаются только как Unicode 4.1 или новее. Всем символам присваиваются стандартные коды, отличные от PUA. Символы отображаются шрифтом MingLiU, и эти символы можно вводить с клавиатуры. Патч, обеспечивающий кодировку Big5 для HKSCS, не поддерживается в Windows Vista и более поздних версиях. Утилита, предоставляемая Microsoft, доступна для преобразования символов в кодировке HKSCS и Unicode PUA в версию Unicode 4.1.

В 2010 году Microsoft опубликовала патч HKSCS-2004 для Windows XP и Windows Server 2003. Он заменяет версию MingLiu, PMingLiu и MingLiu_HKSCS для Windows XP (если был применен патч HKSCS-2001) версией MingLiu, PMingLiu и MingLiu_HKSCS для Windows 7. Кроме того, в целевую систему будут добавлены шрифты MingLiU-ExtB, MingLiU_HKSCS-ExtB и PMingLiU-ExtB. Однако IME не обновляется, как это было в случае патча HKSCS-2001, а шрифты взяты из предварительной версии Windows 7.

Для более ранних версий ОС поддержка HKSCS требует использования патча Microsoft или утилит Digital 21 правительства Гонконга.

IBM

IBM пронумеровывает форму Big5 HKSCS-2001 как кодовую страницу 5471.

Linux

Поддержка HKSCS была добавлена ​​в glibc в 2000 году, но с тех пор не обновлялась. Поддержка HKSCS-2004 обрабатывается как Unicode 4.1 и новее.

Для установки freedesktop.org шрифт AR PL ShanHeiSun Uni полностью поддерживает HKSCS-2004, начиная с версии 0.1-0.dot.1, с последней версией HKSCS-2004, поддерживаемой в версии 0.1.20060903-1.

Современные настольные дистрибутивы (например, Ubuntu) включают в себя HKSCS-совместимые шрифты UKai и UMing от Arphic Technology «из коробки», когда во время установки выбрана поддержка традиционного китайского языка. Их также можно будет установить вручную позже.

Mac OS

Mac OS X 10.0–10.2 поддерживает HKSCS-1999. 10.3–10.4 поддерживает HKSCS-2001. Некоторые буквы, добавленные в HKSCS-2004, поддерживаются через Unicode PUA в OS X 10.4. Начиная с OS X 10.5, все символы HKSCS-2004 поддерживаются с помощью стандартных кодовых точек Unicode 4.1.

Приложения и Интернет

Mozilla 1.5 и выше поддерживает HKSCS, с добавлением поддержки HKSCS-2004 в базу кода Gecko 1.8.1. В отличие от вышеупомянутого патча, Mozilla использует собственную таблицу кодовых страниц. Однако исправление для ошибки 343129 не поддерживает символы, сопоставленные с кодовыми точками выше базовой многоязычной плоскости.

Приложения на основе QT 3.x (например: KDE ) поддерживают только символы, отображаемые в кодовые точки FFFF или ниже. В QT4 символы вне BMP поддерживаются через суррогаты. Текстовый кодек Big5-HKSCS поддерживает HKSCS-1999 еще в Qt-2.3.x, но было слишком поздно в графике разработки Qt, чтобы быть официально включенным в серию Qt-2.3.x, поэтому он был официально поддержан в Qt-3.0.1. Поддержка HKSCS-2001 была добавлена ​​в Qt-3.0.5.

GNOME поддерживает символы HKSCS в диапазонах Unicode, кроме тех, которые отображаются в блоке совместимости Basic Multilingual Plane. Патчи для поддержки персонажей, отображаемых на вышеупомянутом Basic Multilingual Plane, были введены в Pango 1.1.

WHATWG Кодирование Стандартный (используется HTML5 ) включает в себя HKSCS в своем определении Big5 (используется даже с обычной этикеткой Big5). Однако только его декодер использует все расширения HKSCS, а его кодировщик явно исключает те, у которых ведущие байты ниже 0xA1 (таким образом исключая большинство расширений HKSCS, но включая, например, те, которые унаследованы от Big5 ETEN ). Более новые браузеры следуют этому стандарту, включая Firefox.

Смотрите также
Примечания
Рекомендации
внешняя ссылка
Последняя правка сделана 2023-04-13 12:24:43
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте