ISO-IR-165

редактировать
Китайский набор CCITT (ISO-IR 165)
MIME / IANAiso-ir-165
Псевдоним (а)CN-GB-ISOIR165(EUC форма)
Язык (и)Упрощенный китайский, Английский, Русский. Частичная поддержка: . Греческий, Японский
СтандартITU T.101, приложение C
ОпределенияISO-IR 165
РасширяетGB 2312
Форматы кодированияISO-2022-CN-EXT, Синтаксис данных Videotex 2
ПреемникGB 18030
  • v
  • t

Китайский основной набор - это многобайтовый графический набор символов для китайских сообщений, созданный для Консультативного комитета по международной телефонной и телеграфной связи ( CCITT) в 1992 году. Он определен в ITU T.101, приложение C, в котором кодифицируется синтаксис данных 2 Videotex. Он зарегистрирован в реестре ISO-IR для использования с ISO / IEC 2022 как ISO-IR-165 и кодируется в ISO- 2022-CN-EXT версия кода.

Это расширенная модификация GB 2312 -80, соответствующая объединению стандартов материкового Китая GB GB 6345.1 -86 и GB 8565.2 -88, с некоторыми дальнейшими модификациями и расширениями. Подмножество расширений GB 6345.1 включено в GB 18030, тогда как GB 8565.2 служит исходной ссылкой материкового Китая для некоторых CJK Unified Ideographs.

Содержание
  • 1 GB 6345.1
  • 2 GB 8565.2
  • 3 изменения CCITT
  • 4 Ссылки
  • 5 Внешние ссылки
GB 6345.1

GB 6345.1-86 (набор 32 × 32 матричных шрифтов китайских иероглифов для обмена информацией) включает исправление и расширение для GB 2312. Исправление изменяет следующие два символа:

Изменения, внесенные в существующие символы GB 2312 посредством GB 6345.1
Строка EUC Без измененийGB 6341.1Примечания
03-710xA3E7ɡg
79-810xEFF1

Развернутые реализации, включающие GB 2312, например кодовая страница Windows 936, обычно следуют этим исправлениям при выборе сопоставлений Unicode.

Расширение добавляет символы половинной ширины ISO 646-CN в строке 10 (в дополнение к существующему полноширинному символу в строке 3), расширяет набор из 26 символов не-ASCII пиньинь в строке 8 шестью дополнительными такими символами и добавляет формы половинной ширины этих 32 символов пиньинь в строку 11. Эти расширения GB 6345.1 также включены в GB / T 12345, традиционный китайский аналог GB 2312, в дополнение к 29 формам вертикального представления в строке 6.

Шесть дополнительных пиньинь символы из GB 6345.1 и формы вертикального представления из GB 12345, но не формы половинной ширины, включены в классическую кодировку Mac OS для упрощенного китайского языка (модификация EUC-CN ), а также двухбайтовыми кодами в GB 18030. Дополнительные символы пиньинь следующие:

Расширения, выполненные GB 6345.1 до GB 2312, строка 8
Row-cell EUC CharacterПримечания
08-270xA8BBU + 0251 ɑ
08-280xA8BCU + 1E3F ḿ
08-290xA8BDU + 0144 ñ
08-300xA8BEU + 0148 ň
08-310xA8BFU + 01F9 ǹ
08-320xA8C0U + 0261 ɡ
GB 8565.2

GB 8565.2-88 (Обработка информации - Наборы кодированных символов для текстовой коммуникации - Часть 2: Графические символы) определяет расширение для GB 2312, добавляя 705 символов между строками 13–15 и 90–94, из которых 69 (все в строке 15) не являются ханзи. Он включает исправления GB 2312 из GB 6345.1, но не его расширения.

База данных Unihan ссылается на GB 8565.2 как на источник материкового Китая нескольких ханзи, включенных в Unicode. Аббревиатура его источника Unihan: G8.

CCITT changes

ISO-IR-165 включает расширения GB 2312 как из GB 6345.1-86, так и из GB 8565.2-88. Кроме того, он добавляет еще 161 символ (включая 139 символов ханзи, обозначенных как «общие китайские символы и варианты»). Эти расширения CCITT hanzi иногда ошибочно принимались за стандартные символы GB 8565.2, в том числе в предыдущих версиях базы данных Unihan. Всего в наборе 8446 знаков.

Ряд шаблонных полуграфических символов включен в строку 6. Это противоречит формам вертикального представления, включенным в другие расширения, такие как Mac OS Simplified Chinese и GB 18030.

Поправки GB 6345.1 к GB 2312 применяются только частично, в результате чего два отображения Unicode меняются местами по сравнению с другими кодировками, которые включают GB 2312 с расширениями GB 6345.1:

Row-cell EUC GB 2312 (без поправок)GB 6341.1GB 6341.1 отображениеISO-IR-165ISO-IR-165 отображение
03-710xA3E7ɡg U + FF47ɡU + 0261
08-320xA8C0(отсутствует)ɡU + 0261g U + FF47
79-810xEFF1U + 953AU + 953A
Ссылки
  1. ^ Zhu, HF.; Hu, DY.; Wang, ZG.; Kao, TC.; Чанг, WCH.; Криспин, М. (1996). «Кодировка китайских символов для Интернет-сообщений». Запросы на комментарии. IETF. doi : 10.17487 / rfc1922. RFC 1922.
  2. ^ Чанг, Джемин (2018-01-24). «Персонажи псевдо-G8» (PDF). ISO / IEC JTC 1 / SC 2 / WG 2 / IRG N2276.
  3. ^ Лунде, Кен (2009). Обработка информации CJKV: китайские, японские, корейские и вьетнамские вычисления (2-е изд.). Севастополь, Калифорния : О'Рейли. С. 94–111. ISBN 978-0-596-51447-1.
  4. ^ CCITT (1992-07-13). Коды китайского графического набора символов для связи (PDF). ITSCJ / IPSJ. ISO-IR-165.
  5. ^Стил, Шон (2000). «cp936 в таблицу Unicode». Microsoft, Консорциум Unicode.
  6. ^Лунде, Кен (1998). «Приложение F: GB / T 12345» (PDF). CJKV Обработка информации. О'Рейли Медиа. ISBN 9781565922242.
  7. ^ «Сопоставление (внешняя версия) упрощенной китайской кодировки Mac OS с Unicode 3.0 и более поздними версиями». Apple, Inc.
  8. ^ Управление стандартизации Китая (SAC) (2005-11-18). GB 18030-2005: Информационные технологии - набор китайских кодированных символов.
  9. ^«Политика стабильности кодирования символов Unicode». Консорциум Unicode. 2017-06-23.
  10. ^Вишванадха, Рагурам (2000-08-30). «Таблица Unicode в ISO-IR-165». Международные компоненты для Unicode. IBM.(Примечание: коды перечислены в источнике в 7-битной форме: добавьте 0x80 к каждому байту для формы EUC или вычтите 0x20 для формы kuten)
Внешние ссылки
Последняя правка сделана 2021-05-23 07:54:26
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте