MIME / IANA | iso-ir-165 |
---|---|
Псевдоним (а) | CN-GB-ISOIR165 (EUC форма) |
Язык (и) | Упрощенный китайский, Английский, Русский. Частичная поддержка: . Греческий, Японский |
Стандарт | ITU T.101, приложение C |
Определения | ISO-IR 165 |
Расширяет | GB 2312 |
Форматы кодирования | ISO-2022-CN-EXT, Синтаксис данных Videotex 2 |
Преемник | GB 18030 |
|
Китайский основной набор - это многобайтовый графический набор символов для китайских сообщений, созданный для Консультативного комитета по международной телефонной и телеграфной связи ( CCITT) в 1992 году. Он определен в ITU T.101, приложение C, в котором кодифицируется синтаксис данных 2 Videotex. Он зарегистрирован в реестре ISO-IR для использования с ISO / IEC 2022 как ISO-IR-165 и кодируется в ISO- 2022-CN-EXT версия кода.
Это расширенная модификация GB 2312 -80, соответствующая объединению стандартов материкового Китая GB GB 6345.1 -86 и GB 8565.2 -88, с некоторыми дальнейшими модификациями и расширениями. Подмножество расширений GB 6345.1 включено в GB 18030, тогда как GB 8565.2 служит исходной ссылкой материкового Китая для некоторых CJK Unified Ideographs.
GB 6345.1-86 (набор 32 × 32 матричных шрифтов китайских иероглифов для обмена информацией) включает исправление и расширение для GB 2312. Исправление изменяет следующие два символа:
Строка | EUC | Без изменений | GB 6341.1 | Примечания |
---|---|---|---|---|
03-71 | 0xA3E7 | ɡ | ||
79-81 | 0xEFF1 | 鍾 | 锺 |
Развернутые реализации, включающие GB 2312, например кодовая страница Windows 936, обычно следуют этим исправлениям при выборе сопоставлений Unicode.
Расширение добавляет символы половинной ширины ISO 646-CN в строке 10 (в дополнение к существующему полноширинному символу в строке 3), расширяет набор из 26 символов не-ASCII пиньинь в строке 8 шестью дополнительными такими символами и добавляет формы половинной ширины этих 32 символов пиньинь в строку 11. Эти расширения GB 6345.1 также включены в GB / T 12345, традиционный китайский аналог GB 2312, в дополнение к 29 формам вертикального представления в строке 6.
Шесть дополнительных пиньинь символы из GB 6345.1 и формы вертикального представления из GB 12345, но не формы половинной ширины, включены в классическую кодировку Mac OS для упрощенного китайского языка (модификация EUC-CN ), а также двухбайтовыми кодами в GB 18030. Дополнительные символы пиньинь следующие:
Row-cell | EUC | Character | Примечания |
---|---|---|---|
08-27 | 0xA8BB | U + 0251 ɑ | |
08-28 | 0xA8BC | U + 1E3F ḿ | |
08-29 | 0xA8BD | U + 0144 ñ | |
08-30 | 0xA8BE | U + 0148 ň | |
08-31 | 0xA8BF | U + 01F9 ǹ | |
08-32 | 0xA8C0 | U + 0261 ɡ |
GB 8565.2-88 (Обработка информации - Наборы кодированных символов для текстовой коммуникации - Часть 2: Графические символы) определяет расширение для GB 2312, добавляя 705 символов между строками 13–15 и 90–94, из которых 69 (все в строке 15) не являются ханзи. Он включает исправления GB 2312 из GB 6345.1, но не его расширения.
База данных Unihan ссылается на GB 8565.2 как на источник материкового Китая нескольких ханзи, включенных в Unicode. Аббревиатура его источника Unihan: G8
.
ISO-IR-165 включает расширения GB 2312 как из GB 6345.1-86, так и из GB 8565.2-88. Кроме того, он добавляет еще 161 символ (включая 139 символов ханзи, обозначенных как «общие китайские символы и варианты»). Эти расширения CCITT hanzi иногда ошибочно принимались за стандартные символы GB 8565.2, в том числе в предыдущих версиях базы данных Unihan. Всего в наборе 8446 знаков.
Ряд шаблонных полуграфических символов включен в строку 6. Это противоречит формам вертикального представления, включенным в другие расширения, такие как Mac OS Simplified Chinese и GB 18030.
Поправки GB 6345.1 к GB 2312 применяются только частично, в результате чего два отображения Unicode меняются местами по сравнению с другими кодировками, которые включают GB 2312 с расширениями GB 6345.1:
Row-cell | EUC | GB 2312 (без поправок) | GB 6341.1 | GB 6341.1 отображение | ISO-IR-165 | ISO-IR-165 отображение |
---|---|---|---|---|---|---|
03-71 | 0xA3E7 | ɡ | U + FF47 | ɡ | U + 0261 | |
08-32 | 0xA8C0 | (отсутствует) | ɡ | U + 0261 | U + FF47 | |
79-81 | 0xEFF1 | 鍾 | 锺 | U + 953A | 锺 | U + 953A |