Кодовая страница 950

редактировать
Кодовая страница Windows для традиционного китайского языка на основе Big5
Кодовая страница 950
Язык (и)Традиционный китайский
СозданоMicrosoft
РасширяетBig5
На основеBig5-ETen
  • v
  • t

Кодовая страница 950 - это кодовая страница, используемая в Microsoft Windows для традиционного китайского. Это реализация Microsoft де-факто стандартной кодировки символов Big5. Кодовая страница не зарегистрирована в IANA, и, следовательно, она не является стандартом для передачи информации через Интернет, хотя обычно обозначается просто как big5, в том числе функциями библиотеки Microsoft..

Содержание
  • 1 Терминология и варианты
  • 2 Однобайтовые коды
  • 3 Использование области частного использования
  • 4 См. Также
  • 5 Ссылки
  • 6 Внешние ссылки
Терминология и варианты

Основное различие между кодовой страницей Windows 950 и «обычным» (не зависящим от поставщика) Big5 заключается во включении подмножества расширений ETEN в Big5 в 0x от F9D6 до 0xF9FE (включая семь китайских иероглифов 碁, 銹, 裏, 墻, 恒, 粧 и 嫺, за которыми следуют 34 символа рисования прямоугольника и элементы блока ). Диапазоны, используемые некоторыми другими расширенными символами ETEN, вместо этого определены как символы, определяемые конечным пользователем (для частного использования).

Реализация CCSID 950 IBM немного отличается, включая некоторые расширения ETEN для ведущих байтов 0xA3, 0xC6, 0xC7 и 0xC8, опуская те, которые имеют ведущий байт 0xF9 (который включает Microsoft), отображая их вместо этого в Private Use Area как определяемые пользователем символы.

Microsoft обновила их версию кодовой страницы 950 в 2000 году, добавив знак евро (€) в двухбайтовый код 0xA3E1. IBM называет обновление знака евро как CCSID 1370 (которое включает как однобайтовые (0x80), так и двухбайтовые знаки евро) или CCSID 1373 (который включает только двухбайтовый знак евро). Кодовая страница 1373 соответствует поведению Microsoft, в которое включены расширения ETEN.

CCSID 950 состоит из однобайтовой кодовой страницы 1114 (CCSID 1114) и двухбайтовой кодовой страницы 947 ( CCSID 947), тогда как расширенный CCSID 1370 для знака евро состоит из однобайтовой кодовой страницы 1114 (CCSID 5210) и двухбайтовой кодовой страницы 947 (CCSID 21427).

Однобайтовые коды

Ниже приведены однобайтовые графические символы, включенные IBM. Коды от 0x00 до 0x1F и 0x7F могут использоваться вместо управляющих кодов C0, в зависимости от контекста (сравните кодовую страницу 437, кодовую страницу 897 ). Как отмечалось выше, однобайтовый знак евро в 0x80 не включен ни в IBM CCSID 950, ни в 1373, ни в Microsoft.

Кодовая страница 1114
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_.. 263A. 263B. 2665. 2666. 2663. 2660. 2022. 25D8. 25CB. 25D9. 2642. 2640. 266A. 266B. 263C
1_. 25BA. 25C4. 2195. 203C. 00B6§. 00A7. 25AC. 21A8. 2191. 2193. 2192. 2190. 221F. 2194. 25B2. 25BC
2_SP. 0020!. 0021". 0022#. 0023$. 0024%. 0025. 0026'. 0027(. 0028). 0029*. 002A+. 002B,. 002C-. 002D.. 002E/. 002F
3_0. 00301. 00312. 00323. 00334. 00345. 00356. 00367. 00378. 00389. 0039:. 003A;. 003B<. 003C=. 003D>. 003E?. 003F
4_@. 0040A. 0041B. 0042C. 0043D. 0044E. 0045F. 0046G. 0047H. 0048I. 0049J. 004AK. 004BL. 004CM. 004DN. 004EO. 004F
5_P. 0050Q. 0051R. 0052S. 0053T. 0054U. 0055V. 0056W. 0057X. 0058Y. 0059Z. 005A[. 005B\. 005C]. 005D^. 005E_. 005F
6_`. 0060a. 0061b. 0062c. 0063d. 0064e. 0065f. 0066g. 0067h. 0068i. 0069j. 006Ak. 006Bl. 006Cm. 006Dn. 006Eo. 006F
7_p. 0070q. 0071r. 0072s. 0073t. 0074u. 0075v. 0076w. 0077x. 0078y. 0079z. 007A{. 007B|. 007C}. 007D~. 007E. 2302
8_. 20AC...............

Буква Число Знаки препинания Символ Другое Не определено

Остальные являются частями двухбайтовой последовательности.

Использование области частного использования
Сопоставление от Big5 EUDC до PUA кодовых точек
Диапазон Big5Диапазон UnicodeФормула
81 40–8D FEU + EEB8 – U + F6B00xeeb8 + (157 * (H-0x81)) + (L <0x80)?(L-0x40):(L-0x62)
8E 40 – A0 FEU + E311 – U + EEB70xe311 + (157 * (H-0x8e)) + (L <0x80)?(L-0x40):(L-0x62)
C6 A1 – C8 FEU + F6B1 – U + F8480xf672 + (157 * (H-0xc6)) + (L <0x80)?(L-0x40):(L-0x62)
FA 40 – FE FEU + E000 – U + E3100xe000 + (157 * (H-0xfa)) + (L <0x80)?(L-0x40):(L-0x62)

Это сопоставление также используется в HKSCS, где данный глиф еще не найден в указанной версии Unicode.

См. Также
Ссылки
  1. ^«Наборы символов». IANA - Реестры протоколов.
  2. ^«Кодирование. Свойство WindowsCodePage -.NET Framework (текущая версия) ". MSDN. Microsoft.
  3. ^ Zhu, HF.; Hu, DY.; Wang, ZG.; Kao, TC.; Chang, WCH.; Crispin, M. (1996). "Кодировка китайских символов для Интернет-сообщений". Запросы на комментарии. IETF. doi : 10.17487 / rfc1922. RFC 1922.
  4. ^ «Информационный документ CCSID 950». Архивировано из исходного 02.12.2014.
  5. ^«Ведущий байт A3: ibm-950_P110-1999». Демонстрация ICU - Converter Explorer. Международные компоненты для Unicode.
  6. ^"Ведущий байт C6: ibm-950_P110-1999". Демонстрация ICU - Converter Explorer. Международные компоненты для Unicode.
  7. ^«Ведущий байт C7: ibm-950_P110-1999». Демонстрация ICU - Converter Explorer. Международные компоненты для Unicode.
  8. ^«Ведущий байт C8: ibm-950_P110-1999». Демонстрация ICU - Converter Explorer. Международные компоненты для Unicode.
  9. ^"Ведущий байт F9: ibm-950_P110-1999". Демонстрация ICU - Converter Explorer. Международные компоненты для Unicode.
  10. ^ «Информационный документ CCSID 1370». Архивировано из оригинального 27 марта 2016 года.
  11. ^"ibm-1373_P100-2002". Демонстрация ICU - Converter Explorer. Международные компоненты для Unicode.
  12. ^"Ведущий байт A3: ibm-1373_P100-2002". Демонстрация ICU - Converter Explorer. Международные компоненты для Unicode.
  13. ^«Ведущий байт C6: ibm-1373_P100-2002». Демонстрация ICU - Converter Explorer. Международные компоненты для Unicode.
  14. ^«Ведущий байт C7: ibm-1373_P100-2002». Демонстрация ICU - Converter Explorer. Международные компоненты для Unicode.
  15. ^"Ведущий байт C8: ibm-1373_P100-2002". Демонстрация ICU - Converter Explorer. Международные компоненты для Unicode.
  16. ^«Ведущий байт F9: ibm-1373_P100-2002». Демонстрация ICU - Converter Explorer. Международные компоненты для Unicode.
  17. ^«Информационный документ CCSID 1114». Архивировано из оригинала 27.03.2016.
  18. ^«Информационный документ CCSID 947». Архивировано с оригинального 01.12.2014.
  19. ^"Информационный документ CCSID 5210". Архивировано с оригинального 29.11.2014.
  20. ^«Информационный документ CCSID 21427». Архивировано из исходного 27 марта 2016 года.
  21. ^Кодовая страница CPGID 01114 (pdf) (PDF), IBM
  22. ^Кодовая страница CPGID 01114 (txt), IBM
  23. ^«Таблица наилучшего соответствия Windows: CP950». unicode.org. Проверено 13 сентября 2016 г.
  24. ^"Big5". База данных кандзи. Проверено 13 сентября 2016 г.
  25. ^«Big5-HKSCS: 2008». Архивировано из исходного 13.09.2016.
Внешние ссылки
Последняя правка сделана 2021-05-15 13:41:14
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте