Кодовая страница 936 (Microsoft Windows)

редактировать

Кодовая страница Windows 936 (сокращенно MS936, Windows-936 или (неоднозначно) CP936 ), это кодировка Microsoft для упрощенного китайского, одного из четырех DBCS для восточноазиатских языков. Первоначально Windows-936 охватывала GB 2312 (в форме EUC-CN ), но она была расширена для охвата большей части GBK с выпуском Windows 95.

Кодовая страница IBM 936 - это другая кодировка для упрощенного китайского, хотя Международные компоненты для Unicode не включает кодек IBM-936 и использует кодовую страницу Windows для " cp936 "этикетка. Кодовая страница IBM для покрытия GBK - Кодовая страница 1386 (CP1386 или IBM-1386 ), которая определяется как комбинация однобайтового кода . страница 1114 и двойной байт.

Он был заменен кодовой страницей 54936 (GB 18030 ), но по состоянию на 2014 год все еще использовался. В командной строке Windows в качестве кодовой страницы по умолчанию для упрощенных китайских установок используется CP936, хотя часть GB 18030 была сделана обязательной для всех программных продуктов, продаваемых в Китае. В 2002 году Интернет-имя IANA GBK было зарегистрировано в сопоставлении Windows-936, что сделало его де-факто определением GBK в Интернете.

Понятия «Windows-936», «GBK», «GB2312» и «EUC-CN» иногда путают в различных программных продуктах. Кодовые страницы MS936 и 1386 не идентичны GBK, потому что кодовая страница кодирует символы, тогда как GBK определяет только кодовые точки. Кроме того, знак евро (€), закодированный как 0x80 как в Windows-936, так и в IBM-1386, не определен в GBK. С другой стороны, 95 символов, определенных в GBK, изначально не были закодированы в Windows-936.

Эта проблема частично решена в более поздних версиях Windows, и, как и в Windows 7, все символы GBK, не входящие в Unicode BMP Private Use Area, могут отображаться с использованием кодовой страницы 936, но с кодировкой По состоянию на 2014 год 95 символов все еще не поддерживались. Однако "CP936" и "GBK" часто используются как синонимы из-за популярности продуктов Microsoft на китайском рынке, когда GBK был тогда опубликован.

Поскольку GBK давно заменил GB 2312, эти два термина также стали практически эквивалентными для многих пользователей, поэтому «Windows-936», «GBK» и «GB 2312» многими неправильно понимаются как означающие одно и то же. хотя на самом деле они существенно различаются. Вместо поддержки именно EUC-CN / GB 2312 большинство современных программных продуктов на базе Windows подразумевают частичную поддержку GBK через Windows-936, когда они используют термин «GB 2312» в качестве варианта кодировки символов. Это можно наблюдать в таких продуктах, как Microsoft Internet Explorer и Notepad ++.

Примечания

Ссылки

Внешние ссылки

Windows-936:

IBM-1386:

Последняя правка сделана 2021-05-15 13:41:13
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте