Язык (и) | Японский, Английский, Айну, Русский. Частичная поддержка : Греческий, Китайский |
---|---|
Стандартный | JIS X 0213 |
Классификация | ISO 2022, DBCS, Кодирование CJK |
Расширяет | JIS X 0208 |
Форматы кодирования | Shift_JIS-2004. ISO-2022- JP-2004. EUC-JIS-2004 |
Предшественник | JIS X 0208, JIS X 0212 |
|
JIS X 0213 - это Японский промышленный стандарт, определяющий наборы кодированных символов для кодирования символов, используемых в Японии. Этот стандарт расширяет JIS X 0208. Первая версия была опубликована в 2000 году и пересмотрена в 2004 году (JIS2004 ) и 2012 году. Помимо добавления ряда специальных символов, символов с диакритическими знаками и т. Д., Она включала дополнительные 3625 кандзи. Полное название стандарта: 7-битные и 8-битные двухбайтовые расширенные наборы KANJI для обмена информацией (7 ビ ッ ト 及 び び 8 ビ ッ ト の 2 バ イ ト 化 拡 張 漢字 集合, Nana-Bitto Ойоби Хачи-Битто но Ни-Байто Дзёхо Kōkan'yō Fugōka Kakuch Kanji Shūg).
JIS X 0213 имеет две «плоскости» (таблицы символов 94 × 94). Плоскость 1 - это надмножество JIS X 0208, содержащее наборы кандзи с 1 по 3 уровень и символы без кандзи, такие как хирагана, катакана (включая буквы, используемые для написания айнского языка ), латинский, греческий и кириллический алфавиты, цифры, символы и т. Д. Плоскость 2 содержит только набор кандзи четвертого уровня. Общее количество определенных символов - 11 233. Каждый символ может быть закодирован двумя байтами.
Этот стандарт в значительной степени заменил редко используемый JIS X 0212 -1990 «дополнительный» стандарт, который включал 5 801 кандзи и 266 не-кандзи. Из дополнительных 3695 кандзи в JIS X 0213 все, кроме 952, уже были в JIS X 0212.
JIS X 0213 определяет несколько 7-битных и 8-битных кодировок, включая EUC-JIS-2004, ISO-2022-JP-2004 и Shift JIS-2004. Кроме того, он определяет отображение каждой из этих кодировок в ISO / IEC 10646 (Unicode ) для каждого символа.
Unicode версии 3.2 включает все символы JIS X 0213, за исключением символов, которые могут быть представлены с помощью комбинирования символов. Поскольку около 300 кандзи находятся в плоскости Unicode 2, реализации Unicode, поддерживающие только Basic Multilingual Plane, не могут обрабатывать все символы JIS X 0213. Однако это не проблема для большинства приложений.
Варианты символов изменены в версии 2004 г. (щелкните, чтобы увеличить).В версии JIS X 0213 2004 г. были изменены рекомендованные форматы 168 кандзи. Десять дополнительных иероглифов были добавлены в JIS X 0213: 2004 .