В вычислениях кодировка JIS относится к нескольким японским промышленным стандартам для кодирования японского языка. Строго говоря, этот термин означает либо:
На практике «кодировка JIS» обычно относится к символьным данным JIS X 0208, закодированным с помощью JIS X 0202. Например, IANA использует JIS_Encoding
для ссылки на JIS X 0202 и ISO-20 22-JP
для обозначения его профиля, определенного в RFC 1468.
. Другие механизмы кодирования для символов JIS включают кодирование Shift JIS и EUC-JP. Shift JIS добавляет кандзи, хирагану во всю ширину и катакану во всю ширину из JIS X 0208 в JIS X 0201 обратно совместимым способом. Shift JIS является, пожалуй, наиболее широко используемой кодировкой в Японии, поскольку совместимость с однобайтовым набором символов JIS X 0201 позволила производителям электронного оборудования (например, производителям кассовых аппаратов) предлагать модернизацию более старого более дешевого оборудования, которое не использовалось. способен отображать иероглифы на новом оборудовании с сохранением совместимости набора символов.
EUC-JP используется в системах UNIX, где кодировки JIS несовместимы со стандартами POSIX.
Более поздней альтернативой кодированным символам JIS является Unicode (символы в кодировке UCS ), особенно в механизме кодирования UTF-8.
В следующей таблице сравниваются характеристики трех основных схем кодирования для JIS X 0208.
Кодирование | Альтернативное имя | 7 -bit? | ISO 2022 ? | Stateless? | Принимает ASCII ? | 0x00–7F всегда ASCII? | Надмножество 8-битного JIS X 0201 ? | Поддерживает JIS X 0212 ? | Самосинхронизация? | |
---|---|---|---|---|---|---|---|---|---|---|
ISO-2022-JP | "JIS "(JIS X 0202) | Да | Да | No | Да | Последовательности могут быть не- ASCII | Нет (возможна кодировка) | Возможно | Нет | |
Shift_JIS | "SJIS" | No | No | Да | Почти | Изолированные байты могут быть не-ASCII | Да | No | Нет | |
EUC-JP | «UJIS» (Unixized JIS) | No | Да | Да | Да | Всегда ASCII | Нет (в кодировке) | Доступно | Нет | |
Форматы Unicode для сравнения | ||||||||||
UTF-8 | No | No | Да | Да | Да | Нет (в кодировке) | Доступно | Да | ||
UTF- 16 | No | No | Да | No | No | Нет (закодировано) | Доступно | Только более 16-битные слова. | ||
GB 18030 | No | No | Да | Да | Изолированные байты могут быть не-ASCII | Нет (закодировано) | Доступно | Нет |