MIME / IANA | VISCII |
---|---|
Язык (и) | Вьетнамский, Английский |
Создано | Viet-Std Group |
Определения | RFC 1456 |
Классификация | 8-битный SBCS |
На основе | ASCII |
|
VISCII - это неофициально определенная модифицированная кодировка символов ASCII для использование вьетнамского языка на компьютерах. Ее не следует путать с официально зарегистрированной кодировкой VSCII с аналогичным названием. VISCII сохраняет 95 печатных символов ASCII без изменений, но заменяет 6 из 33 управляющих символов на печатные символы. Он добавляет 128 предварительно составленных символов. Юникод и кодовая страница Windows-1258 теперь используются практически для всех вьетнамских компьютерных данных, но устаревшие файлы VSCII и VISCII могут нуждаться в преобразовании.
VISCII был разработан Вьетнамской рабочей группой по стандартизации (Viet-Std Group), базирующейся в Кремниевой долине, Калифорния, в 1992 году, когда они работали с консорциумом Unicode для включать предварительно составленные вьетнамские символы в стандарт Unicode. VISCII, наряду с VIQR, был впервые опубликован в двуязычном отчете в сентябре 1992 года, в котором он был назван «Вьетнамским стандартным кодом для обмена информацией». В отчете отмечается рост использования компьютеров во Вьетнаме, что существующие приложения используют кодировки, зависящие от поставщика, которые не могут взаимодействовать друг с другом, и что поэтому необходима стандартизация между поставщиками.
В следующем году, в 1993 году, Вьетнам принял TCVN 5712, свой первый национальный стандарт в области информационных технологий. Это определило кодировку символов под названием VSCII, которая была разработана TCVN Техническим комитетом по информационным технологиям (TCVN / TC1), и ее название означает «Вьетнамский стандартный код информации. Развязка ». VSCII несовместим с ранее опубликованным VISCII и не связан с ним. В отличие от VISCII, VSCII является «вьетнамским стандартом» в смысле национального стандарта.
VISCII и VIQR были утверждены как информационный статус RFC 1456, отнесенный к группе Viet-Std и датированный маем 1993 года. В этом RFC отмечается, что они являются «соглашениями», используемыми иностранными вьетнамскими носителями в Usenet, и что он «не указывает уровень стандарт ». Несмотря на это, он продолжает называть VISCII «стандартным кодом VIetname for Information Interchange» (то же имя, что и VSCII). Ярлыки VISCII
и csVISCII
зарегистрированы в IANA для VISCII со ссылкой на RFC 1456. (С другой стороны, официального ярлыка IANA нет. для TCVN 5712 / VSCII, хотя x-viet-tcvn5712
ранее поддерживался Mozilla Firefox.)
Традиционный расширенный набор символов ASCII состоит из набора ASCII плюс до 128 символов. Вьетнамский требует 134 дополнительных буквенно-диакритических сочетания, что на шесть больше. Существует (не считая отказа от поддержки тональной метки для заглавных букв, как в VSCII-3 ) по существу четыре различных способа решения этой проблемы:
VISCII выбрал последний вариант, заменив шесть наименее проблемных (например, с наименьшей вероятностью быть распознанным приложением и особым образом обработанным) Контрольные коды C0 (STX, ENQ, ACK, DC4, EM и RS) с шестью наименее используемыми прописными буквами и диакритическими знаками комбинации. Хотя этот параметр может привести к сбою программ, использующих эти управляющие коды, при работе с VISCII text, он создает меньше сложностей, чем два других варианта (разработчики отмечают, что не- 8-битная чистая передача оказалась на практике более трудной, чем повторное использование управляющего символа). Тем не менее, расположение как управляющих символов C0 или C1, так и кодов, используемых для неразрывного пробела в ISO-8859-1, Mac OS Roman и OEM-US были намеренно присвоены прописным буквам с намерением использовать строчные кодовые точки с полностью заглавным шрифтом в качестве рабочего обходного пути, если графические символы не могут отображаться для этих кодов.
Однако использование всех расширенных кодовых точек для акцентированных букв не оставляло места для добавления полезных символов, надстрочных чисел, изогнутых кавычек, правильных тире и т. Д., Как и для большинства других расширенных наборов символов ASCII.
Расположение символов намеренно в основном соответствует ISO-8859-1, где есть общие символы между двумя кодовыми страницами (верхний регистр Õ отмечен как исключение), мотивировано соображениями удобства для пользователя.
VISCII частично поддерживается TriChlor Software Group в Калифорнии, которая выпустила различные пакеты программного обеспечения, совместимые с VISCII, библиотеки, и шрифты для MS-DOS и Windows, Unix и Macintosh. Программное обеспечение, совместимое с VISCII, доступно на многих FTP-сайтах..
VISCII исторически предлагался в качестве кодировки исходящей электронной почты компанией Mozilla Thunderbird.
VISCII в основном использовался иностранцами, говорящими на вьетнамском языке, причем VSCII (TCVN) более популярен в северном Вьетнаме, а VNI более популярен в южном Вьетнаме.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_. 0 | NUL. 0000 | SOH. 0001 | Ẳ. 1EB2 | ETX. 0003 | EOT. 0004 | Ẵ. 1EB4 | Ẫ. 1EAA | BEL. 0007 | BS. 0008 | HT. 0009 | LF. 000A | VT. 000B | FF. 000C | CR. 000D | SO. 000E | SI. 000F |
1_. 16 | DLE. 0010 | DC1. 0011 | DC2. 0012 | DC3. 0013 | Ỷ. 1EF6 | NAK. 0015 | SYN. 0016 | ETB. 0017 | CAN. 0018 | Ỹ. 1EF8 | SUB. 001A | ESC. 001B | FS. 001C | GS. 001D | Ỵ. 1EF4 | US. 001F |
2_. 32 | SP. 0020 | !. 0021 | ". 0022 | #. 0023 | $. 0024 | %. 0025 | . 0026 | '. 0027 | (. 0028 | ). 0029 | *. 002A | +. 002B | ,. 002C | -. 002D | .. 002E | /. 002F |
3_. 48 | 0. 0030 | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | :. 003A | ;. 003B | <. 003C | =. 003D | >. 003E | ?. 003F |
4_. 64 | @. 0040 | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F |
5_. 80 | P. 0050 | Q. 0051 | R. 0052 | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | [. 005B | \. 005C | ]. 005D | ^. 005E | _. 005F |
6_. 96 | `. 0060 | a. 0061 | b. 0062 | c. 0063 | d. 0064 | e. 0065 | f. 0066 | g. 0067 | h. 0068 | i. 0069 | j. 006A | k. 006B | l. 006C | m. 006D | n. 006E | o. 006F |
7_. 112 | p. 0070 | q. 0071 | r. 0072 | s. 0073 | t. 0074 | u. 0075 | v. 0076 | w. 0077 | x. 0078 | y. 0079 | z. 007A | {. 007B | |. 007C | }. 007D | ~. 007E | DEL. 007F |
8_. 128 | Ạ. 1EA0 | Ắ. 1EAE | Ằ. 1EB0 | Ặ. 1EB6 | Ấ. 1EA4 | Ầ. 1EA6 | Ẩ. 1EA8 | Ậ. 1E AC | Ẽ. 1EBC | Ẹ. 1EB8 | Ế. 1EBE | Ề. 1EC0 | Ể. 1EC2 | Ễ. 1EC4 | Ệ. 1EC6 | Ố. 1ED0 |
9_. 144 | Ồ. 1ED2 | Ổ. 1ED4 | Ỗ. 1ED6 | Ộ. 1ED8 | Ợ. 1EE2 | Ớ. 1EDA | Ờ. 1EDC | Ở. 1EDE | Ị. 1ECA | Ỏ. 1ECE | Ọ. 1ECC | Ỉ. 1EC8 | Ủ. 1EE6 | Ũ. 0168 | Ụ. 1EE4 | Ỳ. 1EF2 |
A_. 160 | Õ. 00D5 | ắ. 1EAF | ằ. 1EB1 | ặ. 1EB7 | ấ. 1EA5 | ầ. 1EA7 | ẩ. 1EA9 | ậ. 1EAD | ẽ. 1EBD | ẹ. 1EB9 | ế. 1EBF | ề. 1EC1 | ể. 1EC3 | ễ. 1EC5 | ệ. 1EC7 | ố. 1ED1 |
B_. 176 | ồ. 1ED3 | ổ. 1ED5 | ỗ. 1ED7 | Ỡ. 1EE0 | Ơ. 01A0 | ộ. 1ED9 | ờ. 1EDD | ở. 1EDF | ị. 1ECB | Ự. 1EF0 | Ứ. 1EE8 | Ừ. 1EEA | Ử. 1EEC | ơ. 01A1 | ớ. 1EDB | Ư. 01AF |
C_. 192 | À. 00C0 | Á. 00C1 | Â. 00C2 | Ã. 00C3 | Ả. 1EA2 | Ă. 0102 | ẳ. 1EB3 | ẵ. 1EB5 | È. 00C8 | É. 00C9 | Ê. 00CA | Ẻ. 1EBA | Ì. 00CC | Í. 00CD | Ĩ. 0128 | ỳ. 1EF3 |
D_. 208 | Đ. 0110 | ứ. 1EE9 | Ò. 00D2 | Ó. 00D3 | Ô. 00D4 | ạ. 1EA1 | ỷ. 1EF7 | ừ. 1EEB | ử. 1EED | Ù. 00D9 | Ú. 00DA | ỹ. 1EF9 | ỵ. 1EF5 | Ý. 00DD | ỡ. 1EE1 | ư. 01B0 |
E_. 224 | à. 00E0 | á. 00E1 | â. 00E2 | ã. 00E3 | ả. 1EA3 | ă. 0103 | ữ. 1EEF | ẫ. 1EAB | è. 00E8 | é. 00E9 | ê. 00EA | ẻ. 1EBB | ì. 00EC | í. 00ED | ĩ. 0129 | ỉ. 1EC9 |
F_. 240 | đ. 0111 | ự. 1EF1 | ò. 00F2 | ó. 00F3 | ô. 00F4 | õ. 00F5 | ỏ. 1ECF | ọ. 1ECD | ụ. 1EE5 | ù. 00F9 | ú. 00FA | ũ. 0169 | ủ. 1EE7 | ý. 00FD | ợ. 1EE3 | Ữ. 1EEE |
Буква Число Пунктуация Символ Другое Не определено
Отличия от ISO-8859-1 показаны затененными.