VISCII

редактировать
Неофициальная кодировка символов вьетнамского алфавита
VISCII
MIME / IANAVISCII
Язык (и)Вьетнамский, Английский
СозданоViet-Std Group
ОпределенияRFC 1456
Классификация8-битный SBCS
На основеASCII
  • v
  • t

VISCII - это неофициально определенная модифицированная кодировка символов ASCII для использование вьетнамского языка на компьютерах. Ее не следует путать с официально зарегистрированной кодировкой VSCII с аналогичным названием. VISCII сохраняет 95 печатных символов ASCII без изменений, но заменяет 6 из 33 управляющих символов на печатные символы. Он добавляет 128 предварительно составленных символов. Юникод и кодовая страница Windows-1258 теперь используются практически для всех вьетнамских компьютерных данных, но устаревшие файлы VSCII и VISCII могут нуждаться в преобразовании.

Содержание

  • 1 История и именование
  • 2 Дизайн
  • 3 Поддержка
  • 4 Набор символов
  • 5 См. Также
  • 6 Ссылки
  • 7 Дополнительная литература
  • 8 Внешние ссылки

История и именование

VISCII был разработан Вьетнамской рабочей группой по стандартизации (Viet-Std Group), базирующейся в Кремниевой долине, Калифорния, в 1992 году, когда они работали с консорциумом Unicode для включать предварительно составленные вьетнамские символы в стандарт Unicode. VISCII, наряду с VIQR, был впервые опубликован в двуязычном отчете в сентябре 1992 года, в котором он был назван «Вьетнамским стандартным кодом для обмена информацией». В отчете отмечается рост использования компьютеров во Вьетнаме, что существующие приложения используют кодировки, зависящие от поставщика, которые не могут взаимодействовать друг с другом, и что поэтому необходима стандартизация между поставщиками.

В следующем году, в 1993 году, Вьетнам принял TCVN 5712, свой первый национальный стандарт в области информационных технологий. Это определило кодировку символов под названием VSCII, которая была разработана TCVN Техническим комитетом по информационным технологиям (TCVN / TC1), и ее название означает «Вьетнамский стандартный код информации. Развязка ». VSCII несовместим с ранее опубликованным VISCII и не связан с ним. В отличие от VISCII, VSCII является «вьетнамским стандартом» в смысле национального стандарта.

VISCII и VIQR были утверждены как информационный статус RFC 1456, отнесенный к группе Viet-Std и датированный маем 1993 года. В этом RFC отмечается, что они являются «соглашениями», используемыми иностранными вьетнамскими носителями в Usenet, и что он «не указывает уровень стандарт ». Несмотря на это, он продолжает называть VISCII «стандартным кодом VIetname for Information Interchange» (то же имя, что и VSCII). Ярлыки VISCIIи csVISCIIзарегистрированы в IANA для VISCII со ссылкой на RFC 1456. (С другой стороны, официального ярлыка IANA нет. для TCVN 5712 / VSCII, хотя x-viet-tcvn5712ранее поддерживался Mozilla Firefox.)

Дизайн

Традиционный расширенный набор символов ASCII состоит из набора ASCII плюс до 128 символов. Вьетнамский требует 134 дополнительных буквенно-диакритических сочетания, что на шесть больше. Существует (не считая отказа от поддержки тональной метки для заглавных букв, как в VSCII-3 ) по существу четыре различных способа решения этой проблемы:

  1. Использование кодировки переменной ширины (как включает UTF-8 )
  2. Включает , объединяющий диакритические знаки для тоновых знаков (как и VSCII-2 и Windows-1258 ) или для диакритических знаков в общие (как и ANSEL и VNI )
  3. Замените некоторые знаки препинания ASCII, предпочтительно знаки препинания, которые не являются неизменными в ISO 646 (как и VNI для DOS )
  4. Замените как минимум шесть основных управляющих символов ASCII (как и VPS и VSCII-1 )

VISCII выбрал последний вариант, заменив шесть наименее проблемных (например, с наименьшей вероятностью быть распознанным приложением и особым образом обработанным) Контрольные коды C0 (STX, ENQ, ACK, DC4, EM и RS) с шестью наименее используемыми прописными буквами и диакритическими знаками комбинации. Хотя этот параметр может привести к сбою программ, использующих эти управляющие коды, при работе с VISCII text, он создает меньше сложностей, чем два других варианта (разработчики отмечают, что не- 8-битная чистая передача оказалась на практике более трудной, чем повторное использование управляющего символа). Тем не менее, расположение как управляющих символов C0 или C1, так и кодов, используемых для неразрывного пробела в ISO-8859-1, Mac OS Roman и OEM-US были намеренно присвоены прописным буквам с намерением использовать строчные кодовые точки с полностью заглавным шрифтом в качестве рабочего обходного пути, если графические символы не могут отображаться для этих кодов.

Однако использование всех расширенных кодовых точек для акцентированных букв не оставляло места для добавления полезных символов, надстрочных чисел, изогнутых кавычек, правильных тире и т. Д., Как и для большинства других расширенных наборов символов ASCII.

Расположение символов намеренно в основном соответствует ISO-8859-1, где есть общие символы между двумя кодовыми страницами (верхний регистр Õ отмечен как исключение), мотивировано соображениями удобства для пользователя.

Поддержка

VISCII частично поддерживается TriChlor Software Group в Калифорнии, которая выпустила различные пакеты программного обеспечения, совместимые с VISCII, библиотеки, и шрифты для MS-DOS и Windows, Unix и Macintosh. Программное обеспечение, совместимое с VISCII, доступно на многих FTP-сайтах..

VISCII исторически предлагался в качестве кодировки исходящей электронной почты компанией Mozilla Thunderbird.

VISCII в основном использовался иностранцами, говорящими на вьетнамском языке, причем VSCII (TCVN) более популярен в северном Вьетнаме, а VNI более популярен в южном Вьетнаме.

Набор символов

VISCII
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_. 0NUL. 0000SOH. 0001. 1EB2ETX. 0003EOT. 0004. 1EB4. 1EAABEL. 0007BS. 0008HT. 0009LF. 000AVT. 000BFF. 000CCR. 000DSO. 000ESI. 000F
1_. 16DLE. 0010DC1. 0011DC2. 0012DC3. 0013. 1EF6NAK. 0015SYN. 0016ETB. 0017CAN. 0018. 1EF8SUB. 001AESC. 001BFS. 001CGS. 001D. 1EF4US. 001F
2_. 32SP. 0020!. 0021". 0022#. 0023$. 0024%. 0025. 0026'. 0027(. 0028). 0029*. 002A+. 002B,. 002C-. 002D.. 002E/. 002F
3_. 480. 00301. 00312. 00323. 00334. 00345. 00356. 00367. 00378. 00389. 0039:. 003A;. 003B<. 003C=. 003D>. 003E?. 003F
4_. 64@. 0040A. 0041B. 0042C. 0043D. 0044E. 0045F. 0046G. 0047H. 0048I. 0049J. 004AK. 004BL. 004CM. 004DN. 004EO. 004F
5_. 80P. 0050Q. 0051R. 0052S. 0053T. 0054U. 0055V. 0056W. 0057X. 0058Y. 0059Z. 005A[. 005B\. 005C]. 005D^. 005E_. 005F
6_. 96`. 0060a. 0061b. 0062c. 0063d. 0064e. 0065f. 0066g. 0067h. 0068i. 0069j. 006Ak. 006Bl. 006Cm. 006Dn. 006Eo. 006F
7_. 112p. 0070q. 0071r. 0072s. 0073t. 0074u. 0075v. 0076w. 0077x. 0078y. 0079z. 007A{. 007B|. 007C}. 007D~. 007EDEL. 007F
8_. 128. 1EA0. 1EAE. 1EB0. 1EB6. 1EA4. 1EA6. 1EA8. 1E AC. 1EBC. 1EB8. 1EBE. 1EC0. 1EC2. 1EC4. 1EC6. 1ED0
9_. 144. 1ED2. 1ED4. 1ED6. 1ED8. 1EE2. 1EDA. 1EDC. 1EDE. 1ECA. 1ECE. 1ECC. 1EC8. 1EE6Ũ. 0168. 1EE4. 1EF2
A_. 160Õ. 00D5. 1EAF. 1EB1. 1EB7. 1EA5. 1EA7. 1EA9. 1EAD. 1EBD. 1EB9ế. 1EBF. 1EC1. 1EC3. 1EC5. 1EC7. 1ED1
B_. 176. 1ED3. 1ED5. 1ED7. 1EE0Ơ. 01A0. 1ED9. 1EDD. 1EDF. 1ECB. 1EF0. 1EE8. 1EEA. 1EECơ. 01A1. 1EDBƯ. 01AF
C_. 192À. 00C0Á. 00C1Â. 00C2Ã. 00C3. 1EA2Ă. 0102. 1EB3. 1EB5È. 00C8É. 00C9Ê. 00CA. 1EBAÌ. 00CCÍ. 00CDĨ. 0128. 1EF3
D_. 208Đ. 0110. 1EE9Ò. 00D2Ó. 00D3Ô. 00D4. 1EA1. 1EF7. 1EEB. 1EEDÙ. 00D9Ú. 00DA. 1EF9. 1EF5Ý. 00DD. 1EE1ư. 01B0
E_. 224à. 00E0á. 00E1â. 00E2ã. 00E3. 1EA3ă. 0103. 1EEF. 1EABè. 00E8é. 00E9ê. 00EA. 1EBBì. 00ECí. 00EDĩ. 0129. 1EC9
F_. 240đ. 0111. 1EF1ò. 00F2ó. 00F3ô. 00F4õ. 00F5. 1ECF. 1ECD. 1EE5ù. 00F9ú. 00FAũ. 0169. 1EE7ý. 00FD. 1EE3. 1EEE

Буква Число Пунктуация Символ Другое Не определено

Отличия от ISO-8859-1 показаны затененными.

См. Также

Ссылки

Дополнительная литература

Внешние ссылки

Последняя правка сделана 2021-06-18 07:43:22
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте