Тайский промышленный стандарт 620-2533

редактировать

Тайский промышленный стандарт 620-2533, обычно называемый TIS-620, является наиболее распространенным набором символов и кодировкой символов для тайского языка. Стандарт опубликован (TISI), органом Министерства промышленности при Королевском правительстве Таиланда, и является единственным официальным стандартом для кодирования тайского языка в Таиланде. Описательное название стандарта - «Стандарт тайских кодов символов для компьютеров» (тайский: รหัส สำหรับ อักขระ ไทย ที่ ใช้ กับ คอมพิวเตอร์). «2533» относится к 2533 году буддийской эры (1990), году, когда была опубликована настоящая версия стандарта; предыдущая редакция, TIS 620-2529 (1986), теперь устарела.

TIS-620 - это предпочтительное имя кодировки IANA для TIS-620, и это имя набора символов также используется для ISO / IEC 8859-11 (который добавляет неразрывный пробел в 0xA0, который не назначен в TIS-620). Когда используется имя IANA, коды дополняются управляющими кодами C0 и C1 из ISO / IEC 6429.

Содержание

  • 1 Структура
  • 2 Варианта
  • 3 символа set
  • 4 Дополнительная литература
  • 5 Ссылки
  • 6 Внешние ссылки

Структура

TIS-620 представляет собой стандартный набор национальных символов Extended ASCII с традиционной структурой, который сохраняет полную совместимость с 7-битным ASCII и использует 8-битный шестнадцатеричный диапазон от A1 до FB для кодирования тайского алфавита. Из-за сложного сочетания тайских гласных и диакритических знаков, TIS-620 предназначен только для обмена информацией, и для правильного составления символов требуется дополнительный механизм отображения.

Варианты

Практически идентичная версия TIS-620 была принята как ISO / IEC 8859-11 в 2001 году, единственное отличие состоит в том, что ISO / IEC 8859- 11 определяет шестнадцатеричный A0 как неразрывный пробел, в то время как TIS-620 оставляет его неопределенным, но зарезервированным. (На практике это небольшое различие обычно игнорируется.)

Набор ISO / IEC 8859-11 также был зарегистрирован как ISO-IR-166 Ecma International, но этот вариант добавляет явные escape-коды для обозначения начала и конца тайских последовательностей символов.

Порядок набора символов TIS-620 также использовался по существу, как и в рамках Unicode (ISO / IEC 10646 ). Тайский блок Unicode - это от U + 0E01 до U + 0E7F, а тайские символы TIS-620 можно преобразовать в UTF-16, просто добавив к каждому байту префикс 0E и вычтя шестнадцатеричный A0 из значение.

Набор символов

TIS-620
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_. 0
1_. 16
2_. 32SP. 0020!. 0021". 0022#. 0023$. 0024%. 0025. 0026'. 0027(. 0028). 0029*. 002A+. 002B,. 002C-. 002D.. 002E/. 002F
3_. 480. 00301. 00312. 00323. 00334. 00345. 00356. 00367. 00378. 00389. 0039:. 003A;. 003B<. 003C=. 003D>. 003E?. 003F
4_. 64@. 0040A. 0041B. 0042C. 0043D. 0044E. 0045F. 0046G. 0047H. 0048I. 0049J. 004AK. 004BL. 004CM. 004DN. 004EO. 004F
5_. 80P. 0050Q. 0051R. 0052S. 0053T. 0054U. 0055V. 0056W. 0057X. 0058Y. 0059Z. 005A[. 005B\. 005C]. 005D^. 005E_. 005F
6_. 96`. 0060a. 0061b. 0062c. 0063d. 0064e. 0065f. 0066g. 0067h. 0068i. 0069j. 006Ak. 006Bl. 006Cm. 006Dn. 006Eo. 006F
7_. 112p. 0070q. 0071r. 0072s. 0073t. 0074u. 0075v. 0076w. 0077x. 0078y. 0079z. 007A{. 007B|. 007C}. 007D~. 007E
8_. 128
9_. 144
A_. 160ก. 0E01ข. 0E02ฃ. 0E03ค. 0E04ฅ. 0E05ฆ. 0E06ง. 0E07จ. 0E08ฉ. 0E09ช. 0E0Aซ. 0E0B ​​ฌ. 0E0Cญ. 0E0Dฎ. 0E0Eฏ. 0E0F ​​
B_. 176ฐ. 0E10ฑ. 0E11ฒ. 0E12ณ. 0E13ด. 0E14ต. 0E15ถ. 0E16ท. 0E17ธ. 0E18น. 0E19บ. 0E1Aป. 0E1Bผ. 0E1Cฝ. 0E1Dพ. 0E1Eฟ. 0E1F
C_. 192ภ. 0E20ม. 0E21ย. 0E22ร. 0E23ฤ. 0E24ล. 0E25ฦ. 0E26ว. 0E27ศ. 0E28ษ. 0E29ส. 0E2Aห. 0E2Bฬ. 0E2Cอ. 0E2Dฮ. 0E2Eฯ. 0E2F
D_. 208ะ. 0E30◌ั. 0E31า. 0E32ำ. 0E33◌ิ. 0E34◌ี. 0E35◌ึ. 0E36◌ื. 0E37◌ุ. 0E38◌ู. 0E39◌ฺ. 0E3A฿. 0E3F
E_. 224เ. 0E40แ. 0E41โ. 0E42ใ. 0E43ไ. 0E44ๅ. 0E45ๆ. 0E46◌็. 0E47◌่. 0E48◌้. 0E49◌๊. 0E4A◌๋. 0E4B◌์. 0E4C◌ํ. 0E4D◌๎. 0E4E๏. 0E4F
F_. 240๐. 0E50๑. 0E51๒. 0E52๓. 0E53๔. 0E54๕. 0E55๖. 0E56๗. 0E57๘. 0E58๙. 0E59๚. 0E5A๛. 0E5B

Letter Число Знаки препинания Символ Другое Не определено

В приведенной выше таблице 20 - это обычный символ ПРОБЕЛА. Кодовые значения 00-1F, 7F, 80-9F, A0, DB-DE и FC-FF не присваиваются символам в TIS-620.

Кодовые значения D1, D4-DA, E7-EE - это комбинированные символы.

Дополнительная литература

Ссылки

Внешние ссылки

Последняя правка сделана 2021-06-10 03:48:04
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте