Тайский промышленный стандарт 620-2533, обычно называемый TIS-620, является наиболее распространенным набором символов и кодировкой символов для тайского языка. Стандарт опубликован (TISI), органом Министерства промышленности при Королевском правительстве Таиланда, и является единственным официальным стандартом для кодирования тайского языка в Таиланде. Описательное название стандарта - «Стандарт тайских кодов символов для компьютеров» (тайский: รหัส สำหรับ อักขระ ไทย ที่ ใช้ กับ คอมพิวเตอร์). «2533» относится к 2533 году буддийской эры (1990), году, когда была опубликована настоящая версия стандарта; предыдущая редакция, TIS 620-2529 (1986), теперь устарела.
TIS-620 - это предпочтительное имя кодировки IANA для TIS-620, и это имя набора символов также используется для ISO / IEC 8859-11 (который добавляет неразрывный пробел в 0xA0, который не назначен в TIS-620). Когда используется имя IANA, коды дополняются управляющими кодами C0 и C1 из ISO / IEC 6429.
TIS-620 представляет собой стандартный набор национальных символов Extended ASCII с традиционной структурой, который сохраняет полную совместимость с 7-битным ASCII и использует 8-битный шестнадцатеричный диапазон от A1 до FB для кодирования тайского алфавита. Из-за сложного сочетания тайских гласных и диакритических знаков, TIS-620 предназначен только для обмена информацией, и для правильного составления символов требуется дополнительный механизм отображения.
Практически идентичная версия TIS-620 была принята как ISO / IEC 8859-11 в 2001 году, единственное отличие состоит в том, что ISO / IEC 8859- 11 определяет шестнадцатеричный A0 как неразрывный пробел, в то время как TIS-620 оставляет его неопределенным, но зарезервированным. (На практике это небольшое различие обычно игнорируется.)
Набор ISO / IEC 8859-11 также был зарегистрирован как ISO-IR-166 Ecma International, но этот вариант добавляет явные escape-коды для обозначения начала и конца тайских последовательностей символов.
Порядок набора символов TIS-620 также использовался по существу, как и в рамках Unicode (ISO / IEC 10646 ). Тайский блок Unicode - это от U + 0E01 до U + 0E7F, а тайские символы TIS-620 можно преобразовать в UTF-16, просто добавив к каждому байту префикс 0E и вычтя шестнадцатеричный A0 из значение.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_. 0 | ||||||||||||||||
1_. 16 | ||||||||||||||||
2_. 32 | SP. 0020 | !. 0021 | ". 0022 | #. 0023 | $. 0024 | %. 0025 | . 0026 | '. 0027 | (. 0028 | ). 0029 | *. 002A | +. 002B | ,. 002C | -. 002D | .. 002E | /. 002F |
3_. 48 | 0. 0030 | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | :. 003A | ;. 003B | <. 003C | =. 003D | >. 003E | ?. 003F |
4_. 64 | @. 0040 | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F |
5_. 80 | P. 0050 | Q. 0051 | R. 0052 | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | [. 005B | \. 005C | ]. 005D | ^. 005E | _. 005F |
6_. 96 | `. 0060 | a. 0061 | b. 0062 | c. 0063 | d. 0064 | e. 0065 | f. 0066 | g. 0067 | h. 0068 | i. 0069 | j. 006A | k. 006B | l. 006C | m. 006D | n. 006E | o. 006F |
7_. 112 | p. 0070 | q. 0071 | r. 0072 | s. 0073 | t. 0074 | u. 0075 | v. 0076 | w. 0077 | x. 0078 | y. 0079 | z. 007A | {. 007B | |. 007C | }. 007D | ~. 007E | |
8_. 128 | ||||||||||||||||
9_. 144 | ||||||||||||||||
A_. 160 | ก. 0E01 | ข. 0E02 | ฃ. 0E03 | ค. 0E04 | ฅ. 0E05 | ฆ. 0E06 | ง. 0E07 | จ. 0E08 | ฉ. 0E09 | ช. 0E0A | ซ. 0E0B | ฌ. 0E0C | ญ. 0E0D | ฎ. 0E0E | ฏ. 0E0F | |
B_. 176 | ฐ. 0E10 | ฑ. 0E11 | ฒ. 0E12 | ณ. 0E13 | ด. 0E14 | ต. 0E15 | ถ. 0E16 | ท. 0E17 | ธ. 0E18 | น. 0E19 | บ. 0E1A | ป. 0E1B | ผ. 0E1C | ฝ. 0E1D | พ. 0E1E | ฟ. 0E1F |
C_. 192 | ภ. 0E20 | ม. 0E21 | ย. 0E22 | ร. 0E23 | ฤ. 0E24 | ล. 0E25 | ฦ. 0E26 | ว. 0E27 | ศ. 0E28 | ษ. 0E29 | ส. 0E2A | ห. 0E2B | ฬ. 0E2C | อ. 0E2D | ฮ. 0E2E | ฯ. 0E2F |
D_. 208 | ะ. 0E30 | ◌ั. 0E31 | า. 0E32 | ำ. 0E33 | ◌ิ. 0E34 | ◌ี. 0E35 | ◌ึ. 0E36 | ◌ื. 0E37 | ◌ุ. 0E38 | ◌ู. 0E39 | ◌ฺ. 0E3A | ฿. 0E3F | ||||
E_. 224 | เ. 0E40 | แ. 0E41 | โ. 0E42 | ใ. 0E43 | ไ. 0E44 | ๅ. 0E45 | ๆ. 0E46 | ◌็. 0E47 | ◌่. 0E48 | ◌้. 0E49 | ◌๊. 0E4A | ◌๋. 0E4B | ◌์. 0E4C | ◌ํ. 0E4D | ◌๎. 0E4E | ๏. 0E4F |
F_. 240 | ๐. 0E50 | ๑. 0E51 | ๒. 0E52 | ๓. 0E53 | ๔. 0E54 | ๕. 0E55 | ๖. 0E56 | ๗. 0E57 | ๘. 0E58 | ๙. 0E59 | ๚. 0E5A | ๛. 0E5B |
Letter Число Знаки препинания Символ Другое Не определено
В приведенной выше таблице 20 - это обычный символ ПРОБЕЛА. Кодовые значения 00-1F, 7F, 80-9F, A0, DB-DE и FC-FF не присваиваются символам в TIS-620.
Кодовые значения D1, D4-DA, E7-EE - это комбинированные символы.