Индийский алфавитный код для обмена информацией

редактировать
Схема кодирования для индийских систем письма

Индийский алфавитный код для обмена информацией (ISCII ) - это схема кодирования для представления различных систем письма Индии. Он кодирует основные индийские скрипты и латинскую транслитерацию. Поддерживаемые скрипты: ассамский, бенгальский (Bangla), деванагари, гуджарати, гурмукхи, Каннада, малаялам, ория, тамильский и телугу. ISCII не кодирует системы письма Индии, основанные на персидском, но его коды переключения систем письма, тем не менее, предусматривают кашмирский, синдхи, урду, персидский, пушту и арабский. Системы письма на персидском языке впоследствии были закодированы в кодировке PASCII.

ISCII не использовался широко за пределами определенных государственных учреждений и теперь в значительной степени устарел благодаря Unicode. Unicode использует отдельный блок для каждой индийской системы письма и в значительной степени сохраняет структуру ISCII внутри каждого блока.

Содержание

  • 1 Фон
  • 2 Макет кодовой страницы
  • 3 Специальные кодовые точки
  • 4 Кодовые страницы для преобразования ISCII
  • 5 Кодовые точки для всех языков
  • 6 Внешние ссылки

Фон

Системы письма, производные от брами, имеют аналогичную структуру. Таким образом, ISCII кодирует буквы с одним и тем же фонетическим значением в одной и той же кодовой точке, перекрывая различные сценарии. Например, коды ISCII 0xB3 0xDB представляют [ki]. Это будет отображаться как കി в Малаялам, कि в Деванагари, как ਕਿ в Гурмукхи и как கி на тамильском. Система записи может быть выбрана в формате RTF с помощью разметки или в виде обычного текста с помощью кода ATR, описанного ниже.

Одним из мотивов использования единой кодировки является идея, что она позволит легко транслитерировать из одной системы письма в другую. Однако существует достаточно несовместимости, поэтому это не совсем практическая идея. См. О ISCII.

ISCII - это 8-битная кодировка. Нижние 128 кодовых точек представляют собой простой ASCII, верхние 128 кодовых точек являются специфичными для ISCII. В дополнение к кодовым точкам, представляющим символы, ISCII использует кодовую точку с мнемоническим ATR, которая указывает, что следующий байт содержит один из двух видов информации. Один набор значений изменяет систему записи до следующего индикатора системы записи или конца строки. Другой набор значений выбирает режимы отображения, такие как полужирный и курсив. ISCII не предоставляет средств указания системы письма по умолчанию.

Макет кодовой страницы

В следующей таблице показан набор символов для Деванагари. Наборы кодов для ассамского, бенгальского, гуджарати, гурмукхи, каннада, малаялама, ория, тамильского и телугу аналогичны, причем каждая форма деванагари заменена на эквивалентную форму в каждой системе письма. Каждый символ отображается с его десятичным кодом и его эквивалентом в Unicode.

ISCII Деванагари
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_. 0NUL. 0000SOH. 0001STX. 0002ETX. 0003EOT. 0004ENQ. 0005ACK. 0006BEL. 0007BS. 0008HT. 0009LF. 000AVT. 000BFF. 000CCR. 000DSO. 000ESI. 000F
1_. 16DLE. 0010DC1. 0011DC2. 0012DC3. 0013DC4. 0014NAK. 0015SYN. 0016ETB. 0017CAN. 0018EM. 0019SUB. 001AESC. 001BFS. 001CGS. 001DRS. 001EUS. 001F
2_. 32SP. 0020!. 0021". 0022#. 0023$. 0024%. 0025. 0026'. 0027(. 0028). 0029*. 002A+. 002B,. 002C-. 002D.. 002E/. 002F
3_. 480. 00301. 00312. 00323. 00334. 00345. 00356. 00367. 00378. 00389. 0039:. 003A;. 003B<. 003C=. 003D>. 003E?. 003F
4_. 64@. 0040A. 0041B. 0042C. 0043D. 0044E. 0045F. 0046G. 0047H. 0048I. 0049J. 004AK. 004BL. 004CM. 004DN. 004EO. 004F
5_. 80P. 0050Q. 0051R. 0052S. 0053T. 0054U. 0055V. 0056W. 0057X. 0058Y. 0059Z. 005A[. 005B\. 005C]. 005D^. 005E_. 005F
6_. 96`. 0060a. 0061b. 0062c. 0063d. 0064e. 0065f. 0066g. 0067h. 0068i. 0069j. 006Ak. 006Bl. 006Cm. 006Dn. 006Eo. 006F
7_. 112p. 0070q. 0071r. 0072s. 0073t. 0074u. 0075v. 0076w. 0077x. 0078y. 0079z. 007A{. 007B|. 007C}. 007D~. 007EDEL. 007F
8_. 128
9_. 144
A_. 160ँ. 0901ं. 0902ः. 0903अ. 0905आ. 0906इ. 0907ई. 0908उ. 0909ऊ. 090Aऋ. 090Bऎ. 090Eए. 090Fऐ. 0910ऍ. 090Dऒ. 0912
B_. 176ओ. 0913औ. 0914ऑ. 0911क. 0915ख. 0916ग. 0917घ. 0918ङ. 0919च. 091Aछ. 091Bज. 091Cझ. 091Dञ. 091Eट. 091Fठ. 0920ड. 0921
C_. 192ढ. 0922ण. 0923त. 0924थ. 0925द. 0926ध. 0927न. 0928ऩ. 0929प. 092Aफ. 092Bब. 092Cभ. 092Dम. 092Eय. 092Fय़. 095Fर. 0930
D_. 208ऱ. 0931ल. 0932ळ. 0933ऴ. 0934व. 0935श. 0936ष. 0937स. 0938ह. 0939INV.ा. 093Eि. 093Fी. 0940ु. 0941ू. 0942ृ. 0943
E_. 224ॆ. 0946े. 0947ै. 0948ॅ. 0945ॊ. 094Aो. 094Bौ. 094Cॉ. 0949्. 094D़. 093C।. 0964ATR.
F_. 240EXT.०. 0966१. 0967२. 0968३. 0969४. 096A५. 096B६. 096C७. 096D८. 096E९. 096F

Буква Число Знаки препинания Символ Другое Не определено

Специальные кодовые точки

Символ INV - кодовая точка D9 (217)
Символ INV используется как псевдосогласный для изолированного отображения комбинируемых элементов. Например, (ka) + ् (halant) + INV = क्‍ (половина ka). Эквивалент Unicode: U + 200D ОБЪЕДИНЕНИЕ НУЛЕВОЙ ШИРИНЫ.
Символ ATR - кодовая точка EF (239)
Символ ATR, за которым следует байтовый код, используется для переключения на другой атрибут шрифта (например, полужирный) или язык (например, бенгальский) до следующей последовательности ATR или конца строки. У него нет прямого эквивалента Unicode, поскольку атрибуты шрифта не являются частью Unicode, и каждый сценарий имеет отдельный набор кодовых точек.
символ EXT - кодовая точка F0 (240)
EXT символ, за которым следует байтовый код, указывает на ведический акцент. У него нет прямого эквивалента Unicode, поскольку ведические акценты назначаются отдельным кодовым точкам.
Символ Halant ् - кодовая точка E8 (232)
Символ Halant удаляет неявный гласный звук из согласного и используется между согласными для обозначения соединенных согласных. Например, क (ka) + ् (halant) + त (ta) = क्त (kta). Последовательность ् (галант) + ् (галант) отображает конъюнкт с явным галантом, например क (ка) + ् (галант) + ् (галант) + त (та) = क्‌त. Последовательность ् (галант) + ़ (нукта) отображает конъюнкт с половинными согласными, если они доступны, например, क (ка) + ् (галант) + ़ (нукта) + त (та) = क्‍त.
ISCIIUnicode
single halantE8halant094D
halant + halantE8 E8halant + ZWNJ 094D 200C
halant + nuktaE8 E9halant + ZWJ 094D 200D
символ нукта ़— кодовая точка E9 (233)
символ нукта после другого ISCII символ используется для ряда более редких символов, которых нет в основном наборе ISCII. Например, क (ka) + ़ (nukta) = क़ (qa). Эти символы имеют предварительно составленные формы в Юникоде, как показано в следующей таблице.
Кодовая точка ISCII.Исходный символ.Символ. с нуктаКодовая точка Unicode.
A1 (161)0950
A6 (166)090C
A7 (167)0961
AA (176)0960
B3 (179)क़0958
B4 (180)ख़0959
B5 (181)ग़095A
BA (186)ज़095B
BF (191)ड़095C
C0 (192)ढ़095D
C9 (201)फ़095E
DB (219)ि0962
DC (220)0963
DF (223)0944
EA (234)093D

Кодовые страницы для преобразования ISCII

Для преобразования из Unicode (UTF-8) в ISCII / Кодировка ANSI, могут использоваться следующие кодовые страницы:

  • 57002: Деванагари (хинди, маратхи, санскрит, конкани)
  • 57003: бенгальский
  • 57004: тамильский
  • 57005: телугу
  • 57006: ассамский
  • 57007: одия
  • 57008: каннада
  • 57009: малаялам
  • 57010: гуджарати
  • 57011: панджаби (гурмукхи)

кодовые точки для всех языков

Кодовый набор для всех abugidas, использующих ISCII
HexОфициальный. ЛистингISO 15919 Деванагари Бенгальский Гурмукхи Гуджарати ория тамил телугу каннада малаялам
A0знак OM 09500AD0
A1модификатор гласных чандрабинду 090109810A010A810B010C01
A2Модификатор гласных ANUSWARAM 090209820A020A820B020B820C020C820D02
A3Модификатор гласного VISARGAM 090309830A030A830B030B830C030C830D03
A4Гласная Aa090509850A050A850B050B850C050C850D05
A5Гласная AAā090609860A060A860B060B860C060C860D06
A6Гласная Ii090709870A070A870B070B870C070C870D07
A6*Гласный LI (санскрит)090C098C0A8C0B0C0C0C0C8C0D0C
A7II гласныйī090809880A080A880B080B880C080C880D08
A7*Vowel LII (санскрит)096109E10AE10B610C610CE10D61
A8Гласный Uu090909890A090A890B090B890C090C890D09
A9Гласный UUū090A098A0A0A0A8A0B0A0B8A0C0A0C8A0D0A
AAГласный RI090B098B0A8B0B0B0C0B0C8B0D0B
AA *Гласная RII (санскрит)096009E00AE00B600C600CE00D60
ABГласная E (южные письменности)e090E0B8E0C0E0C8E0D0E
ACГласный EYē090F098F0A0F0A8F0B0F0B8F0C0F0C8F0D0F
ADГласный AIai091009900A100A900B100B900C100C900D10
AEГласный AYE (сценарий деванагари)ê090D0A8D
AFгласный O (южный алфавит)o09120B920C120C920D12
B0гласный OWō091309930A130A930B130B930C130C930D13
B1Гласная AUau091409940A140A940B140B940C140C940D14
B2Гласный AWE (сценарий деванагари)ô09110A91
B3Согласный KAk091509950A150A950B150B950C150C950D15
B3*Согласный QA (урду)qक़0958
B4Согласный KHAkh091609960A160A960B160C160C960D16
B4*Согласный KHHA (Урду)khख़0959ਖ਼0A59
B5Согласный GAg091709970A170A970B170C170C970D17
B5 *Согласный GHHA (урду)ġग़095Aਗ਼0A5A
B6Согласный GHAgh091809980A180A980B180C180C980D18
B7Согласный NGA091909990A190A990B190B990C190C990D19
B8Согласный CHAc091A099A0A1A0A9A0B1A0B9A0C1A0C9A0D1A
B9Согласный CHHAch091B099B0A1B0A9B0B1B0C1B0C9B0D1B
BAСогласный JAj091C099C0A1C0A9C0B1C0B9C0C1C0C9C0D1C
BA*Согласный ZA (урду)zज़095Bਜ਼0A5B
BBСогласный JHAjh091D099D0A1D0A9D0B1D0C1D0C9D0D1D
BCСогласный JNAñ091E099E0A1E0A9E0B1E0B9E0C1E0C9E0D1E
BDСогласный жесткий TA091F099F0A1F0A9F0B1F0B9F0C1F0C9F0D1F
BEЖесткий согласный THAṭh092009A00A200AA00B200C200CA00D20
BFЖесткий согласный DA092109A10A210AA10B210C210CA10D21
BF *Согласный колеблющийся DAड़095Cড়09DC0A5Cଡ଼0B5C
C0Согласный жесткий DHAḍh092209A20A220AA20B220C220CA20D22
C0*Согласный Flapped DHAṛhढ़095Dঢ়09DDଢ଼0B5D
C1Consonant Hard N A092309A30A230AA30B230BA30C230CA30D23
C2Consonant Soft TAt092409A40A240AA40B240BA40C240CA40D24
C3Consonant Soft THAth092509A50A250AA50B250C250CA50D25
C4Мягкий согласный DAd092609A60A260AA60B260C260CA60D26
C5Мягкий согласный DHAdh092709A70A270AA70B270C270CA70D27
C6Мягкий согласный NAn092809A80A280AA80B280BA80C280CA80D28
C7Согласный NA (тамильский)09290BA9
C8Согласный PAp092A09AA0A2A0AAA0B2A0BAA0C2A0CAA0D2A
C9Согласный PHAph092B09AB0A2B0AAB0B2B0C2B0CAB0D2B
C9*Согласный FA (урду)fफ़095Eਫ਼0A5E0CDE
CAСогласная BAb092C09AC0A2C0AAC0B2C0C2C0CAC0D2C
CBСогласный BHAbh092D09AD0A2D0AAD0B2D0C2D0CAD0D2D
CCСогласный MAm092E09AE0A2E0AAE0B2E0BAE0C2E0CAE0D2E
CDСогласный YAy092F09AF0A2F0AAF0B2F0BAF0C2F0CAF0D2F
CEСогласный JYA (бенгальский, ассамский и ория)य़095Fয়09DF0B5F
CFсогласный RA093009B00A300AB00B300BB00C300CB00D30
D0Согласный жесткий RA (Южный алфавит)09310BB10C310CB10D31
D1Согласный LAl093209B20A320AB20B320BB20C320CB20D32
D2Жесткий согласный LA0933ਲ਼0A330AB30B330BB30C330CB30D33
D3Согласный ZHA (тамильский и Малаялам)09340BB40D34
D4согласная VAv093509F10A350AB50B350BB50C350CB50D35
D5Согласный SHAś093609B6ਸ਼0A360AB60B360BB60C360CB60D36
D6Consonant Hard SHA093709B70AB70B370BB70C370CB70D37
D7Согласный SAs093809B80A380AB80B380BB80C380CB80D38
D8Согласный HAh093909B90A390AB90B390BB90C390CB90D39
D9НЕВИДИМЫЙ согласный
DAЗнак гласного AAā093E09BE0A3E0ABE0B3E0BBE0C3E0CBE0D3E
DBЗнак I гласногоiि093Fি09BFਿ0A3Fિ0ABFି0B3Fி0BBFి0C3Fಿ0CBFി0D3F
DB*Знак гласной LI (санскрит)096209E20AE20B620C620CE20D62
DCЗнак II гласногоī094009C00A400AC00B400BC00C400CC00D40
DC*Знак гласного LII (санскрит)096309E30AE30B630C630CE30D63
DDЗнак гласной Uu094109C10A410AC10B410BC10C410CC10D41
DEV owel Sign UUū094209C20A420AC20B420BC20C420CC20D42
DFVowel Sign RI094309C30AC30B430C430CC30D43
DF*Знак гласной RII (санскрит)094409C40AC40B440C440CC40D44
E0Знак гласной E (южные буквы)e09460BC60C460CC60D46
E1Знак гласного EYē094709C70A470AC70B470BC70C470CC70D47
E2Знак гласного AIai094809C80A480AC80B480BC80C480CC80D48
E3Знак гласной AYE (сценарий деванагари)ê09450AC5
E4Знак гласной O (Южный алфавит)o094A0BCA0C4A0CCA0D4A
E5Знак гласной OWō094B09CB0A4B0ACB0B4B0BCB0C4B0CCB0D4B
E6Знак гласной AUau094C09CC0A4C0ACC0B4C0BCC0C4C0CCC0D4C
E7Знак гласной AWE (сценарий деванагари)ô09490AC9
E8Обет знак пропуска (Halant)094D09CD0A4D0ACD0B4D0BCD0C4D0CCD0D4D
E9Диакритический знак (Nuktam)093C09BC0A3C0ABC0B3C0CBC
EAПолная остановка (Viram, северные скрипты)0964
EA *Знак ударения гласных AVAGRAH 093D09BD0ABD0B3D0C3D0CBD0D3D
EBНе используется
ECНе используется
EDНе используется
EEНе используется
EFКод атрибута
F0Код расширения
F1Цифра 0096609E60A660AE60B660BE60C660CE60D66
F2Цифра 1096709E70A670AE70B670BE70C670CE70D67
F3Цифра 2096809E80A680AE80B680BE80C680CE80D68
F4Цифра 3096909E90A690AE90B690BE90C690CE90D69
F5Цифра 4096A09EA0A6A0AEA0B6A0BEA0C6A0CEA0D6A
F6Цифра 5096B09EB0A6B0AEB0B6B0BEB0C6B0CEB0D6B
F7Цифра 6096C09EC0A6C0AEC0B6C0BEC0C6C0CEC0D6C
F8Цифра 7096D09ED0A6D0AED0B6D0BED0C6D0CED0D6D
F9Цифра 8096E09EE0A6E0AEE0B6E0BEE0C6E0CEE0D6E
FAЦифра 9096F09EF0A6F0AEF0B6F0BEF0C6F0CEF0D6F
FBНе используется
FCНе используется
FDНе используется
FEНе используется
FFНе используется

Внешние ссылки

Последняя правка сделана 2021-05-23 13:42:55
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте