MIME / IANA | ISO-8859-6 |
---|---|
Alias(es) | iso-ir-127, ECMA-114, ASMO-708, арабский, csISOLatinArabic |
Стандарт | ASMO 708, ECMA-114, ISO / IEC 8859-6 |
Классификация | расширенный ASCII, ISO 8859 |
Расширения | OEM-708, Mac OS арабский (почти) |
Предшествует | ASMO 449 |
Другая связанная кодировка (и) | Windows-1256 (несовместима, перемещает несколько букв) |
|
ISO / IEC 8859-6: 1999, Информационные технологии - 8-битные однобайтовые графические наборы символов - Часть 6: Латинский / арабский алфавит, является частью серии ISO / IEC 8859 стандартных кодировок символов на основе ASCII, первое издание опубликовано в 1987 году. Неофициально он называется Latin / Arabic . Он был разработан для арабского. Кодируются только номинальные буквы, предварительная форма букв отсутствует, поэтому для отображения требуется обработка формования. Он не включает дополнительные буквы, необходимые для написания большинства языков с арабской графикой, кроме самого арабского (таких как персидский, урду и т. Д.).
ISO-8859-6 - это IANA предпочтительное имя набора символов для этого стандарта, если оно дополнено управляющими кодами C0 и C1 из ISO / IEC 6429. Текст находится в логическом порядке, поэтому для отображения требуется обработка BiDi. Номинально ISO-8859-6 (кодовая страница 28596 ) предназначен для «визуального порядка», а ISO-8859-6-I (кодовая страница 38596 ) для логического порядка. Но на практике и требуется для документов HTML и XML, ISO-8859-6 также обозначает текст логического порядка. Существует также ISO-8859-6-E, который предположительно требует, чтобы направленность была явно указана с помощью специальных управляющих символов; последний вариант практически не используется. IBM присвоила кодовую страницу / CCSID 1089 ISO 8859-6. Это эмуляция их операционной системы AIX.
Unicode предпочтительнее ISO-8859-6 в современных приложениях, особенно в Интернете; означает доминирующую кодировку UTF-8 для веб-страниц (см. также арабский шрифт в Unicode, для полного охвата, в отличие, например, от ISO-8859-6 или Windows 1256 которые не покрывают массовки). 0,1% всех веб-страниц используют ISO-8859-6.
ASMO 708 был разработан ныне несуществующей Арабской организацией по стандартизации и метрологии в 1986 году как 8-битный стандарт для использования в арабоязычных странах. Дизайн этого набора символов был вдохновлен предыдущим 7-битным стандартом - ASMO 449 - но это не просто 7-битный набор символов, перемещенный в верхнюю часть; есть некоторые отличия.
ASMO 708 - это двунаправленный набор символов. Нижняя часть набора символов отличается от стандарта ISO 646 цифрами и некоторыми пунктуацией. В зависимости от контекста (находятся ли числа в латинском или арабском алфавите) цифры отображаются либо как латинские, либо как арабские цифры. Кроме того, в зависимости от контекста симметричные знаки препинания меняются местами, то есть всякий раз, когда есть открывающий знак пунктуации, форма отображается по-разному в соответствии с направлением сценария.
В верхней части набора символов есть только арабские буквы, арабская пунктуация, отличная от латинской, а также несколько других символов.
ASMO 708 был разработан в тесном сотрудничестве с ECMA, которая приняла его в качестве собственного стандарта ECMA-114 в 1986 году. Он также был утвержден как Стандарт ISO как ISO 8859-6 . Он также был зарегистрирован в качестве IR 127 в 1986 году.
Некоторые другие наборы символов связаны с ASMO 708:
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_. 0 | ||||||||||||||||
1_. 16 | ||||||||||||||||
2_. 32 | SP. 0020 | !. 0021 | ". 0022 | #. 0023 | $. 0024 | % /٪. 0025 | . 0026 | '. 0027 | (. 0028 | ). 0029 | * /٭. 002A | +. 002B | ,. 002C | -. 002D | .. 002E | /. 002F |
3_. 48 | 0 / ٠. 0030 | 1/١. 0031 | 2/٢. 0032 | 3/٣. 0033 | 4/٤. 0034 | 5 / ٥. 0035 | 6/٦. 0036 | 7/٧. 0037 | 8/٨. 0038 | 9/٩. 0039 | :. 003A | ;. 003B | <. 003C | =. 003D | >. 003E | ?. 003F |
4_. 64 | @. 0040 | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F |
5_. 80 | P. 0050 | Q. 0051 | R. 0052 | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | [. 005B | \. 005C | ]. 005D | ^. 005E | _. 005F |
6_. 96 | `. 0060 | a. 0061 | b. 0062 | c. 0063 | d. 0064 | e. 0065 | f. 0066 | g. 0 067 | h. 0068 | i. 0069 | j. 006A | k. 006B | l. 006C | m. 006D | n. 006E | o. 006F |
7_. 112 | p. 0070 | q. 0071 | r. 0072 | s. 0073 | t. 0074 | u. 0075 | v. 0076 | w. 0077 | x. 0078 | y. 0079 | z. 007A | {. 007B | |. 007C | }. 007D | ~. 007E | |
8_. 128 | ||||||||||||||||
9_. 144 | ||||||||||||||||
A_. 160 | NBSP. 00A0 | ¤. 00A4 | ،. 060C | SHY. 00AD | ||||||||||||
B_. 176 | ؛. 061B | ؟. 061F | ||||||||||||||
C_. 192 | ء. 0621 | آ. 0622 | أ. 0623 | ؤ. 0624 | إ. 0625 | ئ. 0626 | ا. 0627 | ب. 0628 | ة. 0629 | ت. 062A | ث. 062B | ج. 062C | ح. 062D | خ. 062E | د. 062F | |
D_. 208 | ذ. 0630 | ر. 0631 | ز. 0632 | س. 0633 | ش. 0634 | ص. 0635 | ض. 0636 | ط. 0637 | ظ. 0638 | ع. 0639 | غ. 063A | |||||
E_. 224 | ـ. 0640 | ف. 0641 | ق. 0642 | ك. 0643 | ل. 0644 | م. 0645 | ن. 0646 | ه. 0647 | و. 0648 | ى. 0649 | ي. 064A | ◌ً. 064B | ◌ٌ. 064C | ◌ٍ. 064D | ◌َ. 064E | ◌ُ. 064F |
F_. 240 | ◌ِ. 0650 | ◌ّ. 0651 | ◌ْ. 0652 |
Буква Число Знаки пунктуации Символ Другое Не определено
Кодовые значения 0xEB – 0xF2 присваиваются комбинированным символам.