Windows-1256 - это кодовая страница, используемая для записи арабского (и, возможно, некоторых других языков, использующих арабское письмо, например персидский и урду) в Microsoft Windows. Эта кодовая страница несовместима с кодировками ISO 8859-6 и MacArabic.
Он кодирует каждую абстрактную букву базового арабского алфавита, а не каждую конкретную визуальную форму изолированных, начальных, средних, конечных или лигатурированных вариантов формы букв (т.е. кодирует символы, а не глифы). Арабские буквы в диапазоне C0-FF расположены в арабском алфавитном порядке, но некоторые латинские символы вкраплены между ними. Это некоторые латинские символы Windows-1252, используемые для французского, поскольку этот европейский язык имеет некоторое историческое значение для бывших французских колоний в Северной Африке, таких как Марокко и Алжир. Это позволяло смешивать французский и арабский текст при использовании Windows 1256 без необходимости переключения кодовых страниц (однако прописные буквы с диакритическими знаками не включались).
IBM использует кодовую страницу 1256 (CCSID 1256, знак евро расширенный CCSID 5352 и дополнительно расширенный CCSID 9448) для Windows-1256.
Unicode предпочтительнее Windows 1256 в современных приложениях, особенно в Интернете; означает доминирующую кодировку UTF-8 для веб-страниц (см. также арабский шрифт в Unicode, для полного охвата, в отличие, например, от Windows 1256 или ISO-8859-6 которые не покрывают массовки). В сентябре 2019 года менее 0,1% всех веб-страниц использовали Windows-1256.
Поскольку исходная кодовая страница оставила 9 значений (байтов), помеченных как «НЕ ИСПОЛЬЗУЕМЫЕ» в исходной спецификации, эти байты позже использовались для дополнительных символов, необходимых для персидско-арабского алфавита. (для языков персидский и урду ) плюс знак евро.
В следующей таблице показана расширенная версия Windows-1256. Каждый символ отображается с его эквивалентом Unicode и его десятичным кодом.
Здесь каждая арабская буква показана изолированно. Фактические формы букв внутри арабских слов отображаются с помощью комбинации правил программного обеспечения и соответствующей поддержки шрифтов.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_. 0 | NUL. 0000 | SOH. 0001 | STX. 0002 | ETX. 0003 | EOT. 0004 | ENQ. 0005 | ACK. 0006 | BEL. 0007 | BS. 0008 | HT. 0009 | LF. 000A | VT. 000B | FF. 000C | CR. 000D | SO. 000E | SI. 000F |
1_. 16 | DLE. 0010 | DC1. 0011 | DC2. 0012 | DC3. 0013 | DC4. 0014 | NAK. 0015 | SYN. 0016 | ETB. 0017 | CAN. 0018 | EM. 0019 | SUB. 001A | ESC. 001B | FS. 001C | GS. 001D | RS. 001E | US. 001F |
2_. 32 | SP. 0020 | !. 0021 | ". 0022 | #. 0023 | $. 0024 | %. 0025 | . 0026 | '. 0027 | (. 0028 | ). 0029 | *. 002A | +. 002B | ,. 002C | -. 002D | .. 002E | /. 002F |
3_. 48 | 0. 0030 | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | :. 003A | ;. 003B | <. 003C | =. 003D | >. 003E | ?. 003F |
4_. 64 | @. 0040 | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F |
5_. 80 | P. 0050 | Q. 0051 | R. 0052 | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | [. 005B | \. 005C | ]. 005D | ^. 005E | _. 005F |
6_. 96 | `. 0060 | a. 0061 | b. 0062 | c. 0063 | d. 0064 | e. 0065 | f. 0066 | g. 0067 | h. 0068 | i. 0069 | j. 006A | k. 006B | l. 006C | m. 006D | n. 006E | o. 006F |
7_. 112 | p. 0070 | q. 0071 | r. 0072 | s. 0073 | t. 0074 | u. 0075 | v. 0076 | w. 0077 | x. 0078 | y. 0079 | z. 007A | {. 007B | |. 007C | }. 007D | ~. 007E | DEL. 007F |
8_. 128 | €. 20AC | پ. 067E | ‚. 201A | ƒ. 0192 | „. 201E | …. 2026 | †. 2020 | ‡. 2021 | ˆ. 02C6 | ‰. 2030 | ٹ. 0679 | ‹. 2039 | Œ. 0152 | چ. 0686 | ژ. 0698 | ڈ. 0688 |
9_. 144 | گ. 06AF | ‘. 2018 | ’. 2019 | “. 201C | ”. 201D | •. 2022 | –. 2013 | —. 2014 | ک. 06A9 | ™. 2122 | ڑ. 0691 | ›. 203A | œ. 0153 | ZWNJ. 200C | ZWJ. 200D | ں. 06BA |
A_. 160 | NBSP. 00A0 | ،. 060C | ¢. 00A2 | £. 00A3 | ¤. 00A4 | ¥. 00A5 | ¦. 00A6 | §. 00 A7 | ¨. 00A8 | ©. 00A9 | ھ. 06BE | «. 00AB | ¬. 00AC | SHY. 00AD | ®. 00AE | ¯. 00AF |
B_. 176 | °. 00B0 | ±. 00B1 | ². 00B2 | ³. 00B3 | ´. 00B4 | µ. 00B5 | ¶. 00B6 | ·. 00B7 | ¸. 00B8 | ¹. 00B9 | ؛. 061B | ». 00BB | ¼. 00BC | ½. 00BD | ¾. 00BE | ؟. 061F |
C_. 192 | ہ. 06C1 | ء. 0621 | آ. 0622 | أ. 0623 | ؤ. 0624 | إ. 0625 | ئ. 0626 | ا. 0627 | ب. 0628 | ة. 0629 | ت. 062A | ث. 062B | ج. 062C | ح. 062D | خ. 062E | د. 062F |
D_. 208 | ذ. 0630 | ر. 0631 | ز. 0632 | س. 0633 | ش. 0634 | ص. 0635 | ض. 0636 | ×. 00D7 | ط. 0637 | ظ. 0638 | ع. 0639 | غ. 063A | ـ. 0640 | ف. 0641 | ق. 0642 | ك. 0643 |
E_. 224 | à. 00E0 | ل. 0644 | â. 00E2 | م. 0645 | ن. 0646 | ه. 0647 | و. 0648 | ç. 00E7 | è. 00E8 | é. 00E9 | ê. 00EA | ë. 00EB | ى. 0649 | ي. 064A | î. 00EE | ï. 00EF |
F_. 240 | ً. 064B | ٌ. 064C | ٍ. 064D | َ. 064E | ô. 00F4 | ُ. 064F | ِ. 0650 | ÷. 00F7 | ّ. 0651 | ù. 00F9 | ْ. 0652 | û. 00FB | ü. 00FC | LRM. 200E | RLM. 200F | ے. 06D2 |
Буква Число Знаки пунктуации Символ Другое Не определено