Язык (и) | Белорусский, Украинский, Русский, Болгарский |
---|---|
Классификация | 8-битный KOI, расширенный ASCII |
Расширяет | KOI8-B |
На основе | KOI8-U, KOI8-R |
Другая связанная кодировка (и) | KOI8-E, KOI8-F |
|
KOI8-RU - это 8-битная кодировка символов, предназначенная для русского, украинского и белорусского, в которых используется Кириллица алфавит. Он тесно связан с KOI8-R, который охватывает русский и болгарский, но заменяет десять символов рисунка в рамке на пять украинских и белорусских букв Ґ, Є, І, Ї, и Ў как в верхнем, так и в нижнем регистре. Он даже более тесно связан с KOI8-U, который не включает Ў, но в остальном делает такие же замены. Дополнительные присвоения букв соответствуют KOI8-E, за исключением Ґ, которое добавляется к KOI8-F.
В IBM, KOI8-RU назначается кодовая страница / CCSID 1167.
KOI8 по-прежнему используется гораздо чаще, чем ISO 8859-5, который так и не получил широкого распространения. Другая распространенная кодировка символов кириллицы - Windows-1251. В будущем оба могут со временем уступить место Unicode.
KOI8 - это код обмена информацией, 8 бит (русский : Код Обмена Информацией, 8 бит), что означает «Код обмена информацией, 8 бит ».
Наборы символов KOI8 обладают тем свойством, что буквы русской кириллицы располагаются в псевдолатническом порядке, а не в естественном кириллическом алфавитном порядке, как в ISO 8859-5. Хотя это может показаться неестественным, у него есть то полезное свойство, что если восьмой бит удален, текст все еще можно прочитать (или, по крайней мере, расшифровать) при транслитерации с обратным регистром на обычном ASCII-терминале. Например, «Русский текст» в KOI8-RU превращается в РУССКИЙ ТЕКСТ («Русский текст»), если 8-й бит удален.
В следующей таблице показана кодировка KOI8-RU. Каждый символ отображается с его эквивалентной кодовой точкой Unicode.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_. 0 | ||||||||||||||||
1_. 16 | ||||||||||||||||
2_. 32 | SP. 0020 | !. 0021 | ". 0022 | #. 0023 | $. 0024 | %. 0025 | . 0026 | '. 0027 | (. 0028 | ). 0029 | *. 002A | +. 002B | ,. 002C | -. 002D | .. 002E | /. 002F |
3_. 48 | 0. 0030 | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | :. 003A | ;. 003B | <. 003C | =. 003D | >. 003E | ?. 003F |
4_. 64 | @. 0040 | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F |
5_. 80 | P. 0050 | Q. 0051 | R. 0052 | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | [. 005B | \. 005C | ]. 005D | ^. 005E | _. 005F |
6_. 96 | `. 0060 | a. 0061 | b. 0062 | c. 0063 | d. 0064 | e. 0065 | f. 0066 | g. 0067 | h. 0068 | i. 0069 | j. 006A | k. 006B | l. 006C | m. 006D | n. 006E | o. 006F |
7_. 112 | p. 0070 | q. 0071 | r. 0072 | s. 0073 | t. 0074 | u. 007 5 | v. 0076 | w. 0077 | x. 0078 | y. 0079 | z. 007A | {. 007B | |. 007C | }. 007D | ~. 007E | |
8_. 128 | ─. 2500 | │. 2502 | ┌. 250C | ┐. 2510 | └. 2514 | ┘. 2518 | ├. 251C | ┤. 2524 | ┬. 252C | ┴. 2534 | ┼. 253C | ▀. 2580 | ▄. 2584 | █. 2588 | ▌. 258C | ▐. 2590 |
9_. 144 | ░. 2591 | ▒. 2592 | ▓. 2593 | “. 201C | ■. 25A0 | ∙. 2219 | ”. 201D | —. 2014 | №. 2116 | ™. 2122 | NBSP. 00A0 | ». 00BB | ®. 00AE | «. 00AB | ·. 00B7 | ¤. 00A4 |
A_. 160 | ═. 2550 | ║. 2551 | ╒. 2552 | ё. 0451 | є. 0454 | ╔. 2554 | і. 0456 | ї. 0457 | ╗. 2557 | ╘. 2558 | ╙. 2559 | ╚. 255A | ╛. 255B | ґ. 0491 | ў. 045E | ╞. 255E |
B_. 176 | ╟. 255F | ╠. 2560 | ╡. 2561 | Ё. 0401 | Є. 0404 | ╣. 2563 | І. 0406 | Ї. 0407 | ╦. 2566 | ╧. 2567 | ╨. 2568 | ╩. 2569 | ╪. 256A | Ґ. 0490 | Ў. 040E | ©. 00A9 |
C_. 192 | ю. 044E | а. 0430 | б. 0431 | ц. 0446 | д. 0434 | е. 0435 | ф. 0444 | г. 0433 | х. 0445 | и. 0438 | й. 0439 | к. 043A | л. 043B | м. 043C | н. 043D | о. 043E |
D_. 208 | п. 043F | я. 044F | р. 0440 | с. 0441 | т. 0442 | у. 0443 | ж. 0436 | в. 0432 | ь. 044C | ы. 044B | з. 0437 | ш. 0448 | э. 044D | щ. 0449 | ч. 0447 | ъ. 044A |
E_. 224 | Ю. 042E | А. 0410 | Б. 0411 | Ц. 0426 | Д. 0414 | Е. 0415 | Ф. 0424 | Г. 0413 | Х. 0425 | И. 0418 | Й. 0419 | К. 041A | Л. 041B | М. 041C | Н. 041D | О. 041E |
F_. 240 | П. 041F | Я. 042F | Р. 0420 | С. 0421 | Т. 0422 | У. 0423 | Ж. 0416 | В. 0412 | Ь. 042C | Ы. 042B | З. 0417 | Ш. 0428 | Э. 042D | Щ. 0429 | Ч. 0427 | Ъ. 042A |
Буква Число Знаки пунктуации Символ Другое Не определено Отличия от KOI8-R
. Хотя в RFC 2319 указано, что символ 0x95 должен быть U +2219 (∙), это также может быть U + 2022 (•), чтобы соответствовать символу маркера в Windows-1251.
В некоторых ссылках есть опечатка и неправильно указано, что символ 0xB4 - это U + 0403, а не правильный U + 0404. Эта опечатка присутствует в Приложении A к RFC 2319 (но таблица в основном тексте RFC дает правильное отображение).