Язык (и) | Украинский, Русский, Болгарский |
---|---|
Классификация | 8-битный KOI, расширенный ASCII |
Расширяет | KOI8-B |
На основе | KOI8- R |
Другая связанная кодировка (и) | KOI8-RU, KOI8-F |
|
KOI8-U (RFC 2319 ) является 8-битным кодировка символов, предназначенная для украинского, в которой используется кириллица алфавит. Он основан на KOI8-R, который охватывает русский и болгарский, но заменяет восемь символов рисования прямоугольника четырьмя украинскими буквами Ґ, Є, І и Ї в верхнем и нижнем регистрах.
KOI8-RU тесно связан, но добавляет Ў для белорусского. В обоих случаях расположение букв соответствует таковому в KOI8-E, за исключением Ґ, которое добавляется к KOI8-F.
В Microsoft Windows, KOI8-U назначается номер кодовой страницы 21866. В IBM, KOI8-U назначается кодовая страница / CCSID 1168.
KOI8 используется гораздо чаще, чем ISO 8859 -5, который так и не прижился. Другой распространенной кодировкой кириллических символов является Windows-1251. В будущем оба могут в конечном итоге уступить место Unicode.
KOI8 означает Код обмена информацией, 8 бит (русский : Код Обмена Информацией, 8 бит), что означает «Код обмена информацией, 8 бит ».
Наборы символов KOI8 обладают тем свойством, что буквы русской кириллицы располагаются в псевдолатническом порядке, а не в естественном кириллическом алфавитном порядке, как в ISO 8859-5. Хотя это может показаться неестественным, у него есть то полезное свойство, что если восьмой бит удален, текст все еще можно прочитать (или, по крайней мере, расшифровать) при транслитерации с обратным регистром на обычном ASCII-терминале. Например, «Русский текст» в KOI8-U становится РУССКИЙ ТЕКСТ («Русский текст»), если 8-й бит удален.
В следующей таблице показан KOI8 -U кодировка. Каждый символ отображается с его эквивалентной кодовой точкой Unicode.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_. 0 | ||||||||||||||||
1_. 16 | ||||||||||||||||
2_. 32 | SP. 0020 | !. 0021 | ". 0022 | #. 0023 | $. 0024 | %. 0025 | . 0026 | '. 0027 | (. 0028 | ). 0029 | *. 002A | +. 002B | ,. 002C | -. 002D | .. 002E | /. 002F |
3_. 48 | 0. 0030 | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | :. 003A | ;. 003B | <. 003C | =. 003D | >. 003E | ?. 003F |
4_. 64 | @. 0040 | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F |
5_. 80 | P. 0050 | Q. 0051 | R. 0052 | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | [. 005B | \. 005C | ]. 005D | ^. 005E | _. 005F |
6_. 96 | `. 0060 | a. 0061 | b. 0062 | c. 0063 | d. 0064 | e. 0065 | f. 0066 | g. 0067 | h. 0068 | i. 0069 | j. 006A | k. 006B | l. 006C | m. 006D | n. 006E | o. 006F |
7_. 112 | p. 0070 | q. 0071 | r. 0072 | s. 0073 | t. 0074 | u. 007 5 | v. 0076 | w. 0077 | x. 0078 | y. 0079 | z. 007A | {. 007B | |. 007C | }. 007D | ~. 007E | |
8_. 128 | ─. 2500 | │. 2502 | ┌. 250C | ┐. 2510 | └. 2514 | ┘. 2518 | ├. 251C | ┤. 2524 | ┬. 252C | ┴. 2534 | ┼. 253C | ▀. 2580 | ▄. 2584 | █. 2588 | ▌. 258C | ▐. 2590 |
9_. 144 | ░. 2591 | ▒. 2592 | ▓. 2593 | ⌠. 2320 | ■. 25A0 | ∙. 2219 | √. 221A | ≈. 2248 | ≤. 2264 | ≥. 2265 | NBSP. 00A0 | ⌡. 2321 | °. 00B0 | ². 00B2 | ·. 00B7 | ÷. 00F7 |
A_. 160 | ═. 2550 | ║. 2551 | ╒. 2552 | ё. 0451 | є. 0454 | ╔. 2554 | і. 0456 | ї. 0457 | ╗. 2557 | ╘. 2558 | ╙. 2559 | ╚. 255A | ╛. 255B | ґ. 0491 | ╝. 255D | ╞. 255E |
B_. 176 | ╟. 255F | ╠. 2560 | ╡. 2561 | Ё. 0401 | Є. 0404 | ╣. 2563 | І. 0406 | Ї. 0407 | ╦. 2566 | ╧. 2567 | ╨. 2568 | ╩. 2569 | ╪. 256A | Ґ. 0490 | ╬. 256C | ©. 00A9 |
C_. 192 | ю. 044E | а. 0430 | б. 0431 | ц. 0446 | д. 0434 | е. 0435 | ф. 0444 | г. 0433 | х. 0445 | и. 0438 | й. 0439 | к. 043A | л. 043B | м. 043C | н. 043D | о. 043E |
D_. 208 | п. 043F | я. 044F | р. 0440 | с. 0441 | т. 0442 | у. 0443 | ж. 0436 | в. 0432 | ь. 044C | ы. 044B | з. 0437 | ш. 0448 | э. 044D | щ. 0449 | ч. 0447 | ъ. 044A |
E_. 224 | Ю. 042E | А. 0410 | Б. 0411 | Ц. 0426 | Д. 0414 | Е. 0415 | Ф. 0424 | Г. 0413 | Х. 0425 | И. 0418 | Й. 0419 | К. 041A | Л. 041B | М. 041C | Н. 041D | О. 041E |
F_. 240 | П. 041F | Я. 042F | Р. 0420 | С. 0421 | Т. 0422 | У. 0423 | Ж. 0416 | В. 0412 | Ь. 042C | Ы. 042B | З. 0417 | Ш. 0428 | Э. 042D | Щ. 0429 | Ч. 0427 | Ъ. 042A |
Буква Число Знаки пунктуации Символ Другое Не определено Отличия от KOI8-R (нерусские буквы)
. Хотя RFC 2319 говорит, что символ 0x95 должен быть U + 2219 (∙), он также может быть U + 2022 (•), чтобы соответствовать символу маркера в Windows-1251.
Некоторые ссылки содержат опечатку и неправильно указывают этот символ 0xB4 - это U + 0403, а не правильный U + 0404. Эта опечатка присутствует в Приложении A к RFC 2319 (но таблица в основном тексте RFC дает правильное отображение).