A Шестибитный код символа - это кодировка символов, предназначенная для использования на компьютерах с длина слова кратна 6. Шесть битов могут кодировать только 64 различных символа, поэтому эти коды обычно включают только буквы верхнего регистра, цифры, некоторые знаки пунктуации и иногда управляющие символы. Такие коды с дополнительным битом четности были естественным способом хранения данных на 7-дорожке магнитной ленте.
Ранний шестибитовый двоичный код использовался для Брайля, системы чтения для слепых, разработанной в 1820-х годах.
Самые ранние компьютеры имели дело только с числовыми данными и не обеспечивали символьных данных. Шестибитный BCD использовался IBM на ранних компьютерах, таких как IBM 704 в 1954 году. Эта кодировка была заменена 8-битной EBCDIC код, когда System / 360 стандартизирован на 8-битные байты. Есть несколько вариантов этого типа кода (см. ниже).
Шестибитные коды символов обычно следовали за пятибитным кодом Бодо и предшествовали семибитному ASCII. Одним из популярных вариантов был DEC SIXBIT. Это просто коды символов ASCII от 32 до 95, закодированные как от 0 до 63, путем вычитания 32 (т. Е. Столбцов 2, 3, 4 и 5 таблицы ASCII (16 символов в столбце), сдвинутых в столбцы с 0 по 3, путем вычитания 2 из старших битов); он включает пробелы, знаки препинания, цифры и заглавные буквы, но не управляющие символы. Поскольку в нем не было управляющих символов, даже конца строки, он не использовался для общей обработки текста. Однако шестизначные имена, такие как имена файлов и assembler символов, могут быть сохранены в одном 36-битном слове PDP-10, и три символа помещаются в каждое слово PDP-1, и два символа помещаются в каждое слово PDP-8.
Шестибитные коды могут кодировать больше чем 64 символа, с помощью символов Shift Out и Shift In, по сути, включающих два различных набора из 62 символов и переключение между ними. Например, популярный коммуникационный терминал IBM 2741 поддерживал различные наборы символов, содержащие до 88 печатных символов плюс управляющие символы.
A Кодировка UTF-6 была предложена для Unicode, но была заменена Punycode.
шестибитным BCD был адаптацией кода перфокарты к двоичному коду. IBM применила термины двоично-десятичный код и двоично-десятичный код к вариациям двоично-десятичных букв, используемых в большинстве ранних компьютеров IBM, включая IBM 1620, IBM 1400 series, и не десятичная архитектура элементы IBM 700/7000 series.
Шестибитный код также использовался в базах данных COBOL, где информация о конце записи хранилась отдельно.
Шестибитный код с добавленным нечетным битом четности используется на Дорожка 1 карт с магнитной полосой, как указано в ISO / IEC 7811 -2.
Шестибитный код DEC, включающий несколько управляющих символов - вместе с SO / SI, разрешающий расширение кода - был указан как ECMA -1 в 1963 году (см. ниже). Другой, менее распространенный вариант получается путем простого удаления старшего бита кода ASCII в диапазоне 32-95 (коды 32-63 остаются на своих позициях, из более высоких значений вычитается 64). Такой вариант иногда использовался на DEC PDP-8 (1965).
FIELDATA был семибитовым кодом (с необязательной проверкой четности), из которого формально были определены только 64 позиции кода (занимающие шесть битов). Вариант использовался компьютерами UNIVAC серии 1100. Рассматривая код как шестибитный код, эти системы использовали 36-битное слово (способное хранить шесть таких сокращенных символов FIELDATA).
символы Брайля представлены с использованием шесть точек, расположенных в прямоугольнике. Каждая позиция может содержать или не содержать выпуклую точку, поэтому шрифт Брайля можно рассматривать как шестибитный двоичный код. Некоторые более современные системы Брайля добавляют две дополнительные точки, превращая эти системы в восьмибитный код.
Передача двоичных данных по системам, предназначенным только для текста, иногда может создавать проблемы. Например, электронная почта исторически поддерживала только 7-битные коды ASCII и удаляла 8-й бит, тем самым искажая двоичные данные, отправляемые напрямую через любой проблемный почтовый сервер. Другие системы могут вызывать проблемы из-за неправильной интерпретации управляющих символов во время хранения или передачи. Существует ряд схем для упаковки 8-битных данных в текстовые представления, которые могут проходить через системы текстовой почты для декодирования в месте назначения. Примеры подмножеств 6-битных символов, используемых для упаковки двоичных данных, включают Uuencode и Base64. Эти наборы не содержат управляющих символов (только печатаемые числа, буквы, некоторые знаки препинания и, возможно, пробелы) и позволяют передавать данные через любой носитель, который также может передавать читаемый человеком текст.
Показаны символы с их эквивалентами Unicode.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | 0. 0030 | #. 0023 | @. 0040 | ЛЕНТА. МАРК | |||
1_ | SP. 0020 | /. 002F | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | ЗАПИСЬ. MARK | ,. 002C | %. 0025 | |||
2_ | -. 002D | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F | P. 0050 | Q. 0051 | R. 0052 | -0. 002D 0030 | $. 0024 | *. 002A | |||
3_ | . 0026 | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | +0. 002B 0030 | .. 002E | ¤. 00A4 | ГРУППА. ЗНАК |
Буква Число Знаки препинания Символ Другое Не определено
.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | 0. 0030 | =. 003D | −. 2212 | ||||
1_ | SP. 0020 | /. 002F | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | ,. 002C | (. 0028 | ||||
2_ | —. 2014 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F | P. 0050 | Q. 0051 | R. 0052 | -0. 002D 0030 | $. 0024 | *. 002A | |||
3_ | +. 002B | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | +0. 002B 0030 | .. 002E | ). 0029 |
.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | :. 003A | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | 0. 0030 | =. 003D | ≠. 2260 | ≤. 2264 | !. 0021 | [. 005B |
1_ | SP. 0020 | /. 002F | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | ]. 005D | ,. 002C | (. 0028 | →. 2192 | ≡. 2261 | ~. 007E |
2_ | −. 2212 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F | P. 0050 | Q. 0051 | R. 0052 | %. 0025 | $. 0024 | *. 002A | ↑. 2191 | ↓. 2193 | >. 003E |
3_ | +. 002B | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | <. 003C | .. 002E | ). 0029 | ≥. 2265 | ?. 003F | ;. 003B |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | SP. 0020 | !. 0021 | ". 0022 | #. 0023 | $. 0024 | %. 0025 | . 0026 | '. 0027 | (. 0028 | ). 0029 | *. 002A | +. 002B | ,. 002C | -. 002D | .. 002E | /. 002F |
1_ | 0. 0030 | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | :. 003A | ;. 003B | <. 003C | =. 003D | >. 003E | ?. 003F |
2_ | @. 0040 | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F |
3_ | P. 0050 | Q. 0051 | R. 0052 | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | [. 005B | \. 005C | ]. 005D | ^. 005E | _. 005F |
Буква Число Пунктуация Символ Другое Не определено
.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | SP. 0020 | HT. 0009 | LF. 000A | VT. 000B | FF. 000C | CR. 000D | SO. 000E | SI. 000F | (. 0028 | ). 0029 | *. 002A | +. 002B | ,. 002C | -. 002D | .. 002E | /. 002F |
1_ | 0. 0030 | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | :. 003A | ;. 003B | <. 003C | =. 003D | >. 003E | ?. 003F |
2_ | NUL. 0000 | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F |
3_ | P. 0050 | Q. 0051 | R. 0052 | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | [. 005B | \. 005C | ]. 005D | ESC. 001B | DEL. 007F |
.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 0. 0030 | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | :. 003A | ;. 003B | <. 003C | =. 003D | >. 003E | ?. 003F |
1_ | SP. 0020 | !. 0021 | ". 0022 | #. 0023 | £. 00A3 | %. 0025 | . 0026 | '. 0027 | (. 0028 | ). 0029 | *. 002A | +. 002B | ,. 002C | -. 002D | .. 002E | /. 002F |
2_ | @. 0040 | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F |
3_ | P. 0050 | Q. 0051 | R. 0052 | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | [. 005B | $. 0024 | ]. 005D | ↑. 2191 | ←. 2190 |
.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | @. 0040 | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F |
1_ | P. 0050 | Q. 0051 | R. 0052 | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | [. 005B | \. 005C | ]. 005D | ^. 005E | _. 005F |
2_ | SP. 0020 | !. 0021 | ". 0022 | #. 0023 | $. 0024 | %. 0025 | . 0026 | '. 0027 | (. 0028 | ). 0029 | *. 002A | +. 002B | ,. 002C | -. 002D | .. 002E | /. 002F |
3_ | 0. 0030 | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | :. 003A | ;. 003B | <. 003C | =. 003D | >. 003E | ?. 003F |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 0. 0030 | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | +. 002B | -. 002D | /. 002F | ,. 002C | .. 002E | SP. 0020 |
1_ | ⏨. 23E8 | ↑. 2191 | (. 0028 | ). 0029 | ×. 00D7 | =. 003D | ;. 003B | [. 005B | ]. 005D | *. 002A | ‘. 2018 | ’. 2019 | ≠. 2260 | <. 003C | >. 003E | :. 003A |
2_ | А. 0410 | Б. 0411 | В. 0412 | Г. 0413 | Д. 0414 | Е. 0415 | Ж. 0416 | З. 0417 | И. 0418 | Й. 0419 | К. 041A | Л. 041B | М. 041C | Н. 041D | О. 041E | П. 041F |
3_ | Р. 0420 | С. 0421 | Т. 0422 | У. 0423 | Ф. 0424 | Х. 0425 | Ц. 0426 | Ч. 0427 | Ш. 0428 | Щ. 0429 | Ы. 042B | Ь. 042C | Э. 042D | Ю. 042E | Я. 042F | DEL. 007F |
Буква Число Знаки пунктуации Символ Другое Не определено
В следующей таблице показано расположение количество символов, с шестнадцатеричным значением, соответствующим символом ASCII, 6-битными кодами Брайля (комбинации точек), глифом Брайля Unicode и общим значением (фактическое значение может меняться в зависимости от контекста).
|
|