Список двоичных кодов
редактировать
Это список некоторых двоичных кодов, которые используются (или использовались) для представления текста как последовательности двоичных цифр " 0 "и" 1 ". Двоичные коды фиксированной ширины используют заданное количество битов для представления каждого символа в тексте, тогда как в двоичных кодах переменной ширины количество битов может варьироваться от символа к символу.
Содержание
- 1 Пятиразрядные двоичные коды
- 2 Шестибитные двоичные коды
- 3 Семибитовые двоичные коды
- 4 Восьмибитовые двоичные коды
- 5 10-разрядные двоичные коды
- 6 16-битных двоичных кодов
- 7 32-битных двоичных кодов
- 8 двоичных кодов переменной длины
- 9 Прочие
- 10 См. Также
- 11 Ссылки
Пятибитовые двоичные коды
Ряд различных пятибитовых кодов использовался для ранних систем перфоленты.
Пять битов на символ позволяют использовать только 32 разных символа, поэтому многие из пятибитовых кодов использовали два набора символов на значение, называемые FIGS (цифры) и LTRS (буквы), и зарезервировали два символа для переключаться между этими наборами. Это фактически позволило использовать 60 символов.
Стандартные пятибитные стандартные коды:
- Международный телеграфный алфавит № 1 (ITA1) - также обычно упоминается как код Бодо
- Международный телеграфный алфавит № 2 (ITA2) - также часто упоминается как код Мюррея
- (USTTY) - вариант ITA2, используемый в США
- DIN 66006 - разработан для представления АЛГОЛ / Программы ALCOR на бумажной ленте и перфокартах
Каждая из следующих ранних компьютерных систем использовала свой собственный пятибитный код:
Стеганографический код, широко известный как шифр Бэкона. использует группы из 5 элементов с двоичными значениями для представления букв алфавита.
Шестибитные двоичные коды
Шесть битов на символ позволяют представить 64 различных символа.
Примеры шестибитных двоичных кодов:
- ()
- Шестибитный двоично-десятичный код (двоично-десятичный код), использовавшийся в ранних мэйнфреймах компьютерах.
- Шестибитный ASCII подмножество примитива семибитный ASCII
- Брайль - символы Брайля представлены с использованием шести точек, расположенных в прямоугольнике. Каждая позиция может содержать или не содержать выпуклую точку, поэтому шрифт Брайля можно рассматривать как шестибитный двоичный код.
См. Также: Шестибитные коды символов
Семибитовые двоичные коды
Примеры семибитных двоичных кодов:
- Международный телеграфный алфавит № 3 (ITA3 ) - полученный из кода ARQ Мура, также известный как RCA
- ASCII - Вездесущий код ASCII изначально был определен как семибитный набор символов. В статье ASCII представлен подробный набор эквивалентных стандартов и вариантов. Кроме того, существуют различные расширения ASCII до восьми бит (см. восьмибитные двоичные коды)
- CCIR 476 - расширяет ITA2 с 5 до 7 бит, используя дополнительные 2 бита в качестве контрольных цифр
- ()
Восьмиразрядные двоичные коды
- Расширенный ASCII - ряд стандартов расширяет ASCII до восьми битов путем добавления дополнительных 128 символов, например:
- EBCDIC - Используется в ранних компьютерах IBM и нынешних компьютерах System i и System z
10 -битовые двоичные коды
- AUTOSPEC - также известный как код Бауэра. AUTOSPEC повторяет пятибитовый символ дважды, но если символ имеет нечетную четность, повторение инвертируется.
16-разрядные двоичные коды
- UCS- 2 - устаревшая кодировка, способная представлять базовую многоязычную плоскость Unicode
32-битных двоичных кодов
- UTF-32 / UCS-4 - четырехбайтовый посимвольное представление Unicode
двоичных кодов переменной длины
- UTF-8 - кодирует символы таким образом, чтобы в основном совместим с ASCII, но также может кодировать полный набор символов Unicode с последовательностями до четырех 8-битных байтов.
- UTF-16 - Расширяет UCS-2 для охвата всего Unicode с последовательностями из одного или двух 16-битных элементов
- GB 18030 - код переменной длины, полный Unicode, разработанный для совместимости со старыми китайскими многобайтовыми кодировками
- Huffman coding - метод для выражения большего общие символы, использующие более короткие битовые строки, чем те, которые используются для менее распространенных символов.
Сжатие данных. Системы, такие как Лемпель – Зив – Велч, могут сжимать произвольные двоичные данные. Поэтому они не являются двоичными кодами сами по себе, но могут применяться к двоичным кодам для уменьшения потребности в хранении.
Другое
- Код Морзе - это телеграфный код переменной длины, который традиционно использует серию длинных и коротких импульсы для кодирования символов. Он полагается на промежутки между импульсами, чтобы обеспечить разделение между буквами и словами, поскольку буквенные коды не имеют «свойство префикса». Код Морзе можно представить в виде двоичного потока, позволяя каждому биту представлять одну единицу времени. Таким образом, «точка» или «точка» представлены как один бит 1, а «dah» или «тире» представлены как три последовательных 1 бита. Пробелы между символами, буквами и словами представлены в виде одного, трех или семи последовательных 0 битов. Например, «ВВЕРХ» в коде Морзе - это «..-.--.», Которое может быть представлено в двоичном виде как «101011100010111011101».
См. Также
Ссылки