8-битная очистка - 8-bit clean

редактировать
Компьютерная система, которая правильно обрабатывает 8-битные кодировки символов.

8-битная очистка описывает компьютерная система, которая правильно обрабатывает 8-битные кодировки символов, такие как серия ISO 8859 и UTF-8 кодирование Unicode.

Содержание
  • 1 История
  • 2 SMTP и NNTP 8-битная чистота
  • 3 См. также
  • 4 Ссылки
История

До в начале 1990-х многие программы и каналы передачи данных предполагали, что все символы будут представлены в виде чисел от 0 до 127 (7 бит); например, стандарт ASCII использовал только 7 бит на символ, избегая 8-битного представления , чтобы сэкономить на стоимости передачи данных. На компьютерах и каналах передачи данных с использованием 8 -bit bytes это оставило верхний бит каждого байта свободным для использования в качестве четности, флагового бита или мета бит управления данными. 7-битные системы и каналы передачи данных не могут обрабатывать более сложные коды символов, которые являются обычным явлением в странах, не говорящих на английском с более крупными алфавитами.

Двоичные файлы не могут быть переданы через 7 -битные каналы данных напрямую. Чтобы обойти это, были разработаны двоичные кодировки, в которых используются только 7-битные символы ASCII. Некоторые из этих кодировок: uuencoding, Ascii85, SREC, BinHex, kermit и MIME Base64. Системы на основе EBCDIC не могут обрабатывать все символы, используемые в данных UUencoded. Однако кодировка base64 не имеет этой проблемы.

8-битная чистота SMTP и NNTP

Исторически для передачи сообщений использовались различные носители, некоторые из них поддерживали только 7-битные данные, поэтому 8-битные сообщения имели высокие шансы быть искажено во время передачи в 20 веке. Но некоторые реализации действительно не заботились о формальном запрете 8-битных данных и позволяли байтам с старшим битом проходить. Такие реализации называются 8-битными чистыми. В общем, протокол связи считается 8-битным чистым, если он правильно передает старший бит каждого байта в процессе связи.

Многие ранние стандарты протокола связи, такие как RFC 780, 788, 821 (для SMTP ), RFC 977 (для NNTP ), RFC 1056, 2821 и 5321 были разработаны для работы по таким «7-битным» каналам связи. В них конкретно упоминается использование набора символов ASCII, «передаваемого как 8-битный байт с нулевым старшим битом», и некоторые из них явно ограничивают все данные 7-битными символами.

В течение первых нескольких десятилетий существования сетей электронной почты (с 1971 до начала 1990-х годов) большинство сообщений электронной почты представляло собой обычный текст в 7-битном наборе символов US-ASCII.

Согласно RFC 1428, исходное RFC 821 определение SMTP ограничивает Интернет-почту строками (1000 символов или меньше) из 7-битных символов US-ASCII.

Позже формат сообщений электронной почты был переопределен для поддержки сообщений, которые не являются полностью текстом US-ASCII (текстовые сообщения в наборах символов, отличных от US-ASCII и нетекстовые сообщения, такие как аудио и изображения).

Интернет-сообщество обычно добавляет функции путем «расширения», позволяя осуществлять обмен данными в обоих направлениях между модернизированными машинами и еще не модернизированными машинами, вместо того, чтобы объявлять устаревшее программное обеспечение, которое ранее соответствовало стандартам, «сломанным» и настаивать на том, чтобы все программное обеспечение во всем мире было обновлено до последнего стандарта. В середине 1990-х люди возражали против «просто отправки 8 бит (на RFC 821 серверы SMTP)», возможно, из-за восприятия, что «просто отправляют 8 бит» является неявным заявлением о том, что ISO 8859-1 становится новой «стандартной кодировкой», заставляя всех в мире использовать один и тот же набор символов . Вместо этого рекомендуется использовать 8-битные чистые связи между машинами с помощью расширения ESMTP (RFC 1869 ) 8BITMIME. Несмотря на это, некоторые агенты передачи почты, в частности Exim и qmail, ретранслируют почту на серверы, которые не объявляют 8BITMIME, без выполнения преобразования в 7-битный MIME ( обычно цитируемый-печатный, "преобразование QP") требуется RFC 6152. Такое отношение "просто-отправь-8" на самом деле не вызывает проблем на практике, поскольку практически все современные почтовые серверы являются 8-битными чистыми.

См. Также
Ссылки
Последняя правка сделана 2021-07-19 05:37:08
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте