Анализ контента

редактировать

Анализ контента, также известный как сниффинг типа носителя или MIME сниффинг, - это практика проверки содержимого потока байтов для попытки вывести формат файла данных в нем. Анализ содержимого обычно используется для компенсации отсутствия точных метаданных, которые в противном случае потребовались бы для правильной интерпретации файла. Методы сниффинга контента, как правило, используют сочетание методов, которые полагаются на избыточность, обнаруженную в большинстве форматов файлов: поиск сигнатур файлов и магических чисел и эвристика, включая поиск хорошо известных репрезентативных подстрок, использование таблиц частоты байтов и n-грамм, а также байесовский вывод.

MIME (многоцелевой Интернет Mail Extensions) сниффинг использовался и до сих пор используется некоторыми веб-браузерами, в частности, Microsoft Internet Explorer, в попытке помочь веб-сайтам, которые неправильно сигнализируют о типе MIME отображения веб-материалов. Однако при этом возникает серьезная уязвимость системы безопасности, в которой, запутав алгоритм сниффинга MIME, можно манипулировать браузером для интерпретации данных таким образом, чтобы злоумышленник мог выполнять операции, которые не ожидаются. оператором сайта или пользователем, например межсайтовый скриптинг. Более того, создавая впечатление, что сайты, которые неправильно назначают типы MIME для контента, корректно работают в этих браузерах, это не способствует правильной маркировке материала, что, в свою очередь, делает необходимым для работы этих сайтов анализ контента, создавая порочный круг несовместимость с веб-стандартами и лучшими практиками безопасности.

В HTML5 существует спецификация для сниффинга типов мультимедиа, которая пытается уравновесить требования безопасности с необходимостью обратной совместимости с веб-контентом с отсутствующими или неверными данными типа MIME. Он пытается предоставить точную спецификацию, которая может использоваться в разных реализациях для реализации единого четко определенного и детерминированного набора поведений.

Команда UNIX file может рассматриваться как приложение для сниффинга контента.

Содержание

  • 1 Анализ кодировки
  • 2 См. Также
  • 3 Ссылки
  • 4 Внешние ссылки

Анализ кодировки

Многие веб-браузеры используют более ограниченную форму анализа контента для попытаться определить кодировку символов текстовых файлов, для которых уже известен тип MIME. Этот метод известен как сниффинг кодировки или кодовой страницы и, для определенных кодировок, может также использоваться для обхода ограничений безопасности. Например, Internet Explorer 7 может быть обманут для запуска JScript в обход его политики, позволив браузеру угадать, что HTML -файл был закодирован в UTF-7. Эта ошибка усугубляется особенностью кодировки UTF-7, которая разрешает несколько кодировок одного и того же текста и, в частности, альтернативные представления символов ASCII.

Большинство кодировок не допускают уклончивого представления символов ASCII, поэтому анализ кодировки в целом менее опасен, потому что из-за исторической случайности ASCII-ориентированного характера языков сценариев и языков разметки символы вне репертуара ASCII являются труднее использовать для обхода границ безопасности, а неправильная интерпретация наборов символов, как правило, дает результаты не хуже, чем отображение mojibake.

См. также

Ссылки

Внешние ссылки

Последняя правка сделана 2021-05-15 10:51:37
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте