Пирамида (обработка изображений)

редактировать
Визуальное представление пирамиды изображений с 5 уровнями

Пирамида или представление пирамиды, является типом многоуровневого сигнала представления, разработанного компьютерным зрением, обработкой изображений и обработка сигналов сообществ, в которых сигнал или изображение подвергаются повторному сглаживанию и субдискретизации. Представление пирамиды является предшественником представления в масштабном пространстве и анализа с множественным разрешением.

Содержание
  • 1 Генерация пирамиды
  • 2 Ядра генерации пирамиды
    • 2.1 Гауссова пирамида
      • 2.1. 1 Лапласовская пирамида
    • 2.2 Управляемая пирамида
  • 3 Применение пирамид
    • 3.1 Альтернативное представление
    • 3.2 Манипуляции с деталями
  • 4 См. Также
  • 5 Ссылки
  • 6 Внешние ссылки
Создание пирамиды

Существует два основных типа пирамид: lowpass и bandpass.

Пирамида нижних частот создается путем сглаживания изображения с помощью соответствующего сглаживающего фильтра и последующей субдискретизации сглаженного изображения, обычно с коэффициентом 2 вдоль каждого направления координат. Полученное изображение затем подвергается той же процедуре, и цикл повторяется несколько раз. Каждый цикл этого процесса приводит к уменьшению изображения с повышенным сглаживанием, но с уменьшенной плотностью пространственной выборки (то есть уменьшенным разрешением изображения). Если проиллюстрировать графически, все многомасштабное представление будет выглядеть как пирамида с исходным изображением внизу и меньшим изображением каждого цикла, сложенным одно поверх другого.

Пирамида полосы пропускания создается путем формирования разницы между изображениями на соседних уровнях в пирамиде и выполнения интерполяции изображений между соседними уровнями разрешения, чтобы обеспечить вычисление пиксельных различий.

Ядра генерации пирамиды

Для создания пирамид было предложено множество различных ядер сглаживания. Среди выдвинутых предложений биномиальные ядра, возникающие из биномиальных коэффициентов, выделяются как особенно полезный и теоретически хорошо обоснованный класс. Таким образом, для двумерного изображения мы можем применить (нормализованный) биномиальный фильтр (1/4, 1/2, 1/4), как правило, дважды или более по каждому пространственному измерению, а затем субдискретизировать изображение с коэффициентом два. Затем эта операция может выполняться столько раз, сколько необходимо, что приводит к компактному и эффективному многомасштабному представлению. Если это мотивировано особыми требованиями, могут также быть сгенерированы промежуточные уровни шкалы, где этап подвыборки иногда не учитывается, что приводит к избыточной или гибридной пирамиде. С ростом вычислительной эффективности доступных сегодня процессоров, в некоторых ситуациях также возможно использовать более широкую поддержку гауссовских фильтров в качестве сглаживающих ядер на этапах создания пирамиды.

Пирамида Гаусса

В пирамиде Гаусса последующие изображения уменьшаются с использованием среднего значения по Гауссу (Размытие по Гауссу ) и уменьшаются в масштабе. Каждый пиксель, содержащий локальное среднее значение, соответствует пикселю соседства на нижнем уровне пирамиды. Этот метод используется, в частности, в синтезе текстуры.

Лапласовской пирамиде

Лапласовская пирамида очень похожа на гауссову пирамиду, но сохраняет разностное изображение размытых версий между каждым уровнем. Только наименьший уровень не является разностным изображением, чтобы можно было реконструировать изображение с высоким разрешением с использованием разностных изображений на более высоких уровнях. Этот метод может быть использован в сжатии изображений.

Управляемая пирамида

Управляемая пирамида, разработанная Симончелли и другими, представляет собой реализацию многомасштабного, многоориентационного банк полосовых фильтров, используемый для приложений, включая сжатие изображений, синтез текстуры и распознавание объектов. Его можно рассматривать как ориентированную селективную версию лапласовской пирамиды, в которой набор управляемых фильтров используется на каждом уровне пирамиды вместо одного лапласовского или гауссовского фильтра.

Применение пирамид

Альтернативное представление

На заре компьютерного зрения пирамиды использовались в качестве основного типа многомасштабного представления для вычисления функций многомасштабного изображения из реальных данных изображения. К более поздним методам относятся представление масштабного пространства, которое было популярно среди некоторых исследователей из-за его теоретической основы, способности отделить этап подвыборки от многомасштабного представления, более мощные инструменты теоретического анализа, такие как а также возможность вычислять представление в любом желаемом масштабе, что позволяет избежать алгоритмических проблем, связанных с соотнесением представлений изображений с различным разрешением. Тем не менее пирамиды по-прежнему часто используются для выражения эффективных с вычислительной точки зрения приближений к представлению в масштабном пространстве.

Манипуляции с деталями

Пирамиды лапласовских изображений на основе двустороннего фильтра обеспечивают хорошую основу для улучшение деталей изображения и манипуляции с ним. Различия изображений между каждым слоем изменяются, чтобы преувеличить или уменьшить детали в разных масштабах изображения.

В некоторых форматах файлов сжатия изображений используется алгоритм Adam7 или какой-либо другой метод чересстрочной развертки. Их можно рассматривать как своего рода пирамиду изображений. Поскольку в этом формате файла сначала сохраняются «крупномасштабные» функции, а затем мелкие детали в файле, конкретный зритель, отображающий небольшую «миниатюру» или на маленьком экране, может быстро загрузить ровно столько изображения, чтобы отобразить его в доступные пиксели - поэтому один файл может поддерживать множество разрешений программы просмотра, вместо того, чтобы сохранять или создавать разные файлы для каждого разрешения.

См. Также
Ссылки
Внешние ссылки
Последняя правка сделана 2021-06-02 11:37:53
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте