Цифровая обработка изображений

редактировать
Алгоритмическая обработка изображений, представленных в цифровом виде

Обработка цифровых изображений - это использование цифрового компьютера для обработки цифровых изображений с помощью алгоритма . Как подкатегория или поле обработки цифрового сигнала, обработка цифрового изображения имеет много преимуществ по сравнению с обработкой аналогового изображения. Это позволяет применять к входным данным гораздо более широкий диапазон алгоритмов и позволяет избежать таких проблем, как нарастание шума и искажения во время обработки. Поскольку изображения определены в двух измерениях (возможно, больше), обработка цифровых изображений может быть смоделирована в форме многомерных систем. На создание и развитие цифровой обработки изображений в основном влияют три фактора: во-первых, развитие компьютеров; во-вторых, развитие математики (особенно создание и совершенствование теории дискретной математики); в-третьих, вырос спрос на широкий спектр приложений в окружающей среде, сельском хозяйстве, военном деле, промышленности и медицине.

Содержание
  • 1 История
    • 1.1 Датчики изображения
    • 1.2 Сжатие изображения
    • 1.3 Цифровой сигнальный процессор (DSP)
    • 1.4 Медицинская визуализация
  • 2 Задачи
  • 3 Цифровые преобразования изображений
    • 3.1 Фильтрация
    • 3.2 Заполнение изображения при фильтрации в области Фурье
    • 3.3 Примеры кода фильтрации
    • 3.4 Аффинные преобразования
  • 4 Приложения
    • 4.1 Изображения с цифровой камеры
    • 4.2 Пленка
  • 5 Обнаружение усталости и технологии мониторинга
  • 6 См. также
  • 7 Ссылки
  • 8 Дополнительная литература
  • 9 Внешние ссылки
История

Многие методы обработки цифровых изображений, или цифровая обработка изображений, как ее часто называют, были разработаны в 1960-х годах в Bell Laboratories, Лаборатории реактивного движения, Массачусетский технологический институт, Мэрилендский университет и несколько других исследовательских центров с применением спутниковых изображений, преобразования стандартов телеграфного изображения, медицинских изображений, видеофон, распознавание символов и улучшение фотографий. Целью ранней обработки изображений было улучшение качества изображения. Он был предназначен для улучшения визуального эффекта людей. При обработке изображений входом является изображение низкого качества, а на выходе - изображение улучшенного качества. Обычная обработка изображений включает улучшение изображения, восстановление, кодирование и сжатие. Первым успешным применением стала Американская лаборатория реактивного движения (JPL). Они использовали такие методы обработки изображений, как геометрическая коррекция, преобразование градаций, удаление шума и т. Д. На тысячах лунных фотографий, отправленных космическим детектором Ranger 7 в 1964 году, с учетом положения Солнца и окружающей среды Луны. Влияние успешного составления карты поверхности Луны компьютером имело огромный успех. Позже была произведена более сложная обработка изображений почти 100000 фотографий, отправленных космическим кораблем, так что были получены топографическая карта, цветная карта и панорамная мозаика Луны, что дало выдающиеся результаты и заложило прочный фундамент для посадки человека на Землю. луна.

Однако стоимость обработки была довольно высокой с вычислительным оборудованием той эпохи. Ситуация изменилась в 1970-х годах, когда цифровая обработка изображений получила распространение по мере появления более дешевых компьютеров и специального оборудования. Это привело к тому, что изображения обрабатывались в реальном времени для решения некоторых специальных задач, таких как преобразование телевизионных стандартов. По мере того, как компьютеры общего назначения становились быстрее, они начали брать на себя роль специализированного оборудования для всех, кроме самых специализированных и требовательных к компьютерам операций. С появлением быстрых компьютеров и сигнальных процессоров, доступных в 2000-х годах, цифровая обработка изображений стала наиболее распространенной формой обработки изображений и обычно используется, потому что это не только самый универсальный, но и самый дешевый метод.

Датчики изображения

Основой современных датчиков изображения является технология металл-оксид-полупроводник (MOS), которая берет свое начало с изобретения MOSFET (MOS-полевой транзистор) от Мохамеда М. Аталлы и Давона Канга в Bell Labs в 1959 году. разработка цифровых полупроводниковых датчиков изображения, включая устройство с зарядовой связью (CCD), а затем CMOS-датчик.

Устройство с зарядовой связью было изобретено Уиллард С. Бойл и Джордж Э. Смит в Bell Labs в 1969 году. Исследуя технологию МОП, они поняли, что электрический заряд аналогичен магнитному пузырю и что он может храниться в крошечный МОП конденсатор. Поскольку изготовить серию МОП-конденсаторов в ряд было довольно просто, они подключали к ним подходящее напряжение, так что заряд мог переходить от одного к другому. ПЗС - это полупроводниковая схема, которая позже использовалась в первых цифровых видеокамерах для телевизионного вещания.

NMOS датчик с активными пикселями ( APS) была изобретена Olympus в Японии в середине 1980-х годов. Это стало возможным благодаря достижениям в производстве полупроводниковых устройств MOS , с масштабированием MOSFET, достигающим меньших микронных, а затем субмикронных уровней. NMOS APS был изготовлен командой Цутому Накамуры в Olympus в 1985 году. Датчик с активными пикселями CMOS (датчик CMOS) был позже разработан командой Эрика Фоссума в НАСА Лаборатория реактивного движения в 1993 году. К 2007 году продажи КМОП-сенсоров превзошли ПЗС-сенсоры.

Сжатие изображения

Важное развитие в цифровой сфере Технология сжатия изображений - это технология дискретного косинусного преобразования (DCT), метод сжатия с потерями, впервые предложенный Насиром Ахмедом в 1972 году. DCT-сжатие стало основой для JPEG, который был представлен Joint Photographic Experts Group в 1992 году. JPEG сжимает изображения до файлов гораздо меньшего размера и стал наиболее широко используемым форматом файлов изображений в Интернете. Его высокоэффективный алгоритм сжатия DCT в значительной степени стал причиной широкого распространения цифровых изображений и цифровых фотографий, при этом по состоянию на 2015 год ежедневно создавалось несколько миллиардов изображений JPEG.

Цифровой сигнальный процессор (DSP)

Электронная обработка сигналов произвела революцию в связи с широким внедрением технологии MOS в 1970-е годы. Технология интегральных схем MOS послужила основой для первых однокристальных микропроцессоров и микроконтроллеров в начале 1970-х годов, а затем первых однокристальных процессоров цифровых сигналов (DSP) в конец 1970-х гг. С тех пор микросхемы DSP широко используются в цифровой обработке изображений.

Алгоритм дискретного косинусного преобразования (DCT) сжатия изображений широко применяется в микросхемах DSP, причем многие компании, разрабатывающие микросхемы DSP на основе технологии DCT. DCT широко используются для кодирования, декодирования, кодирования видео, кодирования звука, мультиплексирования, сигналов управления, сигнализации, аналого-цифровое преобразование, форматирование яркости и цветовых различий, а также цветовые форматы, такие как YUV444 и YUV411. DCT также используются для операций кодирования, таких как оценка движения, компенсация движения, межкадровое прогнозирование, квантование, перцепционное взвешивание, энтропийное кодирование, переменное кодирование и векторы движения, а также операции декодирования, такие как обратная операция между разными цветовыми форматами (YIQ, YUV и RGB ) для отображения. DCT также обычно используются для микросхем кодера / декодера телевидения высокой четкости (HDTV).

Медицинская визуализация

В 1972 году инженер из британской компании EMI Housfield изобрел Рентгеновский компьютерный томограф для диагностики головы, который обычно называют КТ (компьютерная томография). Метод компьютерной томографии ядра основан на проекции участка головы человека и обрабатывается компьютером для восстановления изображения поперечного сечения, что называется реконструкцией изображения. В 1975 году EMI успешно разработала компьютерную томографию для всего тела, которая позволила получить четкое томографическое изображение различных частей человеческого тела. В 1979 году этот диагностический метод получил Нобелевскую премию. Технология цифровой обработки изображений для медицинских приложений была занесена в Space Foundation Зал славы космических технологий в 1994 году.

Задачи

Цифровая обработка изображений позволяет использовать гораздо более сложные алгоритмы, и, следовательно, могут предложить как более сложную производительность для простых задач, так и реализацию методов, которые были бы невозможны с помощью аналоговых средств.

В частности, обработка цифровых изображений - это конкретное приложение и практическая технология, основанная на:

Некоторые методы, которые используются в цифровой обработке изображений, включают:

Преобразования цифровых изображений

Фильтрация

Цифровые фильтры используются для размытия и резкости цифровых изображений. Фильтрация может выполняться с помощью:

  • свертки со специально разработанными ядрами (массив фильтров) в пространственной области
  • маскированием определенных частотных областей в частотной (Фурье) области

В следующих примерах показаны оба метода:

Тип фильтраЯдро или маскаПример
Исходное изображение[0 0 0 0 1 0 0 0 0] {\ displaystyle {\ begin {bmatrix} 0 0 0 \\ 0 1 0 \\ 0 0 0 \ end {bmatrix}}\ begin {bmatrix} 0 0 0 \\ 0 1 0 \\ 0 0 0 \ end {bmatrix} Аффинное преобразование Original Checkerboard.jpg
Пространственный фильтр нижних частот 1 9 × [1 1 1 1 1 1 1 1 1] {\ displaystyle {\ frac { 1} {9}} \ times {\ begin {bmatrix} 1 1 1 \\ 1 1 1 \\ 1 1 1 \ end {bmatrix}}}{\ displaystyle {\ frac {1} {9}} \ times {\ begin {bmatrix} 1 1 1 \\ 1 1 1 \\ 1 1 1 \ end {bmatrix}}} Spatial Mean Filter Checkerboard.png
Пространственный фильтр верхних частот [0 - 1 0 - 1 4 - 1 0 - 1 0 ] {\ displaystyle {\ begin {bmatrix} 0 -1 0 \\ - 1 4 -1 \\ 0 -1 0 \ end {bmatrix}}}{\ displaystyle {\ begin {bmatrix} 0 -1 0 \\ - 1 4 -1 \\ 0 -1 0 \ end {bmatrix}}} Пространственный лапласовский фильтр Checkerboard.png
Представление Фурье Псевдокод:

image = checkerboard

F = преобразование Фурье изображения

Показать изображение: журнал (1 + абсолютное значение (F))

Fourier Space Checkerboard.png
фильтр нижних частот ФурьеLowpass Butterworth Checkerboard.png Lowpass FFT Filtered checkerboard.png
фильтр верхних частот ФурьеHighpass Butterworth Checkerboard.png Highpass FFT Filtered checkerboard.png

заполнение изображения при фильтрации в области Фурье

Изображения обычно дополняются перед преобразованием в в пространстве Фурье изображения с фильтром верхних частот ниже иллюстрируют последствия различных методов заполнения:

с заполнением нулямис повторным заполнением краями
Highpass FFT Filtered checkerboard.png Highpass FFT Replicate.png

Обратите внимание, что фильтр верхних частот показывает дополнительные края при нуле padded по сравнению с повторяющейся кромкой.

Примеры кода фильтрации

Пример MATLAB для фильтрации верхних частот в пространственной области.

img = шахматная доска (20); % создать шахматную доску% ************************** ПРОСТРАНСТВЕННЫЙ ДОМЕН ****************** ********* klaplace = [0 -1 0; -1 5 -1; 0 -1 0]; % Ядро лапласовского фильтра X = conv2 (img, klaplace); % convolve test img с% 3x3 Laplacian kernel figure () imshow (X,)% show Laplacian filter title ('Laplacian Edge Detection')

Аффинные преобразования

Аффинные преобразования включают базовые преобразования изображения, включая масштабирование, поворот, переместите, отразите и сдвигайте, как показано в следующих примерах:

Имя преобразованияАффинная матрицаПример
Идентичность [1 0 0 0 1 0 0 0 1] {\ displaystyle {\ begin {bmatrix} 1 0 0 \\ 0 1 0 \\ 0 0 1 \ end {bmatrix}}}{\ displaystyle {\ begin {bmatrix} 1 0 0 \\ 0 1 0 \\ 0 0 1 \ end {bmatrix}}} Checkerboard identity.svg
Отражение [- 1 0 0 0 1 0 0 0 1] {\ displaystyle {\ begin {bmatrix} -1 0 0 \\ 0 1 0 \\ 0 0 1 \ end {bmatrix}}}{\ displaystyle {\ begin {bmatrix} -1 0 0 \\ 0 1 0 \\ 0 0 1 \ end {bmatrix}}} Checkerboard reflection.svg
Масштаб [cx = 2 0 0 0 cy = 1 0 0 0 1] {\ displaystyle {\ begin {bmatrix} c_ {x} = 2 0 0 \\ 0 c_ {y} = 1 0 \\ 0 0 1 \ end {bmatrix}}}{\ displaystyle {\ begin {bmatrix} c_ {x} = 2 0 0 \\ 0 c_ {y} = 1 0 \\ 0 0 1 \ end {bmatrix}}} Checkerboard scale.svg
Повернуть [cos ⁡ (θ) sin ⁡ (θ) 0 - sin ⁡ (θ) cos ⁡ (θ) 0 0 0 1] {\ Displaystyle {\ begin {bmatrix} \ cos (\ theta) \ sin (\ theta) 0 \\ - \ sin (\ theta) \ cos (\ theta) 0 \\ 0 0 1 \ end {bmatrix}}}{\ displaystyle {\ begin {bmatrix} \ cos (\ theta) \ sin (\ theta) 0 \\ - \ sin (\ theta) \ cos (\ theta) 0 \\ 0 0 1 \ end {bmatrix}}} Checkerboard rotate.svg где θ = π / 6 = 30 °
Сдвиг [1 cx = 0,5 0 cy = 0 1 0 0 0 1] {\ di splaystyle {\ begin {bmatrix} 1 c_ {x} = 0.5 0 \\ c_ {y} = 0 1 0 \\ 0 0 1 \ end {bmatrix}}}{\ displaystyle { \ begin {bmatrix} 1 c_ {x} = 0,5 0 \\ c_ {y} = 0 1 0 \\ 0 0 1 \ end {bmatrix}}} Сдвиг шахматной доски. Svg

Чтобы применить аффинную матрицу к изображению, изображение преобразуется в матрицу в котором каждая запись соответствует интенсивности пикселей в этом месте. Затем положение каждого пикселя может быть представлено как вектор, указывающий координаты этого пикселя в изображении, [x, y], где x и y - это строка и столбец пикселя в матрице изображения. Это позволяет умножить координату на матрицу аффинного преобразования, которая дает позицию, в которую будет скопировано значение пикселя в выходном изображении.

Однако, чтобы разрешить преобразования, требующие трансляционных преобразований, необходимы трехмерные однородные координаты. Третье измерение обычно устанавливается на ненулевую константу, обычно 1, так что новая координата равна [x, y, 1]. Это позволяет умножить вектор координат на матрицу 3 на 3, что позволяет сдвигать. Таким образом, третье измерение, являющееся константой 1, допускает перевод.

Поскольку матричное умножение является ассоциативным, несколько аффинных преобразований могут быть объединены в одно аффинное преобразование путем умножения матрицы каждого отдельного преобразования в том порядке, в котором преобразования выполняются. Это приводит к единой матрице, которая при применении к точечному вектору дает тот же результат, что и все отдельные преобразования, выполняемые последовательно над вектором [x, y, 1]. Таким образом, последовательность матриц аффинного преобразования может быть сведена к одной матрице аффинного преобразования.

Например, двумерные координаты допускают вращение только вокруг начала координат (0, 0). Но можно использовать трехмерные однородные координаты, чтобы сначала перевести любую точку в (0, 0), затем выполнить вращение и, наконец, перевести начало координат (0, 0) обратно в исходную точку (противоположность первого перевода). Эти 3 аффинных преобразования могут быть объединены в единую матрицу, что позволяет вращать вокруг любой точки изображения.

Приложения

Изображения цифровых камер

Цифровые камеры обычно включают специализированные цифровые оборудование для обработки изображений - либо выделенные микросхемы, либо добавленные схемы на других микросхемах - для преобразования необработанных данных с их датчика изображения в изображение с цветокоррекцией в стандартном формате файла изображения .

Фильм

Мир Дикого Запада (1973) был первым художественным фильмом, в котором использовалась цифровая обработка изображений для пиксельной фотографии для имитации точки зрения андроида.

Обнаружение усталости и технологии мониторинга

За последнее десятилетие технологии мониторинга усталости значительно продвинулись вперед. Эти инновационные технологические решения теперь коммерчески доступны и предлагают реальные преимущества безопасности водителям, операторам и другим сменным рабочим во всех отраслях промышленности.

Разработчики программного обеспечения, инженеры и ученые разрабатывают программное обеспечение для обнаружения усталости, используя различные физиологические сигналы для определения состояния утомляемость или сонливость. Измерение активности мозга (электроэнцефалограмма) широко признано в качестве стандарта при мониторинге утомляемости. Другая технология, используемая для определения ухудшения, связанного с утомляемостью, включает измерения поведенческих симптомов, например: поведение глаз, направление взгляда, микрокоррекции в управлении и использовании дроссельной заслонки, а также вариабельность сердечного ритма.

См. также
Ссылки
Дополнительная литература
  • Р. Фишер; К. Доусон-Хау; А. Фитцгиббон; К. Робертсон; Э. Трукко (2005). Словарь компьютерного зрения и обработки изображений. Джон Вили. ISBN 978-0-470-01526-1.
  • Рафаэль К. Гонсалес; Ричард Э. Вудс; Стивен Л. Эддинс (2004). Цифровая обработка изображений с использованием MATLAB. Pearson Education. ISBN 978-81-7758-898-9.
  • Тим Моррис (2004). Компьютерное зрение и обработка изображений. Пэлгрейв Макмиллан. ISBN 978-0-333-99451-1.
  • Тяги Випин (2018). Понимание обработки цифровых изображений. Тейлор и Фрэнсис CRC Press. ISBN 978-11-3856-6842.
  • Милан Сонька; Вацлав Главац; Роджер Бойл (1999). Обработка изображений, анализ и машинное зрение. PWS Publishing. ISBN 978-0-534-95393-5.
  • Рафаэль К. Гонсалес (2008). Цифровая обработка изображений. Прентис Холл. ISBN 9780131687288
Внешние ссылки

.

Последняя правка сделана 2021-05-17 05:58:26
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте