дизеринг - это намеренно применяемая форма шума, используемая для рандомизации ошибки квантования, предотвращая крупномасштабные шаблоны, такие как цветовые полосы в изображениях. Дизеринг обычно используется при обработке данных цифрового аудио и видео и часто является одним из последних этапов преобразования аудио в CD.
Использование дизеринга - это преобразование изображения в оттенках серого в черно-белое, так что плотность черных точек в новом изображении приближается к среднему уровню серого в оригинале.
… [О] одно из первых [применений] дизеринга появилось во время Второй мировой войны. Самолеты-бомбардировщики использовали механические компьютеры для выполнения навигации и расчетов траектории бомб. Любопытно, что эти компьютеры (коробки, заполненные сотнями шестеренок и шестеренок) работали более точно при полете на борту самолета и хуже - на земле. Инженеры поняли, что вибрация от самолета уменьшала ошибку из-за залипания движущихся частей. Вместо того чтобы двигаться короткими рывками, они двигались более непрерывно. В компьютеры были встроены небольшие вибрационные двигатели, и их вибрация была названа dither от среднеанглийского глагола «didderen», что означает «дрожать». Сегодня, когда вы касаетесь механического измерителя, чтобы повысить его точность, вы применяете дизеринг, а современные словари определяют дизеринг как очень нервное, растерянное или возбужденное состояние. В незначительных количествах дизеринг успешно делает систему оцифровки чуть более аналоговой в хорошем смысле этого слова.
— Кен Полманн, Принципы цифрового звукаТермин «дизеринг» был опубликован в книгах по аналоговым вычислениям и пистолетам с гидравлическим управлением вскоре после Второй мировой войны. Хотя он не использовал термин «дизеринг», концепция дизеринга для уменьшения шаблонов квантования была впервые применена Лоуренсом Дж. Робертсом в его магистерской диссертации 1961 MIT и статье 1962 года. К 1964 году дизеринг использовался в современном смысле, описанном в этой статье.
Дизеринг используется во многих различных областях, где используются цифровая обработка и анализ. Сюда входят системы, использующие цифровую обработку сигналов, такие как цифровое аудио, цифровое видео, цифровая фотография, сейсмология, радар и системы прогнозирования погоды.
Квантование дает ошибку. Если эта ошибка коррелирует с сигналом, результат потенциально циклический или предсказуемый. В некоторых областях, особенно там, где рецептор чувствителен к таким артефактам, циклические ошибки приводят к нежелательным артефактам. В этих полях введение дизеринга преобразует ошибку в случайный шум. Область аудио является основным примером этого. Человеческое ухо работает во многом подобно преобразованию Фурье, в котором оно слышит отдельные частоты. Таким образом, ухо очень чувствительно к искажению или дополнительному частотному содержанию, но гораздо менее чувствительно к дополнительному случайному шуму на всех частотах, например, в сигнале с сглаживанием.
В аналоговой системе сигнал является непрерывным, но в цифровой системе PCM амплитуда выходящего сигнала из цифровой системы ограничена одним из набора фиксированных значений или чисел. Этот процесс называется квантованием. Каждое кодированное значение представляет собой дискретный шаг... если сигнал квантован без использования дизеринга, возникнет искажение квантования, связанное с исходным входным сигналом... Чтобы предотвратить это, сигнал "смешивается", процесс, который математически полностью удаляет гармоники или другие крайне нежелательные искажения и заменяет их постоянным фиксированным уровнем шума.
Окончательная версия аудио, которая записывается на компакт-диск, содержит только 16 бит на выборку, но на протяжении всего производственного процесса для представления выборки обычно используется большее количество битов. В конце концов, цифровые данные должны быть сокращены до 16 бит для записи на компакт-диск и распространения.
Есть несколько способов сделать это. Например, можно просто отбросить лишние биты - это называется усечением. Также можно округлить лишние биты до ближайшего значения. Однако каждый из этих методов приводит к предсказуемым и определяемым ошибкам в результате. Использование дизеринга заменяет эти ошибки постоянным фиксированным уровнем шума.
Возьмем, например, сигнал , который состоит из следующих значений:
1 2 3 4 5 6 7 8
Если форма волны уменьшается на 20%, затем следующие новые значения:
0,8 1,6 2,4 3,2 4,0 4,8 5,6 6,4
Если эти значения усечены, это приведет к следующим данным:
0 1 2 3 4 4 5 6
Если вместо этого округлить эти значения, получатся следующие данные:
1 2 2 3 4 5 6 6
Для любой исходной формы сигнала процесс уменьшения амплитуды сигнала на 20% приводит к регулярным ошибкам. Возьмем, например, синусоидальную волну, которая для некоторой части соответствует значениям выше. Каждый раз, когда значение синусоидальной волны достигает 3,2, усеченный результат будет отличаться на 0,2, как в примере данных выше. Каждый раз, когда значение синусоидальной волны достигает 4,0, ошибки не возникает, поскольку усеченный результат будет отличаться на 0,0, что также показано выше. Величина этой ошибки регулярно и многократно изменяется на протяжении цикла синусоидальной волны. Именно эта ошибка проявляется в виде искажения. То, что ухо воспринимает как искажение, - это дополнительный контент на дискретных частотах, созданный регулярной и повторяющейся ошибкой квантования.
Правдоподобным решением было бы взять двухзначное число (скажем, 4,8) и округлить его в одну или другую сторону. Например, его можно округлить до 5 один раз, а затем до 4 в следующий раз. Это сделает долгосрочное среднее значение 4,5 вместо 4, так что в долгосрочной перспективе значение будет ближе к его фактическому значению. Это, с другой стороны, по-прежнему приводит к обнаружимой (хотя и более сложной) ошибке. Каждый раз, когда появляется значение 4,8, результатом будет ошибка 0,2, а в остальных случаях - -0,8. Это по-прежнему приводит к повторяющейся, поддающейся количественной оценке ошибке.
Еще одно правдоподобное решение - взять 4,8 и округлить его так, чтобы в первые четыре раза из пяти оно округлялось до 5, а в пятый раз округлялось до 4. В среднем получается ровно 4,8 в долгосрочной перспективе. К сожалению, это по-прежнему приводит к повторяемым и определяемым ошибкам, и эти ошибки по-прежнему проявляются как искажение для уха.
Это приводит к решению дизеринга. Вместо того, чтобы предсказуемо округлять в большую или меньшую сторону в повторяющемся шаблоне, можно округлять в большую или меньшую сторону в случайном порядке. Если серия случайных чисел от 0,0 до 0,9 (например: 0,6, 0,1, 0,3, 0,6, 0,9 и т. Д.) Вычисляется и добавляется к результатам уравнения, два раза из десяти результат будет снова усечен до 4 ( если 0,0 или 0,1 добавляются к 4,8) и восемь раз из десяти он будет усечен до 5. Каждая данная ситуация имеет случайную 20% вероятность округления до 4 или 80% вероятность округления до 5. В долгосрочной перспективе эти результаты будут в среднем до 4,8, и их ошибка квантования будет случайным шумом. Этот шум менее неприятен для уха, чем определяемое искажение, которое могут вызвать другие решения.
Дизеринг добавляется перед любым процессом квантования или повторного квантования, чтобы декоррелировать шум квантования из входного сигнала и предотвратить нелинейное поведение (искажение). Квантование с меньшей битовой глубиной требует большего количества дизеринга. Результат процесса по-прежнему дает искажение, но искажение носит случайный характер, поэтому результирующий шум эффективно декоррелируется с заданным сигналом.
В основополагающих статьях, опубликованных в AES Journal, Липшиц и Вандеркой указали, что разные типы шума с разными функциями плотности вероятности (PDF) ведут себя по-разному при использовании как сигналы дизеринга, и предложил оптимальные уровни сигнала дизеринга для звука. Гауссовский шум требует более высокого уровня добавленного шума для полного устранения искажений, чем шум с прямоугольным или треугольным распределением. Треугольный распределенный шум также минимизирует шумовую модуляцию - слышимые изменения уровня громкости остаточного шума за тихой музыкой, которые привлекают внимание к шуму.
Дизеринг может быть полезен для прерывания периодических предельных циклов, которые являются распространенной проблемой в цифровых фильтрах. Случайный шум обычно менее опасен, чем гармонические тона, создаваемые предельными циклами.
Шум сглаживания с использованием прямоугольной функции плотности вероятности (RPDF) имеет равномерное распределение ; любое значение в указанном диапазоне имеет одинаковую вероятность появления.
Шум дизеринга с использованием треугольной функции плотности вероятности (TPDF) имеет треугольное распределение ; значения в центре диапазона имеют более высокую вероятность появления. Треугольное распределение может быть достигнуто путем добавления двух независимых источников RPDF.
Гауссовский PDF имеет нормальное распределение. Отношение вероятностей результатов следует колоколообразной, или кривой Гаусса, типичной для дизеринга, генерируемого аналоговыми источниками, такими как микрофонные предусилители. Если битовая глубина записи достаточно велика, шума предусилителя будет достаточно для дизеринга записи.
Формирование шума - это процесс фильтрации, который формирует спектральную энергию ошибки квантования, как правило, либо для уменьшения выделения частот, к которым ухо наиболее чувствительно, либо для полного разделения полос сигнала и шума. Если используется дизеринг, его окончательный спектр зависит от того, добавлен ли он внутри или вне контура обратной связи формирователя шума. Если внутри, дизеринг рассматривается как часть сигнала ошибки и формируется вместе с фактической ошибкой квантования. Если снаружи, дизеринг обрабатывается как часть исходного сигнала и линеаризует квантование, не изменяя самого себя. В этом случае окончательный минимальный уровень шума представляет собой сумму плоского спектра дизеринга и сформированного шума квантования. В то время как формирование шума в реальном мире обычно включает внутриконтурное дизеринг, его также можно использовать без добавления дизеринга, и в этом случае ошибка квантования очевидна при низких уровнях сигнала.
Цветной дизеринг иногда упоминается как дизеринг, который был отфильтрован, чтобы отличаться от белого шума. Формирование шума - одно из таких приложений.
Если дизеринг-сигнал должен пройти дальнейшую обработку, то он должен быть обработан дизерингом треугольного типа с амплитудой в два шага квантования, чтобы дизеринг вычисленные значения находятся в диапазоне, например, от -1 до +1 или от 0 до 2. Это идеальный дизеринг с наименьшей мощностью, поскольку он не вводит модуляцию шума (которая проявляется как постоянный минимальный уровень шума) и полностью устраняет гармонические искажения от квантования. Если вместо этого на этих промежуточных этапах обработки используется цветной дизеринг, то частотное содержимое может «растекаться » в другие частотные диапазоны, которые более заметны и становятся отвлекающе слышимыми.
Если сглаживаемый сигнал не должен подвергаться дальнейшей обработке - если он смещается до его конечного результата для распространения - тогда подходит "цветной" дизеринг или формирование шума. Это может эффективно снизить уровень слышимого шума, поместив большую часть этого шума в частотный диапазон, где он менее критичен.
сглаживание используется в компьютерной графике для создания иллюзии глубины цвета на изображениях в системах с ограниченной цветовой палитрой. В изображении с размытием цвета, недоступные в палитре, аппроксимируются путем рассеивания цветных пикселей из доступной палитры. Человеческий глаз воспринимает диффузию как смесь цветов внутри него (см. цветовое зрение ). Изображения с размытием, особенно те, которые используют палитры с относительно небольшим количеством цветов, часто можно отличить по характерной зернистости или пятнистости.
Дизеринг вносит шум или узор в изображение, и часто узор виден. В этих обстоятельствах было показано, что дизеринг, генерируемый синим шумом, является наименее неприглядным и отвлекающим. Методы диффузии ошибок были одними из первых методов генерации шаблонов сглаживания синего шума. Однако другие методы, такие как упорядоченное дизеринг, также могут генерировать дизеринг синего шума без тенденции к вырождению в области с артефактами.
Уменьшение глубины цвета изображения может иметь значительные визуальные побочные эффекты. Если исходное изображение является фотографией, оно, вероятно, содержит тысячи или даже миллионы различных цветов. Процесс ограничения доступных цветов определенной цветовой палитрой фактически отбрасывает определенное количество информации о цвете.
Ряд факторов может повлиять на конечное качество изображения с уменьшенной цветопередачей. Возможно, наиболее важным является цветовая палитра, которая будет использоваться в уменьшенном изображении. Например, исходное изображение (рис. 1) может быть уменьшено до 216-цветной веб-палитры. Если исходные цвета пикселей просто преобразованы в ближайший доступный цвет из палитры, дизеринга не произойдет (рисунок 2). Однако обычно такой подход приводит к появлению плоских участков (контуров) и потере деталей, а также к появлению цветовых пятен, которые значительно отличаются от оригинала. Затененные или градиентные области могут давать цветные полосы, которые могут отвлекать. Применение дизеринга может помочь минимизировать такие визуальные артефакты и обычно приводит к лучшему представлению оригинала (рисунок 3). Дизеринг помогает уменьшить цветовые полосы и однородность.
Одна из проблем, связанных с использованием фиксированной цветовой палитры, заключается в том, что многие из необходимых цветов могут быть недоступны в палитре, и многие из доступных цветов могут не понадобиться; фиксированная палитра, содержащая в основном оттенки зеленого, не подойдет, например, для изображения пустыни. В таких случаях может оказаться полезным использование оптимизированной цветовой палитры. Оптимизированная цветовая палитра - это такая, в которой доступные цвета выбираются в зависимости от того, как часто они используются в исходном исходном изображении. Если изображение уменьшено на основе оптимизированной палитры, результат часто будет намного ближе к исходному (рисунок 4).
Количество цветов, доступных в палитре, также является важным фактором. Если, например, палитра ограничена только 16 цветами, то результирующее изображение может пострадать от дополнительной потери деталей, что приведет к еще более выраженным проблемам с плоскостностью и цветовыми полосами (рис. 5). Еще раз, дизеринг может помочь свести к минимуму такие артефакты (рис. 6).
Рис. 1. Исходное фото; обратите внимание на плавность деталей.
Рис. 2. Исходное изображение с использованием безопасной веб-цветовой палитры без применения дизеринга. Обратите внимание на большие плоские участки и потерю деталей.
Рис. 3. Исходное изображение с использованием цветовой палитры, доступной в Интернете, с сглаживанием Флойда – Стейнберга. Обратите внимание, что даже если используется та же палитра, применение дизеринга дает лучшее представление оригинала.
Рис. 4. Здесь оригинал был уменьшен до 256-цветной оптимизированной палитры с применением дизеринга Флойда – Стейнберга. Использование оптимизированной палитры, а не фиксированной палитры позволяет результату лучше представить цвета в исходном изображении.
Рис. 5. На этом изображении глубина уменьшена до 16-цветной оптимизированной палитры без размытия. Цвета выглядят приглушенными, а цветовые полосы явно выражены.
Рис. 6. В этом изображении также используется оптимизированная палитра с 16 цветами, но использование дизеринга помогает уменьшить полосатость.
Множество различных видов дисплейного оборудования, включая ранние компьютерные видеоадаптеры, а также множество современных ЖК-дисплеев, используемых в мобильных телефонах и недорогие цифровые камеры показывают гораздо меньший цветовой диапазон, чем более продвинутые дисплеи. Одним из распространенных применений дизеринга является более точное отображение графики, содержащей больший диапазон цветов, чем способно отобразить оборудование. Например, дизеринг может использоваться для отображения фотографического изображения, содержащего миллионов цветов, на видеооборудовании, которое способно отображать только 256 цветов за раз. 256 доступных цветов будут использоваться для создания нечеткого приближения к исходному изображению. Без сглаживания цвета в исходном изображении можно просто «округлить» до ближайшего доступного цвета, в результате чего новое изображение будет плохо воспроизводить оригинал. Дизеринг использует тенденцию человеческого глаза «смешивать» два цвета в непосредственной близости друг от друга.
Некоторые ЖК-дисплеи могут использовать временное сглаживание для достижения аналогичного эффекта. Быстро меняя значение цвета каждого пикселя между двумя приблизительными цветами в цветовом пространстве панели (также известном как Управление частотой кадров ), панель дисплея, которая изначально поддерживает только 18-битный цвет (6 бит на канал), может представлять 24-битное "истинное" цветное изображение (8 бит на канал).
Обычно используется дизеринг, подобный этому, при котором аппаратное обеспечение дисплея компьютера является основным ограничением глубины цвета. в программном обеспечении, таком как веб-браузеры. Поскольку веб-браузер может извлекать графические элементы из внешнего источника, ему может потребоваться выполнить дизеринг для изображений со слишком большим количеством цветов для доступного отображения. Из-за проблем с дизерингом была определена цветовая палитра, известная как «веб-безопасная цветовая палитра », для использования при выборе цветов, которые не будут размываться на дисплеях с доступными только 256 цветами.
Но даже когда общее количество доступных цветов в аппаратном обеспечении дисплея достаточно велико для «правильного» отображения полноцветных цифровых фотографий (например, тех, которые используют 15- и 16-битный RGB Hicolor 32 768/65 536 цветовых режимов), полосы все еще могут быть очевидны для глаза, особенно на больших участках с плавными переходами оттенков (хотя исходный файл изображения не имеет полос вообще). Смешение 32 или 64 уровней RGB приведет к довольно хорошей аппроксимации отображения «псевдо truecolor », которую глаз не распознает как зернистую. Кроме того, изображения, отображаемые на 24-битном оборудовании RGB (8 бит на первичный RGB), могут быть размыты для имитации несколько более высокой битовой глубины и / или для минимизации потери оттенков, доступных после гамма-коррекции. Программное обеспечение для обработки неподвижных изображений высокого класса обычно использует эти методы для улучшения отображения.
Еще одно полезное применение дизеринга - это ситуации, в которых формат графического файла является ограничивающим фактором. В частности, широко используемый формат GIF ограничивается использованием 256 или меньше цветов во многих программах редактирования графики. Изображения в других форматах файлов, таких как PNG, также могут иметь такое ограничение, наложенное на них ради уменьшения размера файла. Такие изображения имеют фиксированную цветовую палитру, определяющую все цвета, которые может использовать изображение. В таких ситуациях может отвечать за дизеринг изображений перед их сохранением в таких ограничительных форматах.
Дизеринг аналогичен технике полутонов, используемой при печати. Недавнее широкое внедрение струйных принтеров и их способность печатать отдельные точки увеличили использование дизеринга в печати. По этой причине термин "дизеринг" иногда используется взаимозаменяемо с термином "полутоновое изображение", особенно в связи с цифровой печатью.
. Типичный настольный струйный принтер может печатать только 16 цветов (комбинация точек или отсутствие точек из голубого, пурпурного, желтая и черная печатающие головки). Однако некоторые из этих комбинаций чернил бесполезны, потому что, когда используются черные чернила, они обычно скрывают любой из других цветов. Для воспроизведения большого диапазона цветов используется дизеринг. В областях с плотной печатью, где цвет темный, размытость не всегда видна, потому что точки чернил сливаются, создавая более однородную печать. Тем не менее, внимательный осмотр светлых участков отпечатка, на которых сглаживание расположило точки намного дальше друг от друга, обнаруживает контрольные точки сглаживания.
Существует несколько алгоритмов, предназначенных для выполнения дизеринга. Одним из первых и до сих пор одним из самых популярных является алгоритм дизеринга Флойда – Стейнберга, который был разработан в 1975 году. Одна из сильных сторон этого алгоритма заключается в том, что он минимизирует визуальные артефакты за счет распространение ошибок процесс; Алгоритмы диффузии ошибок обычно создают изображения, которые более точно представляют оригинал, чем более простые алгоритмы дизеринга.
Методы дизеринга включают:
(Исходный) | Порог | Случайный |
---|---|---|
Полутоновый | Упорядоченный (Байер) | Упорядоченный (пустота и кластер) |
Флойд – Стейнберг | Джарвис, Джудис и Ninke | Stucki | Burkes |
---|---|---|---|
Sierra | Двухрядная Sierra | Sierra Lite | Atkinson | На основе градиента |
---|---|---|---|---|
Вынужденное рассеяние Бриллюэна (SBS) - это нелинейный оптический эффект, который ограничивает передаваемую оптическую мощность в волоконно-оптических системах. Этот предел мощности может быть увеличен за счет дизеринга центральной оптической частоты передачи, обычно реализуемого путем модуляции входного смещения лазера. См. Также поляризационное скремблирование.
. Искусственное дрожание (дизеринг) может использоваться в электронике для уменьшения ошибок квантования в A / D-элементах. Еще одно распространенное применение - пройти тесты на ЭМС, сглаживая одиночные частотные пики.
Другой тип временного сглаживания недавно был введен на финансовых рынках, чтобы снизить стимул к участию в высокочастотная торговля. ParFX, лондонский валютный рынок , торгующийся в 2013 году, накладывает короткие случайные задержки на все поступающие ордера; Сообщается, что другие валютные биржи экспериментируют с этой техникой. Использование такой временной буферизации или сглаживания более широко пропагандируется в финансовой торговле акциями, товарами и производными инструментами.
Другие хорошо написанные статьи по этой теме на более элементарном уровне доступны:
Книги с гораздо более подробными объяснениями:
Подробнее Недавнее исследование в области дизеринга для звука было проведено Липшицем, Вандеркуем и Ваннамакером в Университете Ватерлоо :