Формирование шума - это метод, обычно используемый в цифровом аудио, изображении, и обработка видео, обычно в сочетании с дизерингом, как часть процесса квантования или уменьшения битовой глубины цифрового сигнал. Его цель - увеличить кажущееся отношение сигнал / шум результирующего сигнала. Это достигается путем изменения спектральной формы ошибки, которая вносится дизерингом и квантованием; так что мощность шума находится на более низком уровне в диапазонах частот, в которых шум считается менее желательным, и на соответственно более высоком уровне в диапазонах, где он считается более желательным. Популярный алгоритм формирования шума, используемый при обработке изображений, известен как «дизеринг Флойда Стейнберга »; и многие алгоритмы формирования шума, используемые при обработке звука, основаны на модели «Абсолютный порог слышимости ».
Формирование шума работает путем помещения ошибки квантования в контур обратной связи. Любой контур обратной связи функционирует как фильтр , поэтому, создав контур обратной связи для самой ошибки, ошибку можно отфильтровать по желанию.
Например, рассмотрим систему обратной связи:
где y [n] - значение выходной выборки, которое должно быть квантовано, x [n] - значение входной выборки, n - номер выборки, а e [ n] - ошибка квантования, внесенная в выборке n:
В этой модели, когда битовая глубина любой выборки уменьшается, ошибка квантования между квантованным значением и исходное значение измеряется и сохраняется. Это «значение ошибки» затем повторно добавляется в следующую выборку перед ее квантованием. Эффект заключается в том, что ошибка квантования фильтруется нижними частотами с помощью прямоугольного фильтра с двумя отсчетами (также известного как усредняющий фильтр ). В результате, по сравнению с предыдущим, ошибка квантования имеет меньшую мощность на более высоких частотах и более высокую мощность на более низких частотах.
Обратите внимание, что мы можем настроить частоту среза фильтра, изменив пропорцию, b, ошибки из предыдущего образца, который возвращается:
В общем, любой FIR-фильтр или IIR-фильтр может использоваться для создания более сложной кривой частотной характеристики. Такие фильтры могут быть разработаны с использованием метода взвешенных наименьших квадратов. В случае цифрового звука обычно используется весовая функция, деленная на абсолютный порог кривой слуха, то есть
Формирование шума также всегда должно включать соответствующее количество дизеринга внутри самого процесса, чтобы чтобы предотвратить обнаруживаемые и коррелированные ошибки самого сигнала. Если дизеринг не используется, то формирование шума эффективно работает просто как формирование искажения - перемещая энергию искажения в разные полосы частот, но это все равно искажение. Если дизеринг добавлен к процессу как
тогда ошибка квантования действительно становится шумом, и процесс действительно дает формирование шума.
синусоидальный тон 750 Гц, дискретизированный с частотой 48 кГц и квантованный до 4 бит без дизеринга и формирования шума. Этот процесс вводит периодическую ошибку округления с периодом 64 отсчетов, которую можно увидеть в частотной области как гармоники, которые достигают -40 дБ относительно эталонного тона.
Тот же чистый тон с треугольником дизерингом, но без формирования шума. Обратите внимание, что общая мощность шума увеличилась, но ни одна из частот не достигает значений выше −60 дБ.
Тот же чистый тон с треугольным дизерингом и формированием шума. Обратите внимание, что шум самый низкий (-80 дБ) около 4 кГц, где ухо наиболее чувствительно.
Формирование шума в аудио чаще всего применяется как схема уменьшения битов. Самая основная форма дизеринга - это плоский белый шум. Однако ухо менее чувствительно к определенным частотам, чем к другим на низких уровнях (см. кривые Флетчера-Мансона ). Используя формирование шума, ошибка квантования может быть эффективно распределена, так что большая ее часть сосредоточена на частотах, которые также нельзя услышать, и меньше - на частотах, которые могут. В результате там, где ухо наиболее критично, ошибка квантования может быть значительно уменьшена, а там, где уши менее чувствительны, шум намного больше. Это может дать снижение воспринимаемого шума на 4 бита по сравнению с прямым дизерингом. Хотя обычно считается, что 16-битный звук имеет динамический диапазон 96 дБ (см. расчеты искажения квантования ), на самом деле его можно увеличить до 120 дБ с помощью шумового дизеринга.
Примерно с 1989 года 1-битные дельта-сигма модуляторы использовались в аналого-цифровых преобразователях. Это включает дискретизацию звука с очень высокой частотой (например, 2,8224 миллиона выборок в секунду ), но с использованием только одного бита. Поскольку используется только 1 бит, этот преобразователь имеет только 6,02 дБ динамического диапазона. Однако минимальный уровень шума распространяется по всему "допустимому" диапазону частот ниже частоты Найквиста 1,4112 МГц. Формирование шума используется для снижения шума, присутствующего в слышимом диапазоне (от 20 Гц до 20 кГц), и увеличения шума выше слышимого диапазона. Это приводит к широкополосному динамическому диапазону всего 7,78 дБ, но он не согласуется между полосами частот, а на самых низких частотах (слышимый диапазон) динамический диапазон намного больше - более 100 дБ. Формирование шума встроено в модуляторы дельта-сигма.
1-битный преобразователь является основой формата DSD от Sony. Одна критика 1-битного преобразователя (и, следовательно, системы DSD) заключается в том, что, поскольку только 1 бит используется как в сигнале, так и в контуре обратной связи, адекватное количество дизеринга не может использоваться в контуре обратной связи, и при некоторых условиях можно услышать искажения. В большинстве аналого-цифровых преобразователей, выпущенных с 2000 года, используются многобитовые или многоуровневые дельта-сигма-модуляторы, которые выдают более 1 бит на выходе, так что в контур обратной связи можно добавить правильный дизеринг. Для традиционной выборки PCM сигнал затем прореживается до 44,1 кГц или другой подходящей частоты дискретизации.
Analog Devices использует то, что они называют «Рекантизатор формирования шума», а Texas Instruments использует то, что они называют «SNRBoost», для снижения минимальный уровень шума примерно 30 дБ по сравнению с окружающими частотами. Это достигается за счет прерывистой работы, но дает ванну красивой формы для пола спектра. Это можно комбинировать с другими методами, такими как Bit-Boost, для дальнейшего повышения разрешения Spectrum.
Texas Instruments объясняет "SNRBoost" в этих документах Использование окон с технологией SNRBoost3G (PDF) и Понимание низкоамплитудного поведения 11-битных АЦП (PDF), в то время как Analog Devices объясняет свой «Реквантизатор шума» в этом документе AD6677 ПЧ-приемник с полосой пропускания 80 МГц (на стр. 23).