Преобразование постоянной Q

редактировать

В математике и обработке сигналов преобразование постоянной Q преобразует ряд данных в частотную область. Это связано с преобразованием Фурье и очень тесно связано со сложным вейвлет-преобразованием Морле.

Преобразование можно рассматривать как серию фильтров f k, логарифмически разнесенные по частоте, с k-м фильтром, имеющим спектральную ширину δfk, равную кратной ширине предыдущего фильтра:

δ fk = 2 1 / n ⋅ δ fk - 1 знак равно (2 1 / N) К ⋅ δ е мин, {\ Displaystyle {\ begin {выровнено} \ delta f_ {k} = 2 ^ {1 / n} \ cdot \ delta f_ {k-1} \ \ = \ left (2 ^ {1 / n} \ right) ^ {k} \ cdot \ delta f _ {\ text {min}}, \ end {align}}}

{\ displaystyle {\ begin {align} \ delta f_ {k} = 2 ^ {1 / n} \ cdot \ delta f_ {k-1} \\ = \ left (2 ^ {1 / n} \ right) ^ {k} \ cdot \ delta f _ {\ text {min}}, \ end {выровнено }}}

где δf k - полоса пропускания k-го фильтра, f min - центральная частота самого нижнего фильтра, а n - количество фильтров на октаву.

Содержание

1 Расчет
2 Быстрое вычисление
3 Сравнение с преобразованием Фурье
4 Ссылки

Расчет

Кратковременное преобразование Фурье x [n] для кадра сдвинутое на выборку m вычисляется следующим образом:

X [k, m] = ∑ n = 0 N - 1 W [n - m] x [n] e - j 2 π k n / N. {\ displaystyle X [k, m] = \ sum _ {n = 0} ^ {N-1} W [nm] x [n] e ^ {- j2 \ pi kn / N}.}

{\ displaystyle X [k, m] = \ sum _ {n = 0} ^ {N-1} W [nm] x [n] e ^ {- j2 \ pi kn / N}.}

Дано ряд данных, выбранных при f s = 1 / T, T - период выборки наших данных, для каждого частотного бина мы можем определить следующее:

Ширина фильтра, δf k.
Q, " добротность »:

Q = fk δ fk. {\ displaystyle Q = {\ frac {f_ {k}} {\ delta f_ {k}}}.}

{\ displaystyle Q = {\ frac {f_ {k} } {\ delta f_ {k}}}.}

Это показано ниже как целое число циклов, обработанных на центральной частоте f k. По сути, это в некоторой степени определяет временную сложность преобразования.

Длина окна для k-го бина:

N [k] = f s δ f k = f s f k Q. {\ displaystyle N [k] = {\ frac {f _ {\ text {s}}} {\ delta f_ {k}}} = {\ frac {f _ {\ text {s}}} {f_ {k}} } Q.}

{\ displaystyle N [k] = {\ frac {f _ {\ text {s}}} {\ delta f_ {k}}} = { \ frac {f _ {\ text {s}}} {f_ {k}}} Q.}

Так как f s/fk- это количество выборок, обрабатываемых за цикл на частоте f k, Q - это количество целочисленных циклов, обрабатываемых на этой центральной частоте.

Эквивалентное преобразование ядро можно найти с помощью следующих замен:

Длина окна каждого бина теперь является функцией номера бина:

N = N [k] = Q fsfk. {\ displaystyle N = N [k] = Q {\ frac {f _ {\ text {s}}} {f_ {k}}}.}

{\ displaystyle N = N [k] = Q {\ frac {е _ {\ текст {s}}} {f_ {k}}}.}

Относительная мощность каждого интервала будет уменьшаться на более высоких частотах, так как эти сумма за меньшее количество сроков. Чтобы компенсировать это, мы нормализуем на N [k].
Любая оконная функция будет функцией длины окна, а также функцией номера окна. Например, эквивалентное окно Хэмминга будет

W [k, n] = α - (1 - α) cos cos 2 π n N [k] - 1, α = 25/46, 0 ⩽ n ⩽ N [k] - 1. {\ displaystyle W [k, n] = \ alpha - (1- \ alpha) \ cos {\ frac {2 \ pi n} {N [k] -1}}, \ quad \ alpha = 25/46, \ quad 0 \ leqslant n \ leqslant N [k] -1.}

{\ displaystyle W [k, n] = \ alpha - (1- \ alpha) \ cos {\ frac {2 \ pi n} {N [k] -1}}, \ quad \ alpha = 25/46, \ quad 0 \ leqslant n \ leqslant N [k] -1.}

Наша цифровая частота, $2 π k N {\ displaystyle {\ frac {2 \ pi k} {N}}}$ ${\ displaystyle {\ frac {2 \ pi k} {N}}}$ , становится $2 π QN [k] {\ displaystyle {\ frac {2 \ pi Q} {N [k]}}}$ ${\ displaystyle {\ frac {2 \ pi Q} {N [k]}}}$ .

После этих изменений, у нас осталось

X [k] = 1 N [k] ∑ n = 0 N [k] - 1 W [k, n] x [n] e - j 2 π Q n N [k]. {\ displaystyle X [k] = {\ frac {1} {N [k]}} \ sum _ {n = 0} ^ {N [k] -1} W [k, n] x [n] e ^ {\ frac {-j2 \ pi Qn} {N [k]}}.}

{\ displaystyle X [k] = {\ frac {1} {N [k]}} \ sum _ {n = 0} ^ {N [k] -1} W [k, n] x [n] е ^ {\ гидроразрыва {-j2 \ pi Qn} {N [k]}}.}

Быстрое вычисление

Прямое вычисление преобразования постоянного Q выполняется медленно по сравнению с быстрым вычислением Фурье преобразовать (БПФ). Однако само БПФ может использоваться в сочетании с использованием ядра для выполнения эквивалентных вычислений, но намного быстрее. Примерно обратный такой реализации был предложен в 2006 г.; он работает, возвращаясь к ДПФ, и подходит только для инструментов высоты тона.

Развитие этого метода с улучшенной обратимостью включает выполнение CQT (через БПФ) октаву за октавой с использованием низкочастотной фильтрации и субдискретизации результатов для последовательно более низких частот. Реализации этого метода включают реализацию MATLAB и реализацию Python LibROSA. LibROSA сочетает в себе метод субдискретизации с прямым методом БПФ (который она называет «псевдо-CQT») за счет того, что последний обрабатывает более высокие частоты в целом.

Сравнение с преобразованием Фурье

В целом, преобразование хорошо подходит для музыкальных данных, и это можно увидеть в некоторых его преимуществах по сравнению с быстрым преобразованием Фурье. Поскольку выходной сигнал преобразования представляет собой эффективную зависимость амплитуды / фазы от логарифмической частоты, требуется меньше элементов разрешения по частоте для эффективного покрытия заданного диапазона, и это оказывается полезным, когда частоты охватывают несколько октав. Поскольку диапазон человеческого слуха охватывает примерно десять октав от 20 Гц до примерно 20 кГц, такое сокращение выходных данных является значительным.

Преобразование демонстрирует уменьшение разрешения по частоте с увеличением разрешения по частоте, что желательно для слуховых приложений. Преобразование отражает слуховую систему человека, благодаря чему на более низких частотах спектральное разрешение лучше, а временное разрешение улучшается на более высоких частотах. В нижней части шкалы фортепиано (около 30 Гц) разница в 1 полутон составляет разницу примерно в 1,5 Гц, тогда как в верхней части музыкальной шкалы (около 5 кГц) разница в 1 полутон представляет собой разницу примерно в 1 полутон. 200 Гц. Таким образом, для музыкальных данных идеальным является экспоненциальное частотное разрешение преобразования постоянной добротности.

Кроме того, гармоники музыкальных нот образуют образец, характерный для тембра инструмента в этом преобразовании. Предполагая, что относительная сила каждой гармоники одинакова, при изменении основной частоты относительное положение этих гармоник остается постоянным. Это может значительно упростить идентификацию инструментов. Постоянное Q-преобразование также может использоваться для автоматического распознавания музыкальных клавиш на основе накопленного содержимого цветности.

По сравнению с преобразованием Фурье, реализация этого преобразования более сложна. Это связано с различным количеством выборок, используемых при вычислении каждого частотного бина, что также влияет на длину любой реализованной оконной функции.

Также обратите внимание, что, поскольку частотная шкала является логарифмической, истинного нуля не существует. - присутствует термин частота / постоянный ток, который в некоторых случаях может быть недостатком.

Литература

^Джудит К. Браун, Расчет постоянного Q спектрального преобразования, J. Acoust. Soc. Am., 89 (1): 425–434, 1991.
^Непрерывное вейвлет-преобразование «Когда материнский вейвлет можно интерпретировать как оконную синусоиду (например, вейвлет Морле), вейвлет-преобразование можно интерпретировать как преобразование Фурье с постоянной добротностью. До появления теории вейвлетов преобразования Фурье с постоянной добротностью (например, полученные из классического банка фильтров третьей октавы) было нелегко инвертировать, потому что базисные сигналы не были ортогональными ».
^Джудит С. Браун и Миллер С. Пакетт, Эффективный алгоритм для вычисления постоянного Q-преобразования, J. Acoust. Soc. Am., 92 (5): 2698–2701, 1992.
^FitzGerald, Derry; Cychowski, Marcin T.; Крэнитч, Мэтт (1 мая 2006 г.). «К обратному постоянному Q-преобразованию». Конвенция Общества звукорежиссеров. Париж: Общество аудиоинженеров. 120 .
^Шёркхубер, Кристиан; Клапури, Ансси (2010). "ЯЩИК ПРЕОБРАЗОВАТЕЛЯ CONSTANT-Q ДЛЯ ОБРАБОТКИ МУЗЫКИ". 7-я конференция по звуку и музыке. Барселона. Проверено 12 декабря 2018 г. paper
^ McFee, Brian; Баттенберг, Эрик; Лостанлен, Винсент; Томе, Карл (12 декабря 2018 г.). "librosa: core / constantq.py на 8d26423". GitHub. librosa. Проверено 12 декабря 2018 г.
^http://newt.phys.unsw.edu.au/jw/graphics/notes.GIF
^Хендрик Пурвинс, Бенджамин Бланкерц и Клаус Обермайер, Новый метод отслеживания модуляций in Tonal Music in Audio Data Format, International Joint Conference on Neural Network (IJCNN'00)., 6: 270-275, 2000.
^Benjamin Blankertz, The Constant Q Transform, 1999.