В математике и обработке сигналов преобразование постоянной Q преобразует ряд данных в частотную область. Это связано с преобразованием Фурье и очень тесно связано со сложным вейвлет-преобразованием Морле.
Преобразование можно рассматривать как серию фильтров f k, логарифмически разнесенные по частоте, с k-м фильтром, имеющим спектральную ширину δfk, равную кратной ширине предыдущего фильтра:
где δf k - полоса пропускания k-го фильтра, f min - центральная частота самого нижнего фильтра, а n - количество фильтров на октаву.
Кратковременное преобразование Фурье x [n] для кадра сдвинутое на выборку m вычисляется следующим образом:
Дано ряд данных, выбранных при f s = 1 / T, T - период выборки наших данных, для каждого частотного бина мы можем определить следующее:
Эквивалентное преобразование ядро можно найти с помощью следующих замен:
После этих изменений, у нас осталось
Прямое вычисление преобразования постоянного Q выполняется медленно по сравнению с быстрым вычислением Фурье преобразовать (БПФ). Однако само БПФ может использоваться в сочетании с использованием ядра для выполнения эквивалентных вычислений, но намного быстрее. Примерно обратный такой реализации был предложен в 2006 г.; он работает, возвращаясь к ДПФ, и подходит только для инструментов высоты тона.
Развитие этого метода с улучшенной обратимостью включает выполнение CQT (через БПФ) октаву за октавой с использованием низкочастотной фильтрации и субдискретизации результатов для последовательно более низких частот. Реализации этого метода включают реализацию MATLAB и реализацию Python LibROSA. LibROSA сочетает в себе метод субдискретизации с прямым методом БПФ (который она называет «псевдо-CQT») за счет того, что последний обрабатывает более высокие частоты в целом.
В целом, преобразование хорошо подходит для музыкальных данных, и это можно увидеть в некоторых его преимуществах по сравнению с быстрым преобразованием Фурье. Поскольку выходной сигнал преобразования представляет собой эффективную зависимость амплитуды / фазы от логарифмической частоты, требуется меньше элементов разрешения по частоте для эффективного покрытия заданного диапазона, и это оказывается полезным, когда частоты охватывают несколько октав. Поскольку диапазон человеческого слуха охватывает примерно десять октав от 20 Гц до примерно 20 кГц, такое сокращение выходных данных является значительным.
Преобразование демонстрирует уменьшение разрешения по частоте с увеличением разрешения по частоте, что желательно для слуховых приложений. Преобразование отражает слуховую систему человека, благодаря чему на более низких частотах спектральное разрешение лучше, а временное разрешение улучшается на более высоких частотах. В нижней части шкалы фортепиано (около 30 Гц) разница в 1 полутон составляет разницу примерно в 1,5 Гц, тогда как в верхней части музыкальной шкалы (около 5 кГц) разница в 1 полутон представляет собой разницу примерно в 1 полутон. 200 Гц. Таким образом, для музыкальных данных идеальным является экспоненциальное частотное разрешение преобразования постоянной добротности.
Кроме того, гармоники музыкальных нот образуют образец, характерный для тембра инструмента в этом преобразовании. Предполагая, что относительная сила каждой гармоники одинакова, при изменении основной частоты относительное положение этих гармоник остается постоянным. Это может значительно упростить идентификацию инструментов. Постоянное Q-преобразование также может использоваться для автоматического распознавания музыкальных клавиш на основе накопленного содержимого цветности.
По сравнению с преобразованием Фурье, реализация этого преобразования более сложна. Это связано с различным количеством выборок, используемых при вычислении каждого частотного бина, что также влияет на длину любой реализованной оконной функции.
Также обратите внимание, что, поскольку частотная шкала является логарифмической, истинного нуля не существует. - присутствует термин частота / постоянный ток, который в некоторых случаях может быть недостатком.