Профили классов гармонического тона

редактировать

Профили классов гармонического тона (HPCP ) - это группа характеристик, которые компьютерная программа извлекает из аудиосигнала на основе на профиле класса высоты звука - дескриптор, предложенный в контексте системы распознавания аккордов. HPCP - это улучшенная функция распределения основного тона, представляющая собой последовательности векторов признаков, которые в определенной степени описывают тональность, измеряя относительную интенсивность каждого из 12 классов высоты звука равномерного шкалы в кадре анализа.. Часто двенадцать атрибутов написания высоты тона также упоминаются как цветность, а функции HPCP тесно связаны с тем, что называется функциями цветности или хроматограммами.

Обрабатывая музыкальные сигналы, программное обеспечение может идентифицировать функции HPCP и использовать их для оценки тональности пьесы, для измерения сходства между двумя музыкальными пьесами (идентификация кавер-версии), для выполнения поиска аудио на основе содержимого (сопоставление звука), для извлечения музыкальная структура (анализ звуковой структуры) и классифицировать музыку с точки зрения композитора, жанра или настроения. Процесс связан с частотно-временным анализом. В целом, характеристики цветности устойчивы к шуму (например, окружающему шуму или перкуссионным звукам), независимо от тембра и инструментовки, а также от громкости и динамики.

HPCP не зависят от настройки и учитывают наличие гармонических частот, поэтому опорная частота может отличаться от стандартной A 440 Гц. Результатом вычисления HPCP является независимая от октавы гистограмма с 12, 24 или 36 ячейками, в зависимости от желаемого разрешения, представляющая относительную интенсивность каждой 1, 1/2 или 1/3 из 12 полутонов равномерного темперированного строя.

Содержание
  • 1 Общая процедура извлечения функций HPCP
  • 2 Система измерения сходства между двумя песнями
  • 3 См. Также
  • 4 Ссылки
  • 5 Внешние ссылки
Общая процедура извлечения функций HPCP
Рис.1 Блок-схема выделения общих характеристик HPCP

Блок-схема процедуры показана на Рис.1 и подробно описана в.

Процедура выделения общих характеристик HPCP Резюмируется следующим образом:

  1. Входной музыкальный сигнал.
  2. Выполните спектральный анализ, чтобы получить частотные компоненты музыкального сигнала.
  3. Используйте Преобразование Фурье для преобразования сигнала в спектрограмму. (Преобразование Фурье - это тип частотно-временного анализа.)
  4. Do частотной фильтрации. Используется частотный диапазон от 100 до 5000 Гц.
  5. Do обнаружение пиков . только локальные значения максимума спектра рассматриваются.
  6. Do опорной частоты вычисления процедура. Оценить отклонение по отношению к 440 Гц.
  7. Do шаг классов отображения по отношению к расчетной опорной частоте. Это процедура для определения значения класса основного тона от значений частот. схема весовой с косинусной функцией. Он учитывает наличие гармонических частот (процедура суммирования гармоник), принимая во внимание всего 8 гармоник для каждой частоты. Чтобы отобразить значение на одной трети полутона , размер векторов распределения классов основного тона должен быть равен 36.
  8. Нормализовать особый кадр за кадром с делением на максимальное значение, чтобы исключить зависимость от глобальной громкости. И тогда мы можем получить Полученная последовательность HPCP, как на рис.2.
Рис.2 Пример последовательности HPCP с высоким разрешением
Система измерения сходства между двумя песнями
Рис.3 Система измерения сходства между двумя песнями

После получения функция HPCP, высота сигнала во временном разрезе известна. Функция HPCP использовалась для вычисления сходства между двумя песнями во многих исследовательских работах. Система измерения сходства между двумя песнями показана на фиг.3 . Во-первых, для извлечения функции HPCP необходим частотно-временной анализ . А затем установите функцию HPCP для двух песен в глобальную HPCP, так что есть стандарт сравнения. Следующим шагом является использование этих двух функций для построения бинарной матрицы подобия. . Алгоритм Смита – Уотермана используется для построения локальной матрицы выравнивания H в Dynamic Programming Local Alignment . Наконец, после выполнения постобработки можно вычислить расстояние между двумя песнями.

См. Также
Ссылки
Внешние ссылки
  • HPCP - плагин Harmonic Pitch Class Profile, доступный для загрузки http://mtg.upf.edu/technologies/hpcp
  • Chroma Toolbox Бесплатная реализация MATLAB различных типов цветности на основе высоты тона и цветности. на основе звуковых функций
Последняя правка сделана 2021-05-22 13:53:14
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте