Акустический отпечаток пальца

редактировать

Сжатая цифровая сводка, генерируемая из аудиосигнала

акустический отпечаток пальца- это сжатое цифровое резюме, отпечаток пальца, детерминированно, сгенерированный из аудиосигнал, который можно использовать для идентификации аудиовыборки или быстрого поиска аналогичных элементов в базе аудиоданных.

Практическое использование акустического дактилоскопирования включает идентификацию песен, мелодии, мелодии или реклама ; звуковой эффект управление библиотекой; и видеофайл идентификация. Идентификация носителя с помощью акустических отпечатков пальцев может использоваться для отслеживания использования определенных музыкальных произведений и выступлений на радиопередаче, записях, компакт-дисках, потоковых медиа и одноранговые сети. Этот идентификатор использовался в схемах соблюдения авторских прав, лицензирования и других схем монетизации.

Содержание

1 Атрибуты
2 Спектрограмма
3 Shazam
4 См. Также
5 Ссылки
6 Внешние ссылки

Атрибуты

Надежный акустический отпечаток Алгоритм должен учитывать характеристики восприятия аудио. Если два файла звучат одинаково для человеческого уха, их акустические отпечатки пальцев должны совпадать, даже если их двоичное представление сильно различается. Акустические отпечатки пальцев не являются хэш-функциями , которые должны быть чувствительны к любым небольшим изменениям данных. Акустические отпечатки пальцев больше похожи на отпечатки пальцев человека, где допускаются небольшие вариации, несущественные для функций, используемых отпечатком пальца. Можно представить себе случай смазанного отпечатка пальца человека, который можно точно сопоставить с другим образцом отпечатка пальца в эталонной базе данных; акустические отпечатки пальцев работают аналогичным образом.

Характеристики восприятия, часто используемые звуковыми отпечатками пальцев, включают среднюю скорость пересечения нуля, расчетный темп, средний спектр, спектральную однородность, отчетливые тона в наборе полос частот и полосы пропускания.

Большинство методов сжатия звука вносят радикальные изменения в двоичное кодирование аудиофайла без радикальных изменений. влияя на то, как это воспринимается человеческим ухом. Надежный акустический отпечаток пальца позволит идентифицировать запись после того, как она прошла такое сжатие, даже если качество звука значительно снизилось. Для использования в мониторинге радиопередачи акустические отпечатки пальцев также должны быть нечувствительны к артефактам аналоговой передачи.

Спектрограмма

Создание сигнатуры из аудио важно для поиска по звуку. Один из распространенных методов - это создание частотно-временного графика, называемого спектрограммой.

. Любой фрагмент звука может быть преобразован в спектрограмму. Каждый фрагмент звука со временем разбивается на несколько сегментов. В некоторых случаях смежные сегменты имеют общую временную границу, в других случаях смежные сегменты могут перекрываться. Результатом является график, который отображает три измерения звука: частота против амплитуды (интенсивности) против времени.

Shazam

Алгоритм Shazam выделяет точки, в которых есть пики на спектрограмме, которые представляют более высокое содержание энергии. Сосредоточение внимания на пиках звука значительно снижает влияние фонового шума на идентификацию звука. Shazam создает свой каталог отпечатков пальцев в виде хэш-таблицы , где ключом является частота. Они не просто отмечают одну точку на спектрограмме, а скорее отмечают пару точек: пиковую интенсивность плюс вторую точку привязки. Таким образом, их ключ базы данных - это не просто одна частота, это хэш частот обеих точек. Это приводит к меньшему количеству хэш-коллизий, что повышает производительность хэш-таблицы.

См. Также

Ссылки

Внешние ссылки