Фазовый вокодер

редактировать

A Фазовый вокодер - это тип вокодера, который может масштабировать как частота и временные области аудиосигналов с использованием информации фазы. Компьютерный алгоритм допускает модификации в частотной области цифрового звукового файла (обычно временное расширение / сжатие и сдвиг высоты тона ).

В основе фазового вокодера лежит кратковременное преобразование Фурье (STFT), обычно кодируемое с помощью быстрых преобразований Фурье. STFT преобразует представление звука во временной области в частотно-временное представление (фаза «анализа»), позволяя изменять амплитуды или фазы определенных частотных компонентов звука, перед повторным синтезом представления частотно-временной области во временную область с помощью обратного STFT. Временная эволюция повторно синтезированного звука может быть изменена посредством изменения временного положения кадров STFT перед операцией ресинтеза, что позволяет изменять масштаб времени исходного звукового файла.

Содержание

1 Проблема согласованности фаз
2 История
3 Использование в музыке
4 См. Также
5 Ссылки
6 Внешние ссылки

Проблема согласованности фаз

Основная проблема, которая должна быть решена для всех случаев манипулирования STFT, заключается в том, что отдельные компоненты сигнала (синусоиды, импульсы) будут распределены по множеству кадров и множеству местоположений частот STFT (бинов). Это связано с тем, что анализ STFT выполняется с использованием перекрывающихся окон анализа. Работа с окнами приводит к утечке спектра, так что информация об отдельных синусоидальных компонентах распространяется по соседним бинам STFT. Чтобы избежать граничных эффектов сужения окон анализа, окна анализа STFT перекрываются во времени. Это временное перекрытие приводит к тому, что смежные анализы STFT сильно коррелированы (синусоида, присутствующая в кадре анализа в момент времени «t», будет присутствовать и в последующих кадрах). Проблема преобразования сигнала с помощью фазового вокодера связана с проблемой, заключающейся в том, что все модификации, которые выполняются в представлении STFT, должны сохранять соответствующую корреляцию между соседними частотными элементами (вертикальная когерентность) и временными кадрами (горизонтальная когерентность). За исключением случая чрезвычайно простых синтетических звуков, эти соответствующие корреляции могут быть сохранены только приблизительно, и, поскольку изобретение фазового вокодера было в основном связано с поиском алгоритмов, которые сохраняли бы вертикальную и горизонтальную когерентность представления STFT после модификации.. Проблема фазовой когерентности исследовалась довольно долго, прежде чем были найдены подходящие решения.

История

Фазовый вокодер был представлен в 1966 году Фланаганом как алгоритм, который сохранял бы горизонтальную когерентность между фазами бинов, которые представляют синусоидальные компоненты. Этот исходный фазовый вокодер не принимал во внимание вертикальную когерентность между соседними частотными элементами, и, следовательно, временное растяжение с помощью этой системы действительно производило звуковые сигналы, которым не хватало четкости.

Оптимальное восстановление звукового сигнала из STFT после модификаций амплитуды было предложено Гриффином и Лим в 1984 году. Этот алгоритм не рассматривает проблему создания когерентного STFT, но он позволяет найти звуковой сигнал, который имеет STFT, который максимально приближен к модифицированному STFT, даже если модифицированный STFT некогерентен (не представляет никакого сигнала).

Проблема вертикальной когерентности оставалась главной проблемой для качества операций масштабирования по времени до 1999 года, когда Ларош и Долсон предложили средства для сохранения согласованности фазы по спектральным ячейкам. Предложение Лароша и Долсона следует рассматривать как поворотный момент в истории фазового вокодера. Было показано, что посредством обеспечения вертикальной фазовой согласованности могут быть получены преобразования масштабирования по времени очень высокого качества.

Алгоритм, предложенный Ларошем, не позволял сохранять вертикальную фазовую когерентность для звуковых начал (обратите внимание). Решение этой проблемы было предложено Робелом.

Примером программной реализации преобразования сигнала на основе фазового вокодера с использованием средств, аналогичных описанным здесь, для достижения высококачественного преобразования сигнала является Ircam ' s SuperVP.

Использование в музыке

Британский композитор Тревор Уишарт использовал анализ фазового вокодера и преобразования человеческого голоса в качестве основы для своей композиции Vox 5 (часть его больше Vox Cycle ). американского композитора Роджер Рейнольдс использует фазовый вокодер для растягивания звуков флейты во времени. В музыке Джоанн Кучера-Морин используются некоторые из первых и наиболее широко используемых преобразований фазового вокодера, например, в Dreampaths (1989).

Запатентованная Auto-Tune Программное обеспечение коррекции высоты тона, широко используемое в коммерческом производстве музыки, основано на принципе фазового вокодера.

См. Также

Ссылки

Внешние ссылки

Викибук Программирование MATLAB имеет страницу по теме: Фазовый вокодер и кодировщик

Фазовый вокодер: Учебное пособие - Хорошее описание фазового вокодера
Новые методы фазового вокодера для изменения высоты звука, гармонизации и других экзотических эффектов
Новый подход к переходной обработке в фазовом вокодере
Фазовый вокодер - Описание фазового вокодера с цифрами и уравнениями