Ambisonics

редактировать

Ambisonics, бывшая торговая марка

Ambisonics - это полносферный формат объемного звука : в дополнение к в горизонтальной плоскости он охватывает источники звука выше и ниже слушателя.

В отличие от других форматов многоканального объемного звучания, его каналы передачи не передают сигналы динамиков. Вместо этого они содержат независимое от динамика представление звукового поля, называемое B-форматом, которое затем декодируется в настройках динамика слушателя. Этот дополнительный шаг позволяет производителю думать о направлениях источников, а не о позициях громкоговорителей, и предлагает слушателю значительную степень гибкости в отношении компоновки и количества громкоговорителей, используемых для воспроизведения.

Ambisonics была разработана в Великобритании в 1970-х годах под эгидой Британской Национальной корпорации развития исследований.

Несмотря на прочную техническую основу и множество преимуществ, Ambisonics до недавнего времени не имела коммерческого успеха. и выжил только в нишевых приложениях и среди энтузиастов звукозаписи.

Благодаря легкой доступности мощной цифровой обработки сигналов (в отличие от дорогих и подверженных ошибкам аналоговых схем, которые приходилось использовать в первые годы) и успешному внедрению на рынок систем объемного звука для домашних кинотеатров с момента В 1990-е годы интерес к Ambisonics среди звукорежиссеров, звукорежиссеров, композиторов, медиа-компаний, вещателей и исследователей вернулся и продолжает расти.

Содержание
  • 1 Введение
    • 1.1 Панорамирование источника
    • 1.2 Виртуальные микрофоны
    • 1.3 Декодирование
    • 1.4 Ambisonics более высокого порядка
    • 1.5 Сравнение с другими форматами объемного звука
  • 2 Теоретические основы
    • 2.1 Анализ звукового поля (кодирование)
    • 2.2 Психоакустика
      • 2.2.1 Низкочастотная локализация
      • 2.2.2 Высокочастотная локализация
      • 2.2.3 Воспроизведение ITD и ILD в Ambisonics
    • 2.3 Синтез звукового поля (декодирование)
  • 3 Совместимость с существующими каналами распространения
    • 3.1 Стерео
    • 3.2 Многоканальные форматы
  • 4 Производственный процесс
    • 4.1 Амбисонические микрофоны
      • 4.1.1 Массивы в собственном B-формате
      • 4.1.2 Тетраэдрический микрофон
      • 4.1.3 Микрофоны более высокого порядка
    • 4.2 Амбизонное панорамирование
    • 4.3 Амбисонное управление
    • 4.4 Обмен данными
  • 5 Текущие разработки
    • 5.1 Открытый исходный код
    • 5.2 Корпоративный интерес
    • 5.3 Использование в играх
  • 6 Патенты и торговые марки
  • 7 См. Также
  • 8 Примечания
  • 9 Ссылки
  • 10 Внешние ссылки
Введение

Ambison ics можно понимать как трехмерное расширение M / S (mid / side) стерео, добавляющее дополнительные каналы разницы для высоты и глубины. Результирующий набор сигналов называется B-форматом. Его составляющие каналы обозначены W {\ displaystyle W}W для звукового давления (M в M / S), X {\ displaystyle X}Икс для градиент звукового давления спереди-минус-сзади, Y {\ displaystyle Y}Y для слева-минус-справа (S в M / S) и Z {\ displaystyle Z}Z для движения вверх-минус-вниз.

Сигнал W {\ displaystyle W}W соответствует всенаправленному микрофону, тогда как XYZ {\ displaystyle XYZ}XYZ- это компоненты, которые могут быть захвачены капсулами в форме восьмерки, ориентированными вдоль трех пространственных осей.

Панорамирование источника

Простое устройство панорамирования Ambisonic (или кодировщик) принимает сигнал источника S {\ displaystyle S}S и два параметра, горизонтальный угол θ {\ displaystyle \ theta}\ theta и угол возвышения ϕ {\ displaystyle \ phi}\ phi . Он позиционирует источник под нужным углом, распределяя сигнал по компонентам Ambisonic с разным усилением:

W = S ⋅ 1 2 {\ displaystyle W = S \ cdot {\ frac {1} {\ sqrt {2}} }}W = S \ cdot {\ frac {1} {{\ sqrt {2}}}}
Икс = S ⋅ соз ⁡ θ соз ⁡ ϕ {\ displaystyle X = S \ cdot \ cos \ theta \ cos \ phi}X = S \ cdot \ cos \ theta \ cos \ phi
Y = S ⋅ sin ⁡ θ cos ⁡ ϕ {\ displaystyle Y = S \ cdot \ sin \ theta \ cos \ phi}Y = S \ cdot \ sin \ theta \ cos \ phi
Z = S ⋅ sin ⁡ ϕ {\ displaystyle Z = S \ cdot \ sin \ phi}Z = S \ cdot \ sin \ phi

Всенаправленный, W {\ displaystyle W }W канал всегда получает один и тот же постоянный входной сигнал, независимо от углов. Таким образом, его средняя энергия примерно такая же, как и у других каналов, W ослабляется примерно на 3 дБ (точнее, делится на квадратный корень из двух). Термины для X Y Z {\ displaystyle XYZ}XYZфактически создают диаграмму направленности микрофонов в форме восьмерки (см. Иллюстрацию справа, второй ряд). Мы берем их значение в θ {\ displaystyle \ theta}\ theta и ϕ {\ displaystyle \ phi}\ phi и умножаем результат на входной сигнал. В результате входной сигнал во всех компонентах становится ровно настолько громким, насколько его мог бы уловить соответствующий микрофон.

Виртуальные микрофоны

Морфинг между различными шаблонами виртуальных микрофонов.

Компоненты B-формата могут быть объединены для получения виртуальных микрофонов с любой диаграммой направленности первого порядка (всенаправленный, кардиоидный, гиперкардиоидная, восьмерка или что-то среднее), указывающая в любом направлении. Одновременно можно создать несколько таких микрофонов с разными параметрами для создания совпадающих стереопар (например, Blumlein ) или массивов объемного звучания.

p {\ displaystyle p}p Pattern
0 {\ displaystyle 0}{\ displaystyle 0} восьмерка
(0, 0,5) {\ displaystyle (0,0.5)}{\ displaystyle (0,0.5)} Гипер- и суперкардиоиды
0,5 {\ displaystyle 0,5}0,5 Кардиоид
(0,5, 1,0) {\ displaystyle (0,5,1.0)}{\ displaystyle (0.5,1.0)} Широкие кардиоиды
1,0 {\ displaystyle 1.0}1.0 Всенаправленный

горизонтальный виртуальный микрофон под горизонтальным углом >{\ displaystyle \ Theta}\ Theta с шаблоном 0 ≤ p ≤ 1 {\ displaystyle 0 \ leq p \ leq 1}0 \ leq p \ leq 1 определяется выражением

M (Θ, p) = p 2 W + (1 - p) (cos ⁡ Θ X + sin ⁡ Θ Y) {\ displaystyle M (\ Theta, p) = p {\ sqrt {2}} W + (1-p) (\ cos \ Theta X + \ sin \ Theta Y)}M (\ Theta, p) = p {\ sqrt {2}} W + (1-p) (\ cos \ Theta X + \ sin \ Theta Y) .

Этот виртуальный микрофон нормализован по свободному полю, что означает, что он имеет постоянное усиление, равное единице для включения звуки оси. На иллюстрации слева показаны некоторые примеры, созданные с помощью этой формулы.

Виртуальными микрофонами можно управлять на этапе пост-продакшн: можно выделить желаемые звуки, подавить нежелательные, а также настроить баланс между прямым и реверберирующим звуком во время микширования.

Декодирование

Простой однодиапазонный синфазный декодер для квадратной схемы громкоговорителей.

Базовый декодер Ambisonic очень похож на набор виртуальных микрофонов. Для идеально регулярных схем можно сгенерировать упрощенный декодер, направив виртуальный кардиоидный микрофон в направлении каждого динамика. Вот квадрат:

LF = (2 W + X + Y) 8 {\ displaystyle LF = ({\ sqrt {2}} W + X + Y) {\ sqrt {8}}}{\ displaystyle LF = ({\ sqrt {2}} W + X + Y) {\ sqrt {8}}}
LB Знак равно (2 W - X + Y) 8 {\ displaystyle LB = ({\ sqrt {2}} W-X + Y) {\ sqrt {8}}}{\ displaystyle LB = ({\ sqrt {2}} W-X + Y) {\ sqrt {8}}}
RB = (2 W - X - Y) 8 {\ displaystyle RB = ({\ sqrt {2}} WXY) {\ sqrt {8}}}{\ di splaystyle RB = ({\ sqrt {2}} WXY) {\ sqrt {8}}}
RF = (2 W + X - Y) 8 {\ displaystyle RF = ({\ sqrt {2}) } W + XY) {\ sqrt {8}}}{\ displaystyle RF = ({\ sqrt {2}} W + XY) {\ sqrt {8}}}

Знаки X {\ displaystyle X}Икс и Y {\ displaystyle Y}Y Компоненты - важная часть, остальное - факторы усиления. Компонент Z {\ displaystyle Z}Z отбрасывается, поскольку невозможно воспроизвести реплики высоты с помощью всего четырех громкоговорителей в одной плоскости.

На практике настоящий Ambisonic декодер требует ряда психоакустических оптимизаций для правильной работы.

Ambisonics высшего порядка

Визуальное представление компонентов Ambisonic B-формата до трети заказ. Темные участки представляют собой области с обратной полярностью. Обратите внимание, как первые две строки соответствуют ненаправленным диаграммам направленности и диаграммам направленности микрофона в форме восьмерки.

Пространственное разрешение амбисоники первого порядка, как описано выше, довольно низкое. На практике это приводит к слегка размытым источникам, но также и к сравнительно небольшой полезной зоне прослушивания или зоне наилучшего восприятия. Разрешение может быть увеличено, а зона наилучшего восприятия может быть увеличена путем добавления групп более избирательных направленных компонентов в B-формат. Они больше не соответствуют диаграммам направленности обычных микрофонов, а выглядят как листья клевера. Результирующий набор сигналов затем называется вторым, третьим или в совокупности амбисоникой более высокого порядка.

Для заданного порядка ℓ {\ displaystyle \ ell}\ ell для полносферных систем требуется (ℓ + 1) 2 {\ displaystyle (\ ell +1) ^ {2}}(\ ell +1) ^ {2} компоненты сигнала и 2 ℓ + 1 {\ displaystyle 2 \ ell +1}2 \ ell +1 компоненты необходимы для воспроизведения только по горизонтали.

Существует несколько различных соглашений о формате для Ambisonics более высокого порядка; подробнее см. Форматы обмена данными Ambisonic.

Сравнение с другими форматами объемного звука

Ambisonics отличается от других форматов объемного звука по ряду аспектов:

  • Это изотропный : звуки с любого направления обрабатываются одинаково, в отличие от предположения, что основные источники звука являются фронтальными, а задние каналы предназначены только для окружения или специальных эффектов.
  • Требуется только три канала для базового горизонтального объемного звука и четыре канала для полноценного звукового поля. Для базового полносферного воспроизведения требуется минимум шесть динамиков (минимум четыре для горизонтального).
  • Сигнал Ambisonics отделен от системы воспроизведения: размещение динамиков является гибким (в разумных пределах), и та же программа материал можно декодировать для различного количества громкоговорителей. Более того, микс ширины и высоты может воспроизводиться только на горизонтальной, стереосистеме или даже на монофонической системе без полной потери контента (он будет свернут в горизонтальную плоскость и во фронтальный квадрант соответственно). Это позволяет производителям использовать производство с большой высотой, не беспокоясь о потере информации.
  • Ambisonics можно масштабировать до любого желаемого пространственного разрешения за счет дополнительных каналов передачи и большего количества динамиков для воспроизведения. Материал более высокого порядка остается совместимым вниз и может воспроизводиться с более низким пространственным разрешением без специального понижающего микширования.
  • Основная технология Ambisonics не защищена патентами, а полная цепочка инструментов для производства и прослушивания доступна как бесплатное программное обеспечение для всех основных операционных систем.

С другой стороны, Ambisonics:

  • склонна к очень нестабильным фантомным источникам и небольшим «сладким пятнам» при воспроизведении через громкоговорители из-за Эффект приоритета.
  • Склонен к сильному окрашиванию из-за артефактов гребенчатой ​​фильтрации из-за временно смещенных когерентных волновых фронтов при воспроизведении через массив громкоговорителей.
  • Не принимается аудиоинженерами, ориентированными на качество, несмотря на бесчисленные попытки и возможные варианты использования с момента его появления в 1970-е годы.
  • Часто продается с вводящими в заблуждение представлениями, которые не соответствуют практическим вариантам использования, например, предполагая строго сферический массив каналов и слушателя, сидящего точно посередине или ограниченного Нанесение графиков волнового поля в крошечный частотный диапазон.
  • Не поддерживается ни одной крупной звукозаписывающей компанией или медиа-компанией. Хотя ряд треков, закодированных в формате Ambisonic UHJ, (UHJ) (в основном классический), может быть обнаружен, если с некоторыми трудностями, на таких сервисах, как Spotify. [1].
  • Концептуально сложно для понимания людьми, в отличие от традиционной парадигмы «один канал, один динамик».
  • Более сложная настройка для потребителя из-за стадии декодирования.
Теоретические основы

Анализ звукового поля (кодирование)

Сигналы B-формата представляют собой усеченное сферическое гармоническое разложение звукового поля. Они соответствуют звуковому давлению W {\ displaystyle W}W и трем компонентам градиента давления XYZ {\ displaystyle XYZ}XYZ(не путать со связанной скоростью частицы ) в точке в пространстве. Вместе они приблизительно соответствуют звуковому полю на сфере вокруг микрофона; формально это усечение первого порядка мультипольного разложения . W {\ displaystyle W}W (моносигнал) - информация нулевого порядка, соответствующая постоянной функции на сфере, а XYZ {\ displaystyle XYZ}XYZ- члены первого порядка (диполи или восьмерки). Это усечение первого порядка является лишь приближением общего звукового поля.

Более высокие порядки соответствуют дополнительным членам мультипольного разложения функции на сфере по сферическим гармоникам. На практике для воспроизведения более высоких порядков требуется больше динамиков, но увеличивается пространственное разрешение и увеличивается область, в которой звуковое поле воспроизводится идеально (до верхней граничной частоты).

Радиус r {\ displaystyle r}r этой области для амбисонического порядка ℓ {\ displaystyle \ ell}\ ell и частоты f {\ displaystyle f}fопределяется как

r ≈ ℓ c 2 π f {\ displaystyle r \ приблизительно {\ frac {\ ell c} {2 \ pi f}}}r \ приблизительно {\ frac {\ ell c} {2 \ pi f}} ,

где c {\ displaystyle c}c обозначает скорость звука.

Эта область становится меньше человеческой головы выше 600 Гц для первого порядка или 1800 Гц для третьего порядка. Для точного воспроизведения в объеме размером с голову до 20 кГц потребуется порядка 32 или более 1000 динамиков.

На тех частотах и ​​позициях прослушивания, где идеальное звуковое поле реконструкция больше невозможно, воспроизведение Ambisonics должно быть сосредоточено на доставке правильных ориентиров, чтобы обеспечить хорошую локализацию даже при наличии ошибок реконструкции.

Психоакустика

Человеческий слуховой аппарат имеет очень четкую локализацию в горизонтальной плоскости (в некоторых экспериментах расстояние между источниками достигает 2 °). Можно выделить два преобладающих сигнала для разных частотных диапазонов:

Низкочастотная локализация

На низких частотах, где длина волны больше по сравнению с человеческой головой, слышен входящий звук дифрагирует вокруг него, так что практически нет акустической тени и, следовательно, нет разницы в уровнях между ушами. В этом диапазоне единственной доступной информацией является фазовое соотношение между двумя ушными сигналами, называемое межуральной разностью времени или ITD. Оценка этой разницы во времени позволяет точно определить местонахождение в пределах конуса замешательства: угол падения однозначен, но ITD одинаков для звуков спереди и сзади. Пока звук не полностью неизвестен субъекту, путаницу обычно можно устранить, заметив тембральные вариации спереди и сзади, вызванные ушными ушками (или ушными раковинами).

Высокочастотная локализация

По мере того, как длина волны приближается к двойному размеру головы, фазовые отношения становятся неоднозначными, поскольку больше неясно, соответствует ли разность фаз между ушами одному, двум, или даже больше периодов по мере увеличения частоты. К счастью, в этом диапазоне голова будет создавать значительную акустическую тень, которая вызывает небольшую разницу в уровне между ушами. Это называется межуральной разницей уровней, или ILD (применяется тот же конус путаницы). В совокупности эти два механизма обеспечивают локализацию во всем диапазоне слышимости.

Воспроизведение ITD и ILD в Ambisonics

Герзон показал, что качество сигналов локализации в воспроизводимом звуковом поле соответствует двум объективным параметрам: длине вектора скорости частицы r V → {\ displaystyle {\ vec {r_ {V}}}}{\ vec {r_ {V}}} для ITD, и длина вектора энергии r E → {\ displaystyle {\ vec {r_ {E}} }}{\ vec {r_ {E}}} для международной связи. Герзон и Бартон (1992) определяют декодер для горизонтального объемного звука как Ambisonic, если

  • направления r V → {\ displaystyle {\ vec {r_ {V}}}}{\ vec {r_ {V}}} и r E → {\ displaystyle {\ vec {r_ {E}}}}{\ vec {r_ {E}}} согласен с частотой не менее 4 кГц,
  • на частотах ниже примерно 400 Гц, ‖ r V → ‖ = 1 {\ displaystyle \ | {\ vec {r_ {V}}} \ | = 1}\ | {\ vec {r_ {V}}} \ | = 1 для всех азимутальных углов и
  • на частотах примерно от 700 Гц до 4 кГц величина r E → {\ displaystyle {\ vec {r_ {E}}}}{\ vec {r_ {E}}} "существенно увеличивается на как можно большей части звуковой сцены 360 ° ".

На практике удовлетворительные результаты достигаются при умеренных порядках даже для очень больших зон прослушивания.

Синтез звукового поля (декодирование)

В принципе, громкоговоритель сигналы получены с использованием линейной комбинации компонентных сигналов Ambisonic, где каждый сигнал зависит от фактического положения динамика по отношению к центру воображаемой сферы на поверхности ce из которых проходит через все доступные динамики. На практике слегка неравномерные расстояния между динамиками можно компенсировать с помощью задержки.

декодирование True Ambisonics, однако требует пространственного выравнивания сигналов для учета различий в локализации звука на высоких и низких частотах механизмы в человеческом слухе. Дальнейшее уточнение учитывает расстояние слушателя от громкоговорителей (компенсация ближнего поля).

Совместимость с существующими каналами распространения

Декодеры Ambisonics в настоящее время не продаются конечным пользователям в каких-либо значительных Кстати, и никаких записей Ambisonic в продаже нет. Следовательно, контент, созданный в Ambisonics, должен быть доступен потребителям в стерео или дискретных многоканальных форматах.

Стерео

Контент Ambisonics можно автоматически преобразовать в стерео без специального понижающего микширования. Самый простой подход - сэмплировать B-формат с помощью виртуального стереомикрофона. Результат эквивалентен совпадающей стереозаписи. Изображение будет зависеть от геометрии микрофона, но обычно тыловые источники будут воспроизводиться более мягко и рассеянно. Вертикальная информация (из канала Z {\ displaystyle Z}Z ) опускается.

В качестве альтернативы, B-формат может быть матрично закодирован в формат UHJ, который подходит для прямого воспроизведения на стереосистемах. Как и раньше, вертикальная информация будет отброшена, но в дополнение к воспроизведению влево-вправо, UHJ пытается сохранить часть горизонтальной информации объемного звучания, переводя источники сзади в сигналы, не совпадающие по фазе. Это дает слушателю некоторое ощущение задней локализации.

Двухканальный UHJ также может быть декодирован обратно в горизонтальный Ambisonic (с некоторой потерей точности), если доступна система воспроизведения Ambisonic. UHJ без потерь до четырех каналов (включая информацию о высоте) существует, но никогда не получил широкого распространения. Во всех схемах UHJ первые два канала - это обычные левые и правые динамики.

Многоканальные форматы

Точно так же можно предварительно декодировать материал Ambisonics в произвольные схемы расположения динамиков, например Quad, 5.1, 7,1, Auro 11,1 или даже 22,2, опять же без ручного вмешательства. Канал LFE либо пропускается, либо вручную создается специальный микс. Предварительное декодирование в формат 5.1 было известно как G-формат на заре создания DVD-аудио, хотя этот термин больше не используется.

Очевидным преимуществом предварительного декодирования является то, что любой слушатель объемного звука может испытать Ambisonics; не требуется никакого специального оборудования, кроме того, которое есть в обычной системе домашнего кинотеатра. Главный недостаток заключается в том, что гибкость рендеринга одного стандартного сигнала Ambisonics для любого целевого массива громкоговорителей теряется: сигнал предполагает определенную «стандартную» компоновку, и любой, кто слушает с другим массивом, может испытывать снижение точности локализации.

Макеты целей начиная с версии 5.1 обычно превосходят пространственное разрешение амбисоники первого порядка, по крайней мере, во фронтальном квадранте. Для достижения оптимального разрешения, чтобы избежать чрезмерных перекрестных помех и избежать неровностей макета цели, предварительное декодирование для таких целей должно производиться из исходного материала в Ambisonics более высокого порядка.

Рабочий процесс производства

Амбисонический контент может быть создан двумя основными способами: записывая звук с помощью подходящего микрофона первого или более высокого порядка, или путем выделения отдельных монофонических источников и их панорамирования в желаемое положение. Контентом также можно управлять, пока он находится в B-формате.

Амбисонические микрофоны

Нативные массивы B-формата

Массив, разработанный и созданный доктором Джонатаном Холлидеем из Nimbus Records

Поскольку компоненты амбисонических микрофонов первого порядка соответствуют физическим микрофонным датчикам паттернов, вполне практично записывать B-формат напрямую с тремя совпадающими микрофонами: всенаправленная капсула, одна обращенная вперед капсула в виде восьмерки и одна левая капсула в форме восьмерки, что дает W {\ displaystyle Компоненты W}W , X {\ displaystyle X}Икс и Y {\ displaystyle Y}Y . Этот микрофонный массив называется родным или Nimbus / Halliday, в честь его дизайнера доктора Джонатана Холлидея из Nimbus Records, где он используется для записи их обширной и продолжающейся серии релизов Ambisonic. Встроенный микрофон формата B, C700S производится и продается с 1990 года.

Основная трудность, присущая этому подходу, заключается в том, что высокочастотная локализация и четкость зависят от диафрагм, приближающихся к истинному совпадению. При вертикальном расположении капсул достигается идеальное совпадение для горизонтальных источников. Однако звук сверху или снизу теоретически будет страдать от тонких эффектов гребенчатой ​​фильтрации на самых высоких частотах. В большинстве случаев это не ограничение, так как источники звука, далекие от горизонтальной плоскости, обычно являются реверберацией помещения. Кроме того, уложенные друг на друга элементы микрофона в форме восьмерки имеют глубокий ноль в направлении их оси наложения, так что первичным преобразователем в этих направлениях является центральный всенаправленный микрофон. На практике это может привести к меньшей ошибке локализации, чем любой из альтернатив (тетраэдрические массивы с обработкой или четвертый микрофон для оси Z).

Собственные массивы чаще всего используются для горизонтального объемного звучания из-за увеличения позиционные ошибки и эффекты затенения при добавлении четвертого микрофона.

Тетраэдрический микрофон

Поскольку невозможно построить полностью совпадающую микрофонную решетку, следующий лучший подход - минимизировать и распределить позиционную ошибку как можно более равномерно. Это может быть достигнуто путем размещения четырех кардиоидных или субкардиоидных капсул в тетраэдре и выравнивания для равномерного отклика диффузного поля. Затем капсульные сигналы преобразуются в B-формат с помощью матричной операции.

За пределами Ambisonics, тетраэдрические микрофоны стали популярными среди инженеров звукозаписи, работающих в режиме стерео или 5.1, за их гибкость при пост-продакшене; здесь B-формат используется только в качестве промежуточного звена для получения виртуальных микрофонов.

микрофонов более высокого порядка

Выше первого порядка, больше невозможно получить компоненты Ambisonic напрямую с одним микрофоном. капсулы. Вместо этого разностные сигналы более высокого порядка получают из нескольких пространственно распределенных (обычно всенаправленных) капсул с использованием очень сложной цифровой обработки сигналов.

em32 Eigenmike - это коммерчески доступная 32-канальная амбизонная микрофонная решетка.

Из-за необходимости агрессивной эквализации тембральные и шумовые характеристики массивов более высокого порядка в настоящее время несопоставимы с традиционными высококачественными записывающими микрофонами, и результирующий B-формат все больше ограничивается полосой в сторону более высоких порядков, поднимая вопросы совместимости вверх и вниз.

Недавняя статья Питера Крейвена и др. (впоследствии запатентованный) описывает использование двунаправленных капсюлей для микрофонов более высокого порядка, чтобы уменьшить крайность задействованной эквализации. Микрофоны на этой идее пока не созданы.

Ambisonic panning

Самый простой способ создать Ambisonic миксы произвольно высокого порядка - взять монофонические источники и расположить их с помощью кодировщика Ambisonic.

Полносферный кодировщик обычно имеет два параметра: азимут (или горизонт) и угол места. Кодер будет распределять исходный сигнал по компонентам Ambisonic, так что при декодировании источник появится в желаемом месте. Более сложные панорамы дополнительно предоставляют параметр радиуса, который позаботится о зависящем от расстояния затухании и усилении низких частот из-за эффекта ближнего поля.

Аппаратные блоки панорамирования и микшеры для Ambisonics первого порядка доступны с 1980-х годов и используются в коммерческих целях. Сегодня плагины панорамирования и другие сопутствующие программные инструменты доступны для всех основных рабочих станций с цифровым аудио, часто в виде бесплатного программного обеспечения. Однако из-за произвольных ограничений ширины шины немногие профессиональные цифровые рабочие станции (DAW) поддерживают порядок больше секунды. Заметными исключениями являются REAPER, ProTools, Nuendo и Ardor.

Ambisonic Managing

B-формат первого порядка, с которым можно работать. различными способами изменить содержание слуховой сцены. Хорошо известные манипуляции включают «вращение» и «доминирование» (перемещение источников в определенном направлении или от него).

Кроме того, линейная не зависящая от времени обработка сигнала, такая как выравнивание может применяться к B-формату без нарушения направления звука, если он применяется ко всем компонентным каналам одинаково.

Более поздние разработки в области Ambisonics более высокого порядка позволяют выполнять широкий спектр манипуляций, включая вращение, отражение, движение, 3D реверберацию, повышающее микширование из устаревших форматов, таких как 5.1 или первого порядка, визуализацию и направленное воспроизведение. зависимая маскировка и эквализация.

Обмен данными

Для передачи Ambisonic B-формата между устройствами и конечным пользователям требуется стандартизованный формат обмена. В то время как традиционный B-формат первого порядка хорошо определен и понятен всем, существуют противоречивые соглашения для Ambisonics более высокого порядка, различающиеся как порядком каналов, так и весами, которые, возможно, потребуется поддерживать в течение некоторого времени. Традиционно наиболее распространенным является формат Furse-Malham высшего порядка в контейнере .ambна основе файлового формата WAVE-EX от Microsoft. Он масштабируется до третьего порядка и имеет ограничение на размер файла 4 ГБ.

В новых реализациях и продуктах может возникнуть необходимость рассмотреть предложение AmbiX, которое принимает формат файла .cafи отменяет ограничение в 4 ГБ. Он масштабируется до произвольно высоких порядков и основан на кодировании SN3D. Кодирование SN3D было принято Google в качестве основы для своего формата YouTube 360.

Текущая разработка

Открытый исходный код

С 2018 года существует бесплатная реализация с открытым исходным кодом в звуковой кодек Opus.

Корпоративный интерес

С момента принятия Google и другими производителями в качестве предпочтительного аудиоформата для виртуальной реальности к Ambisonics наблюдался всплеск интереса.

В 2018 году Sennheiser выпустила свой микрофон VR, а Zoom выпустила полевой рекордер Ambisonics. Оба являются реализациями конструкции тетраэдрического микрофона, который производит Ambisonics первого порядка.

Ряд компаний в настоящее время проводят исследования в области Ambisonics:

  • BBC
  • Technicolor Исследования и инновации / Thomson Licensing

Лаборатории Dolby проявили «интерес» к Ambisonics от приобретение (и ликвидация) базирующегося в Барселоне специалиста по Ambisonics imm sound перед запуском Dolby Atmos, который, хотя его точная работа не разглашается, действительно реализует разделение между направлением источника и фактическим положением громкоговорителей. Atmos использует принципиально иной подход в том, что он не пытается передавать звуковое поле; он передает дискретные премиксы или основы (то есть необработанные потоки звуковых данных) вместе с метаданными о том, из какого места и направления они должны появляться. Затем стебли декодируются, микшируются и визуализируются в реальном времени с использованием любых громкоговорителей, доступных в месте воспроизведения.

Использование в играх

Ambisonics высшего уровня нашла свою нишу на рынке видеоигр, разработанных Codemasters. Их первой игрой, в которой использовался звуковой движок Ambisonic, была Colin McRae: DiRT, однако она использовала Ambisonics только на платформе PlayStation 3. Их игра Race Driver: GRID расширила использование Ambisonics на платформу Xbox 360, а Colin McRae: DiRT 2 использует Ambisonics на всех платформах, включая ПК.

Последние игры от Codemasters, F1 2010, Dirt 3, F1 2011 и Dirt: Showdown, используйте Ambisonic четвертого порядка на более быстрых ПК, обработанный драйвером OpenAL, и предварительно микшированный звук Ambisonic, созданный с использованием подключаемых модулей WigWare Ambisonic Брюса Виггинса.

Патенты и товарные знаки
252>Срок действия большинства патентов на разработки Ambisonic уже истек (включая патенты на микрофон Soundfield ), и, как следствие, базовая технология доступна для всех. Исключениями являются технология доктора Джеффри Бартона Trifield, которая представляет собой систему стерео-рендеринга с тремя динамиками, основанную на теории Ambisonic (US 5594800 ), и так называемые "венские" декодеры, основанные на на бумаге AES Герзона и Бартона в Вене 1992 г., которые предназначены для декодирования нерегулярных массивов громкоговорителей (US 5757927 ).

«Пул» патентов, включающих технологию Ambisonics, был первоначально собран Национальной корпорацией исследований и разработок правительства Великобритании (NRDC), которая просуществовала до конца 1970-х годов для разработки и продвижения британских изобретений и лицензирования их для коммерческих производителей. в идеале одному лицензиату. В конечном итоге лицензия на систему была предоставлена ​​Nimbus Records (теперь принадлежит Wyastone Estate Ltd).

Логотип Ambisonic в виде «переплетающихся кругов» (торговые марки Великобритании UK00001113276 и UK00001113277 ), а также текстовые марки «AMBISONIC» и «AMBISON» (торговые марки Великобритании UK00001500177 и UK00001112259 ), ранее принадлежавшие Wyastone Estate Ltd., срок действия истек в 2010 году.

См. Также
Примечания
Ссылки
Внешние ссылки
Последняя правка сделана 2021-06-10 16:48:19
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте