Локализация звука

редактировать

Локализация звука - это способность слушателя определять местоположение или источник обнаруженного звука в направлении и расстоянии.

Механизмы локализации звука в слуховой системе изучения млекопитающих были тщательно продуманы. Слуховая система использует несколько сигналов для локализации источника звука, включая разницу во времени и уровне (или разность интенсивности) между обоими ушами, спектральную информацию, временный анализ, корреляционный анализ и сопоставление с образцом.

Эти сигналы также используются другими животными, но могут быть различны в использовании, а также есть локальные сигналы, которые отсутствуют в слуховой системе человека, такие как эффекты движений ушей. Животные, обладающие способностью локализовать звук, имеют явное эволюционное преимущество.

Содержание

1 Как звук достигает мозга
2 Нейронные взаимодействия
3 Конус замешательства
4 Локализация звука слуховой системой человека
- 4.1 Общее введение
- 4.2 Теория дуплекса
  - 4.2. 1 Теория дуплекса
  - 4.2.2 ITD и IID
  - 4.2.3 Оценка для низких частот
  - 4.2.4 Оценка для высоких частот
- 4.3 Теория эффекта ушной фильтрации
  - 4.3. 1 Мотивации
  - 4.3.2 Математическая модель
  - 4.3.3 База данных HRTF
- 4.4 Другие подсказки для трехмерной пространственной локализации
  - 4.4.1 Монофонические реплики
  - 4.4.2 Динамические бинауральные реплики
- 4.5 Расстояние источника звука
- 4.6 Обработка сигналов
- 4.7 Локализация в закрытых помещениях
5 Специальные методы с приложениями
- 5.1 Стереосистема с передачей звука
- 5.2 Стереосистема с 3D паравиртуализацией
- 5.3 Многоканальное стерео виртуальное воспроизведение
6 Животные
- 6.1 Боковая информация (слева, впереди, справа)
- 6.2 Odontocetes
- 6.3 В средней плоскости (спереди, сверху, сзади, снизу)
- 6.4 Наклон головы
- 6.5 Локальные зацепление ушами (мухи)
- 6.6 Двухкоординатная локализация звука (совы)
7 История
8 См. также
9 Ссылки
10 Внешние ссылки

Как звук развивает мозг

Звук - это результат восприятия механических колебаний, распространяющихся через среду, такую как воздух или вода. Через механизмы сжатия и разрежения звуковые волны проходят по воздуху, отражаются от ушной раковины и раковины наружного уха и попадают в слуховой проход. Звуковые волны вызывают вибрацию барабанной перепонки (барабанной перепонки ), вызывая вибрацию трех костей среднего уха, которая передает энергию через овальное окно и в улитку, где он преобразуется в химический сигнал волосковыми клетками в кортиевом органе, который синапс на спиральные ганглии волокна, которые проходят через кохлеарный нерв в мозг.

Нейронные взаимодействия

Известно, что у позвоночных различия во времени между слухом рассчитываются в верхний оливковом ядре ствола мозга .. Согласно Джеффрессу, этот расчет основан на линиях задержки : нейронах в оливе, которые принимают иннервацию от каждого уха с различными соединяющими аксоном длины. Некоторые специфичны для специфических разницы во времени между клетками. Эта теория эквивалентна математической процедурыуре взаимной корреляции. Поскольку теория Джеффресса не может объяснить эффект приоритета , в котором используется первый из нескольких идентичных звуков, используемый для определения местоположения звуков (что позволяет избежать путаницы, вызванной эхом), его нельзя использовать полностью для объяснения ответа. Более того, недавних физиологических наблюдений, сделанных в среднем мозге и стволе головного мозга мелких млекопитающих, бросили серьезные сомнения в обоснованность оригинальных идей Джеффресса.

Нейроны, чувствительные к меж слуховым различиям (ILD), возбуждаются стимуляцией одного уха и подавляется стимуляцией другой уха, так что величина клетки зависит от относительной силы двух входов, которые, в свою очередь, зависят от мощности звука в ушах.

В слуховом ядре среднего мозга, нижнем бугорке (IC), многие чувствительные к ILD нейроны имеют функции ответа, которые резко снижаются от максимальных до нулевых пиков в зависимости от ILD. Однако есть также много нейронов с гораздо более неглубокими функциями, которые не опускаются до нулевых пиков.

Конус замешательства

Большинство млекопитающих умеют определять местонахождение источника звука с помощью межуральных разностей времени и межуральных разностей уровней. Однако такой разницы во времени или уровне не существует для звуков, исходящих по окружности круговых конических срезов, где ось конуса проходит вдоль линии между двумя ушами.

Следовательно, звуковые волны, находящие в любой точке на заданной окружности наклонной высоты, будут иметь неоднозначные координаты восприятия. Другими словами, слушатель не определить, исходит ли звук сзади, спереди, снизу, или где-либо еще по окружности у основания конуса на любом заданном расстоянии от уха. Эти промежуточные расстояния от объекта наиболее важны с точки зрения пригодности.

Эти неоднозначности могут быть устранены путем передачи наклона головы, что может привести к сдвигу как амплитуды, так и фазы звуковых волн, поступающих в каждое ухо. Это перевод вертикальной ориентации интерауральной оси по горизонтали, тем самым задействуя механизм локализации в горизонтальной плоскости. Более того, даже без изменения угла межуральной оси (то есть без наклона головы) слуховой может использовать интерференционные паттерны, создаваемые ушными раковинами, туловищем и даже временным перенацеливанием руки как продолжением ушной раковины. (например, обхватив ухо ладонью).

Как и в случае с другими сенсорными стимулами, устранение неоднозначности восприятия также достигается за счет множества сенсорных входов, особенно визуальных сигналов. Локализовав звук в пределах окружающей среды на визуальном воспринимаемом расстоянии, визуальные подсказки для определения местоположения звука. Кроме того, предварительная информация о новом источнике звука поможет определить его текущее местоположение.

Локализация звука слуховой системой человека

Локализация звука - это процесс определения местоположения источник звука. Объективно говоря, основной локализации звука является моделирование определенного звукового поля, включая акустические источники, слушателя, средства массовой информации и распространения звука. Мозг использует тонкие различия в интенсивности, спектральные и временные характеристики, чтобы мы могли локализовать источники звука. В этом разделе, чтобы глубже понять слуховой механизм человека, мы кратко обсудим теорию локализации человеческого уха.

Общее введение

Локализацию можно определить в трехмерном положении опис: азимут или горизонтальный угол, угол места или вертикальный угол, а также расстояние (для статических звуков) или скорость (для движущиеся звуки).

Азимут звука обозначается разницей во времени прихода между ушами, относительной амплитуды высокочастотных звуков (эффект тени) и асимметричные спектральные отражения от различных частей нашего тела, включая туловище, плечи и ушные раковины.

Признаками расстояния потери амплитуды, потеря высоких частот и отношение прямого сигнала к реверберированному сигналу.

В зависимости от того, где находится источник, наша голова действует как барьер для изменений тембра, интенсивности и спектральных качеств звука, помогая мозгу сориентируйтесь, исходил звук. Эти мельчайшие различия между двумя ушами известны как интерауральные сигналы.

Более низкие частоты с более длинными волнами рассеивают звук вокруг головы, заставляя мозг фокусироваться только на фазовых сигналах от источника.

Хельмут Хаас обнаружил, что мы можем различить источник звука, несмотря на дополнительные отражения на 10 децибел громче исходного волнового фронта, используя самый ранний приходящий волновой фронт. Этот принцип известен как эффект Хааса, конкретная версия эффекта приоритета. Хаас измерил разницу во времени между исходным звуком и отраженным звуком даже с точностью до 1 миллисекунды, увеличив объем, позволяя мозгу различать истинное местоположение исходного звука. Нервная система объединяет все ранние отражения в единое перцептивное целое, позволяя мозгу обрабатывать несколько разных звуков одновременно. Нервная система объединяет отражения, которые находятся в пределах 35 миллисекунд друг от друга и имеют одинаковую интенсивность.

Теория дуплекса

Чтобы определить латеральное направление входного сигнала (влево, вперед, вправо), слуховая система анализирует следующую информацию сигнала уха :

Теория дуплекса

В 1907 году лорд Рэлей использовал камертоны для создания монофонического возбуждения и изучил теорию боковой локализации звука на модели головы человека без ушной раковины. Он первой представил теорию локализации звука, основанную на интерауральных ключах, которая известна как теория дуплекса. Уши человека находятся по разные стороны головы. Как показано на рис. 2, между звуковыми сигналами между акустическим устройством и ушами различаются, между звуковыми сигналами двух ушей существует разница во времени и разница в интенсивности. Мы называем эти виды различий как интерауральная разница во времени (ITD) и интерауральная разница значений (IID) соответственно.

рис.2 Теория дуплекса

ITD и IID

Межуральная разница во времени (ITD ) между левым ухом (вверху) и правым ухом (внизу). [источник звука: 100 мс белый шум справа]

Межуровневая разность уровней (ILD ) между левым ухом (левым) и правым ухом (правым). [источник звука: развертка справа]

Из рисунка 2 видно, что независимо от источника B1 или источника B2, будет задержка распространения между двумя ушами, которая будет генерировать ITD. Одновременно человеческая голова и уши могут иметь затенение на высокочастотные сигналы, которые генерируют IID.

Межуральная разница во времени (ITD) Звук с правой стороны достигает правого уха раньше, чем левого уха. Слуховая система оценивает межуральные временные различия: (а) фазовых задержек на низких частотах и (б) групповых задержек на высоких частотах.
Массовые эксперименты демонстрируют, что ITD относится к частотному сигналу f. Предположим, что угловое положение акустического источника равно θ, радиус головки равен c, функция ITD определяется следующим образом: $ITD = {300 × r × sin ⁡ θ / c, если f ≤ 4000 Гц 200 × r × sin ⁡ θ / c, если f>4000 Гц {\ displaystyle ITD = {\ begin {cases} 300 \ times {\ text {r}} \ times \ sin \ theta / {\ text {c}}, {\ text {if}} f \ leq {\ text {4000Hz}} \\ 200 \ times {\ text {r}} \ times \ sin \ theta / {\ text {c}}, {\ text {если }} f>{\ text {4000Hz}} \ end {cases}}}$ $ITD={\begin{cases}300\times {\text{r}}\times \sin \theta /{\text{c}},{\text{if }}f\leq {\text{4000Hz }}\\200\times {\text{r}}\times \sin \theta /{\text{c}},{\text{if }}f>{\ text {4000Hz}} \ end {ases}}$ . В приведенной выше закрытой мы предположили, что 0 градусов находится прямо перед
Межуральная разница в уровне (IID) или межуральная разность уровней (ILD) Звук с правой стороны имеет более высокий уровень в правом ухе, чем в левом ухе, потому что затеняе т левое ухо. Разница в уровнях значительна. сильно зависит от частоты. Масштабные теоретические исследования показывают, что IID зависит от частоты сигнала f и углового положения акустического источника θ. Функция IID определяется следующим образом: $IID = 1.0 + (f / 1000) 0.8 × sin ⁡ θ {\ displaystyle IID = 1.0 + (f / 1000) ^ {0.8} \ times \ sin \ theta}$ ${\ displaystyle IID = 1.0 + (f / 1000) ^ {0.8 } \ раз \ sin \ theta}$
Для частоты ниже 1000 Гц в основном оцениваются ITD (фазы задержки ), для частот выше 1500 Гц оцениваются в основном IID. Между 1000 Гц и 1500 Гц существует переходная зона, которая играет роль механизма.
Точность локализации составляет 1 градус для источников перед слушателем и 15 градусов для источников по бокам. Человек может различать межураральную разницу во времени в 10 микросекунд или меньше.

Оценка для низких частот

Для частот ниже 800 Гц размеры головы (расстояние до уха 21,5 см, что соответствует межуральной временной задержке 625). мкс) меньше половины длина звуковой волны. Таким образом, слуховая система может без путаницы определять фазовые данные между обоими ушами. Межуровневые различия в уровнях очень малы в этом диапазоне частот, особенно ниже 200 Гц, поэтому точная оценка направления входного сигнала невозможна на основе одних только разностей уровней. Когда частота падает ниже 80 Гц, становится малой для определения уровня времени или разности для определения бокового источника звука.

Оценка для высоких частот

Для частот выше 1600 Гц размеры головы больше, чем длина звуковых волн. Однозначное определение входного направления на основе одной только межузельной фазы на этих частотах невозможно. Эти не менее, межуровневые уровни становятся более и эти уровни оцениваются слуховой системой. Кроме того, можно оценить групповые задержки между ушами, и они более выражены на более высоких частотах; то есть, если есть начало звука, задержка этого начала между ушами может ввести меня в положение начала источника звука. Этот механизм становится важным в реверберирующей среде. После начала звука есть короткий промежуток времени, когда прямой звук достигает ушей, но еще не отраженный звук. Слуховая система использует этот короткий промежуток времени для оценки направления источника звука и сохраняет это обнаруженное направление до тех пор, пока отражения и реверберация не позволяют однозначно оценить направление. Описанные выше источник не заговор для различения звука впереди слушателя или позади слушателя; поэтому необходимо оценивать дополнительные сигналы.

Теория эффекта фильтрации ушной раковины

рис.4 HRTF

Мотивации

Теория дуплекса ясно указывает на то, что ITD и IID играют важную роль в локализации звука. только с проблемами боковой локализации. Например, согласно теории дуплекса, если два акустических источника симметрично расположены на правой передней и правой задней части головы человека, они будут генерироватьные ITD и IID, что называется эффектом модели конуса. Однако человеческое ухо действительно может различить этот набор источников. Кроме того, в естественном чувстве слуха только одно ухо, что означает отсутствие ITD или IID, может различать источники с высокой точностью. Из-за недостатков дуплексной теории исследователи предложили теорию эффекта фильтрации ушной раковины. Форма ушной раковины человека очень особенная. Он вогнутый со сложными складками и асимметричен по горизонтали или вертикали. Отраженные волны и прямые волны будут генерировать частотный спектр на барабанной перепонке, который связан с акустическими источниками. Затем слуховые нервы локализуют источники по этому частотному спектру. Поэтому была предложена соответствующая теория, названная теорией эффект фильтрацииной раковины.

Математическая модель

Эти спектральные подсказки, генерируемые эффектом фильтрации ушной раковины, могут быть представлены как передаточная функция, относящаяся к голове. (HRTF). Соответствующие выражения во временной области называются импульсной характеристики, характер с головой (HRIR). HRTF также называется передаточной функцией из свободного поля в определенную точку слухового прохода. Обычно мы распознаем HRTF как системы LTI:

$HL = HL (r, θ, φ, ω, α) = PL (r, θ, φ, ω, α) / P 0 (r, ω) {\ displaystyle H_ {L} = H_ {L} (r, \ theta, \ varphi, \ omega, \ alpha) = P_ {L} (r, \ theta, \ varphi, \ omega, \ alpha) / P_ {0} (r, \ omega)}$ ${\ displaystyle H_ {L} = H_ {L} (r, \ theta, \ varphi, \ omega, \ alpha) = P_ {L} (r, \ тета, \ varphi, \ omega, \ альфа) / P_ {0} (r, \ omega)}$

$HR = HR (r, θ, φ, ω, α) = PR (r, θ, φ, ω, α) / P 0 (r, ω) {\ displaystyle H_ {R} = H_ {R} (r, \ theta, \ varphi, \ omega, \ alpha) = P_ {R} (r, \ theta, \ varphi, \ omega, \ alpha) / P_ {0} (r, \ omega)}$ ${\ displaystyle H_ {R} = H_ {R} (r, \ theta, \ varphi, \ omega, \ alpha) = P_ {R} (r, \ theta, \ varphi, \ omega, \ alpha) / P_ {0} ( r, \ omega)}$ ,

где L и R обозначают левое и правое ухо соответственно. $PL {\ displaystyle P_ {L}}$ $P_{L}$ и $PR {\ displaystyle P_ {R}}$ $P_R$ отличается амплитудой звукового давления на входе в левое и правое ухо. канал. $P 0 {\ displaystyle P_ {0}}$ $P_ {0}$ - амплитуда звукового давления в центре координат головы, когда слушатель не существует. Как правило, HRTF $HL {\ displaystyle H_ {L}}$ $H_ {L}$ и $HR {\ displaystyle H_ {R}}$ $H_ {R}$ функции углового положения источника $θ {\ displaystyle \ theta}$ $\ theta$ , угол возвышения $φ {\ displaystyle \ varphi}$ $\ varphi$ , расстояние между созданием центра головы $r {\ displaystyle r}$ $р$ , угловая скорость $ω {\ displaystyle \ omega}$ $\ omega$ и эквивалентный размер головы $α {\ displaystyle \ alpha}$ $\ alpha$ .

База данных HRTF

В настоящее время время основные институты, которые работают над измерением базы данных HRTF, включают CIPIC International Lab, MIT Media Lab, Высшую школу психоакустики в Университете Ольденбурга, Лабораторию нейрофизиологии в Университете Висконсин-Мэдисон и лабораторию Эймса в г. НАСА. Базы данных HRIR людей с нормальным и нарушенным слухом и животных общедоступны.

рис. 5 HRIR

Другие сигналы для локализации в трехмерном пространстве

Монофонические сигналы

Человеческое наружное ухо, то есть структуры ушной раковины и наружный слуховой проход, образуют избирательные фильтры. В зависимости от направления ввода звука в средней плоскости активируются различные резонансы фильтра. Эти резонансы имплантируют специфические для направления паттерны в частотные характеристики ушей, которые могут быть оценены слуховой системой для вертикальной локализации звука. Вместе с другими отражениями на голове, плечах и туловище, избирательно отражающих направление, они формируют передаточные функции внешнего уха. Эти закономерности в частотных характеристиках уха очень индивидуальны и зависят от формы и размера внешнего уха. Если звук передается через наушники и был записан через другую голову с внешними поверхностями уха другой формы, диаграммы направленности отличаются от собственных, и при попытке оценить направления в средней плоскости с помощью этих чужеродных ушей возникнут проблемы. Как следствие, при прослушивании фиктивных записей, или иначе называемых бинауральными записями, могут появиться перестановки спереди и сзади или локализация внутри головы. Было показано, что люди могут монофонически локализовать высокочастотный звук, но не низкочастотный звук. Однако бинауральная локализация возможна с более низкими частотами. Вероятно, это связано с тем, что ушная раковина достаточно мала, чтобы взаимодействовать только со звуковыми волнами высокой частоты. Кажется, что люди могут точно локализовать высоту только сложных звуков, включающих частоты выше 7000 Гц, и при этом должна присутствовать ушная раковина.

Динамические бинауральные сигналы

Когда голова неподвижна, бинауральные сигналы для латеральной локализации звука (межуральная разница во времени и межуральная разница уровней) не дают информации о местоположении звука в средней плоскости. Идентичные ITD и ILD могут создаваться звуками на уровне глаз или на любой высоте, если поперечное направление остается постоянным. Однако, если голова повернута, ITD и ILD изменяются динамически, и эти изменения различны для звуков на разных высотах. Например, если источник звука на уровне глаз находится прямо перед собой, а голова поворачивается влево, звук становится громче (и поступает раньше) в правое ухо, чем в левое. Но если источник звука находится прямо над головой,при повороте головы изменения в ITD и ILD не произойдет. Промежуточные возвышения вызовут промежуточные степени изменения, и если представление бинауральных сигналов двум ушам во время движения головы будет обратным, звук будет слышен позади слушателя. Ганс Валлах искусственно изменил бинауральные сигналы во время движения головы. Хотя звук объективно размещался на уровне глаз, динамические изменения ITD и ILD при повороте головы были такими, которые возникли бы, если бы звук был приподнят. В этой ситуации звук был слышен на синтезированной высоте. Тот факт, что источники звука объективно оставались на уровне глаз, не позволяя монофоническим динамическим сигналам определять высоту, действующее, что именно такое изменение бинауральных сигналов во время движения головы обеспечивает правильно локализовать звук в вертикальном измерении. Не нужно активно требовать движения головы; точная вертикальная локализация произошла в аналогичной установке, когда вращение головы пассивно, путем посадки производного субъекта с завязанными глазами на вращающийся стул. Пока динамические изменения в бинауральных сигналах сопровождает воспринимаемое вращение головы, воспринимается синтезированное возвышение.

Расстояние до источника звука

Слуховая система человека имеет лишь ограниченные возможности для определения расстояния до звука. На близком расстоянии есть некоторые показания для определения расстояния, такие как крайние уровни различия (например, при шепоте в одно ухо) или специфические резонансы ушной раковины (видимая часть уха) на близком расстоянии. вверх диапазон.

Слуховая система использует эти подсказки для расстояния до источника звука:

Коэффициент прямого / отраженного звука: в закрытых помещениях к слушателю поступают два типа звука: прямой звук наступающего слушателя. уши, не отражаясь от стен. Отраженный звук хотя бы один раз отражался от стены, прежде чем достиг слушателя. Соотношение между прямым звуком и отраженным звуком может дать представление о расстоянии до источника звука.
Громкость: удаленные источники звука имеют меньшую громкость, чем близкие. Этот аспект может быть оценен особенно для хорошо известных источников звука.
Звуковой спектр: Высокие частоты быстрее затухают в воздухе, чем низкие частоты. Следовательно, удаленный источник звука звучит более приглушенно, чем близкий, поскольку приглушаются высокие частоты. Для звука с известным спектром (например, речи расстояние) можно оценить с помощью воспринимаемого звука.
ITDG: Начальный временной интервал задержки во времени между приходом волны и первой сильной отражением у слушателя. Расположенные относительно большие ITDG, причем первым представлением нужно пройти более длинный путь, возможно, во много раз дольше. Когда источник находится далеко, прямая и отраженная звуковые волны имеют одинаковую длину пути.
Движение: Подобно зрительной системе, в акустическом восприятии также присутствует явление движения параллакс. Для движущихся слушателя источники звука проходят быстрее, чем далекие источники звука.
Разница уровней: Очень близкие источники звука вызывают различный уровень между ушами.

Обработка сигнала

Обработка звука слуховая система человека работает в так называемых критических полосах. Диапазон слышимости разделен на 24 критических каждой, каждой шириной 1 Барк или 100 Мел. Для направленного анализа сигналов внутри критической полосы анализируются вместе.

Слуховая система может извлекать звук желаемого источника звука из мешающего шума. Это позволяет слушателю сосредоточиться только на одном говорящем, если говорят и другие говорящие (эффект коктейльной вечеринки ). С помощью эффекта коктейльной вечеринки звук с мешающего направленного звука приглушенным по сравнению со звуком с нужного направления. Слуховая система может увеличить отношение сигнал / шум на значение до 15 дБ, что означает, что мешающий звук воспринимается как ослабленный наполовину (или меньше) от его фактического громкость.

Локализация в закрытых помещениях

В закрытых помещениях не только прямой звук от источника звука ушей слушателя, но также звук, который отражается на стены. Слуховая система анализирует только прямой звук, который приходит первым, для локализации звука, но не отраженный звук, который приходит позже (закон фронта первой волны ). Таким образом, локализация звука остается возможной даже в эхогенной среде. Это эхоподавление происходит в спинном ядре латерального лемниска (DNLL).

Чтобы определить периоды времени, в которых преобладает прямой звук, который можно использовать для направленной оценки, слуховая система анализа изменения громкости в различных критических диапазонах, а также стабильное направление. Если имеется сильная атака громкости в нескольких критических диапазонах и если воспринимаемое направление стабильно, эта атака, по всей вероятности, вызвана прямым звуком источника звука, который поступает недавно или который меняет характеристики своего сигнала. Этот короткий период времени используется слуховой системой анализа направленности и громкости звука. Когда отражения приходят немного позже, они не так сильно увеличивают громкость внутри звуковых полос, но сигналы направления становятся критическими нестабильными, потому что есть смесь звука прямого направления отражения. В результате слуховая система не запускает новый направленный анализ.

Это первое обнаруженное направление от прямого принимаемого как направление найденного источника звука, пока другие сильные атаки на громкость в сочетании со стабильной информацией о направлении не укажут, что возможен новый анализ направленности. (см. эффект Франссена )

Особые техники с приложениями

Стереосистема передачи звука

Этот вид локализации звука обеспечивает нам настоящую виртуальную стереосистему. Умные »манекены, такие как KEMAR, для сбора сигналов или методов DSP для моделирования процесса передачи источников к ушам. После усиления записи и передачи два канала принимающих сигналов будут воспроизводиться через наушники или динамики. Об исходном звуковом поле путем перевода слухового аппарата слушателя в исходное звуковое поле этого метода то, что его акустические образы являются живыми и естественными.Кроме того, для этого требуется только два независимый передаваемый сигнал для воспроизведения акустического 3D-системы.

рис. 6 Локализация звука с помощью Manikin

3D паравиртуализированная ст ереосистема

Представление К частям такого типа системной группы SRS Audio Sandbox, Spatializer Audio Lab и Qsound Qxpander. Они используют HRTF для имитации акустических сигналов, принимаемых в ушах с разных направлений, с обычным двоичным стереовоспроизведением. Таким образом, они могут имитировать отраженные звуковые волны и улучшать субъективное ощущение пространства и окружающего пространства. Они показывают собой стереосистему с паравиртуализацией, их основная цель - имитировать стереозвук. Величина стереосистемы использует датчики, которые сильно отличаются от человеческих ушей. Хотя эти датчики могут получать акустическую информацию с разных источников, они не имеют той же частотной характеристики, что и слуховая система человека. Следовательно, когда используется бинарный режим, слуховые системы человека по-прежнему могут ощущать поле трехмерных звуковых эффектов. Однако стереосистема с паравиртуализацией 3D-преодолевает такие недостатки. Он использует принципы HRTF для извлечения акустической информации из исходного звукового поля, а затем для создания трехмерного звукового поля через обычные наушники или динамики.

Многоканальное стереофоническое воспроизведение

Многоканальные стереосистемы требуют большого количества каналов воспроизведения. Некоторые исследователи использовали технологии моделирования HRTF, чтобы уменьшить количество каналов воспроизведения. Они используют только два динамика для имитации нескольких динамиков в многоканальной системе. Этот процесс называется виртуальным воспроизведением. По сути, такой подход использует как принцип межушных разностей, так и теорию эффекта фильтрации ушной раковины. К сожалению, такой подход не может полностью заменить традиционную многоканальную стереосистему, такую как систему 5.1 / 7.1 Surround Sound. Это может вызвать инвертирование акустических изображений в симметричных положениях через HRTF.

Животные

«Украине у животных» есть два уха, многие эффекты слуховой системы человека можно построить и у других животных. Таким образом, межуральная разница во времени (межуральная разница) и межуральная разница уровней играют роль в слухе многих животных. Но влияние на локализацию этих эффектов зависит от размера головы, расстояния до ушей, положения ушей и ориентации ушей.

Боковая информация (слева, впереди, справа)

Если уши расположены сбоку от головы, можно использовать такие же сигналы боковой локализации, как и для слуховой системы человека. Это означает: оценка межуральных разностей времени (межуральных фазовых разностей) для более низких частот и оценок разностей межуральных уровней для более высоких частот. Оценка межуральных фазовых различий полезна, если она дает однозначные результаты. Это так, если расстояние до уха меньшей длины (максимальной длины волны) звуковых волн. Для животных с большей головой, чем у человека, диапазон оценки межуральных фазовых различий смещен в сторону более низких частот, для животных с меньшей головой этот диапазон смещен в сторону более высоких частот.

Самая низкая частота, которую можно локализовать, зависит от расстояния до уха. Животные с большими расстояниями между ушами могут определять более низкие частоты, чем люди. Для животных с меньшими расстояниями до ушей наименьшая локализуемая частота выше, чем для людей.

Если уши установлены сбоку от головы, межуральные уровни распознаются для более высоких частот и могут быть оценены задач для локализации. У животных с ушами на макушке не будет тени от головы, и, следовательно, будет гораздо меньше межуральных различий в уровнях, которые можно было бы оценить. Многие из этих животных могут двигать ушами, и эти движения ушей можно использовать в качестве сигнала боковой локализации.

Odontocetes

Дельфины (и другие зубатики) полагаются на эхолокацию, чтобы помочь в обнаружении, идентификации, локализации и поимке добычи. Сигналы сонара дельфинов хорошо подходят для определения местоположения нескольких небольших целей в трехмерной водной среде за счет использования высоконаправленного (ширина луча 3 дБ около 10 градусов), широкополосного (ширина полосы 3 дБ обычно составляет около 40 кГц; пиковые частоты от 40 кГц до 120 кГц), короткие щелчки (около 40 мкс). Дельфины могут локализовать звуки как пассивно, так и активно (эхолокация) с разрешением около 1 градуса. Межмодальное сопоставление (между зрением и эхолокацией) предполагает, что дельфины воспринимают пространственную структуру сложных объектов, опрашиваемых с помощью эхолокации, что, вероятно, требует пространственного разрешения индивидуальных особенностей объекта и интеграции в целостное представление формы объекта. Хотя дельфины чувствительны к небольшой бинауральной интенсивности и разнице во времени, все больше данных свидетельствует о том, что дельфины используют зависимые от положения спектральные сигналы, полученные из хорошо развитых передаточных функций головы, для локализации звука как в горизонтальной, так и в вертикальной плоскостях. Очень маленькое время интегрирования (264 мкс) позволяет локализовать несколько целей на разных расстояниях. Адаптация к локализации включает выраженную асимметрию черепа, носовых мешков и специализированных липидных структур во лбу и челюстях, а также акустически изолированное среднее и внутреннее ухо.

В средней плоскости (спереди, сверху, сзади, снизу)

У многих млекопитающих также есть ярко выраженные структуры в ушной раковине возле входа в ушной канал. Как следствие, могут появиться зависящие от направления резонансы, которые можно использовать как дополнительный сигнал локализации, аналогичный локализации в средней плоскости в слуховой системе человека. Существуют дополнительные сигналы локализации, которые также используются животными.

Наклон головы

Для локализации звука в средней плоскости (возвышение звука) также можно использовать два детектора, которые расположены на разной высоте. Однако у животных приблизительную информацию о высоте можно получить, просто наклонив голову, при условии, что звук длится достаточно долго, чтобы завершить движение. Это объясняет врожденное поведение склонения головы набок при попытке точно локализовать звук. Чтобы получить мгновенную локализацию более чем в двух измерениях с помощью сигналов разности во времени или разности амплитуд, требуется более двух детекторов.

Локализация с прикрепленными ушами (мухи)

Крошечная паразитическая муха Ormia ochracea стала модельным организмом в экспериментах по локализации звука из-за своей уникальной ухо. Животное слишком маленькое, чтобы можно было рассчитать обычным способом разницу во времени звука, поступающего в два уха, но оно может определять направление источников звука с исключительной точностью. барабанные перепонки противоположных ушей связаны напрямую механически, что позволяет разрешить субмикросекундную разницу во времени и требует новой стратегии нейронного кодирования. Хо показал, что система сдвоенной барабанной перепонки у лягушек может вызывать повышенное неравенство межуральных колебаний, когда для головы животного доступны лишь небольшое время прибытия и различия в уровне звука. Работы по созданию направленных микрофонов на основе барабанной перепонки в стадии реализации.

Двухкоординатная локализация звука (совы)

Основные сов ведут ночной образ жизни или крепышко хищные птицы. Они продаются на невизуальные чувства. Эксперименты Роджера Пейна показали, что совы чувствительны к звукам, издаваемым их добычей, а не к теплу или запаху. Фактически, звуковые сигналы необходимы и достаточны для локальных мышей из отдаленного места, где они сидят. Чтобы это сработало, совы должны уметь точно l Окализуйте азимут и высоту источника звука.

История

Термин «бинауральный» означает «слышать двумя ушами» и был введен в 1859 году для обозначения практики прослушивания одного и того же обоими ушами или двух дискретных звуков, по одному в каждое ухо. Только в 1916 году Карл Штумпф (1848–1936), немецкий философ и психолог, различное дихотическое слушание, которое относится к стимулированию каждого ухо с другими стимулом и диотическое слушание, одновременная стимуляция обоих ушей одним и тем же стимулом.

Позже станет очевидно, что бинауральное слушание, дихотическое или диотическое средство, с помощью которого происходит локализация звука.

Научное рассмотрение бинаурального слуха началось еще до того, как это явление было названо так, с предположениями, опубликованными в 1792 году Уильямом Чарльзом Уэллсом (1757–1817) на основе его исследований в бинокулярное зрение. Джованни Баттиста Вентури (1746–1822) провел и описал эксперименты, в которых люди пытались локализовать звук, используя оба уха или одно ухо, заблокированное пальцем. Эта работа не получила дальнейшего развития и была восстановлена только после того, как другие, как работает локализация человеческого звука. Лорд Рэлей (1842–1919) проводил те же эксперименты и приходил к результатам, не зная Вентури. впервые сделал их, почти семьдесят пять лет спустя.

Чарльз Уитстон (1802–1875) работал над оптикой и смешиванием цветов, а также исследовал слух. Он изобрел устройство, которое он назвал «микрофоном», который включен в каждую металлическую пластину, каждую из которых соединена с металлическими стержнями; он использовал это устройство для усиления звука. Он также проводил эксперименты, поднося камертоны к обоим ушам одновременно или по отдельности, пытаясь выяснить, как работает слух, который он опубликовал в 1827 году. Эрнстрих Генрих Вебер (1795–1878) и Август Зеебек (1805–1849) и Уильям Чарльз Уэллс также пытались сравнить и сопоставить то, что стало известно как бинауральный слух, с принципами бинокулярной интеграции в целом. 66>

Понимание того, как различия в звуковых сигналов между двумя ушами воздействия на слуховую обработку таким образом, чтобы обеспечить локализацию и направление звука, было значительно продвинуто после изобретения стетофон в 1859 году, который ввел термин «бинауральный». Элисон создала стетофон на основе стетоскопа, который был изобретен Рене Теофилем Гиацинтом Лаэннеком (1781–1826); у стетофона было два отдельных «датчика», что позволяет пользователю слышать и сравнивать звуки, исходящие из двух отдельных мест.

Локализация звука

Содержание

Как звук развивает мозг

Нейронные взаимодействия

Конус замешательства

Локализация звука слуховой системой человека

Общее введение

Теория дуплекса

Теория дуплекса

ITD и IID

Оценка для низких частот

Оценка для высоких частот

Теория эффекта фильтрации ушной раковины

Мотивации

Математическая модель

База данных HRTF

Другие сигналы для локализации в трехмерном пространстве

Монофонические сигналы

Динамические бинауральные сигналы

Расстояние до источника звука

Обработка сигнала

Локализация в закрытых помещениях

Особые техники с приложениями

Стереосистема передачи звука

3D паравиртуализированная ст ереосистема

Многоканальное стереофоническое воспроизведение

Животные

Боковая информация (слева, впереди, справа)

Odontocetes

В средней плоскости (спереди, сверху, сзади, снизу)

Наклон головы

Локализация с прикрепленными ушами (мухи)

Двухкоординатная локализация звука (совы)

История

См. также

Ссылки 24>

Внешние ссылки