В акустике, громкость является субъективным восприятием звукового давления. Более формально это определяется как «Атрибут слухового ощущения, с точки зрения которого звуки могут быть упорядочены по шкале от тихого до громкого». Отношение физических характеристик звука к воспринимаемой громкости состоит из физических, физиологических и психологических компонентов. Изучение кажущейся громкости входит в тему психоакустики и использует методы психофизики.
В разных отраслях громкость может иметь разное значение и разные стандарты измерения. Некоторые определения, такие как ITU-R BS.1770, относятся к относительной громкости различных сегментов звуков, воспроизводимых электронным способом, например, для радиовещания и кино. Другие, такие как ISO 532а (Stevens громкость, измеренные в сон ), ISO 532b ( Цвикер громкость), DIN 45631 и ASA / ANSI S3.4, имеет более общий характер и часто используются для характеристики громкости окружающего шума. Более современные стандарты, такие как Nordtest ACOU112 и ISO / AWI 532-3 (в разработке), учитывают другие компоненты громкости, такие как скорость начала, изменение во времени и спектральная маскировка.
Громкость, субъективный показатель, часто путают с физическими показателями силы звука, такими как звуковое давление, уровень звукового давления (в децибелах ), интенсивность звука или мощность звука. Взвешивающие фильтры, такие как A-weighting и LKFS, пытаются компенсировать измерения, чтобы они соответствовали громкости, воспринимаемой обычным человеком.
Восприятие громкости связано с уровнем звукового давления (SPL), частотным составом и продолжительностью звука. Взаимосвязь между уровнем звукового давления и громкостью отдельного тона может быть аппроксимирована степенным законом Стивенса, в котором уровень звукового давления имеет показатель 0,67. Более точная модель, известная как функция Inflected Exponential, показывает, что громкость увеличивается с более высокой экспонентой на низких и высоких уровнях и с более низкой экспонентой на умеренных уровнях.
Чувствительность человеческого уха изменяется в зависимости от частоты, как показано на графике равной громкости. Каждая линия на этом графике показывает уровень звукового давления, необходимый для того, чтобы частоты воспринимались как одинаково громкие, а разные кривые относятся к разным уровням звукового давления. Это также показывает, что люди с нормальным слухом наиболее чувствительны к звукам в диапазоне 2–4 кГц, причем чувствительность снижается по обе стороны от этого диапазона. Полная модель восприятия громкости будет включать интегрирование SPL по частоте.
Исторически громкость измерялась с помощью аудиометра «баланса уха», в котором амплитуда синусоидальной волны регулировалась пользователем так, чтобы она равнялась воспринимаемой громкости оцениваемого звука. Современные стандарты измерения громкости основаны на суммировании энергии в критических диапазонах.
Когда присутствует нейросенсорная тугоухость ( повреждение улитки или головного мозга), восприятие громкости изменяется. Звуки на низких уровнях (часто воспринимаемые людьми без потери слуха как относительно тихие) больше не слышны для слабослышащих, но звуки на высоких уровнях часто воспринимаются как имеющие ту же громкость, что и для здорового слушателя. Это явление можно объяснить двумя теориями, называемыми набором громкости и невосприимчивостью мягкости.
Набор громкости предполагает, что громкость увеличивается для определенных слушателей быстрее, чем у обычных слушателей, при изменении уровня. Эта теория была принята как классическое объяснение.
Невосприятие мягкости, термин, введенный Мэри Флорентин в 2002 году, предполагает, что некоторые слушатели с нейросенсорной тугоухостью могут демонстрировать нормальную скорость роста громкости, но вместо этого имеют повышенную громкость на своем пороге. То есть самый тихий звук, который слышат эти слушатели, громче самого тихого звука, слышимого обычными слушателями.
Громкости управления, связанное с компенсацией громкости функцией на некоторых потребительской стереосистеме изменяет частотный отклик кривой, чтобы соответствовать примерно с равной громкостью, характерной для уха. Компенсация громкости предназначена для более естественного звучания записанной музыки при воспроизведении на более низких уровнях за счет усиления низких частот, к которым ухо менее чувствительно при более низких уровнях звукового давления.
Нормализация громкости - это особый тип нормализации звука, который выравнивает воспринимаемый уровень таким образом, чтобы, например, рекламные ролики не звучали громче, чем телевизионные программы. Схемы нормализации громкости существуют для ряда аудиоприложений.
Исторически для измерения громкости использовались единицы Sone (громкость N) и Phon (уровень громкости L N).
A-взвешивание учитывает человеческую чувствительность к звуку и описывает относительную воспринимаемую громкость на тихом и умеренном уровнях речи, около 40 телефонов.
Мониторинг относительной громкости на производстве измеряется в соответствии с ITU-R BS.1770 в единицах LKFS. Работа над ITU-R BS.1770 началась в 2001 году после того, как стало очевидным искажение уровня 0 dBFS + в преобразователях и кодеках с потерями; а исходная метрика громкости Leq (RLB) была предложена Гилбертом Сулодром в 2003 году. Основываясь на данных субъективных тестов на прослушивание, Leq (RLB) выгодно отличался от множества других алгоритмов. CBC, Dolby и TC Electronic, а также многочисленные вещательные компании внесли свой вклад в тестирование прослушивания. Уровни громкости, измеренные в соответствии с Leq (RLB), указанным в ITU-R BS.1770, сообщаются в единицах LKFS.
Измерительная система ITU-R BS.1770 была улучшена для многоканальных приложений (с монофонического до объемного звука 5.1 ). Чтобы сделать метрику громкости удобной для разных жанров, был добавлен вентиль относительного измерения. Эта работа проводилась в 2008 году EBU. Усовершенствования были возвращены в BS.1770-2. МСЭ впоследствии обновил метрику истинного пика (BS.1770-3) и добавил положение для еще большего количества аудиоканалов, например объемного звука 22.2 (BS.1770-4).