Dolby Digital Plus

редактировать
Аудиокодек логотип Dolby Digital Plus

Dolby Digital Plus, также известный как Enhanced AC-3 (и обычно сокращенно DD + или E-AC-3 или EC-3 ) - это сжатие цифрового звука схема, разработанная Dolby Labs для передачи и хранения многоканального цифрового звука. Это преемник Dolby Digital (AC-3), также разработанный Dolby, и имеет ряд улучшений, включая поддержку более широкого диапазона скоростей передачи данных (от 32 кбит / с до 6144 кбит / с)., увеличенное количество каналов и поддержка нескольких программ (через субпотоки), а также дополнительные инструменты (алгоритмы) для представления сжатых данных и противодействия артефактам. В то время как Dolby Digital (AC-3) поддерживает до пяти аудиоканалов с полной полосой пропускания с максимальной скоростью передачи данных 640 кбит / с, E-AC-3 поддерживает максимум до 15 аудиоканалов с полной полосой пропускания. битрейт 6,144 Мбит / с.

Полный набор технических спецификаций для E-AC-3 (и AC-3) стандартизирован и опубликован в Приложении E к ATSC A / 52: 2012, а также Приложение E к ETSI TS 102 366 V1.2.1 (2008–08), опубликованному Комитетом по передовым телевизионным системам.

Содержание

  • 1 Технические подробности
    • 1.1 Технические характеристики
    • 1.2 Структура
    • 1.3 Синтаксис
      • 1.3.1 Хранение коэффициентов преобразования
    • 1.4 Алгоритм
      • 1.4.1 Модифицированное дискретное косинусное преобразование
      • 1.4.2 Адаптивное гибридное преобразование (AHT)
      • 1.4.3 Связь
      • 1.4.4 Расширение спектра
      • 1.4.5 Повторная матрица
      • 1.4.6 Предварительная обработка шума
    • 1.5 Связь с Dolby Digital
    • 1.6 Сжатие динамического диапазона
  • 2 Инкапсуляция, использование и хранение потоков Dolby Digital
    • 2.1 Физический транспорт для потребления устройства
    • 2.2 Физический транспорт для профессиональных устройств и приложений
    • 2.3 Потребительское вещание в системах цифрового телевидения
    • 2.4 HD DVD и Blu-ray Disc
    • 2.5 Медиа-плееры и понижающее микширование
  • 3 См. также
  • 4 Ссылки

Технические характеристики

Технические характеристики

Dolby Digital Plus поддерживает следующие характеристики:

  • Кодированный битрейт: от 0,032 до 6,144 Мбит / с
  • Аудиоканалы : От 1,0 до 15,1 (т.е. от моно до 15 полнодиапазонных каналов и канала низкочастотных эффектов)
  • Количество аудиопрограмм на битовый поток: 8
  • Частота дискретизации: 32, 44,1 или 48 кГц

Структура

Служба Dolby Digital Plus состоит из одного или нескольких подпотоков. Существует три типа субпотоков:

  • Независимые субпотоки, которые могут содержать одну программу с количеством каналов до 5.1. В потоке Dolby Digital Plus может присутствовать до восьми зависимых подпотоков. Каналы, присутствующие в независимом субпотоке, ограничены традиционными каналами 5.1: левым (L), правым (R), центральным (C), левым (Ls) и правым объемным (Rs) каналами, а также низкочастотным Канал эффектов (Lfe).
  • Устаревшие подпотоки, которые содержат одну программу 5.1 и напрямую соответствуют контенту Dolby Digital. В потоке DD + может присутствовать не более одного унаследованного подпотока.
  • Зависимые подпотоки, которые содержат дополнительные каналы помимо традиционных каналов 5.1. Поскольку зависимые подпотоки имеют ту же структуру, что и независимые подпотоки, каждый зависимый подпоток может содержать до пяти каналов с полной полосой пропускания и одного низкочастотного канала; однако эти каналы могут быть назначены различным расположениям динамиков. Метаданные в субпотоке описывают назначение каждого включенного канала.

Все потоки DD + должны содержать по крайней мере один независимый субпоток или унаследованный субпоток, который содержит первые (или только) каналы 5.1 основной аудиопрограммы. Дополнительные независимые субпотоки могут использоваться для вторичных аудиопрограмм, таких как звуковые дорожки на иностранных языках, комментарии или описания / озвучка для слабовидящих. Зависимые субпотоки могут быть предоставлены для программ, которые имеют дополнительные каналы звуковой сцены помимо 5.1.

В каждом подпотоке предусмотрено кодирование пяти каналов с полной полосой пропускания, одного низкочастотного канала и одного соединительного канала. Канал связи используется для передачи информации от средних до высоких частот, что является общим для нескольких каналов с полной полосой пропускания. Его контент смешивается с другими каналами способом, предписанным метаданными, он не воспроизводится декодером как дискретный канал.

Dolby Digital Plus включает исчерпывающие метаданные битового потока для управления декодером выходной громкостью (через dialnorm), понижающего микширования и реверсивного управления динамическим диапазоном (через DRC).

Синтаксис

Dolby Digital Plus номинально является протоколом с 16-битным выравниванием, хотя очень немногие поля в синтаксисе учитывают границы байтов или слов. Поскольку многие элементы синтаксиса являются необязательными или имеют переменную длину, в том числе некоторые, наличие или длина которых зависит от сложных предыдущих вычислений, и в синтаксисе имеется небольшая избыточность, DD + может быть чрезвычайно сложно правильно проанализировать, с синтаксически правильным, но неправильным синтаксическим анализом, который легко производится неисправными энкодерами.

DD + поток - это набор пакетов синхронизирующих кадров фиксированной длины, каждый из которых соответствует 256, 512, 768 или 1536 последовательным выборкам звука во временной области. (Случай с 1536 отсчетами является наиболее распространенным случаем и соответствует Dolby Digital; более короткие субкадры предназначены для использования в интерактивных приложениях, таких как видеоигры, где уменьшение задержки кодировщика является важной проблемой). Каждый синхронизирующий кадр декодируется независимо и принадлежит определенному подпотоку внутри службы. Кадр синхронизации состоит из следующих элементов синтаксиса (некоторые из которых могут быть опущены, когда служба Dolby Digital Plus инкапсулируется в другой формат или транспорт):

  • 16-битное слово синхронизации, которое имеет значение 0x0b77.
  • Раздел Bitstream Info (BSI), который включает ключевые метаданные, такие как размер кадра, идентификатор битового потока (который указывает версию используемого синтаксиса), режим канала, идентификатор субпотока, уровень закодированного диалога (dialnorm) и метаданные для управления декодером создания понижающего микширования.
  • Раздел аудиокадра, который содержит информацию декодирования, общую для всех аудиоблоков в пределах кадра синхронизации, включая необходимую информацию для определения того, как упакованы экспоненты и мантиссы.
  • Один, два, три или шесть разделов аудиоблока. Эти разделы содержат дополнительные метаданные декодирования, а также кодированные и квантованные частотные коэффициенты. Каждый аудиоблок соответствует 256 выборкам ИКМ в каждом канале.
  • Последний раздел, содержащий определяемые пользователем вспомогательные данные, любые необходимые дополнения для получения одинаковых длин синхрокадра и 16-битный циклический контроль избыточности код для обнаружения ошибок.

Хранение коэффициентов преобразования

В основе как Dolby Digital, так и DD + лежит модифицированное дискретное косинусное преобразование (MDCT), которое используется для преобразования звуковой сигнал в частотной области; в каждом блоке может передаваться до 256 частотных коэффициентов. Коэффициенты передаются в двоичном формате с плавающей запятой, а показатели передаются отдельно от мантисс. Это обеспечивает высокоэффективное кодирование.

Экспоненты для каждого канала кодируются в дифференциальном формате с высокой степенью упаковки, при этом в потоке указываются дельты между последовательными элементами разрешения по частоте (кроме первого). Используются три формата или стратегии экспоненты; они известны как «D15», «D25» и «D45». В D15 каждая ячейка имеет уникальный показатель степени, в то время как в D25 и D45 значения дельты соответствуют парам или четырем элементам разрешения по частоте. Аудиоблоки, отличные от первого в кадре синхронизации, могут дополнительно повторно использовать набор экспонент предыдущего блока (это требуется для каналов, которые используют адаптивное гибридное преобразование).

Декодированные экспоненты вместе с набором параметров метаданных используются для получения указателей распределения битов (BAP), которые определяют количество битов, выделенных каждой мантиссе. Бинам, которые соответствуют частотам, на которых человеческий слух более точен, выделяется больше бит; бинов, которые соответствуют частотам, к которым люди менее чувствительны, выделяется меньше. Для каждой мантиссы может быть выделено любое место от нуля до 16 бит; если передаются нулевые биты, необязательно может применяться функция дизеринга для генерации частотного коэффициента.

Алгоритм

Dolby Digital Plus, как и многие аудиокодеки с потерями, использует сильно квантованное представление сигнала в частотной области для достижения усиления кодирования ; В этом разделе описывается операция базового преобразования, а также различные дополнительные «инструменты», определенные стандартом, которые используются для достижения большего сжатия или уменьшения слышимых артефактов кодирования.

Модифицированное дискретное косинусное преобразование

Кодер Dolby Digital и DD + преобразует многоканальный аудиосигнал в частотную область с использованием модифицированного дискретного косинусного преобразования (MDCT) с возможностью переключения длина блока 256 или 512 отсчетов (последний используется со стационарными сигналами, первый - с переходными сигналами). Затем представление частотной области квантуется в соответствии с психоакустической моделью и передается. Для частотных коэффициентов используется формат с плавающей запятой, а мантиссы и экспоненты хранятся и передаются отдельно, причем оба они сильно сжаты.

Адаптивное гибридное преобразование (AHT)

Для очень стационарных сигналов, таких как длинные ноты в музыкальном исполнении, используется адаптивное гибридное преобразование (AHT). Этот инструмент является уникальным для Dolby Digital Plus (и не поддерживается в Dolby Digital) и использует дополнительное дискретное косинусное преобразование (DCT) Типа II для объединения шести смежных блоков преобразования (расположенных внутри кадра синхронизации) в эффективно более длинный блок. В дополнение к двухэтапному преобразованию используется другая структура распределения битов, и используются два способа представления закодированных мантисс: использование векторного квантования, которое дает наибольший выигрыш от кодирования, и использование усиления -адаптированное квантование (GAQ), когда требуется большая точность воспроизведения сигнала. Квантование с адаптацией к усилению может быть независимо включено для каждого частотного бина в канале и позволяет кодировать мантиссу переменной длины.

Связь

Поскольку многие многоканальные аудиопрограммы имеют высокую степень корреляции между отдельными каналами, обычно используется канал связи. Высокочастотная информация, которая является общей для двух или более каналов, передается в отдельном канале (который не воспроизводится декодером, а только смешивается обратно в исходные каналы), известном как канал связи; вместе с коэффициентами, известными как «координаты связи», которые указывают декодеру, как восстанавливать исходные каналы.

Dolby Digital Plus поддерживает более сложную версию инструмента связи, известную как Enhanced Coupling (ECPL). Этот алгоритм, который значительно дороже в обработке (как для кодеров, так и для декодеров), позволяет включать фазовую информацию в координаты связи, что позволяет сохранить фазовые соотношения между связанными каналами.

Расширение спектра

Dolby Digital Plus предоставляет еще один инструмент для высоких частот. Поскольку высокочастотные компоненты часто являются гармониками низкочастотных звуков, Spectral Extension (SPX) позволяет алгоритмически синтезировать высокочастотные компоненты из низкочастотных компонентов. Этот инструмент также является уникальным для Dolby Digital Plus и не поддерживается в Dolby Digital.

Повторная матрица

Стерео программы обычно повторно матрицируются и кодируются как каналы L + R и L-R. Это делается как для увеличения усиления кодирования (канал LR обычно может быть сильно сжат, и последующая нематрица вызывает отмену многих артефактов сжатия), так и для сохранения фазовых соотношений, необходимых для правильного воспроизведения Dolby Surround -кодированный материал.

Предварительная обработка переходных шумов

Переходная предварительная шумовая обработка (TPNP) - это специальный инструмент Dolby Digital Plus для уменьшения результирующих артефактов квантования сигнала и других методов сжатия. В отличие от других описанных выше инструментов, которые работают в частотной области и предшествуют обратному преобразованию в выборки PCM, TPNP - это инструмент, который по существу выполняет оконную операцию вырезания и вставки для сигнала временной области, чтобы стереть определенные предсказуемые артефакты квантования.

Связь с Dolby Digital

Битовые потоки Dolby Digital Plus не имеют прямой обратной совместимости с устаревшими декодерами Dolby Digital. Однако Dolby Digital Plus является функциональным надмножеством Dolby Digital, а декодеры включают обязательный компонент, который напрямую преобразует (без декодирования и перекодирования) битовый поток Dolby Digital Plus в битовый поток Dolby Digital (работающий со скоростью 640 кбит / с) для передачи. через устаревшие соединения S / PDIF (включая S / PDIF через HDMI) к внешним декодерам (например, AVR и т. д.). Все декодеры Dolby Digital Plus могут декодировать битовые потоки Dolby Digital.

.

Сжатие динамического диапазона

Одной из целей разработки DD + является качественное воспроизведение в различных средах, начиная от домашних кинотеатров и других акустически контролируемых сред, где возможно воспроизведение с широким динамическим диапазоном, до портативных и автомобильных сред, где много присутствует фоновый шум, и для обеспечения слышимости всех частей аудиопрограммы может потребоваться сжатие динамического диапазона.

DD + обеспечивает следующие режимы работы для различных сред слушателя / зрителя.

Режимы работы декодера Dolby Digital Plus:

РежимЭталонная громкость (LKFS)Приложение
Линия-31 LKFSВоспроизведение в домашнем кинотеатре - Обеспечивает полный динамический диапазон «кино»
RF−20 LKFSВоспроизведение через динамик телевизора - Обеспечивает типичный динамический диапазон «вещания»
Портативный-11 LKFSВоспроизведение через динамик портативного устройства и наушников - обеспечивает минимальный динамический диапазон (аналогично технологиям создания / микширования / мастеринга музыки)

Примечание: все режимы работы декодера (перечисленные выше) доступны в каждом Dolby Digital Плюс декодер. Режим работы по умолчанию зависит от категории устройства и приложения. На некоторых устройствах у пользователей также может быть выбор (через меню) для выбора альтернативного режима, который соответствует их предпочтениям и / или применению.

Кроме того, Dolby Digital и DD + содержат дополнительные метаданные для обеспечения безошибочного преобразования в нисходящие каналы с ограниченным диапазоном, такие как радиочастотная модуляция, где чрезмерная амплитуда выходного сигнала может привести к значительным искажениям или ошибкам модуляции.

Инкапсуляция, использование и хранение потоков Dolby Digital

Физический транспорт для потребительских устройств

IEC 61937-3: определяет, как передавать Dolby Digital (AC-3) и Битовые потоки Dolby Digital Plus (E-AC-3) через интерфейс IEC 60958/61937 (S / PDIF). Однако интерфейс S / PDIF имеет недостаточную полосу пропускания для передачи потоков битов Dolby Digital Plus (E-AC-3) со скоростью 3,0 Мбит / с, указанной в HD DVD; возможны более низкие значения данных.

Большая часть потребительского оборудования и даже некоторое профессиональное оборудование не распознает Dolby Digital Plus как закодированный формат и обрабатывает сигналы DD + через S / PDIF или аналогичный интерфейс или хранятся в файле.WAV или аналогичном формат контейнера, как если бы они были линейными данными PCM. Это не проблема, если данные передаются без изменений, но любое масштабирование усиления или преобразование частоты дискретизации, операции, которые на слух безвредны для данных PCM, повредят и уничтожат поток Dolby Digital Plus. (Более старые кодеки, такие как DTS или AC-3, с большей вероятностью будут распознаны как сжатые форматы и защищены от такой обработки).

Dolby Digital Plus может передаваться через HDMI 1.3 или новее, в соответствии с IEC 61937-3.

Физический транспорт для профессиональных устройств и приложений

Поскольку интерфейс AES-3 является профессиональным аналогом S / PDIF, потоки Dolby Digital Plus могут передаваться через AES- 3 соединения с достаточной пропускной способностью и / или через другие интерфейсы, которые инкапсулируют AES-3 (например, встроенное аудио SMPTE 259M и SMPTE 299M). Дополнительные стандарты, опубликованные SMPTE, определяют кодирование транспорта Dolby, включая Dolby Digital, Dolby Digital Plus и Dolby E (профессиональный кодек, используемый в аудио / видео приложениях) в интерфейсе AES. Стандарт SMPTE 337 определяет передачу и передачу сигналов, которые не являются аудио PCM, через интерфейс AES-3, а стандарт SMPTE 340-2008 определяет, как Dolby Digital Plus и Dolby Digital должны передаваться через этот интерфейс. Комбинация SMPTE 340-2008 и 337M позволяет хранить и передавать битовый поток Dolby Digital Plus в рамках профессиональных рабочих процессов производства, распространения и распространения до передачи потребителям.

Потребительское вещание в системах цифрового телевидения

DD + или Dolby Digital определены Комитетом по усовершенствованным телевизионным системам в качестве основного аудиокодека для цифрового телевидения ATSC и обычно используется для других приложений DTV (таких как кабельное и спутниковое вещание) в странах, которые используют ATSC для цифрового телевидения.

Для широковещательной передачи (передачи) потребителям поток битов Dolby Digital Plus пакетируется в элементарный поток MPEG и мультиплексируется (с видео) в транспортный поток MPEG. В системах ATSC спецификация для переноса Dolby Digital Plus описана в ATSC A / 53 Part 3 Part 6. В системах DVB спецификация для переноса Dolby Digital Plus описана в ETSI TS 101 154 и ETSI EN 300 468.

Dolby Digital Plus все чаще используется в системах цифрового телевидения, особенно в кабельных и спутниковых системах, в качестве замены Dolby Digital. Многие такие приложения не используют преимущества большего количества каналов или способности поддерживать несколько независимых программ; вместо этого он используется как более эффективный кодек, чем AC-3.

HD DVD и Blu-ray Disc

Как ныне не существующий стандарт HD DVD, так и Blu-ray Disc включают Dolby Digital Plus. Это обязательный компонент HD DVD и дополнительный компонент Blu-ray. Максимальное количество дискретно кодированных каналов одинаково для обоих форматов: 7.1. Однако HD DVD и Blu-ray налагают различные технические ограничения на поддерживаемые аудиокодеки. Следовательно, использование DD + существенно различается между HD DVD и Blu-ray Disc.

Сравнение битрейта Dolby Digital (AC-3) и Dolby Digital Plus (E-AC-3)
КодекHD DVDBlu-ray Disc
ДекодированиеКаналыБитрейтДекодированиеКаналыБитрейт
AC-3обязательноот 1 до 5,1448 кбит / собязательноот 1 до 5,1640 кбит / с
E-AC-3обязательноот 1 до 7,13,024 Мбит / сдополнительно, доступно только для тыловых каналовот 6,1 до 7,11,664 Мбит / с
TrueHDобязательно. необязательно1 или 2. от 3 до 818,0 Мбит / с. 18,0 Мбит / снеобязательноот 1 до 818,0 Мбит / с

На HD DVD DD + обозначен как обязательный аудиокодек. Фильм HD DVD может использовать DD + в качестве основной (или единственной) звуковой дорожки. Требуется проигрыватель HD DVD для поддержки звука DD + путем его декодирования и вывода на выходные гнезда проигрывателя. При хранении на диске битовый поток DD + может переносить любое количество аудиоканалов до максимально допустимого с любой скоростью передачи до 3,0 Мбит / с.

На Blu-ray Disc DD + - это дополнительный кодек, который используется как расширение «основной» аудиодорожки AC-3 5.1. Ядро AC-3 кодируется со скоростью 640 кбит / с, несет 5 основных каналов (и 1 LFE) и может независимо воспроизводиться как звуковая дорожка фильма на любом проигрывателе дисков Blu-ray. Битовый поток расширения DD + используется на проигрывателях, которые его поддерживают, заменяя задние каналы в настройке 5.1 на версии с более высокой точностью воспроизведения, а также обеспечивая возможное расширение канала до 6.1 или 7.1. Для всей аудиодорожки допускается комбинированный битрейт 1,7 Мбит / с: 640 кбит / с для ядра AC-3 5.1 и 1 Мбит / с для расширения DD +. Во время воспроизведения как основной, так и дополнительный потоки битов вносят вклад в окончательный аудиовыход в соответствии с правилами, заложенными в метаданные потока битов.

Медиа-плееры и понижающее микширование

Как правило, битовый поток Dolby Digital Plus может можно передавать только по каналу HDMI 1.3 или выше. Более старые приемники поддерживают более ранние версии HDMI или поддерживают только систему S / PDIF для цифрового звука или аналоговых входов.

Для каналов, отличных от HDMI 1.3, проигрыватель может декодировать звук, а затем передавать его различными способами.

  • Более ранние версии HDMI, такие как HDMI 1.1, поддерживают звук PCM, где проигрыватель декодирует звук и передает его без потерь как PCM через HDMI на приемник.
  • Некоторые приемники и плееры поддерживают аналоговый объемный звук, и проигрыватель может декодировать звук и передавать его на приемник как аналоговый звук.

Большинство приемников и плееров поддерживают S / PDIF. Это цифровое соединение с меньшей пропускной способностью не способно передавать звук PCM без потерь с более чем двумя каналами, но проигрыватель может передавать аудиопоток, совместимый с S / PDIF, на приемник одним из следующих способов:

  • Диск Blu-ray плееры могут использовать преимущества устаревшего битового потока 5.1 AC-3, встроенного в битовый поток E-AC-3, передавая только битовый поток AC-3 без каких-либо изменений.
  • Плееры, поддерживающие HD DVD Стандартный может перекодировать декодированный звук в другой формат. В зависимости от метода и опций, доступных игроку, это можно сделать с относительно небольшой потерей качества. Эталонный декодер Dolby, доступный всем лицензиатам, использует общее наследие между AC-3 и E-AC-3, выполняя операции в частотной области. Гибридное повторное сжатие позволяет избежать ненужной сквозной декомпрессии и последующей повторной компрессии (E-AC-3 → LPCM → AC-3). В дополнение к AC-3 некоторые проигрыватели HD DVD перекодируют звук, совместимый с S / PDIF, в 1,5 Мбит / с звук DTS. В то время как S / PDIF может передавать Dolby Digital Plus с более низкой скоростью передачи данных, стандарт HD DVD определяет скорость передачи данных для DD +, которая слишком высока для передачи через интерфейс S / PDIF.

Если проигрывателю необходимо декодировать звук для не- Приемник HDMI 1.3, результаты должны быть предсказуемыми. Спецификация DD + явно определяет режимы и механизмы понижающего микширования, поэтому любое исходное звуковое поле (до 14.1) может быть предсказуемо воспроизведено для любой среды прослушивания (вплоть до одного канала).

См. Также

Ссылки

Последняя правка сделана 2021-05-17 11:18:19
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте