Импульсно-кодовая модуляция

редактировать
цифровое представление дискретизированных сигналов

Импульсно-кодовая модуляция
Расширение имени файла .L16,.WAV,.AIFF,.AU,.PCM
Тип интернет-носителя audio / L16, audio / L8, audio / L20, audio / L24
Код типа «AIFF» для L16, нет
Магическое число Варьируется
Тип форматаНесжатое аудио
Содержится наAudio CD, AES3, WAV, AIFF, AU, M2TS, VOB и многие другие
Расширенный отPCM

Импульсно-кодовая модуляция (PCM ) - это метод, используемый для цифрового представления дискретизированных аналоговых сигналов. Это стандартная форма цифрового аудио в компьютерах, компакт-дисках, цифровой телефонии и других приложениях цифрового аудио. В потоке PCM , амплитуда аналогового сигнала дискретизируется регулярно с одинаковыми интервалами, и каждая выборка квантуется с точностью до ближайшего значение в диапазоне цифровых шагов.

Линейная импульсно-кодовая модуляция (LPCM ) - это особый тип ИКМ, в котором уровни квантования линейно однородны. Это контрастирует с кодированием PCM, в котором уровни квантования меняются в зависимости от амплитуды (как с алгоритмом A-закона или алгоритмом μ-закона ). Хотя PCM - более общий термин, он часто используется для описания данных, закодированных как LPCM.

У потока PCM есть два основных свойства, которые определяют точность потока исходному аналоговому сигналу: частота дискретизации, которая представляет собой количество выборок в секунду; и битовая глубина, которая определяет количество возможных цифровых значений, которые могут использоваться для представления каждой выборки.

Содержание
  • 1 История
    • 1.1 Цифровые аудиозаписи
    • 1.2 Цифровая телефония
  • 2 Реализации
  • 3 Модуляция
  • 4 Демодуляция
  • 5 Стандартная точность и частота дискретизации
  • 6 Ограничения
  • 7 Обработка и кодирование
  • 8 Кодирование для последовательной передачи
  • 9 Номенклатура
  • 10 См. Также
  • 11 Примечания
  • 12 Ссылки
  • 13 Дополнительная литература
  • 14 Внешние ссылки
История

Ранняя электрическая связь начиналась с выборки сигналов для мультиплексирования выборок из нескольких телеграфных источников и передачи их по одному телеграфный кабель. Американский изобретатель Мозес Г. Фармер передал телеграфное мультиплексирование с временным разделением (TDM) еще в 1853 году. Инженер-электрик В.М. Майнер в 1903 году использовал электромеханический коммутатор . для мультиплексирования с временным разделением множества телеграфных сигналов; он также применил эту технологию в телефонии. Он получал разборчивую речь из каналов, дискретизированных с частотой выше 3500–4300 Гц; более низкие ставки оказались неудовлетворительными.

В 1920 году в системе Бартлейнской кабельной передачи изображений использовалась телеграфная сигнализация символов, пробитых на бумажной ленте, для отправки образцов изображений , квантованных на 5 уровней. В 1926 году Пол М. Рейни из Western Electric запатентовал факсимильный аппарат, который передавал свой сигнал с использованием 5-битного ИКМ, кодированного оптико-механическим аналого-цифровым. конвертер. Машина не была запущена в производство.

Британский инженер Алек Ривз, не зная о предыдущей работе, задумал использовать PCM для голосовой связи в 1937 году, работая в International Telephone and Telegraph во Франции. Он описал теорию и преимущества, но практического применения не дал. Ривз подал заявку на патент во Франции в 1938 году, а его патент в США был получен в 1943 году. К этому времени Ривз начал работать в Исследовательском учреждении электросвязи.

Первая передача речи цифровыми методами., шифровальное оборудование SIGSALY, передавало высокоуровневую связь союзников во время Второй мировой войны. В 1943 году исследователи Bell Labs, разработавшие систему SIGSALY, узнали об использовании двоичного кодирования PCM, как это уже было предложено Ривзом. В 1949 году для системы DATAR ВМС Канады Ferranti Canada построила работающую радиосистему PCM, которая могла передавать оцифрованные радиолокационные данные на большие расстояния.

PCM in в конце 1940-х и начале 1950-х годов использовалась кодирующая трубка катодного луча с пластинчатым электродом , имеющим кодирующие перфорации. Как и в осциллографе , луч качался по горизонтали с частотой дискретизации, в то время как вертикальное отклонение контролировалось входным аналоговым сигналом, в результате чего луч проходил через верхние или нижние части перфорированной пластины. Пластина собирала или пропускала луч, создавая изменения тока в двоичном коде, по одному разряду за раз. Вместо естественного двоичного кода сетка более поздней трубки Гудолла была перфорирована для получения безошибочного кода Грея и генерировала все биты одновременно с использованием веерного луча вместо сканирующего луча.

В США Национальный зал славы изобретателей удостоил Бернарда М. Оливера и Клода Шеннона как изобретателей PCM, как описано в разделе «Система связи» Использование кодовой импульсной модуляции », США Патент 2,801,281, поданный в 1946 и 1952 гг., Выдан в 1956 г. Другой патент с тем же названием был подан Джоном Р. Пирсом в 1945 г. и выдан в 1948 г.: США. Патент 2437707. Трое из них опубликовали «Философию PCM» в 1948 году.

Система T-carrier, представленная в 1961 году, использует две линии передачи с витой парой для передачи 24 PCM телефонные звонки с дискретизацией 8 кГц и 8-битным разрешением. Эта разработка улучшила пропускную способность и качество вызова по сравнению с предыдущими схемами мультиплексирования с частотным разделением каналов.

В 1973 г. адаптивная дифференциальная импульсно-кодовая модуляция (ADPCM) была разработана П. Каммиски, Никилом Джаянтом и Джеймсом Л. Фланаганом.

Цифровые аудиозаписи

В 1967 году исследовательским центром NHK в Японии был разработан первый диктофон PCM. 12-битное устройство 30 кГц использовало компандер (аналогично DBX Noise Reduction ) для расширения динамического диапазона и сохраняло сигналы на видеомагнитофоне. В 1969 году NHK расширила возможности системы до 2-канального стерео и 13-битного разрешения 32 кГц. В январе 1971 года, используя систему записи PCM NHK, инженеры компании Denon записали первые коммерческие цифровые записи.

В 1972 году Denon представила первый 8-канальный цифровой рекордер DN-023R. в котором использовался 4-головочный видеомагнитофон с открытой катушкой для трансляции аудио с частотой 47,25 кГц, 13-битный PCM. В 1977 году компания Denon разработала портативную записывающую систему PCM DN-034R. Как и DN-023R, он записал 8 каналов с частотой 47,25 кГц, но использовал 14-битное "с акцентом, что эквивалентно 15.5 битам".

В 1979 году был выпущен первый цифровой был записан поп-альбом Bop till You Drop. Он был записан с частотой 50 кГц, 16-битным линейным PCM с использованием цифрового магнитофона 3M.

компакт-диск (CD) принес PCM в потребительские аудиоприложения с его появлением в 1982 году. CD использует частоту дискретизации 44,100 Гц и разрешение 16 бит и сохраняет до 80 минут стереозвука на диске.

Цифровая телефония

Быстрое развитие и широкое распространение PCM цифровой телефонии стало возможным благодаря металл-оксид-полупроводник (MOS) Технология коммутируемых конденсаторов (SC), разработанная в начале 1970-х годов. Это привело к разработке микросхем кодеков-фильтров PCM в конце 1970-х годов. Микросхема кодека-фильтра PCM silicon-gate CMOS (дополнительная МОП), разработанная Дэвидом А. Ходжесом и W.C. Black в 1980 году стал отраслевым стандартом цифровой телефонии. К 1990-м годам телекоммуникационные сети, такие как коммутируемая телефонная сеть общего пользования (PSTN), были в значительной степени оцифрованы с очень крупномасштабной интеграцией (VLSI) CMOS PCM кодек-фильтры, широко используемые в системах электронной коммутации для телефонных станций, пользовательских модемах и в широком диапазоне приложения цифровой передачи, такие как цифровая сеть с интегрированными услугами (ISDN), беспроводные телефоны и сотовые телефоны.

Реализации

PCM - это метод кодирования, обычно используемый для несжатого цифрового звука.

  • переключатель 4ESS ввел переключение с временным разделением в телефонную систему США в 1976 году на основе технологии интегральных схем среднего масштаба.
  • LPCM используется для кодирования аудиоданных без потерь на компакт-диске стандарт Red Book (неофициально также известный как Audio CD), введенный в 1982 году.
  • AES3 (определен в 1985 году, на основании которого S / PDIF есть на основе) - это особый формат, использующий LPCM.
  • LaserDiscs с цифровым звуком имеют дорожку LPCM на цифровом канале.
  • На ПК PCM и LPCM часто относятся к формату, используемому в WAV (определено в 1991 г.) и AIFF форматы аудиоконтейнеров (определено в 1988 г.). Данные LPCM также могут храниться в других форматах, таких как AU, необработанный аудиоформат (файл без заголовка) и различные форматы мультимедиа контейнеров..
  • LPCM был определен как часть DVD (с 1995 г.) и Blu-ray (с 2006 г.). Он также определен как часть различных форматов хранения цифрового видео и аудио (например, DV с 1995 года, AVCHD с 2006 года).
  • LPCM используется HDMI (определено в 2002 г.), интерфейс однокабельного цифрового аудио / видео разъема для передачи несжатых цифровых данных.
  • RF64 формат контейнера (определен в 2007 г.) использует LPCM, а также допускает поток битов без PCM. хранение: различные форматы сжатия, содержащиеся в файле RF64 в виде пакетов данных (Dolby E, Dolby AC3, DTS, MPEG-1 / MPEG-2 Audio), могут быть «замаскированы» как линейный PCM.
Модуляция
Выборка и квантование сигнала (красный) для 4-битного LPCM

На диаграмме синусоидальная волна (красная кривая) дискретизируется и квантуется для PCM. Синусоидальная волна дискретизируется через равные промежутки времени, показанные вертикальными линиями. Для каждой выборки выбирается одно из доступных значений (по оси Y). Процесс ИКМ обычно реализуется на единственной интегральной схеме, называемой аналого-цифровым преобразователем (ADC). Это дает полностью дискретное представление входного сигнала (синие точки), которое можно легко закодировать как цифровые данные для хранения или обработки. Несколько потоков PCM также могут быть мультиплексированы в более крупный совокупный поток данных, как правило, для передачи нескольких потоков по одному физическому каналу. Один метод называется мультиплексированием с временным разделением (TDM) и широко используется, особенно в современной телефонной системе общего пользования.

Демодуляция

Электроника, участвующая в создании точного аналогового сигнала из дискретных данных, аналогична электронике, используемой для генерации цифрового сигнала. Эти устройства представляют собой цифро-аналоговые преобразователи (ЦАП). Они вырабатывают напряжение или ток (в зависимости от типа), которое представляет значение, представленное на их цифровых входах. Этот выходной сигнал затем обычно фильтруется и усиливается для использования.

Чтобы восстановить исходный сигнал из дискретизированных данных, демодулятор может применить процедуру модуляции в обратном направлении. После каждого периода дискретизации демодулятор считывает следующее значение и переводит выходной сигнал на новое значение. В результате этих переходов сигнал сохраняет значительное количество высокочастотной энергии из-за эффектов изображения. Чтобы удалить эти нежелательные частоты, демодулятор пропускает сигнал через фильтр восстановления, который подавляет энергию за пределами ожидаемого диапазона частот (больше, чем частота Найквиста fs / 2 {\ displaystyle f_ {s} / 2}f_s / 2 ).

Стандартная точность и частота дискретизации

Общая глубина дискретизации для LPCM составляет 8, 16, 20 или 24 бита на образец..

LPCM кодирует один звуковой канал. Поддержка многоканального звука зависит от формата файла и зависит от синхронизации нескольких потоков LPCM. Хотя два канала (стерео) являются наиболее распространенным форматом, системы могут поддерживать до 8 аудиоканалов (объемный звук 7.1) или более.

Обычные частоты дискретизации: 48 кГц при использовании видео в формате DVD или 44,1 кГц при использовании на компакт-дисках. Частоты дискретизации 96 кГц или 192 кГц могут использоваться на некотором оборудовании, но преимущества обсуждались.

Ограничения

Теорема выборки Найквиста – Шеннона показывает, что устройства PCM могут работать без i вносить искажения в их разработанные полосы частот, если они обеспечивают частоту дискретизации, по крайней мере, в два раза выше самой высокой частоты, содержащейся во входном сигнале. Например, в телефонии полезная полоса речевой частоты находится в диапазоне приблизительно от 300 Гц до 3400 Гц. Поэтому для эффективного восстановления голосового сигнала в телефонных приложениях обычно используется частота дискретизации 8000 Гц, что более чем в два раза превышает самую высокую используемую голосовую частоту.

Несмотря на это, в любой системе PCM есть потенциальные источники ухудшения:

  • Выбор дискретного значения, которое близко, но не точно на уровне аналогового сигнала для каждой выборки, приводит к ошибке квантования.
  • Между выборками измерение сигнала не производится; теорема выборки гарантирует однозначное представление и восстановление сигнала только в том случае, если он не имеет энергии на частоте f s / 2 или выше (половина частоты дискретизации, известная как частота Найквиста ); более высокие частоты не будут правильно представлены или восстановлены и добавят искажения сглаживания к сигналу ниже частоты Найквиста.
  • Поскольку выборки зависят от времени, для точного воспроизведения требуются точные часы. Если синхронизация кодирования или декодирования нестабильна, эти недостатки будут напрямую влиять на качество вывода устройства.
Обработка и кодирование

Некоторые формы PCM сочетают обработку сигналов с кодированием. В более старых версиях этих систем обработка в аналоговой области применялась как часть аналого-цифрового процесса; более новые реализации делают это в цифровой сфере. Эти простые методы в значительной степени устарели современными методами сжатия звука на основе преобразования, такими как кодирование модифицированного дискретного косинусного преобразования (MDCT).

  • Линейный ИКМ (LPCM) - это ИКМ с линейным квантованием.
  • Дифференциальный ИКМ (DPCM) кодирует значения ИКМ как разности между текущим и прогнозируемым значением. Алгоритм предсказывает следующую выборку на основе предыдущих выборок, а кодировщик сохраняет только разницу между этим предсказанием и фактическим значением. Если прогноз является разумным, для представления той же информации можно использовать меньшее количество битов. Для звука этот тип кодирования уменьшает количество битов, требуемых на выборку, примерно на 25% по сравнению с PCM.
  • Adaptive DPCM (ADPCM) - это вариант DPCM, который изменяет размер шага квантования, чтобы позволить дальнейшее уменьшение требуемой полосы пропускания для данного отношения сигнал / шум.
  • Дельта-модуляция - это форма DPCM, которая использует один бит на выборку, чтобы указать, увеличивается или уменьшается сигнал по сравнению с предыдущим

В телефонии стандартный аудиосигнал для одного телефонного звонка кодируется как 8000 выборок в секунду, по 8 бит каждая, что дает цифровой сигнал со скоростью 64 кбит / с, известный как DS0. По умолчанию сжатие сигнала кодирует на DS0 либо μ-закон (mu-law) PCM (Северная Америка и Япония), либо A-law PCM (Европа и большая часть остального мира). Это системы логарифмического сжатия, в которых 12- или 13-битный номер линейной PCM-выборки отображается в 8-битное значение. Эта система описана в международном стандарте G.711.

. Если стоимость канала высока и потеря качества речи допустима, иногда имеет смысл еще больше сжимать голосовой сигнал. Алгоритм ADPCM используется для отображения серии 8-битных выборок PCM с µ-законом или A-законом в серию 4-битных выборок ADPCM. Таким образом, пропускная способность линии увеличивается вдвое. Этот метод подробно описан в стандарте G.726.

Форматы кодирования звука и аудиокодеки были разработаны для обеспечения дальнейшего сжатия. Некоторые из этих методов стандартизированы и запатентованы. Усовершенствованные методы сжатия, такие как MDCT и кодирование с линейным предсказанием (LPC), в настоящее время широко используются в мобильных телефонах, передаче голоса по IP (VoIP) и потоковое мультимедиа.

Кодирование для последовательной передачи

PCM может быть либо с возвратом к нулю (RZ), либо без возврата к нулю (NRZ). Для синхронизации системы NRZ с использованием внутриполосной информации не должно быть длинных последовательностей идентичных символов, таких как единицы или нули. Для двоичных систем PCM плотность 1-символов называется плотностью единиц.

Плотность единиц часто контролируется с использованием методов предварительного кодирования, таких как кодирование с ограничением длины серии, где код PCM расширяется до немного более длинного кода с гарантированным ограничением плотности единиц перед модуляцией в канал. В других случаях в поток добавляются дополнительные биты кадрирования, что гарантирует, по крайней мере, случайные переходы символов.

Другой метод, используемый для управления плотностью единиц, - это использование скремблера для данных, который будет стремиться превратить поток данных в поток, который выглядит псевдослучайным, но где данные могут быть восстановлены с помощью дополнительного дескремблера. В этом случае на выходе все еще возможны длинные серии нулей или единиц, но они считаются достаточно маловероятными для обеспечения надежной синхронизации.

В других случаях важно долгосрочное значение постоянного тока модулированного сигнала, поскольку создание смещения постоянного тока будет иметь тенденцию перемещать цепи связи из их рабочего диапазона. В этом случае принимаются специальные меры, чтобы вести подсчет кумулятивного смещения постоянного тока и при необходимости изменять коды, чтобы смещение постоянного тока всегда возвращалось к нулю.

Многие из этих кодов являются биполярными кодами, где импульсы могут быть положительными, отрицательными или отсутствовать. В типичном коде инверсии альтернативной метки ненулевые импульсы чередуются между положительными и отрицательными. Эти правила могут быть нарушены для генерации специальных символов, используемых для кадрирования или других специальных целей.

Слово «импульс» в термине «импульсно-кодовая модуляция» относится к «импульсам», обнаруживаемым в линии передачи. Это, возможно, является естественным следствием того, что этот метод развился вместе с двумя аналоговыми методами, широтно-импульсной модуляцией и импульсной позиционной модуляцией, в которых информация, которая должна быть закодирована, представлена ​​дискретными импульсами сигнала различной ширины или положения соответственно. В этом отношении ИКМ мало похож на эти другие формы кодирования сигналов, за исключением того, что все они могут использоваться при мультиплексировании с временным разделением, а номера кодов ИКМ представлены в виде электрических импульсов.

См. Также
Примечания
Ссылки
Дополнительная литература
Внешние ссылки
На Викискладе есть материалы, связанные с Pulse-code модуляция.
Последняя правка сделана 2021-06-02 10:39:22
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте