Выборка (обработка сигнала)

редактировать
Представление выборки сигнала. Непрерывный сигнал представлен зеленой линией, а дискретные выборки обозначены синими вертикальными линиями.

В обработке сигналов, выборка - это уменьшение сигнал непрерывного времени на сигнал дискретного времени. Типичный пример - преобразование звуковой волны (непрерывный сигнал) в последовательность выборок (сигнал с дискретным временем).

A образец - значение или набор значений в определенный момент времени и / или в пространстве. семплер - это подсистема или операция, которая извлекает выборки из непрерывного сигнала. Теоретический идеальный пробоотборник производит выборки, эквивалентные мгновенному значению непрерывного сигнала в желаемых точках.

Исходный сигнал можно извлечь из последовательности выборок до предела Найквиста, пропустив последовательность выборок через тип фильтра нижних частот, называемый фильтр реконструкции.

Содержание

  • 1 Теория
  • 2 Практические соображения
  • 3 Приложения
    • 3.1 Выборка звука
      • 3.1.1 Частота дискретизации
      • 3.1.2 Битовая глубина
      • 3.1.3 Выборка речи
    • 3.2 Выборка видео
    • 3.3 3D-выборка
  • 4 Недостаточная выборка
  • 5 Передискретизация
  • 6 Комплексная выборка
  • 7 См. Также
  • 8 Примечания
  • 9 Ссылки
  • 10 Дополнительная литература
  • 11 Внешние ссылки

Теория

Выборка может выполняться для функций, различающихся в пространстве, времени или любом другом измерении, и аналогичные результаты получаются в двух или более измерениях.

Для функций, которые меняются со временем, пусть s (t) будет непрерывной функцией (или «сигналом»), подлежащей выборке, и пусть выборка будет выполняться путем измерения значения непрерывной функции каждые T секунд, который называется интервалом выборки или периодом выборки . Затем функция дискретизации задается последовательностью :

s (nT) для целых значений n.

частота дискретизации или частота дискретизации, f s,- среднее число отсчетов, полученных за одну секунду (отсчетов в секунду), таким образом, fs= 1 / T .

Восстановление непрерывной функции из отсчетов выполняется с помощью алгоритмов интерполяции. Формула интерполяции Уиттекера – Шеннона математически эквивалентна идеальному фильтру нижних частот, вход которого представляет собой последовательность дельта-функций Дирака, которые модулируются (умножаются) выборкой ценности. Когда временной интервал между соседними выборками является константой (T), последовательность дельта-функций называется гребенкой Дирака. Математически модулированная гребенка Дирака эквивалентна произведению гребенчатой ​​функции на s (t). Эту чисто математическую абстракцию иногда называют импульсной дискретизацией.

Большинство дискретизированных сигналов не просто сохраняются и восстанавливаются. Но точность теоретической реконструкции - это обычная мера эффективности выборки. Эта точность снижается, когда s (t) содержит частотные компоненты, периодичность которых меньше двух отсчетов; или, что эквивалентно, отношение циклов к выборкам превышает 1/2 (см. наложение ). Количество ½ циклов / выборка × fsвыборок / сек = fs/ 2 цикла / сек (герц ) известно как частота Найквиста пробоотборник. Следовательно, s (t) обычно является выходным сигналом фильтра нижних частот, функционально известного как фильтр сглаживания. Без сглаживающего фильтра частоты выше частоты Найквиста будут влиять на выборки таким образом, что это неправильно интерпретируется процессом интерполяции.

Практические соображения

На практике дискретизируется непрерывный сигнал с использованием аналого-цифрового преобразователя (ADC), устройства с различными физическими ограничениями. Это приводит к отклонениям от теоретически совершенной реконструкции, которые вместе именуются искажением.

Могут возникать различные типы искажений, включая:

Хотя использование передискретизации может полностью устранить апертурную ошибку и наложение спектров за счет смещения их за пределы полосы пропускания, этот метод практически не может использоваться на частотах выше нескольких ГГц и может быть непомерно дорогим при больших затратах. более низкие частоты. Более того, хотя передискретизация может уменьшить ошибку квантования и нелинейность, она не может полностью их устранить. Следовательно, практические АЦП на звуковых частотах обычно не демонстрируют наложения спектров, ошибку апертуры и не ограничиваются ошибкой квантования. Вместо этого преобладает аналоговый шум. На ВЧ- и СВЧ-частотах, где передискретизация нецелесообразна, а фильтры дороги, ошибка апертуры, ошибка квантования и наложение спектров могут быть значительными ограничениями.

Джиттер, шум и квантование часто анализируются путем моделирования их как случайные ошибки, добавленные к значениям выборки. Эффекты интеграции и удержания нулевого порядка можно анализировать как форму фильтрации нижних частот. Нелинейность АЦП или ЦАП анализируется путем замены идеального отображения линейной функции предложенной нелинейной функцией.

Приложения

Выборка звука

Цифровое аудио использует импульсно-кодовую модуляцию (PCM) и цифровые сигналы для воспроизведения звука. Это включает аналого-цифровое преобразование (АЦП), цифро-аналоговое преобразование (ЦАП), хранение и передачу. По сути, система, обычно называемая цифровой, на самом деле является дискретным по времени аналогом с дискретным уровнем предыдущего электрического аналога. Хотя современные системы могут быть довольно хитрыми в своих методах, основная полезность цифровой системы - это способность сохранять, извлекать и передавать сигналы без потери качества.

Частота дискретизации

Обычно используемая единица измерения частоты дискретизации - это Гц, что означает Герц и означает «количество отсчетов в секунду». Например, 48 кГц - это 48 000 выборок в секунду.

Когда необходимо захватить звук, охватывающий весь диапазон 20–20 000 Гц человеческого слуха, например, при записи музыки или многих типов акустических событий, звуковые волны обычно дискретизируются с частотой 44,1 кГц (CD ), 48 кГц, 88,2 кГц или 96 кГц. Требование приблизительно двойной ставки является следствием теоремы Найквиста. Частота дискретизации выше, чем примерно от 50 кГц до 60 кГц не может предоставить более полезную информацию для слушателей. По этой причине первые производители профессионального аудио оборудования выбирали частоты дискретизации в диапазоне от 40 до 50 кГц.

В отрасли наблюдается тенденция к использованию частот дискретизации, значительно превышающих базовые требования: например, 96 кГц и даже 192 кГц. Несмотря на то, что ультразвуковые частоты не слышны для людей, запись и микширование с более высокой частотой дискретизации эффективен для устранения искажений, которые могут быть вызваны сглаживанием обратной связи. И наоборот, ультразвуковые звуки могут взаимодействовать и модулировать слышимую часть частотного спектра (интермодуляционные искажения ), ухудшая точность воспроизведения. Одним из преимуществ более высоких частот дискретизации является то, что они могут ослабить требования к конструкции фильтра нижних частот для АЦП и ЦАП, но с современными сигма-дельта преобразователями с передискретизацией это преимущество менее важно.

Audio Engineering Society рекомендует для большинства приложений частоту дискретизации 48 кГц, но обеспечивает распознавание до 44,1 кГц для компакт-дисков (CD) и других потребительских целей, 32 кГц для приложения, связанные с передачей, и 96 кГц для более широкой полосы пропускания или ослабленная фильтрация сглаживания. И Lavry Engineering, и J. Robert Stuart заявляют, что идеальная частота дискретизации должна быть около 60 кГц, но, поскольку это не стандартная частота, рекомендуют 88,2 или 96 кГц для целей записи.

Более полный список распространенных Частота дискретизации звука составляет:

Частота дискретизацииИспользуйте
8000 ГцТелефон и зашифрованный рацию, беспроводное переговорное устройство и беспроводной микрофон передача; адекватно человеческой речи, но без шипения (ess звучит как eff (/ s /, / f /)).
11,025 ГцЧетверть частоты дискретизации аудио компакт-дисков; используется для более низкого качества звука PCM, MPEG и для анализа звука в полосах частот сабвуфера.
16000 ГцШирокополосный расширение частоты по сравнению со стандартным телефоном узкополосным 8000 Гц. Используется в большинстве современных VoIP и коммуникационных продуктов.
22050 ГцПоловина частоты дискретизации аудио компакт-дисков; используется для аудио PCM и MPEG более низкого качества, а также для анализа звука низкочастотной энергии. Подходит для оцифровки аудиоформатов начала 20 века, таких как 78s и AM Radio.
32000 ГцminiDV цифровое видео видеокамера, видеокассеты с дополнительными каналами аудио (например, DVCAM с четырьмя каналами аудио), DAT (режим LP), немецкое Digitales Satellitenradio, NICAM цифровое аудио, используется вместе со звуком аналогового телевидения в некоторых странах. Высококачественные цифровые беспроводные микрофоны. Подходит для оцифровки FM-радио.
37,800 ГцАудио CD-XA
44,056 ГцИспользуется для цифрового звука, привязанного к NTSC цветным видеосигналам (3 образца на строку, 245 строк на поле, 59,94 поля в секунду = 29,97 кадров в секунду ).
44,100 Гц Audio CD, также чаще всего используется со звуком MPEG-1 (VCD, SVCD, MP3 ). Первоначально выбран Sony, потому что его можно было записывать на модифицированном видеооборудовании, работающем со скоростью 25 кадров в секунду (PAL) или 30 кадров / с (с использованием монохромного видеомагнитофона NTSC) и покрывать необходимую полосу пропускания 20 кГц соответствовать профессиональному аналоговому записывающему оборудованию того времени. Адаптер PCM поместил бы образцы цифрового звука в аналоговый видеоканал, например, видеокассет PAL, используя 3 образца на строку, 588 строк на кадр, 25 кадров в секунду.
47250 Гцпервый в мире коммерческий PCM диктофон от Nippon Columbia (Denon)
48000 ГцСтандартная выборка звука скорость, используемая профессиональным цифровым видеооборудованием, таким как магнитофоны, видеосерверы, видеомикшеры и т. д. Эта скорость была выбрана потому, что она могла восстанавливать частоты до 22 кГц и работать с видео NTSC 29,97 кадров в секунду, а также с системами 25 кадров / с, 30 кадров / с и 24 кадра / с. В системах со скоростью 29,97 кадров / с необходимо обрабатывать 1601,6 отсчетов звука на кадр, обеспечивая целое число отсчетов звука только на каждый пятый видеокадр. Также используется для звука в потребительских видеоформатах, таких как DV, цифровое телевидение, DVD и фильмы. Профессиональный последовательный цифровой интерфейс (SDI) и последовательный цифровой интерфейс высокой четкости (HD-SDI), используемые для соединения телевизионного оборудования вместе, используют эту частоту дискретизации звука. Большинство профессиональных аудиоустройств используют дискретизацию 48 кГц, включая микшерные пульты и устройства цифровой записи.
50,000 ГцПервые коммерческие цифровые аудиомагнитофоны конца 70-х годов от 3M и Soundstream.
50,400 ГцЧастота дискретизации, используемая Mitsubishi X-80 цифровой аудиомагнитофон.
64000 ГцНечасто используется, но поддерживается некоторым оборудованием и программным обеспечением.
88200 ГцЧастота дискретизации, используемая некоторым профессиональным записывающим оборудованием, когда местом назначения является компакт-диск (кратное 44100 Гц). Некоторое профессиональное звуковое оборудование использует (или может выбирать) дискретизацию 88,2 кГц, включая микшеры, эквалайзеры, компрессоры, реверберацию, кроссоверы и записывающие устройства.
96000 ГцDVD-Audio, некоторые LPCM дорожки DVD, аудиодорожки BD-ROM (диск Blu-ray), HD DVD (DVD высокой четкости) аудиодорожки. Некоторое профессиональное записывающее и производственное оборудование может выбирать дискретизацию 96 кГц. Эта частота дискретизации вдвое превышает стандарт 48 кГц, обычно используемый для звука на профессиональном оборудовании.
176 400 ГцЧастота дискретизации, используемая рекордерами HDCD и другими профессиональными приложениями для производства компакт-дисков. В четыре раза больше частоты 44,1 кГц.
192000 ГцDVD-Audio, некоторые LPCM дорожки DVD, аудиодорожки BD-ROM (диск Blu-ray) и HD DVD (DVD высокой четкости) аудиодорожки, записывающие устройства высокой четкости и программное обеспечение для редактирования аудио. Эта частота дискретизации в четыре раза превышает стандарт 48 кГц, обычно используемый для звука на профессиональном видеооборудовании.
352,800 ГцDigital eXtreme Definition, используется для записи и редактирования Super Audio CD, поскольку 1-битный Direct Stream Digital (DSD) не подходит для редактирование. В восемь раз больше частоты 44,1 кГц.
2,822,400 ГцSACD, 1-битная дельта-сигма модуляция, процесс, известный как Direct Stream Digital, совместно разработанный Sony и Philips.
5644800 ГцDSD с двойной скоростью, 1-бит Direct Stream Digital с удвоенной скоростью SACD. Используется в некоторых профессиональных записывающих устройствах DSD.
11,289,600 ГцQuad-Rate DSD, 1-бит Direct Stream Digital при 4-кратной скорости SACD. Используется в некоторых необычных профессиональных записывающих устройствах DSD.
22,579,200 ГцOctuple-Rate DSD, 1-бит Direct Stream Digital с 8-кратной скоростью SACD. Используется в редких экспериментальных DSD-рекордерах. Также известен как DSD512.

Битовая глубина

Аудио обычно записывается с 8-, 16- и 24-битной глубиной, что дает теоретическое максимальное отношение сигнал / шум квантования (SQNR) для чистой синусоидальной волны примерно 49,93 дБ, 98,09 дБ и 122,17 дБ. Аудио качества CD использует 16-битные семплы. Тепловой шум ограничивает истинное количество битов, которые могут использоваться при квантовании. Некоторые аналоговые системы имеют отношение сигнал / шум (SNR), превышающее 120 дБ. Однако операции обработки цифрового сигнала могут иметь очень высокий динамический диапазон, следовательно, обычно выполняются операции микширования и мастеринга с 32-битной точностью, а затем преобразовываются в 16- или 24-битные для распределения.

Выборка речи

Речевые сигналы, то есть сигналы, предназначенные для передачи только человеческой речи, обычно могут быть дискретизированы с гораздо меньшей частотой. Для большинства фонем почти вся энергия содержится в диапазоне от 100 Гц до 4 кГц, что обеспечивает частоту дискретизации 8 кГц. Это частота дискретизации, используемая почти всеми телефонными системами , в которых используются спецификации дискретизации и квантования G.711.

Видеовыборка

В телевидении стандартной четкости (SDTV) используются либо 720 на 480 пикселей (США NTSC 525 строк), либо 720 на 576 пикселей (Великобритания PAL 625 строк) для видимой области изображения.

Телевидение высокой четкости (HDTV) использует 720p (прогрессивный), 1080i (чересстрочный) и 1080p (прогрессивный, также известный как Full HD).

В цифровом видео временная частота дискретизации определяется как частота кадров - или, скорее, частота полей - а не условная. Частота дискретизации изображения - это частота повторения периода интеграции датчика. Поскольку период интегрирования может быть значительно короче, чем время между повторениями, частота дискретизации может отличаться от обратной величины времени дискретизации:

  • 50 Гц - PAL video
  • 60 / 1,001 Гц ~ = 59,94 Гц - NTSC видео

Видео цифро-аналоговые преобразователи работают в мегагерцовом диапазоне (от ~ 3 МГц для низкокачественных композитных видео масштабаторов в ранних играх). консолей, до 250 МГц или более для вывода VGA с самым высоким разрешением).

Когда аналоговое видео конвертируется в цифровое видео, происходит другой процесс выборки, на этот раз с частотой пикселя, соответствующей пространственной частоте дискретизации вдоль линий развертки. Обычная частота дискретизации пикселя составляет:

Пространственная дискретизация в другом направлении определяется интервалом строк развертки в растре . Частоту дискретизации и разрешение в обоих пространственных направлениях можно измерить в единицах строк на высоту изображения.

Пространственное наложение высокочастотных яркости или цветности видеокомпонентов отображается как муаровый узор.

3D-выборка

Процесс объемного рендеринга производит выборку трехмерной сетки из вокселей для создания 3D-визуализации срезанных (томографических) данных. Предполагается, что трехмерная сетка представляет собой непрерывную область трехмерного пространства. Объемная визуализация широко используется в медицинской визуализации, рентгеновской компьютерной томографии (CT / CAT), магнитно-резонансной томографии (MRI), позитронно-эмиссионной томографии (PET) вот несколько примеров. Он также используется для сейсмической томографии и других приложений.

Два верхних графика изображают преобразования Фурье двух разных функций, которые дают одинаковые результаты при дискретизации с определенной частотой. Функция основной полосы частот дискретизируется быстрее, чем ее частота Найквиста, а функция полосы частот дискретизируется недостаточно, что эффективно преобразует ее в модулирующую полосу. На нижних графиках показано, как идентичные спектральные результаты создаются псевдонимами процесса выборки.

Недостаточная выборка

Когда полосовой сигнал дискретизируется медленнее, чем его частота Найквиста, выборки неотличимы от выборок низкочастотного псевдонима высокочастотного сигнала. Это часто делается специально таким образом, чтобы псевдоним самой низкой частоты удовлетворял критерию Найквиста, потому что полосовой сигнал по-прежнему уникально представлен и может быть восстановлен. Такая недостаточная выборка также известна как полосовая выборка, гармоническая выборка, выборка ПЧ и прямое преобразование ПЧ в цифровое преобразование.

Передискретизация

Передискретизация используется в большинстве современных аналогово-цифровых устройств. -цифровые преобразователи для уменьшения искажений, вносимых практичными цифро-аналоговыми преобразователями, такими как удержание нулевого порядка вместо идеализаций, таких как формула интерполяции Уиттекера – Шеннона.

Комплексная выборка

Комплексная выборка (I / Q выборка ) - это одновременная выборка двух разных, но связанных сигналов, в результате чего образуются пары выборок, которые впоследствии обрабатываются как комплексные числа. Когда один сигнал , s ^ ​​(t), {\ displaystyle, {\ hat {s}} (t),}, {\ hat s} (t), является преобразованием Гильберта другого сигнала , s (t), {\ displaystyle, s (t), \,}, s (t), \, комплексная функция, sa (t) ≜ s (t) + i ⋅ s ^ ( t), {\ displaystyle s_ {a} (t) \ треугольник s (t) + i \ cdot {\ hat {s}} (t),}{\ Displaystyle s_ {a} (t) \ треугольник s (t) + я \ cdot {\ hat {s}} (t),} называется аналитическим сигналом, преобразование Фурье которого равно нулю для всех отрицательных значений частоты. В этом случае частота Найквиста для сигнала без частот ≥ B может быть уменьшена до B (комплексных отсчетов в секунду) вместо 2B (реальных отсчетов в секунду). Более очевидно, что эквивалентная форма волны основной полосы частот, sa (t) ⋅ e - i 2 π B 2 t, {\ displaystyle s_ {a} (t) \ cdot e ^ {- i2 \ pi {\ frac {B} {2}} t},}{\ displaystyle s_ {a} (t) \ cdot e ^ {- i2 \ pi {\ frac {B} {2}} t},} также имеет коэффициент Найквиста B, потому что все его ненулевое частотное содержание сдвинуто в интервал [-B / 2, B / 2).

Хотя выборки с комплексным знаком можно получить, как описано выше, они также создаются путем манипулирования выборками формы сигнала с действительным знаком. Например, эквивалентная форма сигнала основной полосы частот может быть создана без явного вычисления s ^ (t), {\ displaystyle {\ hat {s}} (t),}{\ hat s} (t), путем обработки последовательности произведения , [s (n T) ⋅ е - я 2 π B 2 T n], {\ displaystyle, \ left [s (nT) \ cdot e ^ {- i2 \ pi {\ frac {B} {2}} Tn} \ right],}{\ displaystyle, \ left [s (nT) \ cdot e ^ {- i2 \ pi {\ frac { B} {2}} Tn} \ right],} через цифровой фильтр нижних частот, частота среза которого равна B / 2. Вычисление только каждой второй выборки выходной последовательности снижает частоту дискретизации соразмерно уменьшенной частоте Найквиста. Результат - вдвое меньше комплексных выборок, чем исходное количество реальных выборок. Информация не теряется, и при необходимости можно восстановить исходную форму сигнала s (t).

См. Также

Примечания

Ссылки

Дополнительная литература

  • Мэтт Фарр, Венцель Якоб и Грег Хамфрис, Физически обоснованный рендеринг: от теории к реализации, 3-е изд., Морган Кауфманн, ноябрь 2016. ISBN 978-0128006450. Глава о выборке (доступна в Интернете ) красиво написана с диаграммами, основной теорией и образцом кода.

Внешние ссылки

Последняя правка сделана 2021-06-06 09:27:41
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте