Подвыборка цветности

редактировать

Подвыборка цветности - это практика кодирования изображений с меньшим разрешением для информации о цветности , чем для информации яркости, используя более низкую остроту зрения человеческой зрительной системы в отношении цветовых различий, чем для яркости.

Он используется во многих схемах кодирования видео - как аналоговых, так и цифровых - а также в кодировке JPEG.

Содержание

  • 1 Обоснование
    • 1.1 Как работает подвыборка
  • 2 Системы и соотношения выборки
  • 3 Типы выборки и подвыборки
    • 3,1 4: 4: 4
    • 3,2 4: 2: 2
    • 3,3 4: 2: 1
    • 3,4 4: 1: 1
    • 3,5 4: 2: 0
    • 3,6 4: 1: 0
    • 3,7 3: 1: 1
  • 4 Артефакты
    • 4.1 Гамма-ошибка
    • 4.2 Цвета за пределами гаммы
  • 5 Терминология
  • 6 История
  • 7 См. Также
  • 8 Ссылки
  • 9 Внешние ссылки

Обоснование

В полноразмерном это изображение показывает разницу между четырьмя схемами субдискретизации. Обратите внимание, насколько похожи цветные изображения. Нижняя строка показывает разрешение информации о цвете.

Цифровые сигналы часто сжимаются для уменьшения размера файла и экономии времени передачи. Поскольку человеческая зрительная система гораздо более чувствительна к изменениям яркости, чем к цвету, видеосистему можно оптимизировать, выделив больше полосы пропускания компоненту яркости (обычно обозначаемому Y '), чем компонентам цветового различия Cb и Cr. В сжатых изображениях, например, для схемы 4: 2: 2 Y'CbCr требуется две трети полосы пропускания без субдискретизации «4: 4: 4» R'G'B '. Это уменьшение приводит к почти отсутствию визуальных различий, воспринимаемых зрителем.

Как работает подвыборка

Поскольку человеческая зрительная система менее чувствительна к положению и движению цвета, чем яркость, полоса пропускания может быть оптимизирована сохраняя больше деталей яркости, чем деталей цвета. На нормальных расстояниях просмотра отсутствуют ощутимые потери, вызванные выборкой цветных деталей с более низкой скоростью, то есть с более низким разрешением. В видеосистемах это достигается за счет использования компонентов цветового различия. Сигнал делится на компонент яркости (Y ') и два компонента цветового различия (цветность ). Для получения значений цветности с пониженным разрешением можно использовать различные методы фильтрации.

Яркость (Y ') отличается от яркости (Y) наличием гаммы исправление в его вычислении, поэтому здесь добавлен главный символ. Сигнал с гамма-коррекцией имеет то преимущество, что имитирует логарифмическую чувствительность человеческого зрения, с большим количеством уровней, выделенных для более темных уровней, чем для более светлых. В результате он повсеместно используется в исходном сигнале тристимула, на входе R'G'B '. Примеры таких цветовых пространств включают sRGB, TV Rec. 601, Рек. 709 и Рек. 2020 ; эта концепция также обобщена для оптических передаточных функций в Рек. 2020.

Системы и соотношения выборки

Схема субдискретизации обычно выражается в виде трехчастного отношения J: a: b (например, 4: 2: 2) или четырех частей, если присутствует альфа-канал (например, 4: 2: 2: 4), которые описывают количество выборок яркости и цветности в концептуальной области, которая имеет ширину J пикселей и высоту 2 пикселя. Части (в их соответствующем порядке):

  • J: горизонтальный эталон выборки (ширина концептуальной области). Обычно 4.
  • a: количество выборок цветности (Cr, Cb) в первой строке пикселей J.
  • b: количество изменений выборок цветности (Cr, Cb) между первыми и вторая строка из J пикселей. Обратите внимание, что b должно быть либо нулем, либо равно a (за исключением редких случаев, таких как 4: 4: 1 и 4: 2: 1, которые не соответствуют этому соглашению).
  • Alpha : горизонтальный коэффициент ( относительно первой цифры). Может быть опущено, если альфа-компонент отсутствует, и равен J., если присутствует.

Это обозначение не действует для всех комбинаций и имеет исключения, например 4: 1: 0 (где высота области составляет не 2 пикселя, а 4 пикселя, поэтому, если используется 8 бит на компонент, носитель будет 9 бит на пиксель) и 4: 2: 1.

Пояснительное изображение различных схем субдискретизации цветности можно увидеть по следующей ссылке: http://lea.hamradio.si/~s51kq/subsample.gif (источник: «Основы Видео »: https://web.archive.org/web/20080915101832/http://lea.hamradio.si/~s51kq/V-BAS.HTM ) или подробнее в Chrominance Субдискретизация в цифровых изображениях, Дуглас Керр.

4: 1: 14: 2: 04: 2: 24: 4: 44: 4: 0
Y'CrCb
=====
Y'
+++++
1234J = 41234J = 41234J = 41234J = 41234J = 4
(Cr, Cb)1a = 112a = 212a = 21234a = 41234a = 4
1b = 1b = 012b = 21234b = 4b = 0
¼ разрешение по горизонтали,. полное разрешение по вертикали½ разрешение по горизонтали,. ½ разрешение по вертикали½ разрешение по горизонтали,. полное разрешение по вертикалиполное горизонтальное разрешение,. полное разрешение по вертикалиполное разрешение по горизонтали,. ½ вертикального разрешения

Приведенные примеры отображения являются только теоретическими и для иллюстрации. Также обратите внимание, что диаграмма не указывает на фильтрацию цветности, которую следует применять, чтобы избежать наложения спектров.

Для расчета необходимого коэффициента пропускной способности относительно 4: 4: 4 (или 4: 4: 4: 4) необходимо суммировать все факторы и разделить результат на 12 (или 16, если присутствует альфа).

Типы выборки и субдискретизации

4: 4: 4

Каждый из трех компонентов Y'CbCr имеет одинаковую частоту дискретизации, поэтому нет субдискретизации цветности. Эта схема иногда используется в высококачественных пленочных сканерах и в постпродакшне кинематографа.

Обратите внимание, что «4: 4: 4» вместо этого может относиться к цветовому пространству R'G'B ', которое неявно также не имеет подвыборки цветности. Такие форматы, как HDCAM SR, могут записывать 4: 4: 4 R'G'B 'по двухканальному HD-SDI.

4: 2: 2

Два Компоненты цветности дискретизируются с половиной горизонтальной частоты дискретизации яркости: горизонтальное разрешение цветности уменьшается вдвое. Это сокращает полосу пропускания несжатого видеосигнала на одну треть.

Эта схема используется во многих высококачественных цифровых видеоформатах и ​​интерфейсах:

4: 2: 1

Эта выборка режим не выражается в обозначении J: a: b. «4: 2: 1» - устаревший термин из предыдущей схемы записи, и очень немногие программные или аппаратные кодеки используют его. Cb горизонтальное разрешение вдвое меньше, чем Cr (и четверть горизонтального разрешения Y ).

4: 1: 1

В субдискретизации цветности 4: 1: 1 горизонтальное цветовое разрешение делится на четыре части, а полоса пропускания уменьшается вдвое по сравнению с отсутствием субдискретизации цветности. Первоначально субдискретизация цветности 4: 1: 1 формата DV не считалась качеством широковещательной передачи и была приемлемой только для бюджетных и потребительских приложений. Однако форматы на основе DV (некоторые из которых используют субдискретизацию цветности 4: 1: 1) профессионально используются при сборе электронных новостей и на серверах воспроизведения. DV также время от времени использовался в художественных фильмах и в цифровой кинематографии.

. В системе NTSC, если яркость дискретизируется на частоте 13,5 МГц, это означает, что Cr и Cb Каждый сигнал будет дискретизирован с частотой 3,375 МГц, что соответствует максимальной полосе Найквиста 1,6875 МГц, тогда как традиционный «высококачественный аналоговый кодировщик NTSC для широковещательной передачи» будет иметь полосу пропускания Найквиста 1,5 МГц и 0,5 МГц для I / Q каналы. Однако в большинстве устройств, особенно в дешевых телевизорах и видеомагнитофонах VHS / Betamax, каналы цветности имеют полосу пропускания только 0,5 МГц для Cr и Cb (или эквивалентно для I / Q).. Таким образом, система DV на самом деле обеспечивает превосходную цветовую полосу по сравнению с лучшими композитными аналоговыми характеристиками для NTSC, несмотря на то, что она имеет только 1/4 полосы цветности «полного» цифрового сигнала.

Форматы, в которых используется субдискретизация цветности 4: 1: 1, включают:

4: 2: 0

В 4: 2: 0 горизонтальная выборка удваивается по сравнению с 4: 1: 1, но как Каналы Cb и Cr выбираются только на каждой альтернативной строке в этой схеме, вертикальное разрешение уменьшается вдвое. Таким образом, скорость передачи данных такая же. Это достаточно хорошо подходит для PAL система кодирования цвета, поскольку она имеет только половину вертикального разрешения цветности NTSC. Она также очень хорошо сочетается с системой кодирования цвета SECAM, поскольку, как и этот формат, 4: 2 : 0 сохраняет и передает только один цветовой канал на строку (другой канал восстанавливается из предыдущей строки). Однако на самом деле было произведено немного оборудования, которое выводит аналоговый видеосигнал SECAM. В общем, территории SECAM должны использовать PAL -возможный дисплей или транскодер для преобразования сигнала PAL в SECAM f или дисплей.

Различные варианты конфигураций цветности 4: 2: 0 находятся в:

Cb и Cr каждая субдискретизируется с коэффициентом 2 как по горизонтали, так и по вертикали.

Существует три варианта схем 4: 2: 0, имеющих различное горизонтальное и вертикальное расположение.

  • В MPEG-2 Cb и Cr располагаются по горизонтали. Cb и Cr располагаются между пикселями в вертикальном направлении (размещаются в межстраничном пространстве).
  • В JPEG / JFIF, H.261 и MPEG-1, Cb и Cr размещаются промежуточно, на полпути между альтернативными выборками яркости.
  • В 4: 2: 0 DV, Cb и Cr совмещены в горизонтальном направлении. В вертикальном направлении они размещаются в чередующихся строках.

Большинство цифровых видеоформатов, соответствующих PAL, используют субдискретизацию цветности 4: 2: 0, за исключением DVCPRO25, в котором используется субдискретизация цветности 4: 1: 1. Обе схемы 4: 1: 1 и 4: 2: 0 сокращают полосу пропускания вдвое по сравнению с отсутствием субдискретизации цветности.

Для материала с чересстрочной разверткой субдискретизация цветности 4: 2: 0 может привести к артефактам движения, если она реализована таким же образом, как и для материала с прогрессивной разверткой. Выборки яркости получаются из отдельных временных интервалов, а образцы цветности - из обоих временных интервалов. Именно эта разница может приводить к артефактам движения. Стандарт MPEG-2 допускает альтернативную схему чересстрочной выборки, при которой 4: 2: 0 применяется к каждому полю (а не к обоим полям одновременно). Это решает проблему артефактов движения, уменьшает разрешение цветности по вертикали вдвое и может вносить в изображение гребенчатые артефакты.

444-original-single-field.png . Оригинал. Это изображение показывает одно поле. К движущемуся тексту применено размытие в движении.

420 -gressive-single-field.png . 4: 2: 0 прогрессивная дискретизация, применяемая к движущемуся чересстрочному материалу. Обратите внимание, что цветность ведет и следует за движущимся текстом. На этом изображении показано одно поле.

420-чересстрочный- single-field.png . 4: 2: 0 чересстрочная выборка, применяемая к движущемуся чересстрочному материалу. На этом изображении показано одно поле.

Однако в чересстрочной схеме 4: 2: 0 разрешение цветности по вертикали уменьшается примерно вдвое, поскольку образцы цветности эффективно описывают область шириной 2 отсчета и высотой 4 отсчета вместо 2 × 2. Кроме того, пространственное смещение между обоими полями может привести к появлению гребенчатых артефактов цветности.

420-original444.png . Исходное неподвижное изображение.

420 -gressive-still.png . 4: 2: 0 прогрессивная дискретизация, применяемая к неподвижному изображению. Показаны оба поля.

420-interlaced-still.png . 4: 2: 0 чересстрочная выборка, примененная к неподвижному изображению. Показаны оба поля.

Если чересстрочный материал должен быть де-чересстрочным, гребенчатые артефакты цветности (от чересстрочной выборки 4: 2: 0) можно удалить, размыв цветность по вертикали.

4: 1: 0

Это соотношение возможно, и некоторые кодеки его поддерживают, но широко не используется. Это соотношение использует половину вертикального и четверть горизонтального цветового разрешения с использованием только одной восьмой полосы пропускания максимального используемого цветового разрешения. Несжатое видео в этом формате с 8-битным квантованием использует 10 байтов для каждого макропикселя (что составляет 4 × 2 пикселя). Он имеет эквивалентную ширину полосы цветности сигнала PAL I, декодированного с помощью декодера линии задержки, и все же намного превосходит NTSC.

  • Некоторые видеокодеки могут работать с 4: 1: 0,5 или 4: 1: 0,25 в качестве опции, чтобы обеспечить качество, аналогичное VHS.

3: 1: 1

Используется Sony в своих рекордерах HDCAM High Definition (не HDCAM SR). В горизонтальном измерении яркость дискретизируется по горизонтали с тремя четвертями частоты дискретизации Full HD - 1440 отсчетов на строку вместо 1920. Цветность дискретизируется с 480 отсчетами на строку, что составляет треть частоты дискретизации яркости.

В вертикальном измерении и яркость, и цветность дискретизируются с частотой дискретизации Full HD (1080 отсчетов по вертикали).

Артефакты

Исходное изображение без субдискретизации цвета. 200% масштабирование. Изображение после субдискретизации цвета (кодек Sony Vegas DV, блочная фильтрация.) Обратите внимание на растекание светлоты около границ.

Субдискретизация цветности страдает от двух основных типов артефактов, вызывающих более заметное ухудшение чем предполагалось, где цвета резко меняются.

Гамма-ошибка

Гамма-скорректированные сигналы, такие как Y'CbCr, имеют проблемы, когда ошибки цветности "просачиваются" в яркость. В этих сигналах низкая цветность фактически делает цвет менее ярким, чем цвет с эквивалентной яркостью. В результате, когда насыщенный цвет смешивается с ненасыщенным или дополнительным цветом, на границе происходит потеря яркости. Это можно увидеть на примере между пурпурным и зеленым. Чтобы получить набор субдискретизированных значений, который более похож на исходный, необходимо отменить гамма-коррекцию, выполнить вычисление и затем вернуться в пространство с гамма-коррекцией. Также возможны более эффективные аппроксимации, такие как средневзвешенное значение яркости или итеративно с помощью таблиц поиска в WebP и функции sjpeg "Sharp YUV".

Цвета вне гаммы

Другой артефакт, который может возникать при подвыборке цветности, заключается в том, что цвета вне гаммы могут возникать при реконструкции цветности. Предположим, что изображение состоит из чередующихся красных и черных линий размером в 1 пиксель, а при субдискретизации пропущена цветность для черных пикселей. Цветность красных пикселей будет реконструирована на черные пиксели, в результате чего новые пиксели будут иметь положительные красные и отрицательные зеленые и синие значения. Поскольку дисплеи не могут выводить отрицательный свет (отрицательный свет не существует), эти отрицательные значения будут фактически обрезаны, и результирующее значение яркости будет слишком высоким. Подобные артефакты возникают в менее искусственном примере градации около довольно резкой границы красный / черный.

Другие типы фильтрации во время субдискретизации также могут привести к выходу цветов за пределы гаммы.

Терминология

Термин Y'UV относится к схеме аналогового кодирования, а Y'CbCr относится к схеме цифрового кодирования. Одно различие между ними заключается в том, что масштабные коэффициенты для компонентов цветности (U, V, Cb и Cr) разные. Однако термин YUV часто ошибочно используется для обозначения кодировки Y'CbCr. Следовательно, выражения типа «4: 2: 2 YUV» всегда относятся к 4: 2: 2 Y'CbCr, поскольку в аналоговой кодировке (например, YUV) просто не существует такой вещи, как 4: x: x.

Аналогичным образом термин яркость и символ Y часто ошибочно используются для обозначения яркости, которая обозначается символом Y '. Обратите внимание, что яркость (Y ') видеоинженерии отличается от яркости (Y) науки о цвете (как определено в CIE ). Яркость формируется как взвешенная сумма гамма-скорректированных (трехцветных) компонентов RGB. Яркость формируется как взвешенная сумма линейных (трехцветных) компонентов RGB.

На практике символ CIE Y часто неправильно используется для обозначения яркости. В 1993 г. SMPTE приняла Инженерное руководство EG 28, разъясняющее эти два термина. Обратите внимание, что главный символ 'используется для обозначения гамма-коррекции.

Точно так же цветность / цветность видеоинженерии отличается от цветности науки о цвете. Цветность / цветность видеоинженерии формируется из взвешенных трехцветных компонентов, а не из линейных компонентов. В видеоинженерной практике термины цветность, цветность и насыщенность часто используются как синонимы для обозначения цветности.

История

Подвыборка цветности была разработана в 1950-х годах для развития цветного телевидения компанией RCA, которая превратилась в стандарт NTSC ; Разделение яркости и цветности было разработано ранее, в 1938 году Жоржем Валенси. Посредством исследований он показал, что человеческий глаз имеет высокое разрешение только для черного и белого, несколько меньше для «средних» цветов, таких как желтый и зеленый, и гораздо меньше для цветов на конце спектра, красного и синего. Использование этих знаний позволило RCA разработать систему, в которой они отбрасывали большую часть синего сигнала после того, как он исходит от камеры, сохраняя большую часть зеленого и только часть красного; это субдискретизация цветности в цветовом пространстве YIQ, которая примерно аналогична субдискретизации 4: 2: 1 в том, что она имеет уменьшающееся разрешение для яркости, желтого / зеленого и красного / синего цветов.

См. Также

Ссылки

  • Пойнтон, Чарльз. «Цифровое видео и HDTV: алгоритмы и интерфейсы». США: Morgan Kaufmann Publishers, 2003.
  • Керр, Дуглас А. «Субдискретизация цветности в цифровых изображениях» [1]

Внешние ссылки

Последняя правка сделана 2021-05-15 03:34:32
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте