Сжатие данных

редактировать
Процесс кодирования информации с использованием меньшего количества битов, чем исходное представление

В обработка сигналов, сжатие данных, кодирование источника или уменьшение скорости передачи данных - это процесс кодирования информации с использованием меньшего количества бит чем исходное представление. Любое конкретное сжатие - либо с потерями, либо без потерь. Сжатие без потерь уменьшает количество битов за счет и устранение статистической избыточности. Никакая информация не теряется при сжатии без потерь. Сжатие с потерями уменьшает количество битов, удаляя ненужную или менее важную информацию. Обычно устройство, блокирующее работу процесса, называется кодером, устройством, отвечающим за обращение процесса (декомпрессию), - кодером.

Процесс уменьшения размера файла данных часто называется сжатием данных. В контексте передачи данных это называется кодированием источника; кодирование выполняет в источнике данных перед их сохранением или передачей. Кодирование источника не следует путать с канальным кодированием для обнаружения и исправления ошибок или строковым кодированием, средство для отображения данных на сигнал.

Сжатие полезно, потому что оно уменьшает ресурсы, необходимые для хранения и передачи данных. Вычислительные ресурсы потребляются в процессах сжатия и распаковки. Сжатие данных является предметом компромисса между пространственно-временной сложностью. Например, схема сжатия для видео может потребовать дорогостоящего оборудования для достаточно быстрого распаковывания видео, чтобы его можно было просмотреть во время распаковки, а также возможность полной распаковки видео. перед просмотром это может быть неудобно или потребовать дополнительного хранилища. При разработке сжатия данных используются компромиссы между различными факторами, включая степень сжатия, используемого искажения (при использовании сжатия данных с потерями ) и вычислительные ресурсы, необходимые для сжатия и распаковки данных..

Содержание

  • 1 Без потерь
  • 2 С потерями
  • 3 Теория
    • 3.1 Машинное обучение
    • 3.2 Различие данных
  • 4 Использование
    • 4.1 Изображение
    • 4.2 Аудио
      • 4.2.1 Сжатие аудио с потерями
        • 4.2.1.1 Методы кодирования
        • 4.2.1.2 Кодирование речи
      • 4.2.2 История
    • 4.3 Видео
      • 4.3.1 Теория кодирования
        • 4.3.1.1 Меж-кодирование кадра
      • 4.3.2 Гибридные форматы блочного преобразования
      • 4.3.3 История
    • 4.4 Генетика
  • 5 Перспективы и неиспользуемый в настоящее время потенциал
  • 6 См. также
  • 7 Ссылки
  • 8 Внешние ссылки

Без потерь

Сжатие данных без потерь алгоритмы обычно используют статистическую избыточность для представления данных без потерь информации, так что процесс обратимо. Сжатие без потерь возможно, потому что большинство реальных данных демонстрируют статистическую избыточность. Например, изображение может иметь участки цвета, которые не меняются на несколько пикселей; вместо кодирования «красный пиксель, красный пиксель…» данные могут быть закодированы как «279 красных пикселей». Это базовый пример кодирования длин серий ; существует множество уменьшения размера файла за счет устранения избыточности.

Методы сжатия Лемпеля - Зива (LZ) являются одними из самых популярных алгоритмов для хранения без потерь. DEFLATE - это вариант LZ, оптимизированный для скорости распаковки и сжатия, но сжатие может быть медленным. В середине 1980-х, после работы Терри Велча, алгоритм Лемпеля - Зива - Велча (LZW) быстро стал предпочтительным методом для обширных систем сжатия общего назначения. LZW используется в изображениях GIF, программы, такие как PKZIP, и аппаратных устройств, таких как модемы. LZ-методы используют модель сжатия на основе таблиц, в которой таблицы заменяются соответствующими строками данных. Для новых методов LZ эта таблица создается динамически из более ранних данных во входных данных. Сама таблица часто закодирована по Хаффману. Грамматические коды, подобные этим, эффективно эффективно сжимать повторяющиеся входные данные, например, сбор биологических данных и того же или близкородственных, огромный сборник документов с поддержкой версий, архивирование в Интернете и т. Д. Д. Коды на основе грамматики неконтекстную грамматику на основе одной строки. Другие практические алгоритмы сжатия грамматики включают Sequitur и Re-Pair.

Самые мощные современные компрессоры без использования используют вероятностные модели, такие как прогнозирование путем частичного сопоставления. Преобразование Барроуза - Уил также можно рассматривать как косвенную форму статистического моделирования. В рамках дальнейшего усовершенствования прямого использования вероятностного моделирования статистические оценки могут быть связаны с алгоритмом, называемым арифметическим кодированием. Арифметическое кодирование - это более современный метод кодирования, который использует математические вычисления конечного автомата для создания кодированных битов из серии символов входных данных. Он может выполнить сжатие по другим методам, таким как более известный алгоритм Хаффмана. Он использует состояние внутренней памяти, чтобы избежать необходимости выполнить взаимно-однозначное сопоставление отдельных чисел с отдельными представлениями, которые используют целое число битов и очищает внутреннюю память только после кодирования всей строки символов.. Арифметическое кодирование особенно хорошо применимо к задачам адаптивного сжатия данных, где статистика зависит и от контекста, поскольку его можно легко объединить с адаптивной моделью распределения вероятностей входных данных. Ранним примером использования арифметического кодирования была необязательная (но не широко используемая) функция стандарта кодирования изображений JPEG. С тех пор он применял в различных других проектах, включая H.263, H.264 / MPEG-4 AVC и HEVC для кодирования видео.

С потерями

В конце 80-х годов прошлого века цифровые изображения стали более распространенными, появились стандарты сжатия изображений без потерь . В начале 1990-х годов стали широко используются методы сжатия с потерями. В этих схемах можно сэкономить некоторая потеря информации, как несущественных деталей. Существует соответствующий компромисс между сохранением информации и уменьшением размера. Схемы сжатия данных с потерями разработаны на основе исследования того, как люди воспринимают данные, о которых идет речь. Например, человеческий глаз более чувствителен к незначительным изменениям яркости, чем к изменениям цвета. JPEG загрузка изображений частично работает путем округления несущественных битов информации. Ряд популярных форматов сжатия используют эти особенности в восприятии, в том числе психоакустика для звука и психовизуализация для изображений и видео.

Большинство форм сжатия с потерями основаны на кодировании с преобразованием, особенно на дискретном косинусном преобразовании (DCT). Впервые он был предложен в 1972 году Насиром Ахмедом, который разработал рабочий с алгоритмом Т. Натараджаном и К. Р. Рао в 1973 году, прежде чем представить его в январе 1974 года. DCT является наиболее широко используемым методом сжатия в мультимедийных форматах для изображений (таких как JPEG и HEIF ), видео ( например, MPEG, AVC и HEVC ) и аудио (например, MP3, AAC и Ворбис ).

Lossy сжатие изображения используется в цифровые камерах для увеличения емкости памяти. Точно так же DVD, Blu-ray и потоковое видео используют форматы кодирования видео с потерями . Сжатие с потерями широко используется в видео.

При сжатии звука с потерями используются методы психоакустики для удаления неслышимых (или менее слышимых) компонентов аудиосигнала. Сжатие речи часто выполняется с помощью даже более предлагаемых методов; кодирование речи выделяется как отдельная дисциплина от сжатия звука общего назначения. Кодирование речи используется в интернет-телефонии, например, взятие звука используется для копирования аудиокомпакт-дисков и декодируетсяопроигрывателями.

Сжатие с потерями может вызвать потерю генерации.

Теория

Теория основа условий обеспечивается теорией информации и, более конкретно, алгоритмической теорией информации для сжатия без потерь и теорией скорости - искажения для сжатия с потерями. Эти области исследований были созданы Клодом Шенноном, опубликовавшим фундаментальные статьи по этой теме в конце 1940-х - начале 1950-х годов. Другие темы, связанные со сжатием, включают теорию кодирования и статистический вывод.

Машинное обучение

. Между машинным обучением и сжатием действует тесная связь. Система, которая прогнозирует апостериорные вероятности придерживаться с учетом всей ее истории, система оптимального сжатия данных (с использованием арифметического кодирования в выходном распределении). Оптимальный компрессор можно использовать для прогнозирования (последовательного поиска символов, который сжимает лучше всего с учетом предыдущей истории). Эта эквивалентность использовалась в качестве оправдания использования сжатия данных в эталона для «общего интеллекта».

Альтернативный вид может показать алгоритмы сжатия, неявно программные строки неявные объекты пространства, и Измерения сходства на основе сжатия вычисляют сходство в этих пространствах функций. Для каждого компрессора C (.) Отображает входную строку x, соответствующую норме || ~ х ||. Исчерпывающее изучение пространств признаков, лежащих в основе всех алгоритмов сжатия, исключается из-за пробела; вместо этого руководства признаки выбирают для изучения одного из типов методов сжатия без потерь: LZW, LZ77 и PPM.

Согласно теории AIXI, связь более подробно объясняется в Hutter Prize наилучшее сжатие x - это наименьшее возможное программное обеспечение, которое генерирует x. Например, в этой модели сжатый размер zip-файла включает как zip-файл, так и программное обеспечение для распаковки, поскольку вы не можете распаковать его без обоих, но может существовать еще меньшая комбинированная форма.

Различие данных

Сжатие данных можно рассматривать как частный случай разности данных. Различие состоит в создании разницы для данного и цели, с исправлением основного источника для данного источника и разницы. Транспортировка данных по разным источникам данных. Рассматривать относительную энтропию относительную энтропию как частный случай относительной энтропии (рассмотрение разности данных) без начальных данных.

Термин аварийного напряжения используется для выделения разностного соединения данных.

Использует

Изображение

Энтропийное кодирование возникло в 1940-х годах с введением кодирование Шеннона - Фано, основы кодирования Хаффмана, который был разработан в 1950 году. Кодирование с преобразованием восходит к концу 1960-х годов, когда в 1968 году было введено кодирование с быстрым преобразованием Фурье (БПФ) и преобразование Адамара в 1969 году.

Важным методом сжатия изображения является дискретное косинусное преобразование (DCT), метод в начале 1970-х годов. DCT является агентом для JPEG, формата сжатия с потерями, который представлен Объединенной группой экспертов по фотографии (JPEG) в 1992 году. JPEG снижает количество данных, необходимые для изображения изображения за относительно небольшого снижения качества изображения, и стали широко используемым формат изображения файла изображения. Его высокоэффективный алгоритм сжатия на основе DCT стал причиной широкого распространения цифровых изображений и цифровых фотографий..

Lempel - Ziv - Welch (LZW) - это без потерь алгоритма сжатия, подходит в 1984 году. Он используется в формате GIF, представленном в 1987 году. DEFLATE, сжатие без потерь, в 1996 году, используется в Формат Portable Network Graphics (PNG).

Сжатие вейвлетов, использование вейвлетов при сжатии изображений, началось после разработки кодирования DCT. Стандарт JPEG 2000 был представлен в 2000 году. В отличие от алгоритма DCT, используемого в исходном формате JPEG, JPEG 2000 вместо этого использует алгоритмы дискретного вейвлет-преобразования (DWT). Технология JPEG 2000, которая включает расширение Motion JPEG 2000, была выбрана в качестве стандарта кодирования видео для цифрового кино в 2004 году.

Аудио

Сжатие аудиоданных, не путать с сжатие динамического диапазона, может снизить пропускную способность передачи и требования к хранению аудиоданных. Алгоритмы сжатия звука реализованы в программном продукте как аудиокодеки . Как при сжатии с потерями, так и без потерь, избыточность информации уменьшается с использованием таких методов, как кодирование, квантование дискретное косинусное преобразование и линейное предсказание для уменьшения количества информации, используемой для представления несжатых данных.

Алгоритмы сжатия звука с потерями высокого высокого сжатие и во многих аудиоприложениях, включая Vorbis и MP3. Почти все эти алгоритмы полагаются на психоакустику для устранения или снижения точности менее слышимых звуков, тем самым уменьшая пространство, необходимое для их хранения или передачи.

Приемлемый компромисс между потерей качества звука а размер передачи или хранения зависит от приложения. Например, один 640 МБ компакт-диск (CD) вмещает примерно один час несжатой высококачественной музыки, менее 2 часов музыки, сжатой без потерь, или 7 часов музыки, сжатой в Формат MP3 со средней скоростью передачи данных . Цифровой диктофон обычно может хранить около 200 часов четко разборчивой речи в 640 МБ.

Сжатие звука без потерь представляет цифровые данные, которые могут быть декодированы в точную цифровую копию оригинала. Коэффициенты сжатия составляют около 50–60% от исходного размера, что аналогично стандартному сжатию данных без потерь. Кодеки без потерь использовать аппроксимацию кривой или линейное предсказание в качестве основы для оценки сигнала. Параметры, описывающие разницу и разницу между оценкой и фактическим сигналом, кодируются отдельно.

Существует ряд форматов сжатия звука без потерь. См. Список кодеков без потерь. Некоторые форматы связаны с отдельной системой, например Direct Stream Transfer, использовали в Super Audio CD и Meridian Lossless Packing, инструмент в DVD-Аудио, Dolby TrueHD, Blu-ray и HD DVD.

Некоторые форматы аудиофайлов содержат комбинацию формата с потерями и коррекция без потерь; это позволяет удалить исправление, чтобы легко получить файл с потерями. К такому формату класса MPEG-4 SLS (масштабируемый до без потерь), WavPack и OptimFROG DualStream.

, когда аудиофайлы должны быть обработаны либо путем дальнейшего сжатия, либо для, желательно работать с принудительным оригиналом (несжатым или сжатым без потерь). Обработка сжатого файла для какой-либо цели обычно дает худший результат, чем создание файла из несжатого оригинала. Помимо редактирования или микширования звука, блокировка звука без потерь часто используется для архивного хранения или в качестве мастер-копий.

Сжатие аудио с потерями

Сравнение спектрограмм аудио в несжатом формате и нескольких форматах с потерями. Спектр с потерями показывает ограничение полосы более высоких частот, распространенный метод, связанный со сжатием звука с потерями.

Сжатие звука с потерями используется в широком диапазоне приложений. В дополнение к автономным аудио-приложениям для воспроизведения файлов в MP3-плеерах или компьютерах, аудиопотоки с цифровым сжатием используются в большинстве видеодисков DVD, цифровом телевидении, потоковых медиа в Интернете, спутниковом и кабельном радио и во все большем количестве. в эфирных радиопередачах. Сжатие с потерями обычно обеспечивает гораздо большее сжатие, чем сжатие без потерь, за счет отбрасывания менее важных данных на основе психоакустических оптимизаций.

Психоакустика признает, что не все данные в аудиопотоке могут быть восприняты человеком. слуховая система. В большинстве случаев сжатие с потерями снижает избыточность, сначала идентифицируя несущественные для восприятия звуки, то есть звуки, которые очень трудно услышать. Типичные примеры включают высокие частоты или звуки, которые появляются одновременно с более громкими звуками. Эти нерелевантные звуки кодируются с пониженной точностью или вообще не кодируются.

Из-за природы алгоритмов с потерями, качество звука страдает потерей цифрового поколения, когда файл распаковывается и повторно сжимается. Это делает сжатие с потерями непригодным для хранения промежуточных результатов в профессиональных аудиотехнических приложениях, таких как редактирование звука и многодорожечная запись. Однако форматы с потерями, такие как MP3, очень популярны среди конечных пользователей, поскольку размер файла уменьшается до 5-20% от исходного размера, а в мегабайте можно хранить около минуты музыки с адекватным качеством.

Методы кодирования

Чтобы определить, какая информация в аудиосигнале не имеет отношения к восприятию, большинство алгоритмов сжатия с потерями используют преобразования, такие как модифицированное дискретное косинусное преобразование (MDCT) для преобразования временная область дискретизированные формы сигналов в область преобразования. После преобразования, как правило, в частотную область , частотам компонентов могут быть назначены биты в соответствии с их слышимостью. Слышимость спектральных компонентов, вычисленных с использованием абсолютного порога слышимости и принципов одновременного маскирования - явления, при котором сигнал маскируется другим сигналом, разделенным по частоте, и, в некоторых случаях, временное маскирование - сигнал маскируется другим сигналом, разделенным временем. Контуры равной громкости также могут использоваться для взвешивания перцепционной важности компонентов. Модели сочетания человеческого уха и мозга, включающие такие эффекты, часто называют психоакустическими моделями.

. Другие типы компрессоров с потерями, такие как линейное прогнозирующее кодирование (LPC), используемое с речью, являются исходными. на базе кодеров. Эти кодеры используют модель генератора звука (например, речевой тракт человека с LPC) для обесцвечивания аудиосигнала (т. Е. Сглаживания его спектра) перед квантованием. LPC можно рассматривать как базовый метод перцептивного кодирования: реконструкция аудиосигнала с использованием линейного предсказателя формирует шум квантования кодера в спектр целевого сигнала, частично маскируя его.

Форматы спотерями часто распространение для распространения потокового аудио или интерактивных приложений (таких как кодирование речи для цифровой передачи в сотовой связи). В таких приложениях данные должны распаковываться по мере того, как потоки данных, а не после того, как весь поток данных был передан. Не все аудиокодеки люди обычно выбирают кодек, предназначенный для работы потоковой передачи данных.

Задержка является результатом методов, используемых для кодирования и декодирования данных. Некоторые кодеки анализируют более длинный сегмент данных для оптимизации эффективности, а затем кодируют его таким образом, что для одновременного декодирования требуется больший сегмент данных. (Часто кодеки сегментов, называемые «кадрами», для создания дискретных сегментов данных для кодирования и декодирования.) Внутренняя задержка алгоритма кодирования может быть критической; например, при двусторонней передаче данных, например при телефонном разговоре, плохое качество сильно ухудшить воспринимаемое изображение.

В отличие от скорости сжатия, которая пропорциональна количеству операций, требуемых алгоритмом, здесь под задержкой понимается количество выборок, которые должны быть проанализированы перед обработкой аудио блока. В минимальном случае задержка равна нулю отсчетов (например, если кодер / декодер уменьшает количество битов, используется для квантования сигнала). Алгоритмы временной области, такие как LPC, также часто имеют низкие задержки, отсюда их популярность в кодировании речи для телефонии. В таких алгоритмах, как MP3, необходимо проанализировать большое количество выборок для реализации психоакустической модели в частотной области, задержка составляет порядка 23 мс (46 мс для двусторонней связи).

Кодирование речи

Кодирование речи Указывается категорией сжатия данных. Модели восприятия, используемые для оценки того, что может слышать человеческое ухо, обычно несколько отличаются от моделей, используется для музыки. Диапазон частот, необходимых для передачи звуков человеческих голосов, обычно намного уже, чем диапазон частот, необходимый для музыки, и звук обычно менее сложен. В результате речь может быть кодирована с высоким качеством с использованием относительно низкой скорости передачи данных.

Используется квантование для преобразования в цифровую формулу в числах (обычно целые числа). Это называется аналого-цифровым (A / D) преобразованием. Если целые числа, сгенерированные квантованием, равны 8 битам каждого, то диапазон аналогового сигнала делится на 256 интервалов, и все значения сигнала в пределах интервала квантуются до одного и того же числа. Если генерируются 16-битные целые числа, то диапазон аналогового сигнала делится на 65 536 интервалов.

Это показывает соотношение между высоким разрешением (большое количество аналоговых интервалов) и высоким сжатием (генерируются маленькие целые числа). Это приложение квантования использует использование сжатия речи. Как правило, это достигается комбинацией двух подходов:

  • Кодирование только звуков, которые могут быть изданы одним человеческим голосом.
  • Отбрасывание большего количества данных в сигнале - Сохранение ровно столько, чтобы реконструировать «разборчивый» голос, а не полный частотный диапазон человеческого слуха.

Возможно, самыми ранними алгоритмами, используемыми при кодировании речи (и сжатии) аудиоданных в целом), были алгоритм A-закона и алгоритм μ-закона.

История

Solidyne 922: первая в мире коммерческая битовая аудиокарта звуковая карта для ПК, 1990

В 1950 году Bell Labs подал патент на дифференциальную импульссно-кодовую модуляцию (DPCM). Adaptive DPCM (ADPCM) был представлен П. Каммиски, Никилом С. Джаянтом и Джеймс Л. Фланаган в Bell Labs в 1973 году.

Перцепционное кодирование было впервые использовано для кодирования речи сжатия с кодированием с линейным предсказанием (LPC). Первоначальные концепции LPC восходят к работе Фумитада Итакура (Университет Нагои ) и Сюдзо Сайто (Nippon Telegraph and Telephone ) в 1966 году. В течение 1970-х гг. Бишну С. Атал и Манфред Р. Шредер в Bell Labs разработали формулу LPC, названную адаптивным предсказательным кодированием (APC), алгоритм перцептивного кодирования, используя маскирующие свойства человеческого уха, за которым в начале 1980-х годов последовал алгоритм линейного предсказания с кодовым возбуждением (CELP), который достиг степени сжатия для своего времени.. Перцепционное кодирование используется современными форматами сжатия звука, такими как MP3 и AAC.

Дискретное косинусное преобразование (DCT), разработанное Насиром Ахмедом, Т. Натараджаном. и К. Р. Рао в 1974 г. заложил основу для дискретного косинусного преобразования (MDCT), используемых современными форматами сжатия звука, такими как MP3 и AAC. MDCT был предложен JP Princen, AW Johnson и AB Bradley в 1987 году после более ранней работы Princen и Bradley в 1986 году. MDCT используется в современных форматах сжатия звука, таких как Dolby Digital, MP3 и Advanced Audio Coding (AAC).

Первая в мире коммерческая система автоматизации вещания была предоставлена ​​Оскаром Бонелло, профессором инженерии в Университет Буэнос-Айреса. В 1983 году, используя психоакустический принцип маскировки критических полос, впервые опубликованный в 1967 году, он начал использовать практические приложения на основе компьютера IBM PC, а в 1987 году была запущена система автоматизированного вещания. имя Audicom. Двадцать лет спустя почти все радиостанции в мире использовали методы, произведенные рядом компаний.

Литературный сборник по большому количеству систем аудиокодирования был опубликован в журнале IEEE Journal on Selected Area in Communications (JSAC) в феврале 1988 года. Несмотря на то, что были некоторые статьи до этого времени, этот сборник задокументировал все разнообразие работающих звуковых кодеров, почти все из использования методов восприятия (т. Е. Маскирования) и своего рода частотный анализ и внутреннее бесшумное кодирование. Несколько из этих статей отмечена получение хорошего цифрового звука для исследовательских целей. Большинство, если не все авторы, редакторы JSAC также активны в комитете MPEG-1 Audio, который создал формат MP3.

Видео

Сжатие видео - это практическая реализация кодирования источника в теории информации. На практике большинство видеокодеков используются вместе с методами сжатия звука для отдельных, но дополнительных потоков данных одного комбинированного пакета с использованием так называемых контейнерных форматов ..

Несжатое видео требует очень высокой скорости передачи данных .. Хотя кодеки сжатия видео без потерь работают с коэффициентами сжатия от 5 до 12, типичное видео со сжатием H.264 с потерями имеет коэффициент сжатия от 20 до 200.

Двумя ключевыми методами сжатия видео, используемыми в стандартах кодирования видео, являются дискретное косинусное преобразование (DCT) и компенсация движения (MC). Большинство стандартов кодирования видео, такие как форматы H.26x и MPEG, обычно используют кодирование видео DCT с компенсацией движения (компенсация движения блоков).

Теория кодирования

Видеоданные могут быть представлены как последовательность кадров неподвижного изображения. Такие данные обычно содержат много пространственной и временной избыточности. Алгоритмы сжатия видео стараются уменьшить размер и хранить информацию более компактно.

Большинство форматов сжатия видео и кодеков используют как пространственную, так и временную избыточность (например, посредством разностного кодирования с компенсацией движения ). Сходства можно закодировать, сохранить только различия между, например, сохраненные во времени кадры (межкадровое кодирование) или пространственно определенные пиксели (внутрикадровое кодирование). Межкадровое сжатие (временное дельта-кодирование ) одним из самых мощных методов сжатия. Он (повторно) использует данные из одного или нескольких более ранних или поздних кадров в описании текущего кадра. Внутрикадровое кодирование, с другой стороны, использует только данные из текущего кадра, фактически являясь по-прежнему сжатием изображения.

A класс форматов, используемых в видеокамерах и редактировании видео. использовать менее сложные схемы сжатия, которые ограничивают свои методы предсказания внутрикадровым предсказанием.

Обычно при сжатии видео используются методы сжатия с потерями, такие как квантование, которые уменьшают исходные данные, которые (более или менее) уменьшают исходные отношения, которые (более или менее) не имеют отношения к зрительному восприятию человека, используя перцептивные особенности человеческого зрения. Например, небольшие различия в цвете труднее воспринимать, чем изменения яркости. Алгоритмы сжатия могут усреднять цвет по этим другим областям, чтобы уменьшить пространство, аналогично тем, которые используются при использовании изображений JPEG. Как и при любом сжатии с помощью компромисс между качеством видео и скоростью передачи, стоимостью обработки и распаковки и системными требованиями. Сильно сжатое видео может содержать видимые или отвлекающие артефакты.

Другие методы, кроме распространенных форматов преобразования на основе DCT, такие как фрактальное сжатие, поиск соответствия и использование дискретное вейвлет-преобразование (DWT) было предметом некоторых исследований, но обычно не используется в практических продуктах (за исключением использования вейвлет-кодирования в качестве кодеров неподвижных изображений без движения компенсация). Интерес к фрактальному анализу, кажется, ослабевает из недавнего теоретического анализа, показывающего сравнительную неэффективность таких методов.

Межкадровое кодирование

Межкадровое кодирование путем сравнения каждого кадра в видео с предыдущим. Отдельные кадры видеопоследовательности сравниваются от одного кадра к другому, и кодек сжатия видео отправляет только различия в опорный кадр. Эта часть предыдущего кадра в следующем кадре содержится в следующем кадре. Когда части кадра перемещаются простым способом, компрессор может выдать команду (немного более длинную), которая сообщает декомпрессору сдвинуть, повернуть, осветлить или затем представить копию. Эта более длинная команда по-прежнему остается намного короче. Обычно кодировщик также передает остаточный сигнал, оставшиеся более тонкие отличия от эталонного изображения. Используя энтропийное кодирование, эти остаточные сигналы имеют более компактное представление, чем полный сигнал. В области видео с большим количеством изменяемых пикселей. Обычно во время взрывов, пламени, животных и некоторых панорамных кадрах высокочастотные детали приводят к снижению качества или увеличению модели скорости передачи данных.

Гибридные форматы преобразования на основе блоков

Этапы обработки типичный видеокодер

Сегодня почти все широко используемые методы сжатия видео (например, в стандарте, утвержденном ITU-T или ISO ) используют ту же базовую мощность, что и вернуться к H.261, который был стандартизирован в 1988 году ITU-T. Они в основном полагаются на DCT, применяемый к прямоугольным блокам соседних пикселей, и временное прогнозирование с использованием векторов движения, а также в настоящее время также этап внутриконтурной фильтрации.

На этапе прогнозирования применяются различные методы дедупликации и разностного кодирования, которые помогают декоррелировать данные и описывать новые данные на основе уже переданных данных.

Затем прямоугольные блоки данных (остатка) пикселя преобразуются в частотную область, чтобы облегчить нацеливание нерелевантной информации при квантовании и для некоторого уменьшения пространственной избыточности. Дискретное косинусное преобразование (DCT), которое широко используется в этом отношении, было введено N. Ахмед, Т. Натараджан и К. Р. Рао в 1974 году.

На этапе основной обработки с потерями данные квантуются, чтобы уменьшить количество информации, не имеющей отношения к зрительному восприятию человека.

На последней стадии статистическая избыточность в значительной степени устраняется с помощью энтропийного кодера, который часто применяет некоторую форму арифметического кодирования.

На этапе дополнительной внутриконтурной фильтрации к сигналу восстановленного изображения могут применяться различные фильтры. Вычисляя эти фильтры также внутри цикла кодирования, они могут способствовать сжатию, поскольку их можно применять к справочному материалу до того, как он будет использован в процессе прогнозирования, и ими можно руководствоваться, используя исходный сигнал. Наиболее популярным примером являются фильтры устранения блочности, которые размывают блокирующие артефакты от разрывов квантования на границах блоков преобразования.

История

В 1967 году А.Х. Робинсон и Ч. Черри предложили схему кодирования длины прогона сжатия полосы пропускания для передачи аналоговых телевизионных сигналов. Дискретный косинус transform (DCT), который является фундаментальным для современного сжатия видео, был представлен Насиром Ахмедом, Т. Натараджаном и К. Р. Рао в 1974 году.

H.261, который дебютировал в 1988 году, коммерчески представил распространенную базовую базу архитектуры технологии сжатия видео. Это первый формат кода, основанный на атакии DCT, который обеспечивает стандартом для всех первых форматов кодирования видео. H.261 был разработан рядом компаний, в том числе Hitachi, PictureTel, NTT, BT и Toshiba.

Самая популярная видео . стандарты кодирования, используемые для кодеков, были стандартами MPEG. MPEG-1 был разработан группой экспертов по кинематографии (MPEG) в 1991 году и был разработан для сжатия видео с качеством VHS. На смену ему в 1994 г. пришел MPEG-2 / H.262, который был разработан рядом компаний, в первую очередь Sony, Thomson <146.>и Mitsubishi Electric. MPEG-2 стал стандартным видеоформатом для DVD и SD цифрового телевидения. В 1999 году за ним последовал MPEG-4 / H.263 который, явился крупным шагом вперед в технологии сжатия видео. Он был разработан рядом компаний, в первую очередь Mitsubishi Electric, Hitachi и Panasonic.

. Наиболее широко используемым форматом кодирования видео является H.264 / MPEG-4 AVC. Он был разработан в 2003 году рядом с организациями, в первую очередь Panasonic, Godo Kaisha IP Bridge и LG Electronics. AVC коммерчески представила современные алгоритмы контекстно-адаптивного двоичного арифметического кодирования (CABAC) и контекстно-адаптивного кодирования с длиной (CAVLC). AVC является основным стандартом кодирования видео для дисков Blu-ray и широко используемых потоковыми интернет-сервисами, такими как YouTube, Netflix, Vimeo и iTunes Store, программное обеспечение, такое как Adobe Flash Player и Microsoft Silverlight, а также различные программы HDTV для наземного и спутникового вещания. телевидение.

Генетика

Генетические алгоритмы сжатия - это последнее поколение алгоритмов сжатия без потерь, которые сжимают данные (обычно нуклеотидов) с использованием как обычных алгоритмов сжатия, так и генетических алгоритмов, адаптированных к конкретным типу данных алгоритмов сжатия. В 2012 году группа ученых из Университета Джона Хопкинса опубликовала алгоритм генетического сжатия, который не опубликовал алгоритм сжатия эталонный геном. HAPZIPPER был адаптирован для данных HapMap и обеспечивает более чем 20-кратное сжатие (уменьшение файла размера на 95%), сжатие в 2-4 раза сжатие и намного быстрее, чем ведущие универсальные утилиты сжатия. Для этого Чанда, Эльхайк и Бадер ввели кодирование на основе MAF (MAFE), которое снижает неоднородность набора путем сортировки SNP по частотам их минорных аллелей, тем самым гомогенизируя набор данных. Другие алгоритмы 2009 и 2013 годов (DNAZip и GenomeZip) имеют степень сжатия до 1200 раз, что позволяет хранить 6 миллиардов пар дидидных геномов человека в 2,5 мегабайтах (относительно эталонного генома или усредненных по многим геномам). Сравнительный анализ компрессоров генетических / геномных данных см. В

Outlook и в настоящее время неиспользованный потенциал

Предполагается, что общий объем данных, хранящихся на мировых устройствах хранения, может быть использован с помощью усилителей сжатия с помощью средним коэффициентом 4,5: 1. Подсчитано, что совокупные технологические возможности мира по хранению информации в 2007 году 1300 эксабайт аппаратных цифр, но когда соответствующий оптимально сжато, это составляет всего 295 эксабайт информации Шеннона.

См. Также

Ссылки

Внешние ссылки

Последняя правка сделана 2021-05-17 14:09:44
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте