AV1

редактировать
Открытый и бесплатный формат кодирования видео, разработанный Alliance for Open Media

AOMedia Video 1
РазработанAlliance for Open Media
Первоначальный выпуск28 марта 2018 г.; 2 года назад (28.03.2018)
Последний выпуск 1.0.0 Errata 1
(8 января 2019; 21 месяц назад (2019-01-08))
Тип форматаФормат кодирования видео
Содержится в
Extended из
Extended вAVIF
Стандартный AOM AV1
Открытый формат ?Да
Веб-сайтaomedia .org / av1-features / Измените это на Wikidata

AOMedia Video 1(AV1) - это открытый, бесплатный формат кодирования видео , изначально разработанный для передачи видео через Интернет. разработан в качестве преемника VP9 Alliance for Open Media (AOMedia), консорциумом, основанным в 2015 году, который включает полупроводниковые фирмы, видео по запросу, провайдеров, видео производители контента, компании-разработчики программного обеспечения и поставщики веб-браузеров. Спецификация битового потока AV1 включает эталонный видеокодек . В 2018 году Facebook провел тестирование, приближенное к реальным условиям, AV1 эталонный кодировщик достиг на 34%, 46,2% и 50,3% более высокого уровня сжатия данных , чем libvpx-vp9, x264 high profile и x264 main profile соответственно.

Подобно VP9, ​​но в отличие от H.264 / AVC и HEVC, AV1 имеет модель лицензирования без лицензионных отчислений, которая не препятствует внедрению в открытых системах. исходные проекты.

Формат файла изображения AV1 (AVIF ) - это формат файла изображения, в котором используются алгоритмы сжатия AV1.

Содержание

  • 1 История
  • 2 Цель
  • 3 Технология
    • 3.1 Разделение
    • 3.2 Прогнозирование
      • 3.2.1 Внутрипрогнозирование
    • 3.3 Преобразование данных
    • 3.4 Квантование
    • 3.5 Фильтры
    • 3.6 Энтропийное кодирование
  • 4 Качество и эффективность
  • 5 Профили и уровни
    • 5.1 Профили
    • 5.2 Уровни
  • 6 Поддерживаемые форматы контейнеров
  • 7 Принятие
    • 7.1 Контент поставщики
    • 7.2 Программные реализации
    • 7.3 Поддержка программного обеспечения
    • 7.4 Поддержка операционных систем
    • 7.5 Аппаратное обеспечение
  • 8 Заявки на патенты
  • 9 Формат файла изображения AV1 (AVIF)
    • 9.1 Поддержка AVIF
  • 10 Источники
  • 11 Внешние ссылки

История

Мотивы Альянса для создания AV1 включали высокую стоимость и неопределенность, связанные с лицензированием патента на HEVC, MPEG - кодек, предназначенный для успешного выполнения AVC. Кроме того, семь членов-учредителей Альянса - Amazon, Cisco, Google, Intel, Microsoft, Mozilla и Netflix - объявили, что первоначальная цель видеоформата будет заключаться в предоставлении высококачественного веб-видео. Официальное объявление о выпуске AV1 появилось вместе с пресс-релизом об образовании Alliance for Open Media 1 сентября 2015 года. Всего за 42 дня до этого, 21 июля 2015 года, было объявлено, что первоначальное лицензионное предложение HEVC Advance является новым. превышают лицензионные платежи своего предшественника, AVC. Помимо увеличения стоимости, с HEVC увеличилась сложность процесса лицензирования. В отличие от предыдущих стандартов MPEG, где технология в стандарте могла быть лицензирована от одного лица, MPEG-LA, когда стандарт HEVC был завершен, были сформированы два патентных пула с третьим бассейн был на горизонте. Кроме того, различные патентообладатели отказывались лицензировать патенты через любой пул, что увеличивало неопределенность в отношении лицензирования HEVC. По словам Иэна ЛеГроу из Microsoft, технология с открытым исходным кодом и без лицензионных отчислений рассматривалась как самый простой способ устранить эту неопределенность, связанную с лицензированием.

Негативное влияние патентного лицензирования на бесплатное программное обеспечение с открытым исходным кодом. также был назван причиной создания AV1. Например, встраивание реализации H.264 в Firefox предотвратит его бесплатное распространение, поскольку лицензионные сборы должны быть уплачены MPEG-LA. Европейский фонд свободного программного обеспечения имеет утверждал, что FRAND практика лицензирования патентов делает невозможной реализацию стандартов свободного программного обеспечения из-за различного рода несовместимости с лицензиями на бесплатное программное обеспечение.

Многие компоненты проекта AV1 были получены в результате предыдущих исследований Alliance члены. Отдельные участники запустили экспериментальные технологические платформы за несколько лет до этого: код Xiph / Mozilla Daala уже был опубликован в 2010 году, экспериментальный проект VP9 Evolution от Google был анонсирован 12 сентября 2014 года, а Cisco Thor был опубликован на 11 августа 2015 г. Основываясь на кодовой базе VP9, ​​AV1 включает в себя дополнительные методы, некоторые из которых были разработаны в этих экспериментальных форматах. Первая версия 0.1.0 эталонного кодека AV1 была опубликована 7 апреля 2016 года.

Хотя в конце октября 2017 года вступило в силу мягкое замораживание функций, разработка продолжалась по нескольким важным функции. Одну из этих незавершенных функций, формат битового потока , планировалось заморозить в январе 2018 года, но она была отложена из-за нерешенных критических ошибок, а также дальнейших изменений в преобразованиях, синтаксисе, прогнозировании векторов движения, и завершение юридического анализа. Альянс объявил о выпуске спецификации битового потока AV1 28 марта 2018 года вместе с эталонным программным кодером и декодером. 25 июня 2018 года была выпущена утвержденная версия 1.0.0 спецификации. 8 января 2019 года была выпущена утвержденная версия 1.0.0 с исправлением 1 спецификации.

Мартин Смол из компании Bitmovin, член AOM, сказал, что вычислительная эффективность эталонного кодировщика была самой большой оставшейся проблемой после завершения замораживания формата битового потока. Пока он все еще работал над форматом, кодировщик не предназначался для производственного использования, и оптимизация скорости не была приоритетной. Следовательно, ранняя версия AV1 была на несколько порядков медленнее, чем существующие кодеры HEVC. Следовательно, большая часть усилий по разработке была перенесена на совершенствование эталонного кодировщика. В марте 2019 года сообщалось, что скорость эталонного кодировщика значительно улучшилась и в том же порядке, что и кодировщики для других распространенных форматов.

Цель

AV1 стремится быть видео формат для Интернета, который является современным и бесплатным. Миссия Alliance for Open Media такая же, как и у проекта WebM.

Постоянной проблемой при разработке стандартов, в том числе бесплатных мультимедийных форматов, является опасность случайного нарушения патентов, о которых не знали их создатели и пользователи. Обеспокоенность высказывалась в отношении AV1 и ранее VP8, VP9, ​​Theora и IVC. Проблема не только в форматах без лицензионных отчислений, но она однозначно угрожает их статусу бесплатных форматов.

Патентное лицензированиеAV1, VP9, Theora HEVC, AVC GIF, MP3, MPEG-2
Известными патентообладателямиБез лицензионных отчисленийБез роялтиСрок действия истек
Неизвестными патентообладателямиНевозможно узнать до истечения срока действия

Для достижения цели освобождения от лицензионных отчислений в процессе разработки требуется, чтобы никакая функция не могла быть принята до тех пор, пока она не будет независимо подтверждена двумя отдельными сторонами, чтобы не нарушать патенты конкурирующих компаний. В случаях, когда альтернатива защищенному патентом методу недоступна, владельцы соответствующих патентов приглашаются присоединиться к Альянсу (даже если они уже были членами другого патентного пула). Например, члены Альянса Apple, Cisco, Google и Microsoft также являются лицензиарами патентного пула MPEG-LA для H.264. В качестве дополнительной защиты бесплатного статуса AV1 у Альянса есть фонд правовой защиты для оказания помощи меньшим членам Альянса или лицензиатам AV1 в случае предъявления иска за предполагаемое нарушение патентных прав.

Согласно патентным правилам, принятым от Консорциум Всемирной паутины (W3C), участники технологии лицензируют свои патенты, связанные с AV1, кому угодно, в любом месте и в любое время на основе взаимности (то есть до тех пор, пока пользователь не участвует в патентных тяжбах). В качестве защитного условия любое лицо, участвующее в патентном разбирательстве, теряет право на патенты всех патентообладателей.

Такой подход к правам интеллектуальной собственности (IPR ) и его абсолютный приоритет во время разработки, противоречит существующим форматам MPEG, таким как AVC и HEVC. Они были разработаны в соответствии с политикой непричастности к IPR их организациями по стандартизации, как это предусмотрено в определении открытого стандарта ITU-T. Однако председатель MPEG утверждал, что эту практику необходимо изменить, а именно: EVC также имеет подмножество, не требующее лицензионных отчислений, и будет иметь переключаемые функции в своем битовом потоке для защиты от будущих угроз интеллектуальной собственности.

Создание бесплатных веб-стандартов было давно заявленным стремлением отрасли. В 2007 году в предложении по видео HTML5 указывалось, что Theora является обязательным для реализации. Причина заключалась в том, что общедоступный контент должен быть закодирован в свободно реализуемых форматах, хотя бы как «базовый формат», и что изменение такого базового формата позже будет затруднено из-за сетевых эффектов. Alliance for Open Media - это продолжение усилий Google по проекту WebM, который возобновил соревнование без лицензионных отчислений после того, как AVC превзошла Theora. Для таких компаний, как Mozilla, которые распространяют бесплатное программное обеспечение, поддержка AVC может быть затруднена, поскольку роялти за каждую копию легко неприемлемо из-за отсутствия потока доходов для поддержки этих платежей в бесплатном программном обеспечении (см. FRAND § Исключая бесплатное распространение ). Аналогичным образом, HEVC не удалось убедить всех лицензиаров разрешить исключение для свободно распространяемого программного обеспечения (см. HEVC § Предоставление бесплатного программного обеспечения ).

Цели производительности включают «повышение эффективности по сравнению с VP9 и HEVC» для небольшого увеличения сложности. Цель NETVC - повышение эффективности на 25% по сравнению с HEVC. Основная проблема сложности связана с программным декодированием, поскольку поддержка оборудования потребует времени, чтобы достичь пользователей. Однако для WebRTC также важна производительность кодирования в реальном времени, что входит в повестку дня Cisco: Cisco является производителем оборудования для видеоконференцсвязи, и их вклад Thor направлен на " разумное сжатие при умеренной сложности ".

Что касается функций, AV1 специально разработан для приложений реального времени (особенно WebRTC) и более высоких разрешений (более широкие цветовые гаммы, более высокая частота кадров, UHD ), чем в типичных сценариях использования видеоформатов текущего поколения (H.264), где ожидается наибольший прирост эффективности. Поэтому планируется поддерживать цветовое пространство из Рекомендации МСЭ-R BT.2020 и до 12 битов с точностью на компонент цвета. AV1 в первую очередь предназначен для кодирования с потерями, хотя также поддерживается сжатие без потерь.

Технология

AV1 - это традиционная блочная технология формат преобразования частоты с использованием новых технологий. Основанный на Google VP9, ​​AV1 включает дополнительные методы, которые в основном предоставляют кодировщикам больше возможностей кодирования, чтобы обеспечить лучшую адаптацию к различным типам входных данных.

Этапы обработки кодировщика AV1 с соответствующими технологиями, связанными с каждым этапом.
libaom
Разработчик (и) Alliance for Open Media
Стабильный выпуск 2.0.0 / 18 мая 2020 г. ; 5 месяцев назад (2020-05-18)
Написано наC, сборке
Лицензия Лицензия BSD с двумя пунктами (бесплатное программное обеспечение )
Веб-сайтaomedia.googlesource.com / aom

Альянс опубликовал эталонную реализацию, написанную на C и языке ассемблера (aomenc, aomdec) как бесплатное программное обеспечение в соответствии с условиями лицензии BSD с двумя пунктами. Разработка происходит публично и открыта для участия, независимо от членства в AOM.

Процесс разработки был таков, что инструменты кодирования были добавлены в базу эталонного кода в качестве экспериментов, управляемых флагами, которые включают или отключают их во время сборки, для проверки другими членами группы, а также специализированными группами, которые помогали и обеспечивали удобство оборудования и соблюдение прав интеллектуальной собственности (TAPAS). Когда эта функция получила некоторую поддержку в сообществе, эксперимент был включен по умолчанию, и в конечном итоге его флаг был удален, когда все проверки были пройдены. Эксперимент имена были в нижнем регистре в скрипте конфигурации и в верхнем регистре в условной компиляции флаги.

Для лучшей и более надежной поддержки HDR и цветовых пространств соответствующие метаданные теперь могут быть интегрированы в битовый поток видео, а не сигнализируется в контейнере.

Разделение

10 способов разделения единиц кодирования - на квадраты (рекурсивно), прямоугольники или их комбинации («Т-образная форма»).

Содержимое кадра разделяется на смежные блоки одинакового размера, о которых идет речь как суперблоки. Подобно концепции макроблока , суперблоки имеют квадратную форму и могут иметь размер 128 × 128 или 64 × 64 пикселей. Суперблоки можно разделить на более мелкие блоки в соответствии с различными шаблонами разделения. Шаблон четырехстороннего разделения - единственный шаблон, разделы которого можно рекурсивно разделить. Это позволяет разделять суперблоки на разделы размером 4 × 4 пикселя.

Схема разбиения суперблока AV1. Он показывает, как суперблоки 128 × 128 могут быть полностью разделены до блоков 4 × 4. В особых случаях блоки 128 × 128 и 8 × 8 не могут использовать разбиения 1: 4 и 4: 1, а блоки 8 × 8 не могут использовать разбиения Т-образной формы.

Т-образное разбиение представлены шаблоны, функция, разработанная для VP10, а также горизонтальное или вертикальное разделение на четыре полосы с соотношением сторон 4: 1 и 1: 4. Доступные шаблоны разделения различаются в зависимости от размера блока, блоки 128 × 128 и 8 × 8 не могут использовать разбиение 4: 1 и 1: 4. Более того, блоки 8 × 8 не могут использовать Т-образные разделения.

Теперь можно использовать два отдельных прогноза для пространственно разных частей блока с использованием плавной наклонной линии перехода (прогнозирование с разделением на клин). Это позволяет более точно разделять объекты без традиционных лестничных линий по границам квадратных блоков.

Дополнительный параллелизм кодировщика возможен благодаря настраиваемой зависимости предсказания между строками тайла (ext_tile).

Prediction

AV1 выполняет внутреннюю обработку с более высокой точностью (10 или 12 бит на выборку), что приводит к улучшению сжатия за счет меньших ошибок округления в эталонных изображениях.

Прогнозы можно комбинировать более продвинутыми способами (чем равномерное среднее) в блоке (составное прогнозирование), включая плавные и резкие переходные градиенты в разных направлений (прогнозирование с разделением на клин), а также неявные маски, основанные на различии между двумя предикторами. Это позволяет использовать комбинацию либо двух межкадровых предсказаний, либо межкадрового и внутреннего предсказания в одном блоке.

Кадр может ссылаться на 6 вместо 3 из 8 доступных кадровых буферов для временного (внешнего) предсказания, обеспечивая большую гибкость при двунаправленном предсказании (ext_refs).

Файл: Bergensbanen 1280x720.ogv Воспроизведение мультимедиа Деформированное движение вид спереди поезда.

Инструменты Warped Motion (warped_motion) и Global Motion (global_motion) в AV1 направлены на уменьшение избыточной информации в векторах движения путем распознавания шаблонов, возникающих в результате движения камеры.. Они реализуют идеи, которые пытались использовать в предыдущих форматах, например, MPEG-4 ASP, хотя и с новым подходом, работающим в трех измерениях. Может быть набор параметров деформации для всего кадра, предлагаемый в потоке битов, или блоки могут использовать набор неявных локальных параметров, которые вычисляются на основе окружающих блоков.

Кадры переключения (S-кадр) - это новый тип межкадрового взаимодействия, который можно предсказать, используя уже декодированные опорные кадры из версии того же видео с более высоким разрешением, чтобы обеспечить переключение на более низкое разрешение без необходимости полный ключевой кадр в начале видеосегмента в сценарии использования потоковой передачи с адаптивной скоростью передачи.

Intra Prediction

Intra Prediction состоит из прогнозирования пикселей только заданных блоков используя информацию, доступную в текущем кадре. Чаще всего внутренние предсказания строятся на основе соседних пикселей выше и слева от предсказанного блока. Предиктор DC строит прогноз, усредняя пиксели выше и слева от блока.

Предикторы направления экстраполируют эти соседние пиксели в соответствии с заданным углом. В AV1 можно выбрать 8 основных режимов направленности. Эти режимы начинаются под углом 45 градусов и увеличиваются с шагом 22,5 градусов до 203 градусов. Кроме того, для каждого направленного режима можно сигнализировать о шести смещениях на 3 градуса для больших блоков, три выше главного угла и три ниже него, в результате получается в общей сложности 56 углов (ext_intra).

Предиктор TrueMotion был заменен на предиктор Paeth, который учитывает разницу между известным пикселем в левом верхнем углу и пикселем непосредственно над и слева от нового пикселя и затем выбирает тот, который лежит в направлении меньшего градиента в качестве предиктора. Предиктор палитры доступен для блоков с очень небольшим (до 8, доминирующих) цветов, как в некоторых экранах компьютеров. Корреляции между яркостью и информацией о цвете теперь можно использовать с помощью предсказателя для блоков цветности, который основан на выборках из плоскости яркости (cfl). Чтобы уменьшить видимые границы вдоль границ блоков с внешним предсказанием, можно использовать метод, называемый компенсацией движения перекрывающихся блоков (OBMC). Это включает в себя увеличение размера блока так, чтобы он перекрывался с соседними блоками на 2-32 пикселя, и смешивание перекрывающихся частей вместе.

Преобразование данных

Преобразование ошибки, остающейся после предсказания, в частоту кодировщики AV1 могут использовать квадратные, 2: 1/1: 2 и 4: 1/1: 4 прямоугольные DCT (rect_tx), а также асимметричный DST для блоков, у которых ожидается, что верхний и / или левый край будут иметь меньшую ошибку благодаря предсказанию от ближайших пикселей, или выбрать вариант без преобразования (преобразование идентичности).

Он может комбинировать два одномерных преобразования, чтобы использовать разные преобразования для горизонтального и вертикального измерения (ext_tx).

Quantization

AV1 имеет новые оптимизированные матрицы квантования (aom_qm). Восемь наборов параметров квантования, которые могут быть выбраны и сигнализированы для каждого кадра, теперь имеют индивидуальные параметры для двух плоскостей цветности и могут использовать пространственное предсказание. В каждом новом суперблоке параметры квантования можно регулировать с помощью

Фильтры

Для этапа внутриконтурной фильтрации интеграция ограниченного фильтра нижних частот Тора и направленного фильтра подавления шума Daala оказалась плодотворной: объединенный фильтр ограниченного направленного улучшения ( cdef) превосходит результаты использования исходных фильтров по отдельности или вместе.

Это фильтр условной замены, ориентированный на края, который сглаживает блоки с настраиваемой (сигнализируемой) силой примерно вдоль направления доминирующий край t o устранение артефактов звонков.

Существует также фильтр восстановления петли (loop_restoring) на основе фильтра Винера и самонаводящиеся фильтры восстановления для удалить артефакты размытия из-за обработки блоков.

Синтез зернистости пленки (film_grain) улучшает кодирование зашумленных сигналов с использованием подхода параметрического кодирования видео. Из-за случайности, присущей шуму зернистости пленки, этот компонент сигнала традиционно либо очень дорог для кодирования, либо склонен к повреждению или потере, что может оставлять серьезные артефакты кодирования в виде остатков. Этот инструмент позволяет обойти эти проблемы, используя анализ и синтез, заменяя части сигнала визуально подобной синтетической текстурой, основанной исключительно на субъективном визуальном впечатлении, а не на объективном сходстве. Он удаляет зернистый компонент из сигнала, анализирует его неслучайные характеристики и вместо этого передает только описательные параметры в декодер, который добавляет обратно синтетический псевдослучайный шумовой сигнал, сформированный по образцу исходного компонента. Это визуальный эквивалент метода Perceptual Noise Substitution, который используется в аудиокодеках AC3, AAC, Vorbis и Opus.

Энтропийное кодирование

Энтропийный кодировщик Daala (daala_ec), недвоичный арифметический кодер, был выбран для замены двоичного энтропийного кодировщика VP9. Использование недвоичного арифметического кодирования помогает избежать патентов, но также добавляет параллелизм на уровне битов к последовательному процессу, что снижает требования к тактовой частоте для аппаратных реализаций. Это означает, что эффективность современного двоичного арифметического кодирования, такого как CABAC, достигается с использованием большего алфавита, чем двоичного, следовательно, большей скорости, как в коде Хаффмана (но не так просто и быстро, как код Хаффмана). AV1 также получил возможность адаптировать вероятности символов в арифметическом кодере для каждого кодированного символа, а не для каждого кадра (ec_adapt).

Качество и эффективность

Первое сравнение с начала июня 2016 года показало, что AV1 примерно наравне с HEVC, как и тот, который использовал код с конца января 2017 года.

В апреле 2017 года, используя 8 включенных экспериментальных функций в то время (всего 77), Bitmovin смог демонстрируют благоприятные объективные показатели, а также визуальные результаты по сравнению с HEVC в анимационных фильмах Sintel и Tears of Steel. Последующее сравнение, проведенное Яном Озером журнала Streaming Media Magazine подтвердил это и пришел к выводу, что «AV1 сейчас по крайней мере так же хорош, как HEVC». Озер отметил, что его результаты и результаты Bitmovin противоречат сравнению, проведенному Институтом телекоммуникаций им. Фраунгофера с конца 2016 года, который обнаружил AV1 На 65,7% менее эффективен, чем HEVC, уступая даже H.264 / AVC, который, по их мнению, эффективнее на 10,5%, и j Мы устранили это несоответствие, использовав параметры кодирования, одобренные каждым поставщиком кодировщика, а также добавив больше функций в новый кодировщик AV1. Согласно внутренним измерениям за 2017 год, производительность декодирования была примерно вдвое ниже, чем у VP9.

Тесты от Netflix в 2017 году на основе измерений с PSNR и VMAF при 720p показал, что AV1 примерно на 25% эффективнее, чем VP9 (libvpx). Тесты Facebook, проведенные в 2018 году на основе PSNR, показали, что эталонный кодировщик AV1 смог достичь 34%, 46,2% и 50,3% более высокого уровня сжатия данных чем libvpx-vp9, x264 high profile и x264 main profile соответственно.

Тесты Московского государственного университета в 2017 году показали, что VP9 требует на 31%, а HEVC на 22% больше битрейта, чем AV1, чтобы для достижения аналогичного уровня качества. Исследователи обнаружили, что используемый кодировщик AV1 работал со скоростью «в 2500–3500 раз ниже, чем у конкурентов», при этом признав, что он еще не был оптимизирован.

Тесты от Университета Ватерлоо обнаружили, что при использовании средней оценки мнения (MOS) для видео 2160p (4K) AV1 имеет экономию битрейта 9,5% по сравнению с HEVC и 16,4% по сравнению с VP9. Однако они также пришли к выводу, что во время исследования при 2160p кодирование видео AV1 в среднем занимало в 590,74 раза больше времени по сравнению с кодированием с помощью AVC, HEVC занимало в среднем 4,2810 раза больше, а VP9 занимало в среднем 5,2856 раза больше, чем AVC, соответственно.

Профили и уровни

Профили

AV1 определяет три профиля для декодеров: Основной, Высокийи Профессиональный. Основной профиль позволяет использовать 8 или 10 бит на выборку с 4: 0: 0 (шкала серого) и 4: 2: 0 выборка цветности. В профиль High дополнительно добавлена ​​поддержка выборки цветности 4: 4: 4. Профиль Professional расширяет возможности до полной поддержки 4: 0: 0, 4: 2: 0, 4: 2: 2 и 4: 4: 4 субдискретизации цветности с глубиной цвета 8, 10 и 12 бит.

Функция сравнение профилей AV1
Основной (0)Высокий (1)Профессиональный (2)
Битовая глубина8 или 10-бит8- или 10-битный8-, 10- и 12-битный
Подвыборка цветности4: 0: 0ДаДаДа
4: 2: 0ДаДаДа
4: 2: 2НетНетДа
4: 4: 4НетДаДа

Уровни

AV1 определяет уровни для декодеров с максимальными переменными для уровней от 2,0 до 6,3. Уровни, которые могут быть реализованы, зависят от возможностей оборудования.

Примеры разрешений: 426 × 240 при 30 кадрах в секунду для уровня 2.0, 854 × 480 при 30 кадрах в секунду для уровня 3.0, 1920 × 1080 при 30 кадрах в секунду для уровня 4.0, 3840 × 2160 при 60 кадрах в секунду для уровня 5.1, 3840 × 2160 при 120 кадрах в секунду для уровня 5.2 и 7680 × 4320 при 120 кадрах в секунду для уровня 6.2. Уровень 7 еще не определен.

УровеньMaxPicSize

(Образцы)

MaxHSize

(Образцы)

MaxVSize

(Образцы)

MaxDisplayRate

(Гц)

MaxDecodeRate

(Гц)

MaxHeader

Скорость (Гц)

MainMbps

(Мбит / с)

HighMbps

(Мбит / с)

Мин. Comp BasisMax TilesMax Tile ColsПример
2.0147456204811524,423,6805,529,6001501,5-284426 × 240 при 30 кадрах в секунду
2,1278784281615848,363,52010,454,4001503,0-284640 × 360 @ 30 кадров в секунду
3,06658564352244819,975,68024,969,6001506,0-2166854 × 480 при 30 кадрах в секунду
3,110650245504309631,950,72039,938,40015010,0-21661280 × 720 при 30 кадрах в секунду
4,023592966144345670,778,8 8077,856,76830012,030,043281920 × 1080 при 30 кадрах в секунду
4,1235929661443456141,557,760155,713,53630020,050,043281920 × 1080 при 60 кадрах в секунду
5,0891289681924352267,386,880273,715,20030030,0100,066483840 × 2160 при 30 кадрах в секунду
5,1891289681924352534,773,760547,430,40030040,0160,086483840 × 2160 при 60 кадрах в секунду
5.28912896819243521,069,547,5201,094,860,80030060,0240,086483840 × 2160 при 120 кадрах в секунду
5,38912896819243521,069,547,5201,176,502,27230060,0240,086483840 × 2160 @ 120 кадров / с
6.0356515841638487041,069,547,5201,176,502,27230060,0240,08128167680 × 4320 @ 30 кадров в секунду
6,1356515841638487042,139,095,0402,189,721,600300100,0480,08128167680 × 4320 при 60 кадрах в секунду
6,2356515841638487044,278,190,0804,379,443,200300160,0800,08128167680 × 4320 @ 120 кадров в секунду
6.3356515841638487044,278,190,0804,706,009,088300160,0800,08128167680 × 4320 при 120 кадрах в секунду

Поддерживаемые форматы контейнеров

Стандартизованный
Базовый формат файлов мультимедиа ISO : спецификация контейнеров ISOBMFF, разработанная AOMedia, была первой, которая была завершена и первой получила распространение. Это формат, используемый YouTube.
Matroska : Версия 1 спецификации контейнеризации Matroska была опубликована в конце 2018 года.
Незавершенные стандарты
Транспортный поток MPEG :
Не стандартизирован
WebM: формально, AV1 не был включен в подмножество Matroska, известное как WebM, на конец 2019 года.
On2 IVF : этот формат унаследован от первый публичный выпуск VP8, где он служил простым контейнером для разработки. rav1e также поддерживает этот формат.
Предварительный стандарт WebM: в Libaom была ранняя поддержка WebM, до того, как была указана контейнеризация Matroska, но была изменена для соответствия.

Принятие

Поставщики контента

YouTube начал выпуск AV1, начиная со своего плейлиста запуска бета-версии AV1. Согласно описанию, видео (для начала) кодируются с высоким битрейтом для проверки производительности декодирования, и YouTube ставит «амбициозные цели» по развертыванию AV1. YouTube для Android TV поддерживает воспроизведение видео, закодированных в AV1, на поддерживаемых платформах, начиная с версии 2.10.13, выпущенной в начале 2020 года. Видео

Vimeo на канале «Выбор персонала»: доступно в AV1. Vimeo использует и вносит свой вклад в кодировщик Mozilla Rav1e и ожидает, с дальнейшими улучшениями кодировщика, в конечном итоге обеспечит поддержку AV1 для всех видео, загруженных на Vimeo, а также для предложения компании «Live».

В октябре 2016 года Netflix заявили, что рассчитывают стать одним из первых приверженцев AV1. 5 февраля 2020 года Netflix начал использовать AV1 для потоковой передачи избранных заголовков на Android, что на 20% повысило эффективность сжатия по сравнению с потоками VP9.

После своих очень положительных результатов тестирования Facebook заявил, что будет постепенно развертывать AV1 как как только появится поддержка браузеров, начиная с их самых популярных видео.

Twitch планирует развернуть AV1 для своего самого популярного контента в 2022 или 2023 годах, а универсальная поддержка ожидается в 2024 или 2025 году.

30 апреля 2020 года iQIYI объявил о поддержке AV1 для пользователей веб-браузеров ПК и устройств Android, став «первым и единственным китайским сайтом потокового видео, который на сегодняшний день принял формат AV1».

Программные реализации

  • Libaom - это эталонная реализация. Он включает в себя кодировщик (aomenc) и декодер (aomdec). Как и предыдущий исследовательский кодек, он имеет то преимущество, что он оправданно демонстрирует эффективное использование каждой функции, но за счет общей скорости кодирования. При замораживании функций кодировщик стал проблемно медленным, но оптимизация скорости с незначительным влиянием на эффективность продолжалась и после этого.
  • rav1e - кодировщик, написанный на Rust и на ассемблере. rav1e использует подход, противоположный Aomenc: начните с простейшего (а значит, и самого быстрого) соответствующего кодировщика, а затем со временем повышайте эффективность, оставаясь при этом быстрым.
  • SVT-AV1 включает кодировщик с открытым исходным кодом и впервые выпущенный декодер от Intel в феврале 2019 года, который разработан специально для использования на серверах центров обработки данных на базе процессоров Intel Xeon . Netflix сотрудничает с Intel над SVT-AV1.
  • dav1d - это декодер, написанный на C99 и сборка, ориентированная на скорость и переносимость. Первая официальная версия (0.1) была выпущена в декабре 2018 года. Версия 0.2 была выпущена в марте 2019 года, и, по словам разработчиков, пользователи могли «безопасно использовать декодер на всех платформах с отличной производительностью». Версия 0.3 была анонсирована в мае 2019 года с дальнейшими оптимизациями, демонстрирующими производительность от 2 до 5 раз быстрее, чем aomdec.; версия 0.5 была выпущена в октябре 2019 года. В мае 2019 года Firefox 67 перешел с Libaom на dav1d в качестве декодера по умолчанию.
  • Cisco AV1 - это проприетарный кодировщик реального времени, разработанный Cisco для своего Webex телеконференции продукты. Кодировщик оптимизирован для задержки и ограничения «полезной площади процессора», как в случае с «обычным ноутбуком». Cisco подчеркнула, что в их рабочей точке - высокая скорость, низкая задержка - большой набор инструментов AV1 не исключает низкой сложности кодирования. Скорее, наличие инструментов для экранного содержимого и масштабируемости во всех профилях позволило им найти хорошие компромиссы между сжатием и скоростью, даже лучше, чем с HEVC. По сравнению с ранее развернутым кодировщиком H.264, особая область улучшений заключалась в совместном использовании экрана с высоким разрешением.
  • libgav1 - это декодер, написанный на C ++ 11, выпущенный Google.

Несколько других сторон объявили о работе над кодировщиками, включая EVE для AV1 (в стадии бета-тестирования), NGCodec, Socionext, Aurora и MilliCast.

Поддержка программного обеспечения

  • Firefox (начиная с версии 67.0, Май 2019 г.; включен по умолчанию на всех настольных платформах - Windows, macOS и Linux как для 32-разрядных, так и для 64-разрядных систем)
  • Google Chrome (начиная с версии 70, октябрь 2018 г.)
  • Opera (начиная с версии 57 от 28 ноября 2018 г.)
  • Microsoft Edge (начиная с Windows 10 с обновлением октябрь 2018 г. (1809) с надстройкой AV1 Video Extension )
  • VLC media player (начиная с версии 3.0)
  • GStreamer (начиная с версии 1.14)
  • FFmpeg (начиная с версии 4.0)
  • mpv (начиная с версии 0.29.0)
  • Xine-lib (начиная с 1.2.10)
  • MKVToolNix (принятие окончательной спецификации av1-in-mkv с версии 28)
  • MediaInfo (с версии 18.03)
  • Bitmovin Кодирование (с версии 1.50.0, 4 июля 2018 г.)
  • Elecard StreamEye Studio (инструменты для анализа качества видео)
  • K -Lite Codec Pack (с версии 14.4.5, 13 сентября 2018 г.)
  • HandBrake (с версии 1.3.0, 9 ноября 2019 г.; поддержка декодирования)
  • PotPlayer (начиная с версии 1.7.14804, 16 октября 2018 г.)
  • Google Duo (с апреля 2020 г.)

Поддержка операционной системы

Поддержка AV1 различными операционными системами
Microsoft Windows macOS BSD / Linux Chrome OS Android OS iOS
Поддержка кодековЧастичнаяНетДаДаДаНет
Поддержка контейнерабазовый формат медиафайлов ISO (.mp4 )
WebM (.webm)
Matroska (.mkv)
Нетбазовый формат медиафайлов ISO (.mp4)
WebM (.webm)
Matroska (.mkv)
TBAНет
Примечания- Поддержка введена в Windows 10 October 2018 Update (1809) с надстройкой AV1 Video Extension.

- поддерживается в приложениях универсальной платформы Windows, таких как Microsoft Edge и Films & TV.

Не поддерживается в macOS Catalina.поддерживает декодирование, начиная с Chrome OS 70 и далееПоддерживается с Android 10.Не поддерживается в iOS 13.

Аппаратное обеспечение

Несколько членов Альянса продемонстрировали продукты с поддержкой AV1 на IBC 2018, включая кодировщик с аппаратным ускорением Socionext. Согласно Socionext, ускоритель кодирования основан на FPGA и может работать в облачном инстансе Amazon EC2 F1, где он работает в 10 раз быстрее, чем существующие программные кодировщики.

По словам Мукунда Сринивасана, коммерческого директора члена AOM Иттиама, на раннем этапе поддержки оборудования будет преобладать программное обеспечение, работающее на аппаратном обеспечении без CPU (например, GPGPU, DSP или шейдерные программы, как в случае с некоторые аппаратные реализации VP9 ), поскольку аппаратным средствам с фиксированными функциями потребуется 12–18 месяцев после замораживания потока битов до появления микросхем, плюс 6 месяцев для продуктов, основанных на этих микросхемах, для выхода на рынок. Битовый поток был окончательно заморожен 28 марта 2018 года, то есть чипы могут быть доступны где-то в период с марта по август 2019 года. Согласно приведенному выше прогнозу, продукты на основе чипов могут появиться на рынке в конце 2019 или начале 2020 года.

  • 7 января 2019 года NGCodec объявила о поддержке AV1 для NGCodec, ускоренного с помощью ПЛИС Xilinx.
  • 18 апреля 2019 года Allegro DVT анонсировала свой аппаратный IP-адрес мультиформатного видеокодера AL-E210, первого публично анонсированного аппаратного кодера AV1. AL-E210 поддерживает, помимо VP9, ​​H.265 / HEVC, H.264 / AVC и JPEG, основной профиль AV1, с помощью которого он может кодировать субдискретизацию цветности 4: 2: 0 с глубиной цвета 8 и 10 бит. Одно ядро ​​может кодировать 4K со скоростью 30 кадров в секунду, с несколькими ядрами, которые должны быть даже выше.
  • 23 апреля 2019 года Rockchip анонсировали свой SoC RK3588, который поддерживает аппаратное декодирование AV1 до 4K 60 кадров в секунду. при 10-битной глубине цвета.
  • 9 мая 2019 года Amphion анонсировала видеодекодер с поддержкой AV1 до 4K 60 кадров в секунду 28 мая 2019 года Realtek анонсировала RTD2893, свою первую интегральную схему с декодированием AV1, до 8K.
  • 17 июня 2019 года Realtek анонсировала SoC RTD1311 для телевизионных приставок со встроенным декодером AV1.
  • 20 октября 2019 года была показана дорожная карта от Amlogic, которая включает 3 набора: SoC приставки, способные декодировать контент AV1, S805X2, S905X4 и S908X. К декабрю S905X4 использовался в SDMC DV8919.
  • 21 октября 2019 года Chips & Media анонсировала WAVE510A VPU, поддерживающий декодирование AV1 со скоростью до 4Kp120.
  • 26 ноября 2019, MediaTek анонсировала первый в мире смартфон SoC со встроенным декодером AV1. Dimensity 1000 может декодировать контент AV1 со скоростью до 4K 60 кадров в секунду.
  • 3 января 2020 года компания LG Electronics объявила, что ее телевизоры 8K 2020 года, основанные на процессоре α9 Gen 3, поддерживают AV1.
  • На выставке CES 2020 компания Samsung объявила, что ее телевизоры 8K QLED 2020 года с «квантовым процессором 8K SoC» от ​​Samsung способны декодировать AV1.
  • 13 августа 2020 года Intel объявила, что их графический процессор Intel Xe-LP в Tiger Lake станет их первым продуктом, включающим аппаратное декодирование с фиксированной функцией AV1.
  • 1 сентября 2020 года объявила Nvidia что их графические процессоры Nvidia GeForce RTX 30 Series будут поддерживать аппаратное декодирование с фиксированной функцией AV1.
  • 2 сентября 2020 года Intel официально выпустила процессоры Tiger Lake 11-го поколения с аппаратным декодированием AV1 с фиксированной функцией.
  • 15 сентября 2020 года AMD объединила патчи в драйверы amdgpu для Linux, которые добавляют поддержку декодирования AV1 на графических процессорах RDNA2.
  • 28 сентября 2020 года Roku обновил Roku Ultra, включая поддержку AV1.
  • 30 сентября 2020 года Intel выпустила версию 20.3.0 для Intel Media Driver, которая добавила поддержку декодирования AV1 в Linux.
  • 10 октября 2020 года Microsoft подтвердила поддержку аппаратного декодирования AV1 на Xe-LP (Gen12), Ampere и RDNA2 с сообщением в блоге.
Сравнение оборудования AV1
ПродуктФункцияПрофильПропускная способность

(одноядерный)

Пропускная способность

(макс.)

Ссылка
AllegroAL-E210EОсновная (0)4K 30 кадров в секунду?
AMD RDNA 2 D???
Amlogic S905X4D4K 120 кадров в секунду
S908XD8K 60 кадров в секунду
S805X2D1080p
AmphionCS8142D4K 60fps
Broadcom BCM7218XD4K
Chips & Media WAVE510ADMain (0)4K 60fps4K 120fps
Dwango E720p 30fps
Intel Tiger Lake D8K 10-бит
MediaTek Dimensity 1000D4K 60fps4K 60 кадров в секунду
Nvidia GeForce 30 D8K 10-бит 60 кадров в секунду
Realtek RTD1311D4K
RTD2893D8K
Rockchip RK3588D4K 60 кадров в секунду 10 бит

D = декодирование, E = кодирование

Заявки на патент

Компания Sisvel, базирующаяся в Люксембурге, сформировала патентный пул и продает патентную лицензию на AV1. О создании пула было объявлено в начале 2019 года, но список заявленных патентов был впервые опубликован 10 марта 2020 года. Этот список содержит более 1050 патентов. Сущность патентных притязаний остается оспоренной.

Цены Sisvel составляют 0,32 евро за устройства отображения и 0,11 евро за устройства без дисплея, использующие AV1. Sisvel заявила, что они не будут добиваться лицензионных отчислений за контент, но их лицензия не делает исключений для программного обеспечения.

По состоянию на март 2020 года Alliance for Open Media не ответила на список патентных требований. В их заявлении после первоначального объявления Sisvel подтверждается приверженность их бесплатной патентной лицензии и упоминается «программа защиты патентов AOMedia для защиты участников экосистемы AV1 в случае патентных претензий», но не упоминается претензия Sisvel по имени.

Формат файла изображения AV1 (AVIF)

Формат файла изображения AV1 (AVIF) (произносится [əˈ vif]) - это формат файла изображения. спецификация для хранения изображений или изображений последовательности, сжатые с помощью AV1 в формате файла HEIF. Он конкурирует с HEIC, который использует тот же формат контейнера, основанный на ISOBMFF, но HEVC для сжатия. Версия 1.0.0 спецификации AVIF была завершена в феврале 2019 года.

AVIF поддерживает такие функции, как:

Поддержка AVIF

14 декабря 2018 года Netflix опубликовал первые образцы изображений.avif, а поддержка была добавлена ​​в VLC. Microsoft объявила о поддержке предварительной версии Windows 10 «19H1 », включая поддержку в File Explorer, Paint и нескольких API, а также в образцах изображений. Paint.net добавила поддержку открытия файлов AVIF в сентябре 2019 года и возможность сохранять изображения в формате AVIF в обновлении за август 2020 года. Преобразование формата Colorist и данные изображения RAW Darktable выпустили поддержку и предоставляют эталонные реализации libavif, а также была разработана реализация плагина GIMP, поддерживающая как 3.x, так и 2.10.x плагин API. Встроенный импорт и экспорт AVIF был добавлен в GIMP в октябре 2020 года.

14 февраля 2020 года Netflix опубликовал статью в блоге с объективными измерениями качества изображения AVIF и эффективности сжатия по сравнению с JPEG.

Поддержка AVIF в веб-браузерах находится в разработке. В августе 2020 года был выпущен Google Chrome версии 85 с полной поддержкой AVIF. Mozilla работает над поддержкой формата изображений в Firefox. Cloudflare объявил о поддержке AVIF в своем блоге 3 октября 2020 года.

Ссылки

Внешние ссылки

На Викискладе есть средства массовой информации, связанные с AV1 .
Последняя правка сделана 2021-06-08 15:22:41
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте