MPEG-4 - это метод определения сжатия цифровых аудиовизуальных (AV) данных. Он был представлен в конце 1998 года и стал стандартом для группы форматов кодирования аудио и видео и связанных технологий, согласованных группой экспертов ISO / IEC по движущимся изображениям (MPEG) ( ISO / IEC JTC1 / SC29 / WG11) в соответствии с формальным стандартом. ISO / IEC 14496 - Кодирование аудиовизуальных объектов. Использование MPEG-4 включает сжатие AV-данных для Интернет-видео и распространения компакт-дисков, голоса ( телефон, видеофон ) и приложений широковещательного телевидения. Стандарт MPEG-4 был разработан группой во главе с Тураджем Эбрахими (позже президентом JPEG ) и Фернандо Перейрой.
MPEG-4 вбирает в себя многие функции MPEG-1 и MPEG-2 и других связанных стандартов, добавляя новые функции, такие как (расширенная) поддержка VRML для 3D-рендеринга, объектно-ориентированные составные файлы (включая аудио, видео и объекты VRML), поддержка внешнего управления цифровыми правами и различных типов интерактивности. AAC (Advanced Audio Coding) был стандартизирован как дополнение к MPEG-2 (как часть 7) до того, как был выпущен MPEG-4.
MPEG-4 все еще находится в стадии развития и разделен на несколько частей. Компании, продвигающие совместимость с MPEG-4, не всегда четко указывают, к какому «частичному» уровню совместимости они относятся. Ключевые части, о которых следует знать, - это MPEG-4 Part 2 (включая Advanced Simple Profile, используемый такими кодеками, как DivX, Xvid, Nero Digital и 3ivx, а также QuickTime 6) и MPEG-4 part 10 (MPEG-4 AVC / H.264 или улучшенное кодирование видео, используемое кодировщиком x264, Nero Digital AVC, QuickTime 7 и видеоматериалами высокой четкости, такими как диск Blu-ray ).
Большинство функций, включенных в MPEG-4, оставлено на усмотрение отдельных разработчиков, чтобы решить, реализовывать или нет. Это означает, что, вероятно, не существует полной реализации всего набора стандартов MPEG-4. Чтобы справиться с этим, в стандарт включены концепции «профилей» и «уровней», позволяющие определять конкретный набор возможностей способом, подходящим для подмножества приложений.
Первоначально MPEG-4 был нацелен в первую очередь на видеосвязь с низкой скоростью передачи данных; однако его область применения в качестве стандарта кодирования мультимедиа позже была расширена. MPEG-4 эффективен при различных скоростях передачи данных от нескольких килобит в секунду до десятков мегабит в секунду. MPEG-4 обеспечивает следующие функции:
MPEG-4 предоставляет ряд технологий для разработчиков, поставщиков услуг и конечных пользователей:
Формат MPEG-4 может выполнять различные функции, среди которых могут быть следующие:
MPEG-4 предоставляет большой и богатый набор инструментов для кодирования. Подмножества наборов инструментов MPEG-4 были предоставлены для использования в определенных приложениях. Эти подмножества, называемые «профилями», ограничивают размер набора инструментов, который требуется реализовать декодеру. Чтобы ограничить вычислительную сложность, для каждого профиля устанавливается один или несколько «уровней». Комбинация профиля и уровня позволяет:
MPEG-4 состоит из нескольких стандартов, называемых «частями», включая следующие (каждая часть охватывает определенный аспект всей спецификации):
Часть | Число | Дата первого публичного выпуска (первое издание) | Дата последнего публичного выпуска (последнее издание) | Последняя поправка | Заголовок | Описание |
---|---|---|---|---|---|---|
Часть 1 | ИСО / МЭК 14496-1 | 1999 г. | 2010 г. | 2014 г. | Системы | Описывает синхронизацию и мультиплексирование видео и аудио. Например, формат файла MPEG-4 версии 1 (устарел в версии 2, определенной в MPEG-4, часть 14). Функциональные возможности стека транспортных протоколов для передачи и / или хранения контента, соответствующего ИСО / МЭК 14496, не входят в сферу действия 14496-1, и рассматривается только интерфейс к этому уровню (DMIF). Информация о транспортировке контента MPEG-4 определяется, например, в транспортном потоке MPEG-2, профилях аудио-видео RTP и других. |
Часть 2 | ИСО / МЭК 14496-2 | 1999 г. | 2004 г. | 2009 г. | Визуальный | Формат сжатия визуальных данных (видео, неподвижные текстуры, синтетические изображения и т. Д.). Одним из многих «профилей» в Части 2 является Advanced Simple Profile (ASP). |
Часть 3 | ИСО / МЭК 14496-3 | 1999 г. | 2009 г. | 2017 г. | Аудио | Набор форматов сжатия для перцептивного кодирования аудиосигналов, включая некоторые варианты Advanced Audio Coding (AAC), а также другие форматы и инструменты кодирования аудио / речи (такие как Audio Lossless Coding (ALS), Scalable Lossless Coding (SLS), Структурированный звук, преобразование текста в речь (TTSI), HVXC, CELP и другие) |
Часть 4 | ИСО / МЭК 14496-4 | 2000 г. | 2004 г. | 2016 г. | Тестирование на соответствие | Описывает процедуры проверки соответствия другим частям стандарта. |
Часть 5. | ИСО / МЭК 14496-5 | 2000 г. | 2001 г. | 2017 г. | Справочное программное обеспечение | Предоставляет справочное программное обеспечение для демонстрации и пояснения других частей стандарта. |
Часть 6 | ИСО / МЭК 14496-6 | 1999 г. | 2000 г. | Платформа интеграции мультимедиа доставки (DMIF) | ||
Часть 7 | ISO / IEC TR 14496-7 | 2002 г. | 2004 г. | Оптимизированное справочное программное обеспечение для кодирования аудиовизуальных объектов | Предоставляет примеры того, как сделать улучшенные реализации (например, в отношении Части 5). | |
Часть 8 | ИСО / МЭК 14496-8 | 2004 г. | 2004 г. | Передача содержимого ISO / IEC 14496 по IP-сетям | Задает метод передачи содержимого MPEG-4 в IP- сетях. Он также включает рекомендации по разработке форматов полезной нагрузки RTP, правила использования SDP для передачи информации, относящейся к ISO / IEC 14496-1, определения типов MIME, анализ безопасности RTP и многоадресной рассылки. | |
Часть 9 | ISO / IEC TR 14496-9 | 2004 г. | 2009 г. | Описание эталонного оборудования | Предоставляет проекты оборудования для демонстрации того, как реализовать другие части стандарта. | |
Часть 10. | ИСО / МЭК 14496-10 | 2003 г. | 2014 г. | 2016 г. | Расширенное кодирование видео (AVC) | Формат сжатия видеосигналов, технически идентичный стандарту ITU-T H.264. |
Часть 11 | ИСО / МЭК 14496-11 | 2005 г. | 2015 г. | Описание сцены и движок приложения | Может использоваться для многофункционального интерактивного контента с несколькими профилями, включая 2D и 3D версии. MPEG-4, часть 11, пересмотренный MPEG-4, часть 1 - ISO / IEC 14496-1: 2001 и две поправки к MPEG-4, часть 1. Он описывает описание на системном уровне механизма приложения (доставка, жизненный цикл, формат и поведение загружаемых файлов). Java- приложения с байт-кодом), а также двоичный формат сцены (BIFS) и расширяемый текстовый формат MPEG-4 (XMT) - текстовое представление мультимедийного содержимого MPEG-4 с использованием XML и т. Д. (Он также известен как BIFS, XMT)., MPEG-J. MPEG-J был определен в MPEG-4, часть 21) | |
Часть 12 | ИСО / МЭК 14496-12 | 2004 г. | 2015 г. | 2017 г. | Базовый формат медиафайлов ISO | Формат файла для хранения медиаконтента с привязкой ко времени. Это общий формат, образующий основу для ряда других более конкретных форматов файлов (например, 3GP, Motion JPEG 2000, MPEG-4, часть 14 ). Технически он идентичен ISO / IEC 15444-12 ( система кодирования изображений JPEG 2000 - Часть 12). |
Часть 13. | ИСО / МЭК 14496-13 | 2004 г. | 2004 г. | Расширения для управления и защиты интеллектуальной собственности (IPMP) | В MPEG-4 Part 13 внесена поправка к MPEG-4 Part 1 - ISO / IEC 14496-1: 2001 / Amd 3: 2004. Он определяет общую обработку управления и защиты интеллектуальной собственности (IPMP), синтаксис и семантику для передачи инструментов IPMP в битовом потоке, передачу информации IPMP, взаимную аутентификацию для инструментов IPMP, список органов регистрации, необходимых для поддержки измененных спецификаций. (например, CISAC ) и т. д. Он был определен из-за отсутствия взаимодействия различных механизмов защиты (разных систем DRM) для защиты и распространения защищенного авторским правом цифрового контента, такого как музыка или видео. | |
Часть 14. | ИСО / МЭК 14496-14 | 2003 г. | 2003 г. | 2010 г. | Формат файла MP4 | Он также известен как «формат файла MPEG-4 версии 2». Обозначенный формат файла-контейнера для содержимого MPEG-4, основанный на Части 12. Он пересматривает и полностью заменяет Раздел 13 ISO / IEC 14496-1 (MPEG-4, Часть 1: Системы), в котором формат файла MPEG-4 было указано ранее. |
Часть 15. | ИСО / МЭК 14496-15 | 2004 г. | 2017 г. | 2020 г. | Часть 15: Перенос структурированного видео блока уровня сетевой абстракции (NAL) в базовом формате медиафайлов ISO | Для хранения видео части 10. Формат файла основан на Части 12, но также допускает хранение в других форматах файлов. |
Часть 16. | ИСО / МЭК 14496-16 | 2004 г. | 2011 г. | 2016 г. | Расширение Animation Framework (AFX) | Он определяет модель расширения MPEG-4 Animation Framework (AFX) для представления содержимого 3D-графики. MPEG-4 расширен синтетическими объектами более высокого уровня для определения геометрии, текстуры, анимации и специальных алгоритмов сжатия. |
Часть 17. | ИСО / МЭК 14496-17 | 2006 г. | 2006 г. | Потоковый текстовый формат | Формат субтитров с синхронизированным текстом | |
Часть 18. | ИСО / МЭК 14496-18 | 2004 г. | 2004 г. | 2014 г. | Сжатие шрифтов и потоковая передача | Для формата открытого шрифта, определенного в части 22. |
Часть 19. | ИСО / МЭК 14496-19 | 2004 г. | 2004 г. | Синтезированный поток текстур | Синтезированные потоки текстур используются для создания синтетических видеоклипов с очень низким битрейтом. | |
Часть 20. | ИСО / МЭК 14496-20 | 2006 г. | 2008 г. | 2010 г. | Облегченное представление сцены приложения (LASeR) и простой формат агрегирования (SAF) | Требования LASeR (эффективность сжатия, код и объем памяти) выполняются на основе существующего формата масштабируемой векторной графики (SVG), определенного Консорциумом World Wide Web. |
Часть 21 | ИСО / МЭК 14496-21 | 2006 г. | 2006 г. | Расширения графической среды MPEG-J (GFX) | Описывает облегченную программную среду для расширенных интерактивных мультимедийных приложений - структуру, сочетающую подмножество стандартной среды приложений Java MPEG (MPEG-J) с API Java. (на стадии «FCD» в июле 2005 г., FDIS в январе 2006 г., опубликован как стандарт ISO 22 ноября 2006 г.). | |
Часть 22. | ИСО / МЭК 14496-22 | 2007 г. | 2015 г. | 2017 г. | Открыть формат шрифта | OFFS основан на спецификации формата шрифта OpenType версии 1.4 и технически эквивалентен этой спецификации. Достигнута стадия "CD" в июле 2005 г., опубликована в качестве стандарта ISO в 2007 г. |
Часть 23 | ИСО / МЭК 14496-23 | 2008 г. | 2008 г. | Символическое музыкальное представление (SMR) | Достигнута стадия «FCD» в октябре 2006 г., опубликована в качестве стандарта ISO в 2008-01-28. | |
Часть 24. | ISO / IEC TR 14496-24 | 2008 г. | 2008 г. | Аудио и взаимодействие систем | Описывает желаемое совместное поведение файлового формата MPEG-4 и MPEG-4 Audio. | |
Часть 25. | ИСО / МЭК 14496-25 | 2009 г. | 2011 г. | Модель сжатия 3D-графики | Определяет модель для соединения инструментов сжатия трехмерной графики, определенных в стандартах MPEG-4, с графическими примитивами, определенными в любом другом стандарте или спецификации. | |
Часть 26. | ИСО / МЭК 14496-26 | 2010 г. | 2010 г. | 2016 г. | Аудио соответствие | |
Часть 27. | ИСО / МЭК 14496-27 | 2009 г. | 2009 г. | 2015 г. | Соответствие 3D-графике | Соответствие 3D-графики суммирует требования, перекрестно связывает их с характеристиками и определяет, как можно проверить соответствие им. Даны рекомендации по построению тестов для проверки соответствия декодера. |
Часть 28 | ИСО / МЭК 14496-28 | 2012 г. | 2012 г. | Составное представление шрифта | ||
Часть 29. | ИСО / МЭК 14496-29 | 2014 г. | 2015 г. | Кодирование веб-видео | Текст Части 29 заимствован из Части 10 - ИСО / МЭК 14496-10. Кодирование веб-видео - это технология, совместимая с ограниченным базовым профилем ISO / IEC 14496-10 (подмножество, указанное в Приложении A для ограниченного базового уровня, является нормативной спецификацией, а все остальные части являются информативными). | |
Часть 30. | ИСО / МЭК 14496-30 | 2014 г. | 2014 г. | Синхронизированный текст и другие визуальные наложения в базовом формате медиафайлов ISO | Он описывает передачу некоторых форм синхронизированного текста и потоков субтитров в файлах на основе ISO / IEC 14496-12 - W3C Timed Text Markup Language 1.0, W3C WebVTT (Web Video Text Tracks). Документация этих форм не исключает другого определения передачи синхронизированного текста или субтитров; см., например, синхронизированный текст 3GPP (3GPP TS 26.245). | |
Часть 31 | ИСО / МЭК 14496-31 | В разработке (2018-05) | Кодирование видео для браузеров | Кодирование видео для браузеров (VCB) - технология сжатия видео, предназначенная для использования в браузере World Wide Web. | ||
Часть 32. | ISO / IEC CD 14496-32 | В разработке | Программное обеспечение соответствия и справочное программное обеспечение | |||
Часть 33. | ИСО / МЭК FDIS 14496-33 | В разработке | Кодирование интернет-видео |
Профили также определяются в отдельных «частях», поэтому реализация части обычно не является реализацией всей части.
MPEG-1, MPEG-2, MPEG-7 и MPEG-21 - это другие наборы стандартов MPEG.
Низкопрофильные уровни являются частью ограничений кодирования / декодирования видео MPEG-4 и совместимы со старым стандартом ITU H.261, а также с прежними стандартами аналогового телевидения для вещания и записи (такими как видео NTSC или PAL). Профиль ASP на самом высоком уровне подходит для большинства обычных DVD-носителей и проигрывателей или для многих онлайн-видеосайтов, но не для записей Blu-ray или онлайн-контента HD-видео.
Профиль | Уровень | Максимум. буфер | Максимум. битрейт | Максимум. задерживать | Максимум. Размер ВП | Максимум. Размер VOP | Максимум. скорость декодера | Максимум. размер кадра | ||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
@ Макс. битрейт | @ 30 Гц | @ 25 Гц | @ 24 Гц | @ 15 Гц | @ 12,5 Гц | |||||||
SP | L0 | 160 | 64 | 2,50 | 2 048 | 99 | 1,485 | - | QCIF (176 × 144) | |||
L0b | 320 | 128 | ||||||||||
L1 | 160 | 64 | 128 × 96 | 144 × 96 | 160 × 96 | |||||||
L2 | 640 | 128 | 5.00 | 4096 | 396 | 5 940 | 256 × 192 | 304 × 192, 288 × 208 | 304 × 208 | CIF (352 × 288) | ||
L3 | 384 | 1,66 | 8192 | 11 880 | CIF (352 × 288) | |||||||
L4a | 1,280 | 4 000 | 0,32 | 16 384 | 1,200 | 36 000 | VGA (640 × 480) | |||||
L5 | 1,792 | 8 000 | 0,22 | 1,620 | 40 500 | D1 NTSC (720 × 480) | D1 PAL (720 × 576) | |||||
L6 | 3 968 | 12 000 | 0,33 | 3600 | 108 000 | 720p (1280x720) | ||||||
ASP | L0 | 160 | 128 | 1,25 | 2 048 | 99 | 2 970 | QCIF (176 × 144) | ||||
L1 | ||||||||||||
L2 | 640 | 384 | 1,66 | 4096 | 396 | 5 940 | 256 × 192 | 304 × 192, 288 × 208 | 304 × 208 | CIF (352 × 288) | ||
L3 | 768 | 0,86 | 11 880 | CIF (352 × 288) | ||||||||
L3b | 1,040 | 1,500 | 0,69 | |||||||||
L4 | 1,280 | 3 000 | 0,43 | 8192 | 792 | 23 760 | 352 × 576, 704 × 288 | |||||
L5 | 1,792 | 8 000 | 0,22 | 16 384 | 1,620 | 48 600 | 720 × 576 | |||||
Единицы | кбит | кбит / с | секунды | биты | макроблоки | макроблоков / с | пиксели |
Более продвинутые профили для HD-носителей были определены позже в профиле AVC, который функционально идентичен стандарту ITU H.264, но теперь также интегрирован в MPEG-4 Part 10 ( список см. В H.264 / MPEG-4 AVC. определенных уровней в этом профиле AVC).
MPEG-4 содержит запатентованные технологии, использование которых требует лицензирования в странах, признающих патенты на программные алгоритмы. Более двух десятков компаний заявляют, что имеют патенты на MPEG-4. MPEG LA лицензирует патенты, необходимые для MPEG-4 Part 2 Visual, от широкого круга компаний (аудио лицензируется отдельно) и перечисляет всех своих лицензиаров и лицензиатов на сайте. Новые лицензии на патенты на системы MPEG-4 находятся в стадии разработки, и новые лицензии не предлагаются, в то время как держатели ее старой лицензии на системы MPEG-4 все еще подпадают под условия этой лицензии на перечисленные патенты ( MPEG LA - Список патентов ).
Большинство патентов, используемых для формата MPEG-4 Visual, принадлежат трем японским компаниям: Mitsubishi Electric (255 патентов), Hitachi (206 патентов) и Panasonic (200 патентов).