JBIG2

редактировать

JBIG2
Разработано	Joint Bi-level Image Experts Group
Последняя версия	2
Содержится в	Portable Document Format, FAX
Standard	ITU T.88 ISO / IEC 14492

JBIG2 - это стандарт сжатия изображений для двухуровневых изображений, разработанный Объединенная группа экспертов по двухуровневому изображению. Он подходит для сжатия как без потерь, так и с потерями. Согласно пресс-релизу группы, в режиме без потерь JBIG2 обычно генерирует файлы в 3–5 раз меньше, чем Fax Group 4, и в 2–4 раза меньше, чем JBIG, предыдущий bi стандарт сжатия, выпущенный Группой. JBIG2 был опубликован в 2000 г. как международный стандарт ITU T.88, а в 2001 г. как ISO / IEC 14492.

Содержание

1 Функциональные возможности
2 Технические детали
- 2.1 Данные текстового изображения
- 2.2 Полутона
- 2.3 Арифметическое энтропийное кодирование
3 Патенты
4 Недостатки
5 Ссылки
6 Внешние ссылки

Функциональность

В идеале кодировщик JBIG2 сегментирует входную страницу на области текста, области изображений полутонов и области других данных. Области, которые не являются ни текстом, ни полутонами, обычно сжимаются с использованием контекстно-зависимого алгоритма арифметического кодирования, называемого MQ-кодером. Текстовые области сжимаются следующим образом: пиксели переднего плана в областях группируются в символы. Затем создается и кодируется словарь символов, обычно также с использованием контекстно-зависимого арифметического кодирования, и области кодируются, описывая, какие символы и где появляются. Обычно символ соответствует текстовому символу, но этого не требует метод сжатия. Для сжатия с потерями разницей между похожими символами (например, немного отличающимися оттисками одной и той же буквы) можно пренебречь; для сжатия без потерь эта разница учитывается путем сжатия одного похожего символа с использованием другого в качестве шаблона. Полутоновые изображения могут быть сжаты путем восстановления изображения в градациях серого, используемого для генерации полутонов, и последующей отправки этого изображения вместе со словарем полутоновых узоров. В целом алгоритм, используемый JBIG2 для сжатия текста, очень похож на схему сжатия JB2, используемую в формате файла DjVu для кодирования двоичных изображений.

Файлы PDF версии 1.4 и выше могут содержать данные, сжатые JBIG2. Декодеры с открытым исходным кодом для JBIG2 - это jbig2dec, jbig2-imageio на основе java и декодер, найденный в версиях 2.00 и выше для xpdf. Кодировщиком с открытым исходным кодом является jbig2enc.

Технические детали

Как правило, двухуровневое изображение состоит в основном из большого количества текстовых и полутоновых данных, в которых одни и те же формы появляются повторно. Двухуровневое изображение разделено на три области: текст, полутона и общие области. Каждый регион кодируется по-разному, и методики кодирования описаны в следующем отрывке.

Данные текстового изображения

Кодирование текста основано на природе визуальной интерпретации человека. Наблюдатель-человек не может различить два экземпляра одних и тех же символов в двухуровневом изображении , даже если они не могут точно совпадать пиксель за пикселем. Следовательно, необходимо кодировать только битовую карту одного репрезентативного экземпляра символа вместо кодирования битовой карты каждого вхождения одного и того же символа по отдельности. Для каждого экземпляра символа закодированный экземпляр символа затем сохраняется в «словаре символов». Существует два метода кодирования данных текстового изображения: сопоставление и замена с образцом (PMS) и мягкое сопоставление с образцом (SPM). Эти методы представлены в следующих подразделах.

Блок-схемы (слева) метода сопоставления с образцом и подстановки и (справа) метода мягкого сопоставления с образцом

Сопоставление с образцом и замена: После выполнения сегментации изображения и сопоставления поиск, и если соответствие существует, мы кодируем индекс соответствующего репрезентативного растрового изображения в словаре и позицию символа на странице. Позиция обычно указывается относительно другого ранее закодированного символа. Если совпадение не найдено, сегментированный блок пикселей кодируется напрямую и добавляется в словарь. Типичные процедуры сопоставления с образцом и алгоритма подстановки показаны на левой блок-схеме рисунка выше. Хотя метод PMS может обеспечить выдающееся сжатие, при низком разрешении изображения могут возникнуть ошибки замены.

Мягкое сопоставление с шаблоном: В дополнение к указателю на словарь и информации о положении символа, требуются также уточняющие данные, потому что это важная часть информации, используемая для восстановления исходного символа на изображении. Использование уточняющих данных может сделать упомянутую ранее ошибку подстановки символов весьма маловероятной. Данные уточнения содержат текущий желаемый экземпляр символа, который кодируется с использованием пикселей как текущего символа, так и совпадающего символа в словаре. Поскольку известно, что текущий экземпляр символа сильно коррелирован с совпадающим символом, прогноз текущего пикселя более точен.

Полутона

Полутоновые изображения можно сжать двумя способами. Один из методов аналогичен контекстному алгоритму арифметического кодирования, который адаптивно позиционирует пиксели шаблона, чтобы получить корреляции между соседними пикселями. Во втором методе деэкранирование выполняется на полутоновом изображении, так что изображение снова преобразуется в оттенки серого. Преобразованные значения оттенков серого затем используются в качестве индексов крошечных растровых изображений фиксированного размера, содержащихся в словаре полутоновых растровых изображений. Это позволяет декодеру успешно визуализировать полутоновое изображение путем представления соседних друг с другом индексированных шаблонов растровых изображений словаря.

Арифметическое энтропийное кодирование

Все три типа областей, включая текст, полутон и общие области, могут использовать арифметическое кодирование. JBIG2 специально использует расширение.

Патенты

Патенты на JBIG2 принадлежат IBM и Mitsubishi. Бесплатные лицензии должны быть доступны после запроса. Патенты JBIG и JBIG2 - это не одно и то же.

Недостатки

При использовании в режиме с потерями сжатие JBIG2 потенциально может изменять текст таким образом, чтобы его нельзя было распознать как повреждение. Это отличается от некоторых других алгоритмов, которые просто размываются, делая очевидными артефакты сжатия . Так как JBIG2 пытается сопоставить похожие символы, например, числа «6» и «8» могут быть заменены.

В 2013 г. сообщалось о различных заменах (включая замену «6» на «8») на многих Xerox Workcentre копировальных аппаратах и принтерах, на которых напечатаны числа в отсканированных (но не опознанных) документах потенциально могли быть изменены. Это было продемонстрировано на конструкциях чертежей и некоторых таблицах чисел; Было кратко упомянуто потенциальное влияние таких ошибок замены в таких документах, как медицинские рецепты. Дэвид Кризель и Xerox занимались этим расследованием.

Xerox впоследствии признала, что это давний программный дефект, и их первоначальные утверждения о том, что только не заводские настройки могут вводить замену, были неверными. Патчи, которые всесторонне решают проблему, были опубликованы позже в августе, но не было предпринято никаких попыток отозвать или обязать обновления для затронутых устройств, что, как было признано, затрагивает более десятка семейств продуктов. Ранее отсканированные документы по-прежнему потенциально могут содержать ошибки, из-за чего их достоверность трудно подтвердить. Впоследствии (в 2015 г.) регуляторы Германии и Швейцарии запретили кодирование JBIG2 в архивных документах.

Ссылки

Внешние ссылки

T.88: Кодирование двухуровневых изображений с потерями / без потерь