Векторное квантование (VQ) - это классический метод квантования из обработки сигналов, который позволяет моделировать функции плотности вероятности с помощью распределения прототипы векторов. Первоначально он использовался для сжатия данных. Он работает путем разделения большого набора точек (векторов ) на группы, имеющие примерно одинаковое количество ближайших к ним точек. Каждая группа представлена своей точкой центроида, как в k-средних и некоторых других алгоритмах кластеризации.
Свойство согласования плотности векторного квантования является мощным, особенно для определения плотности больших и многомерных данных. Поскольку точки данных представлены индексом их ближайшего центроида, часто встречающиеся данные имеют низкую ошибку, а редкие данные - высокую ошибку. Вот почему VQ подходит для сжатия данных с потерями. Его также можно использовать для коррекции данных с потерями и оценки плотности.
Векторное квантование основано на парадигме конкурентного обучения, поэтому оно тесно связано с самоорганизующейся картой и в модели с разреженным кодированием, используемые в алгоритмах глубокого обучения, таких как автоэнкодер.
Простейший алгоритм обучения для векторного квантования:
Более сложный алгоритм уменьшает смещение в оценке согласования плотности n, и обеспечивает использование всех точек, включая дополнительный параметр чувствительности:
Желательно использовать график охлаждения для достижения сходимости: см. Имитация отжига. Другой (более простой) метод - LBG, который основан на K-средних.
. Алгоритм можно итеративно обновлять «живыми» данными, а не путем выбора случайных точек из набора данных, но это внесет некоторую систематическую ошибку, если данные коррелируют во времени по множеству выборок.
Векторное квантование используется для сжатия данных с потерями, коррекции данных с потерями, распознавания образов, оценки плотности и кластеризации.
Коррекция или прогнозирование данных с потерей данных используется для восстановления данных, отсутствующих в некоторых измерениях. Это делается путем нахождения ближайшей группы с доступными измерениями данных, а затем прогнозирования результата на основе значений для отсутствующих измерений, предполагая, что они будут иметь то же значение, что и центроид группы.
Для оценки плотности площадь / объем, которые ближе к определенному центроиду, чем к любому другому, обратно пропорциональны плотности (из-за свойства согласования плотности алгоритма).
Векторное квантование, также называемое «блочным квантованием» или «квантованием по шаблону», часто используется в сжатии данных с потерями. Он работает путем кодирования значений из многомерного векторного пространства в конечный набор значений из дискретного подпространства более низкой размерности. Вектор с меньшим пространством требует меньше места для хранения, поэтому данные сжимаются. Из-за свойства согласования плотности векторного квантования сжатые данные имеют ошибки, обратно пропорциональные плотности.
Преобразование обычно выполняется с помощью проекции или с помощью кодовой книги. В некоторых случаях кодовая книга может также использоваться для энтропийного кода дискретного значения на том же этапе путем генерации закодированного с префиксом значения с переменной длиной кода в качестве его вывода.
Набор дискретных уровней амплитуды квантуется совместно, а не каждый отсчет квантуется отдельно. Рассмотрим k-мерный вектор уровней амплитуды. Он сжимается путем выбора ближайшего совпадающего вектора из набора n-мерных векторов , с n < k.
Все возможные комбинации n-мерного вектор образуют векторное пространство, которому принадлежат все квантованные векторы.
Только индекс кодового слова в кодовой книге отправляется вместо квантованных значений. Это экономит место и обеспечивает большее сжатие.
Двойное векторное квантование (VQF) является частью стандарта MPEG-4, имеющего дело с взвешенным векторным квантованием с перемежением во временной области.
Использование видеокодеков, основанных на векторном квантовании, значительно снизилось в пользу кодеков, основанных на прогнозирование с компенсацией движения в сочетании с кодированием с преобразованием, например те, которые определены в стандартах MPEG, поскольку низкая сложность декодирования векторного квантования стала менее актуальной.
VQ также использовался в восьмидесятые годы для распознавания речи и говорящего. В последнее время он также используется для эффективного поиска ближайшего соседа и распознавания подписи в режиме онлайн. В приложениях распознавания образов создается одна кодовая книга для каждого класса (каждый класс является пользователем в биометрических приложениях) с использованием акустических векторов этого пользователя. На этапе тестирования искажение квантования тестового сигнала обрабатывается со всем набором кодовых книг, полученных на этапе обучения. Кодовая книга, которая обеспечивает наименьшее искажение векторного квантования, указывает идентифицированного пользователя.
Основным преимуществом VQ в распознавании образов является его низкая вычислительная нагрузка по сравнению с другими методами, такими как динамическое преобразование времени (DTW) и скрытый марковский модель (HMM). Главный недостаток по сравнению с DTW и HMM заключается в том, что он не принимает во внимание временную эволюцию сигналов (речь, подпись и т. Д.), Потому что все векторы смешаны. Чтобы преодолеть эту проблему, был предложен подход с использованием многосекционной кодовой книги. Многосекционный подход состоит в моделировании сигнала с помощью нескольких секций (например, одна кодовая книга для начальной части, другая для центра и последняя кодовая книга для конечной части).
Поскольку VQ ищет центроиды в качестве точек плотности близлежащих лежащих образцов, его также можно напрямую использовать в качестве метода кластеризации на основе прототипа: каждый центроид затем связывается с один прототип. Стремясь минимизировать ожидаемую квадратичную ошибку квантования и вводя убывающий выигрыш в обучении, удовлетворяющий условиям Роббинса-Монро, несколько итераций по всему набору данных с конкретным, но фиксированным количеством прототипов сходятся к решению k-средних алгоритм кластеризации инкрементным способом.
VQ использовался для квантования слоя представления признаков в дискриминаторе GAN. Метод квантования признаков (FQ) выполняет неявное сопоставление признаков. Он улучшает обучение GAN и обеспечивает повышенную производительность на различных популярных моделях GAN: BigGAN для генерации изображений, StyleGAN для синтеза лиц и U-GAT-IT для неконтролируемого преобразования изображения в изображение.
Часть этой статьи изначально была основана на материалах из Free On-line Dictionary of Computing и используется с разрешением в рамках GFDL.