Сокращение данных - это преобразование цифровой или буквенной цифровой информации выведено эмпирически или экспериментально в исправленную, упорядоченную и упрощенную форму. Основная концепция - сокращение огромных объемов данных до значимых частей.
Когда информация получена из показаний прибора, также может происходить преобразование из аналоговой формы в цифровую. Когда данные уже представлены в цифровой форме, «сокращение» данных обычно включает в себя некоторое редактирование, масштабирование, кодирование, сортировку, сопоставление и создание сводных таблиц.. Когда наблюдения дискретны, но лежащее в основе явление является непрерывным, часто требуются сглаживание и интерполяция. Обработка данных часто выполняется при наличии ошибок чтения или ошибок измерения. Некоторое представление о природе этих ошибок необходимо, прежде чем можно будет определить наиболее вероятное значение.
Примером в астрономии является обработка данных на спутнике Kepler. Этот спутник записывает 95-мегапиксельные изображения каждые шесть секунд, генерируя десятки мегабайт данных в секунду, что на порядки больше, чем пропускная способность нисходящего канала в 550 Кбит / с. Бортовое сокращение данных включает в себя совместное добавление необработанных кадров в течение 30 минут, уменьшая полосу пропускания в 300 раз. Кроме того, предварительно выбираются интересные цели, и обрабатываются только соответствующие пиксели, что составляет 6% от общего количества. Эти сокращенные данные затем отправляются на Землю, где они обрабатываются дальше.
Также были проведены исследования по использованию сокращения объема данных в носимых (беспроводных) устройствах для приложений мониторинга и диагностики состояния здоровья. Например, в контексте диагностики эпилепсии сокращение данных использовалось для увеличения срока службы батареи носимого устройства ЭЭГ путем выбора и только передачи данных ЭЭГ, которые актуальны для диагностики, и исключения фоновой активности.
Это распространенные методы, используемые при обработке данных.